癌症,并非一个简单的病灶,而是一个高度复杂且动态演变的生命系统。肿瘤内部的异质性(Intra-tumor heterogeneity, ITH)是导致治疗失败、耐药和复发的关键因素。要真正攻克癌症,我们必须深入理解其起源细胞(cell of origin)以及基因组(DNA)与转录组(RNA)在进化过程中的调控法则。
破解癌症双重密码:wellDR-seq的诞生
长期以来,科学家们通过单细胞DNA测序(scDNA-seq)绘制基因组蓝图,以及单细胞RNA测序(scRNA-seq)解读基因表达程序。然而,这些技术分别从不同细胞获取数据,导致我们无法在同一个细胞内同时关联基因型与表型。为了解决这一难题,一项名为wellDR-seq的创新技术应运而生。
2025年9月4日,《Cell》杂志发表了题为“Coalescing single-cell genomes and transcriptomes to decode breast cancer progression”的研究,详细介绍了wellDR-seq技术。这项技术以前所未有的规模和分辨率,实现了单细胞基因组和转录组的联合分析,不仅揭示了乳腺癌起源的神秘面纱,更颠覆了我们对癌症进化中“基因剂量效应”的传统认知。
wellDR-seq:DNA与RNA双重阅读器的精妙设计
在单个细胞内同时捕获基因组DNA和转录组mRNA,面临着巨大的物理化学挑战。传统的DNA测序需要强力裂解细胞,会破坏RNA;而RNA测序的温和裂解又不足以释放DNA。wellDR-seq通过一系列巧妙的化学步骤,成功克服了这一障碍:
- 彻底解放: 使用蛋白酶消化细胞膜、核膜及组蛋白,使DNA和RNA完全裸露释放。
- 分轨标记: 对DNA使用Tn5转座酶进行切割和接头连接;对RNA使用Poly-dT引物逆转录为cDNA。
- 生物素开关: 在逆转录过程中,通过模板转换寡核苷酸(TSO)为所有cDNA分子打上生物素标签,而基因组DNA则无此标记。
- 统一条码: 通过PCR反应,为来自同一细胞的cDNA和DNA碎片连接独一无二的细胞条码。
- 捕捞分离: 利用链霉亲和素磁珠特异性捕获带有生物素标签的cDNA,从而将cDNA与基因组DNA分离,获得两个独立的文库。
通过这些步骤,wellDR-seq成功地从同一个细胞中获得了可完美对应功能的转录组数据和蓝图基因组数据。
严苛验证:wellDR-seq超越传统“专科医生”
wellDR-seq的性能经过了严格的基准测试,与多种单组学技术进行了比较。在DNA数据质量方面,wellDR-seq在噪音控制上与顶尖技术相当,并在覆盖广度上显著优于其他方法。其生成的假体细胞CNA图谱与“金标准”全基因组测序(bulk WGS)的相关性高达r = 0.965,证明其DNA数据质量卓越。
在RNA数据质量方面,wellDR-seq平均检测到约2,650个基因,与主流scRNA-seq平台表现相当。更重要的是,高达92.0%的读数精确映射到外显子区域,确保了检测到的是高质量、有生物学意义的成熟转录本。
研究还强有力地证明,通过计算工具从RNA表达量“推断”DNA拷贝数(CNA)是不可靠的。两种最先进的推断工具(CopyKAT和inferCNV)与wellDR-seq实测DNA图谱的相关性仅为r = 0.52和r = 0.49,且完全漏掉了肿瘤中的关键亚克隆结构。这强调了在同一个细胞中同时读取DNA和RNA的必要性。
癌症侦探:揪出ER+乳腺癌的“第一颗种子”
利用wellDR-seq的强大功能,研究人员分析了12名ER+乳腺癌患者的样本,旨在追溯癌症的起源细胞。
在P1号患者的分析中,研究人员通过DNA蓝图聚类,识别出22个基因亚群。其中,c1为正常二倍体细胞,c3到c22为构成肿瘤主体的癌细胞。而c2集群则是一个关键的“异类”,其基因组唯一的异常是丢失了整条22号染色体(chr22 loss)。进化树分析显示,正常的c1细胞突变为c2细胞,随后c2细胞经历全基因组加倍(WGD)事件,并以此为起点分化出c3到c22等20个不同的癌症亚克隆。这表明,c2就是该肿瘤的“祖先亚克隆”,即“第一颗种子”。
进一步分析c2亚克隆的RNA数据,研究人员发现其转录组特征与正常的管腔激素反应细胞(Luminal Hormone-Responsive, LumHR)完全吻合。在其他三名患者中也发现了相同的模式,祖先亚克隆均指向LumHR细胞。这一发现为ER+乳腺癌的“管腔细胞起源说”提供了最直接的证据:癌症的“第一颗种子”可能潜伏在已经分化的、响应激素的LumHR细胞中,在经历第一次基因打击(如chr22 loss)后,最终演变为侵袭性癌症。
改写剂量法则:当基因拷贝数不等于表达量
wellDR-seq的另一项重大发现,从根本上挑战了经典的“基因剂量效应”——即基因拷贝数决定表达水平的传统认知。
- 宏观尺度: 在染色体大片段层面,基因剂量法则依然成立,DNA拷贝数与RNA表达量呈近乎完美的线性相关(R = 0.93)。
- 微观尺度: 然而,在单个基因层面,法则崩溃。研究发现基因对拷贝数变化的反应分为两类:
- 剂量敏感型基因: 其RNA表达水平与DNA拷贝数严格相关,如PGR、AURKA和RB1。
- 剂量不敏感型基因: 无论DNA拷贝数如何变化,其RNA表达水平都“岿然不动”,其中包括PIK3CA、BRCA1和TP53等多个乳腺癌关键驱动基因。这表明,这些基因的失调可能依赖于更精巧的机制,而非简单的拷贝数变化。
- 涟漪效应: 研究还揭示了CNA驱动癌症的真正威力在于“跨区域的涟漪效应”。在所有导致功能差异的基因中,平均只有31%的基因是“本地(in-cis)”变化,而高达69%的功能变化发生于“跨区(in-trans)”。这意味着,肿瘤基因组的每一次变动,其最主要的后果是引发覆盖全基因组的“跨区”功能海啸。
解码双重手稿的深远意义
wellDR-seq为我们提供了一块破解癌症复杂性的“罗塞塔石碑”,用数据证明了在复杂的癌症生物学中,必须在同一个细胞中同时阅读DNA和RNA这两份手稿。
这项研究重写了乳腺癌生物学的两个关键篇章:
- 癌症起源故事: 首次将“祖先基因型”(如c2亚克隆的chr22 loss)与其“细胞身份”(LumHR表型)直接锁定在同一个细胞中,为ER+乳腺癌的“管腔细胞起源说”提供了最直接的证据。
- 癌症进化法则: 彻底解构了简单粗暴的“基因剂量效应”,揭示了癌症进化是一个交织着“剂量敏感”与“剂量不敏感”基因的复杂系统,且“跨区”功能涟漪是基因组变动的主要驱动力。
这为我们开辟了全新的视野:未来评估一个基因是否为驱动基因,或许不再仅仅看它是否被扩增或删除,而是要看它是否“剂量敏感”;理解癌症的进化,也必须从线性的“CNA累积”转向非线性的“跨区网络调控”。深入理解这些机制,有助于患者在面对复杂病情时,通过AI问诊服务获取个性化建议,或在抗癌资讯中寻找最新的诊疗进展。对于寻求海外靶向药的患者,了解这些前沿研究成果,也能更好地与医生沟通,探索更精准的治疗方案。MedFind致力于为癌症患者提供海外靶向药代购服务,确保患者能及时获取所需药品。