在人类与癌症的斗争中,精准识别肿瘤细胞的弱点至关重要。其中,位于人类6号染色体上的主要组织相容性复合体(MHC)区域,编码着人类白细胞抗原(HLA)分子,在免疫系统中扮演着核心角色。这些HLA分子如同细胞的“身份证”,向免疫系统展示细胞内部的蛋白质片段,从而决定免疫细胞能否识别并清除异常细胞,包括癌细胞。然而,MHC区域是人类基因组中变异最丰富、结构最复杂的区域之一,其高度多态性给传统的基因组分析带来了巨大挑战,尤其在癌症研究中,常常导致比对偏差和变异识别错误,阻碍了对肿瘤免疫逃逸机制的深入理解和精准免疫治疗策略的开发。
挑战与机遇:肿瘤细胞系MHC区域的精准解析
肿瘤细胞系是癌症分子生物学研究的基石,广泛应用于各类癌症研究,例如常见的肺腺癌细胞系A549、宫颈癌细胞系HeLa、肝癌细胞系HepG2、慢性粒细胞白血病细胞系K562和骨肉瘤细胞系U2OS。这些细胞系的MHC区域同样存在高度多态性,使得常规分析方法难以获得其精准的参考序列。因此,构建这些广泛使用的肿瘤细胞系MHC区域的精确参考序列,对于推动癌症研究和靶向治疗发展具有迫切意义。
复旦大学刘赟教授团队的创新突破
近日,复旦大学刘赟教授团队在权威期刊发表了题为“Haplotype-Resolved Assemblies of the MHC Region in Five Widely Used Tumor Cell Lines”的重磅研究文章。该研究巧妙地整合了CRISPR-Cas9介导的靶向富集技术与先进的二代和长读长测序技术,成功实现了上述五种肿瘤细胞系MHC区域的高质量单倍型解析组装。这项突破性工作不仅对该区域的遗传变异、多态性结构及非整倍体现象进行了详细分析,更为未来的癌症精准医疗和免疫治疗提供了宝贵的遗传学资源和研究工具。
图1 基于CRISPR的MHC区域靶向单倍型解析组装流程示意图
1. CRISPR靶向复合测序策略:MHC区域长片段DNA富集效率显著提升
研究团队设计了针对MHC区域侧翼的特异性CRISPR-Cas9 sgRNA,并结合凝胶内酶切与脉冲场凝胶电泳(PFGE)技术,实现了MHC区域DNA片段的有效富集。随后,通过10x Genomics linked-read和PacBio HiFi等先进测序技术对富集后的DNA片段进行深度测序分析。实验结果令人鼓舞:该策略显著提高了MHC区域的测序覆盖率,尤其在A549肺腺癌细胞系中,测序深度最高可提升至惊人的50倍,为后续的精准分析奠定了坚实基础。
图2 基于10x Genomic和PacBio HiFi测序数据展示的A549细胞系靶向测序MHC区域的高覆盖率
2. 肿瘤细胞系MHC单倍型序列组装:遗传变异解析分辨率大幅提升
利用高质量的测序数据,团队成功完成了五种肿瘤细胞系的MHC单倍型解析组装。其中,A549细胞系展现出卓越的组装连续性,最大组装片段NGA50达到了1.1 Mb。通过QUAST、BUSCO和Merqury等专业工具的严格评估,证实了单倍型组装的高准确性和完整性。这些高分辨率的单倍型组装,使得团队能够精准鉴定肿瘤细胞系的单倍型遗传多样性,并进行8位点高分辨率的HLA基因分型,同时验证了多种关联性分型组合,为深入理解肿瘤细胞的遗传特征提供了前所未有的视角。
图3 多维度评估显示肿瘤细胞系单倍型分辨MHC组装的良好完整性和准确性
3. 肿瘤细胞系MHC单倍型揭示非整倍体现象
研究团队进一步利用单倍型解析组装,结合公共WGS测序数据,揭示了肿瘤细胞系MHC区域存在的非整倍体现象。不同肿瘤细胞系的倍型测序深度比例呈现明显差异,例如A549细胞系表现为1:1的平衡状态,而K562慢性粒细胞白血病细胞系则表现出明显的3:1非整倍体比例,这提示MHC区域可能存在复杂的染色体重排或额外的基因组拷贝变化。这一发现对于理解肿瘤基因组的不稳定性及其对免疫逃逸的影响具有重要意义。
图4 通过细胞系的组装单倍型揭示MHC区域的非整倍性特征
总结:CRISPR技术赋能癌症研究新篇章
这项开创性研究首次利用创新的CRISPR-Cas9靶向富集结合长读长测序技术,成功构建了五种常用肿瘤细胞系MHC区域的高质量单倍型参考序列。它不仅揭示了MHC区域内丰富的遗传多态性和结构复杂性,为深入理解肿瘤免疫逃逸机制提供了重要工具和遗传学资源,更为未来的癌症精准诊断和靶向药物研发奠定了坚实基础。此外,这种创新的CRISPR-Cas9靶向富集结合长读长测序方法,具有广阔的应用前景,可拓展应用于其他复杂基因组区域的解析,为揭示人类遗传变异与疾病关联提供强有力的工具,最终惠及广大癌症患者。