中瑞科研团队合作发表全球最大规模结直肠癌多组学研究
中瑞科研团队合作发表全球最大规模结直肠癌多组学研究
2024年8月7日,中国科学院杭州医学研究所组学与智慧医疗中心携手瑞典乌普萨拉大学、华大生命科学研究院、华大基因等机构在《自然》(Nature)杂志上联合发表了一篇题为“Prognostic genome and transcriptome signatures in colorectal cancers”的研究论文。该研究公布了全球首个多中心大规模结直肠癌多组学研究成果,并结合临床信息系统深入分析,总结出与结直肠癌临床结果和疾病进展密切相关的分子特征。
全球每年新增约190万例结直肠癌患者,其发病率位居所有癌症第三位,约20%的患者在确诊时已出现转移,死亡率高居各类癌症第二位,是严重威胁人类生命健康的重大疾病之一。随着高通量基因组测序技术在癌症研究领域的快速发展,结直肠癌相关编码区突变已得到较为全面的解析,针对特定突变基因或突变状态的靶向治疗、免疫治疗等手段也逐步成为结直肠癌临床治疗的标准方案。然而,目前尚缺乏整合基因组变异与基因表达谱特征,以实现更精细患者分型、提高分子特征与临床结果及疾病进展相关性的大规模结直肠癌研究。此外,既往研究多集中在外显子区域测序,限制了对全基因组范围内非编码区致病突变的探索,而全基因组测序则有助于深入解析癌症基因组的复杂变异。
为了深入理解结直肠癌的发病机制,识别驱动事件并确定其预后特征,中瑞两国科研团队针对瑞典U-CAN队列中的结直肠癌样本进行了测序分析。基于华大智造DNBSEQ测序平台,研究团队对1063例结直肠癌患者的样本(包括782例结肠癌和281例直肠癌,其中21%为微卫星不稳定肿瘤)进行了全基因组和转录组测序,生成了近412T数据,其中94%的患者具有完整的5年临床随访记录,从而构建了目前全球规模最大的结直肠癌多组学研究。该研究系统地描绘了与结直肠癌相关的基因组变异全景,并结合基因表达分型揭示了与预后密切相关的分子特征。2024年8月7日,这一研究成果以Article形式发表于国际知名学术期刊《自然》(Nature)。
图1
根据全基因组肿瘤突变负荷(TMB),患者被分为超突变型(23%,HM)和非超突变型(77%,nHM)。由于MSI肿瘤通常因DNA错配修复基因缺陷而呈现超突变特征,此队列中超90%的HM肿瘤为MSI。具有HM特征的微卫星稳定(MSS)肿瘤则携带POLE或其他DNA修复通路相关基因突变。APC、TP53和KRAS等驱动基因在MSS肿瘤中突变频率更高,而PIK3CA及BRAF等的突变则在MSI肿瘤中更为富集。基于该队列的基因组突变共鉴定到96个显著突变基因,其中24个为潜在的新驱动基因,其中WNT、EGFR和TGF-β通路相关的驱动基因与结直肠癌生存显著相关。
图2
研究团队通过突变特征分析,鉴定出47个已知和9个新发现的结直肠癌突变特征(包括SBS-CRC1、SBS-CRC2、DBS-CRC1、DBS-CRC2、DBS-CRC3、DBS-CRC4、DBS-CRC5、ID-CRC1和ID-CRC2)。其中,SBS28和DBS-CRC5与POLE突变的微卫星稳定(MSS)肿瘤显著相关;SBS-CRC1、DBS-CRC3和ID-CRC1是DNA错配修复通路缺失的突变特征;而SBS44阳性的超突变型(HM)样本与更长的生存期相关。这些新发现的突变特征具有潜力作为结直肠癌早期诊断和预后评估的生物标志物,为结直肠癌的预防和治疗提供新的思路。
图3
研究团队通过时序分析,推导出9个与结直肠癌早期发生相关的驱动突变基因(APC、TP53、KRAS、BRAF、ZFP36L2、TCF7L2、FBXW7、BCL9L和SOX9),而TRPS1、GNAS和CEP170这3个基因的突变则更倾向于在癌症发展的后期阶段出现。这些发现为结直肠癌的早期检测和靶向治疗的开发提供了重要的临床研究策略,并揭示了与肿瘤后期侵袭和转移相关的关键分子变化。此外,利用高深度全基因组测序技术,本研究在线粒体基因组和非编码区域中也发现了与疾病相关的突变,并对与疾病进展显著相关的突变进行了系统性的总结。这些突破性的发现将进一步推动对结直肠癌发病机制的理解。
图4
研究团队利用同一肿瘤样本的基因组和转录组数据,对突变基因和基因表达水平进行了整合分析。结果显示,RTK-RAS、PI3K、P53和TGF-β通路相关基因(EGFR、KRAS、PIK3CA、CDKN2A、TGFBR1和ACVR2A)的突变与基因表达增加有关。相反,无论肿瘤是否为微卫星不稳定(MSI),抑癌基因APC、PTEN和TP53的突变均导致基因表达降低。这些发现为结直肠癌的精准诊疗提供了重要的分子机制 insights,并可能指导未来临床治疗策略的优化。
图5
研究团队基于肿瘤基因表达差异谱,解析出5个具有独特分子特征的预后亚型(Colorectal Cancer Prognostic Subtypes, CRPS)。相较于经典的共识分子分型(CMS),利用独立队列转录组数据构建的CRPS能够更精准地预测预后,并在多个结直肠癌队列中得到验证。在经典的CMS分型中,CMS4型(间质型)肿瘤因基质细胞浸润和TGF-β通路激活等特征而被认为是预后较差的亚型。然而,在CRPS分型系统中,部分CMS4型肿瘤被重新判定为预后较好的CRPS2型。CRPS2型肿瘤具有上皮细胞特征,并在基因组20q11区域存在较多扩增。这些发现表明,整合基因组和转录组数据的分子分型能够实现更精细且准确的患者预后分层,对优化临床肿瘤分型以及指导结直肠癌精准治疗具有重要意义。
图6
研究团队基于深度学习算法ResNet50开发的CRPS分型工具已在其GitHub仓库中开源,为结直肠癌的研究和治疗提供了更精准的分子分型方法,也为预后评估和疾病机制的理解提供了重要的信息和工具。此项研究对结直肠癌的基因组和转录组进行了迄今最大规模的综合分析,并将分子层面的发现与高质量的临床数据相结合,从而识别出关键的预后因子,这使该项研究在癌症基因组学领域中独树一帜。研究团队不仅发现了多种突变事件对预后的显著预测效应,而且新构建的表达谱精细分型也将在未来指导结直肠癌的个体化诊疗中发挥重要作用。
本文原文来自univ-bio.com