三代单细胞转录组助力融合基因分析
三代单细胞转录组助力融合基因分析
融合基因在多种癌症和遗传疾病中发挥着关键作用,而三代单细胞转录组测序技术在融合基因检测中展现出独特优势。本文将为您详细介绍融合基因的概念、其在疾病研究中的重要性,以及三代单细胞转录组测序技术在融合基因检测中的优势。
融合基因的概念
融合基因(Fusion gene)是指两个基因的全部或一部分的序列相互融合为一个新基因的过程,属于结构变异的一种情况。染色体易位、染色体片段缺失或染色体倒置等变异类型均有可能导致融合基因的发生。这一过程可以在基因水平和RNA水平上观察到,基因水平的融合关注的是DNA的结构变化,而RNA水平的融合则关注于融合转录本的表达。RNA水平的基因融合反映了基因表达的动态变化,通过分析转录本,可以识别出融合基因的表达情况和融合断点信息,为研究融合基因与肿瘤等相关疾病发生发展之间的关系提供了重要参考。
融合基因在疾病研究中的重要性
基因融合现象在多种癌症和遗传疾病中发挥着关键作用。基因融合能够导致功能蛋白的产生,这些蛋白可能具有肿瘤等疾病发生和发展所需的特性。有研究显示,融合基因在多种癌症类型中具有重要的致癌作用,在对9,624个肿瘤样本的研究中,研究人员发现了25,664种融合基因,其中16.5%的肿瘤样本与基因融合密切相关。
目前已经发现的经典的融合基因有BCR::ABL:这是慢性髓性白血病(CML)中最著名的基因融合,BCR和ABL基因的融合导致了酪氨酸激酶的持续激活,从而推动了白血病的发生;在尤文肉瘤中,EWS::FLI1基因融合的发现被认为是该病的主要驱动因素之一;在非小细胞肺癌(NSCLC)中,EML4::ALK基因的融合同样是一个关键的致癌因素,许多靶向ALK的药物已经被开发用于治疗这类癌症。
除了肿瘤,基因融合在其他疾病中的分析同样具有重要的临床意义。在骨骼肌疾病中,特定的基因融合事件可以导致肌肉细胞异常增殖或分化;在免疫系统疾病中,如系统性红斑狼疮和类风湿性关节炎也与特定的基因融合事件有关系,这些融合基因可能影响免疫细胞的功能,导致异常的免疫反应;在遗传性疾病中,某些类型的先天性心脏病和基因融合事件相关,这些事件可能是影响心脏发育的关键基因,通过基因融合分析可以更好理解遗传疾病的分子机制,为早期诊断提供生物标志物。
图1:癌症相关的暴露因素诱导相应的融合基因
三代单细胞转录组研究基因融合的优势
目前比较常见的融合基因检测方式是基于二代测序技术平台对组织样本进行bulk RNA-seq,通过检测基因发生融合后转录形成的嵌合转录本序列来发现融合基因。二代测序数据有高通量低成本相对较高准确度的优势,但二代测序通常产生短片段数据,可能导致基因融合事件的检测不完整或误报。相较于第二代,第三代测序技术如PacBio和Oxford Nanopore提供了更长的读长,能够更好地解析复杂的基因结构和融合事件。这种技术的优势在于能够直接读取全长转录本,从而更准确地识别融合基因。
例如在一卵巢癌的研究中,发现融合事件IGF2BP2::TESPA1 ,有2174条长reads比对到2号病人的基因IGF2BP2和TESPA1中, 其中覆盖IGF2BP的1-4个外显子,共编码112个氨基酸,包含两个motif结构,覆盖TESPA1的3’端UTR 外显子区,编码69个氨基酸,该融合基因共包含181个氨基酸,详见图2a的外显子结构和图2b的融合蛋白结构域。98.9%的融合reads都来自于HGSOC细胞,并且86.8%来自于2号病人的肿瘤细胞,从而鉴定到了肿瘤细胞中高表达,患者特异性表达的融合事件,详见图2c。IGF2BP2::TESPA1 融合在匹配的短读长数据中被错误分类为高 TESPA1 表达,见图2e,f所示,同时此基因融合断裂点在人体DNA和单细胞DNA测序研究中的验得到验证。在该新发现的基因融合事件中,长读长测序发现了短读长测序无法识别的融合基因对,短读长测序可能会混淆基因和融合基因的表达情况,从而导致可能是错误的结论。该研究中IGF2BP2::TESPA1基因融合的发现,强调了单细胞长读长测序在区分基因表达和基因融合方面的独特优势。
图2:肿瘤和个体特异性融合基因的检出
基于三代转录组长读长测序的单细胞基因融合分析,够更准确地识别在特定细胞类型中发生的基因融合事件,不仅可以研究已经关注的融合基因在不同细胞或细胞类型中的表达情况,还可以分析发现细胞类型特有的融合基因(图3),从而揭示这些融合基因在细胞中的表达模式,特别是在肿瘤细胞中,不同细胞之间可能存在不同的基因融合情况,通过该方法,可以揭示肿瘤的复杂性和进展机制,促进对疾病机制的深入理解。
图3:细胞类型特异性的融合基因分布
总结
三代长读长单细胞转录组测序在基因融合分析中展现出多方面的优势,其单分子测序能力、全长转录本读取、高灵敏度和实时数据分析等特点,使得该技术在单细胞水平基因融合的研究中具有重要的应用潜力。三代单细胞转录组测序成为研究基因融合及其相关生物学过程的重要工具,能更好地理解这些融合基因的功能及其对细胞行为的影响。