RNA-Seq:遗传病基因诊断的新利器
RNA-Seq:遗传病基因诊断的新利器
**随着下一代测序技术(NGS)的不断发展,以WES(Whole exome sequencing)为代表的分子诊断技术极大提升了单基因遗传病的实验诊断能力。尽管如此,仍有相当一部分疑似单基因遗传病患者在接受WES、甚至全基因组测序(Whole genome sequencing, WGS)检测后仍未得到确切的诊断。研究显示,WES的临床诊断率约为25~30%。最近,由NIH(National Instatitutes of health)资助的UDN(Undiagnosed Diseased Network)项目统计发现,结合WES,WGS,染色体芯片分析(Chromosomal microarray analysis, CMA),代谢组学(Metabolomics),模式生物模型筛查及综合临床评估等手段进行综合检查,未诊断遗传病的临床诊断率可达35%。因此,针对这些经过WES、甚至WGS但仍未确诊的病例,亟需寻找其他基因诊断新方法、新技术来解决此类诊断难题。
近年来,已有多篇报道探索RNA-Seq在单基因遗传病分子诊断中的应用。研究显示,根据不同样本类型和临床表型,RNA-Seq可使诊断率提高7.5%-36%,且有助于对临床意义不确定(VOUS)基因变异的致病性判断。RNA-Seq分析方法多种多样,但一般均根据基因表达水平的变化及异常剪接进行候选致病基因变异的筛选和/或验证;而传统的RNA-Seq分析,则需先对WES/WGS数据中的大量变异通过基因变异的筛选和过滤策略筛选出候选的变异,再在转录组水平上进行验证。后者虽然在致病基因变异的筛选上具有一定的帮助,但仍存在较多的局限性:1) 随着WGS临床应用日趋广泛,潜在的候选变异位点显著增加,致使转录组水平验证位点难度显著增加;2) 生物信息学算法及软件在剪接位点变异的预测性能尚有欠缺;3) 需要预先选择候选变异;4) 优先考虑已知致病基因,不适合新基因的发现。
近期,贝勒医学院分子和人类遗传学系Murdock博士研究团队发表在“Journal of Clinical Investigation”杂志的研究论文“Transcriptome-directed analysis for Mendelian disease diagnosis overcomes limitations of conventional genomic testing”介绍了一种使用RNA-Seq直接进行下游基因变异分析并成功诊断罕见遗传病的方法,显示了RNA-Seq具有作为遗传病基因诊断方法之一的应用潜力。
研究选取了从2014至2020年间纳入贝勒医学院(BCM) UDN注册登记的115名先证者及其67名家系成员(共182名)作为研究对象,分别对全血细胞和成纤维细胞样本进行RNA测序分析(图1),深入评估RNA-Seq在遗传病基因诊断中的性能。
图1 BCM UDN RNA-Seq诊断研究流程概述
PCA分析证明,成纤维细胞中的基因表达比全血细胞更好,且成纤维细胞数据显示的变异较少,表明成纤维细胞RNA-Seq在检测基因表达差异分析方面优于全血样本。此外,在多种疾病相关的基因集中,相比于全血细胞的RNA,成纤维细胞提取的RNA具有更多表达差异显著的基因数量 (TPM>10, TPM:Transcripts per million)。
对于RNA-Seq中异常表达和异常剪接的基因,研究团队开发了一整套RNA-Seq数据分析流程(DROP: https://github.com/gagneurlab/drop),其中包括**OUTRIDER用于异常表达基因的识别、FRASER用于异常剪接基因的识别**。为最大程度的减少组织特异性的差异,研究者分别处理了>100例来自成纤维细胞和全血细胞的数据,以该研究全体样本的有效数据作为对照数据集,且消除父母样本中的基因表达或剪接差异;同时为了更好地识别临床相关变异,研究者选取了OMIM,gnomAD pLI scores, DOMINO probabilities of causing dominant disease,ClinGen haploinsufficienc,triplosensitivity scores,GTEx TPM values等数据库资料对候选基因进行注释,用于后续的继续分析和验证。
Murdock等研究发现,每个先证者平均有3 ~ 4个表达水平显著升高/降低的基因;至于异常剪接事件,以特定剪接在研究群体中是否出现两次以上作为罕见与否的判断标准,平均每个先证者在成纤维细胞和全血细胞中分别产生60.7个和22.5个异常剪接。
在纳入本研究的115名先证者中,RNA-Seq的总诊断率为12%(14/115; 95% CI, 7-19%);排除WES/WGS技术诊断的病例,RNA-Seq诊断率可升至17%(14/82; 95%, 10-26%)。在所有诊断的14例病例中,7例仅做了成纤维细胞的RNA-Seq分析,1例做了全血细胞的RNA-Seq,而有6例均做了两种组织的RNA-Seq,且在这6例病例中,全血细胞RNA-Seq分析仅鉴定了3例样本(50%)中的变异,而成纤维细胞RNA-Seq则能全部鉴定。(表1)
表1. RNA-seq分析识别的致病性变异表
参考基因组 | GRCh37 (hg19) |
---|---|
NMD | 无义介导的降解 |
DD | 发育迟缓 |
ID | 智力障碍 |
SEMD | 脊椎干骺端发育不良 |
Hemi | 半合子 |
Het | 杂合子 |
Hom | 纯合子 |
M | 男 |
F | 女 |
Zyg | 接合性 |
ES | 全外显子组测序 |
GS | 全基因组测序 |
SNV | 单核苷酸多态性 |
CNV | 拷贝数变异 |
验证案例采用候选基因方法解决。 |
典型案例
案例1:Renpenning syndrome[MIM:309500]
- 一般信息:男性,3岁
- 临床诊断:多发性先天性畸形(先天性心脏缺陷(VSD/PDA), 脊椎异常,左肾异位,尿道下裂,感觉神经性听力障碍(SNHL),发育迟缓)
- 主要表型:身材矮小、头颅微畸形、眼睛深陷、脸中部发育不全、鼻子宽大、低位耳、并指(4-5脚趾)(图2A)
- 既往检查:Trio-WES,WGS和CMA检测均为阴性
- RNA-Seq:全血细胞RNA-Seq基因表达水平分析发现,先证者PQBP1基因表达水平相比对照组下降了近50%,且存在异常剪接。另外,WGS测序数据重分析也显示,PQBP1中存在深度内含子区域的杂合变异(c.180-306G>A),遗传自先证者母亲(图2B)。该异常剪接导致3号和4号外显子间内含子片段异常留存,继而导致基因功能异常(图2C)。
图2 Renpenning syndrome(案例1).(A)先证者颜面畸形特征;(B) WGS数据中发现的由杂合子母亲遗传的半合子PQBP1深度内含子区域位点变异(绿色);(C) 全血细胞的RNA-Seq分析鱼骨图,显示了先证者阅读框外外显子和远端内含子保留(红色),而对照组中没有(蓝色/绿色)。黑色箭头指示PQBP1内含子变体的位置。WGS:全基因组测序。
案例2:CLTC-associated ID syndrome
- 一般信息:男性,14岁
- 临床诊断:ID、DD、先天性多发畸形
- 主要表型:ID、DD、多发畸形、眼距宽、宽前额、后发际线低
- 既往检查:核型分析、CMA、Trio-WES、脆性X综合征基因检测均为阴性
- RNA-Seq:全血细胞和成纤维细胞RNA-Seq分析显示,CLTC和PTRH2表达量显著降低(约为50%正常水平),两个基因在染色体17q23.1上彼此相邻,表明可能为连续缺失。WGS分析也发现存在22.7kb大小的杂合性缺失(chr17:57756685-57779426),该片段涵盖CLTC的18-20外显子及邻近的PTRH2基因部分;PCR分析也证实了先证者及其父亲在该片段的缺失。
图3 CLTC-associated ID syndrome(案例2). (A)先证者颜面畸形特征;(B) WGS测序分析发现的CLTC缺失(红色),覆盖CLTC外显子18-32;(C) PCR分析确认了父亲及先证者中的缺失,但母亲及对照组(NA12878)中不存在,预期的缺失片段大小为391b。WGS:全基因组测序 ID:智力障碍
案例3:Koolen-de Vries (KdV) syndrome [MIM: 610443]
- 一般信息:女性,7岁女性
- 临床诊断:DD、ID、癫痫、多发畸形
- 主要表型:ID、DD、癫痫、多发畸形(睑裂、内眦赘皮、耳朵突出、管状鼻且鼻尖宽);病史描述中有显著的脊柱侧凸、远视、斜视及轻度关节过度灵活,父母及姐姐健康状况良好
- 既往检查:多次Trio-WES、CMA均阴性
- RNA-Seq:WES数据重分析时发现,先证者KANSL1基因14号外显子存在杂合性单核苷酸变异(SNV),且遗传自其父亲;但在RNA序列中并未发现存在此SNV,提示携带该SNV的等位基因未表达(图4B)。同时,先证者中包含起始密码子的2号外显子的测序深度比父母样本减少了50%,表明该区域在先证者中存在微缺失变异(CNV),并已通过CMA证实在17q21.31位置的307Kb的杂合缺失(chr17:44174219-44481307),涵盖KANSL1基因1号和2号外显子(图4C)。一般情况下,利用ClinVar和Decipher等数据库综合分析判断该CNV多为良性,但是根据RNA-Seq结果发现KANSL1表达量下降了近50%,且该基因表达减低导致的情况与先证者临床表型相一致,因此最终诊断为KdV综合征。
图4. Koolen-de Vries syndrome (案例3). (A)先证者颜面畸形特征;(B) WES数据发现先证者中存在KANSL1基因14号外显子变异,且在RNA-Seq显示该等位基因缺失。(C) PCR验证先证者中存在de novo缺失,而其父母和对照(NA12878)样本中未发现,缺失片段大小为926bp。
参考文献:
[1] David R. Murdock et al. Transcriptome-directed analysis for Mendelian disease diagnosis overcomes limitations of conventional genomic testing. J Clin Invest. 2020; 0021-9738.