最新STR分型神器:LobSTR vs ExpansionHunter
最新STR分型神器:LobSTR vs ExpansionHunter
短串联重复序列(Short Tandem Repeats,STRs)是人类基因组中重要的遗传标记,广泛应用于法医鉴定、亲缘关系分析和疾病研究等领域。随着高通量测序技术的发展,STR分型的准确性和效率得到了显著提升。本文将介绍两款在基因组研究中广泛应用的STR分型软件:LobSTR和ExpansionHunter,分析它们的工作原理、特点及实际应用。
STR分型的重要性
STRs是由1-6个碱基组成的重复序列,具有高度多态性,即在不同个体中重复次数存在差异。这种特性使其成为理想的遗传标记,广泛应用于:
- 法医鉴定:通过比较STR图谱,可以精确识别个体身份,用于犯罪现场证据分析。
- 亲缘关系分析:STR分型可用于亲子鉴定和家族谱系研究。
- 疾病研究:某些STR的异常扩增与遗传性疾病密切相关,如亨廷顿舞蹈病和脆性X综合征。
LobSTR:基于侧翼序列的STR分型
LobSTR(Locus-specific, bi-allelic, STR)是一款专门用于STR分型的软件,其核心优势在于:
工作原理:LobSTR通过分析读段的非重复侧翼区域来定位STR位点,这种方法可以有效避免重复序列内部的测序错误影响分型准确性。
适用场景:特别适合处理Illumina平台产生的全基因组测序数据,要求测序深度在30X以上。
使用流程:
- 输入:bam格式的测序数据
- 输出:VCF格式的STR分型结果
- 关键参数:需要提供STR位点的bed文件,包含染色体位置、重复单元长度等信息
实际应用:LobSTR已被广泛应用于细胞系认证,通过与标准细胞库的STR图谱比较,可以检测细胞系的纯度,防止实验污染。
ExpansionHunter:多维度变异检测的革新
ExpansionHunter是Illumina公司开发的一款高级变异检测工具,集成在DRAGEN(Dynamic Read Analysis for Genomics)平台中。与LobSTR相比,ExpansionHunter具有以下显著优势:
综合变异检测:不仅能检测STR扩增,还能同时识别SNV(单核苷酸变异)、Indel(插入缺失)、SV(结构变异)和CNV(拷贝数变异)等多种变异类型。
技术突破:
- 泛基因组参考:使用包含多个基因组组装的泛基因组参考,提高映射准确性。
- 机器学习框架:通过机器学习优化变异调用,减少假阳性结果。
- 加权纯度评分:引入加权纯度评分系统,提高复杂STR位点的分型准确性。
性能表现:在30分钟内完成一个35X全基因组的变异检测,速度远超传统方法。
实际应用:在一项大规模研究中,ExpansionHunter对HG002样本的分析显示,能够检测到492万个SNV、96万个Indel、1.3万个SV、1156个CNV以及3.1万个STR多态性位点,展现了卓越的检测能力。
总结与展望
LobSTR和ExpansionHunter各有优势:
- LobSTR:专注于STR分型,适用于需要高精度STR分析的场景,如法医鉴定和细胞系认证。
- ExpansionHunter:作为综合性变异检测工具,特别适合大规模基因组研究和疾病相关变异的筛查。
随着基因组学研究的深入,这两款软件都将在人类遗传学研究中发挥重要作用。 ExpansionHunter代表了未来发展方向:通过整合多种变异检测功能,提供更全面的基因组变异图谱,为疾病诊断和个性化医疗提供更有力的支持。