长读长测序揭示藏族人240个高海拔适应相关基因变异
长读长测序揭示藏族人240个高海拔适应相关基因变异
藏族人对高海拔环境的适应是研究现代人类进化适应机制的理想模型。近期,一项发表在Nature Communications上的研究揭示了藏族人适应高海拔环境的遗传机制,为理解人类适应性进化提供了新的视角。
研究背景与目的
藏族人对高海拔环境的适应性显著高于汉族人,主要表现在高原反应(如急性高山病、肺水肿和脑水肿等)的患病率较低。以往研究主要集中在缺氧诱导因子(HIF)途径,但其适应性在种群规模上仍显不足。结构变异(SVs)在基因组生物学功能和人类进化适应中扮演重要角色,但人类基因中SV热点的分布模式仍不完全清楚。
研究方法
该研究由中国人民解放军总医院何昆仑教授团队完成,采用单分子长读长测序技术,构建了大规模汉族和藏族人口的SV景观。研究样本包括320例人血液(201例汉族和119例藏族),其中150例同时进行了短读长测序。实验技术涵盖CRISPR/Cas9介导的基因敲除、RT-qPCR和DNA pull-down等。
主要发现
1. SV调用集的构建与验证
研究使用ONT PromethION平台对样本进行测序,平均覆盖深度为20.24。共检测到136,257个SVs,其中汉族116,773个,藏族94,312个。SVs主要包括71,437个删除、56,799个插入、7198个复制和823个反转。通过PCR验证和跨平台比较,证实了SV调用集的高质量。
图1:119例藏族样本和201例汉族样本中SV的发现
2. SV的全基因组特性
SVs主要分布在重复区域,如转座子和卫星重复区域。不同类型的SVs在各类重复和功能元素中的分布存在偏差。例如,删除、插入和复制与SINEs和简单重复相关,而反转则与LINEs、SINEs、简单重复和LTRs相关。SV的长度分布显示两个明显峰值,分别位于约300bp(Alu)和约6kb(LINE)。
3. 汉族-藏族群体遗传和功能性SV在进化适应中的作用
研究发现,汉族和藏族共同拥有74,828个SVs。通过主成分分析(PCA),汉族和藏族的SVs可以明显区分。当将PCA扩展到1KGP数据库中的其他人群时,发现汉族和藏族与东亚人群关系密切,而与其他人群距离较远。这表明藏族在遗传上与汉族更接近,与其他人群相比,这两个人群可能来源于一个共同的祖先。
4. 高海拔适应的遗传机制
通过深度短读长测序和长读长测序数据的综合分析,在EGLN1和EPAS1等基因区域中发现了明显的进化选择信号。在藏汉人群的差异研究中,筛选了FST>0.1的SVs,发现了240个SVs,其中19个是新颖的,169个在藏族人中的频率高于汉族人。这些SVs可能与高海拔适应性相关,特别是EGLN1基因中的一个插入物与先前报道的高海拔相关性一致。
深入研究了17个FST>0.2的SVs,包括3个新颖的SVs,这些SVs附近的蛋白编码基因与缺氧反应、炎症、葡萄糖、脂质和能量代谢、胰岛素受体信号传导、血液凝固和角蛋白丝等生物学特性有关。特别是dbsv66240 SV破坏了一个超级增强子,下调了EPAS1的表达,这是藏族人中最强的特异性信号,表明SVs在高海拔适应性中的重要作用。
研究结论
该研究通过对320例藏族和汉族样本进行长读长测序,破译结构变异在高海拔适应中的作用,发现基因间缺失通过破坏超级增强子来下调EPAS1的证据。
本文原文来自Antpedia