研究揭示蒙古高原汉族人群复杂演化历史及代谢相关遗传调控基础的时空演化轨迹
研究揭示蒙古高原汉族人群复杂演化历史及代谢相关遗传调控基础的时空演化轨迹
近日,刘超院士研究团队在hLife期刊上发表了一项重要研究成果,系统解析了蒙古高原汉族人群的群体演化历史、生物适应性和医学相关性。研究基于5583套整合基因组数据,揭示了脂肪酸和叶酸代谢相关基因的关键突变在五万年尺度下的时空演化轨迹,为理解人类演化和疾病遗传基础提供了新的视角。
研究背景与意义
汉族是世界上人口数量最多的民族,广泛分布于中国生态环境与饮食模式各异的地区。蒙古高原位于东亚北部,共居着汉族和阿尔泰语系等少数民族(蒙古族、赫哲族、鄂伦春族等)。历史资料记载了该地区过去汉族与匈奴、鲜卑、突厥、回鹘和契丹等游牧民族丰富的文化互动。考古学和遗传学等证据支持该农牧交错地带的人群存在着复杂的遗传互动模式。本研究聚焦于内蒙古高原汉族人群,整合大规模古今人群基因组资源,旨在探究蒙古高原农牧交错带汉族人群的遗传演化历史,生物适应性和医学相关性。
主要研究发现
研究团队基于共享等位基因模式和共享单倍型连锁模式的系列计算生物学方法进行了复杂的遗传混合和人口统计学建模,揭示了蒙古高原地理位置不同的汉族人群具有强遗传同质性。相对于中原汉族人群,蒙古高原的汉族人群与阿尔泰语相关的群体共享更多的遗传漂变。混合建模直接证实了蒙古高原汉族人群的基因池受到了阿尔泰语相关人群基因流的影响。
图1 蒙古高原汉族的采样地图及东亚人群的群体结构
图2 东亚古今人群混合模式、遗传关系及精细的遗传结构
图3 蒙古高原汉族的两祖源混合模型及时空演化框架
研究通过多种检测方法识别出与蒙古高原寒冷环境、饮食习惯改变及免疫相关的自然选择信号。研究者利用基于等位基因频率的PBS、FST和基于单倍型的XP-EHH和iHS,绘制了蒙古高原汉族人群的生物适应性信号全景图,其中最显著的为与代谢相关的候选基因FADS和MTHFR。FADS基因家族编码脂肪酸去饱和酶,参与调节机体多不饱和脂肪酸的合成;MTHFR基因编码亚甲基四氢叶酸还原酶,在叶酸循环中至关重要。
研究者基于高时空覆盖度的古今基因组资源重建了FADS1基因上最显著的自然选择信号rs174550(图4)和MTHFR基因上最显著的自然选择信号rs1801133数万年来的演化轨迹(图5)。结果表明rs174550-T优势等位基因在出现后频率逐渐增加,最终稳定在0.54左右;rs1801133-A优势等位基因在万年前的粟作农业人群中出现,与农业生计模式相关的饮食转变促进了该优势等位基因在北纬40度左右的区域高频出现。
图4 蒙古高原人群生物适应性特征及MTHFR基因关键变异近五万年来的时空演化轨迹
图5 FADS1基因基因关键变异近五万年来的时空演化轨迹
在中国人群中,rs1801133-A频率自北向南呈持续下降趋势。近东两河流域的大小麦农业文明和东亚黄河流域的粟作农业相关的生业模式的出现,加速了代谢相关基因遗传多样性模式的快速适应并逐渐趋于稳定。生物适应性信号的表型关联分析揭示了蒙古高原汉族人群复杂性状的多基因适应和基因多效性模式。总之,该研究加强了我们对群体遗传背景如何影响疾病和表型遗传基础的理解,为个性化精准医疗队列研究设计奠定了遗传学及生物学基础。
研究团队
该研究由广东省毒品实验技术中心(国家毒品实验室广东分中心)刘超院士研究团队联合四川大学考古科学中心/四川大学华西罕见病研究院何光林研究团队和昆明医科大学胡利平研究团队共同完成。
参考文献
Li X, Wang M, Su H, et al. Evolutionary history and biological adaptation of Han Chinese people on the Mongolian Plateau. hLife.
https://doi.org/10.1016/j.hlife.2024.04.005