中亚和蒙古高原人群基因组研究揭示人类演化新线索
中亚和蒙古高原人群基因组研究揭示人类演化新线索
中亚和蒙古高原作为连接欧亚大陆东西部的重要枢纽,自古以来就是不同文化和遗传背景人群迁徙和定居的地区。近年来,随着基因组学研究的深入,科学家们开始系统地揭示这一地区人群的遗传演化历史。本文将介绍两篇重要研究论文,分别聚焦于中亚和蒙古高原汉族人群的基因组特征,为我们理解人类迁徙、文化交流以及疾病遗传机制提供了新的视角。
中亚人群基因组研究的新发现
作为史前至历史时期连接南亚、西伯利亚及欧亚大陆东西部的枢纽区域,中亚具有独特的地理和文化重要性,更是古代丝绸之路的重要通道。历史上,中亚是不同文化和遗传背景人群迁徙和定居的地区,这些迁徙和混合不仅塑造了该地区独特的遗传结构,也深刻影响了其文化和社会结构。然而,过去的多项人类基因组和泛基因组项目中,中亚人群的遗传数据存在系统性缺失,可能导致基因组驱动的精准医学在该地区的应用存在局限性,进而影响该地区人群的健康研究和疾病诊疗。
四川大学考古科学中心、四川大学华西医院罕见病研究院袁慧军/何光林研究团队,联合复旦大学生命科学学院进化生物学中心、上海科技大学生命科学与技术学院徐书华研究团队,以及广东省毒品实验技术中心(国家毒品实验室广东分中心)刘超院士研究团队,在hLife上发表题为“Population genomics of Central Asian peoples unveil ancient Trans-Eurasian genetic admixture and cultural exchanges”的论文,系统梳理了中亚地区的古今基因组相关研究,发现包括西伯利亚狩猎采集者、游牧人群、伊朗农民和中国黄河流域古代粟作农业人群在内的多个古代欧亚祖源人群对现代中亚人群遗传图谱的多样性产生了显著贡献。该区域人群基因组代表性严重不足。中亚观察到的广泛遗传混合现象与沿丝绸之路进行的跨欧亚交流的考古和文化证据相呼应。历史上病原体的暴露对中亚人群的基因组多样性也产生了重大影响。
为了阐明全新世期间古代中亚的迁徙和混合模式,相关学者提出了多个假说。全新世时期的大量基因组揭示了中亚人群复杂的形成过程(图1),论证了多种假说相关人群在不同时空尺度影响着中亚史前人群演化动态。中亚地区的民族、语言多样性极其重要,但其遗传多样性研究在早期全球人类基因组计划中被普遍忽视(图2)。因此,设计并开展系统的中亚特异性基因组项目并构建人群特异性基因组数据集至关重要。此外,中亚地区游牧业的技术创新、饮食习惯变化及病原体传播与生业模式和社会结构的转型密切相关,为理解病原体的起源和进化提供了独特的视角。开展大人群基因组队列研究则需要完善的科研设计、稳定的基础设施、优秀的人才队伍、持续的经费支持以及全社会的广泛参与(图3)。
图1 古今欧亚人群的遗传结构和病原菌的传播历史
图2 GWAS研究中人类基因组研究的祖先组成和基因组驱动精准医学时代背景下的人类测序项目
图3 人类基因组研究中通过测序技术实现健康公平的关键步骤和重要展望
尽管中亚作为欧亚大陆文化和人群交流的核心枢纽,近年来系统性的古基因组学研究已初步揭示了欧亚西部人群的源流史和扩散史,特别是青铜时代东欧亚草原人群对中亚古今人群形成的重要影响。然而,关于欧亚东部草原及蒙古高原地区人群的形成史,尤其是青铜时代晚期至历史时期阿尔泰语系人群的大规模扩散及其对当地、中亚及其它周边地区人群遗传结构的重塑过程,目前仍缺乏系统的古今基因组整合研究。我们知道人类古今基因组研究不仅有助于阐明人群的起源、迁徙及混合等演化历史,还在系统解人群疾病与健康的遗传调控机制、揭示复杂性状遗传学基础的时空演化轨迹并推动人类遗传疾病的早期筛查、诊断与治疗方面有重要意义。
蒙古高原汉族人群的遗传演化研究
2024年4月23日,广东省毒品实验技术中心(国家毒品实验室广东分中心)刘超院士研究团队联合四川大学考古科学中心/四川大学华西罕见病研究院何光林研究团队以及昆明医科大学胡利平研究团队,在hLife期刊发表了题为"Evolutionary history and biological adaptation of Han Chinese people on the Mongolian Plateau"的研究论文。该研究基于大规模欧亚古今人群全基因组资源,聚焦于内蒙古高原汉族人群源流历史,深入探究了蒙古高原农牧交错带汉族人群的遗传演化历史、生物适应性和医学相关性。
该研究采用基于共享等位基因模式和共享单倍型连锁模式的计算生物学方法,对蒙古高原汉族人群进行了遗传混合和人口统计学建模分析。研究结果显示,尽管地理分布不同,蒙古高原汉族人群表现出显著的遗传同质性(图1),其遗传组成与中亚、西伯利亚人群组成显著不同。混合建模则直接证实了蒙古高原汉族人群的基因池主要源自黄河流域粟作农业人群相关成分,额外受到了少量阿尔泰语相关祖源人群基因流的影响(图2-3)。进一步采用多种检测方法,研究识别出与蒙古高原寒冷环境适应、饮食习惯改变及免疫相关的自然选择信号。研究者基于高时空覆盖度的古今基因组资源重建了FADS1基因上最显著的自然选择信号rs174550(图4)和MTHFR基因上最显著的自然选择信号rs1801133数万年来的在欧亚大陆古今人群中的演化轨迹(图5)。生物适应性信号的表型关联分析揭示了蒙古高原汉族人群复杂性状的多基因适应特征和基因多效性模式。总之,该研究深化了我们对群体遗传背景如何影响疾病和表型遗传基础的理解,为个性化精准医疗队列研究设计奠定了遗传学及生物学基础。
图4 蒙古高原汉族的采样地图及东亚人群的群体结构
图5 东亚古今人群混合模式、遗传关系及精细的遗传结构
图6 蒙古高原汉族的两祖源混合模型及时空演化框架
图7 蒙古高原人群生物适应性特征及MTHFR基因关键变异近五万年来的时空演化轨迹
图8 FADS1基因关键变异近五万年来的时空演化轨迹