问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

不应该88%都是白人,“All of Us”如何改善基因库的种族不平等

创作时间:
作者:
@小白创作中心

不应该88%都是白人,“All of Us”如何改善基因库的种族不平等

引用
腾讯
1.
https://new.qq.com/rain/a/20240807A0434F00

“All of Us”基因组数据库推动应对遗传学研究中的多样性问题。


All of Us项目计划招募一百万人,来自以往在生物医学研究中代表性不足的种族和社会群体。图片来源:Barbara Alper/Getty

一项旨在通过关注历史上代表性不足群体的基因组和健康状况来改善医疗健康的美国大型项目已开始取得成果。由位于马里兰州贝塞斯达的美国国立卫生研究院管理的“All of Us”项目对收集到的多达24.5万个基因组进行了分析,结果发现了超过2.75亿个新的遗传标记,其中约150个可能与2型糖尿病有关。这项工作还反映出了非白人群体中遗传学研究的空白。这些发现于2月19日发表在《自然》[1,2]、《通讯-生物学》[3]和《自然-医学》[4]上。

英国剑桥大学计算基因组学家Michael Inouye说,这些研究成果“很好地提炼了‘All of Us’项目资源:它是什么?它能做什么?”他还补充说,对想知道自己的研究结果是否能推广到广泛人群还是只适用于有限人群的遗传学研究者来说,这将成为他们的“首选数据集”。

填补空白

在范德比尔特大学医学中心研究健康差异遗传学的遗传学家Jibril Hirbo说,研究人员早已注意到他们研究的基因组数据缺乏多样性。一项研究[5]观察了截至2019年1月收集的数据,发现在大多数大规模疾病基因组研究中,78%的对象是欧洲祖源。Hirbo说,这加剧了现有的健康不平等问题,尤其是对非白人人群。当研究人员为新药选择基因或分子靶点,或建立模型来预测哪些人有患病风险时,他们的决策基础是缺乏多样性的数据,因为现有的所有数据就这样了。

All of Us项目的首席数据官Andrea Ramirez说,这一项目旨在弥补这一空白。该项目迄今已获得超过31亿美元的资金,并计划在2026年底之前为美国100万人建立详细的健康档案。该计划于2018年开始招募参与者,并于2022年发布了第一批约10万个全基因组的数据。到2023年4月,它已招募了41.3万名匿名参与者,其中46%属于少数种族或少数族裔群体,并共享了近25万个基因组。相比之下,此前全基因组数据集英国生物库(UK Biobank)迄今发布了约50万个基因组,其中约88%来自白人。

波士顿麻省总医院的人口遗传学家Alicia Martin说,All of Us数据集是“一个巨大的资源,尤其是非裔美国人、西班牙裔美国人和拉丁美洲人的基因组,这是绝大多数大型生物库资源和基因组学联盟的数据所缺少的。”

除了基因组之外,该数据库还包括一些参与者的调查回复、电子健康记录以及来自可穿戴设备(如Fitbits)的数据,这些设备会报告人们的活动情况,“这使得该数据库成为强大的基因组数据资源之一”,Martin说。

迫切的需求

Ramirez说《自然》上发表的一项关于2型糖尿病[2]的研究是个很好的例子,体现出多样基因组数据库的力量。在美国,大约每十人中就有一人患有这种疾病,而造成这种疾病的原因有很多,涉及了各种各样的基因。研究人员分析了包括All of Us在内的多个数据库中超过250万人的遗传信息,其中近40%的数据来自非欧洲祖源个体。研究小组发现了611个可能导致疾病发生和发展的遗传标记,其中145个以前从未报道过。作者写道,这些发现可用于开发“基于遗传特征的糖尿病医疗护理”。

在另一项研究中[3],研究人员利用All of Us的数据检查了致病突变(pathogenic variants),即会增加个人罹患某种疾病风险的基因差异。他们发现,欧洲祖源的人的基因组中,2.3%有致病突变。而在非洲裔人的基因组中,这一数字下降到了1.6%。

该研究共同作者、德克萨斯州休斯顿贝勒医学院计算遗传学家Eric Venner提醒说,这种差异不应是生物学原因造成的。他说,这种差异可能是对欧洲祖源人群研究更多的结果;我们对这一人群中哪些突变会导致疾病就是了解得更多些。他补充说,事实上,研究人员在非欧洲祖源人群基因组中发现的未知风险变异要多于欧洲祖源人群。Venner说,这更加表明亟需对非欧洲人的基因组进行更详细的研究。

更新模型

从不同人群中收集和使用更多基因组和健康数据,对于生成更准确的“多基因风险评分”尤为重要,它能评估一个人由于遗传因素罹患某种疾病的风险。

为了计算某种疾病的得分,研究人员开发了一种算法,该算法是在数千个患有或未患该疾病的人的基因组上训练出来的。然后,将一个人的基因数据输入算法,就能计算出他自己的得分。

以前的研究[6]表明,这些可能很快会用于临床的个性化医疗保健分数,对少数群体的评估准确性往往低于多数群体。在这次的一篇论文[4]中,研究人员使用了更具包容性的All of Us数据来改善现状:他们校准并验证了23种疾病的评分,并推荐了其中10种疾病的评分模型在临床中优先使用,包括冠心病和糖尿病。Martin赞赏了这些工作,但她希望未来的研究能探讨医生和临床治疗中的其他人如何解读这些评分,以及基于这些评分的治疗选择是否能长期改善一个人的健康状况。

All of Us项目计划每年发布一批涵盖新注册参与者的基因组数据,包括2024年底将会发布的一批,Ramirez说。同时Hirbo认为,多样化的数据能不断涌现是个很好的现象,希望现有基于欧洲祖源人群基因组训练的算法能尽快更新。“这些模型还远远落后”,他说。

参考文献:

1.The All of Us Research Program Genomics InvestigatorsNaturehttps://doi.org/10.1038/s41586-023-06957-x (2024).

2.Suzuki, K.et al. Naturehttps://doi.org/10.1038/s41586-024-07019-6 (2024).

3.Venner, E.et al. Commun. Biol.https://doi.org/10.1038/s42003-023-05708-y (2024).

4.Lennon, N. J.et al. Nature Med.https://doi.org/10.1038/s41591-024-02796-z (2024).

5.Sirugo, G., Williams, S. M. & Tishkoff, S. A.Cell177, 26–31 (2019). at https://arxiv.org/abs/2202.04044 (2022).

6.Martin, A. R.et al. Nature Genet.51, 584–591 (2019).

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号