哥大AI模型预测基因表达,揭秘癌症奥秘
哥大AI模型预测基因表达,揭秘癌症奥秘
哥伦比亚大学瓦格洛斯医学院的研究团队最近开发了一种名为“通用表达转换器”(GET)的新型AI模型,能够准确预测任何人类细胞中的基因活性。这一突破性的研究成果发表在最新一期的《自然》杂志上,有望彻底改变科学家研究癌症、遗传疾病等的方式。
GET模型:预测基因表达的革命性工具
GET模型的核心创新在于其能够预测特定细胞中哪些基因处于活跃状态。基因表达信息对于确定细胞的身份及其功能执行方式至关重要。研究团队采用了独特的机器学习方法,利用从正常人体组织中获取的数百万个细胞的基因表达数据进行训练。模型的输入包括基因组序列以及显示基因组哪些部分可访问和表达的数据。
这一方法的整体思路类似于ChatGPT等流行的“基础”模型。这些系统通过训练数据识别底层规则(如语言的语法),然后将这些规则应用于新场景。GET模型同样从多种细胞状态中学习“语法”,然后将其应用于特定条件——无论是病变细胞还是正常细胞——并尝试预测其行为模式。
揭秘癌症:从儿童白血病到基因组“暗物质”
研究团队展示了GET模型在揭示病变细胞隐藏生物学机制方面的强大能力。他们以一种遗传性儿童白血病为例,利用AI预测了突变基因如何破坏两种不同转录因子之间的相互作用,从而决定白血病细胞的命运。实验室实验证实了AI的预测。了解这些突变的影响可以揭示驱动这种疾病的特定机制。
此外,GET模型还为研究人员探索基因组“暗物质”的作用提供了可能。基因组“暗物质”是指基因组中不包含已知蛋白质编码基因的绝大部分区域。癌症患者中发现的大多数突变都位于基因组的“暗区域”,这些突变不影响蛋白质功能,因此一直未被充分研究。通过使用GET模型,研究人员可以观察这些突变并揭示基因组这一部分的功能。
AI引领生物医学研究的未来
GET模型的开发是AI在生物医学领域应用的重大进展。近年来,随着细胞数据的海量积累和AI模型的日益强大,生物学正逐渐向预测性科学转变。2024年诺贝尔化学奖就授予了利用AI预测蛋白质结构的开创性研究。然而,使用AI方法预测细胞内基因和蛋白质的活动仍然面临巨大挑战。
GET模型的成功为这一领域带来了新的希望。它不仅能够预测基因表达和调控活性,还能揭示细胞的内在基因网络,甚至帮助科学家破解各种疾病的谜团。这项研究标志着生物学正在逐步转变为一种预测性科学,为未来的新疗法提供了重要支持。
展望未来,AI在生物医学领域的应用前景广阔。从基因组学到蛋白质组学,从单细胞数据分析到空间转录组学,AI正在为生物学家提供前所未有的工具,帮助他们揭示生命的奥秘。随着技术的不断发展,我们有理由相信,AI将成为推动医学研究和临床实践进步的重要力量。