ProteinMPNN:AI驱动的蛋白质设计革命
ProteinMPNN:AI驱动的蛋白质设计革命
华盛顿大学医学院生物学家在蛋白质设计领域取得重大突破,开发出名为ProteinMPNN的AI工具,能够快速准确地设计出自然界中不存在的蛋白质。这一突破不仅大大提高了蛋白质设计的效率和准确性,还为疫苗开发、癌症治疗、碳捕获技术等领域的创新开辟了新途径。
蛋白质设计的革命:从调整到创造
蛋白质是生命的基础,它们在所有生物的结构和功能中都发挥着至关重要的作用。然而,目前人类发现的蛋白质仅占所有可能存在的蛋白质的一小部分。为了解决这一问题,研究人员开发了多种人工智能蛋白质设计工具,其中包括:
- 固定骨架设计:给定一个预设蛋白质结构,使用AI确定该蛋白质的氨基酸序列。
- 序列生成:利用语言模型让AI学习生成蛋白质序列。
- 结构生成:训练神经网络生成全新的蛋白质结构。
- 序列和结构设计:使用inpainting方法,让研究人员输入特定的结构或序列,AI网络完成其余部分的设计。
ProteinMPNN:从头设计蛋白质的利器
ProteinMPNN是一个基于消息传递图神经网络的蛋白质序列设计工具,它能够在一秒内生成蛋白质序列,比以前最好的软件快200多倍。更重要的是,ProteinMPNN不需要专家定制就可以运行,大大降低了蛋白质设计的门槛。
使用ProteinMPNN设计的蛋白质细节
ProteinMPNN的核心优势在于它能够解决逆向问题:如果研究人员已经有一个明确的蛋白质结构,ProteinMPNN可以帮助他们找到能够折叠成这个形状的氨基酸序列。这与传统的蛋白质设计方法形成鲜明对比,传统方法通常通过调整自然界中已知的蛋白质来设计新的蛋白质。
蛋白质设计的三大挑战与解决方案
Baker团队将蛋白质设计的挑战分解为三个部分,并针对每个部分设计了特定的软件方案:
- 生成新的蛋白质形状:
- 幻想(hallucination):类似于DALL-E等生成AI工具,通过随机搜索所有可能的蛋白质序列,并倾向于具有特定功能的序列。
- 修复(inpainting):类似于文字处理器的自动完成功能,从功能位点开始填充额外的序列和结构。
使用“幻想”生成的对称环
生成氨基酸序列:开发了ProteinMPNN这一快速且准确的氨基酸序列生成算法。
结构预测:使用DeepMind开发的AlphaFold工具来独立评估提出的氨基酸序列是否能折叠成预期的形状。
应用前景与未来展望
利用这些新方法,研究人员已经创造出了一些在自然界中从未见过的全新蛋白质,比如巨大的纳米环。这些纳米环的直径大约比罂粟种子小十亿倍,未来可能被用于制造定制的纳米机械,甚至用于疏通动脉。
蛋白质设计研究所的博后研究员Basile Wicky展示使用ProteinMPNN设计的蛋白质
ProteinMPNN已经在GitHub上开源,供研究人员免费使用。这一突破不仅大大提高了蛋白质设计的效率和准确性,还为疫苗开发、癌症治疗、碳捕获技术等领域的创新开辟了新途径。
正如华盛顿大学医学院生物化学教授David Baker所说:“这仅仅是机器学习在蛋白质设计中的一个开始。在接下来的几个月里,我们会努力改进这些工具,争取创造出更具动态性和功能性的蛋白质。”