EVOLVEpro:融合AI的蛋白质优化新方法,实现百倍性能提升
创作时间:
2025-01-22 01:00:09
作者:
@小白创作中心
EVOLVEpro:融合AI的蛋白质优化新方法,实现百倍性能提升
蛋白质工程是生物技术领域的重要分支,通过优化蛋白质序列来提升其功能或赋予新的特性。近年来,人工智能技术在这一领域的应用取得了显著进展。本文将介绍一种名为EVOLVEpro的创新方法,它结合了蛋白质语言模型(PLM)和回归模型,通过少样本主动学习实现蛋白质的快速优化。这一方法在抗体优化、CRISPR核酸酶改良、RNA聚合酶进化等任务中展现出卓越性能,为蛋白质工程领域开辟了新的可能性。
文章背景
蛋白质是生命活动的基石,其功能和序列之间的复杂关系长期以来吸引着科学家们的关注。尽管深度突变扫描等实验方法可以解析蛋白质突变的功能影响,但这些技术的应用范围局限于序列空间的一小部分。近年来,基于蛋白质语言模型(PLM)的计算方法如ESM2模型取得了一些突破。然而,这些模型在零样本预测中往往无法显著提高蛋白质活性。为了解决这一问题,研究者提出了EVOLVEpro,一个结合PLM和回归模型的少样本主动学习框架,用于蛋白质的快速优化。
实验方法
EVOLVEpro通过以下策略实现高效的蛋白质定向进化:
模型架构
EVOLVEpro的核心包括:
- 使用ESM2模型将蛋白质序列嵌入到高维潜在空间中。
- 构建一个随机森林回归器以学习嵌入向量与功能活性之间的关系。
- 在迭代回合中通过少量突变的实验数据优化模型。
主动学习流程
每轮优化:
- 模型根据预测的活性值对未测试突变排序。
- 选择高活性的突变进行实验验证。
- 将实验结果反馈至模型,进一步改进预测性能。
优化与验证
作者基于12个不同的深度突变扫描数据集优化EVOLVEpro的参数,并验证了其在抗体优化、CRISPR核酸酶改良、RNA聚合酶进化等多种任务中的性能。
结果与讨论
性能评估
- EVOLVEpro在低样本设置中取得了显著的优化效果,相较于传统方法提高了最多100倍的功能表现。
- 模型在抗体优化、基因组编辑工具和RNA生产酶的开发中展示了卓越的多目标优化能力。
抗体优化
- 对SARS-CoV-2刺突蛋白抗体进行多目标优化,包括结合亲和力和表达水平。
- 通过迭代优化,产生了结合力提高10倍的突变体,同时兼顾了可开发性。
CRISPR核酸酶优化
- 成功优化了体积更小但活性较低的Cas12f核酸酶,突变体的靶点编辑效率提高了44倍。
RNA聚合酶进化
- 优化后的T7 RNA聚合酶生成的RNA在免疫原性降低515倍的同时,其翻译效率提升57倍。
其他应用
- 包括Bxb1整合酶的活性提升以及Prime编辑器的长片段插入能力优化。
总结与展望
EVOLVEpro展示了人工智能在蛋白质工程中的巨大潜力,其模块化设计可适配多种蛋白质特性优化任务。未来的发展方向可能包括:
- 结合生成式PLM进行端到端的设计与优化。
- 将物理化学模型整合到现有框架中,以进一步提高预测精度。
- 扩展到更多复杂多目标任务,推动生物技术的前沿探索。
热门推荐
2024年申请香港大学博士的条件及费用
原来补钙这么简单!喝它就够了
杜丽娘:古装版“恋爱脑”?
杜甫李白笔下的绝美女子,你更爱谁?
西施文化:从古至今的女性力量
中国历代绘画大系:古代美女画像艺术探秘
从虎式到现代:坦克装甲技术的百年传奇
《易经》卦象:职场人必备的决策指南
虎式坦克黑科技大揭秘:现代科技如何复刻传奇?
虎式坦克:二战战场上的技术巨兽
小说推文收益怎么算,从播放量到广告分成的完整解析
饺子新作情感表达大揭秘:从细节到共鸣
高敏肌钙蛋白预测肺栓塞严重度的新发现
肌钙蛋白升高不一定就是心梗?其实还有这8种情况也可以出现
郑州商品交易所小麦期货投资指南
全球升温将影响中国小麦产量,春小麦增产冬小麦减产
四个武汉家庭的抗疫故事:中国人的凝聚力藏在日常生活的琐碎里
家电行业市值分析报告
《哪吒2》两本衍生图书爆火,出版人15年前就盯上了
斯里兰卡红茶品鉴指南:7大茶区特色与选购要点
新疆阿拉尔市双城镇:温室养殖鲈鱼 开启致富新模式
探索欧米伽3脂肪酸:心脏、脑力与整体健康的秘密
全国十大红茶:从正山小种到金骏眉,品味中国红茶文化
红茶的健康益处:你需要知道的七件事
探秘红茶的起源:中国哪个历史时期开始盛行?
奇亚籽的毒性有多大
如何在零售业中进行成本控制
如何通过乐观和友善提升人际魅力?
四季变换:大自然的奇妙交响曲
AI如何颠覆企业管理:从决策优化到模式创新