EVOLVEpro:融合AI的蛋白质优化新方法,实现百倍性能提升
创作时间:
2025-01-22 01:00:09
作者:
@小白创作中心
EVOLVEpro:融合AI的蛋白质优化新方法,实现百倍性能提升
蛋白质工程是生物技术领域的重要分支,通过优化蛋白质序列来提升其功能或赋予新的特性。近年来,人工智能技术在这一领域的应用取得了显著进展。本文将介绍一种名为EVOLVEpro的创新方法,它结合了蛋白质语言模型(PLM)和回归模型,通过少样本主动学习实现蛋白质的快速优化。这一方法在抗体优化、CRISPR核酸酶改良、RNA聚合酶进化等任务中展现出卓越性能,为蛋白质工程领域开辟了新的可能性。
文章背景
蛋白质是生命活动的基石,其功能和序列之间的复杂关系长期以来吸引着科学家们的关注。尽管深度突变扫描等实验方法可以解析蛋白质突变的功能影响,但这些技术的应用范围局限于序列空间的一小部分。近年来,基于蛋白质语言模型(PLM)的计算方法如ESM2模型取得了一些突破。然而,这些模型在零样本预测中往往无法显著提高蛋白质活性。为了解决这一问题,研究者提出了EVOLVEpro,一个结合PLM和回归模型的少样本主动学习框架,用于蛋白质的快速优化。
实验方法
EVOLVEpro通过以下策略实现高效的蛋白质定向进化:
模型架构
EVOLVEpro的核心包括:
- 使用ESM2模型将蛋白质序列嵌入到高维潜在空间中。
- 构建一个随机森林回归器以学习嵌入向量与功能活性之间的关系。
- 在迭代回合中通过少量突变的实验数据优化模型。
主动学习流程
每轮优化:
- 模型根据预测的活性值对未测试突变排序。
- 选择高活性的突变进行实验验证。
- 将实验结果反馈至模型,进一步改进预测性能。
优化与验证
作者基于12个不同的深度突变扫描数据集优化EVOLVEpro的参数,并验证了其在抗体优化、CRISPR核酸酶改良、RNA聚合酶进化等多种任务中的性能。
结果与讨论
性能评估
- EVOLVEpro在低样本设置中取得了显著的优化效果,相较于传统方法提高了最多100倍的功能表现。
- 模型在抗体优化、基因组编辑工具和RNA生产酶的开发中展示了卓越的多目标优化能力。
抗体优化
- 对SARS-CoV-2刺突蛋白抗体进行多目标优化,包括结合亲和力和表达水平。
- 通过迭代优化,产生了结合力提高10倍的突变体,同时兼顾了可开发性。
CRISPR核酸酶优化
- 成功优化了体积更小但活性较低的Cas12f核酸酶,突变体的靶点编辑效率提高了44倍。
RNA聚合酶进化
- 优化后的T7 RNA聚合酶生成的RNA在免疫原性降低515倍的同时,其翻译效率提升57倍。
其他应用
- 包括Bxb1整合酶的活性提升以及Prime编辑器的长片段插入能力优化。
总结与展望
EVOLVEpro展示了人工智能在蛋白质工程中的巨大潜力,其模块化设计可适配多种蛋白质特性优化任务。未来的发展方向可能包括:
- 结合生成式PLM进行端到端的设计与优化。
- 将物理化学模型整合到现有框架中,以进一步提高预测精度。
- 扩展到更多复杂多目标任务,推动生物技术的前沿探索。
热门推荐
家有“小胖墩”,该如何帮他科学减重?
喝茶那些事儿:洗茶的门道与茶类的品鉴
密苏里大学怎么样
烘焙艺术:如何通过面粉的选择提升你的蛋糕品质
交通事故赔偿全攻略:从责任认定到赔偿金获取
没有房子住的情况下如何解决居住问题?这些解决方各有什么优缺点?
户外人像打光的秘密武器:小型反光板
倾听和关心:孩子哭泣的重要意义
如何分析经济危机对黄金价格的影响?黄金价格在危机中如何发挥作用?
科学研究证实:蓝莓或能改善记忆、提升情绪
白衬衫发黄怎么洗?10种实用清洗方法+注意事项
珠峰近年为何突然“长高”?科学家最新研究揭示原因
白居易《荔枝图序》:荔枝如丹,夏熟
虎眼石 TIGER’S EYE|慢溫水晶天然礦石知識庫
虎眼石是什么宝石?宝石学家解说虎眼石的奥秘
成为一名医生需要经历哪些阶段的学习和培训
水果杨桃的营养价值
冻梨的储存技巧与品质保持
兼职工作怎么避免被骗
尿酸偏高可以吃亚麻籽粉吗
案例分析:并行计算让代码“飞”起来
骰骨脱位伴Lisfranc损伤的诊断与治疗
中华木绣球怎么种植(中华木绣球花的养殖方法讲解)
股票市场情绪如何影响股价
吃够蛋白质有多重要?新年第一天一起来改变饮食习惯吧
西安地铁三站更名引发热议,市民积极参与建议征集
表面活性剂的种类繁多,你都认识哪几种?
普通车漂移的技巧是什么?漂移对车辆有哪些要求?
铜及其化合物性质知识点总结
宅基地继承权的规定是什么