EVOLVEpro:融合AI的蛋白质优化新方法,实现百倍性能提升
创作时间:
2025-01-22 01:00:09
作者:
@小白创作中心
EVOLVEpro:融合AI的蛋白质优化新方法,实现百倍性能提升
蛋白质工程是生物技术领域的重要分支,通过优化蛋白质序列来提升其功能或赋予新的特性。近年来,人工智能技术在这一领域的应用取得了显著进展。本文将介绍一种名为EVOLVEpro的创新方法,它结合了蛋白质语言模型(PLM)和回归模型,通过少样本主动学习实现蛋白质的快速优化。这一方法在抗体优化、CRISPR核酸酶改良、RNA聚合酶进化等任务中展现出卓越性能,为蛋白质工程领域开辟了新的可能性。
文章背景
蛋白质是生命活动的基石,其功能和序列之间的复杂关系长期以来吸引着科学家们的关注。尽管深度突变扫描等实验方法可以解析蛋白质突变的功能影响,但这些技术的应用范围局限于序列空间的一小部分。近年来,基于蛋白质语言模型(PLM)的计算方法如ESM2模型取得了一些突破。然而,这些模型在零样本预测中往往无法显著提高蛋白质活性。为了解决这一问题,研究者提出了EVOLVEpro,一个结合PLM和回归模型的少样本主动学习框架,用于蛋白质的快速优化。
实验方法
EVOLVEpro通过以下策略实现高效的蛋白质定向进化:
模型架构
EVOLVEpro的核心包括:
- 使用ESM2模型将蛋白质序列嵌入到高维潜在空间中。
- 构建一个随机森林回归器以学习嵌入向量与功能活性之间的关系。
- 在迭代回合中通过少量突变的实验数据优化模型。
主动学习流程
每轮优化:
- 模型根据预测的活性值对未测试突变排序。
- 选择高活性的突变进行实验验证。
- 将实验结果反馈至模型,进一步改进预测性能。
优化与验证
作者基于12个不同的深度突变扫描数据集优化EVOLVEpro的参数,并验证了其在抗体优化、CRISPR核酸酶改良、RNA聚合酶进化等多种任务中的性能。
结果与讨论
性能评估
- EVOLVEpro在低样本设置中取得了显著的优化效果,相较于传统方法提高了最多100倍的功能表现。
- 模型在抗体优化、基因组编辑工具和RNA生产酶的开发中展示了卓越的多目标优化能力。
抗体优化
- 对SARS-CoV-2刺突蛋白抗体进行多目标优化,包括结合亲和力和表达水平。
- 通过迭代优化,产生了结合力提高10倍的突变体,同时兼顾了可开发性。
CRISPR核酸酶优化
- 成功优化了体积更小但活性较低的Cas12f核酸酶,突变体的靶点编辑效率提高了44倍。
RNA聚合酶进化
- 优化后的T7 RNA聚合酶生成的RNA在免疫原性降低515倍的同时,其翻译效率提升57倍。
其他应用
- 包括Bxb1整合酶的活性提升以及Prime编辑器的长片段插入能力优化。
总结与展望
EVOLVEpro展示了人工智能在蛋白质工程中的巨大潜力,其模块化设计可适配多种蛋白质特性优化任务。未来的发展方向可能包括:
- 结合生成式PLM进行端到端的设计与优化。
- 将物理化学模型整合到现有框架中,以进一步提高预测精度。
- 扩展到更多复杂多目标任务,推动生物技术的前沿探索。
热门推荐
机械继电器、固态继电器和模拟开关对比分析
B站循环播放算播放量吗?深度解析背后规则与逻辑
这5本历史书,建议看三遍!(强烈推荐)
多媒体教室的光环境设计
楼板粘钢加固施工方案
如何正确搅拌和涂抹粘钢胶?有哪些标准和注意事项?
如何在幼儿时期培养同理心:专家教你实用同理心训练技巧
探索淮南:必去的旅游景点与全面游玩指南
天府新区:让城市在自然生态中有机生长
Nature:棕色脂肪组织在低温下对营养物质的竞争力竟比肿瘤组织强
柳州一日游攻略:青云市场-龙潭公园-马鞍山公园-五星步行街-窑埠古镇
电脑怎么让帧数稳定起来?
石英石台面清洁全攻略:从日常维护到深层去污
不同租车公司提供的服务和价格有何差异?
出口汽车政策要求及通关流程指引
什么是 PDCA 循环,如何在项目管理中应用 PDCA 循环?
风湿多肌痛的治疗方法全解析
患了风湿性多肌痛应如何治疗
技术文档翻译的细节把控与精准表达
Windows 10反复弹出窗口怎么办?多种实用解决方案帮你轻松应对
重返巅峰?伦纳德的职业生涯分析
投完简历后可以主动问结果吗?
远程连接路由器:方法大全与优缺点解析
如何Web远程管理自己的路由器
PCB、SMT、DIP和PCBA之间的区别是什么
冬天这样吃水果,不寒凉更健康
【水果与人群】不同人群吃什么水果好?不同体质吃什么水果好?
家庭电梯维保的法律法规要求
中医药传承创新迎新花样 养生操短视频率先“出圈”
房贷款提前还清需要哪些手续?房产证加名、划拨土地贷款全攻略