AI驱动的可电离脂质理性设计用于mRNA递送
AI驱动的可电离脂质理性设计用于mRNA递送
近日,蓝鹊生物联合复旦大学、澳门大学在Nature Communications杂志发表研究文章Artificial intelligence-driven rational design of ionizable lipids for mRNA delivery,利用AI和虚拟筛选得到能够高效递送mRNA的脂质体新分子。
简要版
脂质纳米颗粒(LNPs)已被证明在mRNA传递方面有效。其关键成分可电离脂质体传统上通过实验筛选来优化,过程效率低且成本高昂。本研究利用人工智能(AI)和虚拟筛选来促进可电离脂质体的合理设计,评估了近2000万个可电离脂质体,分别产生了三个和六个新分子。经过两轮迭代,最终得到一个脂质体分子的功效与脂质SM-102相似。
研究方法:
- 使用AI驱动的计算机模拟和机器学习算法来预测和优化可电离脂质体的性能。
- 构建了一个包含多种可电离脂质体的数据库,并使用这些数据训练机器学习模型。
- 通过模拟不同脂质与mRNA的相互作用,评估其在体外和体内递送中的表现。
- 采用高通量筛选技术验证AI模型的预测结果,并进一步优化设计。
研究者将 Moderna, Acuitas, Protiva各公司和其他学术机构发表的递送相关专利中的相关信息进行了提取和整理,构建了一个包含多种可电离脂质体的数据库,并使用这些数据训练机器学习模型。研究者提取的信息包括,LNP配方、表观pKa、粒径、包封率、动物种类、给药途径、给药剂量和mRNA表达水平等。同时为了确保数据的一致性,研究者将不同来源的数据进行了整理,并排除了信息不全或不符合要求的数据。最终所有可电离脂质体递送效率均以DLin-MC3-DMA(MC3)的递送效率为参照。
在AI模型训练过程中,研究者采用了LightGMB训练方式,基于与MC3比较的传递效率标准,采用分类模型,区分优于MC3(阳性)和不如MC3(阴性)的脂质。AI根据脂质体化合物结构预测表观pKa和递送效率。研究者预测了14种可电离脂质体的递送效率,对训练结果进行验证,整体正确率达到0.78。
图1:AI模型训练流程示意图
在本研究中,脂质虚拟筛选分为两个连续阶段进行,最终导致两批独立脂质的合成和评估。与MC3递送效率相当的,作为Model 1的筛选标准;达到MC3递送效率2倍,作为Model 2的筛选标准。图2显示了第一轮筛选的工作流程。该模型指出了在脂质生成过程中应重点关注的显著亚结构。
图2:第一轮脂质筛选工作流程
离子化脂质的结构由扩展连通性指纹(ECFP)表示,每个ECFP位对应脂质内的一个亚结构。ECFP分数与mRNA递送效率相关。将高评分的脂质体进行结构相似性比较,找到关键的亚结构特征。然后将尾部和头部候选结构按照结构模式组合,穷尽地生成虚拟可电离脂质体。利用构建的模型,可以对每个脂质体进行表观pKa和递送效率预测。按照pKa在6.0-7.0之间,且递送效率达到MC3水平作为阳性标准进行筛选,最终确定了三种脂质体分子。
不过,这三种脂在实际检测中表现相对一般,递送效率只有一个接近MC3的水平。因此研究者又对模型重新进行了评估,重点关注含有乙醇胺头部基团的脂分子,在数据集中进行集中测试。另外,研究者还将阳性的判定标准提高到MC递送效率的2倍,构建了Model 2。第二轮筛选的候选分子为666个,由乙醇胺头部基团和多种尾部结构进行组合。Model 1从中筛选了94个阳性分子,Model 2筛选了21个阳性分子。最终从Model 2筛选出的21个分子中,确定了6个候选脂质体分子进行合成和实际测试。
研究者们进行了一系列实验来测试筛选出了这9种脂质体与MC3和SM-102(Moderna在COVID-19疫苗中使用的脂质体分子)在性质上的异同。在体外实验中,测试了不同设计的可电离脂质体对mRNA的保护效果和细胞内转染效率,以及形成的LNP的稳定性等。在体内实验中,检测了mRNA在肝部和肌肉注射部位的转染效率,并评估了这些脂质在小鼠模型中的免疫反应和安全性。经过以上实验测试,AI筛选出的9种脂质体中,有一种达到了和SM-102相当的递送效率,并且表现出较好的稳定性。
小结
这项工作将AI模型应用在预测mRNA传递效率和表观pKa,可以加速可电离脂质体的筛选和设计。研究显示,通过AI模型的应用,不仅可以提高筛选效率,还能发现性能优异的新脂质,有的甚至接近现有最佳标准。此外,合理结合多种AI模型的重要性,以及AI模型在结构解释上的优势,可以在有限数据量的情况下,设计并筛选出新脂质体分子。这项研究对mRNA-LNP传递系统的开发具有推动作用,并能为相关项目提供指导。
参考文献
https://doi.org/10.1038/s41467-024-55072-6
本文原文来自PharmCube