AI助力固态电池研发,MIT研究发现minGPT更胜一筹
AI助力固态电池研发,MIT研究发现minGPT更胜一筹
在麻省理工学院4号楼的地下室,有一个被学生们称为“创新的摇篮”的实验室——4-061实验室。在这里,Donald Sadoway教授自1990年代后期就开始了他对固体聚合物电解质(SPE)锂金属电池的研究。这个实验室见证了无数个日夜的辛勤工作和无数次的实验失败,但也正是这些挑战,孕育出了改变世界的创新发现。
在过去的三十余年中,麻省理工学院始终未曾放慢对固态聚合物电解质(SPE)研究的脚步。随着人工智能技术的迅猛发展,麻省理工学院的科研团队正借助机器学习和数据驱动的策略,开启了一系列的创新研究。他们运用先进的算法和海量数据,旨在突破传统材料的局限,为电池技术的未来开辟新的可能性。
不久前,麻省理工学院与丰田研究所的科研团队携手合作,运用生成式人工智能技术,进行了聚合物电解质的全新设计。他们比较了基于GPT的minGPT和基于扩散的1Ddiffusion、diffusion-LM模型,采用了预训练和微调的方法,成功地创造出了一大批新颖、多样化且具有潜在应用价值的聚合物。这一成果不仅展示了人工智能在材料设计领域的强大潜力,也为固态电解质的发展注入了新的活力。
下一代锂电池的希望之星:AI助力固态聚合物电解质的创新突破
固态聚合物电解质(SPEs)被广泛认为是下一代锂离子电池的有力候选材料,相较于液态电解质,它们在安全性、能量密度和制造性能方面展现出显著的优势。然而,SPEs的离子导电性通常比商业化液态电解质低几个数量级,这一特性严重限制了它们的实际应用。为了应对这一挑战,科研人员已经开展了广泛的实验和计算研究。
一方面,研究人员发现数据挖掘为理解物质结构与性能之间的关系提供了新的解决方案。早在2021年,上海交通大学的研究团队在Nano Energy期刊上发表了一项题为“Harnessing Artificial Intelligence to Holistic Design and Identification for Solid Electrolytes”的研究,他们结合机器学习模型和有限的DFT计算,从超过29,000个设计的石榴石(Garnet Solid State Electrolyte)结构中,快速筛选出12个在室温下具有极低电子电导率的候选物。这种方法在计算上缩短了至少95年的筛选周期,为固态电解质的设计和发现开辟了新的思路和方法。
到了2023年,日本东北大学的研究团队在题为“The dynamic database of solid-state electrolyte (DDSE)”的研究中,构建了一个动态的全固态电池电解质数据库,并利用机器学习预测离子电导率,为实验合成的新材料提供了性能参考。
另一方面,研究人员也致力于通过新材料的挖掘来提升聚合物的离子导电性。目前,尽管高温操作、添加辅助添加剂、共聚物化等常见方法取得了一定的进展,但它们大多依赖于聚乙烯氧化物(PEO)。受限于材料本身的局限性,PEO材料已经成为了SPE技术发展的一大障碍。但是,现阶段对于非PEO聚合物的探索仍然相对有限。为了探索更广阔的非PEO聚合物空间,机器学习和数据驱动方法开始被广泛应用于聚合物属性预测和逆向设计。
尽管人工智能可以加速新聚合物的发现,但它也带来了独特的挑战。一般来说,人工智能预测的准确性依赖于丰富、多样、广泛的初始数据集,因此高质量的数据至关重要。此外,设计一套能够生成化学上真实且可合成的聚合物的算法也是一项复杂的任务。因此,在各种机器学习方法中,生成式设计因其能够从数据中学习并创造新的候选物质而显得尤为突出。这种方法不仅有望通过学习现有数据来扩展聚合物数据库,还能帮助定制化设计特定目标的聚合物材料。
然而,目前很少有研究利用这些先进的生成式AI技术来进行聚合物的生成。为了研究生成式AI技术在非PEO材料方面的应用,尤其是在具有高度结构随机性的非晶材料的聚合物电解质领域,麻省理工学院和丰田研究所的研究团队在一项最新研究中深入研究了不同先进生成式模型在聚合物生成中的复杂性,并提出了一种可以持续生成和评估新的基于GPT和扩散模型的聚合物电解质的从头设计方法,为实验检验提供了新的候选物。
minGPT胜过扩散模型:预训练策略提升数据集适应性
在麻省理工学院的最新研究中,为了开发有价值的新型聚合物电解质材料,研究团队通过标记(tokenize)、训练(Train)、生成(Generate)、验证(Evaluate)四大模块,为聚合物生成设计了一个系统的评估方案。
该研究的工作流程
首先,在标记(tokenize)阶段,研究人员首先选择了一个包含6,024种不同非晶聚合物电解质的HTP-MD数据集。这些聚合物的离子传输属性主要通过分子动力学(MD)模拟计算得出。
基于这个数据集,在训练(Train)阶段,研究人员比较了几种不同的生成式AI模型(Generative AIs),包括GPT模型的一个流行的开源PyTorch复现项目——minGPT,以及两种扩散模型:一维去噪扩散概率模型(1Ddiffusion)和扩散语言模型(diffusion-LM),在聚合物生成方面的性能。
通过这些模型的比较,研究人员希望能够找到一种最有效的方法来生成具有理想属性的聚合物电解质。鉴于三个模型具有不同的损失函数,损失值可能无法为化学系统提供全面评估。因此,研究人员提出了一种包含6个不同指标的评估聚合物生成的方法,从而可评估模型在不同超参数组合下的性能。
1Ddiffusion模型是对去噪扩散概率模型(DDPM)的改进,最初是为了图像生成而开发的。
在diffusion-LM模型中,非自回归语言模型架构与连续扩散的概念相结合,可用于生成文本。
在这项研究中,研究人员首先研究了无条件(Unconditional)生成情况下的模型架构性能,即在没有任何属性约束的情况下,使用HTP-MD数据集来训练生成模型,以学习聚合物的“语言”。在无条件生成的过程中,模型可在生成(Generate)阶段被训练可随机生成(Randomly generated)新颖的、化学上有效的、独特的和可合成的聚合物。
结果如下图所示,minGPT模型和diffusion-LM模型的表现相当,而1Ddiffusion模型的表现相对较差。在计算成本方面,minGPT模型在训练和推理方面比基于扩散的模型更高效。在Tesla V100 GPU核心(16GB RAM)上,训练最优的minGPT模型仅大约需要3-4分钟,而最优的1Ddiffusion和diffusion-LM模型则需要大约2小时的训练时间。
无条件生成的不同评价指标下不同模型的性能比较
接下来,该研究进一步引导生成模型创建具有理想属性的聚合物电解质,研究了在条件生成(Conditional)情况下的模型性能。在这种情况下,研究人员使用了两种不同的策略:基于属性的条件生成和基于结构的条件生成。基于属性的条件生成允许研究人员指定所需的物理化学属性,如玻璃化转变温度(Tg)和离子电导率(σ),而基于结构的条件生成则允许研究人员通过指定特定的化学基团或结构特征来指导生成过程。
研究结果表明,minGPT模型在条件生成任务中也表现出色,特别是在基于属性的条件生成中。这表明minGPT模型不仅能够生成新颖的聚合物结构,还能够根据特定的性能需求进行定制化设计。这种能力对于开发具有特定功能的聚合物电解质至关重要,例如高离子电导率、宽温度操作范围或优异的机械性能。
未来展望:AI驱动的材料创新与可持续能源发展
麻省理工学院与丰田研究所的这项研究不仅展示了AI在材料设计领域的巨大潜力,还为固态聚合物电解质的发展开辟了新的途径。通过利用生成式AI技术,研究人员能够以前所未有的速度和效率探索新材料空间,为下一代锂电池的开发提供了强大的工具。
这项研究的突破性进展不仅体现在技术层面,还具有深远的社会和环境意义。随着全球对可持续能源解决方案的需求日益增长,高性能、低成本的电池技术将成为推动电动汽车普及和可再生能源存储的关键。AI驱动的材料创新有望加速这一进程,为实现更清洁、更高效的能源未来做出重要贡献。
展望未来,这项研究为材料科学领域开辟了新的研究方向。随着AI技术的不断发展和数据集的持续扩大,我们有理由相信,AI将在新材料的发现和设计中发挥越来越重要的作用。这不仅限于电池领域,还可能扩展到其他重要材料的开发,如高效催化剂、高性能复合材料和新型半导体材料等。AI与材料科学的深度融合,将为科技创新和产业升级注入新的动力,开启一个材料发现的新纪元。