问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

加速材料属性预测:结构感知图神经网络

创作时间:
作者:
@小白创作中心

加速材料属性预测:结构感知图神经网络

引用
CSDN
1.
https://blog.csdn.net/MS_YangZhanZhang/article/details/136277827

在材料科学领域,准确预测材料性能对于优化实验资源分配至关重要。美国西北大学研究团队提出了一种基于结构感知图神经网络的深度迁移学习框架,通过结合先进的数据挖掘技术,显著提升了材料属性预测的准确性和效率。

利用晶体结构准确预测材料性能在材料科学领域中发挥着关键的作用。在确定候选材料后,必须进行一系列实验或者大量的密度泛函理论计算。根据系统的复杂性,这可能需要耗费数小时、数天甚至数月。因此,在合成前准确预测所关注的材料属性,对择优分配模拟和实验资源非常有用。


图1:提出的框架概述

仅基于组分的预测模型有助于筛选并识别潜在的候选材料而无需结构输入,但它们无法区分给定组分的结构多态性。此外,由于给定组分的不同结构可能具有截然不同的特性,因而与真实特性相比,仅基于组分的模型在预测值上可能存在显著的误差。这些缺陷可以通过在训练数据集中包含基于结构的输入得到缓解。因此,与基于组分的模型相比,基于结构的模型为推进材料科学领域的发现过程提供了更大的可能性。

图2:基于ALIGNN的特征提取方法概述

来自美国西北大学电气与计算机工程系的Vishu Gupta等,提出了一个材料属性预测任务框架。该框架将先进的数据挖掘技术与结构感知图神经网络相结合,以提高模型对具有稀疏数据的材料属性的预测性能。研究者首先使用基于结构感知图神经网络的深度学习架构,从现有的包含晶体结构信息的大数据中捕捉底层化学信息。学习得到的知识将被迁移到稀疏数据集上使用,以开发可靠和准确的目标模型。作者使用115个数据集对所提出的框架在跨属性和跨材料类别的场景下进行了评估,发现迁移学习模型在104种情形下(≈90%)优于从头开始训练的模型。此外,迁移学习模型在外推问题中具有额外的性能优势。


图3:在JARVIS数据集上预测形成能的训练曲线,针对不同训练数据量

使用该框架所带来的性能提升将有助于材料科学领域的研究人员更有价值地利用数据挖掘技术,帮助更加可靠、准确地筛选和识别潜在的候选材料,以加速材料发现。该文近期发布于npj Computational Materials 10: 1 (2024)。

图4:使用最佳从头训练(SC)和最佳迁移学习(TL)模型预测JARVIS数据集形成能的预测误差分析,以平均绝对误差(MAE)为误差度量

原文Abstract及其翻译

Structure-aware graph neural network based deep transfer learning framework for enhanced predictive analytics on diverse materials datasets
(基于结构感知图神经网络的深度迁移学习框架:应用于不同材料数据集的增强预测分析)

Vishu Gupta, Kamal Choudhary, Brian DeCost, Francesca Tavazza, Carelyn Campbell, Wei-keng Liao, Alok Choudhary & Ankit Agrawal

Abstract
Modern data mining methods have demonstrated effectiveness in comprehending and predicting materials properties. An essential component in the process of materials discovery is to know which material(s) will possess desirable properties. For many materials properties, performing experiments and density functional theory computations are costly and time-consuming. Hence, it is challenging to build accurate predictive models for such properties using conventional data mining methods due to the small amount of available data. Here we present a framework for materials property prediction tasks using structure information that leverages graph neural network-based architecture along with deep-transfer-learning techniques to drastically improve the model’s predictive ability on diverse materials (3D/2D, inorganic/organic, computational/experimental) data. We evaluated the proposed framework in cross-property and cross-materials class scenarios using 115 datasets to find that transfer learning models outperform the models trained from scratch in 104 cases, i.e., ≈90%, with additional benefits in performance for extrapolation problems. We believe the proposed framework can be widely useful in accelerating materials discovery in materials science.

摘要
现代数据挖掘方法在理解和预测材料性能方面展现出了高效性。材料发现过程中的一个重要环节是了解哪种材料将具有理想的特性。对许多材料属性而言,进行实验和密度泛函理论计算相当昂贵且耗时。因此,由于可用的数据量较少,使用传统的数据挖掘方法建立这些属性的准确预测模型极具挑战性。这里,我们提出了一个使用结构信息的材料属性预测任务框架,该框架利用基于图神经网络的架构和深度迁移学习技术,从而显著提高模型在不同材料(3D/2D、无机/有机、计算/实验)数据上的预测能力。我们使用115个数据集对所提出的框架在跨属性和跨材料类别的场景下进行了评估,发现迁移学习模型在104种情形下(≈90%)优于从头开始训练的模型。此外,迁移学习模型在外推问题中具有额外的性能优势。我们相信所提出的框架能够广泛应用于加速材料科学中的材料发现。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号