人工智能在地质学中的应用研究
人工智能在地质学中的应用研究
进入21世纪,信息社会和信息技术已经普及到了各行各业和人们的日常生活中,地质学也迎来了数字化转型的新阶段。《数字地质学》一书由赵鹏大院士主编,中国地质学会数学地质与地学信息专业委员会组织全国15所开设相关课程的高校的任课教授和科研院所的有关专家,历时几年完成了教材的编写工作。本文节选自该书的"第10章 地质大数据与人工智能"章节,介绍了人工智能在地质学中的应用研究。
矿产资源定量预测
随着地质大数据指数形式增长以及人工智能、机器学习、深度学习的兴起,机器学习方法在矿产资源定量预测中的应用也更加广泛。机器学习可以自动识别数据模式和特征,而成矿定量预测可以作为一种特殊的模式识别过程,即对远景地段和非远景地段的识别问题。与传统方法相比,机器学习往往具有更高的预测精度,特别是针对数据量大、维数高并且输入变量之间存在复杂的非线性关系,或者输入变量有着较为复杂的统计分布特征,具有明显的优势。
机器学习在解决矿产资源预测问题中可以发挥如下3个方面的作用:
- 基于机器学习对复杂数据进行深层次分析,提取和挖掘传统方法技术难以识别的深层次矿化信息特征,而提取和挖掘深层次矿化信息是成功发现矿床的关键;
- 基于机器学习实现致矿异常信息关联与转换,发掘潜在的与矿床时空分布相关的空间模式,解决控矿因素的空间分布规律;
- 基于机器学习实现对来自多源地学数据的致矿异常信息综合和集成,建立地质、地球化学、地球物理与遥感异常与已知矿化关联,融合多源异构找矿信息,预测未发现矿床,并在此基础上进行决策。
分别利用传统多元统计方法和机器学习方法开展化探致矿异常信息提取,机器学习模型获得的异常模式与已知矿化有很强的空间相关性。但是某些机器学习方法是采用"黑箱"技术,多元素的内部结构对地球科学家来说是未知的,因此,机器学习在地球科学中的应用要求其在数学和计算机方面拥有良好的知识背景。
高光谱遥感数据分类
近年来,神经网络方法理论不断发展提升,基于神经网络方法的遥感领域应用是其中的一大研究热点,许多研究者进行了基于神经网络的高光谱遥感分类。目前使用较多、研究较广的用于遥感领域的神经网络模型有五种:自编码(Autoencoder)神经网络、卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、生成对抗网络(GAN)等。
自从2006年Hinton提出自编码神经网络概念后,自编码网络结构被广泛应用在数据降维、特征提取等方面。使用自编码网络进行特征提取并分类,并与传统基于光谱信息的方法进行对比,发现效果较好。卷积神经网络通过卷积层、池化层及全连接层构成,通过逐像素进行区域聚合识别。使用卷积神经网络方法,利用端到端的方式,使用平均池化层和较大dropout率,应用于高光谱影像分类,并验证表现良好。将高光谱数据作为序列数据而不是维度数据,基于RNN结构的网络,并结合改良型控制单元与新型激活函数,使用机载高光谱数据,在三幅影像上进行了分类,证明其效果较好。针对样本不足的问题,基于GAN网络训练光谱数据,充分利用标记数据与未标记数据,使用半监督分类同样可以实现高光谱样本生成与分类。
地球化学数据处理
地球化学异常是最重要的找矿信息之一。当前的矿产勘查重点是对现有的勘查地球化学数据进行二次开发利用,识别和提取传统方法无法识别的模式和异常。在这种背景下,各种新的高级算法,尤其是机器学习(包括深度学习)算法不需要对数据的分布模式做出假设,可用来分析复杂的、未知的勘查地球化学数据分布情况,已被引入到勘查地球化学领域。
深度学习模型用于多元地球化学异常识别最初由我国学者陈永良教授提出,利用连续受限玻尔兹曼机方法有效识别了吉林南部的多元地球化学异常。之后,我国学者将深度自编码、卷积神经网络等算法应用于地球化学异常的识别与提取。目前基于机器学习和深度学习的勘查地球化学数据处理大都忽略了地球化学数据的空间特性。如何将大数据思维和深度学习方法结合,以充分考虑元素组合的复杂性和多样性,更好识别地球化学异常是研究的主流。
地球物理数据处理
机器学习算法在地球物理中的地震信号处理、数据重构、断层识别等方面广泛应用。
- 将人工神经网络用于环境地震噪声分类,以确定测区数据是否适合做噪声层析成像,实验证明机器学习分类方法优于人工手动分类。
- 将小波神经网络用于去除直升机瞬变电磁数据中的高频运动噪声,通过对信号和噪声样本进行学习,预测并消除噪声干扰。
- 将机器学习用于天然地震信号与噪声的实时识别,开发了具有可变结构深度的非线性分类器,包括全连通的、卷积的和递归的神经网络,以及一个将生成式对抗网络与随机森林相结合的模型,通过训练,对信号和噪声样本数据的识别准确率达到99%以上。
- 将人工神经网络用于一维电测深数据反演,其设计两个网络,其中第一个网络识别曲线类型,然后使用第二个网络进行模型参数估计,新方法提高了对弱异常的分辨率。
- 基于模糊均值聚类的多域岩石物理约束反演与地质分异方法,相比于传统反演方法,加强了岩石物性与反演结果的联系。
- 通过一维正演生成时间域直升机的航空电磁响应样本集,通过人工神经网络反演层状介质电导率参数,理论模型表明新算法对高阻层的反应更加灵敏。
- 将蚁群算法与神经网络相结合用于高密度电阻率二维反演,理论模型的测试结果表明新算法的效果优于传统拟线性算法和常规神经网络方法。
- 分别利用遗传优化-神经网络和深度置信神经网络方法对二维大地电磁数据进行了反演研究,证明了其可行性与有效性。
岩石矿物识别
岩石及矿物的识别与分类是地质学研究中十分重要的内容,对岩石和矿物准确地分类,有助于对地层年代的划分,建立可靠的地质时间标尺。同时通过对重要矿物的发现和识别,可快速对区域矿产资源进行确认和评估,产生巨大的经济和战略价值。传统的岩石、矿物测试分类对人类专家的依赖性很强,对专业知识和长时间的经验积累要求很高。此外如果纯粹依靠人类专家进行识别,工作非常耗时,且工作人员在疲惫状态下,存在难以避免的误差。近年来人工智能领域取得重大突破,通过深度学习模型学习岩石矿物识别特征,模拟地质专业人员肉眼鉴定岩石矿物的经验,有效实现了岩石、矿物的智能识别,为一线地质工作者的肉眼鉴定提供了辅助,大大提高了识别的效率。
本文摘编自《数字地质学》(赵鹏大主编. 北京: 科学出版社,2023. 11)一书“第10 章 地质大数据与人工智能”,标题为编者所加。
ISBN 978-7-03-075353-3
责任编辑: 王 运
本书可作为地学相关专业大学生的基础教材,也可作为理工科专业大学生、研究生在地质研究中学习和借鉴的参考书。
本文编辑:刘四旦
一起阅读科学!
专业品质 学术价值
原创好读 科学品位
硬核有料 视听科学