中科院团队用AI发现早期星系“指纹”,系外行星探测获突破
中科院团队用AI发现早期星系“指纹”,系外行星探测获突破
2024年,中国科学院上海天文台葛健研究员带领的国际团队,通过人工智能深度学习方法,在国际斯隆数字巡天项目第三期释放的类星体光谱数据中,成功发现了107例宇宙早期星系内的冷气体云块有“中性碳吸收体”。这一样本数是此前获得的最大样本数的近两倍,且探测到了更多比以前更微弱的信号。
这一发现不仅展示了人工智能在处理天文大数据方面的巨大潜力,也为研究星系的形成和演化提供了新的视角。此外,该团队还利用AI发现了5颗超短周期系外行星,其中4颗是迄今为止发现的距其主星最近的最小行星。这些发现标志着人工智能正在深刻改变我们探索宇宙的方式。
AI助力发现宇宙早期星系的“指纹”
中性碳吸收体是研究星系形成和演化的重要探针。然而,中性碳吸收线的信号微弱且极其稀少,需要在海量的类星体光谱数据中才能找到,使用传统的搜寻方法耗时费力,如同“大海捞针”。
研究团队通过使用人工智能的深度学习方法,设计神经网络,生成基于实际观测的中性碳吸收线特征的大量仿真样本,去训练深度学习神经网络,并使用这些被“训练好”的深度学习神经网络,在国际斯隆数字巡天项目第三期释放的数据中搜寻“中性碳吸收体”。
通过这一创新方法,研究团队很快发现了107例宇宙早期星系内的冷气体云块有“中性碳吸收体”。这一样本数是此前获得的最大样本数的近两倍,且探测到了更多比以前更微弱的信号。
发现了这么多冷气体的“中性碳吸收体”,研究团队把这些光谱叠加到一起,极大提高了探测各种金属元素丰度的能力,并能直接测量尘埃吸附导致的部分金属丰度缺失。
研究结果表明,早在宇宙只有约30亿年的年龄时(宇宙现在的年龄为约138亿年),这些携带“中性碳吸收体”探针的早期星系,已经过了快速物理和化学演化,进入了介于大麦哲伦矮星系和银河系之间的物理和化学演化状态,产生了大量的金属,同时部分金属被吸附到尘埃上,产生观测到的“尘埃红化”结果。
这一发现独立验证了近期詹姆斯·韦伯太空望远镜首次在宇宙最早的恒星中,探测到类似钻石的碳尘埃的新发现,预示部分星系的演化比预期要快得多,这将对现有的星系形成和演化模型形成挑战。
发现最小系外行星,揭秘行星形成之谜
在另一项突破性研究中,葛健研究员团队研发了一种结合GPU相位折叠和卷积神经网络的深度学习算法,并在开普勒(Kepler)2017年释放的恒星测光数据中发现了五颗直径小于地球、轨道周期短于1天的超短周期行星。其中,四颗是迄今为止发现的距其主星最近的最小行星,类似火星大小。这是天文学家首次利用人工智能一次性完成搜寻疑似信号和识别真信号的任务。
经过5年的努力和创新,科研团队开发了结合GPU相位折叠和卷积神经网络的深度学习的新算法GPFC。该算法比国际上流行的BLS法搜寻速度提高了约15倍,检测准确度和完备度各提高约7%,提高了凌星信号搜索速度、精度和完备度。该算法已应用于Kepler的数据集中,并识别出五颗新的超短周期行星——Kepler-158d、Kepler-963c、Kepler-879c、Kepler-1489c和Kepler-2003b。其中,Kepler-879c、Kepler-158d、Kepler-1489c和Kepler-963c分别位列迄今为止发现的最小超短周期行星中的第一、第二、第三和第五名。Kepler-879c、Kepler-158d、Kepler-1489c和Kepler-2003b是最接近其主星的小型行星,其轨道半径在5个恒星半径以内,展现了新算法在搜寻微弱凌星信号的优势。
这些超短周期行星的存在为行星系统的早期演化、行星-行星相互作用以及恒星-行星相互作用的动力学(包括潮汐力和大气侵蚀)研究提供了关键线索,对行星形成理论研究具有重要意义。
“星语3.0”:望远镜阵列的智能大脑
在天文观测领域,人工智能的应用不仅限于数据分析,还延伸到了观测设备的智能化控制。中国科学院国家天文台人工智能工作组发布了新一代天文大模型——“星语3.0”,这是大模型在科学领域落地的经典案例,也是大模型在天文观测领域的首次应用。
“星语3.0”基于阿里云通义千问开源模型打造,目前已成功接入国家天文台兴隆观测站望远镜阵列——Mini“司天”。这一创新尝试解决了随着望远镜数量不断增加,如何管控大型望远镜阵列成为当今天文界共同面临的挑战。
“星语3.0”依托阿里云通义千问底模和百炼平台,基于超30万条专家订正的数据完成训练,在天文物理等专业能力上表现突出。目前,它已实现自主控制望远镜进行观测、分析观测结果,并智能地给出下一步观测建议。
例如,当收到“观测某星体”的任务时,“星语3.0”首先查询某星体的坐标信息,反馈给观测人员;得到确认后,将按照观测人员输入的计划进行自动观测;单次曝光完成后,大模型将回收并处理数据,根据结果判断目标源的观测价值,并推荐接下来的观测计划。
未来,“星语3.0”将接入国家天文台大型望远镜阵列“司天”(Mini“司天”即为“司天”的一部分)。“司天”是我国天文学家面向时域天文学提出的国家级重大天文基础设施项目,至2030年米级望远镜数量预期达到72架,每晚将产生约140TB处理后数据,有望成为全球巡天效率最高的项目。
“全新升级的星语大模型正在向智能体方向发展。”国家天文台人工智能工作组智能体开发方向的李瑀旸表示,“星语将吸收更多天文细分领域知识,融合现有科研模型、算法和成果,打造‘One For All’的天文+AI新范式。星语将降低天文学家在跨方向交流和工作时的门槛,提高科研效率,让天文学家将注意力更多的集中在天文发现上。”
这些突破性成果展示了人工智能在天文学领域的巨大潜力,预示着AI将成为人类探索宇宙的得力助手,开启天文学研究的新纪元。