Nature最新研究:DeepMind创始人揭秘多巴胺在强化学习中的作用
Nature最新研究:DeepMind创始人揭秘多巴胺在强化学习中的作用
近日,《Nature》杂志发表了一篇关于机器学习和神经科学的重大论文,由DeepMind创始人Demis Hassabis领衔。该研究深入探讨了多巴胺如何实现分布式强化学习,揭示了其在决策过程中的关键作用。这一发现不仅为人工智能的发展提供了新的视角,也为理解人类大脑的工作机制带来了重要启示。通过模仿人类的决策方式,强化学习正在成为连接心理学、计算科学和神经科学的重要桥梁。
多巴胺与元强化学习
多巴胺是大脑中一种重要的神经递质,通常被认为是大脑的“快乐信号”。在AI领域,多巴胺的作用常被类比为强化学习算法中的奖励预测误差信号。然而,DeepMind的最新研究发现,多巴胺的作用远比这复杂。
在发表于《Nature Neuroscience》的论文《Prefrontal cortex as a meta-reinforcement learning system》中,研究团队使用了AI研究中开发的元强化学习框架来探索大脑中的多巴胺所发挥的帮助学习的作用。他们发现,多巴胺不仅用于调整权重,还传输和编码抽象任务和规则结构的重要信息,使得智能体能够更快适应新任务。
科学意义
这一发现对理解大脑的工作机制具有重要意义。长期以来,神经科学家们发现前额叶皮质中有类似的神经激活模式,但一直找不到合理的解释。前额叶皮质不依赖缓慢的突触权重变化来学习规则结构,而是使用在多巴胺中直接编码的基于模型的抽象信息,这个思路为其多功能性提供了更合理的解释。
Demis Hassabis在2025年世界经济论坛上表示,AI与神经科学之间存在密切的相互启发关系。他说:“AI的结构灵感来自大脑,现在AI又帮助我们理解大脑的工作原理。这种循环式的进步非常令人兴奋。”
应用前景
DeepMind的这一发现不仅具有理论意义,还可能带来实际应用的突破。Hassabis在论坛上宣布,由其创立的Isomorphic Labs开发的AI设计药物预计将在2025年进入临床试验阶段。这标志着AI在药物研发领域的重大进展。
此外,DeepMind的AlphaFold系统在蛋白质结构预测方面取得了突破性进展。目前,AlphaFold已经预测了2亿个蛋白质的结构,这些工作如果用传统方法完成需要大约10亿年。最新版本的AlphaFold3进一步扩展了能力,可以分析蛋白质与其他分子的相互作用。
结语
DeepMind的最新研究揭示了多巴胺在大脑学习过程中的重要作用,为理解人类决策机制提供了新的视角。同时,这一发现也展示了AI与神经科学相互启发的可能性,为未来的研究开辟了新的方向。随着AI技术的不断发展,我们有理由相信,它将在更多领域带来突破性进展。