问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

破解大模型"9.9<9.11"之谜:《圣经》经文是关键因素

创作时间:
作者:
@小白创作中心

破解大模型"9.9<9.11"之谜:《圣经》经文是关键因素

引用
腾讯
1.
https://new.qq.com/rain/a/20241024A08BP700

大模型为何会混淆"9.9"和"9.11"的大小关系?MIT和UC伯克利的研究团队通过开发AI工具Monitor,揭示了这一谜团背后的真相。研究发现,与《圣经》经文、日期和重力等概念相关的神经元是导致这一错误的关键因素。通过抑制这些神经元,模型的判断准确率显著提升。

研究发现:《圣经》经文是关键因素

大模型在比较"9.9"和"9.11"时出现的错误,终于被可解释性研究揭开谜底。来自MIT和UC伯克利的独立实验室团队Transluce AI开发了一种AI工具,能够抑制大模型中与特定概念相关的神经元。

研究发现,只要将与《圣经》经文、日期和重力等概念相关的神经元激活设为0,大模型就能正确回答这道比较题。仅移除《圣经》经文相关神经元,就能使该问题的准确率提高21个百分点。而且,这一修复方法不需要重新训练模型或添加额外提示词。

Monitor工具揭秘大模型内部机制

Transluce AI开发的Monitor工具是一个可解释性界面,可以揭示语言模型的内部计算过程,并允许用户对其进行控制。该工具采用了一系列AI驱动的工具来帮助用户理解语言模型中的神经激活模式:

  • 预先编译的高质量神经元描述数据库:包含通过将Transluce AI的AI驱动描述流程应用在LLaMA-3.1-8B中的所有MLP神经元。

  • 实时界面:展示给定聊天对话中的重要概念,用户可以通过激活度或归因度来衡量重要性。

  • 实时AI代码检查器:自动识别可能的虚假线索概念群集。

  • 语义引导的调节:根据自然语言输入,增加或减少概念相关神经元集合的强度。

通过使用Monitor工具,研究人员发现"9.8<9.11"这个bug与日期、重力以及《圣经》经文有关。一旦移除与这些概念相关的神经元,LLaMA就能正确回答问题。进一步的归因分析显示,与《圣经》相关的神经元在其中扮演了重要角色。如果将9.8和9.11解读为第9.8章节和第9.11章节,也会出现大模型判断错误的情况。

Transluce AI实验室简介

Transluce AI是一个新成立的非营利性研究实验室,致力于构建开源、可扩展的技术,以理解AI系统并引导它们服务于公共利益。实验室的目标是创建世界级的AI系统理解工具,并利用这些工具推动建立可信赖的AI行业标准。

实验室的创始成员来自MIT、CMU、多伦多大学等顶尖高校,其中包括多位在AI领域具有重要影响力的学者。实验室的顾问团队包括图灵奖得主Yoshua Bengio、斯坦福AI大佬Percy Liang等。

结语

这项研究不仅揭示了大模型在处理数字比较时的一个有趣现象,更重要的是展示了通过可解释性工具理解AI系统内部机制的可能性。这对于提高AI系统的可靠性和安全性具有重要意义。

Transluce AI创始团队成员(部分)

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号