问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

院士邀请|大模型新研究:思维图DoT用数学理论确保AI逻辑一致性

创作时间:
作者:
@小白创作中心

院士邀请|大模型新研究:思维图DoT用数学理论确保AI逻辑一致性

引用
网易
1.
https://www.163.com/dy/article/JHH9HK9A05569ZF8.html

图灵奖首位华人得主姚期智院士领导的团队近日推出了一种名为思维图(Diagram of Thought,DoT)的新推理框架,旨在让大模型的思考方式更加贴近人类。

姚期智院士,这位图灵奖首位华人得主,再次引领计算机科学界的新潮流。他领导的团队近日推出了一种名为思维图(Diagram of Thought,DoT)的新推理框架,旨在让大模型的思考方式更加贴近人类。

DoT框架将逻辑推理过程建模为在单个大型语言模型(LLM)内构建有向无环图(DAG)。这种图由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,且方向明确,不存在循环路径。这种设计确保了推理过程的逻辑一致性和合理性,同时能够捕捉人类推理的复杂性。

与传统的CoT(Chain of Thought)推理模式相比,DoT更具优势。CoT将推理过程表示为线性序列,而DoT则能够更真实地反映人类推理的非线性和迭代特性。此外,与引入分支结构(如ToT和GoT)的推理框架相比,DoT不需要依赖外部控制机制或多个模型协作,训练和部署更加简单。

在DoT框架中,LLM在生成过程中无缝切换三个关键角色:提议者负责生成命题或推理步骤,添加新节点;批评者评估命题,识别错误、不一致或逻辑谬误,并添加批评节点;总结者则将经过验证的命题综合成一个连贯的思维链,执行DAG的拓扑排序以产出最终的推理输出。

为了让模型从错误中学习并不断改进其推理能力,DoT允许模型接触正确和错误的推理。通过自然语言批评提供的丰富反馈,模型能够接收到关于错误的详细解释,从而更有效地改进命题。这种方法不仅捕捉了推理的非线性和迭代特性,还提高了模型的自我修正能力。

此外,姚期智院士的团队还为DoT框架提供了严格的数学基础。他们利用拓扑斯理论(Topos Theory)对推理过程进行了形式化描述,确保了推理过程的逻辑一致性和完备性。这种数学基础为设计下一代专门用于推理的AI模型提供了概念框架。

值得一提的是,姚期智院士一年前曾提出累积推理(Cumulative Reasoning,CR)的方法。而DoT可以视为对CR的进一步深化和升级。与CR相比,DoT直接在单一模型内构建DAG,不依赖于外部控制机制或多个模型,且模型生成的批评反馈是自然语言形式的,更加详细和丰富。

这项研究提出后,迅速引起了广泛关注。网友们纷纷表示,这是一种正确的路径,有望推动人工智能领域的发展。未来,随着DoT框架的不断完善和推广,我们有理由相信,大模型的推理能力将更加接近甚至超越人类水平。

中国首位图灵奖得主 姚期智院士

姚期智是中国科学院院士、清华大学交叉信息研究院院长;同时也是“图灵奖”创立以来首位获奖的亚裔学者、迄今为止获此殊荣的唯一华人计算机科学家。

姚期智教授2004年从普林斯顿辞去终身教职回到清华任教;2005年为清华本科生创立了计算机科学实验班“姚班”;2011年创建“清华量子信息中心”与“交叉信息研究院”;2019年再为清华本科生创立了人工智能学堂班,简称“智班”。

如今,他领导的清华大学交叉信息研究院早已声名远播,姚班、智班都隶属交叉信息院。

姚期智教授研究方向有算法、密码学、量子计算等,是这方面的国际先驱和权威。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号