从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
创作时间:
作者:
@小白创作中心
从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
引用
1
来源
1.
https://m.php.cn/faq/1219865.html
腾讯AILab联合苏州大学、上海交通大学团队的一项最新研究揭示了长推理模型的“思考不足”现象,并提出了一种改进方法。这项研究发表于arxiv,通讯作者为腾讯专家研究员涂兆鹏。
研究发现,类似OpenAI o1等长推理模型,虽然展现出强大的深度思考能力,但在解决复杂问题时,往往会频繁切换思路,无法深入思考某个方向,导致最终答案错误。研究团队将这种现象称为“思考不足”(Underthinking),并将其比喻为模型的“注意力缺陷多动障碍”。
研究团队通过分析不同难度级别的数学问题,发现模型在难题上的错误答案往往伴随着更多的思路切换和更长的 token 数量,但准确率并未提升。他们进一步提出了一种“思考不足”评分机制,定量评估模型在错误回答中推理效率的低下程度。
为解决这个问题,研究团队提出了一种名为“思路转换惩罚”(Thought Switching Penalty,TIP)的解码策略,通过惩罚思路切换行为来鼓励模型更深入地思考。实验结果表明,TIP策略能够有效提升模型的准确率并降低“思考不足”现象。这项研究为改进长推理模型提供了新的思路和方法。
论文信息:
- 论文题目:Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs
- 论文地址:https://www.php.cn/link/3e33f40836bd425bbdf92b71cc707cee
热门推荐
报考军校不花钱?揭秘空军工程大学的真实福利!
有一种浪漫叫丽江古城 倾听文化故事
十二存单法的缺点是什么?如何改进十二存单法?
长期目标与短期目标应如何平衡
猫咪Ebisu教你如何训练聪明喵星人
研究证实:电子烟、伐尼克兰和金雀花碱是最佳戒烟工具
柏拉图《理想国》中的勇气观:坚持信念的力量
张艺谋、章宇:电影中的两种勇敢
从心理层面获得勇气:阿德勒理论与实用方法
大连特色旅游项目:下一个网红打卡地?
打卡大连:历史与现代交融的魅力之城
空军工程大学学员实操新型战机:理论与实践结合,加速培养高素质机务人才
电车与油车之争:全面对比与深度分析,省钱、环保还是省心?
都2025年了,开电车回家过年还能有什么问题?
毕达哥拉斯学派:被√2“坑惨了”
嘉定“文化名片”亮相进博会“非遗客厅”
洛带古镇:千年客家文化的活态博物馆
成都非遗古镇:平乐与新繁的文化传承
为宝宝做好准备
怎么预防脑瘫
无人机如何选购?省消委会发布比较试验报告及消费提示
探秘新西兰蓝泉:人间仙境等你来打卡!
新西兰蓝泉:徒步者的天堂
任鲁豫:用语言艺术点亮春晚舞台
河北自驾游推荐:5个必去景点,绝对值得一游!
河北十大名菜:从金毛狮子鱼到李鸿章烩菜,品味燕赵饮食文化
白帝城的历史简介
屯溪老街游玩攻略:古建筑与地道小吃完美融合
香烟价格上涨的原因及其影响分析
S38赛季最强辅助:钟馗崛起!