从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
创作时间:
作者:
@小白创作中心
从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
引用
1
来源
1.
https://m.php.cn/faq/1219865.html
腾讯AILab联合苏州大学、上海交通大学团队的一项最新研究揭示了长推理模型的“思考不足”现象,并提出了一种改进方法。这项研究发表于arxiv,通讯作者为腾讯专家研究员涂兆鹏。
研究发现,类似OpenAI o1等长推理模型,虽然展现出强大的深度思考能力,但在解决复杂问题时,往往会频繁切换思路,无法深入思考某个方向,导致最终答案错误。研究团队将这种现象称为“思考不足”(Underthinking),并将其比喻为模型的“注意力缺陷多动障碍”。
研究团队通过分析不同难度级别的数学问题,发现模型在难题上的错误答案往往伴随着更多的思路切换和更长的 token 数量,但准确率并未提升。他们进一步提出了一种“思考不足”评分机制,定量评估模型在错误回答中推理效率的低下程度。
为解决这个问题,研究团队提出了一种名为“思路转换惩罚”(Thought Switching Penalty,TIP)的解码策略,通过惩罚思路切换行为来鼓励模型更深入地思考。实验结果表明,TIP策略能够有效提升模型的准确率并降低“思考不足”现象。这项研究为改进长推理模型提供了新的思路和方法。
论文信息:
- 论文题目:Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs
- 论文地址:https://www.php.cn/link/3e33f40836bd425bbdf92b71cc707cee
热门推荐
郑东新区发力低空经济“新赛道”
山东四大自驾游线路全攻略:从威海到临沂,领略不一样的齐鲁风光
威海至西藏自驾游全攻略:路线规划、必备物品、沿途风光与注意事项详解
【药食同源】中药中的香辛料(一)
心脏起搏器与射频消融术:心率异常的新希望
吃这些高钾食物,远离心率异常!
秋冬养生新选择:改良版鱼香肉丝
“断亲”成时代趋势?专家解读家庭关系新变化
中国家庭亲近指数揭示:如何改善家庭关系?
米其林推荐:雁荡山必打卡
雁荡山:温州最美自然景观打卡地
楠溪江三日游:打卡最美山水秘境!
万里长城:横亘两千年的建筑奇迹
和平精英新赛季,教你如何调灵敏度上分!
《和平精英》灵敏度调节秘籍:提升操作技巧
小白裙&不求人教你调《和平精英》灵敏度
哈尔滨火车站:12306候补购票新功能上线!
12306 vs 携程:抢票大战谁更靠谱?
呼和浩特什么时候最适合,呼和浩特旅游的最佳时间是什么时候
老年人如何吃出健康
太姥山一线天:惊魂体验
太姥山一线天:中国最窄的地质奇观
太姥山一线天自驾游攻略大揭秘!
蜂蜜现在的执行标准是什么?蜂蜜GH/T18796是纯蜂蜜吗?
蜂蜜为什么会含钠?真正的蜂蜜不含钠吗?
蜂蜜怎么鉴别品质好坏?鉴别蜂蜜品质好坏的3大方法,建议了解
如何通过创新策略提升经营创效能力?
买什么桂花树比较好
金丹青螺旋藻胶囊:功效与注意事项
秋冬养生新选择:螺旋藻的营养价值与食用指南