从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
创作时间:
作者:
@小白创作中心
从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
引用
1
来源
1.
https://m.php.cn/faq/1219865.html
腾讯AILab联合苏州大学、上海交通大学团队的一项最新研究揭示了长推理模型的“思考不足”现象,并提出了一种改进方法。这项研究发表于arxiv,通讯作者为腾讯专家研究员涂兆鹏。
研究发现,类似OpenAI o1等长推理模型,虽然展现出强大的深度思考能力,但在解决复杂问题时,往往会频繁切换思路,无法深入思考某个方向,导致最终答案错误。研究团队将这种现象称为“思考不足”(Underthinking),并将其比喻为模型的“注意力缺陷多动障碍”。
研究团队通过分析不同难度级别的数学问题,发现模型在难题上的错误答案往往伴随着更多的思路切换和更长的 token 数量,但准确率并未提升。他们进一步提出了一种“思考不足”评分机制,定量评估模型在错误回答中推理效率的低下程度。
为解决这个问题,研究团队提出了一种名为“思路转换惩罚”(Thought Switching Penalty,TIP)的解码策略,通过惩罚思路切换行为来鼓励模型更深入地思考。实验结果表明,TIP策略能够有效提升模型的准确率并降低“思考不足”现象。这项研究为改进长推理模型提供了新的思路和方法。
论文信息:
- 论文题目:Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs
- 论文地址:https://www.php.cn/link/3e33f40836bd425bbdf92b71cc707cee
热门推荐
潜望长焦与直立长焦有何不同?热门手机镜头对比揭秘!
Kaggle赛题总结:预测客户太阳能电量
锂电安全性能比拼:半固态VS钛酸锂
后脑勺痛到影响生活?枕神经疼痛症状、原因及舒缓方法一次看
史上最全腰椎间盘突出康复对策【全了!收藏】
解密坚果营养:它们如何为身体保驾护航?
中医揭秘心悸:症状、根源与调理
如何做婚恋项目经理
小儿麦粒肿的治疗方法
晨起空腹喝蜂蜜水,3个意想不到的好处
GPU基础知识:从图形处理到AI计算的核心组件
INFP人格|MBTI哲学家型人格3大特质:理想主义者 更适合与E型人恋爱?
洪姓起源与发展全解析:从水神后裔到现代繁荣
糖尿病患者的饮水秘籍:5个实用技巧,帮你轻松驾驭血糖水平
商品房交付条件及办理房产证流程详解
肇事司机逃逸时如何追究法人责任?
报交警的流程是什么?如何合法处理交通事故?
旅游出了意外怎么赔?一例游客摔伤索赔案的法律分析
解决4K电视画面模糊的问题(提升画面清晰度)
“脑腐”“脑雾”成了新的现代病?跑步是一剂有效药方
YouTube上最受欢迎的cosplay频道
浙江“九三榜样” | 黄小明:木雕传人 匠心独运
牛油果对人体有益吗?完全指南
美国智库“认证”:阿里、华为等14家中国公司对量子技术贡献重大
减脂期间,要不要每天称体重?哪些因素影响着体重的波动?
海南橡胶的价格如何衡量?衡量的价格对相关产业有何影响?
英国媒体评中国足球:展现潜力与挑战并存的未来前景
必知的经济周期
北京旅游持续升温:研学团增多,外国游客激增,导游讲述一线观察
阳宅建房吉凶揭秘:详解风水布局与禁忌