从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
创作时间:
作者:
@小白创作中心
从想太多到想不透?DeepSeek-R1等长推理模型也存在「思考不足」问题
引用
1
来源
1.
https://m.php.cn/faq/1219865.html
腾讯AILab联合苏州大学、上海交通大学团队的一项最新研究揭示了长推理模型的“思考不足”现象,并提出了一种改进方法。这项研究发表于arxiv,通讯作者为腾讯专家研究员涂兆鹏。
研究发现,类似OpenAI o1等长推理模型,虽然展现出强大的深度思考能力,但在解决复杂问题时,往往会频繁切换思路,无法深入思考某个方向,导致最终答案错误。研究团队将这种现象称为“思考不足”(Underthinking),并将其比喻为模型的“注意力缺陷多动障碍”。
研究团队通过分析不同难度级别的数学问题,发现模型在难题上的错误答案往往伴随着更多的思路切换和更长的 token 数量,但准确率并未提升。他们进一步提出了一种“思考不足”评分机制,定量评估模型在错误回答中推理效率的低下程度。
为解决这个问题,研究团队提出了一种名为“思路转换惩罚”(Thought Switching Penalty,TIP)的解码策略,通过惩罚思路切换行为来鼓励模型更深入地思考。实验结果表明,TIP策略能够有效提升模型的准确率并降低“思考不足”现象。这项研究为改进长推理模型提供了新的思路和方法。
论文信息:
- 论文题目:Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs
- 论文地址:https://www.php.cn/link/3e33f40836bd425bbdf92b71cc707cee
热门推荐
中美俄三国军用机器人技术大比拼:谁将主导未来战场?
观音菩萨怎么放在家里
王者荣耀S36赛季:曹操与怒龙剑盾的最强搭配攻略
王者荣耀S35赛季曹操进阶攻略:秒人连招大揭秘!
人到50岁,不管多难,都要努力得到以下这十样东西,这是对自己好
【蒙古旅游】探索草原之美!蒙古必游景点、美食、交通攻略全解析!
美丽的草原,有多少种模样?
宁都三杯鸡:从传统美食到预制菜爆品的蝶变之路
中国军用5G连接万个机器人,改变现代战争模式
各主要城市年度平均工资出炉:北京暂居首位,杭州高于南京与广州
创20年来新低!国内虾价即将跌破成本价,以后能实现吃虾自由了?
鲅鱼上市就跌价,为啥便宜还不好卖?鱼贩:4个原因,很现实
猫咪绝育后变懒?真相揭秘!
绝育猫为啥还半夜叫?真相揭秘!
猫咪绝育后如何快速恢复心情?
北京北站:从百年老站到现代枢纽
京张高铁开通在即!北京北站周边三大打卡胜地推荐
北京北站首开西安高铁,6小时47分直达!
洛克希德马丁最新军用机器人揭秘:智能化战场的未来
中国军用机器人迎来重大突破!全球首个可穿越复杂地形的军用5G基站问世
从靶机到战场主力:无人机技术的演变之路
后背疼打嗝可能暗示的健康问题
石榴花的魅力:象征、美丽与烹饪之乐
石榴的生长环境(从土壤到气候,探讨石榴成长的条件)
石榴树怎样防寒过冬
春节习俗大变脸,你的心理准备好了吗?
疫情下的春节新玩法:让家庭关系更亲密
经略幽燕:宋辽战争的战略博弈
澶渊之盟:辽宋百年和平的博弈与抉择
南宋中兴四将:张俊与刘光世的军事成就与历史评价