问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

什么是推理模型?和普通大模型有何区别?看完秒懂

创作时间:
作者:
@小白创作中心

什么是推理模型?和普通大模型有何区别?看完秒懂

引用
搜狐
1.
https://m.sohu.com/a/860008311_121857574/?pvid=000115_3w_a

自从去年OpenAI o系列大模型问世,强化大模型的推理能力,很快成为行业新方向。今年以来,随着DeepSeek的爆火,推理模型更是成为业界关注的焦点。那么,什么是推理模型?它有怎样的特点?和通用大模型有何区别?未来又将朝着哪些方向发展?本文将为您一一解答。

什么是推理模型?

推理模型,顾名思义指具备推理能力的大语言模型,目前业内有“Understanding Reasoning LLMs”、“Reasoning models”、“Reasoning LLMs”等多种说法。

因为推理模型的核心在于面对复杂任务场景时,通过多步骤推理生成答案,且能通过在后训练或在线推理阶段加大资源投入,提升模型性能,它也被视为大语言模型发展的新方向,一种新的scaling law范式。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号