问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

大模型常用推理参数工作原理

创作时间:

作者:

@小白创作中心

大模型常用推理参数工作原理

引用

CSDN

1.

https://blog.csdn.net/qq_63585949/article/details/139564411

为天地立心，为生民立命，为往圣继绝学，为万世开太平。

do_sample

do_sample参数控制是否使用采样方法生成输出。当do_sample=True时，模型会根据下一个 token 的概率分布进行采样；当do_sample=False时，模型会选择概率最大的 token 作为输出。

temperature

temperature参数通过影响softmax控制生成输出时每个 token 的概率分布的平滑程度。

不考虑temperature参数，softmax概率分布的计算公式为：
prob ( x i ) = e x i ∑ j = 1 n e x j \text{prob}(x_i) = \frac{e^{x_i}}{\sum_{j=1}^{n} e^{x_j}}prob(xi )=∑j=1n exj exi

加入temperature参数后，softmax概率分布的计算公式为：
prob ( x i , t ) = e x i t ∑ j = 1 n e x j t \text{prob}(x_i,t) = \frac{e^{\frac{x_i}{t}}}{\sum_{j=1}^{n} e^{\frac{x_j}{t}}}prob(xi ,t)=∑j=1n etxj etxi

下图展示了temperature参数的影响：

top_k

top_k参数控制生成输出时，只考虑概率最高的top_k个 token。

下图展示了top_k参数的影响：

top_p

top_p参数与top_k参数类似，区别在于top_p参数控制生成输出时，只考虑累计概率分布在前top_p的 token。

下图展示了top_p参数的影响：

协同工作

同时使用temperature、top_k、top_p参数时，它们的影响会以一定顺序叠加。

下图展示了同时使用temperature、top_k、top_p参数的影响：

temperature、top_k、top_p参数不会改变各 token 概率的相对大小，因此当do_sample=False时，token 的选择不会受到上述三个参数的影响。

热门推荐

什么是白茅根白茅根的功效与作用

什么是白茅根白茅根的功效与作用

无线电测向运动训练策略

无线电测向运动训练策略

陈晓漫：论方言在贾樟柯电影中的运用——以《山河故人》为例

陈晓漫：论方言在贾樟柯电影中的运用——以《山河故人》为例

汉武帝刘彻和刘秀是什么关系刘秀是刘彻的后代吗

汉武帝刘彻和刘秀是什么关系刘秀是刘彻的后代吗

除夕祭祖的规矩和仪式

除夕祭祖的规矩和仪式

《艾尔登法环》盾刺流玩法详解装备选择推荐

《艾尔登法环》盾刺流玩法详解装备选择推荐

CSS中grid网格布局详解

CSS中grid网格布局详解

大氧化事件的起因和对地球及生命的影响分析

大氧化事件的起因和对地球及生命的影响分析

孩子缺乏安全感怎么办？专家解析青春期心理健康问题

孩子缺乏安全感怎么办？专家解析青春期心理健康问题

白内障手术几天能出院

白内障手术几天能出院

属猪在2025蛇年的运势解析

属猪在2025蛇年的运势解析

父母情绪稳定是孩子一生之幸

父母情绪稳定是孩子一生之幸

限制速度标志如何辨认？辨认后怎样遵守相关规定？

限制速度标志如何辨认？辨认后怎样遵守相关规定？

张雪峰推荐陕西民办二本院校：这些宝藏学校你不可不知！

张雪峰推荐陕西民办二本院校：这些宝藏学校你不可不知！

探秘新疆之旅：独库公路深度游路线推荐

探秘新疆之旅：独库公路深度游路线推荐

月柱天干正财地支正印解析与人生命运

月柱天干正财地支正印解析与人生命运

边地不语：凭祥·祖国的南大门

边地不语：凭祥·祖国的南大门

2025年世俱杯将扩军至32支球队切尔西皇马已获参赛资格

2025年世俱杯将扩军至32支球队切尔西皇马已获参赛资格

《清明上河图密码》邹勉原型：宋六贼之一，一手遮天，终成刀下魂

《清明上河图密码》邹勉原型：宋六贼之一，一手遮天，终成刀下魂

马蹄爆爆珠制作工艺详解：从原料处理到成品包装全过程揭秘

马蹄爆爆珠制作工艺详解：从原料处理到成品包装全过程揭秘

仅6所高校开设的小众赛道，交叉学科究竟如何

仅6所高校开设的小众赛道，交叉学科究竟如何

中国新技术实现“前所未有”的稀土生产速度

中国新技术实现“前所未有”的稀土生产速度

应急救护实训基地建设方案：从空间规划到运营管理的全方位指南

应急救护实训基地建设方案：从空间规划到运营管理的全方位指南

孕妇能喝枸杞泡水吗？孕妇吃枸杞要注意哪些事？

孕妇能喝枸杞泡水吗？孕妇吃枸杞要注意哪些事？

中药导致儿童鼻出血的五大原因及应对方法

中药导致儿童鼻出血的五大原因及应对方法

企业战略与市场定位：如何精准把握市场机会

企业战略与市场定位：如何精准把握市场机会

栀子花的花语是什么？栀子花有哪些寓意？

栀子花的花语是什么？栀子花有哪些寓意？

如何准备出国留学申请

如何准备出国留学申请

学前端开发简单还是后端？六个维度全面解析

学前端开发简单还是后端？六个维度全面解析

洋吉梗的养殖方法

洋吉梗的养殖方法

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号