问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

深度学习中的Beam Search算法详解

创作时间:

作者:

@小白创作中心

深度学习中的Beam Search算法详解

引用

CSDN

1.

https://m.blog.csdn.net/fj1024/article/details/140043591

在自然语言处理和深度学习领域，beam search是一种常用的解码策略。它通过保留多个候选序列来避免贪心搜索的局限性，但同时也存在一些缺点。本文将详细介绍beam search的工作原理、缺点以及一些改进方法。

Beam Search的基本原理

束搜索（Beam Search）是一种在序列生成任务中常用的解码策略。与贪心搜索不同，束搜索在每个时间步解码时，不再只保留一个分数最高的作为输出，而是保留num_beams个。当num_beams=1时，束搜索就退化成了贪心搜索。

Beam Search的缺点

尽管束搜索比贪心搜索表现更好，但它仍然存在一些问题。例如，生成的文本可能会出现重复、空洞或前后矛盾的情况。为了解决这些问题，研究人员提出了多种改进方法。

改进方法

随机采样

随机采样（sampling）通过引入随机性来替代选择概率最大的词。这种方法可以增大所选词的范围，从而避免过度依赖最高概率的词。

Temperature随机采样

Temperature随机采样通过调整温度参数（T）来控制softmax函数产生的单词概率分布的平滑程度。具体来说：

当温度参数T较高时，指数运算的结果会变得更加平均，导致概率分布更加均匀，各个类别的概率差异较小。
当温度参数T较低时，指数运算的结果会更加集中，导致概率分布更加尖锐，各个类别的概率差异较大。

当温度参数T趋近于无穷大时，softmax函数的输出将趋近于均匀分布，即每个类别的概率接近于1/n，其中n是类别的数量。而当温度参数T趋近于零时，softmax函数的输出将趋近于一个独热编码，即只有最大值对应的类别的概率接近于1，其他类别的概率接近于0。

Top K采样

Top K采样方法在采样前将输出的概率分布截断，取出概率最大的k个词构成一个集合，然后将这个子集词的概率再归一化，最后从新的概率分布中采样词汇。

Top P采样

Top P采样方法通过累加概率，选取前若干个词的概率进行累加，直到达到预设的阈值p。然后取出前面这若干个词，重新进行概率归一化，并把剩下词的概率设为0。

惩罚重复

为了解决重复问题，可以通过惩罚因子将出现过词的概率变小，或者强制不使用重复词来解决。

停止解码策略

束搜索的停止解码策略通常包括两种情况：

解码到end字符
早停，即候选序列得分已经低于已解码完的当前最优序列

这些改进方法和策略共同作用，使得束搜索能够在保持较高效率的同时，生成更高质量的序列。

热门推荐

干货｜自由职业人自救指南之时间管理大法

干货｜自由职业人自救指南之时间管理大法

抑郁症最想听的十句话

抑郁症最想听的十句话

皮脂腺旺盛怎么办？全方位调理指南

皮脂腺旺盛怎么办？全方位调理指南

爱的教鞭，如何在惩罚中培养孩子的正面成长

爱的教鞭，如何在惩罚中培养孩子的正面成长

孩子的批判性思维能力：理性思考，独立判断

孩子的批判性思维能力：理性思考，独立判断

李知恩（IU）：韩国实力派歌手演员的多栖发展之路

李知恩（IU）：韩国实力派歌手演员的多栖发展之路

钢筋锈蚀隐患大，如何通过定期检测来规避风险？

钢筋锈蚀隐患大，如何通过定期检测来规避风险？

韩国为何规定“死子”放入棋盒盖？再谈柯洁LG杯犯规判负

韩国为何规定“死子”放入棋盒盖？再谈柯洁LG杯犯规判负

埋线减肥的副作用是什么

埋线减肥的副作用是什么

关于“见路不走”的一些思考

关于“见路不走”的一些思考

股票崩盘意味着什么？如何应对股票崩盘的风险？

股票崩盘意味着什么？如何应对股票崩盘的风险？

股市崩盘的原因、后果及对投资者的启示

股市崩盘的原因、后果及对投资者的启示

妈妈，为什么我的耳朵跟别人不一样？如何回答比较好

妈妈，为什么我的耳朵跟别人不一样？如何回答比较好

房屋租赁合同哪种好写：法律实务中的注意事项

房屋租赁合同哪种好写：法律实务中的注意事项

怎样查询医院病历档案？获取病历的步骤和注意事项是什么？

怎样查询医院病历档案？获取病历的步骤和注意事项是什么？

汽车燃油泵滤网的清洁要点

汽车燃油泵滤网的清洁要点

郑良明：农民工书法家的追梦之路

郑良明：农民工书法家的追梦之路

喝完精神一宿奶茶咖啡因含量竟比咖啡还高

喝完精神一宿奶茶咖啡因含量竟比咖啡还高

凤梨种植技术全攻略：从选地到收获的完整指南

凤梨种植技术全攻略：从选地到收获的完整指南

正十七边形的绘制（几何画板）

正十七边形的绘制（几何画板）

银行的ATM机取款异常情况处理办法有哪些？

银行的ATM机取款异常情况处理办法有哪些？

银行卡被自动取款机吞卡后的领取流程

银行卡被自动取款机吞卡后的领取流程

5V/1A与5V/2A充电器：手机充电背后的技术细节与安全考量

5V/1A与5V/2A充电器：手机充电背后的技术细节与安全考量

狂风暴雨的时候，鸭子为啥会站在雨里一动不动？

狂风暴雨的时候，鸭子为啥会站在雨里一动不动？

既能识别诈骗话术又能拆解骗局逻辑遇事不决找“D老师”

既能识别诈骗话术又能拆解骗局逻辑遇事不决找“D老师”

如何通过数据库观看NBA比赛

如何通过数据库观看NBA比赛

用激光照射飞机是否构成犯罪：法律分析与实践探讨

用激光照射飞机是否构成犯罪：法律分析与实践探讨

住房公积金缴存规定是什么,公积金贷款类别又有哪些

住房公积金缴存规定是什么,公积金贷款类别又有哪些

合肥市2035年发展前景预测（基于PEST-SWOT分析）

合肥市2035年发展前景预测（基于PEST-SWOT分析）

种植牙研究文献综述：种植牙的新进展与临床应用探讨

种植牙研究文献综述：种植牙的新进展与临床应用探讨

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号