深度学习中的熵相关知识:信息量、熵、相对熵与交叉熵详解
创作时间:
作者:
@小白创作中心
深度学习中的熵相关知识:信息量、熵、相对熵与交叉熵详解
引用
1
来源
1.
https://www.cnblogs.com/gongzb/p/18679797
在深度学习领域,熵相关知识是理解模型训练和优化的关键概念之一。本文将通过通俗易懂的语言,帮助读者理解信息量、熵、相对熵(KL散度)和交叉熵等核心概念及其相互关系。
信息量
信息量是衡量一个事件发生所携带的信息多少的指标。一个事件发生的概率越低,其信息量越大。例如,“中国队在世界杯夺冠”这一事件发生概率极低,因此其信息量非常大。
信息量的计算公式为:
其中,p(x)表示事件x发生的概率。公式中的负号是为了确保信息量为正数,而对数函数则用于衡量信息量的大小。
熵
熵是衡量一个系统整体不确定性的指标。它反映了系统从不确定状态变为确定状态的难度。熵的本质是用一个数值来概括整个概率分布中的不确定性。
熵的计算公式为:
其中,p(x)表示事件x发生的概率,H(X)表示随机变量X的熵。熵的计算需要考虑每个事件的信息量与其发生概率的乘积,再对所有事件求和。
相对熵(KL散度)
相对熵,也称为KL散度,用于衡量两个概率分布之间的差异。它可以帮助我们比较模型预测分布与真实分布之间的差距。
KL散度的计算公式为:
其中,P表示真实分布,Q表示模型预测分布。KL散度的值越大,表示两个分布之间的差异越大。
交叉熵
交叉熵是衡量使用一个概率分布(Q)来表示另一个概率分布(P)的效率的指标。在机器学习中,交叉熵常被用作损失函数,用于衡量模型预测结果与真实标签之间的差异。
交叉熵的计算公式为:
其中,P表示真实分布,Q表示模型预测分布。交叉熵的值越小,表示模型的预测结果越接近真实标签。
总结
- 信息量衡量单个事件的不确定性
- 熵衡量整个系统的不确定性
- KL散度衡量两个概率分布之间的差异
- 交叉熵衡量使用一个概率分布表示另一个概率分布的效率
在深度学习中,最小化交叉熵等价于最小化KL散度,这有助于优化模型的预测性能。
本文原文来自知乎专栏
热门推荐
广东人最爱的滋补佳肴:猪肚鸡
广东名菜:猪肚鸡的正宗做法大揭秘!
广东人教你挑选猪肚鸡食材
不要误解便秘为正常情况
解密:三国历史中常被人忽视的顶级谋士李儒
去向未知的——毒谋士李儒
中式园林设计里八大造景手法,一步一景皆诗意
昆明到北海的秋冬自驾游:10天9晚,3600元打造难忘之旅
318自驾游秘籍:教你拍出大片!
秋冬自驾游新宠:昆明到广西的文化探秘之旅
镇江四日游攻略:探访历史文化名城,不可错过的古镇之旅
家庭旅行新选择:探索家庭式民宿太空舱
Michio Kaku揭秘:宇宙微波背景辐射中的"冷点"或为平行宇宙存在证据
《洛基》中的平行宇宙:你的既视感有科学依据吗?
量子平行宇宙:哲学新视角
摩托车逾期未检验的处罚及风险提示
全国哪里的大黄鱼最出名?中国10个优质大黄鱼产地,哪的最好吃?
美食厨房 | 家烧大黄鱼
中医特色护理疗法 | 艾灸:温通气血 扶正祛邪
艾灸不是“烤火”!九宫艾带你了解艾灸如何调理身体,排出病邪!
量子力学新突破:平行宇宙中真的存在外星生命吗?
昆明秋末冬初自驾游攻略:9大湿地公园、5条经典路线详解
除夕除了吃饺子,年夜饭餐桌上必备的3样吉祥美味!
《蜘蛛侠:平行宇宙》中的多重世界探索
爱因斯坦和霍金眼中的平行宇宙:从理论到实证
中国科学家首次测出量子纠缠速度,232阿秒刷新人类认知
《彗星来的那一夜》:量子平行宇宙的哲学思考
探访官渡古镇:昆明自驾游的历史宝藏
秋冬自驾游必备:从昆明出发的驾驶技巧分享
酒精助眠是误区!这些科学方法更有效