深度学习(5):逻辑斯蒂回归Logistic
创作时间:
作者:
@小白创作中心
深度学习(5):逻辑斯蒂回归Logistic
引用
CSDN
1.
https://blog.csdn.net/qq_51976556/article/details/142499245
一、逻辑斯蒂回归(Logistic Regression)
- 概述
逻辑斯蒂回归是一种广泛应用于二分类问题的统计模型,用于预测输入数据属于某个类别的概率,实际上是用于分类任务的。
- 原理
模型函数:逻辑斯蒂回归使用逻辑斯蒂函数(Sigmoid 函数)将线性回归的输出映射到 (0,1) 区间,表示预测为正类的概率。
损失函数:使用对数似然损失函数,通过最大化似然函数来估计模型参数。
二、KL 散度(相对熵)
- 概述
KL 散度(Kullback-Leibler Divergence),也称为相对熵,是用于衡量两个概率分布 ( P ) 和 ( Q ) 之间差异的非对称度量。
定义
性质
作用
KL 散度在信息论和机器学习中用于:
- 衡量分布差异:评估模型预测分布与真实分布之间的差异。
- 优化目标:在变分推断等方法中,最小化 KL 散度以逼近复杂的概率分布。
三、交叉熵(Cross-Entropy)
- 概述
交叉熵是衡量两个概率分布之间差异的度量,特别关注真实分布与预测分布之间的信息熵差异。
- 定义
对于离散分布,交叉熵定义为:
关系
作用
在机器学习中,交叉熵常用作分类模型的损失函数,衡量模型预测与真实标签之间的差异。
四、关系
- 逻辑斯蒂回归与交叉熵损失
在逻辑斯蒂回归中,损失函数实际上就是交叉熵损失。通过最小化交叉熵损失,我们希望模型的预测分布 ( Q ) 接近真实分布 ( P )。
- 二分类交叉熵损失函数:
- 交叉熵与 KL 散度的关系
- 联系:交叉熵等于真实分布的熵加上真实分布与预测分布之间的 KL 散度。
- KL 散度在逻辑斯蒂回归中的作用
- 在逻辑斯蒂回归中,通过最小化交叉熵损失,我们实际上是在最小化模型预测分布 ( Q ) 与真实分布 ( P ) 之间的 KL 散度。
- 这意味着我们希望模型的预测分布尽可能接近真实分布,从而提高分类准确率。
五、总结
- 逻辑斯蒂回归:一种用于二分类问题的模型,使用 Sigmoid 函数将线性组合映射为概率,损失函数为交叉熵损失。
- 交叉熵:衡量两个概率分布之间差异的度量,用于逻辑斯蒂回归等模型的损失函数。
- KL 散度:衡量两个概率分布之间差异的非对称度量,交叉熵可以视为熵和 KL 散度的组合。
- 关系:在逻辑斯蒂回归中,最小化交叉熵损失等价于最小化真实分布和模型预测分布之间的 KL 散度。
热门推荐
揭秘遗传性心电疾病——Brugada综合征,从“女鬼”说起……
别再上当!一篇告诉你到底什么是“珐琅”?
Ansys Fluent GPU求解器使用指南
美国债务利息负担创28年新高
Redis系列之Redis Sentinel
3-10万吨/年!当升科技与中伟股份签署固态电池等长期合作协议
中石油和中石化谁油质最好?内行人讲出实情:原来差距这么大
黄金回购太火爆!有银行已经预约到3月下旬 业内:2025年黄金整体仍有上行空间
四合院房子是怎么安排居住的?
咖喱大解密:从印度到全球的美食之旅
人口普查显示,美国人口增长率为23年来最快,首次突破3.4亿大关
AMD处理器安装Win10还是Win11?全面解析与最佳选择指南
白铜和黄铜的区别
收到简历不合适通知?这样回复最得体
算法与数据结构精讲-数据结构算法掌握
首阴战法的演变
核桃能补脑?最新研究:还真不是“以形补形”
慢性咽炎吃阿莫西林有用吗?一文读懂病因与治疗
如何在自己的代码中声明版权
章鱼拥有9个大脑能编辑基因,智商很高,为什么没发展出文明?
梯形图和ST语言,到底哪个更好用?大厂大神这么说
影史经典电影《美国往事》台词赏析"能够被你欺骗的人,都是相信你的人”
His标签蛋白纯化技术关键要点与疑难问题解析
普陀山十大佛寺:海天佛国里的神圣殿堂
热菜能否直接放入冰箱?答案竟然不绝对?
举报危险驾驶行为的方法
举报危险驾驶行为的方法
贵州青岩古镇与镇远古镇深度对比:历史韵味与旅游体验全方位解析
综合评价报考条件及要求(含2024年各校录取分数线)
英媒: 974球场拆除后或送给乌拉圭 用于2030世界杯