深度学习(5):逻辑斯蒂回归Logistic
创作时间:
作者:
@小白创作中心
深度学习(5):逻辑斯蒂回归Logistic
引用
CSDN
1.
https://blog.csdn.net/qq_51976556/article/details/142499245
一、逻辑斯蒂回归(Logistic Regression)
- 概述
逻辑斯蒂回归是一种广泛应用于二分类问题的统计模型,用于预测输入数据属于某个类别的概率,实际上是用于分类任务的。
- 原理
模型函数:逻辑斯蒂回归使用逻辑斯蒂函数(Sigmoid 函数)将线性回归的输出映射到 (0,1) 区间,表示预测为正类的概率。
损失函数:使用对数似然损失函数,通过最大化似然函数来估计模型参数。
二、KL 散度(相对熵)
- 概述
KL 散度(Kullback-Leibler Divergence),也称为相对熵,是用于衡量两个概率分布 ( P ) 和 ( Q ) 之间差异的非对称度量。
定义
性质
作用
KL 散度在信息论和机器学习中用于:
- 衡量分布差异:评估模型预测分布与真实分布之间的差异。
- 优化目标:在变分推断等方法中,最小化 KL 散度以逼近复杂的概率分布。
三、交叉熵(Cross-Entropy)
- 概述
交叉熵是衡量两个概率分布之间差异的度量,特别关注真实分布与预测分布之间的信息熵差异。
- 定义
对于离散分布,交叉熵定义为:
关系
作用
在机器学习中,交叉熵常用作分类模型的损失函数,衡量模型预测与真实标签之间的差异。
四、关系
- 逻辑斯蒂回归与交叉熵损失
在逻辑斯蒂回归中,损失函数实际上就是交叉熵损失。通过最小化交叉熵损失,我们希望模型的预测分布 ( Q ) 接近真实分布 ( P )。
- 二分类交叉熵损失函数:
- 交叉熵与 KL 散度的关系
- 联系:交叉熵等于真实分布的熵加上真实分布与预测分布之间的 KL 散度。
- KL 散度在逻辑斯蒂回归中的作用
- 在逻辑斯蒂回归中,通过最小化交叉熵损失,我们实际上是在最小化模型预测分布 ( Q ) 与真实分布 ( P ) 之间的 KL 散度。
- 这意味着我们希望模型的预测分布尽可能接近真实分布,从而提高分类准确率。
五、总结
- 逻辑斯蒂回归:一种用于二分类问题的模型,使用 Sigmoid 函数将线性组合映射为概率,损失函数为交叉熵损失。
- 交叉熵:衡量两个概率分布之间差异的度量,用于逻辑斯蒂回归等模型的损失函数。
- KL 散度:衡量两个概率分布之间差异的非对称度量,交叉熵可以视为熵和 KL 散度的组合。
- 关系:在逻辑斯蒂回归中,最小化交叉熵损失等价于最小化真实分布和模型预测分布之间的 KL 散度。
热门推荐
广州初三复读:八大策略提升学生学习动机与兴趣
阿根廷锋线不整遭数据看衰 恐被乌拉圭双杀
高效会议秘诀:优化流程、促进沟通的策略与实践
轴流式风机与离心式风机性能比较
2025养老金调整日程明确!三步到位、涨幅可期,这些新变化要知道
韩国人姓名大全及其含义
个人借款利息如何缴税:法律适用与税务处理分析
太火爆!大批韩国游客涌入!韩国多家旅行社推出:“探福公主家乡”
胃镜检查胃体可见部分RAC征是什么意思
环岛行驶规则详解
香港公司税务指南:你需要知道的税种和税率
安徒生童话中的暗黑元素
快餐食品的营养价值
影像医学与核医学:现代医学的“侦察兵”
安捷伦示波器脉宽设置详解
劳务外包需要什么证件
衰老的神经生物学机制研究助力揭开脑衰老之谜
手冲咖啡粉研磨粗细咖啡风味口感对比 手冲咖啡研磨度参考
什么是市场估值?市场估值的方法有哪些?
购房发票长什么样?解读购房票据的关键信息
计算机未来从事的工作领域及发展前景
什么是访问深度(Depth of Visit)?一文读懂
司法鉴定:如何识别假货并维护消费者权益
假冒伪劣产品案件的责任认定与法律应对
保险费率厘定的原则是什么?专业视角深度解读
饭前、饭后、随餐,口服药的穷讲究? ——怎样服药才正确?
如何利用AI工具高效生成论文大纲与内容?
聚醚醚酮文献综述:技术进展与应用前景
甘油三酯和胆固醇都高怎么办
翡翠原石色彩的生成原理及其影响:深入解析各种颜色的形成机制