深度学习(5):逻辑斯蒂回归Logistic
创作时间:
作者:
@小白创作中心
深度学习(5):逻辑斯蒂回归Logistic
引用
CSDN
1.
https://blog.csdn.net/qq_51976556/article/details/142499245
一、逻辑斯蒂回归(Logistic Regression)
- 概述
逻辑斯蒂回归是一种广泛应用于二分类问题的统计模型,用于预测输入数据属于某个类别的概率,实际上是用于分类任务的。
- 原理
模型函数:逻辑斯蒂回归使用逻辑斯蒂函数(Sigmoid 函数)将线性回归的输出映射到 (0,1) 区间,表示预测为正类的概率。
损失函数:使用对数似然损失函数,通过最大化似然函数来估计模型参数。
二、KL 散度(相对熵)
- 概述
KL 散度(Kullback-Leibler Divergence),也称为相对熵,是用于衡量两个概率分布 ( P ) 和 ( Q ) 之间差异的非对称度量。
定义
性质
作用
KL 散度在信息论和机器学习中用于:
- 衡量分布差异:评估模型预测分布与真实分布之间的差异。
- 优化目标:在变分推断等方法中,最小化 KL 散度以逼近复杂的概率分布。
三、交叉熵(Cross-Entropy)
- 概述
交叉熵是衡量两个概率分布之间差异的度量,特别关注真实分布与预测分布之间的信息熵差异。
- 定义
对于离散分布,交叉熵定义为:
关系
作用
在机器学习中,交叉熵常用作分类模型的损失函数,衡量模型预测与真实标签之间的差异。
四、关系
- 逻辑斯蒂回归与交叉熵损失
在逻辑斯蒂回归中,损失函数实际上就是交叉熵损失。通过最小化交叉熵损失,我们希望模型的预测分布 ( Q ) 接近真实分布 ( P )。
- 二分类交叉熵损失函数:
- 交叉熵与 KL 散度的关系
- 联系:交叉熵等于真实分布的熵加上真实分布与预测分布之间的 KL 散度。
- KL 散度在逻辑斯蒂回归中的作用
- 在逻辑斯蒂回归中,通过最小化交叉熵损失,我们实际上是在最小化模型预测分布 ( Q ) 与真实分布 ( P ) 之间的 KL 散度。
- 这意味着我们希望模型的预测分布尽可能接近真实分布,从而提高分类准确率。
五、总结
- 逻辑斯蒂回归:一种用于二分类问题的模型,使用 Sigmoid 函数将线性组合映射为概率,损失函数为交叉熵损失。
- 交叉熵:衡量两个概率分布之间差异的度量,用于逻辑斯蒂回归等模型的损失函数。
- KL 散度:衡量两个概率分布之间差异的非对称度量,交叉熵可以视为熵和 KL 散度的组合。
- 关系:在逻辑斯蒂回归中,最小化交叉熵损失等价于最小化真实分布和模型预测分布之间的 KL 散度。
热门推荐
猫咪异常行为预警:健康大揭秘!
你的性格可能影响猫咪健康!
才高不薄雕虫技——“诗书画印”四绝的陈师曾
陈师曾:中国近现代"文人画"的精神领袖
河源双璧:苏家围与南园古村的客家文化传承
河源必打卡:全球最多恐龙蛋的博物馆
纯电动汽车选购指南:续航、技术、安全全面解析
增程式车型逆市成市场新宠,为啥新能源车企都要做增程式?
南岳衡山祈福一日游:寻宗教圣地,祈美好心愿
黄鹤楼的由来传说,你真的了解吗?看完涨知识了!
雅思口语7.5分大神分享:如何短期逆袭?
悉尼大学硕士雅思要求全解析:基础要求、学院差异与签证新政
澳元汇率走低,2025年申请澳洲硕士的最佳时机!
银行的信用卡免息期的计算方法有哪些?
信用卡免息期全解析:从概念到设置规则
乌梅汤:传承千年的养生饮品
饭后出汗?中医教你固汗止汗小妙招!
家谱里的祠堂:祠堂位置、建筑、布局与家族精神
哈萨克斯坦自由行旅游攻略
申根签证资金证明怎么准备?5种有效材料+注意事项
覆盖10大医疗应用场景!国产AI大模型应用典型案例盘点
探秘通州古城与燃灯佛舍利塔的历史奥秘
宋庄艺术之旅:7000多位艺术家的“梦工厂”
通州大运河森林公园:秋日游园正当时
智联招聘:灵活用工成趋势,新兴行业机会多
祠堂祖先神位如何排列?
古朴沧桑话王氏宗祠
英国名校雅思门槛全解析:从G5到热门专业要求详解
留学必备:用《唐顿庄园》提升你的英语
留学美国如何克服语言障碍?