机器学习之交叉熵
创作时间:
作者:
@小白创作中心
机器学习之交叉熵
引用
CSDN
1.
https://m.blog.csdn.net/dundunmm/article/details/144466980
交叉熵(Cross-Entropy)是机器学习中用于衡量预测分布与真实分布之间差异的一种损失函数,特别是在分类任务中非常常见。它源于信息论,反映了两个概率分布之间的距离。
交叉熵的数学定义
对于分类任务,假设我们有:
- 一个真实的分布 y,用独热编码表示,例如 y=[0,1,0] 表示属于第二类。
- 一个预测的概率分布\hat{y},例如 \hat{y} = [0.1, 0.7, 0.2],表示模型预测属于各类的概率。
交叉熵的公式为:
其中:
- yi是真实分布中第 i 类的值(独热编码下只有一个为 1,其余为 0)。
- \hat{y}_i 是模型预测的第 i 类的概率。
由于 y 是独热编码,交叉熵可以简化为:
其中 c 是真实类别的索引。
交叉熵的直观理解
- 信息论解释:
- 交叉熵可以理解为用预测分布\hat{y} 去编码真实分布 y 的代价。
- 如果预测越接近真实分布(即预测概率\hat{y}_c 越接近 1),交叉熵越小,模型表现越好。
- 惩罚机制:
- 如果模型的预测概率 \hat{y}_c 很低(接近 0),交叉熵会给出很大的惩罚。
- 这促使模型更自信地预测正确类别。
交叉熵的应用场景
二分类问题: 对于二分类任务,真实标签 y∈{0,1},模型预测 \hat{y} \in [0, 1]。交叉熵损失为:
多分类问题: 对于 K 类分类任务,交叉熵损失为:
其中 y_k 表示第 k 类的真实标签,\hat{y}_k 表示模型对第 k 类的预测概率。
- 目标检测和语义分割: 交叉熵通常与其他损失(如 IoU、Dice Loss)结合使用,以处理多任务学习。
交叉熵的优点
- 数学性质优良:损失函数连续且可微,适合梯度下降优化。
- 自然适用于概率分布:直接用概率度量模型的预测质量。
- 对错误预测的敏感性:能有效惩罚错误分类,提高模型对分类任务的优化效果。
交叉熵的缺点
- 对预测不平衡的敏感性:
- 如果某些类别的样本数很少,模型可能忽视这些类别。
- 解决方法:可以结合加权交叉熵(Weighted Cross-Entropy)。
- 对异常值的敏感性:当预测概率非常接近 0 时,交叉熵的惩罚会非常大,可能导致数值不稳定。
交叉熵与其它损失的关系
- 与均方误差(MSE):
- MSE 更适合回归任务,而交叉熵适合分类任务。
- 对于分类任务,MSE 可能导致梯度消失,影响优化效果。
- 与 KL 散度:交叉熵是 KL 散度的一部分,衡量预测分布与真实分布的差异。
实现示例
二分类问题的交叉熵损失(Python + PyTorch)
import torch
import torch.nn as nn
# 假设真实标签和预测概率
y_true = torch.tensor([1, 0, 1], dtype=torch.float32) # 真实标签
y_pred = torch.tensor([0.8, 0.2, 0.6], dtype=torch.float32) # 预测概率
# 定义二分类交叉熵损失
loss_fn = nn.BCELoss()
loss = loss_fn(y_pred, y_true)
print(f"Binary Cross-Entropy Loss: {loss.item():.4f}")
多分类问题的交叉熵损失
# 假设真实标签和预测概率
y_true = torch.tensor([1, 0, 2]) # 真实标签(类别索引)
y_pred = torch.tensor([[0.3, 0.6, 0.1],
[0.1, 0.2, 0.7],
[0.8, 0.1, 0.1]]) # 预测概率
# 定义多分类交叉熵损失
loss_fn = nn.CrossEntropyLoss()
loss = loss_fn(y_pred, y_true)
print(f"Multi-class Cross-Entropy Loss: {loss.item():.4f}")
交叉熵是分类任务中的核心损失函数之一,其优异的性质和强大的优化能力使其在机器学习的各个领域得到了广泛应用。
热门推荐
拍的最好看的10部青春校园剧,哪几部勾起了你的青春回忆?
XR实时渲染:三大挑战与优化技巧
招聘全流程详解:从面试到入职
宋朝皇帝评鉴:谁是真正的治国佼佼者?
火药时代:明朝火器与欧洲的对比
双拼域名查询指南:概念、优势与实用技巧全解析
先睹为快!总台元宵晚会还有重庆,10种美食带你感受舌尖上的非遗
反复酸痛、僵硬的 “妈妈手”,这样治好它
3款健康蛋糕食谱:港姐邓卓殷Amber的自创超简易零失败甜品
掌握英语发音的秘密武器:全方位解析语音符号
鹳雀楼:纵览浩瀚天地 领略灿烂文明
“又老又潮”的英歌舞,终于轮到出圈又出海
中国足球现状系列文章,从困境中求生:中国足球的历史与现状
离婚可以离婚不离家吗?法律风险与应对建议
廊腰缦回,檐牙高啄 中国古建的空间转换之美
小空间大舒适:小卧室打造高质量睡眠环境全攻略
轻松掌握几何图形的奥秘:如何计算对角线长度?
探秘千古传世之作——《滕王阁序》深度解析
给你三妙计,有效防范开户滥用
科普 | 磷霉素氨丁三醇散,吃得明明白白
太原必吃的18种美食,每一种都藏着晋韵风情
基金持仓收益excel表格如何制作?
除夕可以缝补衣服吗?过年有哪些禁忌?10个传统习俗解读
疤痕用什么膏结果好?选择合适的疤痕修复膏的关键因素是什么?
电力安全必备:高压验电器的使用指南
复旦大学新技术提高锂电池寿命十倍,能否助力新能源革命?
中医把脑梗看成是瘀血的原因
利用ollama + RAGFlow部署千问大模型构建个人知识库AI智能体应用
兔生肖的人生如何让财运更旺:智慧选择与行动的指南
维生素A和维生素D的补充详解