回归损失和分类损失
创作时间:
作者:
@小白创作中心
回归损失和分类损失
引用
CSDN
1.
https://blog.csdn.net/Oxford1151/article/details/140273079
回归损失和分类损失是机器学习模型训练过程中常用的两类损失函数,分别适用于回归任务和分类任务。
回归损失函数
回归任务的目标是预测一个连续值,因此回归损失函数衡量预测值与真实值之间的差异。常见的回归损失函数有:
- 均方误差(Mean Squared Error, MSE)
- 计算预测值与真实值之间差的平方的平均值。
- 对于误差较大的样本,MSE 会给予更高的惩罚,因此对异常值较为敏感。
- 数学表达式:
应用场景示例:在房价预测任务中,MSE 可以帮助模型快速收敛到一个相对准确的预测值,但异常高价或低价的房屋数据可能会对模型产生较大影响。
- 均方根误差(Root Mean Squared Error, RMSE)
- 是均方误差的平方根,具有与预测值和真实值相同的单位。
- 数学表达式:
$$RMSE = \sqrt{\frac{1}{n}\sum_{i=1}^{n}(y_i - \hat{y}_i)^2}$$
应用场景示例:在天气预报中,RMSE 可以帮助评估温度预测的准确性,其单位与温度相同,便于直观理解误差大小。
- 平均绝对误差(Mean Absolute Error, MAE)
- 计算预测值与真实值之间绝对差的平均值。
- MAE 对异常值不如 MSE 敏感。
- 数学表达式:
$$MAE = \frac{1}{n}\sum_{i=1}^{n}|y_i - \hat{y}_i|$$
应用场景示例:在股票价格预测中,MAE 可以帮助模型更好地处理异常波动,避免被极端值过度影响。
- Huber损失(Huber Loss)
- 结合了MSE和MAE的优点,对异常值具有一定的鲁棒性。
- 数学表达式:
$$
HuberLoss =
\begin{cases}
\frac{1}{2}(y_i - \hat{y}_i)^2 & \text{if } |y_i - \hat{y}_i| < \delta \
\delta (|y_i - \hat{y}_i| - \frac{1}{2}\delta) & \text{otherwise}
\end{cases}
$$
应用场景示例:在自动驾驶中,Huber损失可以平衡对正常行驶数据和异常情况(如突发障碍物)的处理,提高模型的鲁棒性。
分类损失函数
分类任务的目标是预测一个类别标签,因此分类损失函数衡量预测的概率分布与真实标签分布之间的差异。常见的分类损失函数有:
- 二元交叉熵(Binary Cross-Entropy, BCE)
- 适用于二分类问题。
- 衡量真实标签与预测概率之间的差异。
- 数学表达式:
$$BCE = -\frac{1}{n}\sum_{i=1}^{n}[y_i\log(\hat{y}_i) + (1-y_i)\log(1-\hat{y}_i)]$$
应用场景示例:在垃圾邮件分类中,BCE 可以帮助模型准确区分垃圾邮件和正常邮件。
- 多元交叉熵(Categorical Cross-Entropy, CCE)
- 适用于多分类问题。
- 衡量真实标签的一个热编码与预测概率分布之间的差异。
- 数学表达式:
$$CCE = -\frac{1}{n}\sum_{i=1}^{n}\sum_{j=1}^{C}y_{ij}\log(\hat{y}_{ij})$$
应用场景示例:在图像分类任务中,CCE 可以帮助模型区分不同类别的图像。
- 稀疏分类交叉熵(Sparse Categorical Cross-Entropy, SCCE)
- 适用于多分类问题,但真实标签不是一个热编码,而是一个整数索引。
- 数学表达式与CCE相同,但真实标签是整数索引而不是一个热编码。
应用场景示例:在手写数字识别中,SCCE 可以直接处理0-9的数字标签,无需转换为one-hot编码。
- Kullback-Leibler散度(Kullback-Leibler Divergence, KL Divergence)
- 衡量两个概率分布之间的差异。
- 常用于强化学习和生成模型中。
- 数学表达式:
$$KL(P||Q) = \sum_{i}P(i)\log\left(\frac{P(i)}{Q(i)}\right)$$
其中 P是真实分布, Q是预测分布。
应用场景示例:在生成对抗网络(GAN)中,KL散度可以衡量生成的图像分布与真实图像分布之间的差异。
选择损失函数的建议
- 如果你的任务是预测连续值,选择回归损失函数,如MSE 或 MAE。
- 如果你的任务是分类,选择分类损失函数,如BCE 或 CCE。
- 具体选择哪种损失函数,还需根据任务的特点和数据的分布来确定。MSE 对异常值敏感,而 MAE 较为鲁棒;交叉熵损失函数适用于概率预测,而 KL 散度则适用于比较概率分布。
热门推荐
提车必看:7大灯光系统检查要点与实操指南
汽车灯光使用全攻略:从法规要求到实战技巧
自己动手换近光灯:9步详解,省时省钱又安全
今日小年,农村老人说“小年三要洗,来年不受穷”,指哪三要洗?
南方小年夜是农历几号?南方小年夜的习俗与传说
马斯克Neuralink成功植入大脑芯片,专家解读:技术突破但需谨慎
探访鄂州博物馆:一日游完美行程,揭秘三国吴都
从外观到口感:专家详解黄桃选购六大技巧
牙痛自救指南:6种快速止痛方法及穴位按摩图解
苦瓜和绿豆:肝胆湿热的食疗良方
绿豆薏米粥:肝胆湿热的居家调理良方
绿豆冬瓜汤:告别肝胆湿热的养生良方
中医教你告别肝胆湿热烦恼
时间管理大师的7个实用技巧,助你提升工作效率
Excel统计任职时间全攻略:8种方法详解
气血不足的人总喜欢蹲着?8个坏习惯容易“带走”气血,别再做!
Android自动亮度调节的秘密:从传感器到用户体验
护眼模式真的有用吗?教你科学调亮度
福州一日游精选:三坊七巷、烟台山、平潭岛三大主题路线
气血两虚怎么调理最有效
快入冬了,想要快速把气血补回来,多喝这三道汤!冬季再冷也不怕
传统美食凉拌皮冻:周末在家就能做出餐厅味
2.2 石窟简史|东传:从古印度到中国新疆,龟兹为何佛教如此盛行?
“桂林山水甲天下”:一块石碑背后的文化传奇
揭阳市十大旅游景点详解
全球最大镁生产基地府谷:环保技改投入45亿,引领行业绿色转型
南京长江大桥:中国自主建桥里程碑,开创技术新纪元
南京长江大桥:攻克世界级难题,开创中国桥梁建设新纪元
从“争气桥”到文旅新地标:南京长江大桥的前世今生
三伏天六道清淡菜:西芹虾仁到捞汁生蚝,助你清凉开胃