机器学习中的平均绝对误差(MAE)详解
创作时间:
作者:
@小白创作中心
机器学习中的平均绝对误差(MAE)详解
引用
CSDN
1.
https://blog.csdn.net/IT_ORACLE/article/details/143623931
平均绝对误差(MAE)是机器学习和统计学中常用的评估指标,用于衡量预测值与实际值之间的平均差异。与均方误差(MSE)或均方根误差(RMSE)相比,MAE使用误差的绝对值,因此在处理异常值时更加稳定。本文将详细介绍MAE的定义、计算方法、性质、优缺点及其应用场景,并通过Python代码实现和图解说明帮助读者更好地理解这一概念。
1. MAE 的定义和公式
给定预测值 (\hat{y}_i) 和真实值 (y_i),MAE 的公式为:
$$
MAE = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|
$$
其中:
- (n) 是样本总数。
- (\hat{y}_i) 是模型的预测值。
- (y_i) 是对应的真实值。
MAE 表示了预测值与真实值之间的平均绝对差异。由于取了绝对值,每个误差的正负号被忽略,保证了所有差异的非负性。
2. MAE 的计算步骤
计算 MAE 的步骤如下:
- 求出误差:计算预测值 (\hat{y}_i) 与真实值 (y_i) 之间的差异。
- 取绝对值:计算每个误差的绝对值,以确保所有差异都是正值。
- 求均值:将所有误差的绝对值加总,并除以样本数量 (n),得到 MAE。
3. MAE 的性质和意义
- 易于解释:MAE 具有与原始数据相同的单位,直接表示预测值与真实值的平均差距,因而易于理解和解释。
- 对异常值更稳定:相比 MSE 和 RMSE,MAE 对异常值不敏感,不会因为少数大误差的平方而放大结果,适用于具有较多异常值的数据集。
- 偏好绝对误差:由于 MAE 忽略了误差的正负号,它无法提供误差的方向性信息。
4. MAE 的优缺点
优点
- 简单直观:MAE 仅计算绝对误差的平均值,简单明了。
- 对异常值稳定:由于没有误差平方的放大效应,MAE 不易受异常值的影响,更能反映数据的整体趋势。
缺点
- 缺乏方向性:由于计算绝对误差,MAE 无法反映出误差是正偏还是负偏,可能不适用于需要区分偏差方向的应用场景。
- 较低的区分度:MAE 没有放大误差的功能,因此在评估较复杂模型的表现时,可能没有 RMSE 那样敏感。
5. MAE 的应用
MAE 是回归问题中常用的评估指标,广泛应用于以下场景:
- 时间序列预测:在金融、气象等时间序列预测问题中,MAE 可以用来评估预测精度。
- 经济预测:在经济领域,MAE 用于衡量经济指标的预测偏差,帮助判断模型的可靠性。
- 机器学习模型的比较:MAE 在回归模型的评估中用于衡量不同模型的预测效果,是算法调优时的重要参考指标。
6. Python 实现代码
import numpy as np
def mae(y_true, y_pred):
return np.mean(np.abs(y_pred - y_true))
# 示例
y_true = np.array([3, -0.5, 2, 7])
y_pred = np.array([2.5, 0.0, 2, 8])
result = mae(y_true, y_pred)
print("MAE:", result)
说明
y_true
为真实值数组,y_pred
为预测值数组。np.abs(y_pred - y_true)
计算每个误差的绝对值。np.mean(...)
求所有误差的绝对值的平均,得到 MAE。
7. MAE 的图解说明
下图展示了 MAE 的计算过程,其中:
- 蓝色圆点连线代表真实值 (y)。
- 红色叉点连线代表预测值 (\hat{y})。
- 每条灰色虚线表示预测值和真实值之间的绝对误差。
可以用垂直线表示预测值与实际值之间的绝对误差,每条线段的长度对应于预测值和真实值的差异。以下是一个 MAE 的计算图解步骤:
- 绘制真实值和预测值的散点图:将实际值和预测值分别绘制在坐标图上。
- 计算误差:每个预测点到真实点的垂直线段代表误差的绝对值。
- 平均误差长度:将这些垂直线段的长度平均,即得到 MAE。
通过这样的图示,MAE 能帮助直观展示预测结果与实际情况的整体差异。
8. MAE 与 RMSE 的对比
指标 | MAE | RMSE |
---|---|---|
计算方式 | 绝对误差的均值 | 平方误差的均值开平方根 |
对异常值敏感性 | 低 | 高 |
是否反映方向性 | 否 | 否 |
应用场景 | 数据含有较多异常值的数据集 | 对精度要求高的数据分析场景 |
9. 结论
MAE 是一种简单、直观且对异常值较为稳定的误差度量方法。它适合用于需要估计预测与真实值间差距的应用场景。对于希望避免极端值过度影响的情况,MAE 是一个有效的选择。而在需要更精细的模型评价时,通常会与 RMSE 一起使用,从而更全面地评估模型的预测表现。
热门推荐
强推《晚明》等10本评分最高的历史小说,主角智多近妖杀伐果断!
葫芦巴种子怎么种植最适合 播种方法
什么是消失模铸造:定义、重要性、工作原理、应用和优势
盘点河南最好吃的十碗烩面,馋哭在外游子,有你家乡的那碗吗?
传统武术掌法精功:内功篇、外功篇、绝技篇
哪些因素影响国家电网企业文化的形成?
梦幻西游手游PC端总死机问题解析及解决方案
翡翠手镯挑选、保养与鉴别:全方位指南解析常见问题及解答
梁晓声新作《中国文化的历史基因》:解码千年文化特质
治疗睡眠呼吸暂停只能用正压呼吸器吗?止鼾牙套或许是更理想的替代治疗!

一文读懂“CAR-T细胞免疫治疗”
珠海楼市回调后将迎来首轮微涨,房价上涨是正常现象
“肠寿”才能长寿!给肠道投喂这10种食物,让肠道更年轻
可降解材料运输包装专利如何推动绿色物流和可持续发展?
橘猫品种介绍与养护指南
三里屯、石家庄、呼家楼……村、庄、屯有啥区别?
人工智能岗位需求大增,AI人才市场火热,薪资水涨船高
属鸡的住哪个方向的风水好?属鸡人居住楼层的宜忌
天涯社区的兴衰史:一个网络乌托邦的落幕
因红牌丢掉4分,这会成为影响阿森纳争冠的关键因素吗?
适老化家居打造指南:从布局到照明的全方位设计建议
合理避税与税务筹划的关系是什么
汉代货币大揭秘:铜钱称霸,黄金成配角
CBA常规赛:郭士强观战广东逆转新疆取连胜 徐杰22+3胡明轩13中4
LBMR技术亮相山西 参观者“探访”1600年前军事堡垒
贝姓的起源与来历:追溯召公康的足迹,探寻姓氏传承的故事
物业收支不透明?最高法明确:业主有权查账!2025最新取证攻略!
微短剧行业的版权保护与发展专题研讨大家谈
延续历史文脉,绽放新时代生命力,照亮徐州城市“更”新之路
设计一个游戏的基本博弈框架