问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

机器学习中的均方误差（MSE）详解：定义、特点及应用

创作时间:

作者:

@小白创作中心

机器学习中的均方误差（MSE）详解：定义、特点及应用

引用

CSDN

1.

https://m.blog.csdn.net/IT_ORACLE/article/details/143499586

均方误差（Mean Squared Error, MSE）是衡量预测值与真实值之间差异的一种方法。在统计学和机器学习中，MSE 是一种常见的损失函数，用于评估模型的预测准确性。本文将详细介绍均方误差的概念、定义、特点、应用及其优缺点，并通过Python代码实现和图解示例帮助读者深入理解这一重要概念。

均方误差的定义

假设有一组真实值 (y_1, y_2, ..., y_n) 和模型预测的对应值 (\hat{y}_1, \hat{y}_2, ..., \hat{y}_n)。均方误差的定义如下：

$$
MSE = \frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2
$$

其中：

(y_i) 是第 (i) 个真实值。
(\hat{y}_i) 是第 (i) 个预测值。
(n) 是数据点的总数。

公式解析

误差：每个预测值与真实值的差异称为误差，记为 (e_i = y_i - \hat{y}_i)。
平方：每个误差的平方 (e_i^2) 消除了正负误差的抵消作用，保证误差总量为正。
均值：将所有平方误差求和并取平均，以得到整体误差的平均值，这样可以反映出模型的整体预测误差。

特点

非负性：均方误差总是非负的，因为平方项总是非负。
敏感度：MSE 对于离群值（极大或极小误差）非常敏感，因为平方会放大较大误差的影响。

均方误差的应用

回归分析：在回归问题中，MSE 被用来衡量模型预测值与实际观测值之间的差异，常用于模型的训练和验证。
机器学习模型评估：MSE 是评估回归模型的一种常用指标，比如线性回归、决策树回归、神经网络等。

示例

假设有 3 个真实值 (y = [3, -0.5, 2]) 和模型的预测值 (\hat{y} = [2.5, 0.0, 2])，则均方误差为：

$$
MSE = \frac{1}{3} \left( (3-2.5)^2 + (-0.5-0)^2 + (2-2)^2 \right) = \frac{1}{3} \left( 0.25 + 0.25 + 0 \right) = \frac{1}{3} \times 0.5 = 0.1667
$$

均方误差的优缺点

优点：简单且广泛使用，适合衡量模型误差。
缺点：对异常值非常敏感，可能不适合含有离群值的数据集。

Python 实现代码

以下代码用于计算 MSE 值：

import numpy as np

def mse(y_true, y_pred):
    return np.mean((y_pred - y_true) ** 2)

# 示例
y_true = np.array([3, -0.5, 2, 7])
y_pred = np.array([2.5, 0.0, 2, 8])
result = mse(y_true, y_pred)
print("MSE:", result)

MSE 图解示例

下面的图展示了真实值和预测值之间的差异及其平方误差，用于更直观地理解 MSE。

上图展示了均方误差（MSE）的计算过程：

蓝色圆点连线表示真实值 (y)。
红色叉点连线表示预测值 (\hat{y})。
灰色虚线表示每个预测值和真实值之间的误差，即残差（差异）。
这些残差的平方的平均值即为 MSE。本图示帮助理解预测值与真实值之间的差异以及如何计算它们的平方误差。

为什么要使用误差的平方而不直接使用误差的绝对值

使用误差的平方而不直接使用误差的绝对值主要有以下几个原因：

1. 数学性质

可导性：均方误差（MSE）是一个连续且可导的函数，这使得我们在优化算法（如梯度下降法）中能够轻松计算导数和进行更新。而绝对误差（Mean Absolute Error, MAE）在误差为零时不可导，这在某些优化算法中可能会造成困难。

2. 对离群值的敏感性

放大离群值影响：平方误差对较大的误差（离群值）非常敏感，因为它们的平方会显著增加总误差的值。这使得模型能够更好地识别并调整较大的预测错误。在某些应用中，尤其是对大误差特别关注的场景，使用平方误差可以帮助改善模型性能。

3. 简化计算

解析解和算法效率：使用平方误差可以使许多计算过程变得更简单。例如，在最小二乘法中，通过对平方误差进行最小化可以得到解析解，这在处理线性回归等问题时非常有用。

4. 标准正态分布假设

假设分布：在许多统计建模和机器学习的背景下，假设误差是正态分布的是常见的。使用平方误差的损失函数与这种正态分布假设一致，适合于基于最大似然估计的参数估计。

5. 平滑性

函数平滑：平方函数是平滑的，优化过程中的小变化不会导致函数值发生剧烈变化，这使得收敛过程更加稳定和可靠。

6. 对称性

误差符号的处理：平方误差可以消除正负误差的影响，而绝对误差只能给出误差的大小，不能处理多种情况的平衡。

示例对比

假设有三个真实值 (y = [3, -0.5, 2]) 和对应的预测值 (\hat{y} = [2.5, 0.0, 2])，我们来计算每个误差的绝对值和平方。

计算误差

(e_1 = 3 - 2.5 = 0.5)
(e_2 = -0.5 - 0 = -0.5)
(e_3 = 2 - 2 = 0)

绝对误差

(|e_1| = 0.5)
(|e_2| = 0.5)
(|e_3| = 0)
总绝对误差：(0.5 + 0.5 + 0 = 1.0)

平方误差

(e_1^2 = 0.25)
(e_2^2 = 0.25)
(e_3^2 = 0)
总平方误差：(0.25 + 0.25 + 0 = 0.5)

关键点总结

绝对误差是对误差的绝对值的简单累加，不考虑误差的方向（正负）。
平方误差则是对每个误差进行平方处理，从而放大了较大误差的影响，有助于强调模型在较大误差上的表现。

结论

虽然绝对误差在某些情况下也非常有用，尤其是在关注中位数和稳健性时，但均方误差在优化、模型训练和统计推断中有其独特的优势。因此，选择使用平方误差还是绝对误差通常取决于具体问题的需求和模型的特性。

热门推荐

溶胶凝胶法制备CZTSSe薄膜及缺陷钝化的研究

溶胶凝胶法制备CZTSSe薄膜及缺陷钝化的研究

新不良人手游阵容搭配指南

新不良人手游阵容搭配指南

科学减脂：打造健康饮食与运动计划，全面提升减脂效果

科学减脂：打造健康饮食与运动计划，全面提升减脂效果

「水泥封鼻」有救了：鼻塞超详细缓解手册

「水泥封鼻」有救了：鼻塞超详细缓解手册

如何评估企业的固有风险和控制风险？

如何评估企业的固有风险和控制风险？

小学数学试讲教案撰写攻略：步骤详解与实用技巧

小学数学试讲教案撰写攻略：步骤详解与实用技巧

家庭资产是指什么？如何合理规划和管理家庭资产？

家庭资产是指什么？如何合理规划和管理家庭资产？

外夹持式超声波流量计的原理特点及安装要求

外夹持式超声波流量计的原理特点及安装要求

MAG电磁流量计的工作原理及性能特点

MAG电磁流量计的工作原理及性能特点

离职后五险一金怎么自己续交医保

离职后五险一金怎么自己续交医保

为什么名字越独特，人越有个性？

为什么名字越独特，人越有个性？

云存储服务安全性和性价比怎么权衡？

云存储服务安全性和性价比怎么权衡？

2024 年，科学如何改变我们对宇宙的看法？｜盘点

2024 年，科学如何改变我们对宇宙的看法？｜盘点

霍兰德职业测评量表-附对照表

霍兰德职业测评量表-附对照表

Excel表格中将对应的数值相加的多种方法

Excel表格中将对应的数值相加的多种方法

户外活动必备：如何识别毒蛇、预防蛇咬及急救处理指南

户外活动必备：如何识别毒蛇、预防蛇咬及急救处理指南

选择合适的DDR4内存频率需考虑多种因素与使用场景

选择合适的DDR4内存频率需考虑多种因素与使用场景

澳大利亚移民局的审批流程是怎样的？需要多长时间？

澳大利亚移民局的审批流程是怎样的？需要多长时间？

秦三世子婴：末代皇族的身份之谜

秦三世子婴：末代皇族的身份之谜

离婚诉讼前的准备工作及异地离婚指南

离婚诉讼前的准备工作及异地离婚指南

起诉离婚法庭辩论：法律实务与策略探讨

起诉离婚法庭辩论：法律实务与策略探讨

房型有几种类型

房型有几种类型

怪物猎人荒野盔速龙地图位置掉落素材介绍

怪物猎人荒野盔速龙地图位置掉落素材介绍

绝味鸭脖：家常制作秘方

绝味鸭脖：家常制作秘方

洛阳正打造大遗址保护3.0版

洛阳正打造大遗址保护3.0版

洛阳文旅“出圈记”：这项试点让文物活起来、火起来

洛阳文旅“出圈记”：这项试点让文物活起来、火起来

培养适应性思维灵活应对各种挑战

培养适应性思维灵活应对各种挑战

出国留学选校指南：综合排名 vs 专业排名

出国留学选校指南：综合排名 vs 专业排名

通过引入专家打分提升活动评审专业度

通过引入专家打分提升活动评审专业度

教你如何挑选适合的粉饼

教你如何挑选适合的粉饼

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号