从原理到实战：最小二乘法在机器学习中的应用详解

创作时间:

2025-01-21 21:55:15

作者:

@小白创作中心

从原理到实战：最小二乘法在机器学习中的应用详解

在机器学习的世界里，预测是核心任务之一。无论是预测房价、股票走势，还是分析用户行为，我们都需要找到数据背后的规律。而最小二乘法，正是揭示这些规律的重要工具。它广泛应用于线性回归问题中，通过最小化误差平方和来寻找最佳拟合参数。本文将深入探讨最小二乘法在机器学习中的应用，揭示它是如何帮助我们理解和预测数据的内在规律。

最小二乘法：寻找最佳拟合线

最小二乘法的核心思想非常直观：给定一组数据点，我们希望找到一条直线（或曲线），使得所有数据点到这条线的距离之和最小。这里的“距离”指的是预测值与实际值之差的平方，即误差平方。

假设我们有一组观测数据 ((x_i, y_i))，其中 (i = 1, 2, ..., n)，目标是找到一个函数 (y = f(x; \beta)) 来描述这些数据，其中 (\beta) 是待定参数。最小二乘法的目标是最小化残差平方和（RSS），即：

[
S(\beta) = \sum_{i=1}^{n} [y_i - f(x_i; \beta)]^2
]

为了求解最优参数 (\beta)，需要对 (S(\beta)) 求偏导数并令其等于零，从而得到正规方程组。以线性回归为例，模型为 (y = \beta_0 + \beta_1 x)，则有：

[
S(\beta_0, \beta_1) = \sum_{i=1}^{n} [y_i - (\beta_0 + \beta_1 x_i)]^2
]

分别对 (\beta_0) 和 (\beta_1) 求偏导，并令结果为零：

[
\frac{\partial S}{\partial \beta_0} = -2 \sum_{i=1}^{n} [y_i - (\beta_0 + \beta_1 x_i)] = 0
]
[
\frac{\partial S}{\partial \beta_1} = -2 \sum_{i=1}^{n} [y_i - (\beta_0 + \beta_1 x_i)] x_i = 0
]

解这个方程组可得：

[
\beta_1 = \frac{n \sum (x_i y_i) - \sum x_i \sum y_i}{n \sum x_i^2 - (\sum x_i)^2}
]
[
\beta_0 = \frac{\sum y_i - \beta_1 \sum x_i}{n}
]

这样就得到了最佳拟合直线的斜率 (\beta_1) 和截距 (\beta_0)。

最小二乘法与线性回归：相辅相成的关系

线性回归是一种统计分析方法，用于确定两种或两种以上变量间相互依赖的定量关系。最小二乘法则是线性回归中常用的参数估计方法。通过最小二乘法，我们可以找到线性回归方程中的最佳参数，使得预测值与实际观测值之间的差异（即残差）的平方和最小。

实战演练：用Python实现最小二乘法

让我们通过一个具体的例子来演示最小二乘法的应用。假设我们有一组数据点 ((1, 2), (2, 3), (3, 5), (4, 4), (5, 6))，我们希望使用最小二乘法找到最佳拟合直线。

使用NumPy库实现

import numpy as np
import matplotlib.pyplot as plt

# 数据点
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 3, 5, 4, 6])

# 构建设计矩阵
A = np.vstack([x, np.ones(len(x))]).T

# 使用最小二乘法求解参数
m, c = np.linalg.lstsq(A, y, rcond=None)[0]

# 绘图
plt.plot(x, y, 'o', label='原始数据')
plt.plot(x, m*x + c, 'r', label='拟合直线')
plt.legend()
plt.show()

手动实现最小二乘法

import numpy as np
import matplotlib.pyplot as plt

# 数据点
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 3, 5, 4, 6])

# 构建设计矩阵
X = np.vstack([x, np.ones(len(x))]).T

# 计算转置矩阵
X_T = X.T

# 求解正规方程
theta = np.linalg.inv(X_T @ X) @ X_T @ y
m, b = theta

# 绘图
plt.plot(x, y, 'o', label='原始数据')
plt.plot(x, m * x + b, 'r', label='拟合直线')
plt.legend()
plt.show()

通过上述代码，我们可以看到最小二乘法成功地找到了最佳拟合直线 (y = x + 1)。这条直线不仅直观地展示了数据点的分布趋势，还为我们提供了预测新数据点的工具。