AI基础——如何拟合
AI基础——如何拟合
机器学习的核心目标是通过数据训练模型,使其能够准确预测或分类新数据。在这个过程中,"拟合"是一个关键概念。本文将通过类比和具体例子,帮助读者理解拟合的原理及其在机器学习中的应用。
人类学习与机器学习的类比
让我们从人类学习的过程开始。在学习过程中,人们会做大量的练习题,遇到错误或不会做的题目时,通过查看答案来学习。考试时,通过做题的准确率来评价学习效果。
机器学习的过程与此类似,也分为"学习"(训练)和"考试"(测试)两个阶段。在机器学习领域,这两个阶段分别被称为"训练"和"测试"。
基本概念解析
在机器学习中,数据是学习的基础。数据量越大,模型通常学得越好,这与人类通过大量练习题来学习的道理相同。
样本、特征与标签
- 样本:用于训练和测试的数据集。
- 特征:样本中的输入部分,例如身高、体重等。
- 标签:样本中的答案部分,例如体型(瘦、正常、胖)。
根据样本是否包含标签,机器学习可分为两类:
- 有监督学习:样本包含标签。
- 无监督学习:样本不包含标签。
通常,我们会将样本分为两部分:
- 训练集:用于训练模型的数据,占比通常较大(如90%)。
- 测试集:用于评估模型性能的数据,占比通常较小(如10%)。
拟合的概念与意义
拟合在百科中的解释是:通过一条光滑的曲线连接平面上一系列的点。在机器学习中,拟合意味着找到一个函数,使得这个函数能够尽可能准确地预测或分类新数据。
一个具体的例子
假设我们有一个任务:根据人的身高和体重判断体型(瘦、正常、胖)。我们有10000条样本数据,每条数据包含三个字段:身高、体重和体型。
- 特征:身高、体重
- 标签:体型(瘦、正常、胖)
我们将这10000条数据分为两部分:
- 训练集:9000条数据
- 测试集:1000条数据
训练模型的目标是找到一个函数,使得输入身高和体重后,能够输出正确的体型判断。这个函数可以表示为:
[ y = a \times x_1 + b \times x_2 + c ]
其中:
- ( y ) 是预测的体型
- ( x_1 ) 是身高
- ( x_2 ) 是体重
- ( a )、( b )、( c ) 是函数参数
由于实际的标签是离散的(只有瘦、正常、胖三种情况),而函数输出是连续的,因此需要通过激活函数将连续值转换为离散标签。
训练过程就是通过调整参数 ( a )、( b )、( c ),使得函数计算出的预测值 ( \hat{y} ) 尽可能接近实际标签 ( y )。这个过程可以用下面的示意图来说明:
总结
机器学习中的拟合过程,本质上是通过训练数据找到一个最优的函数映射关系。这个过程虽然追求的是"尽可能"的拟合,但并不意味着训练集上的拟合度越高模型就越好。这是因为:
- 过度拟合(Overfitting):模型在训练集上表现很好,但在新数据上泛化能力差。
- 欠拟合(Underfitting):模型在训练集和新数据上表现都不好。
因此,机器学习的目标是在拟合度和泛化能力之间找到一个平衡点。
这种用简单的语言就能说明白的道理,为了严谨性,必须转化为数学语言的做法,何尝不是另一种拟合!