问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

人工智能基础概念2:机器学习中的监督学习和非监督学习

创作时间:
作者:
@小白创作中心

人工智能基础概念2:机器学习中的监督学习和非监督学习

引用
CSDN
1.
https://blog.csdn.net/LaoYuanPython/article/details/137009687

机器学习根据所用的训练数据分为两类:监督式学习和非监督式学习。

一、监督学习

监督学习(Supervised Learning)是一种机器学习方法,通过使用带有标注的训练数据来建立一个模型,然后利用该模型对新的未标记数据进行预测。标注的数据就是被预测的输出结果数据。

在监督学习中,输入数据和对应的输出标签是已知的。例如,通过给定一组带有房屋特征和对应价格的数据,我们可以建立一个房价预测模型。

监督学习按标注的类型又可以细分为两类:分类和回归。

  • 分类(Classification)是一种监督学习方法,用于预测离散型输出变量的值。分类算法的标注是离散的,通过学习输入特征与输出标签之间的关系,建立一个分类模型,然后用该模型对新的输入数据进行分类。例如,通过使用一个已经训练好的垃圾邮件分类器,我们可以将新收到的邮件自动分类为垃圾邮件或非垃圾邮件。

  • 回归(Regression)是另一种监督学习方法,用于预测连续型输出变量的值。回归算法的标注是连续的,通过学习输入特征与输出变量之间的关系,建立一个回归模型,然后用该模型对新的输入数据进行预测。例如,通过使用一个已经训练好的房价回归模型,我们可以根据房屋的特征预测其价格。

二、非监督学习

非监督学习(Unsupervised Learning)是一种机器学习方法,这类模型所用的训练数据没有标注,只有自变量。非监督学习的目标是从无标签的数据中发现隐藏的模式和结构或关系,而无需事先给定输出标签。

非监督学习的目标是对数据进行聚类或降维等操作,以便更好地理解数据的内在结构,因此非监督学习按用途可分为聚类(如K均值聚类、层次聚类)和降维(如主成分分析)。

  • 降维(Dimensionality Reduction):降维是将高维数据映射到低维空间的过程,同时尽可能保留原始数据的关键信息。降维可以减少数据的复杂性和存储空间,并可提高后续机器学习算法的效率和准确性。常见的降维方法包括主成分分析(PCA)和 t-SNE 等。

例如,人脸识别时,可以通过相关降维算法提取人脸图像转换为一个低维的特征向量,其中每个元素表示该图像在主成分方向上的投影值,可以将图像数据映射到一个低维空间。这样可以保留关键信息的同时减少数据的维度,从而更高效地进行图像分类或识别。

  • 聚类(Clustering):聚类是一种将数据分组或分类的技术,通过计算数据点之间的相似性或距离来将数据划分为不同的组。聚类的目标是使得同一组内的数据点相似度高,而不同组之间的相似度低。聚类可以发现数据中的潜在群组或簇,并且可以用于市场细分、社交网络分析、图像分割等领域。

例如一组顾客的购买记录,可以使用聚类算法将这些顾客分成不同的群组(如老中青、男女),每个群组代表一类具有相似购买行为的顾客。这样,我们可以更好地了解不同类型的顾客,并根据他们的需求进行个性化推荐。

三、小结

机器学习根据训练数据是否标注分为监督学习和非监督学习,监督学习按标注的数据是否连续细分为分类和回归,非监督学习按用途可分为聚类和降维,不同的学习方式适合不同的应用场景。

本文原文来自CSDN

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号