机器学习入门必看!5分钟搞懂机器学习定义、类型+应用范例!
机器学习入门必看!5分钟搞懂机器学习定义、类型+应用范例!
机器学习是什么?机器学习、深度学习有什么区别?本文将用最通俗的方式带你了解机器学习的7个步骤、4种类型,以及实际应用案例,是机器学习入门者的必读之作!
什么是机器学习?AI人工智能 vs 机器学习 vs 深度学习!
为什么网购平台总能推荐你可能喜欢的商品?为什么Netflix能知道你接下来想看什么剧集?为什么Facebook能识别照片中的人物?今天就来告诉你这些AI应用背后的神奇智慧——机器学习!
(一)什么是机器学习?3分钟带你认识机器学习定义!
你可能会有这个疑惑:“机器学习、人工智能是一样的吗?”
机器学习是人工智能的一个子集,近年来由于机器学习的火热,很多人误将人工智能与机器学习等同起来,其实两者是完全不同的概念。
机器学习(Machine Learning,ML)是一种人工智能的应用,通过算法分类、解析和吸收数据,再加上不断的训练与学习,进而达到预测结果的AI机器学习模式。
让我们试着用最简单的方式解释给你听:
什么是AI人工智能?简单来说就是希望机器可以像人类一样有智慧。那要怎么让机器有智慧呢?其中一个重要方法就是机器学习!
机器学习就像学生在学习一样,通过大量的课堂学习、作业练习等过程,归纳出一套知识间的逻辑关系、解题方法等,并在考试时运用这些内化的知识来回答问题。
▋ 机器学习的优点
- 洞察力:机器学习可以从大量数据中找出人类难以察觉或被忽略的模式和趋势,帮助我们做出更明智的决策。
- 自动化:一旦设置完成,机器学习模型就可以自动执行任务,大量节省人力,提高效率。
- 持续优化:机器学习模型会随着数据量的增加和时间的推移不断学习和改进,预测结果会越来越精准,这使得机器学习在处理动态数据时具有明显优势。
- 灵活性:机器学习模型可以处理不同格式和来源的数据,使其能够应用于各种不同的情境,例如预测商品销售量、分析客户行为、检测欺诈行为等。
(二)机器学习如何运作?机器学习流程7步骤!
机器学习过程大致可以分为7个步骤。下面以训练一个可以分辨啤酒与葡萄酒的模型为例,带你了解机器学习的7个步骤,并附上机器学习流程图供你参考!
1️⃣ 收集数据(Gathering data)
为了训练出能够准确分辨啤酒与葡萄酒的模型,第一步是“收集数据”,关于这两种饮料的数据收集有很多,例如泡沫的量、玻璃杯的形状。
我们选择两种最简单的数据作为判断特征:酒的颜色(光的波长)、酒精含量,接着就可以开始收集和整理各种啤酒、葡萄酒的特征数据。
这一步非常重要,因为数据的质量和数量会直接影响模型的好坏!
2️⃣ 准备数据(Preparing that data)
准备数据是将前一步骤收集到的信息变成训练数据的过程。首先为了确保数据顺序不会影响模型的训练,我们需要将所有数据打乱顺序。在准备数据的过程中,可以顺便检查两种饮料数据收集的数量是否均衡!
同时还要将打散的数据分成两大部分,一部分占大多数(80%),用来让机器对照数据;另一部分占少数(20%),用来测试训练完成的模型。
3️⃣ 选择模型(Choosing a model)
接着进入选择模型(算法)阶段,不同模型擅长分析的资料类型都不尽相同,有些模型适合分析图像、有些适合分析数字等。
在这个例子中,我们可以使用线性模型来帮助机器训练。
4️⃣ 训练模型(Training)
选好模型后就进入正式的训练阶段,在训练过程中会不断在错误、练习、修正与调整中循环。
5️⃣ 分析评估(Evaluation)
训练完成后需要评估模型是否真的有效。这一步可以使用前面我们在准备数据时预留的20%测试数据,评估模型在面对全新数据时的回答准确度。
6️⃣ 超参数调整(Hyperparameter tuning)
做完分析与评估后,可以根据测试结果进一步进行超参数修正,并测试多组不同超参数的模型,来看看哪组能提供最佳结果。
7️⃣ 预测结果(Prediction)
最后!就可以拿训练好的模型来回答问题啦~
✨ 以下为Google Cloud Tech的教学视频,欢迎参考!
(三)机器学习、深度学习傻傻分不清?快速掌握2者差异!
然而,机器学习也不是万能的,当遇到数据与情况更复杂、层次更高的应用时,机器学习可能就无法有效运作。因此“深度学习”就诞生了!
简单来说:
- 机器学习➤ 从过去的资料中找出一套规则
- 深度学习➤ 整理出规则的其中一种方法
深度学习(Deep Learning)是以人类大脑为参考所开发的学习技术。
人们希望机器可以像人类的大脑一样,通过神经元之间的连接产生智慧,因此产生了类神经网络(Neural Network)领域,后续又演变成深度学习(Deep Learning)。
深度学习是通过模仿人类大脑的类神经网络,使用多层神经网络来处理数据,从数据输入再经过多个隐藏层,最后到达输出层。这个过程使深度学习能够分辨出更复杂、更准确的信息!
深度学习最著名的例子就是击败世界知名围棋大师的Google AlphaGo!
▋ AI vs 机器学习 vs 深度学习
人工智能(AI)、机器学习、深度学习的区别到底是什么?如果各用一句话来形容这三者的关系:
- 人工智能 ➤ 目标是让机器具有人类的智慧
- 机器学习 ➤ 从大量数据中找出规则,以达到智慧化的目标
- 深度学习 ➤ 机器学习的一种方法,模仿人类大脑的类神经网络去分析数据资料
机器学习类型|4种机器学习类型一次看!
如同前面介绍机器学习7步骤时所说,在训练机器学习时,会运用到许多不同的机器学习算法,例如线性回归法、逻辑回归法等,我们可以大致将各种算法分为4种类型:监督式学习、非监督式学习、半监督式学习、强化式学习。
(一)监督式学习(Supervised Learning)
▋ 监督式学习定义
提供机器大量有历史数据、有标记标签的“输入”和“输出”数据配对分类。例如,我们给机器多组啤酒与葡萄酒的影像,并标记出哪些是啤酒,哪些是葡萄酒。机器会学习这些数据,并找出这些影像间的共同特征,以分辨啤酒与葡萄酒。
⚑ 常见的监督式学习算法有:
- 线性回归法(Linear Regression)
- 随机森林法(Random Forest)
- 单纯贝氏分类器(Naive Bayes Classifier)
▋ 监督式学习例子
推荐系统就是利用监督式学习,例如Netflix的剧集推荐。Netflix的推荐系统会根据用户过去的观看记录与行为,推荐用户可能会喜欢的节目。
(二)非监督式学习(Unsupervised Learning)
▋ 非监督式学习定义
在非监督式学习模式中,输入的数据多是没有标准答案、未标记与非结构化的数据。机器会使用所有相关且可访问的数据来识别数据间的关联性,并将数据分群。
⚑ 常见的非监督式学习算法有:
- K-平均算法(K-Means Cluctering)
- 主成分分析(PCA)
- t-分布随机邻近嵌入(t-SNE)
▋ 非监督式学习例子
非监督式学习可以解决各种商业问题,有助于企业快速探索大量数据,例如银行用来监测交易是否为欺诈或机器人活动等异常行为。
(三)半监督式学习(Semi-supervised Learning)
▋ 半监督式学习定义
半监督式学习则是指,有一部分的数据有标记,另一部分则没有。半监督学习会先用已标记过的数据训练模型,之后再使用经过训练的模型来标记那些未标记的数据,直到所有数据都被标记完成。
⚑ 常见的半监督式学习算法有:
- 生成式对抗网络(Generative adversarial networks)
- 自学习贝氏分类器(Self-trained Naive Bayes classifier)
▋ 半监督式学习应用
半监督式学习经常应用于语音与语言分析,例如使用少量的语音数据来训练模型,并利用大量的未标记语音数据来进一步学习,提高识别的准确度。
(四)强化式学习(Reinforcement Learning)
▋ 强化式学习定义
强化式学习也叫做增强式学习,指机器在处理数据时,会像学生学习一样,通过“奖励和惩罚”来学习,每当它做出一个动作,就会得到一个“反馈”:如果这个动作是好的,它就得到“奖励”,反之则是“惩罚”。
通过不断的试错,慢慢了解哪些动作是好的,哪些动作是坏的,最终找到最有效的处理数据路径,达到最终目标。
⚑ 常见的增强式学习算法有:
- Q 学习(Q-Learning)
- 蒙特卡洛学习(Monte-Carlo Learning)
- SARSA (State–Action–Reward–State–Action)
▋ 强化式学习应用
强化式学习最著名的案例,莫过于2014年Google DeepMind开发的下围棋软件AlphaGo。AlphaGo一开始是使用监督式学习,但由于学习与进步的速度太慢了,因此改使用强化式学习的方式提高棋力。
机器学习类型 | 特色 | 常见算法 |
---|---|---|
监督式学习 | 有标准答案数据需要标记 | 线性回归法(Linear Regression) 随机森林法(Random Forest) 单纯贝氏分类器(Naive Bayes Classifier) |
非监督式学习 | 没有标准答案数据没有标记 | K-平均算法(K-Means Cluctering) 主成分分析 (PCA) t-分布随机邻近嵌入(t-SNE) |
半监督式学习 | 一部分的数据有标记,另一部分没有 | 生成式对抗网络(Generative adversarial networks) 自学习贝氏分类器(Self-trained Naive Bayes classifier) |
强化式学习 | 有奖励与惩罚机制 | Q 学习(Q-Learning) 蒙特卡洛学习(Monte-Carlo Learning) SARSA (State–Action–Reward–State–Action) |
机器学习应用案例分享:生活&商业真实案例!
机器学习应用领域非常广泛,包括搜索推荐、天气预测、人脸识别、车牌识别、医学诊断辅助、测谎、语言处理等,以下分享在生活中与商业上的机器学习应用实例!
(一)机器学习生活应用:串流媒体推荐机制
串流平台Netflix在其推荐系统上下了不少功夫,除了影集节目推荐外,还会根据不同用户挑选影集的预览图,利用缩图吸引用户点击!
他们针对不同颜色、对比度、人物表情等切点去标记影集缩图,再通过A/B测试去收集用户的点击数据,最后根据不同用户的数据显示出最能吸引他们点击的缩图预览。
(二)机器学习商业应用:金融领域应用
相信大家多多少少都有听说过FinTech(金融科技)吧!机器学习、深度学习等就是目前在金融科技领域相当热门的AI技术。
机器学习在金融领域中的应用相当广泛,包括风险管理、金融预测、交易执行等各个方面。
以投资领域为例,机器学习可以帮助投资机构优化投资组合。通过分析市场数据、价格波动等因素,机器学习可以识别潜在的投资机会和风险,提供基于数据的投资策略建议,帮助投资者做出更明智的决策。
机器学习入门必看!免费文章、课程推荐给你!
看完本文后,相信你对机器学习已经有了大致的概念了吧!如果还想了解更多关于机器学习的知识,以下分享几个机器学习教学文章、课程等资源供你参考!
(一)机器学习推荐文章、书籍、课程
▋ 文章 📝 Python机器学习教学文章推荐
- 台大资料分析与决策社(NTU Data Analytics Club):《【Python】 机器学习入门与Python机器学习实作》
- simple LEARN:《机器学习范例程式说明|使用Python程式实作影像识别》
▋ 书籍 📘 机器学习书推荐:
- 《机器学习的数学基础 : AI、深度学习打底必读》
专门为机器学习数学基础所设计的精华内容,就算只有高中数学的基础也能看得懂! - 《Python机器学习第三版(上)、(下)》
使用Python探索机器学习和深度学习的技术精髓,包含程式范例、数学解释、图解说明,循序渐进、由浅入深了解机器学习。
▋ 课程 🎥 机器学习课程推荐:
- 台大大学人工智能中心 李宏毅教授:《Machine Learning》
直观、容易理解,非常适合入门者 - 台湾大学资讯系统训练班:《Python 机器学习入门[线上课程]》
通过范例试教学与大量Coding练习,零程式基础也可以完成学习 - 緯育 TibaMe:《机器学习实战》
适合具备Python基础能力、想了解机器学习如何应用于专案管理的学员