跟着StatQuest学知识02-链式法则与梯度下降法
创作时间:
作者:
@小白创作中心
跟着StatQuest学知识02-链式法则与梯度下降法
引用
CSDN
1.
https://blog.csdn.net/m0_74803856/article/details/145968444
在机器学习和深度学习中,链式法则和梯度下降法是两个非常重要的基础概念。本文将通过简单的数学推导和实例,帮助读者理解这两个概念的本质,并展示它们在实际问题中的应用。
一、引入
有如下两个关系图:
可以根据体重预测身高,进而根据身高预测鞋码。
通过一些数学推导,可以得出鞋码对体重的导数= 鞋码对身高的导数×身高对体重的导数。这就是链式法则的本质。
二、残差平方和
残差平方和是机器学习中常用的损失函数。
为了求截距为何值时,残差的平方最小,就要求残差平方对截距的导数何时为0。
根据链式法则,残差平方对截距的倒数=残差平方对残差的导数 × 残差对截距的导数。
最后,我们看到截距等于1时,残差平方和最小。
三、梯度下降法
为什么要选择梯度下降法,直接求导不准确吗?
- 显示数据往往复杂且求导困难
- 算力消耗大,梯度下降法更高效
初始有三个点,为三个点拟合一个函数(选取截距和斜率)。这里选用残差平方和作为损失函数。
(一)定斜率,选截距
因此就要求残差平方和(损失函数)对截距的导数为0的时候。梯度下降法步骤如下:
- 代入三个点的横纵坐标,求出残差平方和对截距的导数的表达式。
- 选取一个起始截距值(这里选0)代入得到结果。
- 将结果代入步长计算公式(×一个学习率)得到步长,得到新的截距(旧截距加步长)
- 重复直至步长接近0。
通过这个步骤可以看出,梯度下降法就是在远离目标时选取大步长,接近目标时选取小步长。
(二)定截距,选斜率
与(一)同理,最后得到一个三维图。在 【官方双语】零基础梯度下降法,手把手教你优化损失函数! 第16分钟。
注意:当你有同一个函数的两个或更多的导数时,它们被称为梯度。
选取初始值,然后再计算出斜率和截距分别的步长。
当参数更多时,那么我们只需要取更多的导数,其他一切保持不变。
四、补充
残差平方和只是一种损失函数,对于其他类型的损失函数,梯度下降法的工作原理都一样。
现在回到步骤3并重复,直到步长非常小或你达到了最大步数。
另外,当数据量增大时,有一种叫做随机梯度下降的方法,即随机选取全部数据的子集计算。
热门推荐
企业培训项目开班仪式流程:全面策划与执行指南
明日方舟临光角色深度解析:定位、技能与练级价值全面探讨
“打赏”没上限无提醒 专家建议给直播平台打赏限额抵制超额打赏
轻熟风格,30岁女生穿搭的时尚与智慧
蜘蛛是昆虫吗
老祖宗的这些“规矩”一定要知道,除夕夜20个习俗与禁忌,切记!
正月十五“天官赐福日”
贴膜牛剖层革是真皮吗
意外受伤后一定要打破伤风针吗?
低血压的原因有什么
PT100温度传感器精度等级有哪些
M.2移动硬盘打造Win To Go系统:高效分区存储文件全攻略
究竟喝哪种类咖啡最养生?一图表让你轻松看懂
国家规定未成年退款政策
多高层模块化钢结构建筑技术研究与工程实践
六亲不认是哪六亲?株连九族又指哪九族?你不知道的古代常识
哪些水培植物不易淹死?正确水培方法是什么?
天水:不止麻辣烫,还有历史文化的“丝路”盛宴
家里这3种水杯尽快扔掉,白开水进“毒水”出,很多人还在用
如何构建好的设计团队
在合同中如何明确税务责任?
可持续方法论|ESG由量变到质变,绿色教育需全方位发力
加密市场凌晨闪崩,比特币最坏的情况将跌至80000美金?
数据库如何防止篡改数据
每日应摄取多少维生素B族以发挥其作用与功效
高中物理有哪些学习方法(推荐的高中物理学习方法)
葡萄籽和虾青素哪个好:全面比较与解析
智能识别与实时预警:校园安全管理的科技新方案
哪些因素影响国企人事管理制度的入职环节?
马勃粉可以吃吗?医生专业解答