跟着StatQuest学知识02-链式法则与梯度下降法
创作时间:
作者:
@小白创作中心
跟着StatQuest学知识02-链式法则与梯度下降法
引用
CSDN
1.
https://blog.csdn.net/m0_74803856/article/details/145968444
在机器学习和深度学习中,链式法则和梯度下降法是两个非常重要的基础概念。本文将通过简单的数学推导和实例,帮助读者理解这两个概念的本质,并展示它们在实际问题中的应用。
一、引入
有如下两个关系图:
可以根据体重预测身高,进而根据身高预测鞋码。
通过一些数学推导,可以得出鞋码对体重的导数= 鞋码对身高的导数×身高对体重的导数。这就是链式法则的本质。
二、残差平方和
残差平方和是机器学习中常用的损失函数。
为了求截距为何值时,残差的平方最小,就要求残差平方对截距的导数何时为0。
根据链式法则,残差平方对截距的倒数=残差平方对残差的导数 × 残差对截距的导数。
最后,我们看到截距等于1时,残差平方和最小。
三、梯度下降法
为什么要选择梯度下降法,直接求导不准确吗?
- 显示数据往往复杂且求导困难
- 算力消耗大,梯度下降法更高效
初始有三个点,为三个点拟合一个函数(选取截距和斜率)。这里选用残差平方和作为损失函数。
(一)定斜率,选截距
因此就要求残差平方和(损失函数)对截距的导数为0的时候。梯度下降法步骤如下:
- 代入三个点的横纵坐标,求出残差平方和对截距的导数的表达式。
- 选取一个起始截距值(这里选0)代入得到结果。
- 将结果代入步长计算公式(×一个学习率)得到步长,得到新的截距(旧截距加步长)
- 重复直至步长接近0。
通过这个步骤可以看出,梯度下降法就是在远离目标时选取大步长,接近目标时选取小步长。
(二)定截距,选斜率
与(一)同理,最后得到一个三维图。在 【官方双语】零基础梯度下降法,手把手教你优化损失函数! 第16分钟。
注意:当你有同一个函数的两个或更多的导数时,它们被称为梯度。
选取初始值,然后再计算出斜率和截距分别的步长。
当参数更多时,那么我们只需要取更多的导数,其他一切保持不变。
四、补充
残差平方和只是一种损失函数,对于其他类型的损失函数,梯度下降法的工作原理都一样。
现在回到步骤3并重复,直到步长非常小或你达到了最大步数。
另外,当数据量增大时,有一种叫做随机梯度下降的方法,即随机选取全部数据的子集计算。
热门推荐
边缘AI开发嵌入式硬件如何选型
古代科举的庠生、贡生、监生、廪生、增生、附生、例生、童生各有什么不同?
艺术生专业选择指南:洞察市场趋势、探索跨界融合
我们多久没见到故事如此出色的武侠游戏了?
NAT、代理服务与内网穿透技术全解析
两款常用电池充电管理芯片详解:TC4056A与TP4055
跑步装备选择与维护指南:从跑鞋到手表应注意的关键细节
异地搬家电瓶车怎么托运?4大搬运方式大PK,你真的选对了吗?
重庆理工大学是双一流大学吗?
穿袜子睡觉有6大好处!就像无形的肉桂,是引火下行的妙招
入秋后穿袜子睡觉助眠?专家这样说
如何用SEO引流?SEO引流有哪些有效方法?
鸡蛋买回来要不要洗?
读书笔记如何撰写更有效?
《心动还请告诉我》爱的短剧篇章:情感的细腻描绘
塑造纤细小腿:饮食、运动与日常习惯的综合指南
独立显卡驱动优化全攻略:硬件调优、软件更新与维护秘籍
手机WLAN总是自动断开?别急,这里有最全的解决方法!
Windows 11系统中更改驱动器号的5种方法
合租各房间的费用应如何合理分摊?这种分摊方式的原则是什么?
小米事故汽车的电池包,是小米自己组装的
降噪技术如何让世界静悄悄
6部韩朝历史题材电影,再现风云变幻的历史
中国饲料行业竞争格局深度剖析
农用钾肥是起什么作用的肥料?
枫叶:自然之美与生态价值
春季护胃指南:溃疡性胃炎的饮食调理与预防
零成本打造猫咪安乐窝:猫窝DIY
八大建筑央企,都在哪个领域称王?你知道吗
港币兑人民币的汇率形成机制受哪些因素影响