跟着StatQuest学知识02-链式法则与梯度下降法
创作时间:
作者:
@小白创作中心
跟着StatQuest学知识02-链式法则与梯度下降法
引用
CSDN
1.
https://blog.csdn.net/m0_74803856/article/details/145968444
在机器学习和深度学习中,链式法则和梯度下降法是两个非常重要的基础概念。本文将通过简单的数学推导和实例,帮助读者理解这两个概念的本质,并展示它们在实际问题中的应用。
一、引入
有如下两个关系图:
可以根据体重预测身高,进而根据身高预测鞋码。
通过一些数学推导,可以得出鞋码对体重的导数= 鞋码对身高的导数×身高对体重的导数。这就是链式法则的本质。
二、残差平方和
残差平方和是机器学习中常用的损失函数。
为了求截距为何值时,残差的平方最小,就要求残差平方对截距的导数何时为0。
根据链式法则,残差平方对截距的倒数=残差平方对残差的导数 × 残差对截距的导数。
最后,我们看到截距等于1时,残差平方和最小。
三、梯度下降法
为什么要选择梯度下降法,直接求导不准确吗?
- 显示数据往往复杂且求导困难
- 算力消耗大,梯度下降法更高效
初始有三个点,为三个点拟合一个函数(选取截距和斜率)。这里选用残差平方和作为损失函数。
(一)定斜率,选截距
因此就要求残差平方和(损失函数)对截距的导数为0的时候。梯度下降法步骤如下:
- 代入三个点的横纵坐标,求出残差平方和对截距的导数的表达式。
- 选取一个起始截距值(这里选0)代入得到结果。
- 将结果代入步长计算公式(×一个学习率)得到步长,得到新的截距(旧截距加步长)
- 重复直至步长接近0。
通过这个步骤可以看出,梯度下降法就是在远离目标时选取大步长,接近目标时选取小步长。
(二)定截距,选斜率
与(一)同理,最后得到一个三维图。在 【官方双语】零基础梯度下降法,手把手教你优化损失函数! 第16分钟。
注意:当你有同一个函数的两个或更多的导数时,它们被称为梯度。
选取初始值,然后再计算出斜率和截距分别的步长。
当参数更多时,那么我们只需要取更多的导数,其他一切保持不变。
四、补充
残差平方和只是一种损失函数,对于其他类型的损失函数,梯度下降法的工作原理都一样。
现在回到步骤3并重复,直到步长非常小或你达到了最大步数。
另外,当数据量增大时,有一种叫做随机梯度下降的方法,即随机选取全部数据的子集计算。
热门推荐
谅解备忘录与会签合同的关系及法律适用
经常锻炼跑步的人需要补充什么
一睡睡一天,究竟谁才是动物界的“觉皇”?
过敏性鼻炎的症状及管理方法
液相色谱法检测粮油农残的研究进展
怎么评估组织架构改革的效果?
为什么总有人相信"鬼魂"?心理学家发现颠覆认知的真相
黑玉断续膏:中华老字号的传承与创新
拔牙后疼痛加剧,究竟是怎么一回事?
无痛肠镜后饮食的注意事项
杭州养老保险转移办理指南
探索无线充电:Qi标准协议1.2.4深度解析
抗诉申请书怎么写?
民事诉讼中申请抗诉的法律依据有哪些?
第三套人民币"麦穗2角"硬币收藏价值解析
什么是渐进镜片?
什么是EMS?详解邮政特快专递服务的功能与优势
邮政EMS:除了催款函,还有哪些应用场景?
摩托车上高速要什么证件和手续
16世纪末,英国乡绅阶层为何十分重视对子女未来的职业规划?
吐司大揭秘:山形吐司与方形吐司的制作要点
渴望战争:心理学解读背后的社会问题
自助餐厅如何吸引客户(店铺引流)
血管栓塞是什么意思
静脉血栓栓塞症的危险因素
软件项目经理如何解决bug
改善腰疼的瑜伽动作
如何选投SCI期刊:10个关键因素全面解析
新如何描述卧底角色的红茶特征,以及判断他人是否为卧底的方法和技巧
宜昌住房公积金中心:购房与提取政策详解