跟着StatQuest学知识02-链式法则与梯度下降法
创作时间:
作者:
@小白创作中心
跟着StatQuest学知识02-链式法则与梯度下降法
引用
CSDN
1.
https://blog.csdn.net/m0_74803856/article/details/145968444
在机器学习和深度学习中,链式法则和梯度下降法是两个非常重要的基础概念。本文将通过简单的数学推导和实例,帮助读者理解这两个概念的本质,并展示它们在实际问题中的应用。
一、引入
有如下两个关系图:
可以根据体重预测身高,进而根据身高预测鞋码。
通过一些数学推导,可以得出鞋码对体重的导数= 鞋码对身高的导数×身高对体重的导数。这就是链式法则的本质。
二、残差平方和
残差平方和是机器学习中常用的损失函数。
为了求截距为何值时,残差的平方最小,就要求残差平方对截距的导数何时为0。
根据链式法则,残差平方对截距的倒数=残差平方对残差的导数 × 残差对截距的导数。
最后,我们看到截距等于1时,残差平方和最小。
三、梯度下降法
为什么要选择梯度下降法,直接求导不准确吗?
- 显示数据往往复杂且求导困难
- 算力消耗大,梯度下降法更高效
初始有三个点,为三个点拟合一个函数(选取截距和斜率)。这里选用残差平方和作为损失函数。
(一)定斜率,选截距
因此就要求残差平方和(损失函数)对截距的导数为0的时候。梯度下降法步骤如下:
- 代入三个点的横纵坐标,求出残差平方和对截距的导数的表达式。
- 选取一个起始截距值(这里选0)代入得到结果。
- 将结果代入步长计算公式(×一个学习率)得到步长,得到新的截距(旧截距加步长)
- 重复直至步长接近0。
通过这个步骤可以看出,梯度下降法就是在远离目标时选取大步长,接近目标时选取小步长。
(二)定截距,选斜率
与(一)同理,最后得到一个三维图。在 【官方双语】零基础梯度下降法,手把手教你优化损失函数! 第16分钟。
注意:当你有同一个函数的两个或更多的导数时,它们被称为梯度。
选取初始值,然后再计算出斜率和截距分别的步长。
当参数更多时,那么我们只需要取更多的导数,其他一切保持不变。
四、补充
残差平方和只是一种损失函数,对于其他类型的损失函数,梯度下降法的工作原理都一样。
现在回到步骤3并重复,直到步长非常小或你达到了最大步数。
另外,当数据量增大时,有一种叫做随机梯度下降的方法,即随机选取全部数据的子集计算。
热门推荐
赏析《乡愁》的诗歌美
一个深蹲消耗多少热量
AI如何独立创作动画:探索人工智能在动画制作中的广泛应用与潜力
36岁张帅爆发,92分钟5破发挑落4号种子,赛季第4次进双打四强
每日诗词|第1009期—【唐】宋之问《初到陆浑山庄》
初学者必读:山地自行车选购全攻略
喜临门联手清华大学:AI技术助力中国成为全球睡眠科技“科技龙”
人工智能:照亮未来之路的双刃剑
TS文件用什么播放器?带您了解TS文件播放器的选择
如何使用FFmpeg将TS文件转换为MP4文件
late的用法及例句详解
用医保卡买药是否有购买记录?
偏光镜和墨镜有啥区别?
29.9元和几千元的墨镜,差在哪?别再踩雷了!选错更伤眼!
维生素C的化学式及其生理功能
【学习习惯】孩子学习效率低还容易注意力不集中?18个方法养成孩子良好的学习习惯
香港知名混血女星雪儿宣布复出,不介意老公有过婚史,将继子继女视如己出
喝酒助眠不如吃香蕉,吃这几类食物的人睡得更香
安全检查清单的使用与更新
莴笋炒牛肉
从氨基酸到生物分子的演化
哥特式服装:从历史传承到现代时尚
燕麦热量高为什么能减肥?一日三餐燕麦减肥法详解
腊肉晒多少天最合适?看完这篇文章你就懂了!
摄影技术如何改变我们记录世界的方式?
文山麻栗坡构建口岸经济发展新模式
路亚钓鱼行为的法律界定与犯罪构成分析
河道禁渔期能路亚吗?法律解读与实践分析
让青年敢生愿生 生育友好型社会如何构建
家常美味,一盘干锅包菜的简单幸福