学习率(learning rate)详解
创作时间:
作者:
@小白创作中心
学习率(learning rate)详解
引用
CSDN
1.
https://blog.csdn.net/hellocsz/article/details/88802670
学习率(learning rate)是机器学习和深度学习中一个非常重要的超参数,它控制着模型学习的进度。本文将详细介绍学习率的概念、设置原则以及如何根据训练过程中的目标函数损失值曲线来调整学习率。
学习率的定义
学习率(learning rate)控制模型的学习进度。在反向传播算法中,学习率通常用符号η表示,它决定了权重更新的步长。
学习率的设置
在训练过程中,一般根据训练轮数设置动态变化的学习率:
- 刚开始训练时:学习率以0.01~0.001为宜。
- 一定轮数过后:逐渐减缓。
- 接近训练结束:学习速率的衰减应该在100倍以上。
对于迁移学习,由于模型已在原始数据上收敛,此时应设置较小的学习率(≤10^-4)在新数据上进行微调。
学习率减缓机制
通过观察目标函数损失值曲线,可以判断学习率是否合适:
理想情况:曲线应该是滑梯式下降(绿线)。
初始上扬:如果曲线初始时上扬(红线),说明学习率过大导致振荡,应减小学习率并从头开始训练。
后期水平:如果曲线初始时强势下降但不久后归于水平(紫线),说明后期学习率过大导致无法拟合,应减小学习率并重新训练后几轮。
全程缓慢:如果曲线全程缓慢(黄线),说明学习率过小导致收敛慢,应增大学习率并从头开始训练。
参考资料
[1] 解析卷积神经网络—深度学习实践手册
[2] 调整学习速率以优化神经网络训练
[3] 如何找到最优学习率
热门推荐
釉下彩最安全,金属装饰要避开:微波炉瓷盘选购要点
素食者和老年人如何补充维生素B12?强化食品和补充剂是关键
维生素B12与听力健康关联,两类人群补充指南
15%老年人面临维生素B12缺乏,专家详解补充方法
长歌行:中国古代诗歌的音乐韵律之美
比特币市场动荡:9.3万人爆仓,机构持仓现异动
掌握中种发酵,轻松做出蓬松柔软的北海道吐司
面包工艺大比拼:中种法与直接法的优劣分析
寒假游戏时间公布:腾讯网易限玩时长出炉,防沉迷效果显现
学生寒假运动指南:6种运动项目+3阶段锻炼计划
寒假健康生活指南:眼科医生推荐科学用眼、规律作息和健康饮食
福建满贤生态农业:自动化养殖引领蛋鸭产业革新
用科技打造走心生日惊喜
程儿生日直播:粉丝花式祝福引爆热度
高情商生日祝福语,温暖特殊时期
生日祝福:一句简单的话语,如何治愈心灵?
杭州西湖秋季攻略:自然美景、文化活动与美食指南
杭州西湖秋日游:6大景点+最佳路线+摄影攻略
洗衣机“三包”政策:整机保修1年,电机3-5年
小天鹅洗衣机排水指南:从方法到注意事项
小天鹅洗衣机排水故障排除:7大常见问题及处理方法
色彩心理学教你如何用颜色调节情绪
潘通发布2025流行色:摩卡慕斯与奶油黄,温暖大地色系引领新潮流
中国传统色的诗意之美:从历史传承到现代新生
“包打天下”,扬州包子的传统特色与工业化生产简析
同样是渐冻症,很多都是活不过5年,为何霍金却活了55年?
刮刮乐热卖背后:一张彩票里的社会心理密码
中种法面包制作攻略:从基础到创新食谱详解
掌握中种发酵,轻松做出柔软北海道吐司
厨房里的化学家:用科学原理提升烹饪技艺