机器学习中的批量归一化(Batch Normalization)详解
创作时间:
作者:
@小白创作中心
机器学习中的批量归一化(Batch Normalization)详解
引用
CSDN
1.
https://blog.csdn.net/qq_35516428/article/details/139277713
批量归一化(Batch Normalization)是深度学习中一种常用的技术,用于加速神经网络的训练并提高模型的稳定性。本文将从概念、必要性到具体实现和优点,全面介绍这一技术。
概念简介
归一化指的是将数据缩放到一个固定范围内,通常是 [0, 1],而标准化是使得数据符合标准正态分布。归一化的作用是使不同特征具有相同的尺度,从而使模型训练更加稳定和快速,尤其是对于使用梯度下降法的算法。而标准化的作用加快模型收敛速度,提高模型的性能。
批量归一化用于加速神经网络的训练并提高模型的稳定性。它在每个批次的数据上进行标准化,通过对每层的输入进行归一化处理,使得网络中间层的激活值保持在一个较小的范围内,有助于加速模型的收敛,同时减少了梯度消失和爆炸的问题。所以批量归一化特别适合深层网络。
为什么需要归一化
例如上边这个例子,右图神经网络有两个输入,分别是从3-34和从0-1000的范围。
输入范围的巨大差异会导致在前向传播和反向传播过程中,激活函数的输出也会有很大的波动。如果激活函数是非线性的,大范围输入可能会导致梯度消失或梯度爆炸问题。
输入范围的巨大差异也会导致损失函数在不同维度上的梯度变化不一致,使得优化算法难以有效收敛。
对输入使用归一化可以缓解以上问题,但是在训练后期仍可能出现梯度消失或梯度爆炸问题。这时我们就需要使用批量归一化了。
批量归一化层
批量归一化所做的是仅标准化输入,然后将数据输入到网络中,在网络中所有层的所有输出进行标准化,也就是每层之间都有批量归一化层。它所做的就是标准化数据并做一些其他的工作,然后输出给下一层。
加入批量归一化层的优点
- 稳定和加速训练过程:归一化减少了不同层之间输入数据分布的变化。
- 减少梯度消失和爆炸问题:保持零均值和单位方差。
- 起到轻微正则化的效果:每个小批量的均值和方差略有不同,微小随机性类似于Dropout正则化。
- 降低对权重初始化的敏感性:减少了调参的难度。
- 适用于更深的神经网络:深度神经网络往往面临梯度消失或爆炸的问题。
本文原文来自CSDN
热门推荐
专家详解:饮酒引发痔疮的科学治疗方法
SDH技术(详解SDH光传输技术的原理与应用)
西梅:天然通便高手,还有这些意想不到的健康功效
店面前建停车场合规吗?商户认为影响经营,业委会及停车场运营方这么说……
葛姓的起源与历史文化:从远古部落到现代多民族
科学补钙全攻略:这些方法最有效!
为什么我跑得腿疼?小腿疼痛的5个最常见原因
绿豆生长的环境及条件(从种子到成熟)
2024年一季度保租房REITs财务分析报告:出租率超90%,净利润稳健增长
乐不思蜀的主角是谁?他为什么会乐不思蜀?
旅游净收入如何提升地方经济发展潜力
千万人口城市变局:长沙增量第一,石家庄“逆转”
汉字"暧"的详细解释
“草莓+”让小水果引发大转型
头皮疼是怎么回事,一碰头发就疼
2025年昆明最新社保缴费,昆明社保24小时人工服务电话
如何看待美联储降息节奏
科学研究向极综合交叉发力,将带来哪些影响?
养肝的中药配方
复合材料未知化合物成分分析检测及应用
农村的界定标准是什么?这些标准有哪些实际应用?
如何选择和使用FLAC格式:无损音频编码指南
艾灸后皮肤瘙痒?医生为你解答原因和应对方法
华语说唱,在争论的漩涡中前行
雷电的神秘面纱:那些鲜为人知却又令人称奇的自然现象
【医疗问答】生活中常说穿衣要“春捂秋冻”,你知道这是为什么吗?
肝癌骨转移的综合治疗方案详解
饮食顺序 先喝汤还是先吃饭 这些饮食服药顺序您颠倒了吗
公积金缴费基数是什么标准
高原冻土区铁路建设技术措施研究