激活函数篇——Relu、Leaky ReLU、SiLU(对比计算量、内存)
创作时间:
作者:
@小白创作中心
激活函数篇——Relu、Leaky ReLU、SiLU(对比计算量、内存)
引用
CSDN
1.
https://blog.csdn.net/qq_40938217/article/details/145026736
在深度学习模型优化过程中,激活函数的选择对计算效率和模型性能有着重要影响。本文将从计算量和内存使用角度,对比分析三种常用的激活函数:ReLU、Leaky ReLU和SiLU,帮助读者更好地理解它们的优缺点和适用场景。
在深度学习领域,激活函数是神经网络中不可或缺的组成部分。它们为模型引入非线性特性,使得神经网络能够学习和模拟复杂的函数映射。
ReLU
ReLU(Rectified Linear Unit)因其计算简单、在很多情况下表现较好而被广泛使用。但是,它可能会导致“神经元死亡”(即 ReLU 激活后的输出恒为0),特别是在初始化不当或学习率过大的情况下。
Leaky ReLU
Leaky ReLU可以缓解 ReLU 的一些问题,通过允许负值部分避免神经元完全“死掉”。通常取值为0.01。
SiLU
SiLU(Sigmoid Linear Unit)近年来提出的激活函数,表现出在一些任务中相较于ReLU更好的性能,尤其在深层网络中更为有效。适用于网络较深、任务较复杂时使用。
相同层不同激活函数对比(MACs、Memory)
- Relu
- SiLU
- Leaky ReLU
- 论文中SiLU和ReLU曲线对比和其导数
总结
可以看到激活函数在计算量上影响还是很大的,因为每一次卷积都会跟随一次激活函数,多次使用对整体的计算量、内存都会提升。具体如何选择我认为还是要通过实验来衡量速度与精度。
- ReLU缺点:当权重更新导致节点输出始终小于0时,该节点的梯度为零,不会再更新,导致网络部分神经元失效,所有负输入直接被置为 0,可能丢失一些重要信息
- Leaky ReLU缺点:引入了超参数 𝛼,需要手动调整其值(默认一般是 0.01),可能导致不稳定性。计算复杂度略高:相比 ReLU,多了一些系数乘法操作,但仍然较高效
- SiLU缺点:引入了 sigmoid 函数,导致计算复杂度较高。由于公式的复杂性和非单调性,不容易直观理解其输出对学习的影响。
热门推荐
无痛血尿?不是炎症,是癌症!膀胱B超建议一年一做
如何判断CPU是否支持虚拟机
小孩子的血压多少正常
金铲铲之战S7阵容推荐图 新赛季阵容一图流
PUBG是什么意思?-全面解析PUBG游戏的含义与玩法
生辰八字中土命的人如何通过五行相生来增强金元素
美国进入夏令时,美股交易时间提前1小时
合肥工业大学智能感知工程专业:以"精益求精"为理念,培养高素质复合型人才
脑科学告诉你:吃什么可以增强脑力?
又添新证!中外学者捐赠大量侵华日军细菌战刊物史料
运动没有最低时间,碎片化运动也有效
一场别开生面的产销会:政企媒跨界携手,打通农产品产销“任督二脉”
中国二十四节气有哪些 二十四节气都是什么节气
漏电开关的正确接法是怎样的
哑铃飞鸟练哪里?5种训练方式详解
为什么漫迷能接受赛亚人血统,却接受不了路飞的“尼卡果实”?
20周年结婚纪念日送花有什么讲究?
福建舰的设计方案,临时全改,电磁弹射器,到底有多强悍?
“豹2”主战坦克:德国制造的精良战车
太原获评“中国气候宜居城市”→ 系唯一入榜省会城市
通胀成全球经济主要威胁,如何解决?经济学家建议改变金本位制
互联网巨头字节跳动,为何没进中国民企500强?
拒绝校园欺凌 向暴力说“不”——预防校园欺凌指导手册
骨骺线闭合自测小方法
AN94尴尬的命运,永远无法代替AK系列
恒生科技指数调整成分股构成,中通快递和百济神州新晋入选
中外云计算产业发展形势与比较
胆固醇有好也有坏?科学管理胆固醇,从生活细节做起
走进希腊神话经典故事,领略古老文化魅力。
侗族大歌:自然天成的山水和音