Sigmoid和Tanh:两种常用的激活函数对比分析
创作时间:
作者:
@小白创作中心
Sigmoid和Tanh:两种常用的激活函数对比分析
引用
CSDN
1.
https://m.blog.csdn.net/weixin_41429382/article/details/144702210
Sigmoid和Tanh是两种常用的激活函数,它们在神经网络中具有不同的特点和应用场景。
定义与输出范围
- Sigmoid函数:其定义为 $ \sigma(x) = \frac{1}{1 + e^{-x}} $,输出范围在 $ (0, 1) $ 之间,通常用于二分类问题的输出层,因为其输出可以被解释为概率值。
- Tanh函数:其定义为 $ \tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}} $,输出范围在 $ (-1, 1) $ 之间,通常用于隐藏层,因为其输出以零为中心,有助于数据的居中。
形状与特性
两者都呈S形曲线,但Tanh函数的输出范围更广,且关于原点对称,而Sigmoid函数的输出范围较窄且非零中心。
在输入接近零时,Tanh函数的导数通常比Sigmoid函数的导数更大,这使得Tanh函数在某些情况下收敛速度更快。
优点与缺点
- Sigmoid函数:
- 优点:输出值可以被解释为概率,适用于二分类问题的输出层。
- 缺点:输出非零中心,容易导致梯度消失问题,尤其是在深层网络中。
- Tanh函数:
- 优点:输出以零为中心,有助于数据居中,从而可能提高训练效率;其导数在某些区间内更大,有助于缓解梯度消失问题。
- 缺点:同样存在梯度消失问题,尤其是在极端值附近;计算时涉及更多的指数运算,可能会增加计算复杂度。
适用场景
- Sigmoid函数通常用于输出层,特别是在需要输出概率值的二分类问题中。
- Tanh函数则更适合用于隐藏层,特别是在处理对称性数据或需要数据居中的场景中。
关系与转换
Tanh函数可以通过对Sigmoid函数进行线性变换得到,即 $ \tanh(x) = 2 \cdot \sigma(2x) - 1 $。这种变换使得Tanh函数的输出范围从(0,1)变为(-1,1),并解决了Sigmoid函数非零中心的问题。
Sigmoid和Tanh函数各有优缺点,选择哪种激活函数需要根据具体的应用场景和问题需求来决定。在实际应用中,由于ReLU及其变体的出现,这两种传统激活函数的使用频率有所下降。
热门推荐
感应电机(异步电机)工作原理详解
如何保养和清洁钕铁硼磁铁?
车辆自查指南:看这篇,轻松搞定自检
从技校生到大国工匠——记全国劳动模范王忠才
干货分享 | 52种细胞因子的来源和功能
人工智能治理白皮书:守护人类文明的AI时代
NAS设备RAID配置完整指南:从选择级别到维护管理
薄层色谱的四种类型及其原理详解
情侣相处,最忌讳这2件事,现在知道还不晚
四大标准体系解读:EN、IEC、ISO、ITU 的全球影响与合作机制
PC板和亚克力板哪个好?全面对比分析
PC(聚碳酸酯)与亚克力板特性差异解析
什么是A娃?ADHD的病因、特征与治疗方法全解析
邮报:利物浦为萨拉赫和科纳特调整了训练计划以适应斋月
久坐人群要小心腰肌劳损
揭秘游泳池水的物理过滤与化学消毒方法
利物浦主帅斯洛特暗示阿诺德的替代人选!
中消协:旧家电超过这个年限就该换了!
脖子晒黑如何恢复?
如何高效购买团体意外险:2024年最新全面指南
全面推进国家居家和社区养老服务改革试点 兰州市构建多元化养老服务体系
Steam免费发布游戏吗?详细了解Steam游戏发布机制
跨省住院不降报销比例 湘鄂这些区域医保互联互通了!
彩礼还要收多久?
什么是打新股?详细操作流程与注意事项
深入解析A股打新:规则、流程与常见问题
人工智能对创意产业的影响与未来展望:机遇与挑战并存
生物牙根再生技术在北京的发展现状与未来展望
南京大学第五轮学科评估结果公布:南大第五轮abc类学科名单一览
南京大学:集历史荣耀与现代辉煌于一身的学府