Sigmoid和Tanh:两种常用的激活函数对比分析
创作时间:
作者:
@小白创作中心
Sigmoid和Tanh:两种常用的激活函数对比分析
引用
CSDN
1.
https://m.blog.csdn.net/weixin_41429382/article/details/144702210
Sigmoid和Tanh是两种常用的激活函数,它们在神经网络中具有不同的特点和应用场景。
定义与输出范围
- Sigmoid函数:其定义为 $ \sigma(x) = \frac{1}{1 + e^{-x}} $,输出范围在 $ (0, 1) $ 之间,通常用于二分类问题的输出层,因为其输出可以被解释为概率值。
- Tanh函数:其定义为 $ \tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}} $,输出范围在 $ (-1, 1) $ 之间,通常用于隐藏层,因为其输出以零为中心,有助于数据的居中。
形状与特性
两者都呈S形曲线,但Tanh函数的输出范围更广,且关于原点对称,而Sigmoid函数的输出范围较窄且非零中心。
在输入接近零时,Tanh函数的导数通常比Sigmoid函数的导数更大,这使得Tanh函数在某些情况下收敛速度更快。
优点与缺点
- Sigmoid函数:
- 优点:输出值可以被解释为概率,适用于二分类问题的输出层。
- 缺点:输出非零中心,容易导致梯度消失问题,尤其是在深层网络中。
- Tanh函数:
- 优点:输出以零为中心,有助于数据居中,从而可能提高训练效率;其导数在某些区间内更大,有助于缓解梯度消失问题。
- 缺点:同样存在梯度消失问题,尤其是在极端值附近;计算时涉及更多的指数运算,可能会增加计算复杂度。
适用场景
- Sigmoid函数通常用于输出层,特别是在需要输出概率值的二分类问题中。
- Tanh函数则更适合用于隐藏层,特别是在处理对称性数据或需要数据居中的场景中。
关系与转换
Tanh函数可以通过对Sigmoid函数进行线性变换得到,即 $ \tanh(x) = 2 \cdot \sigma(2x) - 1 $。这种变换使得Tanh函数的输出范围从(0,1)变为(-1,1),并解决了Sigmoid函数非零中心的问题。
Sigmoid和Tanh函数各有优缺点,选择哪种激活函数需要根据具体的应用场景和问题需求来决定。在实际应用中,由于ReLU及其变体的出现,这两种传统激活函数的使用频率有所下降。
热门推荐
什么是光盘映像文件?它有哪些用途和优势?
菏泽牡丹机场2024年夏秋季航班时刻表
继承确认书是什么
甲状腺疾病遗传吗?
甲状腺疾病会遗传吗?
没到退休年龄人死了养老金怎么返还?
文旅景观设计要点与案例解析
简洁明了的贷款申请书范文
贺兰公安:“三防”模式提升社会治安防控能力
法治宣传——普法宣传|法律在心中,安全在手中
二维码登录
银翘散的组成功效与主治
如何为不同年龄的宝宝选择合适的辅食?
美术学院排名重新洗牌,九大美院再次排位,它们分别有哪些亮点?
五大“千亿工程”,它拔得头筹!
红烧茄子的历史演变与地方特色
完颜宗翰:金国首席名将,子孙三十多人被金兵处死
如何实现两台电脑文件传输?多种方法供你选择!
构建高效协同的供应链生态体系需要哪些策略?
软件开发人员如何有效提问
吸毒成瘾难题:为何难以戒断
电脑电源选购指南:让您的设备稳定运行的秘密武器
SLG游戏类型详解及玩法介绍
探究翡翠的紫色品种:价值、鉴别与市场行情
紫水晶保养和清洁指南
切肠息肉术后饮食指南:14天食谱分享
言语治疗:脑卒中后语言障碍的康复之路在哪里?
蒲公英的象征意义是什么?它在不同文化中代表了什么?
八字喜偏财命里无偏财:含义与应对之道
笔记本电脑连接外接显示器不显示?一文详解解决方案