Sigmoid和Tanh:两种常用的激活函数对比分析
创作时间:
作者:
@小白创作中心
Sigmoid和Tanh:两种常用的激活函数对比分析
引用
CSDN
1.
https://m.blog.csdn.net/weixin_41429382/article/details/144702210
Sigmoid和Tanh是两种常用的激活函数,它们在神经网络中具有不同的特点和应用场景。
定义与输出范围
- Sigmoid函数:其定义为 $ \sigma(x) = \frac{1}{1 + e^{-x}} $,输出范围在 $ (0, 1) $ 之间,通常用于二分类问题的输出层,因为其输出可以被解释为概率值。
- Tanh函数:其定义为 $ \tanh(x) = \frac{e^x - e^{-x}}{e^x + e^{-x}} $,输出范围在 $ (-1, 1) $ 之间,通常用于隐藏层,因为其输出以零为中心,有助于数据的居中。
形状与特性
两者都呈S形曲线,但Tanh函数的输出范围更广,且关于原点对称,而Sigmoid函数的输出范围较窄且非零中心。
在输入接近零时,Tanh函数的导数通常比Sigmoid函数的导数更大,这使得Tanh函数在某些情况下收敛速度更快。
优点与缺点
- Sigmoid函数:
- 优点:输出值可以被解释为概率,适用于二分类问题的输出层。
- 缺点:输出非零中心,容易导致梯度消失问题,尤其是在深层网络中。
- Tanh函数:
- 优点:输出以零为中心,有助于数据居中,从而可能提高训练效率;其导数在某些区间内更大,有助于缓解梯度消失问题。
- 缺点:同样存在梯度消失问题,尤其是在极端值附近;计算时涉及更多的指数运算,可能会增加计算复杂度。
适用场景
- Sigmoid函数通常用于输出层,特别是在需要输出概率值的二分类问题中。
- Tanh函数则更适合用于隐藏层,特别是在处理对称性数据或需要数据居中的场景中。
关系与转换
Tanh函数可以通过对Sigmoid函数进行线性变换得到,即 $ \tanh(x) = 2 \cdot \sigma(2x) - 1 $。这种变换使得Tanh函数的输出范围从(0,1)变为(-1,1),并解决了Sigmoid函数非零中心的问题。
Sigmoid和Tanh函数各有优缺点,选择哪种激活函数需要根据具体的应用场景和问题需求来决定。在实际应用中,由于ReLU及其变体的出现,这两种传统激活函数的使用频率有所下降。
热门推荐
太湖鼋头渚摄影指南:四季皆美
无锡两日游:打卡最美樱花圣地
太湖畔的三重美景:鼋头渚、拈花湾、灵山大佛
鼋头渚樱花季:太湖畔的粉色仙境
2024中国985高校排名揭晓:上海交大跻身前三
浙大首超复旦跻身前三,南大跃居第六创历史新高
肾病焦虑如何破?中药调理+生活方式改善双管齐下
红格温泉:攀西地区的温泉度假胜地
海上丝路起点变身临港经济区,广州南海神庙片区迎新机
还魂崖与金银桥:阴阳两界的神秘之门
高情商道歉的艺术:修复友谊的六个关键步骤
阳澄湖服务区:亲子游的网红打卡胜地
《新白娘子传奇》:用115首配乐演绎传统文化新生
冬赏济宁古建:三孔孟府里的千年儒家文化
孔子诞生地尼山圣境:文旅融合的儒家文化体验地
夏季四肢无力,可能是缺钾了!这些食物可有效补钾
385米丹崖配269米瀑布,赤水佛光岩展现世界丹霞奇观
普乐安片入选全国首批中药品种:质量与疗效的双重保障
雨中的大雁塔:一座城市的诗意与浪漫
苏轼王质教你雨中作诗
爱因斯坦预言再获证实:600万星系110亿年活动遵循广义相对论
炸带鱼选舟山:肉质细嫩不腥,口感更佳
炸带鱼:传统干拍VS创新面糊,谁更胜一筹
东京迪士尼海洋完全攻略:从交通到游玩全解析
日本的25处世界遗产,你去过几处?(上)
箱根温泉指南:在日本的温泉天堂探索极致放松之旅
白素贞身份揭秘:白蛇精、仙女、精灵的完美融合
赵雅芝端庄,王祖贤妩媚,黄圣依刚烈:白素贞的三种经典诠释
两个小动作解决办公疲劳:打哈欠和伸懒腰的科学依据
广州供电局创新管理模式,数字化转型打造国际领先电网