神经网络为什么要用 ReLU 增加非线性?
创作时间:
作者:
@小白创作中心
神经网络为什么要用 ReLU 增加非线性?
引用
CSDN
1.
https://m.blog.csdn.net/u012935445/article/details/146036469
在神经网络中,ReLU(Rectified Linear Unit)作为最常用的激活函数之一,其引入非线性的作用至关重要。本文将深入探讨为什么神经网络需要非线性,ReLU的具体定义及其优势,并介绍其几种常见的变体形式。
1. 为什么需要非线性?
1.1 线性模型的局限性
如果神经网络只使用线性激活函数(如线性函数),那么无论网络有多少层,整个模型仍然是一个线性模型。这是因为多个线性变换的组合仍然是线性变换:
这样的模型无法学习复杂的非线性关系,表达能力非常有限。
1.2 非线性激活函数的作用
非线性激活函数(如 ReLU、Sigmoid、Tanh)能够打破线性关系,使神经网络能够学习复杂的非线性模式。通过堆叠多个非线性层,神经网络可以逼近任意复杂的函数。
2. ReLU 的定义
ReLU 的定义非常简单:
- 当输入 x>0 时,输出 x。
- 当输入 x≤0 时,输出 0。
3. ReLU 的优势
3.1 缓解梯度消失问题
- 在 Sigmoid 或 Tanh 激活函数中,当输入值较大或较小时,梯度会趋近于零,导致梯度消失问题。
- ReLU 的梯度在正区间恒为 1,避免了梯度消失问题,使得深层网络的训练更加稳定。
3.2 计算高效
- ReLU 的计算非常简单,只需要比较和取最大值操作,计算速度远快于 Sigmoid 和 Tanh。
- 在训练大规模神经网络时,ReLU 的高效计算能够显著加快训练速度。
3.3 稀疏激活
- ReLU 会将负值输出为零,这使得神经网络的激活变得稀疏。
- 稀疏激活可以减少参数之间的依赖性,提高模型的泛化能力。
4. ReLU 的变体
尽管 ReLU 有很多优点,但它也存在一些问题(如神经元“死亡”问题)。因此,研究者提出了多种 ReLU 的变体:
4.1 Leaky ReLU
在负区间引入一个小的斜率,避免神经元“死亡”:
其中 α 是一个小的正数(如 0.01)。
4.2 Parametric ReLU (PReLU)
将 Leaky ReLU 的斜率 α 作为可学习参数,动态调整负区间的输出。
4.3 Exponential Linear Unit (ELU)
在负区间引入指数函数,平滑过渡:
5. ReLU 的代码实现
以下是 ReLU 及其变体的 PyTorch 展示:
import torch
import torch.nn as nn
# 标准 ReLU
relu = nn.ReLU()
x = torch.tensor([-1.0, 2.0, -3.0, 4.0])
print(relu(x)) # 输出: tensor([0., 2., 0., 4.])
# Leaky ReLU
leaky_relu = nn.LeakyReLU(negative_slope=0.01)
print(leaky_relu(x)) # 输出: tensor([-0.0100, 2.0000, -0.0300, 4.0000])
# ELU
elu = nn.ELU(alpha=1.0)
print(elu(x)) # 输出: tensor([-0.6321, 2.0000, -0.9502, 4.0000])
热门推荐
咀嚼槟榔对口腔和牙齿的危害原理及其影响
让输入法更精准:四大实用技巧详解
2024年广东高考一本分数线出炉:历史类428分,物理类442分
何首乌的炮制方法是什么
监督抽检农残超标“新星”——噻虫胺知多少
小学数学复习计划:利用多媒体教学资源
在哪里查学校录取分数线 有什么方法
备孕期间女性如何保持良好心态?三个维度全方位指导
神经可塑性:大脑的自我修复与适应力
民宿困惑调查:从"一房难求"到"冷热不均"
如何设计灵活的居住空间?这种设计有哪些创新点?
从超市到潮玩店:不同场景下的货架设计策略
手术后低烧怎么办
兽用B超仪在畜牧业中的应用及其重要性
资产分配确认是什么
耳鸣诊断:医生如何查找耳鸣病因?
经常吃松子有5个好处,但这2类人最好一颗都不要吃
预测股市变盘的时间窗口
“医”起科普 | “小身材”大作用,动态血糖监测助力骨折患者轻松控糖、安全手术!
房价上涨背后的经济因素有哪些?这些因素如何影响房地产市场的稳定性?
法护花蕾 守“未”成长——武陵区人民法院深入推进“利剑护蕾”专项行动工作综述
事业单位拖欠工资多久算违法?
CMF趋势 | 4大方向告诉你,CMF色彩、材质、图案和形状的最佳存在方式
山西小镇特色产业多点开花 多元发展助力乡邻共富
2024贵州中医药大学录取规则及投档比例
火影忍者手游:千手柱间技能详解与实战攻略
慈悲心,是一切智慧的开始
股票上涨的因素究竟是什么?这些因素如何分析?
7个常见减肥误区,你中了几个?这些方法看似有效,实际上让你越减越肥!
人与猪的DNA相似度有多高?这对科学研究和医学有什么启示?