资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

AI模型的思维方式：激活函数的关键作用及代码示例

创作时间:

作者:

@小白创作中心

AI模型的思维方式：激活函数的关键作用及代码示例

引用

CSDN

https://blog.csdn.net/jjb520/article/details/137679855

在人工智能领域，机器学习是大多数革命性AI应用的基础。从语言处理到图像识别，机器学习无处不在。机器学习依赖于算法、统计模型和神经网络。而深度学习是机器学习的一个子领域，专注于神经网络。任何神经网络的关键组成部分都是激活函数。但确切地理解它们为何对任何神经网络系统都是至关重要的，是一个常见的问题，也可能是一个难以回答的问题。本文重点解释为什么激活函数是必需的，以简单的方式和类比来说明。通过理解这一点，您将了解到AI模型思维的过程。

人工智能与深度学习的兴起

人工智能中的深度学习是什么？

显示社会与人工智能之间联系的图像

深度学习是人工智能的一个子领域。它使用神经网络来处理复杂的模式，就像体育团队为赢得比赛而采用的策略一样。神经网络越大，就越能够做出令人惊叹的事情 - 就像ChatGPT一样，它使用自然语言处理来回答问题并与用户交互。

要真正理解神经网络的基础知识 - 每个单独的人工智能模型都具有的共同点，使其能够工作 - 我们需要理解激活层。

深度学习 = 训练神经网络

简单神经网络

深度学习的核心是训练神经网络。这基本上意味着使用数据来获得正确的权重值，以便能够预测我们想要的内容。神经网络由组织在层中的神经元构成。每一层从数据中提取独特的特征。这种分层结构使得深度学习模型能够分析和解释复杂的数据。

理解激活函数：简化神经网络机制

Leaky ReLU激活函数

激活函数帮助神经网络处理复杂的数据。它们根据接收到的数据改变神经元的值。几乎每个神经元在将其值发送到下一个神经元之前都有一个类似的过滤器。实质上，激活函数控制神经网络的信息流 - 它们决定哪些数据是相关的，哪些是不相关的。这有助于防止梯度消失，以确保网络正确学习。梯度消失问题发生在神经网络的学习信号太弱以至于权重值不变时。这使得从数据中学习变得非常困难。

简单类比：激活函数为什么必要

足球运动员思考

在足球比赛中，球员决定是传球、运球还是射门。这些决定基于当前的比赛情况，就像神经网络中的神经元处理数据一样。在这种情况下，激活函数在决策过程中起到这样的作用。如果没有它们，神经元将会毫无选择性地传递数据- 就像球员毫无思考地踢球，不管比赛背景如何。这样，激活函数引入了复杂性到神经网络中，使其能够学习复杂的模式。

没有激活函数会发生什么？

球员奔跑

为了理解没有激活函数会发生什么，让我们首先想一想如果在足球比赛中球员毫无考虑地踢球会发生什么情况。他们很可能会输掉比赛，因为没有团队决策过程。球还是会被踢到某个地方 - 但大部分时间它不会飞往预期的地方。这与没有激活函数的神经网络所发生的情况相似：神经网络不会做出良好的预测，因为神经元只是随机地向彼此传递数据。我们仍然会得到一个预测结果。只是不是我们想要的，或者不是有用的。这严重限制了足球队和神经网络的能力。

对激活函数的直观解释

现在让我们看一个例子，以便您可以直观地理解这一点。

ReLU激活函数

让我们从深度学习中最广泛使用的激活函数开始（它也是最简单的之一）。这是一个ReLU激活函数。它基本上充当了神经元发送值到其下一个神经元之前的过滤器。这个过滤器基本上包含两个条件：

如果权重值为负，它变为0
如果权重值为正，它不改变任何值

通过这样做，我们为每个神经元增加了一个决策过程。它决定发送哪些数据，哪些不发送。

现在让我们看一些其他激活函数的例子。

Sigmoid激活函数

这个激活函数将输入值转换为0到1之间的值。Sigmoid在最后一个神经元中的二元分类问题中广泛使用。

Sigmoid激活函数

不过，Sigmoid激活函数存在问题。考虑给定线性变换的输出值：

0.00000003
0.99999992
0.00000247
0.99993320

我们可以询问这些值的一些问题：

像0.00000003和0.000002这样的值真的重要吗？它们不能只是0，这样我们就少了要在计算机上运行的东西吗？请记住，在今天的许多模型中，我们有数百万个权重。数百万的0.00000003和0.000002不能是0吗？
如果它是一个正值，它如何区分大值和非常大值？例如，在0.99993320和0.99999992中，输入值像7和13或7和55在哪里？0.99993320和0.99999992并没有准确地描述它们的输入值。

我们如何区分输出中微小差异，以保持准确性？

这就是ReLU激活函数解决的问题：将负数设为零，同时保持正数可以增强神经网络的计算效率。

Tanh（双曲正切）激活函数

tanh激活函数

这些激活函数的输出值在-1和1之间，与Sigmoid类似。它们通常用于循环神经网络（RNNs）和长短期记忆网络（LSTMs）。Tanh也被使用是因为它是以零为中心的。这意味着输出值的平均值大约为零。这种特性有助于处理梯度消失问题。

Leaky ReLU

Leaky ReLU激活函数

Leaky ReLU激活函数不是忽略负值，而是会有一个小的负值。这样，当训练神经网络时，负值也会被使用。使用ReLU激活函数时，带有负值的神经元是不活跃的，并且不会对学习过程做出贡献。使用Leaky ReLU激活函数时，带有负值的神经元是活跃的，并且对学习过程有所贡献。这种决策过程是由激活函数实现的。如果没有它，它将简单地将数据发送给下一个神经元（就像球员毫无思考地踢球）。