资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

神经网络 | CNN 与 RNN——深度学习主力军

创作时间:

作者:

@小白创作中心

神经网络 | CNN 与 RNN——深度学习主力军

引用

CSDN

https://blog.csdn.net/ttrr27/article/details/136018712

卷积神经网络（CNN）和循环神经网络（RNN）是深度学习领域的两大支柱，分别在图像识别和语言处理领域发挥着重要作用。本文将从多个维度对这两种网络进行对比分析。

卷积神经网络（CNN）

特征

局部连接：在卷积层（假设是第$l$层）中的每一个神经元都只和前一层（第$l-1$层）中某个局部窗口内的神经元相连，构成一个局部连接网络。
权重共享：一个卷积核只捕捉输入数据中的一种特定的局部特征（因此，如果要提取多种特征就需要使用多个不同的卷积核）。
空间或时间上的次采样。

结构

一个卷积神经网络主要由以下5层组成：

输入层（Input layer）
卷积层（CONV layer，包含激活函数，比如ReLU、sigmoid、tanh等）
池化层（Pooling layer）
全连接层（FC layer）
输出层（Ouput layer）

循环神经网络（RNN）

网络结构

RNN不是刚性地记忆所有固定长度的序列，而是通过隐藏状态来存储之前时间步的信息。

可以看出，典型的RNN是有环结构。一个典型的RNN网络架构包含一个输入，一个输出和一个神经网络单元。和普通的前馈神经网络的区别在于：RNN的神经网络单元不但与输入和输出存在联系，而且自身也存在一个循环/回路/环路/回环（loop）。这种回路允许信息从网络中的一步传递到下一步。

同时，RNN还能按时间序列展开循环（unroll the loop）为如下形式：

由上图可知，上一个时刻的网络状态将会作用于到下一个时刻的网络状态，还表明RNN和序列数据密切相关。同时，RNN要求每一个时刻都有一个输入，但是不一定每个时刻都需要有输出。

进一步地，公式化RNN的结构。单个展开的RNN结构如下：

RNN的计算结构如下：

由上述表示，RNN的经典计算结构如下：

在图中有一条单向流动的信息流是从输入单元到达隐藏单元的，与此同时另一条单向流动的信息流从隐藏单元到达输出单元。在某些情况下，RNNs会打破后者的限制，引导信息从输出单元返回隐藏单元，这些被称为“Back Projections”，并且隐藏层的输入还包括上一隐藏层的状态，即隐藏层内的节点可以自连也可以互连（这实际上就是LSTM）。

循环神经网络的输入是序列数据，每个训练样本是一个时间序列，包含多个相同维度的向量。网络的参数如何通过训练确定？这里就要使用解决RNN训练问题的BPTT（Back Propagation Through Time）算法。

右侧为计算时便于理解记忆而产开的结构。简单说，x为输入层，o为输出层，s为隐含层，而t指第几次的计算；V、W、U为权重（在RNN中，每一层都共享参数U、V、W，降低了网络中需要学习的参数，提高学习效率。）。

表示t时刻的输入，

表示t时刻的隐状态，

表示t时刻的输出。

输入单元（input units）：

隐藏单元（hidden units）：

输出单元（output units）：

输入层：

表示时刻t的输入。

第t次的中间的隐含层状态为：

f是非线性激活函数，比如tanh。