资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

卷积神经网络 - 一维卷积、二维卷积

创作时间:

作者:

@小白创作中心

卷积神经网络 - 一维卷积、二维卷积

引用

CSDN

https://blog.csdn.net/liruiqiang05/article/details/146262093

卷积神经网络（Convolutional Neural Network，CNN）是深度学习领域的重要模型之一，在图像识别、语音处理等领域有着广泛的应用。本文将深入探讨卷积神经网络中的一维卷积和二维卷积，从数学定义、几何意义、计算过程等多个维度对比分析它们的差异，并通过具体案例帮助读者理解。

一、数学定义对比

一维卷积 (1D Convolution)

滑动方向：单一方向（时间轴/序列方向）
感受野：连续区间
参数数量：K×Cin×Cout

二维卷积 (2D Convolution)

滑动方向：两个正交方向（高度+宽度）
感受野：矩形区域
参数数量：Kh ×Kw ×Cin ×Cout

二、几何意义解析

一维卷积的几何视角

特征提取模式：
在时间轴上滑动的局部窗口
捕获时序相关性（如语音中的音素过渡）
典型模式检测：
上升沿检测核：[1, 0, -1]
振动检测核：[1, -2, 1]

二维卷积的几何视角

特征提取模式：
在平面网格上滑动的局部窗口
捕获空间相关性（如图像中的边缘走向）
典型模式检测：
水平边缘检测核：
45度对角线检测核：

三、计算过程对比演示

案例1：一维卷积实例

输入序列：[3, 5, 2, 6, 8]
卷积核：[0.5, -1]
计算过程（步长=1，无填充）：

位置1: 3×0.5 + 5×(-1) = 1.5 -5 = -3.5 
位置2: 5×0.5 + 2×(-1) = 2.5 -2 = 0.5 
位置3: 2×0.5 + 6×(-1) = 1 -6 = -5 
位置4: 6×0.5 + 8×(-1) = 3 -8 = -5

输出：[-3.5, 0.5, -5, -5]

案例2：二维卷积实例

输入矩阵：
卷积核：
计算过程（步长1，无填充）：

位置(1,1): 
1×1 + 3×0 + 4×(-1) + 6×0.5 = 1 -4 +3 = 0
位置(1,2): 
3×1 + 2×0 + 6×(-1) + 5×0.5 = 3 -6 +2.5 = -0.5
位置(2,1): 
4×1 + 6×0 + 7×(-1) + 9×0.5 = 4 -7 +4.5 = 1.5
位置(2,2): 
6×1 + 5×0 + 9×(-1) + 8×0.5 = 6 -9 +4 = 1

输出矩阵：

四、本质差异深度分析

维度	特征提取方向	参数空间	不变性	典型应用
1D	单方向时序关系	O(K)	时间平移	语音识别、股票预测
2D	二维空间关系	O(K^2)	空间平移	图像分类、医学影像

关键差异点：

邻域结构：

1D：线性邻域（前序-当前-后续）
2D：平面邻域（包含空间拓扑关系）

参数复杂度：

1D参数量随核长度线性增长
2D参数量随核尺寸平方增长

平移不变性：

1D处理时间平移（早/晚出现相同模式）
2D处理空间平移（不同位置相同物体）

特征组合方式：

1D通过堆叠卷积层捕获长程依赖
2D通过分层卷积建立多尺度表征

五、统一数学框架

两种卷积都可以纳入张量卷积的一般形式：

对于1D卷积，其中一个维度退化（如j=0）
对于2D卷积，两个维度都保持活跃

几何解释：

1D：在直线上滑动的线段检测器
2D：在平面上滑动的平面检测器

六、现代扩展形式

扩展类型	1D实现	2D实现	目的
空洞卷积	间隔采样时序点	棋盘式采样	扩大感受野
可分离卷积	深度分离时序卷积	空间分离卷积	降低参数量
动态卷积	时间自适应的核	空间自适应的核	增强灵活性

七、选择指导原则

数据类型决定维度：

时间序列 → 1D卷积
图像/视频 → 2D/3D卷积

特征方向性需求：

需要捕获空间方向特征 → 2D卷积
仅需序列模式 → 1D卷积

计算资源约束：

资源有限时优先1D
允许复杂计算时使用2D

终极理解：
一维卷积是时序特征提取器，关注事件发生的顺序规律；二维卷积是空间特征提取器，关注模式的几何分布。二者的本质区别在于：
1D卷积处理的是因果性（causality），2D卷积处理的是共现性（co-occurrence）。这种维度差异决定了它们在特征表示、参数设计和应用场景上的根本不同。

八、示例

典型类比：

现实场景	卷积对应
金属探测器扫沙滩	在二维空间滑动检测
心电图机走纸	在时间轴上滑动分析
验钞灯照射纸币	多层级特征验证

一维卷积示例：
下层为输入信号序列，上层为卷积结果。连接边上的数字为滤波器中的权重。下图的卷积结果为近似值。

二维卷积示例

在数学卷积的定义中，核翻转指的是在计算卷积前，将卷积核进行反转操作。具体来说：

一维卷积：如果卷积核为 [a, b, c]，翻转后得到 [c, b, a]。
二维卷积：如果卷积核为
翻转操作即先水平翻转，再垂直翻转，结果为
这种翻转是数学卷积定义的一部分，确保了卷积运算的交换性和其他数学性质。需要注意的是，在很多深度学习框架中实际使用的操作更接近于交叉相关（不翻转卷积核），但严格的数学卷积要求核翻转。以上的例子为严格的数学卷积，即先翻转。

在图像处理中，卷积经常作为特征提取的有效方法。一幅图像在经过卷积操作后得到结果称为特征映射(Feature Map)。下图给出在图像处理中几种常用的滤波器，以及其对应的特征映射。图中最上面的滤波器是常用的高斯滤波器，可以用来对图像进行平滑去噪；中间和最下面的滤波器可以用来提取边缘特征。