卷积神经网络 - 一维卷积、二维卷积
创作时间:
作者:
@小白创作中心
卷积神经网络 - 一维卷积、二维卷积
引用
CSDN
1.
https://blog.csdn.net/liruiqiang05/article/details/146262093
卷积神经网络(Convolutional Neural Network,CNN)是深度学习领域的重要模型之一,在图像识别、语音处理等领域有着广泛的应用。本文将深入探讨卷积神经网络中的一维卷积和二维卷积,从数学定义、几何意义、计算过程等多个维度对比分析它们的差异,并通过具体案例帮助读者理解。
一、数学定义对比
- 一维卷积 (1D Convolution)
- 滑动方向:单一方向(时间轴/序列方向)
- 感受野:连续区间
- 参数数量:K×Cin×Cout
- 二维卷积 (2D Convolution)
- 滑动方向:两个正交方向(高度+宽度)
- 感受野:矩形区域
- 参数数量:Kh ×Kw ×Cin ×Cout
二、几何意义解析
- 一维卷积的几何视角
- 特征提取模式:
- 在时间轴上滑动的局部窗口
- 捕获时序相关性(如语音中的音素过渡)
- 典型模式检测:
- 上升沿检测核:[1, 0, -1]
- 振动检测核:[1, -2, 1]
- 二维卷积的几何视角
- 特征提取模式:
- 在平面网格上滑动的局部窗口
- 捕获空间相关性(如图像中的边缘走向)
- 典型模式检测:
- 水平边缘检测核:
- 45度对角线检测核:
三、计算过程对比演示
案例1:一维卷积实例
- 输入序列:[3, 5, 2, 6, 8]
- 卷积核:[0.5, -1]
- 计算过程(步长=1,无填充):
位置1: 3×0.5 + 5×(-1) = 1.5 -5 = -3.5
位置2: 5×0.5 + 2×(-1) = 2.5 -2 = 0.5
位置3: 2×0.5 + 6×(-1) = 1 -6 = -5
位置4: 6×0.5 + 8×(-1) = 3 -8 = -5
- 输出:[-3.5, 0.5, -5, -5]
案例2:二维卷积实例
- 输入矩阵:
- 卷积核:
- 计算过程(步长1,无填充):
位置(1,1):
1×1 + 3×0 + 4×(-1) + 6×0.5 = 1 -4 +3 = 0
位置(1,2):
3×1 + 2×0 + 6×(-1) + 5×0.5 = 3 -6 +2.5 = -0.5
位置(2,1):
4×1 + 6×0 + 7×(-1) + 9×0.5 = 4 -7 +4.5 = 1.5
位置(2,2):
6×1 + 5×0 + 9×(-1) + 8×0.5 = 6 -9 +4 = 1
- 输出矩阵:
四、本质差异深度分析
维度 | 特征提取方向 | 参数空间 | 不变性 | 典型应用 |
---|---|---|---|---|
1D | 单方向时序关系 | O(K) | 时间平移 | 语音识别、股票预测 |
2D | 二维空间关系 | O(K^2) | 空间平移 | 图像分类、医学影像 |
关键差异点:
- 邻域结构:
- 1D:线性邻域(前序-当前-后续)
- 2D:平面邻域(包含空间拓扑关系)
- 参数复杂度:
- 1D参数量随核长度线性增长
- 2D参数量随核尺寸平方增长
- 平移不变性:
- 1D处理时间平移(早/晚出现相同模式)
- 2D处理空间平移(不同位置相同物体)
- 特征组合方式:
- 1D通过堆叠卷积层捕获长程依赖
- 2D通过分层卷积建立多尺度表征
五、统一数学框架
两种卷积都可以纳入张量卷积的一般形式:
- 对于1D卷积,其中一个维度退化(如j=0)
- 对于2D卷积,两个维度都保持活跃
几何解释:
- 1D:在直线上滑动的线段检测器
- 2D:在平面上滑动的平面检测器
六、现代扩展形式
扩展类型 | 1D实现 | 2D实现 | 目的 |
---|---|---|---|
空洞卷积 | 间隔采样时序点 | 棋盘式采样 | 扩大感受野 |
可分离卷积 | 深度分离时序卷积 | 空间分离卷积 | 降低参数量 |
动态卷积 | 时间自适应的核 | 空间自适应的核 | 增强灵活性 |
七、选择指导原则
- 数据类型决定维度:
- 时间序列 → 1D卷积
- 图像/视频 → 2D/3D卷积
- 特征方向性需求:
- 需要捕获空间方向特征 → 2D卷积
- 仅需序列模式 → 1D卷积
- 计算资源约束:
- 资源有限时优先1D
- 允许复杂计算时使用2D
终极理解:
一维卷积是时序特征提取器,关注事件发生的顺序规律;二维卷积是空间特征提取器,关注模式的几何分布。二者的本质区别在于:
1D卷积处理的是因果性(causality),2D卷积处理的是共现性(co-occurrence)。这种维度差异决定了它们在特征表示、参数设计和应用场景上的根本不同。
八、示例
典型类比:
现实场景 | 卷积对应 |
---|---|
金属探测器扫沙滩 | 在二维空间滑动检测 |
心电图机走纸 | 在时间轴上滑动分析 |
验钞灯照射纸币 | 多层级特征验证 |
一维卷积示例:
下层为输入信号序列, 上层为卷积结果。连接边上的数字为滤波器中的权重。下图的卷积结果为近似值。
二维卷积示例
在数学卷积的定义中,核翻转指的是在计算卷积前,将卷积核进行反转操作。具体来说:
- 一维卷积:如果卷积核为 [a, b, c],翻转后得到 [c, b, a]。
- 二维卷积:如果卷积核为
翻转操作即先水平翻转,再垂直翻转,结果为
这种翻转是数学卷积定义的一部分,确保了卷积运算的交换性和其他数学性质。需要注意的是,在很多深度学习框架中实际使用的操作更接近于交叉相关(不翻转卷积核),但严格的数学卷积要求核翻转。以上的例子为严格的数学卷积,即先翻转。
在图像处理中,卷积经常作为特征提取的有效方法。一幅图像在经过卷积操作后得到结果称为特征映射(Feature Map)。下图给出在图像处理中几种常用的滤波器,以及其对应的特征映射。图中最上面的滤波器是常用的高斯滤波器,可以用来对图像进行平滑去噪;中间和最下面的滤波器可以用来提取边缘特征。
九、特性和关键优势
卷积就像用同一个「特征扫描仪」在数据上逐段检查,专注寻找重复出现的局部模式。想象你拿手机扫描超市货架找可乐:
- 扫描动作:手机摄像头每次对准货架的一小块区域(局部连接)
- 同一标准:无论扫描哪个位置,都用相同的"可乐logo识别程序"(权重共享)
- 滑动检测:从左到右移动手机,直到找到红底白字的经典标志(滑动窗口)
- 效率高:1个扫描器重复使用,避免重复造轮子
- 专注细节:每次只看局部,不受无关信息干扰
- 模式专家:专门检测平移不变的特征(如无论猫咪在图片哪个位置都能识别)
终极记忆口诀:
"小窗滑动,同标检测,特征抓取,高效省力"
热门推荐
张掖:聚焦“一屏三地” 奋力谱写新篇章
黄金价格的影响因素有哪些?这些因素对黄金市场有什么长远影响?
遇上债基亏损,却不能赎回?怎么回事?
办公软件隐藏怎么解除
香港简单注册结婚流程与费用详解
没结婚的罪名:未婚女性面临的法律困境与权益保障
八字纯阳为何会撞邪 八字纯阳与帝王命的神秘联系
从“双碳”目标到零碳园区:中国工业绿色转型的“突破战”
房车太阳能选购指南:功率选择与使用注意事项全解析
房产纠纷中的合同审查
优化绩效考核管理系统,提升企业绩效评估和员工管理效果
别夸孩子“你真棒”!照搬4个黄金表扬句式,孩子一天比一天优秀
“明前肥螺”已上市,这几天最好吃,避雷攻略请收好!
决明子价格,影响因素与市场行情
IP数据报格式参数详解
瞪羚企业崛起!政府报告揭示商业市场新机遇!
澳大利亚房产税全解析:如何计算房屋税金?
白月光的出处
如何利用专利地图分析趋势与竞争格局?
前端管理系统项目亮点怎么写
公司税票全面解读:从定义到实际应用
海洋为什么是蓝色的?
优质的井字游戏有哪些2025 受欢迎的井字游戏大全
智能物流与供应链管理:技术驱动的现代化物流解决方案
十种置物架类型有哪些 家庭常备十类实用收纳架
贫血要补铁吗?一文读懂贫血与补铁的关系
OpenAI发布经济蓝图:奥特曼急呼AI让美国先赢,打造AI版“美国梦”
英语四级语法知识精选内容:独立主格的用法
【健康科普】病理报告为什么要等3至5天?
IP地址中的网络号:定义、作用与重要性