问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

卷积特征图与感受野:深度学习中的核心概念解析

创作时间:
作者:
@小白创作中心

卷积特征图与感受野:深度学习中的核心概念解析

引用
CSDN
1.
https://blog.csdn.net/hawk2014bj/article/details/138729746

卷积神经网络(CNN)是深度学习领域中一种重要的神经网络架构,广泛应用于图像识别、自然语言处理等领域。在CNN中,特征图尺寸和感受野是两个非常重要的概念,它们直接影响着网络的性能和效果。本文将详细介绍这两个概念的计算方法。

特征图尺寸

卷积特征图是输入图像经过卷积核处理后的输出尺寸。计算输出特征图的尺寸需要考虑以下几个关键参数:

  • 输入尺寸:输入图像或特征图的高度或宽度。
  • 卷积核尺寸:卷积核的高度或宽度。
  • 填充:应用于输入图像的填充量。
  • 步长:卷积核在输入图像上移动的步长。

特征图尺寸的计算公式如下:

这个公式的直观理解是:首先计算卷积核能移动多少像素,直到卷积核不能继续移动。然后将结果除以步长,并加1(加1是为了处理边界情况,确保即使输入尺寸与卷积核尺寸相等时,输出尺寸也为1)。

让我们通过几个实例来理解这个公式:

  • 实例1:输入尺寸为6x6,卷积核尺寸为2x2,步长为1,填充为0。根据公式计算得到的输出尺寸为5。
  • 实例2:输入尺寸为6x6,卷积核尺寸为2x2,步长为2,填充为1。根据公式计算得到的输出尺寸为4。

感受野

感受野是指在卷积神经网络中,某一层特征图上的一个像素点能够看到的原始输入图像的范围。随着网络深度的增加,感受野也会逐渐扩大,从而能够捕捉到更大范围的上下文信息。

感受野的计算是一个多层累加的过程。具体来说:

  1. 第一层的感受野等于卷积核的尺寸。
  2. 后续每一层的感受野等于前一层的感受野加上当前层新增加的边缘(卷积核尺寸减去中心点)。
  3. 如果步长大于1,还需要考虑步长的影响。

让我们通过几个实例来理解感受野的计算:

假设一个网络的前两层都使用了3x3的滤波器,步长为1:

第一层:
    感受野 = 1 + (3 - 1) × 1 = 3
第二层:
    感受野 = 3 + (3 - 1) × 1 = 5

假设一个网络的前三层都使用了3x3的滤波器,步长为2:

第一层:
    卷积核大小 = 3,步长 = 2
    RF1=1+(3−1)×1=3
第二层:
    卷积核大小 = 3,步长 = 2
    此处,之前层的步长积仅为第1层的步长,即2。
    RF2=3+(3−1)×2=7
第三层:
    卷积核大小 = 3,步长 = 2
    第1层和第2层的步长积是 2×2=4。
    RF3=7+(3−1)×4=15

通过以上计算可以看出,随着网络深度的增加,感受野也在不断扩大,从而能够捕捉到更大范围的上下文信息。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号