问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

神经网络之卷积篇:详解池化层(Pooling layers)

创作时间:
作者:
@小白创作中心

神经网络之卷积篇:详解池化层(Pooling layers)

引用
1
来源
1.
https://www.cnblogs.com/oten/p/18395915

池化层是卷积神经网络中的重要组成部分,它通过减少特征图的尺寸来降低计算复杂度,同时保持重要的特征信息。本文将详细介绍池化层的工作原理,包括最大池化和平均池化两种主要类型,并通过具体示例帮助读者理解其在实际应用中的作用。

池化层的工作原理

池化层的主要功能是缩减模型的大小,提高计算速度,同时保持所提取特征的鲁棒性。我们先通过一个具体的例子来理解池化层的工作过程。

假设输入是一个4×4矩阵,使用最大池化(max pooling)类型,池化窗口是一个2×2矩阵。执行过程如下:

将4×4的输入矩阵划分为不同的区域,每个区域用不同颜色标记。对于2×2的输出矩阵,每个元素都是其对应颜色区域中的最大元素值。具体来说:

  • 左上区域的最大值是9
  • 右上区域的最大元素值是2
  • 左下区域的最大值是6
  • 右下区域的最大值是3

这个过程就像是应用了一个规模为2的过滤器,因为选用的是2×2区域,步幅是2,这些就是最大池化的超参数。

从直观上理解,可以把这个4×4输入看作是某些特征的集合。数字越大意味着可能探测到了某些特定的特征,比如左上象限可能表示一个垂直边缘、一只眼睛,或是大家害怕遇到的CAP特征。最大池化的作用就是只要在任何一个象限内提取到某个特征,它都会保留在最大化的池化输出里。

最大池化的参数

最大池化的主要参数包括:

  • 过滤器大小 (f):通常为2或3
  • 步幅 (s):通常为2
  • 填充 (p):通常为0

计算输出大小的公式与卷积层相同:(\frac{n + 2p - f}{s} + 1)。

三维输入的最大池化

如果输入是三维的,比如5×5×2,那么输出也是三维的,即3×3×2。计算方法是对每个通道分别执行最大池化计算。

平均池化

除了最大池化,还有一种不太常用的池化类型是平均池化。它不是选择每个过滤器区域的最大值,而是计算平均值。例如:

紫色区域的平均值是3.75,后面依次是1.25、4和2。平均池化的参数 (f) 和 (s) 可以根据需要设置。

总结

池化层的主要参数包括过滤器大小 (f) 和步幅 (s),常用的参数值为 (f=2),(s=2),这相当于将高度和宽度缩减一半。最大池化比平均池化更常用,尤其是在深度较浅的神经网络中。最大池化的一个重要特点是它没有需要学习的参数,只有超参数需要设置。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号