问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

1*1的卷积核 降维和升维的妙用

创作时间:
作者:
@小白创作中心

1*1的卷积核 降维和升维的妙用

引用
CSDN
1.
https://blog.csdn.net/kris_paul/article/details/118766639

在卷积神经网络中,1x1的卷积核虽然看似简单,但却在降维和升维方面发挥着重要作用。本文将通过具体的例子和计算,深入探讨1x1卷积核在卷积神经网络中的应用及其优势。

卷积核的数量问题

一张图片可能包含多种特征,因此需要学习多个卷积核来提取这些特征。对于灰度图像,图像为2D,例如一个5×5的图像使用3×3的卷积核进行卷积,步长为1,会生成一个3×3的矩阵。如果有2组卷积核对图像进行卷积,就会生成2个3×3的矩阵,这被称为通道。

对于RGB图像,图像为3维。若要提取2个特征,可以设置2个3维卷积核进行特征提取,提取结果为2通道的feature map,2个通道互相独立,代表着不同卷积核提取的不同特征。

参数数量的计算

进行卷积处理的卷积通道数默认和输入图像的通道数相等。例如,如果输入图像维度为256,那么进行特征提取的卷积核也默认是256维。若设定输出64个特征,那么就一共有64个256维的卷积核用来提取特征,即提取特征的输出通道数为64,输出64个feature map。

具体计算过程如下:

  • 第一个1x1的卷积把256维channel降到64维
  • 然后在最后通过1x1卷积恢复
  • 参数数目:1x1x256x64 + 3x3x64x64 + 1x1x64x256 = 69632
  • 全连接层(左图)就是两个3x3x256的卷积,参数数目: 3x3x256x256x2 = 1179648
  • 差了16.94倍

增加跨通道信息的交互和增加非线性

如果卷积的输出输入都只是一个平面,那么1x1卷积核并没有什么意义,它是完全不考虑像素与周边其他像素关系。但卷积的输出输入是长方体,所以1x1卷积实际上是对每个像素点,在不同的channels上进行线性组合(信息整合),且保留了图片的原有平面结构,调控depth,从而完成升维或降维的功能。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号