深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。
每一种通道代表着图像某一方面的特征信息。对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
长城为什么建两层堡垒?烽火台有何作用?万里长城有什么意义?
解锁"国风热"的时代密码
特别好吃的凉拌海带丝的做法
海带豆腐汤:简单美味家常滋补佳品,为餐桌增添健康与温暖
3亿人的养老挑战:“人财物”如何做好准备
宝宝玩具选择指南
来,让你1分钟搞懂精细动作和大运动
山东拜年磕头:千年习俗里的文化传承
大年初一地道拜年语,你学会了吗?
“一唱三叹”:从《诗经》到现代歌曲的音乐传承
从珠海航展看未来空中技术前沿
信丰县亲子打米果:传统文化的生动课堂
春节必备:正宗黄元米果详细教程
GTA5超跑对决:佩嘉西T20 vs 死神,谁才是最佳选择?
佩嘉西T20 vs 兰博基尼Sian:谁是GTA 5中的速度之王?
RCEP红利下,榴莲成中国果盘新宠
春节临近,如何安全选购进口水果?
爆香猪心的做法是什么?如何在家轻松制作?
元旦高铁选座攻略:一等座还是商务座?
猪八戒的身世之谜:黎山老母之子的传说与真相
蛇年创意新年祝福短视频制作指南
新年祝福语大比拼:谁是最有创意的?
《熊出没》:从“中国味现代性”到艺术风格大变脸
GTA Online UFO商战:团队协作新高度!
GTA Online新手必看:快速上手秘籍
GTA5洛圣都:那些奇葩玩法大揭秘!
远归客栈:一家藏在街子古镇的“诗与远方”
叶罗丽PK艾莎:东西方动画公主的对决
春节拜年新花样:中英文祝福语大比拼
富兰克林教你玩转《侠盗猎车手5》