深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。
每一种通道代表着图像某一方面的特征信息。对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
1980版五元人民币收藏价值几何?品相冠号是关键
梦境解析:揭秘你的心理状态
“八格牙路”:一个词汇背后的战争记忆
八格牙路:一个词汇背后的中日文化探秘
职场妈妈的时间管理秘诀:14个实用技巧打造工作生活平衡
解密人民币“首发冠”:冠号收藏价值最高的品类
1990版2元券收藏指南:绿幽灵冠号最高涨至百元
市场运营赋能文化传承 青州博物馆兴起研学热
山东人考公上岸,为什么先要去这个县级博物馆拜一拜?
5种沙发背景墙设计:从收纳到装饰,打造客厅新亮点
从收纳到隔断:五种实用沙发背景墙设计方案
20款沙发背景墙设计案例,总有一款适合你的家居风格
四步化解家庭矛盾,专家教你重建和谐关系
和谐家庭关系是心理健康基石,不良关系可致抑郁自伤
自制土豆面膜:美白淡斑的天然秘诀
土豆面膜真的能美白吗?一文揭秘土豆面膜的美白真相
红薯面膜DIY:美白保湿新宠
炖鸭肉秘方大公开:白蔻辛夷砂仁桂枝
炖鸭肉香料大揭秘:白蔻、辛夷、砂仁、桂枝的秘密
炖鸭肉的调料搭配与烹饪技巧全攻略
许雯雯家庭幸福经:情感支持与理性规划并重
67年前,这群工程师用算盘建成了“万里长江第一桥”
武汉双子星:长江大桥与黄鹤楼游览攻略
湿气重不仅伤身还伤心,中西医教你这样应对
立冬祛湿正当时:四食材加一泡脚法
湿气重的调理方案:4种食材搭配4款汤品,轻松改善体内湿气
中医专家推荐:六种食材搭配养生法,轻松应对冬季湿气
蜈支洲岛游玩项目推荐:海上、陆地、海底全方位体验
降压用药知识讲座
没有开瓶器怎么办?多种实用红酒开瓶方法详解