深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。
每一种通道代表着图像某一方面的特征信息。对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
电脑压缩包怎么设置密码?3种常用工具详细教程
3个月宝宝睡眠时间多少才正常?3月大睡眠时长、安排与夜醒对策
揭秘肠镜检查:那些不为人知的“小插曲”与“智慧应对”
防止CSRF攻击
中国十大名茶:探索中国茶文化的精髓与瑰宝
交互式内容提升用户参与度方案
如何理解公积金房屋贷款的提前还款政策?这些政策有哪些财务和法律影响?
深入解析“carry”一词的发音、用法及其丰富含义与应用场景
苯中毒能否自愈?快速识别与护理
太阳花怎么养才会爆盆
男生瓜子脸面相(男生瓜子脸留什么发型好看)
孟加拉赤金和黄金的区别
食品餐饮业的库存管理:建立适合各类餐饮服务的食材清单
广东省委书记、省长与AI、机器人企业高频互动,释放强烈信号
前端动态表单如何实现
《人间草木》| 万物有时,寄以风华
Intel及AMD CPU型号后面的神秘代号代表什么?
中国学者研究:MRI参数预测中央腰椎管狭窄合并神经根冗余
银行自助设备的维护周期是多久?
重塑实体书店的未来:打造全新文化地标的新契机
高度近视的人为什么不能献血
Windows 10游戏闪屏怎么办?5个实用解决方案帮你轻松应对
药学与制药工程的区别
药学与制药工程的区别
四川茶叶种类繁多,如何选择适合自己口味的茶叶?
坐姿的艺术:不同场合下的正确坐姿指南
怎样让新栽的树状月季快速生根?
《嫦娥奔月》教学设计:粤教版六年级上册综合实践活动课程
尿常规检查前的三大忌
四川理塘旅游攻略:利用丁真营销提升景区知名度