深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。
每一种通道代表着图像某一方面的特征信息。对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
新西兰博士留学全攻略:从申请到移民
N股市场投资策略与风险分析指南
临床前沿 | 数字健康干预对儿童术后康复的效果如何?
毛囊炎日常护理需要注意哪些?
如何减少自我内耗?
大陆反派演员,演技魅力与角色深度探究
解读《哪吒之魔童闹海》:传统服饰元素在现代美学中的觉醒
喜庆≠铺张 春节氛围营造如何“经济适用”?各地给出自家“方案”
如何保养身体:全面的保养指南
房颤射频消融术术后护理指南
采购定制办公家具:提升企业形象与员工满意度的重要选择
免疫系统检查项目
巴厘岛旅游攻略:景点、美食与文化体验全解析
为什么狗狗开心了会原地转圈?揭秘这一有趣行为背后的科学原理
探索《原神》:揭秘梦境与现实的神秘切换之道
青平:翻拍经典名著需有“度”也有“量”
“多元化”的一心堂,风险潜藏
对赌协议的法律风险及防范措施研究
探秘山城魅力:临沂至重庆自驾之旅全攻略
航空托运费用怎么计算
6个因素最容易患口腔溃疡,早期做好3类预防,防止复发
电影院也“斜杠”,不妨乐观看待
全面解析私域会员运营的综合策略
关节镜手术后注意事项
八字重:命理学的深层含义
手机蓝牙如何单元测试
川菜文化:从历史渊源到饮食哲学的全面解读
利物浦与范迪克有望达成续约协议
20寸行李箱尺寸能否登机:航空公司规定一览
生肖兔和生肖鸡相配吗?属兔人渴望的爱情是怎样的?