深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。
每一种通道代表着图像某一方面的特征信息。对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
陶渊明《饮酒·其五》:心远地自偏,道出人生真谛
开会两个人座位左右哪边为大
牙周炎刷什么牙膏好
春节客流指数级增长,解码“民间小故宫”牟氏庄园走红密码
Excel下拉列表选择数据源的多种方法与实战技巧
中医经典《伤寒论》:解码伤寒杂病的智慧与实用价值
“社交与竞技并存”的健身游戏在促进健康社交
孩子缺乏学习动力该如何教育
如何分析具有 10 倍潜力的小盘股
房产继承全攻略:放弃继承与父母房产继承办理指南
实锤?日本人的祖先源自我国?基因对比显示就在河北和河南
如何了解公积金缴纳的相关事宜?这类事宜有哪些要点?
2025年人工智能产业十大趋势:技术创新与应用落地并举
如何通过期权策略应对市场波动?这些策略在不同市场环境下的表现如何?
一天吃几个核桃最佳
如何倍速看云盘文件内容
生产计划管理系统是如何运作的?
胃息肉,会变成胃癌吗?哪些需要切除?有没有办法预防?——8大问题,一文打尽
青春期男孩长高方法
从小学会做家务 培养孩子的责任感和独立性
产教融合,破解就业结构性矛盾!
香港:1179万毕业生就业压力下的新避风港
牟氏庄园:探秘中国最大地主庄园的历史与文化之旅
玻璃器皿能熬中药吗?使用时需要注意这些事项
专家分析天价彩礼背后的原因,社会现象下的深层次解读
Excel编制物料清单表的详细步骤和技巧
《管理控制:运用四大杠杆驱动战略执行》:助力企业实现动态平衡
制作手机壁纸的指南与技巧:从零开始成为设计大师!
烫伤可以用红外线烤灯吗
【科普营养】关于茶底的冷知识:奶茶里的咖啡因有多高?