深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。每一种通道代表着图像某一方面的特征信息。
对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
2025年征兵体检标准全解析:从身高体重到视力要求,一文读懂体检细则
大学生何时参军最合适——探讨最佳入伍时间与学业职业发展平衡
培养独立自信的下一代:英国家长的7大教育秘诀
许书典家族慈善捐赠破10亿,持续助力家乡公益事业
南阳吴氏针法:300年传承创新,惠及70国患者
ABS系统:新手司机的救命神器?
定期检查车辆,远离交通事故
古力娜扎主演动作片《传说》,开启实力派转型新篇章
技校毕业生可以升学吗?该怎么准备?
《出入平安》国庆上映,古力娜扎演绎唐山大地震中的爱
英国文学的多样性与魅力
怎么学好英国文学
职高学生如何考取本科学校?五种主要升学途径详解
来四川,啥特产值得带?本地人推荐这10种,物美价廉,送礼不丢面
厦门以市场需求牵引产业创新
C++从入门到高手:三阶段学习路线与实战项目指南
高血糖健康知识宣教课件
血糖升高解析:原因、预防策略与日常调理指南
从鼎盛到流散:四大家族的民国权力兴衰史
古力娜扎为博彩游戏代言,引发社会热议
北伐为何难?地理经济制约下的历史困局
地理不利、经济掣肘:中国北伐为何九成以上以失败告终
解密朱元璋临终喊话:为何三唤朱棣
朱棣北伐真相:五次亲征为何难掩洪武北伐辉煌
太平天国北伐:战略决策失误的三大教训
三步专业清洁+四种小妙招,轻松去除汽车空调异味
甲流高发期,选购车载空气净化器看这四点
汽车发动机罩子拆卸方法:螺丝、卡扣、铰链三种固定方式详解
汽车发动机科普:如何影响动力输出与油耗
山楂茶饮指南:五种搭配方案改善消化心血管