深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。
每一种通道代表着图像某一方面的特征信息。对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
蜀汉都城成都:历史与现代的交汇之地
春季干眼症滴眼液怎么选?|贤医健康说
当我把情绪管理融入课堂,学生的进步出人意料(附各学段案例)
含Omega-3的食物排行榜:揭秘五大富含Omega-3的食物
1-10楼的英文表达:序数词与基数词的使用指南
全陶瓷、混合陶瓷、不锈钢、轴承钢...轴承材质如何选择?
视听资料指通过声音、图像等形式记录案件事实的资料
Android虚拟机如何开启定位
腾讯报告显示:历史文化游正成江苏文旅新风尚
蜂王浆的功好处与正确食用方法:全面解析
人工智能在创意产业的应用:未来创作的革命性突破!
破产程序说明是什么
切与割有什么区别?到底什么是切线?切点真的是一个点吗?
开封结婚风俗:传统婚俗里的文化传承
手机如何支持API?从基础到进阶的全面指南
菊花茶功效与禁忌:什么时候喝最好?怎么泡最养生?
孙俪、罗晋《乌云之上》再携手,剧情看点多,口碑为何两极分化?
电影高压监狱:深度解析与幕后揭秘
海洋自然地理概况:四大洋的特点与资源分布
如何在股票交易中实现稳定盈利?这些盈利策略的可持续性如何?
咽喉炎高发引关注,专家揭示主要诱因与预防措施
电动剃须刀使用指南:从准备到剃须后的护肤全攻略
新相机必改的9项实用设置,让拍摄效果更上一层楼
揭秘电话骚扰:为何骚扰者不断出现及应对策略
《伤寒论》条文第十五的解释及其法律适用分析
电脑配置升级无预算怎么办?如何优化现有配置?
深圳私立学校指南:六所优质学校的特色与选择建议
传统文化|中国传统婚嫁习俗
舌头疼痛的原因是什么?
厨房新手指南:五谷杂粮的基础烹调方法