深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。每一种通道代表着图像某一方面的特征信息。
对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
防控“小胖墩”不能只靠每天开设体育课
2025年人工智能在安全监控领域应用
观点丨左美云:数字技术适老化助推老年友好社会建设
2024上半年玉米市场回顾及下半年展望
【家居搭配】现代简约家居风格如何搭配 简约不等于简单
芯科普 | 一文了解时序与频率对内存性能的影响
如何理解城市中的居住环境并做出合适的选择?这种选择需要考虑哪些方面?
虾皮的营养价值与食用禁忌
“洼地”变“高地”——解码合肥经开区教育优质均衡发展之路
英语学习:关于简·奥斯汀你所不知道的6件事
从“Soccer”到全球现象:足球运动的多重维度
政策预期对整体股市情绪有较强支撑,A500ETF基金盘中成交额已破10亿元
个人信用报告逾期记录影响贷款吗?如何处理逾期信用报告以获得顺利贷款?
体育生高考能加多少分怎么加的?2024高考体育加分项目一览表
塔罗牌"恋人"正位:解读和谐与选择中的人格特质
换档与踌躇,直播电商重定位的一年
以路为笔绘乡村振兴新图景——青海大通县农村公路建设助力乡村振兴纪实
保险理赔残值纠纷判例的法律解析与实务分析
新疆的雪花开了·冬日新美食丨吃碗新疆“鱼羊鲜” 太有口福了
8本已完结主角是魔法师的西幻小说,神秘冒险之旅,谱写不朽史诗
宝宝脱水的症状有哪些
海外直播带货的现状与挑战:如何打破文化差异和市场壁垒
中国煤科煤科院煤直接液化实验室:煤炭工业发展重要印记和重要见证
羽毛球拍正确握法带图(在家如何练习羽毛球握拍架拍)
基于政策视角的中国温泉康养未来发展方向与趋势分析
无线能量传输技术,未来能否实现远距离供电?
《周易》可以预判股市吗?探寻股市预测的古老奥秘
处理器性能的演变:从单核到多核的转变!
运动减压迎高考,专家教你这样做→
老年人营养不良的预防