深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。每一种通道代表着图像某一方面的特征信息。
对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
3D建模在游戏行业的演变和影响
Excel条件格式公式:对比两组数据的实用技巧
如何找到低估值股票以优化投资决策?这些分析方法有哪些实际应用?
唐代安西都护府设立的历史意义是什么?
重塑温度传感器:动态特性深度剖析与测试方法创新
国际快递清关失败后如何处理(货主货代请注意)
探秘内蒙古各地博物馆“之最”
1800马力发动机,99A式坦克,全面大改,到底有多强悍?
研究证实:高强度、碎片化运动,健康效果更好
缅甸7.9级地震:中国老百姓最关心的三个问题
做空A股是什么意思?如何理解做空A股的操作方式及风险?
如何写歌:七步创作法
黄瓜叶子生锈:原因、症状与防治方法
中医理论:心主血脉的科学解读
输尿管狭窄:沉默的"拦路虎",别让它堵了你的健康!
Excel中调整图片透明度的完整指南
职场礼仪的具体要求:如何在职业场合展现专业素养与尊重
成都加速度:人城产深度融合,驶入轨道城市高质量发展快车道
如何判断电动自行车用锂电池是否健康?工信部发布最新文件
螃蟹的科普:从科属分类到种类区分
最适合夏天吃的凉拌黄瓜 8种吃法根本停不下来
手机Wi-Fi设置与故障排除指南
洗衣机水位怎么调最合适(控制水洗机水位的方法)
汽车玻璃水的作用和用法
等额本息、等额本金、先息后本,利息相差几百万?
生物物理所揭示多巴胺再摄取分子机制和低成瘾风险药物作用机制
南京大学计算机科学与技术专业深度解析
如何通过处理违章?违章处理有哪些便捷方法?
如何证明意外摔伤情况?证明后的结果如何应用?
上海保租房申请指南:从入口到签约全流程详解