深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。每一种通道代表着图像某一方面的特征信息。
对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
揭秘生辰八字:从年月日时到命运密码
生辰八字里的健康密码:从天干地支到五行调理
文物界“论资排辈”的科学方法:说说碳14测年
神秘的世界:什么是碳-14测年?
蓬莱三大景点:蓬莱阁、三仙山、八仙过海,美到不需要滤镜!
揭秘乌克兰战场上的朝鲜“火鸟-4”导弹之谜
火鸟-6亮相俄乌战场:朝鲜武器成焦点
柠檬在料理中的应用:掌握烹饪技巧,完整保留营养
文物科技鉴定漫议
碳十四测年技术在古建筑年代测定中的应用:以山西万荣稷王庙大殿为例
驾驶证提前多久换证?这个时间节点要牢记,过期可不能再继续开车
老年人免费乘车取消了?老年公交卡“新规”,事关每个人,早了解
三清山:当红叶“疯”了的时候
意外受傷指甲翻起怎麼辦?專家教您正確處理與注意事項
双十一来了!用NGINX应对流量高峰
房产继承应当如何公证
子女离婚,父母起诉要求返还出资,应怎么准备证据?
T34-85坦克:朝鲜军队的秘密武器
原来贵州人秋天都在赏花吗?真·绝美!
如何选择地板胶?地板胶的使用寿命和注意事项
红酒瓶底的凹陷:设计背后的多重作用
红酒瓶底凹槽的秘密:不只是为了美观
俄乌冲突中的巡飞弹:智能化战争的先驱
永宁门:西安古城墙上的历史见证者
西安文旅转型升级:从“流量”到“留量”的探索之路
《红酒瓶大揭秘》看瓶身挑好酒!教你轻松辨別產區和品質
赡养老人如何保留证据?法律这样规定
瓦西里大尉的空中手术刀:巴伦支海撞机事件始末
进口葡萄酒是一定要加贴中文背标吗?
离婚不离家,居住权如何行使?