深度学习中的Channel,通道数是什么?
创作时间:
作者:
@小白创作中心
深度学习中的Channel,通道数是什么?
引用
CSDN
1.
https://blog.csdn.net/a287100886/article/details/140216659
在跑深度学习代码的过程中,经常遇到的一个报错是:模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是:torch.size([16,3,24,24])。这四个参数的含义如下:
- 16:批量大小(Batch Size)表示张量中包含的图像数量,每次迭代(或称为一个batch)处理16张图片。
- 3:通道数(Channels)在彩色图像中,代表RGB三个颜色通道。对于灰度图像,这个数字将是1。
- 24:高度(Height)表示每张图片的高度,单位是像素,这里是24个像素。
- 24:宽度(Width)这表示每张图片的宽度,单位也是像素,这里同样是24个像素。
模型只有在各阶段张量均匹配了才能跑通。其中,第二个参数即是channel。
一般来说,常见的图像如灰度图,彩色图,他们的通道数分别为1和3,但为什么在深度学习模型训练时会出现如torch.size([32,64,224,224]),其中channel = 64之类非常多通道数的情况呢?
这里就和滤波器和卷积核这两个结构相关了。从上图也可以看到,在通道数为1的情况下,可以认为滤波器和卷积核是等价的;但当通道数为3时,滤波器和通道数有区别。
此外,输出通道多少,其实和模型设定的卷积核数量有关,只要设置的合理,理论上64通道,128通道都是可以实现的,此时,这里的通道含义也就不能完全按照传统的“RGB”这样的三色通道来理解了。
这里每一个卷积核都能提取特定通道上特定的特征信息,最后将提取出的特征信息整合,得到对应数量的特征图,得到输出通道。每一种通道代表着图像某一方面的特征信息。
对于网络的下一层,输入通道数就是网络上一层的输出通道数。
下面这张图也很好的描述了卷积过程中,卷积核/滤波器的作用,以及维度的变化过程:
热门推荐
购房能力评估技巧及预算要点
Hotmail和Outlook有何关联与区别?关联区别剖析
新手学炒菜基本功:从食材准备到调味品搭配
一键登录的手机号验证如何保护用户隐私
成都国家现代农业产业科技创新中心2024年十大亮点工作
多发淋巴结是什么意思?一文读懂其定义、原因及注意事项
国内焦虑胡思乱想怎么治疗
如何在Markdown Online编辑器中高效排版和格式化文档?
中超夺冠悬念揭晓?考验双雄 武磊伤病或影响走势
北京汽车摇号如何查询?
辛弃疾《清平乐·村居》诗意赏析
软件开发后如何测试验证
中国古代史的时间线与重要事件
警惕!小学生电话手表被借走,电话卡竟被用来实施诈骗
老北京豆汁儿:百年古韵,酸香记忆,京城小吃的独特风味
离职工资补偿怎么算法
构建胰腺癌术后复发预测模型:基于SEER数据库
明代成化朝瓷器的发展特征及鉴定要点
职场中的"拒绝文化":如何优雅地说"不"
AI赋能网络安全带来“双刃剑”,专家:还需解决自身安全隐忧
Web服务器如何获取用户IP地址:技术详解与应用场景
指甲月牙和身体健康有关系?一文读懂月牙的6个真相!
在NAS上轻松部署Home Assistant,实现全方位智能家居管理
自学画画软件哪个好?板绘需要什么工具?
如何利用RFID技术打造出高效可用的被装物资仓储管理系统?
唐诗巅峰三巨匠:探寻盛唐文学的璀璨星河
八字合婚日柱相生与年柱日柱相冲
如何调整投资策略?这些策略的效果如何?
汽车故障码和故障图标对照表大全,还有哪些你还不知道的
全国首张处方落地!依普利酮为高血压管理带来全新治疗选择