YOLOV8模型架构轻量化:极致降低参数量
创作时间:
作者:
@小白创作中心
YOLOV8模型架构轻量化:极致降低参数量
引用
1
来源
1.
https://cloud.tencent.com/developer/article/2423064
模型轻量化加速是深度学习领域的重要研究方向,旨在减小模型的体积和计算复杂度,从而提高在资源受限设备上的运行效率。本文将从模型结构设计的角度,以YOLOV8为例,探讨如何在保持模型性能稳定不变的前提下,实现参数量的极致压缩。
一、设计思路
从模型结构看,YOLOV8主要由两个大的模块构成:backbone和head模块。因此,降低参数量可以从这两个模块入手。
二、backbone模块轻量化参数
CSPPC替换c2f卷积块
论文地址:https://arxiv.org/pdf/2303.03667.pdf
如上图所示,其中利用了PConv模块大量降低参数量。PConv(部分卷积)的基本原理是利用特征图的冗余,从而减少计算和内存访问。具体来说,PConv 只在输入通道的一部分上应用常规卷积进行空间特征提取,而保留剩余通道不变。这种设计的优势在于:
- 减少计算复杂度:PConv 通过在较少的通道上进行计算,降低了浮点操作(FLOPs)的数量。例如,如果部分率设置为 1/4,则PConv的计算量只有常规卷积的 1/16.
- 降低内存访问:与常规卷积相比,PConv减少了内存访问量,这对于输入输出(/0)受限的设备尤其有益
- 保持特征信息流:尽管只对输入通道的一部分进行计算,但保留的通道在后续的逐点卷积(PWConv)层中仍然有用,允许特征信息在所有通道中流动
Down_wt替换backbone下采样模块
上图是ADown,其是在202402021最新发布的yolov9模型结构中提出的
检测头轻量化参数
论文地址:https://arxiv.org/pdf/2306.15988.pdf
主要改进机制:
- 底层特征融合: AFPN通过引入底层特征的逐步融合,首先融合底层特征,接着深层特征,最后整合顶层特征。这种层级融合的方式有助于更好地利用不同层次的语义信息,提高检测性能。
- 自适应空间融合;引入自适应空间融合机制(ASFF),在多级特征融合过程中引入变化的空间权重,加强关键级别的重要性,同时抑制来自不同对象的矛盾信息的影响。这有助于提高检测性能,尤其在处理矛盾信息时更为有效。
- 底层特征对齐: AFPN采用渐近融合的思想,使得不同层次的特征在融合过程中逐渐接近,减小它们之间的语义差距。通过底层特征的逐步整合,提高了特征融合的效果,使得模型更能理解和利用不同层次的信息。
个人总结:AFPN的灵感就像是搭积木一样,它不是一下子把所有的积木都放到一起,而是逐步地将不同层次的积木慢慢整合在一起。这样一来,我们可以更好地理解和利用每一层次的积木,从而构建一个更牢固的目标检测系统。同时,引入了一种智能的机制,能够根据不同情况调整注意力,更好地处理矛盾信息。
模型结构轻量化参数对比
原yolov8参数:3011043
轻量化后参数:1436977
通过以上模块的替换使得模型参数降低至原来的一半不到,且精度不变,这是通过剪枝、蒸馏都没办到的
热门推荐
侵华日军第七三一部队遗址参观全攻略
“遇见更好的自己”妇女成长小组 | 社工案例计划
拍摄一张精致的证件照,提升个人形象
精致生活的艺术:简约而不简单
畅游两地风情:青岛至重庆跨省深度旅游指南
不能灭火的灭火器!非标品比标品价格低一半,部分产品没有检测报告
解析汽车充电桩主板的常见问题|主板故障表现、原因及应对方法
解析汽车充电桩主板的常见问题|主板故障表现、原因及应对方法
南京必打卡:总统府&夫子庙秦淮风光带
跟着导游小田玩转南京:冬季三日游完全攻略
冬日南京三日游:邂逅雪景之美
南京三日游:打卡总统府与夫子庙!
考勤核算工作用日语怎么说?
拉黑和屏蔽朋友圈的区别
2024广州中考分数线出炉!如何保持良好心态?
“老头乐”退场倒计时:安全与便利的两难抉择
电动代步车选购指南:资质、配置与品牌全方位解析
李白的梦境世界:从《梦游天姥吟留别》看诗人的精神追求
庄子与弗洛伊德:解密梦境本质
宁都是个啥?“客家祖地”了解一下!
揭秘中国古代天文学:尾宿和箕宿的奥秘
谢雨欣人生起伏录:从花街娇唱到重拾幸福的旅程
济南孙村片区和王舍人片区规划公示,济南起步区房价会如何变化?
济南孙村片区和王舍人片区规划公示,新地块开发会吸引哪些投资?
翻车后如何确保安全并进行紧急处理?这种紧急情况有哪些常见应对措施?
2025年新型储能十大发展趋势
铅酸电池价格更便宜,为啥外卖小哥大多选锂电池?今天才知道答案
全球固态电池商业化提速
家电清洗:守护家庭健康,从细节开始
电气线路老化、出现安全隐患谁来管?这篇文章算是说明白了!