问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

目标检测——YOLOv7算法解读

创作时间:
作者:
@小白创作中心

目标检测——YOLOv7算法解读

引用
CSDN
1.
https://blog.csdn.net/lishanlu136/article/details/138168568

YOLOv7是目标检测领域的重要算法,由Chien-Yao Wang等人于2022年提出。该算法在不增加推理成本的情况下,通过设计可训练的bag-of-freebies和优化网络结构,实现了检测精度的显著提升。本文将详细介绍YOLOv7的算法原理、网络结构改进以及实验结果。

1、算法概述

YOLOv7是YOLOv4和YOLOR的同一个作者团队开发的最新版本。一个有趣的现象是,按照arxiv上显示的时间,YOLOv7发布的时间比YOLOv6更早。这可能意味着YOLOv7在算法设计和优化上具有独特的优势。

YOLOv7的主要贡献包括:

  1. 设计了几种可训练的bag-of-freebies,使实时检测器可以在不提高推理成本的情况下大大提高检测精度;
  2. 针对目标检测中模块重参化和动态标签分配策略提出了新的解决方案;
  3. 提出了"扩展"和"复合缩放"方法,可以更高效地利用参数和计算量,同时减少40%的参数和50%的计算量。

2、YOLOv7细节

2.1 YOLOv7的网络结构改进

扩展高效层聚合网络(E-ELAN, Extended efficient layer aggregation network)

ELAN结构通过控制最短最长的梯度路径,允许深度模型更有效地学习和收敛。YOLOv7基于ELAN结构提出的E-ELAN适用于具有无限堆叠计算块的模型。E-ELAN通过打乱和合并(shuffling and merging)基数来结合不同groups的特征,在不破坏原有梯度路径的情况下增强网络的学习能力。

基于连接的模型的模型缩放

模型缩放的主要目的是调整模型的某些属性,生成不同尺度的模型,以满足不同推理速度的需要。YOLOv7的网络结构是基于串联的结构,其中标准缩放技术(如深度缩放)会导致过渡层的输入通道和输出通道之间的比率变化,从而导致模型的硬件使用减少。YOLOv7提出了一种新的基于串联的模型缩放策略,该策略将块的深度和宽度以相同的因子进行缩放,以保持模型的最优结构。

2.2 赠品礼包(bag-of-freebies)

卷积重参数化

尽管RepConv在VGG上取得了优异的性能,但将它直接应用于ResNet和DenseNet或其他网络架构时,它的精度会显著降低。作者使用梯度传播路径来分析不同的重参化模块应该和哪些网络搭配使用。通过分析RepConv与不同架构的组合以及产生的性能,作者发现RepConv中的identity破坏了ResNet中的残差结构和DenseNet中的跨层连接,这为不同的特征图提供了梯度的多样性。基于这个原因,作者使用没有identity连接的RepConv结构。

辅助训练模块

使用引导头(lead head)预测作为指导来生成由粗到细的层次标签,这些标签分别用于辅助头(auxiliary head)和引导头的学习。其结构如下:

引导头指导的标签分配器主要是根据引导头的预测结果和gt真实框进行计算,并通过优化过程生成软标签。这些软标签将作为辅助头和引导头的目标训练模型。这点可以被看作是一种广义残差学习。通过让较浅的辅助头直接学习引导头已经学习过的信息,引导头将更能专注于学习尚未学习的剩余信息。

其他bag-of-freebies

  • Batch normalization in conv-bn-activation:目的是在推理阶段将批归一化的均值和方差整合到卷积层的偏差和权重中。
  • Implicit knowledge:YOLOR中的隐式知识可以在推理阶段将计算值简化为向量。这个向量可以与前一层或后一层卷积层的偏差和权重相结合。
  • Exponential moving average:作者使用 EMA 模型作为最终的推理模型。

3、实验

实验设置

所有的实验都没有使用预训练的模型,用COCO2017训练集训练,用其验证集选择最佳模型,用COCO2017测试集评估模型性能。作者针对边缘端GPU、normal GPU和云端GPU分别设计了三种模型YOLOv7-tiny、YOLOv7和YOLOv7-W6。同时,我们还利用基本模型对不同的业务需求进行模型缩放,得到不同类型的模型。例如,通过对YOLOv7的neck部分缩放得到YOLOv7-X;对YOLOv7-W6进行缩放得到YOLOv7-E6和YOLOv7-D6。

BaseLines模型比较

以YOLOv4和YOLOR模型为基准进行比较。

与现如今其他检测算法对比

消融实验:略

参考文献

[1] Terven J, Cordova-Esparza D. A comprehensive review of YOLO: From YOLOv1 and beyond. arXiv 2023[J]. arXiv preprint arXiv:2304.00501

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号