问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

目标检测新突破:YOLOv8核心技术详解

创作时间:
作者:
@小白创作中心

目标检测新突破:YOLOv8核心技术详解

引用
CSDN
1.
https://blog.csdn.net/hhl_work/article/details/141321146

YOLOv8作为新一代目标检测算法,通过引入注意力机制、卷积层优化、主干网络改进等创新技术,在保持高速度的同时显著提升了检测精度。本文将详细介绍YOLOv8的核心原理及其在多个基准数据集上的卓越表现。

YOLOv8的主要改进

YOLOv8相较于YOLOv7引入了一系列改进,这些改进主要集中在以下几个方面:

  • 注意力机制:YOLOv8采用了多种注意力机制来增强模型的特征提取能力,如ECA(Efficient Channel Attention)、GAM(Global Attention Mechanism)等,这些注意力机制有助于模型更好地关注图像中的关键信息,提高检测精度。

  • 卷积层优化:YOLOv8在卷积层上进行了创新,例如使用可变形卷积(Deformable Convolution)和动态卷积(Dynamic Convolution)等技术,这些技术可以提高模型对不同形状和大小目标的适应性。

  • 主干网络改进:YOLOv8的主干网络也进行了优化,如使用MobileNetV4等轻量化网络结构,以减少模型的计算量并提高检测速度。

  • 特征融合模块:YOLOv8引入了新的或改进的特征融合模块,例如BiFPN(Bidirectional Feature Pyramid Network)和AFPN(Asynchronous Feature Pyramid Network),这些模块有助于提高模型对多尺度目标的检测能力。

  • 检测头改进:YOLOv8在检测头也进行了创新,例如使用RT-DETR(Routing Transformer for Detection)等技术,这些技术可以改善模型在不同尺寸目标上的检测效果。

  • 损失函数和IoU优化:YOLOv8对损失函数和IoU(Intersection over Union)计算方法进行了改进,以提高模型的回归精度和检测性能。

  • NMS和其他模块的改进:YOLOv8还对非极大值抑制(Non-Maximum Suppression, NMS)等其他模块进行了优化,以提高检测的准确性和效率。

  • 轻量化设计:YOLOv8注重模型的轻量化设计,使其更适合在资源受限的设备上运行,例如使用VanillaNet等极简主义网络架构。

  • 多尺度检测能力:YOLOv8通过改进,如使用SPD-Conv(Spatial Pyramid Depthwise Convolution)等技术,增强了对小目标和多尺度目标的检测能力。

  • 优化器改进:YOLOv8还可能采用了新的优化器,如Lion等,以进一步提高训练效率和模型性能。

YOLOv8的算法概述

YOLOv8的结构基本上分为两个关键部分:骨干网络和检测头。骨干网的部分任务是从大量尺度的输入图像中提取各种丰富的特征。另一方面,检测头的任务是合并这些特征,并为边界框创建不同的高质量预测。

骨干网

YOLOv8的骨干网基于高效率网络(EfficientNet),这是一种最先进的神经网络架构,可以在各种计算机视觉任务上实现高熟练度和高性能。EfficientNet基于复合扩展的思想,可以以平衡的方式扩展网络宽度、深度和确定度。YOLOv8采用了EfficientNet-B4作为主干网络,它在速度和精度之间提供了很好的平衡,而且它可以从输入图像中提取丰富的多尺度特征。

Neck

采用路径聚合网络(PANet)Neck网络,以改善网络不同层次间的信息流和特征融合。PANet在特征金字塔网络(FPN)设计的基础上,增加了额外的自底向上的路径到传统的自顶向下路径。

检测头

YOLOv8的检测头基于NAS-FPN,是一种自动生成特征金字塔网络进行目标检测的神经架构搜索方法。NAS-FPN采用强化学习算法寻找最优的特征融合技术,该技术由一组组合操作和连接组成。NAS-FPN输出一个特征金字塔网络,称为NAS-FPN- cell,它可能是一个子网络,可以重新散列和堆叠以形成一个更大的网络。

新功能和增强

YOLOv8对以前的YOLO变体提供了一些现代特性和改进,例如新的损失函数,现代信息增强方法和现代评估度量。这些特性和升级计划是为了提高算法的执行和鲁棒性,并解决现有YOLO变体的一些限制和挑战。

增强后处理

YOLOv8在提高预测准确性和效率的后处理技术方面进行了改进:* 改进的非最大值抑制(NMS):YOLOv8采用了一种增强的NMS算法,减少了假阳性数量并提高了目标检测的精确度。

训练技术

混合精度训练:YOLOv8利用混合精度训练,结合16位和32位浮点运算。这种技术加快了训练过程,减少了内存使用,同时不牺牲模型精度。混合精度训练对于计算能力和内存有限的边缘设备特别有利。

超参数优化:YOLOv8包括自动超参数优化,调整模型的超参数以达到最佳性能。这个过程涉及运行多个具有不同超参数设置的训练实验,并选择最佳配置。自动超参数优化节省了时间,并确保模型在各种任务和数据集上表现良好。

新增损失函数

YOLOv8采用了一种称为Focal loss的现代损失函数,这是一种以困难的插图为中心的损失工作,降低了简单案例的影响。焦损使用一个调节因子来降低对分类良好的插图的贡献,以及一个缩放因子来调整阳性和阴性样本。焦点损失对于提高检测结果的召回率和精度具有重要意义,特别是对于不平衡和有噪声的数据集,其中大部分情况是简单的或不相关的。

新的数据增强方法

YOLOv8使用了一种新的数据增强方法Mixup,它可以是一种信息增强方法,将两张图像及其标签混合在一起,生成新的图像和标签。混合可以扩展准备数据的不同质量和复杂性,提高模型的泛化和强度。

新的评价指标

YOLOv8采用了一种新的评估指标,称为跨尺度平均精度(APAS),它可以衡量物体在不同尺度上的检测精度。APAS是标准平均精度(AP)度量的扩展,它测量单个尺度的对象检测的准确性。

实验结果

在COCO数据集上,YOLOv8模型在所有方法中表现最好,APAS得分为52.7,比之前的最佳方法YOLOv7提高了2.4分。YOLOv8模型在所有方法中也达到了最好的速度,FPS得分为150,比之前的最佳方法YOLOv5快了10帧。

结论

YOLOv8通过引入新的特性和改进,扩展了以前的YOLO版本的功能。YOLOv8的目标是优化目标检测的速度和精度,同时确保鲁棒性和稳定性。实验结果表明,YOLOv8在各种度量和场景的性能和效率方面超越了现有的方法。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号