问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

YOLOv1-v11:版本演进及其关键技术解析

创作时间:
作者:
@小白创作中心

YOLOv1-v11:版本演进及其关键技术解析

引用
CSDN
1.
https://blog.csdn.net/hadoopdevelop/article/details/142677591

YOLO(You Only Look Once)是一种高效的目标检测算法,自其初代发布以来,经过多次迭代,逐步提升了检测速度和精度。本文将详细介绍 YOLO 从 v1 到 v11 的各个版本,涵盖每个版本的发布日期、作者、项目地址及主要功能特性。

1. YOLOv1 (2016)

发布日期: 2016年6月

作者: Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi

论文:"You Only Look Once: Unified, Real-Time Object Detection"

项目地址: YOLOv1 GitHub

主要功能:

  • 创新思想:YOLOv1 首次将目标检测任务转化为一个单次前向传播的问题,显著提升了检测速度。

  • 检测速度快:能够以 45 FPS 的速度处理图像,并且有一个更快的版本可以达到 155 FPS。

  • 限制:YOLOv1 在小物体检测上的精度较差,且定位误差较高。

2. YOLOv2 (2017)

发布日期: 2017年12月

作者: Joseph Redmon, Ali Farhadi

论文:"YOLO9000: Better, Faster, Stronger"

项目地址: YOLOv2 GitHub

主要功能:

  • YOLO9000:YOLOv2 被称为 YOLO9000,能够检测 9000 种类别物体。

  • 多尺度训练:通过不同分辨率的训练图像增强模型的鲁棒性。

  • Anchor Boxes:引入 anchor boxes 改进了对小物体的检测能力。

3. YOLOv3 (2018)

发布日期: 2018年4月

作者: Joseph Redmon, Ali Farhadi

论文:"YOLOv3: An Incremental Improvement"

项目地址: YOLOv3 GitHub

主要功能:

  • 改进的网络结构:引入了 Darknet-53 作为主干网络,结合残差网络提高检测精度。

  • 多尺度预测:在不同尺度上进行预测,改善对小物体的检测。

  • 分类器移除:取消了软分类器,使用独立的二元分类器来提高性能。

4. YOLOv4 (2020)

发布日期: 2020年4月

作者: Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao

论文:"YOLOv4: Optimal Speed and Accuracy of Object Detection"

项目地址: YOLOv4 GitHub

主要功能:

  • Bag of Freebies 和 Bag of Specials:提出了一系列的免费(Freebies)和特效(Specials)优化策略,大幅提高了模型精度。

  • CSPDarknet53:更高效的主干网络,提升了网络的推理速度和精度。

  • CIoU 损失函数:引入 CIoU 损失,提高了边界框回归的性能。

5. YOLOv5 (2020)

发布日期: 2020年6月

作者: Glenn Jocher

项目地址: YOLOv5 GitHub

主要功能:

  • Pytorch 实现:YOLOv5 转向了 Pytorch 框架,便于开发者使用和扩展。

  • 自动学习的 anchor boxes:通过自适应的 anchor box 学习机制,进一步提高检测效率。

  • 丰富的预训练模型:提供了多种尺寸的预训练模型,满足不同场景的需求。

6. YOLOv6 (2022)

发布日期: 2022年6月

作者: Meituan 技术团队

项目地址: YOLOv6 GitHub

主要功能:

  • 行业应用优化:YOLOv6 是针对行业应用优化的版本,尤其注重推理速度。

  • 改进的网络结构:引入 EfficientRep 带来了更高效的网络架构。

  • 支持部署:优化模型部署性能,适合工业环境中的大规模应用。

7. YOLOv7 (2022)

发布日期: 2022年7月

作者: Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang

论文:"YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors"

项目地址: YOLOv7 GitHub

主要功能:

  • 精度和速度的新突破:YOLOv7 在 COCO 数据集上达到了新的速度与精度平衡。

  • 跨尺度特征融合:通过跨尺度的特征融合,提高了对不同尺度物体的检测能力。

  • 动态标签分配:改进了训练过程中的标签分配方式,使得训练效率更高。

8. YOLOv8 (2023)

发布日期: 2023年1月

作者: Ultralytics 团队

项目地址: YOLOv8 GitHub

主要功能:

  • 模块化设计:提供了可定制的模块化设计,方便用户根据需求进行扩展。

  • 自动化训练和优化:内置了多种训练和超参数优化策略,简化了模型调优过程。

  • 集成检测、分割和跟踪:YOLOv8 不仅支持目标检测,还集成了语义分割和目标跟踪功能。

YOLOv9(2024.02)

  • 版本名称: YOLOv9

  • 发布日期: 2024年2月

  • 作者/贡献者: WongKinYiu, 可能还有其他贡献者

  • 项目地址: GitHub - WongKinYiu/yolov9

  • 主要功能:

  • 引入了可编程梯度信息(PGI)的概念。

  • 设计了一种新的轻量级网络架构—基于梯度路径规划的通用高效层聚合网络(GELAN)。

  • 提高了模型的学习能力,并在整个检测过程中保留关键信息。

  • 改进了GhostNet主干网络以提高效率。

  • 融合了Involution新卷积算子来增强上下文信息提取能力。

  • 为道路缺陷检测等特定应用场景引入了DCNv4、自研BSAM注意力机制及极简的神经网络VanillaBlock等技术。

  • 替换MobileNetV2作为主干网络实现轻量化。

10. YOLOv10 (2024.05)

发布日期: 2024.05

作者: 清华大学

论文https://arxiv.org/pdf/2405.14458

项目地址: https://github.com/THU-MIG/yolov10

主要功能:实时端到端的对象检测。主要是速度和性能方面的提升。

11. YOLOv11 (2024)

发布日期: 2024.09

作者: Ultralytics 团队

项目地址: https://github.com/ultralytics/

主要功能:

Ultralytics YOLO11 是基于之前 YOLO 版本的成功经验开发的最新版本,引入了新的特性和改进,进一步提升了性能和灵活性。YOLO11 设计为快速、准确且易于使用,使其成为对象检测、跟踪、实例分割、图像分类和姿态估计等多种任务的理想选择。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号