问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

YOLOv8简易结构流程阐述

创作时间:

作者:

@小白创作中心

YOLOv8简易结构流程阐述

引用

CSDN

1.

https://m.blog.csdn.net/qq_62836158/article/details/141722120

YOLOv8是当前主流的目标检测算法之一，其整体结构可以分为三部分：骨干网络（backbone）、颈部网络（neck）和头部网络（head）。下面将对YOLOv8的结构流程进行简要阐述。

骨干网络（Backbone）

骨干网络的主要作用是提取图像的细节信息。YOLOv8的不同版本（如YOLOv8n、YOLOv8s等）在骨干网络的模块设置上有所不同，例如卷积层数量和特征拼接的数量。这些差异使得不同版本的模型在计算效率和检测精度之间取得不同的平衡。

颈部网络（Neck）

颈部网络的主要作用是融合不同尺度下的信息，提高模型的多尺度检测能力。YOLOv8使用了SPP（Spatial Pyramid Pooling）模块和PAFPN（Path Aggregation Feature Pyramid Network）来实现这一目标。SPP模块通过不同尺度的池化操作来增强模型的尺度不变性，而PAFPN则通过跨层连接来增强特征的传播。

头部网络（Head）

头部网络的主要作用是对预测框坐标和预测类别进行解耦。YOLOv8使用了三个不同尺度的特征图（以640大小输入为例：80x80、40x40、20x20）来进行预测。

预测框坐标

预测框坐标的计算过程如下：

首先，将特征图的每个位置映射到一个向量，向量的维度为c=4*reg_max，其中reg_max是默认长度为16的向量。因此，对于8400个预测框（80x80+40x40+20x20），每个预测框的坐标向量维度为8400x64。
然后，对这些向量进行积分求和，转换为8400x4的格式。转换后的单个向量的值的范围在[0,15]之间，表示的是以该预测框为中心，上下左右四个方向与中心点的距离。
最后，使用回归损失函数来计算预测框坐标的损失。

预测类别

预测类别的计算过程如下：

对于每个预测框，模型会输出一个80维的向量（假设总共有80个类别），表示每个预测框对每种类别的预测概率。
使用BCE（Binary Cross-Entropy）损失函数来计算分类损失。

正负样本的确定

由于图像中大部分区域并没有事先标注好的检测对象，因此需要确定正负样本以计算损失函数。YOLOv8使用了Task-Aligned Assigner（TAL）来确定正负样本。具体来说，TAL通过计算分类分数s和预测框与真实框的IoUu的加权分数来衡量预测框与真实框的对齐程度。对于正样本，使用常规的BCE计算分类损失；对于负样本，则使用纯粹的分类损失。

非极大值抑制（NMS）

在预测阶段，可能会出现多个预测框检测到同一个物体的情况。为了消除冗余的预测框，YOLOv8使用了非极大值抑制（NMS）算法。NMS通过计算预测框之间的CIoU（Complete IoU）来确定哪些预测框应该被保留，哪些应该被丢弃。

热门推荐

粉末防结块剂是什么东西

粉末防结块剂是什么东西

如何规划农业种植需求

如何规划农业种植需求

世界观与信仰的选择——人生的根基

世界观与信仰的选择——人生的根基

十大受欢迎的意大利面品种 10种常见意面的种类及吃法

十大受欢迎的意大利面品种 10种常见意面的种类及吃法

沈阳、大连、丹东“旅游金三角”加开高铁

沈阳、大连、丹东“旅游金三角”加开高铁

贝拉玻尿酸和德彩玻尿酸哪个好？贝拉玻尿酸VS德彩玻尿酸等多方面对比解析

贝拉玻尿酸和德彩玻尿酸哪个好？贝拉玻尿酸VS德彩玻尿酸等多方面对比解析

郑州构建“青春网格”：基层有需求，青年来协助

郑州构建“青春网格”：基层有需求，青年来协助

为人处世，在人际交往中获得尊重的10个铁律

为人处世，在人际交往中获得尊重的10个铁律

为什么人们偏爱铅笔？从实用到情感的八大理由

为什么人们偏爱铅笔？从实用到情感的八大理由

《墨剑江湖》天山连招流阵容搭配全攻略

《墨剑江湖》天山连招流阵容搭配全攻略

上海眼科医院眼科医生：长了“针眼”怎么办?

上海眼科医院眼科医生：长了“针眼”怎么办?

用GPT打造一个专门写网文小说的AI智能体！轻松掌控故事发展

用GPT打造一个专门写网文小说的AI智能体！轻松掌控故事发展

桃花之语：桃花的花语及其深刻意义

桃花之语：桃花的花语及其深刻意义

办公软件护眼怎么设置

办公软件护眼怎么设置

如何制定有效的地产营销策略？这些策略在市场中的效果如何？

如何制定有效的地产营销策略？这些策略在市场中的效果如何？

房地产行业客服：连接开发商与购房者的关键纽带

房地产行业客服：连接开发商与购房者的关键纽带

我们为什么迷恋油炸？

我们为什么迷恋油炸？

10所高校考研复试线下降，多则降56分，热门专业有小涨，为什么？

10所高校考研复试线下降，多则降56分，热门专业有小涨，为什么？

日本2024年平均月薪创新高，这个行业薪资最高

日本2024年平均月薪创新高，这个行业薪资最高

图解 | 全球科技巨头算力投资计划大比拼

图解 | 全球科技巨头算力投资计划大比拼

腰腹部减肥的办法

腰腹部减肥的办法

根据MBTI找工作靠谱吗？听听HR们是怎么说的

根据MBTI找工作靠谱吗？听听HR们是怎么说的

这份常见案件所需证据材料清单，请收好！

这份常见案件所需证据材料清单，请收好！

全球AI算力行业现状分析：规模增长速度快，中国AI芯片国产化率仍有待提升

全球AI算力行业现状分析：规模增长速度快，中国AI芯片国产化率仍有待提升

槟榔，为什么不禁止售卖？

槟榔，为什么不禁止售卖？

出租房屋的描述技巧如何？这样的描述技巧对租客吸引力有何影响？

出租房屋的描述技巧如何？这样的描述技巧对租客吸引力有何影响？

刘邦如何用八年的时间，从泗水亭长成为汉朝开国皇帝的？

刘邦如何用八年的时间，从泗水亭长成为汉朝开国皇帝的？

lol寒冰三姐妹背景故事英雄联盟寒冰三姐妹介绍

lol寒冰三姐妹背景故事英雄联盟寒冰三姐妹介绍

工资计算器软件怎么快速计算税后工资

工资计算器软件怎么快速计算税后工资

无钱聘请律师如何维权：法律救济途径全解析

无钱聘请律师如何维权：法律救济途径全解析

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号