问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

目标检测中的锚框技术详解：从基础原理到实践应用

创作时间:

作者:

@小白创作中心

目标检测中的锚框技术详解：从基础原理到实践应用

引用

1

来源

1.

https://juejin.cn/post/7353113367534665791

目标检测是计算机视觉领域的重要任务之一，而锚框（anchor box）技术在其中扮演着关键角色。本文将详细介绍锚框的生成原理、交并比（IOU）的计算、非极大值抑制（NMS）等关键技术，并讨论数据增强、模型训练等实践方法。

锚框（Anchor Box）基础

以每个像素为中心，生成多个缩放比和宽高比（aspect ratio）不同的边界框。这些边界框被称为锚框（anchor box）：

在图像中提取多个被称为锚框的区域
预测每个锚框中是否有关注的物体
若含有，预测该锚框到真实边缘框的偏移量

缩放比s: s1-sn，宽高比r: r1-rm

以同一像素为中心的锚框的数量是n+m-1。对于整个输入图像，将共生成wh(n+m-1)个锚框。

交并比（IOU）

锚框个数很多，设置一个IOU阈值将其分为两类：背景类和相关类

赋予锚框标号（有很多种算法可选取）

读取图片后，我们将每个锚框视为一个训练样本。为了训练目标检测模型，我们需要每个锚框的类别（class）和偏移量（offset）标签，其中前者是与锚框相关的对象的类别，后者是真实边界框（GT）相对于锚框的偏移量。

在预测时，我们为每个图像生成多个锚框，预测所有锚框的类别和偏移量，根据预测的偏移量调整它们的位置以获得预测的边界框，最后只输出符合特定条件的预测边界框。

非极大值抑制（NMS）

合并属于同一目标的类似的预测边界框。
选中的是非背景类的最大预测值
去掉所有其他和当前锚框IOU大于θ的预测
重复上述过程，直到所有预测的锚框要么是被选中，要么被去掉---去除冗余的预测

技术分析

数据增强
在测试时多次使用较弱的增强再去平均（？）
使用多个模型预测，最后结果加权平均（多为ResNet变种）
训练算法和学习率的选取
训练算法：SGD/ADAM
学习率：要么固定不变，要么根据每个一定epoch衰减一次，要么基于Cosine
清理数据
真实图像中可能存在大量的噪音
若数据集中，图片的背景占比较大，可进行裁剪
对于没有方向性的数据，可以进行随机旋转
跨图像增强：Mixup（随机选两张图像，随机权重，叠加）、CutMix（在不同图像中随机采样一些块，再利用随机权重进行块的组合，关注数据中的局部信息）
提升精度
模型、优化算法、多个模型融合
数据增强
在工业应用中，更关心数据的质量，对新数据进行标注，对旧数据进行清理

热门推荐

如何不内耗不多想

如何不内耗不多想

中科大彭新华课题组：新型原子共磁力计实现高频磁噪声自补偿

中科大彭新华课题组：新型原子共磁力计实现高频磁噪声自补偿

不完美正是一种完美

不完美正是一种完美

高松自由行攻略：景点、美食、住宿全攻略

高松自由行攻略：景点、美食、住宿全攻略

电机转矩和负载关系，详解电机转矩与负载的相关性

电机转矩和负载关系，详解电机转矩与负载的相关性

英语非谓语动词全解析：告别混淆，精准运用

英语非谓语动词全解析：告别混淆，精准运用

职场氛围感大片，8个姿势，拍照优雅气质，显身材又好看

职场氛围感大片，8个姿势，拍照优雅气质，显身材又好看

在汽车选购时，如何挑选适合自己驾驶习惯的车型？

在汽车选购时，如何挑选适合自己驾驶习惯的车型？

6600万年前撞击地球的小行星来自外太阳系

6600万年前撞击地球的小行星来自外太阳系

6500万年前小行星撞击地球，是如何导致恐龙灭绝的

6500万年前小行星撞击地球，是如何导致恐龙灭绝的

家庭如何规划消费者需求

家庭如何规划消费者需求

GPA计算标准详解及常见问题解答

GPA计算标准详解及常见问题解答

叶色艳丽，花如铃铛！“花叶良姜”迎来最后一波盛放

叶色艳丽，花如铃铛！“花叶良姜”迎来最后一波盛放

C++20 模块：告别头文件，迎接现代化的模块系统

C++20 模块：告别头文件，迎接现代化的模块系统

研学之旅，该重“研”还是重“旅”？

研学之旅，该重“研”还是重“旅”？

板栗的功效作用及营养价值、禁忌是什么

板栗的功效作用及营养价值、禁忌是什么

火星大气当燃料，外星球供能有妙招

火星大气当燃料，外星球供能有妙招

饭前喝水真的有助于减肥吗？

饭前喝水真的有助于减肥吗？

多少才算是足够的表达？揭秘情感表达的正确姿势！

多少才算是足够的表达？揭秘情感表达的正确姿势！

梨状肌卡压引起脚底麻木怎么办？医生给出专业解答

梨状肌卡压引起脚底麻木怎么办？医生给出专业解答

用神的意义：兼谈用神和命运的关系

用神的意义：兼谈用神和命运的关系

增值税已知税后金额税率如何计算税前金额

增值税已知税后金额税率如何计算税前金额

锂电池充电：注意事项、过程解析与寿命维护

锂电池充电：注意事项、过程解析与寿命维护

中医治疗拉肚子最快的方法

中医治疗拉肚子最快的方法

Simufact软件在铝型材挤压模具设计数值模拟的应用

Simufact软件在铝型材挤压模具设计数值模拟的应用

范仲淹的一生，就是一部逆袭史

范仲淹的一生，就是一部逆袭史

春困睡不醒？做好这几件事让你“赶跑”春困，精神百倍

春困睡不醒？做好这几件事让你“赶跑”春困，精神百倍

热茶和冰水，哪个更解暑？答案让人意外

热茶和冰水，哪个更解暑？答案让人意外

尿蛋白定量参考值是多少

尿蛋白定量参考值是多少

在激烈竞争中，如何利用差异化战略脱颖而出持续增长？

在激烈竞争中，如何利用差异化战略脱颖而出持续增长？

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号