目标检测中的锚框技术详解:从基础原理到实践应用
创作时间:
作者:
@小白创作中心
目标检测中的锚框技术详解:从基础原理到实践应用
引用
1
来源
1.
https://juejin.cn/post/7353113367534665791
目标检测是计算机视觉领域的重要任务之一,而锚框(anchor box)技术在其中扮演着关键角色。本文将详细介绍锚框的生成原理、交并比(IOU)的计算、非极大值抑制(NMS)等关键技术,并讨论数据增强、模型训练等实践方法。
锚框(Anchor Box)基础
以每个像素为中心,生成多个缩放比和宽高比(aspect ratio)不同的边界框。这些边界框被称为锚框(anchor box):
- 在图像中提取多个被称为锚框的区域
- 预测每个锚框中是否有关注的物体
- 若含有,预测该锚框到真实边缘框的偏移量
缩放比s: s1-sn,宽高比r: r1-rm
以同一像素为中心的锚框的数量是n+m-1。对于整个输入图像,将共生成wh(n+m-1)个锚框。
交并比(IOU)
锚框个数很多,设置一个IOU阈值将其分为两类:背景类和相关类
- 赋予锚框标号(有很多种算法可选取)
读取图片后,我们将每个锚框视为一个训练样本。为了训练目标检测模型,我们需要每个锚框的类别(class)和偏移量(offset)标签,其中前者是与锚框相关的对象的类别,后者是真实边界框(GT)相对于锚框的偏移量。
在预测时,我们为每个图像生成多个锚框,预测所有锚框的类别和偏移量,根据预测的偏移量调整它们的位置以获得预测的边界框,最后只输出符合特定条件的预测边界框。
非极大值抑制(NMS)
- 合并属于同一目标的类似的预测边界框。
- 选中的是非背景类的最大预测值
- 去掉所有其他和当前锚框IOU大于θ的预测
- 重复上述过程,直到所有预测的锚框要么是被选中,要么被去掉---去除冗余的预测
技术分析
- 数据增强
- 在测试时多次使用较弱的增强再去平均(?)
- 使用多个模型预测,最后结果加权平均(多为ResNet变种)
- 训练算法和学习率的选取
- 训练算法:SGD/ADAM
- 学习率:要么固定不变,要么根据每个一定epoch衰减一次,要么基于Cosine
- 清理数据
- 真实图像中可能存在大量的噪音
- 若数据集中,图片的背景占比较大,可进行裁剪
- 对于没有方向性的数据,可以进行随机旋转
- 跨图像增强:Mixup(随机选两张图像,随机权重,叠加)、CutMix(在不同图像中随机采样一些块,再利用随机权重进行块的组合,关注数据中的局部信息)
- 提升精度
- 模型、优化算法、多个模型融合
- 数据增强
- 在工业应用中,更关心数据的质量,对新数据进行标注,对旧数据进行清理
热门推荐
《画江湖之不良人》:李星云、镜心魔等四大历史人物的动画新生
小红书员工泄露机密给B站副总裁,企业数据安全存隐患
航班信息精准泄露,多人陷入“机票退改签”骗局
2024龙年男孩取名指南:5个好听名字推荐及注意事项
公安部互联网平台新增重名查询,助力个性化取名
古代姓名里的文化密码:从姓氏起源到名人故事
医学营养推荐:高饱腹感食物清单
高纤维饮食:吃饱又瘦的健康饮食法
法门寺地宫重现天日,出土佛指舍利和世界最大锡杖等稀世珍宝
齐东方解读法门寺地宫:2499件文物重现大唐盛世
法门寺出土佛指舍利与金银器,展现唐代盛世风貌
重庆九龙坡区:垃圾分类新风尚 绿色新春靓四方
南平深入推进文明乡风建设,为群众构建幸福家园
解码40岁玩家:王者荣耀里的娱乐与责任
AI助力企业效率提升:五大领域全面解析
中华医学会2024世界肾脏日公益活动在京成功举办
康养财富规划师兴起,一站式解决健康财富管理难题
心理咨询教你应对死亡焦虑
海德格尔教你如何“向死而生”
西甲:皇马大胜巩固优势,毕尔巴鄂绝平难阻争四颓势
毕尔巴鄂竞技主场战奥萨苏纳,欧战资格赛关键一役
毕尔巴鄂竞技主场战奥萨苏纳,国王杯晋级在望
当她主动坐你旁边:女生好感的7个行为信号
从眼神到行动:他这样读懂了她的暗恋信号
女生对你有好感?八大行为特征帮你读懂她的心
从咏春弟子到功夫电影之王:李小龙的传奇人生
广州李小龙故居免费开放,全息投影重现功夫巨星风采
广州李小龙故居:全息投影让功夫巨星“重现”
3分钟做出一虾两吃,黑椒炒虾配芝士焗虾
副业增收新选择:自媒体运营vs线上教育,哪个更适合你?