最全总结!标注数据不够时怎么训练目标检测网络?
创作时间:
作者:
@小白创作中心
最全总结!标注数据不够时怎么训练目标检测网络?
引用
1
来源
1.
https://www.bilibili.com/read/cv31952206/
在目标检测领域,当标注数据稀缺时,如何训练出高性能的检测模型是一个重要挑战。本文综述了低样本目标检测(LSOD)领域的最新进展,详细介绍了单样本目标定位(OSOL)、少样本目标检测(FSOD)和零样本目标检测(ZSOD)三种场景,并对相关方法进行了系统性的总结和分析。
1. LSOD背景与分类
目标检测网络在标注数据充足的情况下表现优异,但当数据稀缺时容易过拟合。因此,将现有模型泛化到标注数据不足的场景成为重要的研究方向。LSOD主要包括以下三种场景:
- 一次性目标定位(OSOL):每个目标类别都有一个注释图像样本
- 少样本目标检测(FSOD):每个目标类别有少量注释图像样本
- 零样本目标检测(ZSOD):根据语义信息而非图像样本区分不同类别
FSOD和OSOL主要区别在于:
- FSOD需要预测测试图像中潜在对象的正确类别
- OSOL为每个测试图像独立采样支持图像,而FSOD仅为所有测试图像采样一次支持图像
- 在FSOD中,每个类别的标记样本数量可以大于一个
2. LSOD方法分类
LSOD方法主要分为两类:
- 元学习方法:采用"学习如何学习"的机制,在基础数据集上定义多个少样本任务来训练模型,使其能够快速适应真实的少样本任务
- 迁移学习方法:通过在基础数据集上训练模型来学习良好的图像表示,然后用于新数据集
3. 主流基准总结
4. 单样本目标检测(OSOL)
OSOL方法主要采用Faster R-CNN框架,通过整体特征聚合将查询图像和支持图像的特征图融合。具体实现方式包括基于连接的方法和基于注意力的方法。
基于连接的整体特征聚合方法
- OSCD:将查询特征图与支持特征图的合并嵌入向量连接
- SiamMask:将查询特征映射与查询特征映射和支持特征映射的合并嵌入向量之间的绝对差值连接
- FOC·OSOL:在SiamMask生成的积分特征图上应用卷积块
基于注意力的整体特征聚合方法
- 一些方法(如CoAE、BHRL、ABA OSOL)使用非局部操作
- 一些方法(如AIT、CAT、SaFT)使用Transformer来捕获查询和支持图像之间的注意力
5. 少样本目标检测(FSOD)
FSOD方法主要采用两阶段迁移学习框架,包括基础训练阶段和少量微调阶段。特征向量的聚合方式包括逐元素乘法、逐元素减法和级联运算。
6. 零样本目标检测(ZSOD)
ZSOD方法主要通过视觉-语义映射将视觉特征投影到语义空间,并与类别语义嵌入进行比较以进行分类。主流方法包括快速R-CNN和YOLO式模型。
7. 总结与未来工作
增强深度目标检测器以从很少甚至零样本中快速学习对于未来的目标检测具有重要意义。这篇文章对低样本目标检测(LSOD)进行了全面的研究,包括单样本目标定位(OSOL)、少样本目标检测(FSOD)和零样本目标检测(ZSOD)。希望这项调查能够促进未来对LSOD的研究。
热门推荐
美媒评选21世纪NBA年度最佳中锋:奥尼尔统治7年,约基奇成现役最强
西游记中的团队管理智慧有哪些?
梦见去姐姐家:多重维度下的心理解读
深度剖析中医倪海厦
朱砂桂的养殖方法和注意事项
鸡蛋一周吃几个够量?煎鸡蛋不要常吃?……怎样吃更健康
2024年四川新高考解读:变化、机遇与应对策略
八字命理学中的“七杀格”与“偏印格”详解
有一种胸口刺痛非常危险,心脏发出的7个信号值得警惕
研发打样选择什么样的3D打印机合适?
上饶:仙境般的山水画卷,品味江西风味的绝美之旅!
原创还是借鉴?一篇文章教你正确使用原创度检测
苏轼和苏辙:情深意重的兄弟情谊
楼船夜雪瓜洲渡:一文厘清古代战船的发展史,为何战船技术会衰落
如何挑选适合的汽车配置?这种挑选会受到哪些因素制约?
黄仁勋:成功的关键在于努力与韧性,而非高智商
Win11键盘快捷键如何快速打开软件?这些按键是哪些?
从小魔童到大英雄,一本书讲完哪吒的前世今生
徐志摩死后,陆小曼的存折连续18年每月打进300元,谁在供养她?
咳嗽、打喷嚏时,做好这两个动作很重要!
宋朝百姓生活探秘:真实与想象的交融
哪里可以查询职工死亡丧葬补助金的政策?
如何设计符合二次元风格的背景
近10年进步最快的6位男演员:从无戏可拍到炙手可热
群山中的神秘龙游石窟,《鬼吹灯》取景地,被称作世界第九大奇迹
心理障碍怎么克服方法
深入了解23种设计模式:从理论到实践
从城市跑步到越野初体验:技巧与装备全面指南
软件测试基础知识
国内没有夜盘的期货交易品种(国内没有夜盘的期货交易品种有哪些)