细粒度识别综述:概念、数据集与研究进展
创作时间:
作者:
@小白创作中心
细粒度识别综述:概念、数据集与研究进展
引用
CSDN
1.
https://blog.csdn.net/m0_74137224/article/details/134844129
细粒度识别是计算机视觉领域的一个重要研究方向,主要关注如何区分视觉上非常相似的物体类别。本文将从细粒度识别的概念出发,介绍常用的训练和测试数据集,并总结近年来的研究进展。
一、细粒度(fine-grained)的概念
细粒度识别主要解决的是相似目标的检测问题。与粗粒度分类(如区分猫和狗)不同,细粒度分类需要识别更细微的差别,例如区分杜宾犬和金毛。这种分类任务对模型的精度要求更高,传统的目标检测方法(如YOLO系列)往往难以达到理想的效果。
二、常用的细粒度分类训练和测试的数据集
- Stanford Dogs
- 包含120种狗,每个类别有150张图片
- 图像总数:20580
- 基于ImageNet的图像和注释构建
- 分为12,000张训练图像和8,580张测试图像
- CUB200-2011 Caltech-UCSD Birds-200-2011
- 包含200个鸟类子类别
- 每类有30+训练图像
- 总共11,788张图像
- 5,994张训练图像,5,794张测试图像
- 每张图像包含15个局部部位标注点、312个二值属性和语义分割图像
- 每张图像收集了10个自然语言描述
- Oxford Flowers
- 分为17类和102类两种规模
- 102类版本每类包含40到258张图像
- 总共8,189张图像
- 只提供语义分割图像,无其他额外标注信息
- 图像具有较大的比例、姿势和光线变化
- FGVC-Aircraft Fine-Grained Visual Classification of Aircraft
- 包含10,200张飞机图像
- 100种不同飞机模型变体,每种102张图像
- 每张图像带有紧密边界框和分层飞机模型标签
- 四级层次结构:型号、变体、家庭、制造商
- 数据分为训练、验证和测试三个子集
- Stanford-Cars
- 由196类汽车组成
- 共有16,185张图像
- 8,144张训练图像,8,041张测试图像
- 类别通常位于品牌、型号、年份级别
- 图像尺寸为360×240
三、细粒度识别的研究方向
近年来,细粒度识别的研究主要集中在以下几个方向:
- 局部特征提取:通过检测和描述物体的局部特征来提高分类精度
- 注意力机制:利用注意力机制聚焦于区分性特征
- 多模态融合:结合图像和文本信息进行分类
- 迁移学习:利用预训练模型进行微调
对于更详细的论文和研究方向,可以参考GitHub上的相关资源:
LionRoarRoar/Awesome-Fine-grained-Visual-Classification
四、机器学习数据集推荐
对于从事机器学习和计算机视觉研究的读者,以下网站值得推荐:
paperswithcode
特点:将ArXiv上的最新论文与GitHub上的代码对应起来
包含8,916个机器学习数据集
优点:节省查找和整理数据集的时间
ImageNet
由斯坦福大学教授Li Fei-Fei创建
包含数百万张有标签的图像
每年举行图像识别挑战赛
在计算机视觉领域有深远影响
热门推荐
阀门密封面泄漏检测方法全解析
深度体验国航C919大飞机首航:为何特别?有何不同?
《星露谷物语》美化类模组的变迁科普:XNB,CP,和AT
运动习惯四招养成
乌鲁木齐高铁:兰新高铁全攻略
怎么查询失业保险金
外伤的定义与分类:从外力损伤到化学伤的全面解析
越睡越累?做对4招疲劳不累积,一觉到天亮
刚种植的芦荟要浇水吗(教你芦荟浇水的正确方法)
二进制数的编码表示
4D打印技术:从概念到应用的全面解析
历史有妲己这个人物吗?,真实存在的妲己:古代传说人物揭秘
煎中药的正确打开方式,您了解吗?
中药一般煎多长时间
广州十大心理咨询机构你会选择哪一家
深度剖析:人狼村之谜全剧情惊天反转与隐藏真相
界朱然在《三国杀》中的最佳位置分析
头部磁共振需要多少钱一次
中药材种植环境要求
扁平化设计在现代网站中的应用与发展趋势分析
苹果电脑如何兼容windows
基本养老金怎样进行计算?计算基本养老金有哪些方法?
广州养老金计算方法详解:基础养老金、过渡性养老金等如何计算?
咳嗽的诊断方法:从症状评估到影像学检查
非小细胞肺癌中药方有哪些?治疗效果怎么样?
专家解析:手脚麻木的六大缓解方法
床的一般高度是多少?舒适与健康的选择
光学镀膜VS涂层:功能、技术与应用的全方位对比
儿童冬季保暖的饮食有哪些
胃炎患者可以吃木耳吗?医生给出专业建议