资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

行人重识别(ReID)基本介绍

创作时间:

作者:

@小白创作中心

行人重识别(ReID)基本介绍

引用

CSDN

https://blog.csdn.net/qq_41076629/article/details/140463871

行人重识别（ReID）是计算机视觉领域的一个重要研究方向，主要用于在不同摄像头或场景下识别同一行人。本文将详细介绍ReID的基本概念、应用场景、系统架构、传统方法、深度学习方法、基于GAN的方法以及相关的工程实践和优化技巧。

行人重识别(ReID)基本介绍

应用

视频监控
人脸识别&检测
视频结构化
道路上人车的属性等
行人重识别ReID

行人重识别ReID

拿到图片，检测到图片中的行人，得到一系列行人图片，拿到一张想要检索的人图片，在行人图片中检索的到该人的行为
人脸识别失效的情况下用的比较多
衣着、配饰、体态等方面看

行人重识别ReID也成行人再识别，被认为是一个图像检索的子问题，是利用计算机视觉技术判断图像或者视频中是否存在特定行人的技术，即给定一个监控行人图像检索跨设备下的该行人图像。

弥补固定摄像头的视觉局限

应用

刑事侦查（短时）
行人理解
行人跟踪
单摄像头单目标
单摄像头多目标
多摄像头多目标

行人重识别系统

行人重识别主要关注点在特征提取和相似度度量

过程

特征提取：学习能够应对在不同摄像头下行人变化的特征
度量学习：将学习到的特征映射到新的空间使相同的人更近不同的人更远
图像检索：根据图片特征之间的距离进行排序，返回检索结果

数据集

数据集通常是通过人工标注或者检测算法得到的行人图片，目前与检测独立，注重识别
数据集分为训练集、验证集、Query、Gallery
Query：probe，待检索的行人图片
Gallery：图像库
在训练集上进行模型的训练，得到模型后对Query和Gallery中的图片提取特征计算相似度，对于每个Query在Gallery中找出前N个与其相似的图片
训练、测试中的人物身份不重复

常用数据集

单帧
CUHK03
Market1501
DukeMTMC-ReID
MSMT17
以上数量依次递增
序列- 多帧
LPW
MARS
LVReID

挑战

分辨率低
遮挡
视角、姿势变化
光照变化
视觉模糊性

常用评价指标

rank-k：算法返回的排序列表中，前k位为存在检索目标则称为rank-k命中
CMC曲线：计算rank-k的击中率，形成rank-acc曲线
mAP曲线：反映检索的人在数据库中所有正确的图片排在排序表前面的程度，能更加全面的衡量ReID算法的性能

评价模式

single shot：gallery中每个人的图片为一张
multi shot：gallery中每个人的图片为N张，N越大识别率越高
single query：probe中每个人的图片为一张
multi query：probe中每个人的图像为n张，融合多张图片特征为最终特征

通常ReID模型的性能采用single shot+ single query模式

传统方法-手工设计特征+距离度量

手工特征

颜色空间：RGB、HSV、LAB、XYZ、YCbCr、ELF、ELF16
纹理空间：LBP、Gabor
局部特征：SIFT、HOG、SURF
专用特征：LDFV、ColorInv、SDALP、LOMO

距离度量

常用距离：欧氏距离、马氏距离、余弦距离
度量学习：LFDA、MFA、LMNN、LADF、XQDA、KISSME

深度学习方法

表征学习与度量学习

表征学习

把行人重识别任务当作分类问题或者验证问题来看待，没有直接在训练网络的时候考虑图片间的相似度
分类损失和验证损失
分类损失（ID分类）：利用行人的ID作为训练标签来训练模型，每次只需要输入一张图片
IDE网络
属性损失
验证损失：输入一对图片，判断两张图片是否为同一个人，等效于二分类问题

度量学习

通过网络学习出两张图片的相似度，在行人重识别问题上表现为同一行人的不同图片间的相似度大于不同行人的不同图片
损失
对比损失：输入两张图片，分别提取特征，计算距离
三元组损失：输入三张图片，一张锚点图片，一张正样本，一张负样本，学习网络，拉近正样本之间的距离，远离负样本之间的距离
改进三元组损失：在前面的前提下约束正样本之间的距离
四元组损失：一对正样本，两张不同的负样本，第三张为三元组损失，第四张为弱推动的三元组损失，目的是推开负样本之间的距离，推近正样本之间的距离
TriHard loss(标杆)
核心思想：对每一个训练batch挑选p个id的行人，每个行人随机挑选k张不同的图片，即一个batch含有p✖️k张图片。之后对于batch中的每一张图片a，挑选一个最难的正样本和最难的负样本和a组成一个三元组。
TriHard loss with adaptive weights
难样本挖掘

全局特征