非极大值抑制(NMS)及其变体详解
创作时间:
作者:
@小白创作中心
非极大值抑制(NMS)及其变体详解
引用
CSDN
1.
https://blog.csdn.net/2401_89898861/article/details/145911797
非极大值抑制(NMS)是目标检测算法中的关键步骤,用于去除冗余预测框并保留高置信度的预测结果。本文将详细介绍NMS的基本原理、步骤以及具体实现方法。
非极大值抑制(NMS)及其变体
非极大值抑制(Non-Maximum Suppression, NMS)是目标检测算法中一个非常关键的步骤,常用于去除冗余的预测框,并且保留具有最高置信度的预测框。它通过抑制那些与其他框重叠度较高的低置信度框,来确保最终输出的框是最优的。
1. NMS(Non-Maximum Suppression)的定义
NMS 的基本思想是:对于每个目标类别的所有预测框,首先根据置信度对预测框进行排序,然后选出置信度最高的框,接着去掉与这个框重叠度(IoU)较高的框,最后继续选出下一个置信度最高的框,重复此过程,直到所有预测框都处理完。
NMS 的步骤
- 排序:根据框的置信度对预测框进行排序,从置信度最高的框开始。
- 选择:选择排序后的第一个框作为最终结果。
- 计算 IOU(Intersection over Union):计算当前框与所有其他框的 IOU 值。
- 抑制:如果当前框与其他框的 IOU 大于预设的阈值,则抑制该框(即删除)。
- 重复:重复上述步骤,直到所有框都被处理完。
NMS 算法公式
IoU (Intersection over Union):用于衡量两个矩形框的重叠度。公式如下:
其中:
- Area of Intersection:两个框交集区域的面积。
- Area of Union:两个框并集区域的面积。
- 置信度:每个框都有一个置信度分数,代表该框是目标的可能性。
标准 NMS 伪代码
def nms(boxes, scores, iou_threshold):
"""
:param boxes: 一个形状为 [N, 4] 的 numpy 数组,表示 N 个边界框 [x1, y1, x2, y2]。
:param scores: 一个形状为 [N] 的 numpy 数组,表示每个框的置信度。
:param iou_threshold: IoU 阈值,决定是否去除一个框。
:return: 保留的边界框索引。
"""
# 对预测框按置信度排序
idxs = np.argsort(scores)[::-1] # 降序排序,返回索引
selected_boxes = []
while len(idxs) > 0:
# 选择置信度最高的框
current_idx = idxs[0]
selected_boxes.append(current_idx)
# 计算剩余框与当前框的 IoU
ious = compute_iou(boxes[current_idx], boxes[idxs[1:]])
# 去除与当前框 IoU 大于阈值的框
remaining_idx = np.where(ious <= iou_threshold)[0]
# 更新索引
idxs = idxs[remaining_idx + 1]
return selected_boxes
def compute_iou(box1, boxes):
"""
计算单个框与多个框的 IoU
:param box1: 单个框 [x1, y1, x2, y2]
:param boxes: 多个框的列表 [[x1, y1, x2, y2], ...]
:return: IoU 数组
"""
x1 = np.maximum(box1[0], boxes[:, 0])
y1 = np.maximum(box1[1], boxes[:, 1])
x2 = np.minimum(box1[2], boxes[:, 2])
y2 = np.minimum(box1[3], boxes[:, 3])
inter_area = np.maximum(0, x2 - x1) * np.maximum(0, y2 - y1)
box1_area = (box1[2] - box1[0]) * (box1[3] - box1[1])
boxes_area = (boxes[:, 2] - boxes[:, 0]) * (boxes[:, 3] - boxes[:, 1])
union_area = box1_area + boxes_area - inter_area
iou = inter_area / union_area
return iou
代码说明
nms:该函数实现了标准的非极大值抑制算法。它接收预测框boxes、对应的置信度scores以及 IoU 阈值iou_threshold。最终返回保留的框的索引。compute_iou:计算一个框与多个框之间的 IoU。
热门推荐
“华夏中交建REIT”收入与分配的非比例变动
五行中的木火土金水与肝心脾肺肾的关系
氧气检测仪的报警值如何设置?
如何提高王者荣耀电竞队伍的竞技水平与团队协作能力
工业触摸显示器LCD VS LED液晶面板之争,谁才是王者?
缺乏维生素B12,身体出现4种常见症状,5类人群应重点注意
哪些职业技能培训工种最受欢迎?
记者亲测:网上复制小区门禁卡比配钥匙还方便,律师:涉嫌违法
考人力资源怎么刷题的
银行理财产品的投资期限和流动性的关系是怎样的?
江化微副董事长去世!
城堡毁灭者全关卡制霸攻略与角色培养指南
运动发型怎么扎?有请奥运选手们讲解
旧轮胎怎样用于种花?用旧轮胎种花的注意事项有哪些?
从符号解码文明起源
玉肌仙露:从元至清七百年的宫廷人参养颜秘方(附原方与改良方)
如何有效备考雅思:精选复习资料详解
公司发展战略规划的成功案例有哪些值得借鉴的经验?
王者荣耀:王昭君下台,甄姬让位,中路“霸主”出现,学会轻松登王者
如何准确计算保险准备金?这些计算方法有哪些影响因素?
劳保用品发放标准依据是什么
文科到底有什么用?
如何拟定一份可靠的合同协议,守护合同签约安全?
差点被英国抢走的南宋沉船,满载800年前文物,我国为何隔了23年才敢捞?
什么是数字孪生(Digital Twin)?数字孪生有哪些应用领域?
合金装备5幻痛富尔顿虫洞开发任务图文详解
博士申请,导师匹配的重要性
如何有效加强企业制度建设?
腋下黑黑的原因?十年皮肤科医生教你高效解决腋下变黑困扰!
如何选择适合自己的考研专业课资料?