问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

准确率、精确率、召回率、F1-score 概念、计算原理

创作时间:
作者:
@小白创作中心

准确率、精确率、召回率、F1-score 概念、计算原理

引用
CSDN
1.
https://m.blog.csdn.net/Yaki_Duck/article/details/140681186

在机器学习和数据科学领域,评估模型的性能是至关重要的一步。准确率、精确率、召回率和F1-score是常用的评估指标,它们从不同角度反映了模型的预测效果。本文将详细介绍这些指标的概念、计算方法及其在实际应用中的权衡关系。

一、 TP、TN、FN、FP 概念

在介绍准确率、精确率、召回率和F1-score之前,我们先来理解四个基本概念:真正例(True Positives, TP)、假正例(False Positives, FP)、假负例(False Negatives, FN)和真负例(True Negatives, TN)。

  • TP(True Positives):真正例,即正例预测为真(预测为正例而且实际上也是正例);
  • FP(False Positives):假正例,即负例预测为真(预测为正例然而实际上却是负例);
  • FN(false Negatives):假负例,即正例预测为假(预测为负例然而实际上却是正例);
  • TN(True Negatives):真负例,即负例预测为假(预测为负例而且实际上也是负例)。

二、准确率、精确率、召回率、F1-score计算

1.准确率(accuracy)

准确率是所有预测正确的样本(包含正例或负例均预测正确,即正例预测为正TP或负例预测为负TN)占总样本的比例。它是衡量模型整体预测能力的一个重要指标。

2.精确率(查准率,precision)

精确率是预测为真的正例样本(TP)与全部预测为真的样本(对于预测而言,包括真正例TP,假正例FP)的比值。即正确预测为正的占全部预测为正的比例,(真正正确的占所有预测为正的比例)。

3、召回率(也叫查全率,recall)

召回率是预测为真的正例(TP)占全部实际为正例的样本(可能将实际正例预测为正例即真正例TP,也可能实际正例预测为负例即假负例FN)的比例(真正正确的占所有实际为正的比例)。

4、F1-score

精确率和召回率互相影响,理想状态下肯定追求两个都高,但是实际情况是两者相互“制约”:追求精确率高,则召回率就低;追求召回率高,则通常会影响精确率。我们当然希望预测的结果精确率越高越好,召回率越高越好,但事实上这两者在某些情况下是矛盾的。这样就需要综合考虑它们,最常见的方法就是F-score。

F1值为算数平均数除以几何平均数,且越大越好,将Precision和Recall的上述公式带入会发现,当F1值小时,True Positive相对增加,而false相对减少,即Precision和Recall都相对增加,即F1对Precision和Recall都进行了加权。

一般来说准确率和召回率呈负相关,一个高,一个就低,如果两个都低,一定是有问题的。一般来说,精确度和召回率之间是矛盾的,这里引入F1-Score作为综合指标,就是为了平衡准确率和召回率的影响,较为全面地评价一个分类器。F1是精确率和召回率的调和平均。F1-score越大说明模型质量更高。

学习参考文档:https://blog.csdn.net/qq_39506862/article/details/129157576

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号