问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

常见模型评价标准

创作时间:

作者:

@小白创作中心

常见模型评价标准

引用

CSDN

1.

https://blog.csdn.net/qq_35229591/article/details/143057907

前言

在机器学习和数据科学中，模型的性能评估是至关重要的环节。不同的应用场景可能需要不同的评价指标，以确保模型的预测能力符合实际需求。本篇文档旨在介绍几种常用的模型评价标准，包括准确率（Accuracy）、精确率（Precision）、召回率（Recall）以及F1_Score。通过了解这些指标的定义和应用场景，我们可以更好地选择合适的指标来评估和优化模型，避免因数据集不平衡或其他因素导致的误导性结论。

模型评价标准

图片来源：https://en.wikipedia.org/wiki/Precision_and_recall

缩写含义：

TP: True Positive
TN: True Negative
FP: False Positive
FN: False Negative

Accuracy（准确率）

是指分类器正确分类的样本数量与总样本数量的比例

$$Accuracy=\frac{TP+TN}{TP+TN+FP+FN}$$

Accuracy 对于不平衡数据集可能是一个误导性的指标。考虑一个样本，其中有95个负值和5个正值。在这种情况下，将所有值分类为负值会得到0.95的准确率分数。

有许多指标不会受到这个问题的影响。例如，平衡准确率（bACC）通过分别将真正例和真反例的预测值除以正负样本的数量，并将它们的和除以2来进行规范化：

$$Balanced \ accuracy=\frac{TPR+TNR}{2} \ TPR=\frac{TP}{TP+FN} \ TNR=\frac{TN}{TN+FP}$$

对于之前的例子（95个负样本和5个正样本），将所有样本都分类为负样本得到的平衡准确率得分为0.5（最大bACC得分为1），这相当于在平衡数据集中随机猜测的期望值。平衡准确率可以作为一个模型的整体性能指标，无论真实标签在数据中是否不平衡，假设FN的代价与FP相同。

Precision（精确率）

是指分类器预测为正例的样本中真正为正例的样本数占预测为正例的样本数的比例。

$$Precision=\frac{TP}{TP+FP}$$

Recall（召回率）

是指分类器预测为正例的样本中真正为正例的样本数占实际为正例的样本数的比例。

$$Recall=\frac{TP}{TP+FN}$$

$$Recall = TPR$$

F1 Score

传统的 F-measure 或平衡 F-score（F1 分数）是精确率和召回率的调和平均值：

$$F_{1}=2 \times \frac{precision \times recall}{precision+recall}$$

问: Accuracy、Precision、Recall 一样吗？

不一样。

Accuracy 表示分类器总体的分类准确度，而 Precision 和 Recall 则分别强调分类器在预测正例时的准确性和分类器对真正例的识别能力。在不同场景下，优化的目标也不同。例如，在垃圾邮件分类中（P=垃圾邮件，N=正常邮件），我们更关心 Precision，因为误判一封正常邮件为垃圾邮件的代价更高。而在新冠检测中（P=阳性，N=健康），我们更关心 Recall，因为漏诊一位患者的代价更高。

热门推荐

桂林摄影之旅：肇兴侗寨最美瞬间

桂林摄影之旅：肇兴侗寨最美瞬间

心理自愈：如何用正念静观找回内心的平和

心理自愈：如何用正念静观找回内心的平和

春运抢票攻略：如何选最舒适的长途班车座位？

春运抢票攻略：如何选最舒适的长途班车座位？

煎鱼不粘锅全攻略：大厨传授选材烹饪秘诀

煎鱼不粘锅全攻略：大厨传授选材烹饪秘诀

全球刚经历最热十年，巴库气候大会将定新融资目标

全球刚经历最热十年，巴库气候大会将定新融资目标

小王子与玫瑰：一段关于爱与责任的成长之旅

小王子与玫瑰：一段关于爱与责任的成长之旅

佛山人事经理薪资水平全解析：从行业到经验的全方位分析

佛山人事经理薪资水平全解析：从行业到经验的全方位分析

4种亲子互动活动，助力孩子语言、情感、运动能力全面提升

4种亲子互动活动，助力孩子语言、情感、运动能力全面提升

“黑马艺术家”倪新宽：书法作品稳健升值，收藏价值凸显

“黑马艺术家”倪新宽：书法作品稳健升值，收藏价值凸显

感受来自古时的回声，宁波古建筑景点推荐

感受来自古时的回声，宁波古建筑景点推荐

唾液中的超级英雄：乳杆菌和溶菌酶

唾液中的超级英雄：乳杆菌和溶菌酶

多层PCB板在汽车电子领域的应用

多层PCB板在汽车电子领域的应用

科学运动，让骨关节炎患者有一个“绿色良方”

科学运动，让骨关节炎患者有一个“绿色良方”

生生不息的中国龙，新新不已的龙文化

生生不息的中国龙，新新不已的龙文化

丹栀逍遥丸治疗失眠效果好，但需遵医嘱服用

丹栀逍遥丸治疗失眠效果好，但需遵医嘱服用

冬季养肠秘籍：这些食物让你肠道活力满满

冬季养肠秘籍：这些食物让你肠道活力满满

抗日重大战役的回顾与反思的揭秘

抗日重大战役的回顾与反思的揭秘

哈利·波特25年：5亿册销量见证魔法世界的文学传奇

哈利·波特25年：5亿册销量见证魔法世界的文学传奇

延边G331国道自驾游：边境风光与朝鲜族文化之旅

延边G331国道自驾游：边境风光与朝鲜族文化之旅

冬季脚踝保暖有讲究：从穿衣到运动的科学防护

冬季脚踝保暖有讲究：从穿衣到运动的科学防护

跟着洋洋玩转湖南：六天五晚纯玩无购物VIP之旅

跟着洋洋玩转湖南：六天五晚纯玩无购物VIP之旅

2025春夏时装周：牛仔上衣迎来童趣与解构双雄对决

2025春夏时装周：牛仔上衣迎来童趣与解构双雄对决

车险出险超3次保费涨50%，4大妙招教你省保费

车险出险超3次保费涨50%，4大妙招教你省保费

骡子为何难产？揭秘背后的遗传秘密

骡子为何难产？揭秘背后的遗传秘密

高情商回应赞美的6种方式，让社交更从容

高情商回应赞美的6种方式，让社交更从容

法式指甲修剪技巧全攻略：让你的美甲更持久

法式指甲修剪技巧全攻略：让你的美甲更持久

豹2A8坦克穿甲弹技术揭秘：120毫米/L55滑膛炮的威力

豹2A8坦克穿甲弹技术揭秘：120毫米/L55滑膛炮的威力

橄榄油、花生油、菜籽油……哪种食用油最健康？

橄榄油、花生油、菜籽油……哪种食用油最健康？

冬日西昌：从邛海到世界最大温泉瀑布，一日游全攻略

冬日西昌：从邛海到世界最大温泉瀑布，一日游全攻略

文化旅游产业助力文化传承、经济发展与社会进步

文化旅游产业助力文化传承、经济发展与社会进步

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号