问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

深度学习笔记：最详尽解释混淆矩阵 Confusion Matrix

创作时间:

作者:

@小白创作中心

深度学习笔记：最详尽解释混淆矩阵 Confusion Matrix

引用

CSDN

1.

https://blog.csdn.net/weixin_53765658/article/details/140119607

混淆矩阵是机器学习中用于评估分类模型性能的重要工具。它通过展示模型预测结果与实际结果之间的关系，帮助我们理解模型的正确率和错误类型。本文将通过具体案例，详细解释混淆矩阵的概念及其应用。

假设我们有包含临床测量数据的医疗数据，例如胸痛、良好的血液循环、动脉阻塞和体重。我们希望应用机器学习方法来预测某人是否会患上心脏病。

我们可以使用逻辑回归、k最近邻算法、随机森林或其他方法。为了决定哪种方法效果最好，我们首先将数据分为训练集和测试集。请注意，这将是一个使用交叉验证的绝佳机会。我们在训练数据上训练所有方法，并在测试集上测试每种方法，然后用混淆矩阵总结它们的性能。

混淆矩阵的行对应于机器学习算法的预测，而列对应于已知的真实情况。由于有两个类别，对于二分类（“有心脏病”或“没有心脏病”），混淆矩阵看起来像这样：左上角包含真正例（TP），即正确识别的心脏病患者。真正负例（TN）在右下角，即正确识别的无心脏病患者。左下角包含假负例（FN），即被错误识别为无心脏病的心脏病患者。右上角包含假正例（FP），即被错误识别为有心脏病的健康患者。

真正例 (TP): 正确识别的心脏病患者。
真正负例 (TN): 正确识别的无心脏病患者。
假负例 (FN): 被误分类为健康的心脏病患者。
假正例 (FP): 被误分类为心脏病患者的健康人。

例如，当将随机森林应用于测试数据时，我们得到：

真正例 (TP): 142
真正负例 (TN): 110
假负例 (FN): 29
假正例 (FP): 22

对角线上的数字（绿色框）是正确分类的样本，而非对角线上的数字（红色框）是错误分类的样本。

将随机森林的混淆矩阵与k最近邻算法的混淆矩阵进行比较：

随机森林: TP=142, TN=110
k最近邻算法: TP=107, TN=79

由于107 < 142且79 < 110，随机森林的表现更好，因此我们会选择随机森林而不是k最近邻算法。

当应用逻辑回归时，随机森林和逻辑回归的混淆矩阵非常相似，难以选择。我们将在未来讨论更复杂的指标，如敏感性、特异性、ROC和AUC，以帮助做出决定。

多类混淆矩阵

现在，让我们看看一个更复杂的混淆矩阵。

这是一个新的数据集。基于人们对电影《侏罗纪公园III》、《老婆大逃亡》、《Out Kold》和《Howard the Duck》的看法，我们能否使用机器学习方法预测他们最喜欢的电影？

如果最喜欢的电影选项是《Troll 2》、《Gore Police》或《Cool as Ice》，则混淆矩阵将有3行和3列。对角线（绿色框）是机器学习算法做对的地方，其他地方是算法出错的地方。

混淆矩阵的大小取决于预测类别的数量。

2个类别: 2x2混淆矩阵。
3个类别: 3x3混淆矩阵。
4个类别: 4x4混淆矩阵。
40个类别: 40x40混淆矩阵。

总之，混淆矩阵展示了你的机器学习算法做对和做错的地方。

热门推荐

中医专家推荐：人参归脾丸调理大便不成形

中医专家推荐：人参归脾丸调理大便不成形

广州唯一入选！番禺这条夏季美食避暑线路赶紧收藏起来

广州唯一入选！番禺这条夏季美食避暑线路赶紧收藏起来

蛇年春节，通州区文化盛宴来袭！

蛇年春节，通州区文化盛宴来袭！

福建莆田：探访千年文脉的龙华双塔

福建莆田：探访千年文脉的龙华双塔

教育部力推VR技术进课堂，八大主题课程助力校园安全教育

教育部力推VR技术进课堂，八大主题课程助力校园安全教育

用好白萝卜能止咳！推荐这3种食疗法

用好白萝卜能止咳！推荐这3种食疗法

玉米高产种植技术全攻略

玉米高产种植技术全攻略

玉米产量预测研究综述

玉米产量预测研究综述

B站跨年晚会再现《卖拐》：当小品开始抽象，经典重现引全民狂欢

B站跨年晚会再现《卖拐》：当小品开始抽象，经典重现引全民狂欢

刘能回归，《乡村爱情14》笑点满满！

刘能回归，《乡村爱情14》笑点满满！

赵本山携赵家班全球巡演，2月起赴5城演出

赵本山携赵家班全球巡演，2月起赴5城演出

DeepSeek如何才能更好？

DeepSeek如何才能更好？

中山二日游：走近伟人，领略岭南文化

中山二日游：走近伟人，领略岭南文化

VR看房：房地产销售的新革命

VR看房：房地产销售的新革命

数字展里的吴县古民居：传统与科技的完美融合

数字展里的吴县古民居：传统与科技的完美融合

太湖古镇：太湖畔的“不夜城”

太湖古镇：太湖畔的“不夜城”

冬日打卡湖州太湖古镇，美食美景全攻略！

冬日打卡湖州太湖古镇，美食美景全攻略！

木渎古镇：吴越文化的千年传承

木渎古镇：吴越文化的千年传承

什么是社交媒体营销？ 6 大重点教你有效的利用社交平台做营销

什么是社交媒体营销？ 6 大重点教你有效的利用社交平台做营销

东山岛&潮州：自驾游的文化探险

东山岛&潮州：自驾游的文化探险

潮汕出发，福建自驾游打卡网红景点！

潮汕出发，福建自驾游打卡网红景点！

上海市第十人民医院专家推荐：胸椎骨折术后饮食调理指南

上海市第十人民医院专家推荐：胸椎骨折术后饮食调理指南

秋冬季节胸椎术后康复指南

秋冬季节胸椎术后康复指南

云南保山：咖啡庄园里的文旅融合新探索

云南保山：咖啡庄园里的文旅融合新探索

胡萝卜炒蛋：营养搭配的科学解读

胡萝卜炒蛋：营养搭配的科学解读

安徽铜陵永泉小镇：秋日童话世界

安徽铜陵永泉小镇：秋日童话世界

曼陀罗：浪漫死亡之花的多重寓意

曼陀罗：浪漫死亡之花的多重寓意

暑期亲子游：安全与教育同行

暑期亲子游：安全与教育同行

庐山站到牯岭镇完美一日游攻略

庐山站到牯岭镇完美一日游攻略

庐山站到庐山景区：最便捷的交通指南

庐山站到庐山景区：最便捷的交通指南

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号