深度学习:二次加权Kappa系数(QWK)详细介绍
创作时间:
作者:
@小白创作中心
深度学习:二次加权Kappa系数(QWK)详细介绍
引用
CSDN
1.
https://m.blog.csdn.net/m0_56184997/article/details/144433198
二次加权Kappa系数(QWK)是深度学习中一个常用的评价指标,主要用于衡量两个评分者(如自动评分系统和人工评分)之间的一致性水平。本文将通过一个具体的例子,详细介绍QWK的计算步骤及其应用场景。
1. QWK定义
QWK(Quadratic Weighted Kappa)已在整体论文评分和论文特征评分研究中广泛采用,旨在衡量两名评分员(自动评分系统和人工评分)之间的一致性水平。它考虑了不一致性的严重程度,并使用一个权重矩阵来量化这种差异。对于二次加权,权重是根据评分差值的平方来计算的,因此更大的评分差异会得到更高的惩罚。
2. QWK计算步骤
假设我们有两个评分员,他们分别对100篇论文进行了评分。评分等级为1到2分,其中1分为最低分,2分为最高分。
(1)创建观测混淆矩阵O
在100篇论文中,假设有40篇论文同时被两个评分员打了1分;20篇论文被A评分员打了2分,H评分员打了1分;10篇论文被A评分员打了1分,H评分员打了1分;有30篇论文同时被两个评分员打了2分,即得到如下观测混淆矩阵O:
评分员H打1分 | 评分员H打2分 | |
|---|---|---|
评分员A打1分 | 40 | 10 |
评分员A打2分 | 20 | 30 |
这里可以把A评分员看成是自动打分系统(即是预测值),H评分员看成是人工打分(即为真实值)。其中Pi和Pj为行和列边缘分布概率,Pi表示每个实际类别中的样本总数,Pj表示每个预测类别中的样本总数,可以看成这是评分员对每一个打分类别的倾向性。
(2)创建预期混淆矩阵E
预期混淆矩阵E的计算公式如下,其中Pi和Pj为行和列边缘分布概率:
计算得到如下预期混淆矩阵E:
评分员H打1分 | 评分员H打2分 | |
|---|---|---|
评分员A打1分 | 30 | 20 |
评分员A打2分 | 30 | 20 |
(3)构建权重矩阵W
权重矩阵W的计算公式如下,其中N为分类的总类数:
计算得到如下权重矩阵W:
评分员H打1分 | 评分员H打2分 | |
|---|---|---|
评分员A打1分 | 0 | 1 |
评分员A打2分 | 1 | 0 |
(4)计算二次加权Kappa值
二次加权Kappa值的计算公式如下:
就以此为例,计算Kappa值为:
Kw=1-(10.2+10.1)/(10.2+10.3)=1-(0.3/0.5)=0.4
3. 总结
Kappa值的含义如下:
- -1:完全不一致
- 0: 偶然一致
- 0.0~0.20: 极低的一致性(slight)
- 0.21~0.40: 一般的一致性(fair)
- 0.41~0.60: 中等的一致性(moderate)
- 0.61~0.80: 高度的一致性(substantial)
- 0.81~1: 几乎完全一致(almost perfect)
热门推荐
MySQL 高可用方案选型解析
东北财经大学全国排名和最强专业解析
益安宁对冠心病有效吗
电子游戏谜题设计的哲学
影响棉花期货价格走势的因素有哪些?
基于CALPHAD方法的材料热力学建模
菠菜鸡蛋汤这样做最好喝,饭店级做法让鸡蛋不散花菠菜不发涩
读写障碍儿童给大人的一封信
如何选择合适的客厅挂钟尺寸并搭配家居风格?这种选择方式有哪些要点?
如何正确连接并设置路由器,确保网络稳定与安全?
“林下听经秋苑鹿,江边扫叶夕阳僧”郑谷三首经典诗作,朴素自然
《竹石》竹石郑燮原文、翻译、赏析和诗意
湿疹过敏源怎么查比较准确呢
探寻九旬尊称:传统文化中的长寿寓意与演变
《大决战》简评:历史与艺术的完美融合
尿臭味重是什么原因
在家量血压,7个要点须牢记
山西十大名酒:从杏花村到现代酿造,品味千年酒文化
一杯牛奶搞定减重:乳制品帮你健康瘦身!
大学生跑圈提升运动精准度与体验
物质的秘密:揭开密度的神秘面纱
圣托里尼旅游攻略:必游景点推荐及行程安排与省钱技巧
越野车四驱系统大揭秘:分时、适时、全时,新能源解耦有何不同?
Win11玩MC遇到问题怎么办?如何优化游戏体验?
湘雅医院:织密罕见病诊疗网,让“罕见”被看见
十二个月份对应五行属性 八字看月令五行
DDR核心和事务调度程序(DDRC)详解
它是与尿毒症关系最密切的指标!可惜大多数肾友却不会看
转口贸易合法吗?一文详解转口贸易的概念与案例
亲子关系的深度共读时光:通过共同阅读促进情感与认知发展