深度学习:二次加权Kappa系数(QWK)详细介绍
创作时间:
作者:
@小白创作中心
深度学习:二次加权Kappa系数(QWK)详细介绍
引用
CSDN
1.
https://m.blog.csdn.net/m0_56184997/article/details/144433198
二次加权Kappa系数(QWK)是深度学习中一个常用的评价指标,主要用于衡量两个评分者(如自动评分系统和人工评分)之间的一致性水平。本文将通过一个具体的例子,详细介绍QWK的计算步骤及其应用场景。
1. QWK定义
QWK(Quadratic Weighted Kappa)已在整体论文评分和论文特征评分研究中广泛采用,旨在衡量两名评分员(自动评分系统和人工评分)之间的一致性水平。它考虑了不一致性的严重程度,并使用一个权重矩阵来量化这种差异。对于二次加权,权重是根据评分差值的平方来计算的,因此更大的评分差异会得到更高的惩罚。
2. QWK计算步骤
假设我们有两个评分员,他们分别对100篇论文进行了评分。评分等级为1到2分,其中1分为最低分,2分为最高分。
(1)创建观测混淆矩阵O
在100篇论文中,假设有40篇论文同时被两个评分员打了1分;20篇论文被A评分员打了2分,H评分员打了1分;10篇论文被A评分员打了1分,H评分员打了1分;有30篇论文同时被两个评分员打了2分,即得到如下观测混淆矩阵O:
评分员H打1分 | 评分员H打2分 | |
---|---|---|
评分员A打1分 | 40 | 10 |
评分员A打2分 | 20 | 30 |
这里可以把A评分员看成是自动打分系统(即是预测值),H评分员看成是人工打分(即为真实值)。其中Pi和Pj为行和列边缘分布概率,Pi表示每个实际类别中的样本总数,Pj表示每个预测类别中的样本总数,可以看成这是评分员对每一个打分类别的倾向性。
(2)创建预期混淆矩阵E
预期混淆矩阵E的计算公式如下,其中Pi和Pj为行和列边缘分布概率:
计算得到如下预期混淆矩阵E:
评分员H打1分 | 评分员H打2分 | |
---|---|---|
评分员A打1分 | 30 | 20 |
评分员A打2分 | 30 | 20 |
(3)构建权重矩阵W
权重矩阵W的计算公式如下,其中N为分类的总类数:
计算得到如下权重矩阵W:
评分员H打1分 | 评分员H打2分 | |
---|---|---|
评分员A打1分 | 0 | 1 |
评分员A打2分 | 1 | 0 |
(4)计算二次加权Kappa值
二次加权Kappa值的计算公式如下:
就以此为例,计算Kappa值为:
Kw=1-(10.2+10.1)/(10.2+10.3)=1-(0.3/0.5)=0.4
3. 总结
Kappa值的含义如下:
- -1:完全不一致
- 0: 偶然一致
- 0.0~0.20: 极低的一致性(slight)
- 0.21~0.40: 一般的一致性(fair)
- 0.41~0.60: 中等的一致性(moderate)
- 0.61~0.80: 高度的一致性(substantial)
- 0.81~1: 几乎完全一致(almost perfect)
热门推荐
跟着阿海吃遍潮汕:五日美食之旅
诸葛亮的《出师表》为何能千古传颂?情真意切,内容详实且具体
你的充电宝能带上火车吗?
阴阳五行学说在石磨设计中的体现和应用
寒假必读:《小书虫的故事》助你养成好习惯
揭秘美国富人的高收益投资秘籍
婺源小长假是如何做到151%的增量? 小县城全域旅游的揽客密码
昆明:中国最“安逸”的省会城市,冬无严寒夏无酷暑
月到中秋圆——诗词里的中国节
学校减盐健康教育推广项目总结会在京召开
智能晾衣架是“智商税”吗?好太太、金贵夫人、网易严选等产品存在问题
手摇升降晾衣架安装全攻略:12步详解安装流程
中国传统节日顺序及文化解读:详解二十四节气与重要节日
常见的血液病有哪些?血液病常见症状有哪些?
血小板减少的原因及症状解析
血小板低的原因及后果是什么
中国人民武装警察部队哈尔滨指挥学院:北疆警官摇篮的辉煌历程
从武警哈尔滨指挥学院到职场的华丽转身
哈尔滨冰雪大世界开园啦!328元门票玩转超级冰滑梯、摩天轮
哈尔滨小雪来袭!你准备好过冬了吗?
鳄梨:高钾食物中的明星选手
慢性肾病患者如何科学控钾?
什么是有限空间作业?一文全弄懂
春节习俗大全:从小年到元宵节的传统与文化
元宵节为什么要吃汤圆?元宵节吃汤圆的寓意
体检后甘油三酯高要如何应变?揭秘4个方法,快速帮助降低血脂
凤凰山自驾游:东北第一大山的冬日仙境
哈尔滨冬季自驾游完全攻略:从车辆准备到安全驾驶,再到景点美食推荐
升降晾衣架安装步骤 维修及保养方法
扒高踩低的领导,职场大忌!