卡方检验:检验变量之间相关性的实用指南
创作时间:
作者:
@小白创作中心
卡方检验:检验变量之间相关性的实用指南
引用
CSDN
1.
https://blog.csdn.net/weixin_41506107/article/details/146135405
卡方检验是一种用途广泛的假设检验方法,主要用于检验两个分类变量之间的独立性或检验观测频数与期望频数是否一致。本文将详细介绍卡方检验的原理、实施步骤以及如何使用Python进行实现。
一、概念
卡方检验是一种用途很广的假设检验方法,一般用于检验两个分类变量之间的独立性或者检验观测频数与期望频数是否一致。其原理是统计样本的实际频数与期望频数之间的偏离程度——卡方值。如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。
对于卡方检验的有效性,每个单元格的期望频数应该达到一定的数量,通常至少为5。如果期望值太小,卡方检验可能不准确,此时应考虑使用Fisher's Exact Test或其他方法。
二、卡方检验的实施步骤
(一)建立假设
- 原假设(H₀):变量之间独立或观测分布与理论分布一致。
- 备择假设(H₁):变量之间不独立或观测分布与理论分布不一致。
(二)计算卡方值、自由度和p值
- P值:P值表示在原假设(即分类变量之间是独立的)为真的情况下,观察到χ²统计量或更极端值的概率。如果P值小于预定的显著性水平(比如0.05),我们就拒绝零假设,认为分类变量之间是相关的。
- 自由度:卡方检验的自由度是由分类变量的类别数量决定的,计算公式为:(行数-1) x (列数-1)。
(三)计算卡方统计量
计算分2个场景:
判断两个分类变量是否相互独立
应用场景:例如,检验性别与是否吸烟之间的关系
- 构建列联表(Contingency Table)。
- 计算期望频数。
- 计算卡方统计量:
其中,Oi是观测频数,Ei 是期望频数。
- 根据卡方统计量和自由度,查找卡方分布表,确定p值。
拟合优度检验(Goodness-of-Fit Test)
检验观测频数与期望频数是否一致,判断样本分布是否符合某种理论分布。例如,检验掷骰子结果是否均匀分布
- 计算期望频数
- 计算卡方统计量:
- 根据卡方统计量和自由度,查找卡方分布表,确定p值。
三、数据解读
p值如果很小,比如p=0.05,那么我们有95%的把握认为原假设不成立,两个变量之间不独立,存在相关性。或者,观测分布与理论分布不一致。
四、Python代码实现
简易版
from scipy.stats import chi2_contingency
# 构建列联表
data = [[80, 50], [60, 40]]
# 执行卡方检验
chi2, p, dof, expected = chi2_contingency(data)
print("卡方统计量:", chi2)
print("p值:", p)
print("自由度:", dof)
print("期望频数:", expected)
本文原文来自CSDN
热门推荐
牙痛怎么办?金元名医李东垣仅用5味药,方药对证有立刻止痛之效
年内208只基金清盘,9月清盘数创6年新高
私募基金清算全流程指南:从决定终止到保存清算材料
赵露思新大片引两极评价:有人夸有潜力,有人批妆容油腻
北影节造型引热议,赵露思时尚之路的挑战与突破
《许我耀眼》开机:赵露思转型都市剧,搭档陈伟霆
赵露思新剧《恋人》花絮曝光,搭档彭冠英演绎8年爱情长跑
深圳“9·29”新政效应显现:新房现“日光盘”,土地市场回暖
园林常见石楠花,竟有如此丰富的营养价值和食用方法
绵阳社保局公布新联系方式,2024年养老险缴费延至明年3月
绵阳12333社保热线:政策咨询到业务办理全覆盖
李煜的悲歌:当才华遇上无法重来的命运
电动车电池充电全解析:从基本概念到未来趋势
Cell:赵立平团队破解肠道菌群结构密码,有望成为健康评估新标准
中卫至恩施大峡谷:峡谷石林深度游攻略
如何应对儿子对妈妈发脾气:实用指南与技巧
当一个人心烦的时候,用什么方法调节好情绪?这5个方法要看看
探访《黑神话:悟空》取景地:蔚县南安寺塔
张艺谋点赞《黑神话:悟空》,影视化能否成真?
《黑神话:悟空》新手速成秘籍:从画面设置到战斗技巧全攻略
科学情绪管理的5种方式
1965年属蛇人与属猴人的最佳配对:从传统到现代的解读
原创动漫如何在竞争激烈的市场中突围?
白萝卜和木耳:肠道健康的黄金搭档
汽车年检新政:异地可检、网上办理,省时省钱更便捷
汽车电瓶鼓胀处理指南:立即停用,专业维修,确保安全
昆明必游地:海埂公园观鸥全攻略,交通美食一文掌握
新手必看:《我的世界》从入门到精通攻略
Minecraft挖矿攻略:1.20版本矿石分布与技巧详解
《爱的五种语言》教你提升人际魅力