医学研究中的卡方分布应用:如何进行假设检验?
医学研究中的卡方分布应用:如何进行假设检验?
在医学研究中,卡方检验是一种常用的方法,用于判断两个离散变量之间是否存在统计学上的显著关联。例如,在比较两种药物的治愈率时,可以通过构建列联表并计算卡方统计量来确定差异是否具有统计意义。本文将详细介绍如何利用卡方分布在医学研究中进行假设检验,帮助研究人员更好地理解和应用这一重要工具。
卡方检验的基本原理与应用场景
卡方检验是一种用途广泛的分析定类数据差异性的方法,用于比较定类与定类数据的关系情况,以及分析实际数据的比例与预期比例是否一致。
判断两个分类变量之间的关联性
例如,通过对某地区居民的性别和购买行为的调查,来分析性别与购买行为之间是否存在关联。
判断观察频数与理论频数之间的差异
例如,评估某公司的产品销售比例与理论预期比例之间是否存在显著差异。
拟合优度检验
评估数据是否符合预期的分布,例如评估骰子是否均匀、观察到的基因型频率是否符合Hardy-Weinberg平衡等。
卡方检验的操作步骤与注意事项
基本操作步骤
建立假设:原假设(H0)是分类变量间无关联,备择假设(H1)是分类变量间存在关联。
计算卡方统计量:利用卡方检验公式,结合观察频数和期望频数计算卡方统计量。
确定自由度:自由度等于(行数 - 1) * (列数 - 1)。
选择显著性水平:通常设定为0.05或0.01。
计算卡方值和p值:根据自由度和显著性水平,查找对应的卡方临界值。
判断结果:如果卡方统计量大于卡方临界值(p<0.05),则拒绝原假设,表明观察频数与期望频数之间存在显著差异,即两个分类变量之间具有关联性。若卡方统计量小于或等于卡方临界值(p≥0.05),则不能拒绝原假设,认为观察频数与期望频数之间没有显著差异,两个分类变量之间可能是独立的。
注意事项
适用范围:卡方检验适用于分类变量间的关系分析。对于连续变量,需要进行离散化处理后才能进行卡方检验。但在离散化过程中,可能会引入一定的信息损失。
样本量要求:卡方检验对样本量有一定要求。总样本量通常应不小于40,且每个单元格的期望频数不小于5。当样本量较小或期望频数过低时,卡方检验的结果可能不准确,此时可以考虑使用费希尔确切概率检验等其他方法。
显著性水平与自由度:在卡方检验中,需要设定一个显著性水平(如0.05或0.01),并根据列联表的行数和列数计算自由度。显著性水平和自由度将影响卡方检验的结果。
无法判断因果关系:卡方检验仅能分析分类变量间的关联性,而无法确定因果关系。要确立因果关系,需要进行更严谨的实验设计和分析。
效应量计算:卡方检验只能告诉我们分类变量间是否存在关联,但不能直接衡量关联程度。为了评估关联程度,可以计算效应量,如Cramér's V或Phi系数。这些效应量指标的取值范围为0到1,值越大表示关联程度越高。
实际案例分析
案例1:癌症患病率与年龄的关系研究
假设我们有一组数据,记录了某种癌症的患病情况和年龄分布。数据如下表所示:
年龄段 | 患病人数 | 未患病人数 | 合计 |
---|---|---|---|
20-39 | 35 | 65 | 100 |
40-59 | 65 | 135 | 200 |
60-79 | 55 | 145 | 200 |
80以上 | 45 | 55 | 100 |
合计 | 200 | 400 | 600 |
我们的研究假设是,年龄与患癌症的发生率之间存在关系。具体而言,我们想知道,不同年龄段的人群中,患癌症的人数是否与预期相符,还是存在显著差异。
为了回答这个问题,我们需要进行卡方检验。具体步骤如下:
- 计算期望值:
年龄段 | 患病人数期望值 | 未患病人数期望值 |
---|---|---|
20-39 | 33.3333 | 66.6667 |
40-59 | 66.6667 | 133.3333 |
60-79 | 66.6667 | 133.3333 |
80以上 | 33.3333 | 66.6667 |
- 计算卡方值:
年龄段 | 患病人数(A-T)^2 /T | 未患病人数(A-T)^2 /T |
---|---|---|
20-39 | 0.0833 | 0.0417 |
40-59 | 0.0417 | 0.0208 |
60-79 | 2.0417 | 1.0208 |
80以上 | 4.0834 | 2.0417 |
卡方值 = 0.0833 + 0.0417 + 0.0417 + 0.0208 + 2.0417 + 1.0208 + 4.0834 + 2.0417 = 9.3751
自由度 = (4-1) * (2-1) = 3
查卡方临界值表,根据卡方值和自由度可以查找到对应的临界值和p值。在本例中,自由度为3,显著性水平设为0.05。查表可得,卡方临界值为7.81,因为卡方值(9.3751)大于临界值(7.81),所以p值小于显著性水平0.05,所以可以拒绝原假设,接受备择假设,认为不同年龄段的人群中,患癌症的人数存在显著差异。
案例2:HBV感染研究
当前有一项HBV感染医学研究,并被试分为预防组和非预防组,共两组,并且记录阳性和阴性的数据,汇总如下表,似问两组数据HBV感染率有无差别?数据如下:
组别 | 阳性 | 阴性 | 总计 |
---|---|---|---|
预防组 | 4 | 18 | 22 |
非预防组 | 5 | 6 | 11 |
总计 | 9 | 24 | 33 |
Fisher卡方检验利用超几何分布原理进行计算,共不同与pearson卡方检验会提供卡方值和p值两项。Fisher卡方检验时仅提供p值。SPSSAU在医学研究模块->卡方检验方法中提供22时卡方检验,如果是汇总表格格式,也或者RC结构时,可使用fisher卡方按钮完成计算。
检验统计量:
检验 | 卡方值 | p 值 |
---|---|---|
Fisher卡方 | - | 0.121 |
Pearson卡方 | 2.750 | 0.097 |
连续校正卡方 | 1.547 | 0.214 |
上表格展示出fisher卡方、pearson卡方和连续校正卡方统计量,从上表可知:fisher卡方时仅提供p值,而且从pearson卡方和连续校正卡方对应的p值来看,3个值均呈现出一致性结论即:预防组与非预防组时HPV感染情况无明显差异。
特别提示:
通常情况下:如果总样本量>40且期望频数值全部均大于5时,一般使用pearshon卡方值,如果总样本量大于40,但出现期望频数小于5的单元格时,可优先使用连续校正卡方,也或者使用fisher卡方值,如果总样本量小于40,也或者出现期望频数小于1的单元格时,此时建议使用fisher卡方检验。具体以文献为准即可,可能不同文献的标准不完全一致。
期望频数:
阳性 | 阴性 | 总计 | |
---|---|---|---|
预防组 | 6.0 | 16.0 | 22 |
非预防组 | 3.0 | 8.0 | 11 |
总计 | 9 | 24 | 33 |
上表格展示各单元格的期望频数,上表格可以看到,非预防组阳性的期望频数为3.0<5,并且总样本量为33,因而本案例数据使用fisher卡方检验量较为适合。
上表格展示实际频数,并且可通过下拉选择切换展示效果,按频数或者按百分比展示。
总结
卡方检验在医学研究中具有重要作用,能够帮助研究者分析分类变量之间的关系,判断观察数据与理论预期之间的差异。通过合理运用卡方检验,可以为医学研究提供有力的统计学支持。然而,在使用卡方检验时,研究者需要注意其适用范围和条件,确保分析结果的准确性和可靠性。
