问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

一般四格表卡方检验的SPSS操作教程及结果解读

创作时间:
作者:
@小白创作中心

一般四格表卡方检验的SPSS操作教程及结果解读

引用
腾讯
1.
https://view.inews.qq.com/k/20241218A00FLM00

四格表卡方检验是医学统计学中常用的一种假设检验方法,用于分析两个分类变量之间的关联性。本文将详细介绍四格表卡方检验的基本概念、使用条件以及在SPSS软件中的具体操作步骤,并通过一个实际案例进行演示。

一般四格表卡方检验介绍

一般四格表卡方检验可以检验两个样本的总体分布是否相同,或者两个样本是否来自同一总体。连续校正卡方只在四格表中才计算。

如何选择统计结果,教科书给出了如下判断标准:

  1. 当n≥40且所有T≥5时(T代表每个样本的理论频数),用Pearson卡方,若所得P=0. 05时,用Fisher精确检验。
  2. 当n≥40但有1≤T≤5时,用连续校正卡方。
  3. 当n<40或T<1时,用Fisher精确检验。

研究表明,在Pearson卡方、似然比卡方和Fisher的精确检验三种方法中,似然比卡方最为准确,即使在小样本中也是如此。而Fisher的确切概率法的分布假设在很多时候并不成立,因此建议大家多参考似然比卡方的结果。

对于Fisher 确切概率法有关说法:
(1)凡是四格表资料均可采用 Fisher 确切概率法进行假设检验。
(2)Fisher 确切概率法基于超几何分布,计算的基本步骤是在四格表的周边合计不变的条件下,计算表内四个基本数据的各种组合之概率,再计算满足一定条件的各四格表累计概率;若行双侧检验,则计算满足等于及大于样本|p1-p2|条件的所有格子的累计概率;若进行单侧检验,只计算等于及大于样本(p1-P2)的累计概率。
(3)依次增减四格表中某个格子(一般选用行合计与列合计均为最小的那个格子)的数据,可列出周边合计不变条件下各种组合的四格表(一般可列出最小周边合计数加1 个四格表)

一般四格表卡方检验使用条件

  1. 样本量要求:
    四格表卡方检验要求每个格子的理论频数(即期望频数)应至少为5。如果某个格子的理论频数小于5,可以考虑合并相邻的格子或使用Fisher精确检验(适用于样本量较小的情况)。

  2. 总样本量要求:
    总样本量必须至少为40。这是卡方检验能够有效进行的统计假设之一。

  3. 格子的理论频数分布:
    如果所有格子的理论频数都大于或等于5,使用Pearson卡方检验;如果理论频数在1到5之间,使用连续性校正的卡方检验;如果任何格子的理论频数小于1或总样本量小于40,使用Fisher精确概率法。

这些条件确保了卡方检验的统计效能和结果的可靠性。在实际应用中,如果数据不满足这些条件,可能需要调整分析方法或考虑使用其他更适合的检验方法。

案例的SPSS操作演示

分析示例

将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?

研究假设

H0:两药治疗消化道溃疡的愈合率相同,π₁=π₂。
H₁:两药治疗消化道溃疡的愈合率不同,π₁ ≠π2。
α=0.05

数据录入

  1. 变量视图
    名称 treat 标签 处理 值1=洛赛克2=雷尼替丁
    名称 result 标签 疗效 值1=愈合2=未愈合
    名称 weight 标签 权重

  2. 数据视图 注意该数据视图和四格表的差别。

操作流程

  1. 下图是对数据的预定义,在数据(D) 下拉菜单框中完成,即设置权重变量,该操作是四格表运算的基本操作。

  1. 下图是四格表统计的主对话框,主要设置行变量和列变量,该例中行变量指分组变量 处理treat, 列变量指结果变量疗效result, 行变量和列变量的设置只对结果的排列产生影响,并不影响其统计结果,因此大家将行变量与列变量调换也可。

  1. 下图是对检验方法的选择,选用卡方检验(Chi-square), 该检验用于判断行、列变量是否独立,如果数据不满足卡方检验的要求(不能有单元格的期望值<1,不能有20%以上单元格的期望值<5),则系统会在分析结果的最后给出警告,提示作者采用确切概率法。

  1. 下图中各选项是计算四格表中统计描述指标,观察值(observed) 指原始数据,期望值 (expected) 指统计过程中的理论数,一般用处不大。各种百分比,如行百分比(Row) 、列百分比(Column)及合计百分比(Total), 均为四格表的统计描述内容,比较重要。

结果解释

  1. 下表是处理记录缺失值情况报告,可见169例均为有效值。

  1. 下表标明了各百分比结果,百分数的含义关键是确定分子和分母,分子好确定,也就是各单元格的观察值(计数),分母则需要确定所对应的100%项,如洛赛克组中有三个百分数值,处理中的%值为75.3%,对应的100%为处理横向合计,即在洛赛克处理组中,治愈率为75.3%;疗效中%值为55.7%,对应的100%为纵向疗效值,即在所有愈合的病例中,由洛赛克治疗而愈合的占55.7%;总计37.9%,对应的100%为右下角的总合计值,即洛赛克治疗愈合的病例占总病例的37.9%。在本例中,最重要的百分数为处理中%,当然,根据需要,大家可以挑选不同的%作为统计描述值。

  1. 下表给出了一堆检验结果,如何选择统计结果,教科书给出了如下判断标准:
    (1)当n≥4且所有T≥5时,用Pearson 卡方,若所得P≈0.05时,用Fisher 精确检验。
    (2)当n≥40但有1≤T≤5 时,用连续校正卡方。
    (3)当n<40或 T<1时,用Fisher 精确检验。

本例N=169≥40, 且表下a 注释中说明0单元格的期望计数(理论数,T)<5,即T≥5成立,符合条件1,选用Pearson卡方值,x²=4.130,P=0.042<0.05, 说明两样本频率的差异具有统计学意义。结合前表中的百分数,可知洛赛克的愈合率为75.3%,雷尼替丁的愈合率为 60.7%,可以认为洛赛克治疗的愈合率比雷尼替丁的愈合率高。

注意事项

  1. 连续校正卡方只在四格表中才计算。
    2.研究表明,在Pearson 卡方、似然比卡方和Fisher 的精确检验三种方法中,似然比卡方 最为准确,即使在小样本中也是如此。而 Fisher 的确切概率法的分布假设在很多时候并不成立,因此建议大家多参考似然比卡方的结果。

参考文献:《临床医学研究中的统计分析和图形表达实例详解》

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号