SPSS统计实战之—卡方检验操作详解
SPSS统计实战之—卡方检验操作详解
卡方检验是统计学中用于分析计数资料的重要方法,广泛应用于医学、公共卫生等领域的研究。本文将详细介绍SPSS软件中各种卡方检验的应用场景和具体操作步骤,帮助读者掌握这一重要的统计分析工具。
变量家族有计量、计数和等级三种形式,t检验和F检验是用于比较组间计量资料的,而计数资料组间采用的方法是卡方检验。该检验的发明者是卡尔·皮尔逊(Karl Pearson),其基本思想是真实值与理论值的吻合程度。
成组四格表卡方
当我们的设计依然为成组(2组)设计,比较的效应指标为二分类,就需要采用成组四个表资料卡方检验。
操作流程:
1)对于二维计数资料统计表资料,数据库构建只能是3列式(行变量、列变量和频数变量;2)加权:菜单—数据—个案加权,将频数放入加权框;
3):点击卡方检验交叉表设置:分析—描述统计—交叉表;4)参数设置:选择“统计”,勾选“卡方”;点击“单元格”,勾选百分比。
主要结果解读:
交叉表显示相对数信息,产生主观意识,但需要进一步统计分析确认;
上图给出了5中卡方检验结果,第一种Pearson卡方,P=0.012<0.05,差异具有统计学差异。
成组四格表卡方检验,软件会自动计算5种卡方检验,需要根据研究目的和条件进行选择:
(1)N≥40并且T≥5:选择Pearson卡方;
(2)N≥40并且1≤T<5:选择连续性校正卡方检验;
(3)N<40 或者T<1:选择Fisher精确概率法;
(4)N≥40并且T≥5:选择似然比卡方检验与Pearson卡方一致。
成组R*C表
前面说的是成组中的2组,统计学存在2K 效应,当K(K≥3)组设计,均超过4个单元格,这类表格叫做R*C表。
操作流程:1)加权;2)交叉表设置:菜单—分析—描述统计—交叉表,年龄分组放入行,疾病构成放入列;3)参数设置:“统计”按钮,选择“卡方”,“单元格按钮”选择行百分比。
主要结果解读:
根据交叉表结果和卡方检验结果,可以看到统计学差异。
但是上图共有三种卡方,如何选择呢?
(1)Pearson卡方:无任何一个单元格理论频数T<1,且1≤T<5的格子数不超过总格子数的1/5;
(2)如(1)条件不满足,可以考虑增加样本量;专业上进行删除或者合并;采用R*C表资料的Fisher确切概率法;
(3)线性关联,当我们研究目的是研究是否存在线性趋势时使用。
成组R*C表效应指标比较
但我们想探究分析的构成组到底哪里不同,就可以进行列的比较分析。
操作流程:1)加权;2)分析—描述统计—交叉表,与上述设置一致;3)参数设置,“单元格”选择行百分比,同时勾选“比较列的比例”。
主要结果解读:
可以看到在病变构成频数表中,产生的a和b下标,从而依据下标的不同,进而得出主要是第一种和后三种型的构成不同。
R*C表确切概率法
对于四格表资料,Fisher是自动计算的,而当R*C卡方条件不符合时,也可以采用Fisher确切概率法。
操作流程:其他流程基本一致,在参数设置时记得勾选“精确”。
主要结果展示:
结果可见R*C表Fisher确切法检验,P<0.05,和上方Pearson卡方一致。
线性趋势卡方
线性关联是研究数据的变化是否具备线性趋势,之前的结果中,均有线性关联分析的结果。
操作流程:与前述四格表操作类似,不再详述;
结果展示:
线性关联卡方,P<0.05,说明不同年份的数据存在线性增长的趋势。
配对设计卡方表
配对是一种设计,如果采用配对设计,而效应指标为计数资料,此时需采用配对设计卡方检验。常用的是配对设计四格表资料(22)卡方检验(McNemar),还有配对设计的(KK)方表卡方检验(McNemar-Bowker)。两种方法操作步骤一样,都是McNemar检验。
操作流程:1)加权个案:数据—加权个案,将频数放入加权个案框中;2)分析—描述统计—交叉表,两种方法分别放到行和列,顺序没关系;3)参数设置:“统计”选择“McNemar卡方”;
主要结果解读:
McNemar卡方P<0.05,有差异,因此,两种方法的检测结果不同。
分层卡方
前述的计数资料均为二维表,只有一个行变量和一个列变量,但有时候会遇到维度≥3的情况,对于3维表可以采用分层卡方进行分析。
操作流程:1)加权个案:数据—加权个案,将“人数”放入加权个案框中;2)分析—描述统计—交叉表,将年龄分组放入行,疾病构成放入列,地区放入层;3)参数设置:“统计”选择卡方和CMH卡方,“单元格”勾选行百分比;
主要结果解读:
(1)卡方检验:样本量均大于40,理论频数均大于5,因此参看Pearson卡方检验结果,得到均值P<0.05;
(2)比值比齐次检验:P>0.05,说明地区间差异无统计学意义;
(3)条件独立性检验:采用了Cochran's和Mantel-Haenszel两种卡方检验,前者是后者的改进版,P均<0.05,说明儿童和成人病变类型差异存在统计学意义;
(4)Mantel-Haenszel OR值估算:结果可见OR(MH)=0.151,指成人得其他类型的松毛虫病是儿童的0.151倍。
卡方分割
方差分析多组间差异分析,做了事后两两比较检验;然而进行R*C表资料卡方检验,多组间分析软件并未提及两两比较的方法,此时需要人为的对统计表进行分割分析,即卡方分割。
卡方分割就是对检验水准α进行调整,有两种分割方式:
(1)比如A、B和C三组资料比较,则两两比较需要进行3次,则检验水准α'=2α/K(K-1)=α/3=0.0167;
(2)若是A组、B组和对照组三组资料,各组只和对照组比较,则比较次数为组数K-1次,即α'=α/ (k-1)=0.05/2=0.025.得到α'后,进行卡方检验,只有统计分析得到的P值小于α'才具有统计学意义,不再是小于0.05为统计学意义的标准了。