【Wilcoxon 检验】威尔科克森秩检验[非参数检验]附Matlab代码
【Wilcoxon 检验】威尔科克森秩检验[非参数检验]附Matlab代码
在统计推断的世界中,我们常常需要对数据进行假设检验,以验证我们对总体的一些猜想。传统的参数检验,例如t检验和方差分析,依赖于数据满足一定的分布假设,如正态性。然而,现实世界的数据往往并不那么完美,经常会偏离正态分布,甚至缺乏足够的测量尺度(例如,只有排序信息)。在这种情况下,非参数检验就显得尤为重要。威尔科克森秩检验(Wilcoxon Rank-Sum Test,亦称曼-惠特尼U检验)正是非参数检验中的一种,它无需对数据分布做出严格假设,而是利用数据的秩信息进行推断,因此具有更广泛的适用性。
一、威尔科克森秩检验的基本原理
威尔科克森秩检验是一种用于比较两个独立样本的非参数检验方法,其目的是检验这两个样本是否来自相同的总体分布。更具体地说,它关注的是两个样本的总体位置是否一致,即两个样本的中心趋势是否存在显著差异。与t检验直接比较两个样本的均值不同,威尔科克森秩检验并不依赖于数据的具体数值,而是基于数据的秩信息。
其核心思想是,如果两个样本来自相同的总体分布,那么它们的数据在混合排序后应该呈现随机分布,即每个样本的数据在总体排序中应该占据大致均匀的位置。如果两个样本来自不同的总体分布,例如,一个样本的总体位置明显高于另一个样本,那么该样本的数据在混合排序后将会集中在排序的较高端。
威尔科克森秩检验通过计算一个统计量,该统计量基于两个样本数据在混合排序后的秩和。如果这个统计量的值偏离了在零假设(即两个样本来自相同总体分布)下的期望值,就表明两个样本的总体位置可能存在差异,从而拒绝零假设。
二、威尔科克森秩检验的适用场景
威尔科克森秩检验的适用场景相对广泛,特别是在以下情况下,它比传统的参数检验更为合适:
数据不满足正态分布假设:
当数据明显偏离正态分布,或者无法确定数据是否服从正态分布时,威尔科克森秩检验是更稳健的选择。数据只有排序信息:
如果数据只能提供排序信息,而没有具体的数值,例如,对产品进行满意度排序,或者对疾病严重程度进行分级,威尔科克森秩检验是唯一可行的选择。小样本量:
在样本量较小的情况下,很难判断数据是否服从正态分布,即使数据确实服从正态分布,t检验的效力也可能受到影响。此时,威尔科克森秩检验通常能提供更可靠的结果。异常值:
威尔科克森秩检验对异常值不太敏感,因为它是基于数据的秩信息,而不是具体数值。异常值对秩的影响相对较小,因此即使存在异常值,威尔科克森秩检验也能提供更稳健的结果。
三、威尔科克森秩检验的优势
相比于参数检验,威尔科克森秩检验具有以下显著优势:
稳健性:
对数据分布没有严格要求,即使数据不服从正态分布,也能提供可靠的结果。适用性:
可以处理排序数据,适用于无法获得具体数值的数据。对异常值不敏感:
异常值对秩的影响较小,因此即使存在异常值,也能提供更稳健的结果。易于理解和应用:
计算方法相对简单,容易理解和应用。
四、威尔科克森秩检验的局限性
尽管威尔科克森秩检验具有诸多优点,但也存在一些局限性:
信息损失:
由于只利用了数据的秩信息,而忽略了数据的具体数值,因此可能会造成信息损失,导致检验效力降低。尤其是在数据接近正态分布时,t检验通常比威尔科克森秩检验更有效力。对样本量要求:
虽然威尔科克森秩检验适用于小样本量,但如果样本量过小,则可能难以检测到显著差异。只关注总体位置:
威尔科克森秩检验主要关注的是两个样本的总体位置是否一致,而不能用于检验其他类型的差异,例如方差差异。
五、与其他非参数检验方法的比较
除了威尔科克森秩检验之外,还有许多其他的非参数检验方法,例如:
符号检验:
用于检验配对样本的差值的中位数是否为零。克鲁斯卡尔-沃利斯检验:
用于比较三个或三个以上独立样本的总体位置是否一致。弗里德曼检验:
用于检验多个相关样本的总体位置是否一致。
选择哪种非参数检验方法,取决于数据的类型、样本的特点以及研究的目的。
六、实际应用举例
例如,研究人员想比较两种教学方法对学生成绩的影响。他们随机将学生分成两组,分别采用两种教学方法进行教学,然后对学生进行测试,得到学生的成绩。然而,研究人员发现,学生的成绩并不服从正态分布,因此不能使用t检验。此时,他们可以使用威尔科克森秩检验来比较两种教学方法的效果。
具体步骤如下:
- 将两组学生的成绩合并,并按照从小到大的顺序进行排序。
- 计算两组学生的秩和。
- 根据秩和计算威尔科克森秩检验的统计量或曼-惠特尼U统计量。
- 计算P值。
- 根据P值判断两种教学方法的效果是否存在显著差异。
七、结论
总而言之,威尔科克森秩检验是一种重要的非参数检验方法,它无需对数据分布做出严格假设,而是利用数据的秩信息进行推断,因此具有更广泛的适用性。在数据不满足正态分布假设、数据只有排序信息、样本量较小或存在异常值的情况下,威尔科克森秩检验是比传统的参数检验更为合适的选择。然而,我们也应该认识到其局限性,例如信息损失和只关注总体位置,并在选择检验方法时综合考虑各种因素,以选择最合适的统计方法。掌握威尔科克森秩检验及其应用,能够帮助研究人员更有效地分析数据,从而得出更准确的结论。
本文原文来自CSDN