问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

【Wilcoxon 检验】威尔科克森秩检验[非参数检验]附Matlab代码

创作时间:
作者:
@小白创作中心

【Wilcoxon 检验】威尔科克森秩检验[非参数检验]附Matlab代码

引用
CSDN
1.
https://blog.csdn.net/Matlab_jiqi/article/details/146395443

在统计推断的世界中,我们常常需要对数据进行假设检验,以验证我们对总体的一些猜想。传统的参数检验,例如t检验和方差分析,依赖于数据满足一定的分布假设,如正态性。然而,现实世界的数据往往并不那么完美,经常会偏离正态分布,甚至缺乏足够的测量尺度(例如,只有排序信息)。在这种情况下,非参数检验就显得尤为重要。威尔科克森秩检验(Wilcoxon Rank-Sum Test,亦称曼-惠特尼U检验)正是非参数检验中的一种,它无需对数据分布做出严格假设,而是利用数据的秩信息进行推断,因此具有更广泛的适用性。

一、威尔科克森秩检验的基本原理

威尔科克森秩检验是一种用于比较两个独立样本的非参数检验方法,其目的是检验这两个样本是否来自相同的总体分布。更具体地说,它关注的是两个样本的总体位置是否一致,即两个样本的中心趋势是否存在显著差异。与t检验直接比较两个样本的均值不同,威尔科克森秩检验并不依赖于数据的具体数值,而是基于数据的秩信息。

其核心思想是,如果两个样本来自相同的总体分布,那么它们的数据在混合排序后应该呈现随机分布,即每个样本的数据在总体排序中应该占据大致均匀的位置。如果两个样本来自不同的总体分布,例如,一个样本的总体位置明显高于另一个样本,那么该样本的数据在混合排序后将会集中在排序的较高端。

威尔科克森秩检验通过计算一个统计量,该统计量基于两个样本数据在混合排序后的秩和。如果这个统计量的值偏离了在零假设(即两个样本来自相同总体分布)下的期望值,就表明两个样本的总体位置可能存在差异,从而拒绝零假设。

二、威尔科克森秩检验的适用场景

威尔科克森秩检验的适用场景相对广泛,特别是在以下情况下,它比传统的参数检验更为合适:

  • 数据不满足正态分布假设:
    当数据明显偏离正态分布,或者无法确定数据是否服从正态分布时,威尔科克森秩检验是更稳健的选择。

  • 数据只有排序信息:
    如果数据只能提供排序信息,而没有具体的数值,例如,对产品进行满意度排序,或者对疾病严重程度进行分级,威尔科克森秩检验是唯一可行的选择。

  • 小样本量:
    在样本量较小的情况下,很难判断数据是否服从正态分布,即使数据确实服从正态分布,t检验的效力也可能受到影响。此时,威尔科克森秩检验通常能提供更可靠的结果。

  • 异常值:
    威尔科克森秩检验对异常值不太敏感,因为它是基于数据的秩信息,而不是具体数值。异常值对秩的影响相对较小,因此即使存在异常值,威尔科克森秩检验也能提供更稳健的结果。

三、威尔科克森秩检验的优势

相比于参数检验,威尔科克森秩检验具有以下显著优势:

  • 稳健性:
    对数据分布没有严格要求,即使数据不服从正态分布,也能提供可靠的结果。

  • 适用性:
    可以处理排序数据,适用于无法获得具体数值的数据。

  • 对异常值不敏感:
    异常值对秩的影响较小,因此即使存在异常值,也能提供更稳健的结果。

  • 易于理解和应用:
    计算方法相对简单,容易理解和应用。

四、威尔科克森秩检验的局限性

尽管威尔科克森秩检验具有诸多优点,但也存在一些局限性:

  • 信息损失:
    由于只利用了数据的秩信息,而忽略了数据的具体数值,因此可能会造成信息损失,导致检验效力降低。尤其是在数据接近正态分布时,t检验通常比威尔科克森秩检验更有效力。

  • 对样本量要求:
    虽然威尔科克森秩检验适用于小样本量,但如果样本量过小,则可能难以检测到显著差异。

  • 只关注总体位置:
    威尔科克森秩检验主要关注的是两个样本的总体位置是否一致,而不能用于检验其他类型的差异,例如方差差异。

五、与其他非参数检验方法的比较

除了威尔科克森秩检验之外,还有许多其他的非参数检验方法,例如:

  • 符号检验:
    用于检验配对样本的差值的中位数是否为零。

  • 克鲁斯卡尔-沃利斯检验:
    用于比较三个或三个以上独立样本的总体位置是否一致。

  • 弗里德曼检验:
    用于检验多个相关样本的总体位置是否一致。

选择哪种非参数检验方法,取决于数据的类型、样本的特点以及研究的目的。

六、实际应用举例

例如,研究人员想比较两种教学方法对学生成绩的影响。他们随机将学生分成两组,分别采用两种教学方法进行教学,然后对学生进行测试,得到学生的成绩。然而,研究人员发现,学生的成绩并不服从正态分布,因此不能使用t检验。此时,他们可以使用威尔科克森秩检验来比较两种教学方法的效果。

具体步骤如下:

  1. 将两组学生的成绩合并,并按照从小到大的顺序进行排序。
  2. 计算两组学生的秩和。
  3. 根据秩和计算威尔科克森秩检验的统计量或曼-惠特尼U统计量。
  4. 计算P值。
  5. 根据P值判断两种教学方法的效果是否存在显著差异。


七、结论

总而言之,威尔科克森秩检验是一种重要的非参数检验方法,它无需对数据分布做出严格假设,而是利用数据的秩信息进行推断,因此具有更广泛的适用性。在数据不满足正态分布假设、数据只有排序信息、样本量较小或存在异常值的情况下,威尔科克森秩检验是比传统的参数检验更为合适的选择。然而,我们也应该认识到其局限性,例如信息损失和只关注总体位置,并在选择检验方法时综合考虑各种因素,以选择最合适的统计方法。掌握威尔科克森秩检验及其应用,能够帮助研究人员更有效地分析数据,从而得出更准确的结论。

本文原文来自CSDN

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号