问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

非参数检验的艺术:四种方法,一种思考

创作时间:
作者:
@小白创作中心

非参数检验的艺术:四种方法,一种思考

引用
1
来源
1.
http://www.360doc.com/content/24/0929/07/50382475_1135296896.shtml

在统计学中,非参数检验提供了一种不依赖于数据分布假设的分析方法。

当数据不满足正态分布或其他参数检验的假设时,非参数检验成为我们分析数据的有力工具。
本文将介绍非参数检验的基本概念、优缺点以及常用的四重非参数检验方法。

什么是非参数检验?

非参数检验(Nonparametric tests),也称为分布自由检验,是一种不依赖于数据具体分布形式的统计方法。
它不要求数据服从特定的分布(如正态分布),也不依赖于总体参数的估计。
而是利用样本数据的秩次(或顺序信息)而不是具体数值来进行假设检验。它通过比较不同组数据的秩次分布来判断它们之间是否存在显著性差异。

常见的四种非参数假设检验的方法:

  1. Mann-Whitney U检验:用于比较两个独立样本的中位数是否存在显著差异。
  2. Wilcoxon符号秩检验:用于比较两个配对样本的中位数差异是否显著。
  3. Kruskal-Wallis检验:用于比较多个独立样本的中位数是否存在显著差异。
  4. Friedman检验:用于比较多个相关样本的中位数是否存在显著差异。

Mann-Whitney U检验

基本原理

该检验的基本原理是通过比较两个独立样本的
秩次和
来评估它们是否来自相同的总体。它假设两个样本的分布形状相同,只是位置参数可能不同。
秩次和计算涉及将数据合并、排序、分配秩次,并求和的过程,用于反映各组数据在整个数据集中的相对位置。

统计量-计算公式

式中:和分别是两个样本的样本量,和分别是两个样本的秩次之和。最终的统计量取两者中的较小值。

Wilcoxon符号秩检验

基本原理

该检验的基本原理是比较两个配对样本之间的差异,这些差异的秩次被用来评估统计显著性。
基于上述的思想:如果两个配对样本来自相同的总体,那么它们之间的差异应该是随机的,并且中位数差异应该是零

统计量-计算公式

式中,是正差值的秩次之和,是负差值的秩次之和。

Kruskal-Wallis检验

基本原理

Kruskal-Wallis检验的基本原理是比较不同组数据的秩和。它不要求数据服从正态分布,也不要求方差齐性。
它适用于至少是顺序尺度的数据,即可以比较大小但不要求数值之间的差异有意义的情况。

统计量-计算公式

式中,是所有组的样本总量,是第组的样本量,是第组的秩和。

Friedman检验

基本原理

Friedman检验的基本原理是将多个相关样本的数据合并,对每个样本的数据进行秩次赋值,然后计算各组数据的秩次和。
通过比较各组秩次和的差异来判断样本中是否存在显著差异

统计量-计算公式

式中,是所有组的样本总量,是组数(相关样本数),是第组的秩和。

非参数检验的优缺点

  • 😊不依赖正态分布:适用于任何分布的数据,尤其是非正态分布的数据。
  • 😊稳健性:对异常值不敏感,适用于含有异常值的数据集。
  • 😊灵活性:可以处理有序分类数据和连续数据。
  • 😞统计效力可能较低:在数据分布接近正态且样本量较大时,统计效力可能低于参数检验。
  • 😞结果解释复杂:不如参数检验直观,结果解释可能较为复杂。

结语

非参数检验为我们提供了一种灵活的数据分析方法,使我们能够在不满足传统参数检验假设的情况下,依然能够进行有效的统计推断。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号