问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

正态性检验方法详解

创作时间:
作者:
@小白创作中心

正态性检验方法详解

引用
CSDN
1.
https://blog.csdn.net/u012114900/article/details/138193886

正态性检验是统计分析中的一个重要环节,特别是在进行t检验、方差分析等参数检验时,需要确保数据满足正态分布的假设。本文将详细介绍多种正态性检验方法,包括图示法和概率统计法,并讨论偏度和峰度在正态性检验中的应用。

参数检验与非参数检验

t检验、方差分析(ANOVA)等参数检验都有一个共同的前提条件:样本数据必须服从正态分布,即样本数据必须来源于一个正态分布的总体。若样本数据不服从正态分布,就不能用以上参数检验对数据进行分析,而应该使用非参数检验(如卡方检验、置换检验等)。

  • 参数检验:t检验、方差分析(ANOVA)
  • 非参数检验:正态检验

图示法

图示法是一种直观的正态性检验方法,主要包括直方图和QQ图。

  • 直方图:通过绘制数据的频率分布直方图,并拟合正态分布曲线。需要注意的是,当数据量较少时,直方图的参考价值有限。
  • QQ图:QQ图(Quantile-Quantile Plot)是通过比较样本数据的分位数与理论正态分布的分位数来判断数据是否服从正态分布。如果QQ图上的点都大致落在一条直线上,表示高度正相关,即这些数据是正态分布的。且该直线的斜率为标准差,截距为均值。

概率统计法

概率统计法通过计算样本数据与理论正态分布之间的差异来判断正态性。主要包括以下几种方法:

基于经验分布函数(EDF)

  1. Kolmogorov-Smirnov检验(K-S检验)
  • 计算经验分布和理论分布之间的最大距离作为检验统计量。
  • 适用于样本量大于2000的情况。
  • 需要指定总体的均值和方差。
  • 可用于检验其他任何分布。
  1. Lilliefors检验
  • 通过计算经验分布函数与理想累积分布函数之间的最大差异来进行检验。
  • 直接利用样本的均值和方差进行计算。
  • 最适用于对称分布的小样本,也适用于大样本。
  • 仅适用于正态性检验。
  1. Anderson-Darling检验(AD检验)
  • 通过计算数据的累积分布曲线与理想正态分布的累积分布曲线之间的差异来进行检验,且考虑了两条累积分布曲线之间的所有差异。
  • 比K-S检验效果更好。
  • 仅适用于小样本,推荐样本量小于26。
  • 但有些超过200的工业数据也有可能通过A-D检验。
  • 可用于检验其他分布。

基于卡方分布

  1. D'Agostino's K-squared检验(偏度-峰度检验)
  • 通过计算偏度(Skewness)和峰度(Kurtosis)来量化数据分布曲线与标准正态分布曲线之间的差异与不对称性。
  • 适用于大样本。
  • 仅能用于正态性检验。
  1. Jarque-Bera检验
  • 必须用于大样本(样本量小于2000时,显著性水平会从0.001跌到0.5)。
  • 只能用于正态性检验。

基于回归和相关

  1. Shapiro-Wilk检验(SW检验)
  • 在每一个样本值都是唯一时的检验效果最好,但若样本中存在几个值重复的情况下该方法便会大打折扣。
  • 只适用于小样本,推荐样本量为7~2000。当样本量超过5000时不再适用。
  • MATLAB函数源下载:swtest()函数使用:When the series ‘X’ is Leptokurtic, SWTEST performs the Shapiro-Francia test, else (series ‘X’ is Platykurtic) SWTEST performs the Shapiro-Wilk test.

偏度与峰度

峰度是一种统计量,用于衡量分布包含异常值的程度。峰度是分布形状的无单位度量。峰度分为三种:尖峰、平峰和中峰。

  • 尖峰分布(Leptokurtic distributions):具有比正态分布更高的峰度。这些分布具有“重尾”,表明它们具有相对较长的尾部,包含更多异常值。
  • 平峰分布(Platykurtic distributions):具有更短且包含更少极值的“轻尾”。
  • 中峰分布(Mesokurtic distributions):与正态分布的峰度相同。

经验总结

  1. 当样本量较大时通常会选择 K-S-L检验或 D’Agostino’s K-squared检验。
  2. 当样本量较小时通常选用 AD检验或 SW检验。
  3. 在实际操作中可以根据样本量大小选择多种检验方法进行正态性检验,同时通过QQ图等图示法辅助判断。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号