正态性检验方法详解
创作时间:
作者:
@小白创作中心
正态性检验方法详解
引用
CSDN
1.
https://blog.csdn.net/u012114900/article/details/138193886
正态性检验是统计分析中的一个重要环节,特别是在进行t检验、方差分析等参数检验时,需要确保数据满足正态分布的假设。本文将详细介绍多种正态性检验方法,包括图示法和概率统计法,并讨论偏度和峰度在正态性检验中的应用。
参数检验与非参数检验
t检验、方差分析(ANOVA)等参数检验都有一个共同的前提条件:样本数据必须服从正态分布,即样本数据必须来源于一个正态分布的总体。若样本数据不服从正态分布,就不能用以上参数检验对数据进行分析,而应该使用非参数检验(如卡方检验、置换检验等)。
- 参数检验:t检验、方差分析(ANOVA)
- 非参数检验:正态检验
图示法
图示法是一种直观的正态性检验方法,主要包括直方图和QQ图。
- 直方图:通过绘制数据的频率分布直方图,并拟合正态分布曲线。需要注意的是,当数据量较少时,直方图的参考价值有限。
- QQ图:QQ图(Quantile-Quantile Plot)是通过比较样本数据的分位数与理论正态分布的分位数来判断数据是否服从正态分布。如果QQ图上的点都大致落在一条直线上,表示高度正相关,即这些数据是正态分布的。且该直线的斜率为标准差,截距为均值。
概率统计法
概率统计法通过计算样本数据与理论正态分布之间的差异来判断正态性。主要包括以下几种方法:
基于经验分布函数(EDF)
- Kolmogorov-Smirnov检验(K-S检验)
- 计算经验分布和理论分布之间的最大距离作为检验统计量。
- 适用于样本量大于2000的情况。
- 需要指定总体的均值和方差。
- 可用于检验其他任何分布。
- Lilliefors检验
- 通过计算经验分布函数与理想累积分布函数之间的最大差异来进行检验。
- 直接利用样本的均值和方差进行计算。
- 最适用于对称分布的小样本,也适用于大样本。
- 仅适用于正态性检验。
- Anderson-Darling检验(AD检验)
- 通过计算数据的累积分布曲线与理想正态分布的累积分布曲线之间的差异来进行检验,且考虑了两条累积分布曲线之间的所有差异。
- 比K-S检验效果更好。
- 仅适用于小样本,推荐样本量小于26。
- 但有些超过200的工业数据也有可能通过A-D检验。
- 可用于检验其他分布。
基于卡方分布
- D'Agostino's K-squared检验(偏度-峰度检验)
- 通过计算偏度(Skewness)和峰度(Kurtosis)来量化数据分布曲线与标准正态分布曲线之间的差异与不对称性。
- 适用于大样本。
- 仅能用于正态性检验。
- Jarque-Bera检验
- 必须用于大样本(样本量小于2000时,显著性水平会从0.001跌到0.5)。
- 只能用于正态性检验。
基于回归和相关
- Shapiro-Wilk检验(SW检验)
- 在每一个样本值都是唯一时的检验效果最好,但若样本中存在几个值重复的情况下该方法便会大打折扣。
- 只适用于小样本,推荐样本量为7~2000。当样本量超过5000时不再适用。
- MATLAB函数源下载:swtest()函数使用:When the series ‘X’ is Leptokurtic, SWTEST performs the Shapiro-Francia test, else (series ‘X’ is Platykurtic) SWTEST performs the Shapiro-Wilk test.
偏度与峰度
峰度是一种统计量,用于衡量分布包含异常值的程度。峰度是分布形状的无单位度量。峰度分为三种:尖峰、平峰和中峰。
- 尖峰分布(Leptokurtic distributions):具有比正态分布更高的峰度。这些分布具有“重尾”,表明它们具有相对较长的尾部,包含更多异常值。
- 平峰分布(Platykurtic distributions):具有更短且包含更少极值的“轻尾”。
- 中峰分布(Mesokurtic distributions):与正态分布的峰度相同。
经验总结
- 当样本量较大时通常会选择 K-S-L检验或 D’Agostino’s K-squared检验。
- 当样本量较小时通常选用 AD检验或 SW检验。
- 在实际操作中可以根据样本量大小选择多种检验方法进行正态性检验,同时通过QQ图等图示法辅助判断。
热门推荐
自制红糖馒头,简单又美味,香甜软糯,早餐新选择!
剑桥二级英语考试技巧全攻略
股市运行机制与投资策略:如何在复杂市场中稳健获利?
选择技校专业时应考虑兴趣、能力与市场需求的平衡与发展方向
开车必看!这8种情况允许掉头,8种情况禁止掉头
【2025 劳工假期】分不清法定假日和公众假期?雇主必看!2025假期一览
如何通过PECVD工艺优化专利提升薄膜材料的性能与应用潜力?
火烧连营:罗马名将西庇阿的非洲首秀
神经性皮炎:儿童用药和日常护理指南
喉咙干燥一直喝水都还是干燥?原因及应对方法全解析
去台湾旅游需要准备什么?十大台湾旅行必备物品清单
APB信号详解
内网穿透 篇一:通过 Tailscale 异地组网 实现远程访问局域网
公交驾驶员避免投诉操作指南
办公室设计心理学:27个关键技巧提升工作效率与员工幸福感
周朝为何能享八百年国运?主要基于分封制和宗法制
蝴蝶结怎么打图解 蝴蝶结的系法图示
最大堆、最小堆数据结构详细解读
使用Bond0打造高可靠网络:配置教程及实战案例
增强团队凝聚力的15个协作游戏,快速提升团队协作能力
吃哪种碳水更健康?一起来了解全谷物食品
从音乐品位看个性
剑桥大学申请要求
十大非常好看的技术流小说,一技在手,天下我有
VR教学研讨:如何促进VR教育高质量发展
提高公共服务质量是提升民生幸福的关键
赚钱才是成年人最大的安全感
从化这8条绿美春游路线,简直美出圈啦!
世卫警告:红肉是2A级致癌物!大量食用患胃癌结肠癌?
「维桢」名字寓意,含义,好听吗_维桢名字取名打分