正态性检验方法详解
创作时间:
作者:
@小白创作中心
正态性检验方法详解
引用
CSDN
1.
https://m.blog.csdn.net/u012114900/article/details/138193886
正态性检验是统计分析中的一个重要环节,特别是在进行t检验、方差分析等参数检验时,需要确保数据满足正态分布的假设。本文将详细介绍多种正态性检验方法,包括图示法和概率统计法,并提供具体的使用场景和建议。
参数检验与非参数检验
t检验、方差分析(ANOVA)等参数检验都有一个共同的前提条件:样本数据必须服从正态分布,即样本数据必须来源于一个正态分布的总体。若样本数据不服从正态分布,就不能用以上参数检验对数据进行分析,而应该使用非参数检验(如卡方检验、置换检验等)。
- 参数检验:t检验、方差分析(ANOVA)
- 非参数检验:正态检验
图示法
图示法是一种直观的正态性检验方法,主要包括直方图和QQ图。
- 直方图(with 拟合正态分布曲线):通过绘制数据的直方图并叠加拟合的正态分布曲线,可以直观地判断数据是否符合正态分布。但需要注意的是,这种方法在数据量较少时效果不佳。
- QQ图:QQ图(Quantile-Quantile Plot)是一种通过比较样本分位数与理论分位数来检验数据分布的方法。当QQ图上的点都大致落在一条直线上时,表示高度正相关,即这些数据是正态分布的。且该直线的斜率为标准差,截距为均值。
概率统计法
概率统计法通过计算经验分布与理论分布之间的差异来进行检验,主要包括以下几种方法:
基于经验分布函数(EDF)
- Kolmogorov-Smirnov检验(K-S检验)
- 计算经验分布和理论分布之间的距离,并将其中最大的距离作为检验统计量。
- 适用于样本量大于2000的情况。
- 需要指定总体的均值和方差。
- 可用于检验其他任何分布。
- Lilliefors检验
- 通过计算经验分布函数与理想累积分布函数之间的最大差异来进行检验。
- 直接利用样本的均值和方差进行计算。
- 最适用于对称分布的小样本,也适用于大样本。
- 仅适用于正态性检验。
- Anderson-Darling检验(AD检验)
- 通过计算数据的累积分布曲线与理想正态分布的累积分布曲线之间的差异来进行检验,且考虑了两条累积分布曲线之间的所有差异。
- 比K-S检验效果更好。
- 仅适用于小样本,推荐样本量小于26。
- 但有些超过200的工业数据也有可能通过A-D检验。
- 可用于检验其他分布。
基于卡方分布
- D’Agostino’s K-squared检验(偏度-峰度检验)
- 通过计算偏度(Skewness)和峰度(Kurtosis)来量化数据分布曲线与标准正态分布曲线之间的差异与不对称性。
- 适用于大样本。
- 仅能用于正态性检验。
- Jarque-Bera检验
- 必须用于大样本(样本量小于2000时,显著性水平会从0.001跌到0.5)。
- 只能用于正态性检验。
基于回归和相关
- Shapiro-Wilk检验(SW检验)
- 在每一个样本值都是唯一时的检验效果最好,但若样本中存在几个值重复的情况下该方法便会大打折扣。
- 只适用于小样本,推荐样本量为7~2000。当样本量超过5000时不再适用。
- MATLAB函数源下载:swtest()函数使用:When the series ‘X’ is Leptokurtic, SWTEST performs the Shapiro-Francia test, else (series ‘X’ is Platykurtic) SWTEST performs the Shapiro-Wilk test.
峰度分类
峰度是一种统计量,用于衡量分布包含异常值的程度。峰度是分布形状的无单位度量。峰度分为三种:尖峰、平峰和中峰。
- 尖峰分布(Leptokurtic distributions):具有比正态分布更高的峰度。这些分布具有“重尾”,表明它们具有相对较长的尾部,包含更多异常值。例如,低自由度的t分布和Laplace分布。
- 平峰分布(Platykurtic distributions):具有更短且包含更少极值的“轻尾”。例如,均匀分布和beta分布。
- 中峰分布(Mesokurtic distributions):峰度与正态分布相同。
经验总结
- 在实际操作中可以根据样本量大小选择多种检验方法进行正态性检验,同时通过QQ图等图示法辅助判断。
- 常用选择方法:
- 当样本量较大时通常会选择 K-S-L检验或 D’Agostino’s K-squared检验
- 当样本量较小时通常选用 AD检验或 SW检验
热门推荐
AI语音技术在客户服务中的应用有哪些?
深圳超高层建筑:经济发展的新引擎
《哪吒2》特效揭秘:百万条锁链如何炼成?
从《西游记》到《封神演义》,哪吒形象如何变迁?
怎么拒绝面试邀请
古埃及的金椰子壳之谜:一个美丽的假设
高籽椰子树:夏日栽培秘籍大公开!
首都通勤圈已涵盖13个环京区县 吸引范围不断扩大
京津城际亦庄站开通试运营,通勤时间节省50分钟
LPR最新动态:你的房贷会降吗?
维持骨骼和肌肉健康,老年人应该怎么吃?
百舸争流千帆竞——南阳市加快重点项目建设掠影
科技创新擦亮发展底色!南阳经开区积极培育和发展新质生产力
杨明德大师教你:金火互位如何提升家庭财运
技工教育和职业教育区别
探秘“中国彝家第一村”:迤沙拉的千年文化传承与创新
春节打卡:攀枝花迤沙拉村的民俗魅力
攀枝花迤沙拉村:600年古村落变身4A景区,彝汉文化交融成独特风景
红糖红枣发糕:传统甜点的制作与文化传承
农业知识产权:科技助力种植业创新
数字化转型下的银行团队协作新趋势
哀牢山摄影指南:捕捉哈尼梯田之美
哀牢山:云南的生态守护者
昆明动物所揭秘:哀牢山生物多样性的秘密
探秘哀牢山:九隆神话背后的龙文化
辽宁丹东鸭绿江口湿地国家级自然保护区:守护好珍稀濒危野生动物栖息地
辽宁丹东鸭绿江口湿地成功列入《世界遗产名录》
房屋租赁没有备案是谁的责任
装修材料以次充好维权攻略:8大案例与对策详解
蛙泳高手教你快速提升上肢力量!