正态性检验(Shapiro-Wilk test检验和kstest检验)
创作时间:
作者:
@小白创作中心
正态性检验(Shapiro-Wilk test检验和kstest检验)
引用
CSDN
1.
https://m.blog.csdn.net/qq_45932996/article/details/141689121
正态分布是统计学中一个非常重要的概念,许多统计方法都要求数据服从或近似服从正态分布。因此,在数据分析过程中,对数据进行正态性检验是非常必要的。本文将介绍两种常用的正态性检验方法:Shapiro-Wilk检验和Kolmogorov-Smirnov检验,并通过Python代码演示如何实现这些检验。
Shapiro-Wilk检验
Shapiro-Wilk检验是一种常用的正态性检验方法,适用于样本量较小的情况。以下是使用Python进行Shapiro-Wilk检验的代码:
import pandas as pd
import numpy as np
from scipy import stats
data = pd.read_csv(r'数据4.1.csv')
# 定义原假设和备择假设
Ho = '数据服从正态分布'
Ha = '数据不服从正态分布'
alpha = 0.05 # 显著性水平
def normality_check(data):
for columnName, columnData in data.items():
print("Shapiro test for {columnName}".format(columnName=columnName))
res = stats.shapiro(columnData)
pValue = round(res[1], 2)
if pValue > alpha:
print("pvalue = {pValue} > {alpha}. 不能拒绝原假设. {Ho}".format(pValue=pValue, alpha=alpha, Ho=Ho))
else:
print("pvalue = {pValue} <= {alpha}. 拒绝原假设. {Ha}".format(pValue=pValue, alpha=alpha, Ha=Ha))
normality_check(data)
根据Shapiro-Wilk检验结果,变量year、profit、labor服从正态分布,invest、rd不服从正态分布。
Kolmogorov-Smirnov检验
Kolmogorov-Smirnov检验是一种非参数检验方法,可以检验样本是否符合某种连续的累积分布函数,包括正态分布。以下是使用Python进行Kolmogorov-Smirnov检验的代码:
# 使用kstest检验数据是否服从正态分布
Ho = '数据服从正态分布'
Ha = '数据不服从正态分布'
alpha = 0.05
def normality_check(data):
for columnName, columnData in data.items():
print("kstest for {columnName}".format(columnName=columnName))
res = stats.kstest(columnData, 'norm')
pValue = round(res[1], 2)
if pValue > alpha:
print("pvalue = {pValue} > {alpha}. 不能拒绝原假设. {Ho}".format(pValue=pValue, alpha=alpha, Ho=Ho))
else:
print("pvalue = {pValue} <= {alpha}. 拒绝原假设. {Ha}".format(pValue=pValue, alpha=alpha, Ha=Ha))
normality_check(data)
根据Kolmogorov-Smirnov检验结果,变量year、profit、invest、labor、rd均不服从正态分布。综合两种检验结果,我们可以认为year、profit、invest、labor、rd均不服从正态分布。
热门推荐
母猫产后护理:15个关键要点确保母猫和幼崽健康成长
国庆聚餐吃啥肉?“腿的数量越少肉越好”是真的吗?
3D打印机加速度测试指南
末日题材角色特征与创作指南:深入解析末日风格人物形象与故事构建
玉龙雪山旅行全攻略:旅游时间与注意事项详解
《鲁班书》里记载了哪些秘术?为什么说它是“邪书”?
转租条款解析:如何合法进行房屋转租?
Git 项目管理快速入门
使用GitHub提交Pull Request的完整流程
算日子还是选日子:探讨我国结婚日期选择的传统与变革
未来30年全球科技发展重大趋势
手臂痛怎么办?从中医证候、经络与中药理解!
智能云仓库存管理:核心功能、优势与未来趋势
从1.5万套黑胶收藏中挑选出11套最爱黑胶唱片推荐
八字命理学中的“中和之命”:理想命理状态的特征解析
海鲈鱼在哪个水层?
鲈鱼生活习性解析与钓鲈鱼需注意的事项
Kaggle数据科学挑战竞赛内容与备考策略
工厂有老鼠怎么办?6大捕鼠数据告诉你鼠夹防治如何有效断绝鼠害
幼犬饲养的常见问题前三名:吠叫、大小便、咬手咬脚
疼起来要命的阑尾炎,该怎么预防?
拜占庭帝国为何难守住巴尔干半岛?内忧外患致有心无力
七個心肌梗塞的前兆,定期監測讓你遠離危險
初中物理 “弹簧测力计” 大闯关:从错题挖宝藏,提分超轻松!
【菜籽油保质期】菜籽油可以放多久 教你如何存储菜籽油长期不变质
金刚菩提——神秘的种子之谜(探究金刚菩提的起源、特点及价值)
哪些实验可以验证量子计算的原理?
“绛”为何物?为何古人尤其是民国时期喜欢以“绛”为名?
说女生甜是什么意思?解读背后的情感表达与赞美文化
315特辑丨化妆品抽检盘点:滥用防腐剂、非法添加现象多;稚优泉兰芝品质不稳