问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

用Excel判断数据是否符合正态分布的四种方法

创作时间:
作者:
@小白创作中心

用Excel判断数据是否符合正态分布的四种方法

引用
1
来源
1.
https://docs.pingcode.com/baike/4835334

用Excel判断数据是否符合正态分布的方法包括:绘制直方图、计算偏度和峰度、使用QQ图、Shapiro-Wilk检验。在这些方法中,绘制直方图和QQ图是最直观的,而计算偏度和峰度以及Shapiro-Wilk检验则提供了具体的数值判断依据。以下将详细描述如何在Excel中使用这些方法判断数据是否符合正态分布。

一、绘制直方图

直方图是最直观的查看数据分布的方法之一,通过观察直方图的形状,可以初步判断数据是否呈现钟形曲线,即正态分布。

  1. 数据准备:将数据输入到Excel工作表中。

  2. 选择数据:选中数据列。

  3. 插入直方图

  • 点击菜单栏的“插入”选项卡。

  • 选择“图表”组中的“直方图”。

  1. 调整直方图
  • 双击直方图,进入图表工具。

  • 调整组距,使得直方图的分布更清晰。

通过直方图,如果数据分布呈现对称的钟形曲线,那么数据可能符合正态分布。

二、计算偏度和峰度

偏度和峰度是描述数据分布形状的两个重要统计量。偏度描述分布的对称性,峰度描述分布的集中程度。

  1. 偏度(Skewness)
  • 在Excel中,使用函数

SKEW(data_range)

计算偏度。

  • 偏度接近0表示数据对称,正态分布的偏度为0。
  1. 峰度(Kurtosis)
  • 使用函数

KURT(data_range)

计算峰度。

  • 正态分布的峰度为3,Excel计算的峰度通常为减3后的值,因此正态分布的峰度在Excel中应接近0。

偏度和峰度接近0,可以初步认为数据符合正态分布。

三、使用QQ图

QQ图(Quantile-Quantile Plot)是另一种直观判断数据是否符合正态分布的方法。QQ图通过比较数据的分位数与正态分布分位数的关系,来判断数据分布。

  1. 生成正态分布数据
  • 在Excel中生成与原数据相同个数的正态分布数据,使用函数

NORM.INV(RAND(), mean, standard_dev)

  1. 排序数据
  • 将原数据和生成的正态分布数据分别排序。
  1. 绘制散点图
  • 选中排序后的原数据和正态分布数据。

  • 插入散点图,观察散点图是否接近一条直线。

如果QQ图中的点接近一条直线,数据可能符合正态分布。

四、Shapiro-Wilk检验

Shapiro-Wilk检验是一种统计检验方法,用于判断数据是否来自正态分布。虽然Excel本身没有直接提供Shapiro-Wilk检验的函数,但可以通过VBA或者使用插件实现。

  1. 安装插件
  • 可以使用第三方统计分析插件,例如Real Statistics。
  1. 执行检验
  • 使用插件中的Shapiro-Wilk检验功能,输入数据范围。

  • 检验结果包括W值和P值。

如果P值大于0.05,表示数据符合正态分布。

五、实例操作详解

为了更好地理解上述方法,下面将通过具体实例进行详细操作。

1. 绘制直方图

假设有一组数据如下:


12, 15, 14, 16, 14, 13, 15, 14, 16, 15, 14, 13, 12, 16, 15  

将数据输入到Excel的A列中,从A1到A15。

  1. 选择数据:选中A1到A15。

  2. 插入直方图

  • 点击“插入”选项卡,选择“图表”组中的“直方图”。

  • 调整组距,使直方图的分布更清晰。

观察直方图,若分布呈钟形,则数据可能符合正态分布。

2. 计算偏度和峰度

  1. 偏度
  • 在任一空白单元格中输入公式

=SKEW(A1:A15)

,按Enter键。

  • 计算结果若接近0,则数据可能对称。
  1. 峰度
  • 输入公式

=KURT(A1:A15)

,按Enter键。

  • 计算结果若接近0,则数据集中程度接近正态分布。

3. 使用QQ图

  1. 生成正态分布数据
  • 在B列中输入公式

=NORM.INV(RAND(), 14, 1.5)

,生成15个模拟正态分布数据。

  1. 排序数据
  • 在C列中输入公式

=SMALL(A$1:A$15, ROW())

,将原数据排序。

  • 在D列中输入公式

=SMALL(B$1:B$15, ROW())

,将正态分布数据排序。

  1. 绘制散点图
  • 选中C1到D15,插入散点图。

  • 观察散点图中的点是否接近一条直线。

4. Shapiro-Wilk检验

  1. 安装插件
  • 下载并安装Real Statistics插件。
  1. 执行检验
  • 选择数据范围A1到A15。

  • 打开插件中的Shapiro-Wilk检验功能,输入数据范围。

  • 检验结果中的P值若大于0.05,则数据符合正态分布。

结论

通过以上四种方法,可以在Excel中判断数据是否符合正态分布。绘制直方图和QQ图提供了直观的视觉判断,计算偏度和峰度以及使用Shapiro-Wilk检验提供了具体的数值判断依据。结合多种方法,可以更准确地判断数据的分布形态。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号