问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

什么是标准正态分布

创作时间:
作者:
@小白创作中心

什么是标准正态分布

引用
CSDN
1.
https://blog.csdn.net/u013172930/article/details/144529214

标准正态分布是统计学和概率论中的一个核心概念,它不仅是正态分布的标准化形式,更在数据分析、假设检验、机器学习等多个领域有着广泛的应用。本文将详细介绍标准正态分布的定义、特征、图形示意、累积分布函数、标准化方法及其实际应用。

1. 标准正态分布的定义

标准正态分布的概率密度函数(PDF)为:
$$
p(x) = \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2}\right), \quad -\infty < x < \infty
$$
其中:

  • $x$:随机变量;
  • $\exp(-x^2/2)$:指数部分决定了分布的形状;
  • $\frac{1}{\sqrt{2\pi}}$:归一化常数,保证总概率为1。

2. 特征

  1. 均值和方差
  • 均值(期望):$\mu = 0$
  • 方差:$\sigma^2 = 1$
  1. 对称性
    标准正态分布是关于$x = 0$对称的。

  2. 分布曲线

  • 钟形曲线,也称为高斯曲线
  • 曲线在$x = 0$处最高,向两侧逐渐减小;
  • 越远离中心,概率密度越小。
  1. 性质
  • 总概率等于1:
    $$
    \int_{-\infty}^\infty \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{x^2}{2}\right) dx = 1
    $$
  • 关于0的奇函数(如$x$)的积分为0:
    $$
    \int_{-\infty}^\infty x \cdot p(x) , dx = 0
    $$

3. 图形示意

标准正态分布的曲线如下图所示:

  • 横轴为$x$(随机变量取值);
  • 纵轴为概率密度$p(x)$;
  • 曲线中心对称,均值为0,峰值位于$x = 0$。

4. 标准正态分布的累积分布函数(CDF)

标准正态分布的累积分布函数表示随机变量$X$小于等于$x$的概率,定义为:
$$
\Phi(x) = \int_{-\infty}^x \frac{1}{\sqrt{2\pi}} \exp\left(-\frac{t^2}{2}\right) dt
$$

5. 标准正态分布的标准化

任意正态分布$N(\mu, \sigma^2)$可以通过标准化变换转化为标准正态分布:
$$
Z = \frac{X - \mu}{\sigma}, \quad Z \sim N(0, 1)
$$
这里:

  • $X$:原始随机变量;
  • $\mu$:原始分布的均值;
  • $\sigma$:原始分布的标准差;
  • $Z$:标准化后的变量,服从标准正态分布。

6. 应用

标准正态分布在统计学、机器学习和自然科学中有广泛应用,主要包括:

  • 假设检验和显著性检验;
  • Z分数计算,用于数据标准化;
  • 蒙特卡洛模拟中用作基础概率分布;
  • 机器学习中的概率模型,如高斯过程和贝叶斯方法。

总结

标准正态分布是均值为0、方差为1的正态分布。其概率密度函数呈对称的钟形曲线,是统计学中最重要的分布之一,广泛用于数据分析、概率估计和模拟计算中。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号