正态分布的概率密度函数与分布函数可视化教程
创作时间:
作者:
@小白创作中心
正态分布的概率密度函数与分布函数可视化教程
引用
CSDN
1.
https://blog.csdn.net/yyyyypppppzzzzz/article/details/121952196
正态分布(Normal Distribution),也称高斯分布(Gaussian Distribution),是统计学中最重要的概率分布之一。其概率密度函数(Probability Density Function,PDF)和分布函数(Cumulative Distribution Function,CDF)在数据分析和科学计算中有着广泛的应用。本文将通过Python的matplotlib库,详细展示如何绘制不同参数下的正态分布曲线。
正态分布的基本概念
正态分布的概率密度函数公式为:
其中,μ是分布的均值(期望值),σ是标准差。当μ=0且σ=1时,称为标准正态分布。
分布函数(CDF)是概率密度函数的积分,表示随机变量小于等于某个值的概率。对于正态分布,其分布函数没有简单的闭式解,通常需要通过数值积分来计算。
Python代码实现
下面通过Python代码,分别绘制μ=0, σ=1;μ=0, σ=2;μ=1, σ=1三种情况下的正态分布概率密度函数和分布函数。
import sympy
import numpy as np
import matplotlib.pyplot as plt
# 设置matplotlib显示中文字体
plt.rcParams['font.sans-serif'] = 'KaiTi'
plt.rcParams['axes.unicode_minus'] = False
# 构造数据
def generate_normal_data(mu, sigma):
x = np.arange(-10, 10, 0.1)
y_pdf = np.exp(-((x - mu) ** 2) / (2 * sigma ** 2)) / (np.sqrt(2 * np.pi) * sigma)
# 计算分布函数
sympy_x = sympy.symbols('x')
sympy_y = sympy.exp(-((sympy_x - mu) ** 2) / (2 * sigma ** 2)) / (sympy.sqrt(2 * np.pi) * sigma)
sympy_Y = sympy.integrate(sympy_y)
y_cdf = [sympy_Y.subs(sympy_x, i) - sympy_Y.subs(sympy_x, -float('inf')) for i in x]
return x, y_pdf, y_cdf
# 生成不同参数的数据
data_1 = generate_normal_data(0, 1)
data_2 = generate_normal_data(0, 2)
data_3 = generate_normal_data(1, 1)
# 绘制概率密度函数
plt.figure(figsize=(10, 5))
plt.title("正态分布概率密度")
plt.plot(data_1[0], data_1[1], c='red', label='μ=0 σ=1')
plt.plot(data_2[0], data_2[1], c='green', label='μ=0 σ=2')
plt.plot(data_3[0], data_3[1], c='blue', label='μ=1 σ=1')
plt.xlabel('x', loc='right')
plt.ylabel('y', loc='top')
plt.legend(framealpha=1, frameon=True)
plt.show()
# 绘制分布函数
plt.figure(figsize=(10, 5))
plt.title("正态分布分布函数")
plt.plot(data_1[0], data_1[2], c='red', label='μ=0 σ=1')
plt.plot(data_2[0], data_2[2], c='green', label='μ=0 σ=2')
plt.plot(data_3[0], data_3[2], c='blue', label='μ=1 σ=1')
plt.xlabel('x', loc='right')
plt.ylabel('y', loc='top')
plt.legend(framealpha=1, frameon=True)
plt.show()
结果分析
通过上述代码,我们得到了以下三组参数下的正态分布曲线:
从图中可以看出:
- 当μ=0, σ=1时(红色曲线),这是标准正态分布,其概率密度函数在x=0处达到最大值,分布函数从0平滑上升到1。
- 当σ增大时(绿色曲线,σ=2),分布曲线变得更加扁平,表示数据的离散程度增加。
- 当μ改变时(蓝色曲线,μ=1),整个分布曲线向右平移,表示数据的中心位置发生了变化。
通过本文,读者不仅能够掌握正态分布的基本概念,还能学会如何使用Python进行可视化展示,这对于数据科学和统计学的学习具有重要的参考价值。
热门推荐
机动车尾气检测系统:原理、流程与环保意义
尾气汽油味重的解决方法有哪些?这些方法对车辆性能有何影响?
汽车尾气超标不用慌,解决方法及日常注意事项全解析
感冒脚酸痛的五大治疗方案:从轻症到重症全覆盖
新冠流感后当心心肌炎,专家提醒警惕腿疼等非典型症状
彭浦镇Town Walk:探寻历史文化遗址,见证城市变迁
蜂毒牙膏:口腔护理新选择
可立克蜂毒牙膏:神奇功效背后的科学解读
离婚后户口迁移全攻略:从法律依据到具体操作
毕业生户口迁移指南:从政策办理到心理调适
“双减”时代,迁户家庭如何破解教育难题
富贵竹叶片黏糊的四大原因及科学护理方法
末世流苏烈成S31上分利器,边路胜率高达64%
100句古诗词里的冬日雪景:从唐诗到宋词精选
FastSnowyLandscape:imgaug库中的图像雪景增强工具
双黄连片的功效与作用及使用说明书
老年人可以服用福森双黄连口服液吗?
宋词里的聚散智慧:八首词解读“人走茶凉”
一文读懂四个成语:从历史典故看成语智慧
仓鼠的13种叫声:解读宠物情绪的实用指南
塔罗牌之太阳,审判的解读和画面
免洗喷雾不能天天用?这样护理才能告别“细软塌”
如何平衡胜任能力的优势与劣势,以提升个人职业发展?
3000年前金饰现世,如今成中国文化遗产标志
成都金沙遗址博物馆举办2024太阳节,重现古蜀文明辉煌
三星堆现3500年前玉石“车间”,古蜀文明保护工程全面升级
从定州到正定:河北十大古镇的历史与人文之美
河北正定:一座被低估的千年古城,藏着唐代钟楼和八大碗
河北8处小众景点推荐:草原、古城、美食全攻略
商务洽谈进茶室,轻松氛围促合作