问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

教材“小补丁”:正态分布公式的来龙去脉(含推导)

创作时间:
作者:
@小白创作中心

教材“小补丁”:正态分布公式的来龙去脉(含推导)

引用
1
来源
1.
http://www.360doc.com/content/24/0815/09/50382475_1131415201.shtml

这是一篇在好奇心驱使下完成的文章,本文试图在15分钟内,尽可能以清晰、易理解的方式,阐明正态分布的公式是怎么来的

有的教材会猛地给一个公式定理,告诉你“同学,用就对了”,但不明来历的公式总会让人心痒痒,想知道它的来历。此文(教材“小补丁”)就是在这样的背景下诞生的,希望对你深入理解正态分布有帮助。

总的来说,正态分布的公式推导需要一定高数知识,知识面较广,但不是特别深。落实到具体,推导主要涉及函数基本性质、极大似然函数、柯西函数方程、导数和微积分的部分知识,需要读者有一定背景知识才能在理解时感到丝滑(不过,有知识感到陌生也没关系,这正好是学习的好机会,查漏补缺即可~)。

受限于篇幅,本文侧重推导,但会对重要背景知识做简要展开。

Are you ready?

Let's begin。

01 引入


(天体位置图 图源:百度)

正态分布并非高斯的发明,只是高斯在误差函数的研究中,将正态分布准确地描述了出来,因此才以其名字命名,称为“高斯分布”。正态分布最初作为二项分布计算的渐进公式被棣莫弗引进,后被拉普拉斯发展成系统的理论,但将其作为一个分布来研究并准确描述,则归功于高斯。

正态分布是一种概率分布,而正态分布的密度函数则是这个分布的数学表达。正态分布的密度函数是分析随机现象、进行统计推断和预测的重要工具,高斯就是在它的帮助下,更准确地确定了天体的位置和地球的形状。

02 看图说话,直击问题

在开始推导之前,我想先用看图说话的方式,一句话直观地说清接下来要探讨的问题:在下图中,每一个小长方形的面积是它的频率,所有小长方形的总和为1,如果把图中的组距变得无限小,我们就会得到一条近似山峰的平滑曲线(红线),这条红色平滑曲线的公式,就是我们今天要讨论的内容。

(图1 图源:百度)

现在,顺着这条近似山峰的平滑曲线,我们来看一下误差函数的定义,做一下公式推导前的热身。

误差函数(或称为概率密度函数)是一个特殊的积分形式,与正态分布关系密切,可用其表达正态分布的积分。误差函数可用于描述一个随机变量在某一特定值附近的概率分布情况。

我们用f(x)表示密度函数,并假设它应满足以下三个条件:

(1) f(x)≥0,即正态分布密度函数的值始终非负。

(2) ,即正态分布密度函数在整个实数域上的积分等于1,这保证了随机变量取遍所有可能值的总概率为1。

(3)对于任意给定的区间[a,b],连续型随机变量x在该区间内取值的概率为:

现在,我们把图1频率分布图中近似山峰的平滑曲线(图1红线)提取出来,再把前文的定义和条件也丢进图2,来加深理解:


(图2 知识汇总图 )

哈哈哈,是不是一目了然?

了解正态分布密度函数的定义和条件,对我们接下来理解推导有帮助。高斯在推导前,进行了一些假设,如果从结论的方向逆向思考,你会更好地理解他为什么要这么设定。

公式的推导我主要参考李贤平老师的《 概率论基础(第3版)》,虽然他在部分计算上的处理方式与高斯不一致,但总体思路是类似的。

03 公式推导

在高斯的时代,知识并不像现在这样完备,因此能做出相关的假设和推导是不容易的。在推导正态分布密度函数公式时,高斯运用函数和微积分的知识,假设密度函数f(x)有以下特点:

(1)f(x)为连续函数;

(2)X=0时, f(x)应有最大值,x→∞,f(x)向两侧逐渐趋近于0;

(3)∫f(x)=1,即 f(x)在实数域R上的积分为1。

根据高斯提到的3点假设,我们可以进一步挖掘出他的潜在假设:

(1)根据1、2:f(x)关于x=0处对称,即f(x)=f(-x),是偶函数,并在(-∞,0),f(x)单调递增,(0,+∞)单调递减;

(2)根据3:f(x)恒大于0 且 f(x)在实数域R上可导。

接着,高斯假设每次观测都是独立且随机的,在密度函数f(x)中,有n个独立观测值x1,x2,x3,...,xn。记μ是测量中的真值, 是测量中的观测值,误差记作 ,误差的分布密度函数为 。

小贴士:真值是指在一定的时间与空间(位置及状态)条件下,被测量所体现的真实数值。比如我们测量一个物体的重量,这个物体的“真值”就是不受外界干扰(如空气阻力、气温、仪器误差等)的重量。但实际上,受限于环境和仪器,测量值往往与真值存在一定差异,这个差异被称作“误差”。误差=观测值-真值。

因为x1,x2,x3,...,xn是一组独立同分布的值,即一组随机变量之间相互独立且具有相同的概率分布的特性,在误差独立的情况下,可得一个极大似然函数 :

(3.1)

简写为:

(3.2)

小贴士:L(μ)极大似然函数是在统计学中用于估计模型参数的一种方法。假设我们有一组观测数据 ,这些数据来自某个概率分布,该分布的参数为 μ。我们的目标是找到 μ的一个估计值,使得观测数据 x出现的概率(即似然函数 L(μ;x))最大。

连续随机变量求极大似然函数的公式为: ,也可简写为: 。

为了方便计算,我们可以对 进行对数转换:

(3.3)

高斯假定观测值的平均值 作为未知参数μ的估值。由于 使似然函数 最大,故:

(3.4)

记 ,则 。

由假设知道g(x)好定义而且是连续函数,这时可将 化简:

(3.5)

整理得:

(3.6)

当n=2,方程 化为:

(3.7)

由于 ,以及 的任意性可知,对任意 ,有 。

当n=3时,可将方程 化为:

(3.8)

由于 ,以及 的任意性可知,对任意 ,有:

(3.9)

这是柯西函数方程,它的解为:

(3.10)

小贴士:什么是柯西函数方程?

柯西方程是函数方程的一种,具体表现为对于任意的实数x和y,都有f(x+y)=f(x)+f(y)成立。在实数域上,如果函数f(x)是连续的,那么可以证明其唯一解是f(x)=kx,其中k为常数(这里的k对应我们上面的b)。

柯西法是一种解决函数方程的有效手段,其步骤是:先求出对于自变量取所有自然数时函数方程的解具有的形式,然后依次证明对自变量取整数值、有理数值以及实数值时函数方程的解仍具有这种形式,从而得到函数方程的解。这种思维也被称为“爬坡式推理”。

例如,对于柯西方程f(x+y)=f(x)+f(y),我们可以先取x=y=1,得到f(2)=2f(1)。再取x=2,y=1,得到f(3)=f(2)+f(1)=3f(1)。以此类推,我们可以归纳出对于任意自然数n,f(nx)=nf(x)。然后,通过类似的方法,我们可以推广到整数、有理数和实数的情况,最终得到f(x)=kx的解。

因此我们得到:

(3.11)

因为f(x)是密度函数,所以b<0,记 。

小贴士:为什么f(x)是密度函数,b<0,记 ?

“记 ”在一开始没有想到是很正常的,这样写是为了化简结果更简洁,是站在结果回头看过程,再优化写法。实际这里上我们只需知道b是一个小于0的数就可以了。

具体来说,如果这里没有记 ,则 最终化简结果为 ,代入方差计算公式为 ,较复杂,因此,出于化简方便的考虑,我们记 。

另外,因为 总是正数,因此 也必须是非负数。这意味着b<0。

再多说一句,b不取0的原因是因为如果b=0,则函数退化为常数C,这在大多数情况下不满足密度函数归一性条件(只有一个对应值)。

则 。

由前面的假设, ,即分布密度函数在整个实数域上的积分等于1。可知 。

因此 。

因为讨论的是N(0,1)的情况,所以求得标准正态分布的密度函数公式 。

04 总结

这篇文章有一定难度,相信愿意打开它的你,大概率也有很浓的好奇心。恭喜我们又一起拓展了视野!

老规矩,最后请让我来为你进行简要的总结:在文章的开始,我简要介绍了正态分布的基础知识,以及难易度。在简单引入后,我们进入了推导环节。跟随高斯的思想,我们在了解他推的假设的前提下,复现了正态分布公式的推导过程。

当然,本文讨论的是标准正态分布的情况,即N(0,1),不过一般正态分布的公式推导也同理,感兴趣的朋友可以在读完此文后尝试推导~

延伸阅读:

  1. 正态分布有趣的科普性介绍,往期文章《一文读懂正态分布》。

  2. 正态分布的故事和应用,往期文章《生活中的正态分布》。

致谢:

在写这篇文章的时候发现推导涉及的知识较多,自己也有很多知识需要补足,想以通俗、易懂的方式讲解并非易事,过程中十分感谢向我提供资料和改进建议的Z同学和W同学。

(毕业工作后还能以写公众号为由“骚扰”我的朋友们,一起探讨学习问题,真的很开心 :-D)

后记:

文章以李贤平老师的教材《概率论基础(第3版)》为框架,并在他的基础上,进行了补充说明。

预期读者会提出很多问题,但个人并非科班出身,且能力有限,有的可能暂时无法解答,不过我会认真阅读读者提出的问题,作为之后写作的反馈,并选出有启发性的问题和回答,供大家交流和参考。

此文是阶段性的思考,肯定有不足和疏漏之处,望大佬轻喷。如果后面有新的感悟,我就再更新一篇~(^▽^)

参考资料

  1. 李贤平. 概率论基础(第3版)[M]. 第3版. 高等教育出版社, 2010-4 第三章 随机变量与分布函数 p156-p157

  2. 吴军. 吴军数学通识讲义:原来数学可以这样用[M].第一版. 新星出版社, 2021-4.

  3. 知乎:AlexHam的回答(2023-02-08):正态分布概率密度函数的导出 https://zhuanlan.zhihu.com/p/403762128

4.CSDN:Hanjieee(2022-09-16)正态分布(高斯分布)的由来(公式推导)https://blog.csdn.net/hj_0317/article/details/126888169

  1. 课件:Jenny Kenkel.History of the Normal Distribution(2016-11-08) https://www.math./~kenkel/normaldistributiontalk.pdf

  2. bilibili:亚瑟的灭神王瞳(2021-11-10 )一个视频说明什么是概率密度函数:
    https://www.bilibili.com/video/BV16L4y1q7MW/?spm_id_from=333.337.search-card.all.click

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号