问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

边缘概率分布

创作时间:
作者:
@小白创作中心

边缘概率分布

引用
1
来源
1.
https://kb.kmath.cn/kbase/detail.aspx?id=2553

边缘概率分布是概率论中的一个重要概念,特别是在处理多维随机变量时。它允许我们从联合分布中提取出单个变量的分布特征,从而简化问题的分析。本文将详细介绍边缘概率分布的定义、计算方法及其在离散和连续情况下的具体应用。

定义

设 (\left(X,Y\right)) 是一个二维随机变量,其联合分布为 (P\left(X,Y\right))。

  • (X) 的边缘分布是通过对 (Y) 的所有可能取值求和(离散情况)或积分(连续情况)得到的:

    • 离散情况:(P\left(X=x\right)=\sum _{y}P\left(X=x,Y=y\right))

    • 连续情况:({f}{X}\left(x\right)={\int }{-\mathrm{\infty }}^{\mathrm{\infty }}{f}_{X,Y}\left(x,y\right)\phantom{\rule{0.167em}{0ex}}dy)

  • 类似地,(Y) 的边缘分布为:

    • 离散情况:(P\left(Y=y\right)=\sum _{x}P\left(X=x,Y=y\right))

    • 连续情况:({f}{Y}\left(y\right)={\int }{-\mathrm{\infty }}^{\mathrm{\infty }}{f}_{X,Y}\left(x,y\right)\phantom{\rule{0.167em}{0ex}}dx)

离散型

边缘分布可以理解为在多维随机变量中,忽略其他变量后,探寻某一维变量的分布情况。例如,在研究身高和体重的联合分布时,边缘分布可以分别描述身高或体重的单独分布。

考虑扔两个骰子的点数,第一个为(X),第二个为(Y)。那么(P\left(X=1,Y=1\right))就是扔出来(\left(1,1\right))的概率了,这个对应到连续的情况就是(f\left(X=1,Y=1\right)),这就是联合概率密度。

现在我只关心第一个色子,也就是(X)的概率,这时候(P\left(X=1\right))就包含了扔出来(\left(X=1,Y=1\right),\left(1,2\right)\left(1,3\right)\left(1,4\right)\left(1,5\right)\left(1,6\right)) 六个情况了,也就是“Y等于多少都可以”,这个就对应到连续变量的边缘分布了。那么,你离散情况下从第一个概率算起,把第二个概率求和即可,这个对应到连续就自然变成积分,如果还不是很清楚,请看下面的例子:

例1

假设学生数学(X) 和语文(Y)成绩的联合分布如下:

这是一个学生成绩分布表,中间的一个数字表示该学生(语文和数学)的概率,比如该生语文80分,数学80分的概率0.3, 语文100,数学80分的概率为0,

现在,我们要研究该生数学为80的概率,只需要把X=80的数学对应的行加起来即可,即 0.2+0.3+0.0=0.5

数学成绩 (X) 的边缘分布

[\begin{array}{rl}P\left(X=60\right)& =0.1+0.0+0.1=0.2,\ P\left(X=80\right)& =0.2+0.3+0.0=0.5,\ P\left(X=100\right)& =0.0+0.1+0.2=0.3.\end{array}]

语文成绩 (Y) 的边缘分布

[\begin{array}{rl}P\left(Y=60\right)& =0.1+0.2+0.0=0.3,\ P\left(Y=80\right)& =0.0+0.3+0.1=0.4,\ P\left(Y=100\right)& =0.1+0.0+0.2=0.3.\end{array}]

连续型边缘分布

相比离散型边缘分布,连续性边缘分布要难的多,这里的“难”不是说意义上的难,而是计算上的难。连续性边缘分布本质是广义积分,对于微积分不好的同学,计算积分是一大挑战。

不管是离散型还是连续性,边缘密度的定义都是一样的

设 (\left(X,Y\right)) 是二维连续型随机变量,其概率密度为 (f\left(x,y\right)) ,由定义可得 (X) 的边缘分布函数

[\begin{array}{rl}{F}{X}\left(x\right)& =P\left(X⩽x\right)=P\left(X⩽x,y<+∞\right)\ & ={\int }{-\mathrm{\infty }}^{x}{\int }{-\mathrm{\infty }}^{+∞}f\left(s,t\right)dsdt={\int }{-\mathrm{\infty }}^{x}\left[{\int }_{-\mathrm{\infty }}^{+∞}f\left(s,t\right)dt\right]ds.\end{array}]

进而可得 (X) 的边缘密度函数为

[{f}{X}\left(x\right)=\frac{d{F}{X}\left(x\right)}{dx}={\int }_{-\mathrm{\infty }}^{+∞}f\left(x,y\right)dy.]

同理,(Y) 是连续型随机变量,且其边缘密度函数为

[{f}{Y}\left(y\right)={\int }{-\mathrm{\infty }}^{+∞}f\left(x,y\right)dx]

分别称 ({f}{X}\left(x\right)) 和 ({f}{Y}\left(y\right)) 为 (\left(X,Y\right)) 关于 (X) 和 (Y) 的边缘分布密度或边缘概率密度.

看懂连续性边缘分布图像

下图显示的({F}_{X})边缘分布

从图中可以看到,求(X)边缘分布时,Y的取值范围是是(\left(-∞,+∞\right))

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号