问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

随机变量:平均、方差和标准差

创作时间:
作者:
@小白创作中心

随机变量:平均、方差和标准差

引用
1
来源
1.
https://www.shuxuele.com/data/random-variables-mean-variance.html

随机变量是统计学中的一个基本概念,它将随机实验的结果用数值表示,从而可以进行数学分析。本文将通过具体例子,详细介绍随机变量的平均值、方差和标准差的计算方法。

随机变量是一个随机实验结果的可能数值

例子:抛硬币

结果可以是正面或反面。我们可以用数值来代表:正面=0反面=1,这就是随机变量 "X":

所以:

  • 有个实验(比方抛硬币)
  • 我们给每个事件分派数值
  • 数值的集合是个随机变量

去阅读随机变量来了解更多。

平均、方差和标准差

例子:抛一个不公平的骰子

想象一个加重了的骰子(蒙人!)。概率是:

数值
1
2
3
4
5
6
概率
0.1
0.1
0.1
0.1
0.1
0.5

平均或期望值:μ

如果我们知道每个数值x的概率,我们便可以计算 X 的期望值(平均):

μ = Σxp

注意:Σ是总和符号,意思是加起来。

计算期望值:

  • 把每个数值乘以其概率
  • 把结果加起来

例子(续):

数值 x
1
2
3
4
5
6
概率 p
0.1
0.1
0.1
0.1
0.1
0.5
xp
0.1
0.2
0.3
0.4
0.5
3

μ = Σxp = 0.1+0.2+0.3+0.4+0.5+3 = 4.5

期望值是 4.5

注意:这是加权平均值:高概率的数值在平均里有较高的比重。

方差:Var(X)

方差是:

Var(X) = Σx2p − μ2

计算方差:

  • 把每个数值的平方乘以其概率
  • 把结果加起来:Σx2p
  • 减去期望值的平方μ2

例子(续):

数值 x
1
2
3
4
5
6
概率 p
0.1
0.1
0.1
0.1
0.1
0.5
x2p
0.1
0.4
0.9
1.6
2.5
18

Σx2p = 0.1+0.4+0.9+1.6+2.5+18 = 23.5

Var(X) = Σx2p − μ2= 23.5 - 4.52= 3.25

方差是 3.25

标准差:σ

标准差是方差的平方根:

σ = √Var(X)

例子(续):

数值 x
1
2
3
4
5
6
概率 p
0.1
0.1
0.1
0.1
0.1
0.5
x2p
0.1
0.4
0.9
1.6
2.5
18

σ = √Var(X)= √3.25= 1.803...

标准差是 1.803……

再来一个例子!
(注意这次的列表是垂直排列的。)

你打算开一家麦德劳炸鸡店。这是市场调查数据:

百分比
每年收益
20%
¥50,000 亏蚀
30%
¥0
40%
¥50,000 利润
10%
¥150,000 利润

用这些概率来计算,你的利润期望值和标准差是多少?

随机变量是 X = '可能利润'。

xpx2p的总和:

黛绿p
收益(¥'000)x
xp
x2p
0.2
-50
-10
500
0.3
0
0
0
0.4
50
20
1000
0.1
150
15
2250
Σp = 1
Σxp = 25
Σx2p = 3750

μ = Σxp =25

Var(X) = Σx2p − μ2= 3750 − 252= 3750 − 625 =3125

σ = √3125 =56(到最近的整数)

这些数值的单位是千元,所以:

  • μ = ¥25,000
  • σ = ¥56,000

所以你预期可以转到 ¥25,000,但可能有很大的误差。

我们再做一遍,不过这次 ¥50,000 的概率大很多:

例子(续):

用不同的概率(¥50,000 的概率是很高的0.7):

概率p
收益(¥'000)x
xp
x2p
0.1
-50
-5
250
0.1
0
0
0
0.7
50
35
1750
0.1
150
15
2250
Σp = 1
Sums:
Σxp = 45
Σx2p = 4250

μ = Σxp =45

Var(X) = Σx2p − μ2= 4250 − 452= 4250 − 2025 =2225

σ = √2225 =47(到最近的整数)

把千元转回到元:

  • μ = ¥45,000
  • σ = ¥47,000

平均值现在比较接近离最可能值了。
标准差也小了(代表数值比较聚合在中间。)

连续

随机变量可以是离散或连续的:

  • 离散数据只能取某些数值(例如 1、2、3、4、5)
  • 连续数据可以取一个范围(值域)里的任何数值(例如人的身高)

这个网页的例子都是关于离散数据的,因为求连续数据的平均、方差和标准差需要用到积分法。

总结

  • A随机变量是随机实验结果的可能数值。
  • 平均(期望值)是:μ = Σxp
  • 方差是:Var(X) = Σx2p − μ2
  • 标准差是:σ = √Var(X)
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号