问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

方差、标准差、协方差

创作时间:
作者:
@小白创作中心

方差、标准差、协方差

引用
1
来源
1.
https://cloud.tencent.com/developer/article/1411597

方差、标准差和协方差是统计学中描述数据分布特征的重要概念。本文将从均值开始,逐步介绍方差、标准差的定义和计算方法,重点解释样本方差中分母取n还是n-1的问题。此外,还将详细阐述协方差及其矩阵的定义和性质,以及相关系数的概念和特点。

1. 均值

数据的平均值。

2. 方差

方差(Variance)是各个数据与平均数之差的平方的平均数,用来度量随机变量与其数学期望之间的偏离程度。

样本方差

关于公式中分母取值为n,还是n-1

  • 如果数据是总体数据的部分样本(如学校全体男生中的部分男生身高),则分母为n-1,称为整体数据的无偏估计;
  • 如果数据就是所有的数据(如学校全体男生的身高),则分母应该替换为n。

相关证明来源于https://blog.csdn.net/Hearthougan/article/details/77859173。证明过程截图如下:

3. 标准差

标准差等于方差的平方根,描述的是样本集合的各个样本点到均值的距离的平均值

4. 协方差

协方差用于衡量两个变量偏离其均值的程度。

方差和标准差一般用来描述一维数据,但是我们想要了解两组数据之间是否存在一定的联系,可以仿照方差公式,构造协方差公式如下:

4.1 协方差矩阵

  • 协方差矩阵是一个对称的矩阵;
  • 对角线上是各个维度的方差。

三维的协方差矩阵

4.2 相关系数

协方差作为描述X和Y相关程度的方法,在同一物理量纲下有一定的作用。但是两个变量采用不同的量纲时,他们的协方差在数值上会表现出很大的差异。为此引出相关系数的公式(如下),其具有如下特点:

  • 相关系数是一个衡量线性独立的无量纲数
  • 取值范围是[-1,1]

相关系数

参考资料:

https://www.cnblogs.com/ywl925/p/3210822.html
https://blog.csdn.net/Hearthougan/article/details/77859173

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号