问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

什么是标准差和方差?一文详解统计学中的重要概念

创作时间:
作者:
@小白创作中心

什么是标准差和方差?一文详解统计学中的重要概念

引用
CSDN
1.
https://blog.csdn.net/weixin_40763897/article/details/139889473

方差和标准差是统计学中常用的衡量数据离散程度的指标。本文将详细介绍方差和标准差的概念、计算方法及其应用场景,帮助读者更好地理解这些统计学基础知识。

什么是方差

方差是衡量数据分布情况的重要指标,它反映了数据点与平均值之间的差异程度。方差的计算过程如下:

  1. 计算平均值(mean),用μ(读作mu)表示。
  2. 用每一个数减去平均值,再平方(对差进行平方)。
  3. 将第二步得到的平方值都加起来,再除以数据的个数,就能得到方差。

方差的求值公式为:
σ2 = 1/N ∑i=1n (xi - μ)2

其中,μ表示平均值。

标准差

标准差是方差的平方根,通常用σ表示。标准差的计算公式为:
σ = √(σ2)

在实际应用中,我们通常直接计算标准差,因为标准差的单位与原始数据相同,更易于理解和解释。标准差的计算公式为:
σ = √(1/N ∑i=1n (xi - μ)2)

有了标准差后,我们可以用它来识别哪些数据是正常的,哪些数据是过大或过小的。这是因为标准差描述了平均下来,每个数据点到平均值点的距离,以此来说明数据的分布情况。

实例分析

假设10个同学的身高(cm)分别为:150, 130, 160, 185, 135, 168, 170, 155, 120, 169

  1. 计算平均值:
    平均值 = (150 + 130 + 160 + 185 + 135 + 168 + 170 + 155 + 120 + 169) / 10 = 154.2

  2. 计算方差:
    方差 = [(150-154.2)2 + (130-154.2)2 + (160-154.2)2 + (185-154.2)2 + (135-154.2)2 + (168-154.2)2 + (170-154.2)2 + (155-154.2)2 + (120-154.2)2 + (169-154.2)2] / 10 = 378.36

  3. 计算标准差:
    标准差 = √378.36 = 19.45

根据这个标准差,我们可以判断哪些同学的身高是正常范围内的,哪些是偏高或偏低的。例如,如果认为在一个标准差内的身高属于正常范围,那么120和133都显得太矮小了,185就太高了。

样本标准差

当数据是样本(从更大的总体中选择)时,计算标准差的方法会有所不同。样本标准差的计算公式为:
s = √(1/(N-1) ∑i=1n (xi - x̄)2)

其中,s代表样本标准差。

实例分析

使用前面的例子,计算样本标准差:

  1. 方差 = [(150-154.2)2 + (130-154.2)2 + (160-154.2)2 + (185-154.2)2 + (135-154.2)2 + (168-154.2)2 + (170-154.2)2 + (155-154.2)2 + (120-154.2)2 + (169-154.2)2] / (10-1) = 420.4

  2. 标准差 = √420.4 = 20.5

样本标准差的计算结果更接近实际值,这是因为除以N-1而不是N可以减少偏差,使估计更准确。

为什么使用平方而不是绝对值

在计算方差和标准差时,为什么要对每个差值进行平方,而不是直接取绝对值呢?

  1. 避免正负抵消:直接相加可能会出现正负抵消的情况,无法准确反映数据点之间的距离。
  2. 与欧几里得距离类似:平方差的计算方式类似于欧几里得空间中两点之间的距离计算,能够更好地反映数据的分布特点。
  3. 数学处理方便:平方和平方根的计算在代数上更容易处理,虽然数值的准确性不是绝对必要,但能准确反映问题的本质更为重要。

通过以上分析,我们可以看到方差和标准差在统计学中的重要性和应用场景。掌握这些基础知识对于进行数据分析和统计推断具有重要意义。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号