终于把统计学中的 T 检验搞懂了!!
终于把统计学中的 T 检验搞懂了!!
T 检验是一种广泛应用于统计学中的假设检验方法,用于比较两个样本均值之间是否存在显著差异,或者一个样本的均值是否与已知值有显著差异。它基于 t 分布,适用于样本量较小(通常 n < 30)且总体标准差未知的情况。T 检验的核心思想是通过计算 t 统计量,来判断观察到的差异是否具有统计学意义。
T 检验的类型
T 检验主要包括以下三种类型。
1.单样本 t 检验
用于检验一个样本的均值是否与已知的总体均值存在显著差异。
适用场景
例如,检测某批产品的平均寿命是否与公司标注的寿命一致。
假设
- H0:样本均值等于总体均值
- H1:样本均值不等于总体均值
数学公式
其中:
- x̄ 是样本均值
- μ 是总体均值
- s 是样本标准差
- n 是样本大小
2.独立样本 t 检验
用于检验两个独立样本的均值是否有显著差异。
适用场景
例如,比较男性和女性的平均身高是否不同。
假设
- H0:两组样本的均值相等。
- H1:两组样本的均值不相等。
数学公式
其中:
- x̄1 和 x̄2 是两个样本的均值
- s1^2 和 s2^2 是两个样本的方差
- n1 和 n2 是两个样本的大小
3.配对样本 t 检验
用于比较两个相关样本(如同一组实验对象在不同时间点的测量值)的均值是否有显著差异。
适用场景
例如,比较同一批学生在两次考试中的成绩是否有显著变化。
假设
- H0:配对样本的均值差为零。
- H1:配对样本的均值差不为零。
数学公式
其中:
- d̄ 是配对差值的均值
- sd 是差值的标准差
- n 是配对样本对数
T 检验的步骤
以下以独立样本 t 检验为例,介绍其基本步骤。
- 提出假设
定义零假设(H0)和备择假设(H1)
- 零假设(H0):两组均值相等,即 μ1 = μ2
- 备择假设(H1):两组均值不相等,即 μ1 ≠ μ2(双尾检验)。或选择单尾检验:μ1 < μ2 或 μ1 > μ2。
选择显著性水平
常用的显著性水平有 0.05、0.01 等。计算 t 统计量
公式如下:
t = (x̄1 - x̄2) / sqrt[(s1^2/n1) + (s2^2/n2)]
其中,x̄1 和 x̄2 为两个样本均值,s1^2 和 s2^2 为样本方差,n1 和 n2 为样本大小。
确定自由度
对于独立样本 t 检验,自由度计算较为复杂,常用公式为:
df = [(s1^2/n1) + (s2^2/n2)]^2 / [(s1^2/n1)^2/(n1-1) + (s2^2/n2)^2/(n2-1)]
或在方差齐性假设成立时,简化为 df = n1 + n2 - 2查找临界值或计算 p 值
根据 t 分布表和自由度,确定临界 t 值,或直接计算 p 值。做出决策
根据 T 值或 P 值,判断是否拒绝零假设
- 如果 |t| > t_critical,或 p < α,拒绝零假设,认为两组均值存在显著差异。
- 如果 |t| ≤ t_critical,或 p ≥ α,不拒绝零假设,认为两组均值差异不显著。
T 检验的假设
所有类型的 T 检验都基于以下基本假设:
- 数据正态性:样本数据应近似服从正态分布(尤其是小样本时)。
- 方差齐性:独立样本 T 检验要求两组数据的方差相等。
- 独立性:样本数据之间应相互独立。
案例分享
某研究对两组学生进行不同的教学方法实验,并记录了他们的考试成绩:
- 组 1:传统教学法,样本大小为 10,考试成绩为 [82, 88, 91, 85, 89, 93, 87, 90, 84, 86]。
- 组 2:新型教学法,样本大小为 10,考试成绩为 [79, 81, 85, 83, 80, 86, 84, 82, 78, 88]。
研究问题
新型教学法是否显著提高了考试成绩?
假设:
- 零假设 (H0):两组成绩的均值没有显著差异 (μ1 = μ2)。
- 备择假设 (H1):两组成绩的均值存在显著差异 (μ1 ≠ μ2)。
import numpy as np
from scipy.stats import ttest_ind
# 数据
group1 = np.array([82, 88, 91, 85, 89, 93, 87, 90, 84, 86]) # 传统教学法
group2 = np.array([79, 81, 85, 83, 80, 86, 84, 82, 78, 88]) # 新型教学法
# 独立样本 T 检验
t_stat, p_value = ttest_ind(group1, group2, equal_var=True) # 假设方差相等
# 显示结果
alpha = 0.05 # 显著性水平
print(f'T 值: {t_stat:.2f}')
print(f'P 值: {p_value:.4f}')
if p_value < alpha:
print('拒绝原假设,认为两组均值存在显著差异。')
else:
print('不拒绝原假设,认为两组均值不存在显著差异。')
解释
P 值
P 值为 0.0037,小于显著性水平,因此拒绝零假设。结论
传统教学法和新型教学法对学生考试成绩的影响存在显著差异。