终于把统计学中的 T 检验搞懂了!!
终于把统计学中的 T 检验搞懂了!!
T 检验是一种广泛应用于统计学中的假设检验方法,用于比较两个样本均值之间是否存在显著差异,或者一个样本的均值是否与已知值有显著差异。
它基于 t 分布,适用于样本量较小(通常 n < 30)且总体标准差未知的情况。T 检验的核心思想是通过计算 t 统计量,来判断观察到的差异是否具有统计学意义。
T 检验的类型
T 检验主要包括以下三种类型。
1.单样本 t 检验
用于检验一个样本的均值是否与已知的总体均值存在显著差异。
适用场景
例如,检测某批产品的平均寿命是否与公司标注的寿命一致。
假设
: 样本均值等于总体均值
: 样本均值不等于总体均值
数学公式
其中:
是样本均值
是总体均值
是样本标准差
是样本大小
2.独立样本 t 检验
用于检验两个独立样本的均值是否有显著差异。
适用场景
例如,比较男性和女性的平均身高是否不同。
假设
原假设():两组样本的均值相等。
备择假设():两组样本的均值不相等。
数学公式
其中:
是两个样本的均值
是两个样本的方差
是两个样本的大小
3.配对样本 t 检验
用于比较两个相关样本(如同一组实验对象在不同时间点的测量值)的均值是否有显著差异。
适用场景
例如,比较同一批学生在两次考试中的成绩是否有显著变化。
假设
:配对样本的均值差为零。
:配对样本的均值差不为零。
数学公式
其中:
是配对差值的均值
是差值的标准差
n 是配对样本对数
T 检验的步骤
以下以独立样本 t 检验为例,介绍其基本步骤。
- 提出假设
定义零假设()和备择假设()
零假设():两组均值相等,即
备择假设():两组均值不相等,即(双尾检验)。或选择单尾检验:或。
选择显著性水平
常用的显著性水平有 0.05、0.01 等。
计算 t 统计量
公式如下:
其中,为两个样本均值,为样本方差,为样本大小。
确定自由度
对于独立样本 t 检验,自由度计算较为复杂,常用公式为:
或在方差齐性假设成立时,简化为
查找临界值或计算 p 值
根据 t 分布表和自由度,确定临界 t 值,或直接计算 p 值。
做出决策
根据 T 值或 P 值,判断是否拒绝零假设
如果,或,拒绝零假设,认为两组均值存在显著差异。
如果,或,不拒绝零假设,认为两组均值差异不显著。
T 检验的假设
所有类型的 T 检验都基于以下基本假设:
数据正态性:样本数据应近似服从正态分布(尤其是小样本时)。
方差齐性:独立样本 T 检验要求两组数据的方差相等。
独立性:样本数据之间应相互独立。
案例分享
某研究对两组学生进行不同的教学方法实验,并记录了他们的考试成绩:
- 组 1
传统教学法,样本大小为 10,考试成绩为 [82, 88, 91, 85, 89, 93, 87, 90, 84, 86]。
- 组 2
新型教学法,样本大小为 10,考试成绩为 [79, 81, 85, 83, 80, 86, 84, 82, 78, 88]。
研究问题
新型教学法是否显著提高了考试成绩?
假设:
零假设 ():两组成绩的均值没有显著差异 ()。
备择假设 ():两组成绩的均值存在显著差异 ()。
import numpy as np
from scipy.stats import ttest_ind
# 数据
group1 = np.array([82, 88, 91, 85, 89, 93, 87, 90, 84, 86]) # 传统教学法
group2 = np.array([79, 81, 85, 83, 80, 86, 84, 82, 78, 88]) # 新型教学法
# 独立样本 T 检验
t_stat, p_value = ttest_ind(group1, group2, equal_var=True) # 假设方差相等
# 显示结果
alpha = 0.05 # 显著性水平
print(f'T 值: {t_stat:.2f}')
print(f'P 值: {p_value:.4f}')
if p_value < alpha:
print('拒绝原假设,认为两组均值存在显著差异。')
else:
print('不拒绝原假设,认为两组均值不存在显著差异。')
解释
- P 值
P 值为 0.0037,小于显著性水平,因此拒绝零假设。
- 结论
传统教学法和新型教学法对学生考试成绩的影响存在显著差异。