终于把统计学中的方差分析搞懂了!!
创作时间:
作者:
@小白创作中心
终于把统计学中的方差分析搞懂了!!
引用
1
来源
1.
http://www.360doc.com/content/25/0406/20/64427839_1150692695.shtml
方差分析(ANOVA)是一种用于比较三个或更多组数据均值是否存在显著差异的统计方法。它通过比较组间差异与组内差异的比率,来判断不同组别之间是否存在显著的统计学差异。方差分析广泛应用于农业、医学、社会科学等领域,帮助研究人员理解和解释数据中的变异来源。
方差分析的原理
方差分析的核心思想是将总体的总变异分解为组内变异和组间变异,并检验组间变异是否大于组内变异。
- 总变异:总变异是所有样本与总体均值之间的差异,即整个数据集的方差。
- 组间变异:组间变异是不同组的均值与总体均值之间的差异,是各组均值变动的贡献。
- 组内变异:组内变异是每个组内数据点与该组均值之间的差异,反映了组内的变异程度。
我们通过比较组间变异与组内变异的比值,来判断不同组的均值是否存在显著差异。通常,方差分析的结果通过 F 值来衡量,F 值越大,意味着组间差异相对于组内差异越大,从而更可能拒绝原假设(即均值相等的假设)。
方差分析的步骤
1. 提出假设
- 原假设(H0):不同组之间的均值没有显著差异,即所有组的均值相等。
- 备择假设(H1):至少有两个组的均值存在显著差异。
2. 计算组间平方和(SSB)
其中,是第 i 组的均值,是所有样本的总体均值。
3. 计算组内平方和(SSW)
其中,是第组的第个样本,是第组的均值。
4. 计算总平方和(SST)
其中,是所有样本的值,是总体均值。
5. 计算自由度(df)
- 组间自由度:k-1,其中k是组数。
- 组内自由度:N-k,其中N是总样本量。
- 总自由度:N-1。
6. 计算均方(MS)
- 组间均方(MSB):SSB/(k-1)
- 组内均方(MSW):SSW/(N-k)
7. 计算F统计量
通过比较组间均方(MSB)与组内均方(MSW)来计算 F 值。如果 F 统计量较大,表示组间差异大于组内差异,可能拒绝原假设。
8. 查找F分布的临界值或计算p值
使用这些自由度和F值查找F分布表中的临界值,或者直接使用统计软件计算 p 值。
9. 做出决策
- 如果计算的 p 值小于预设的显著性水平(通常为 0.05),则拒绝原假设,认为不同组之间存在显著差异。
- 如果 p 值大于显著性水平,则无法拒绝零假设,认为不同组之间没有显著差异。
案例分享
假设有三种不同的教学方法,我们想要检验这三种教学方法是否在学生的考试成绩上有显著差异。我们有三组学生,分别使用三种不同的教学方法进行教学,并记录他们的考试成绩。
- 组1(教学方法A):[56, 59, 61, 58, 55]
- 组2(教学方法B):[65, 67, 66, 64, 62]
- 组3(教学方法C):[71, 73, 74, 72, 70]
现在,我们要使用方差分析来检验这三组之间的均值是否存在显著差异。
import numpy as np
from scipy import stats
# 数据:三种教学方法的考试成绩
group_A = [56, 59, 61, 58, 55]
group_B = [65, 67, 66, 64, 62]
group_C = [71, 73, 74, 72, 70]
# 使用scipy的f_oneway函数进行方差分析
f_statistic, p_value = stats.f_oneway(group_A, group_B, group_C)
# 输出F统计量和p值
print('F-statistic:', f_statistic)
print('p-value:', p_value)
# 判断显著性
alpha = 0.05
if p_value < alpha:
print('拒绝零假设:不同教学方法之间的均值有显著差异')
else:
print('无法拒绝零假设:不同教学方法之间的均值没有显著差异')
# F-statistic: 63.546218487394924
# p-value: 4.123503606051619e-07
# 拒绝零假设:不同教学方法之间的均值有显著差异
结果解释:
- F-statistic:计算得出的 F值,用于判断组间和组内变异的相对大小。
- p-value:计算得出的p值,如果p值小于显著性水平(通常是0.05),则拒绝原假设,认为不同组之间有显著差异。
绘制箱型图
import matplotlib.pyplot as plt
data = [group_A, group_B, group_C]
plt.figure(figsize=(8, 6))
plt.boxplot(data, labels=['Group A', 'Group B', 'Group C'], patch_artist=True,
boxprops=dict(facecolor='lightblue', color='black'),
flierprops=dict(markerfacecolor='red', marker='o', markersize=8, linestyle='none'))
plt.title('Boxplot of Scores by Group')
plt.ylabel('Scores')
plt.xlabel('Groups')
plt.grid(True)
# 显示图形
plt.show()
热门推荐
新U22国家队首战,U20小将替补出彩
德文猫:独特的卷毛小精灵
300排量成买车红线?分排量管理或以成真,部分城市开始施行!
e证驾照报名费用?
安阳灵泉寺石窟:河朔第一古刹的千年遗韵
越剧的历史发展简介:从民间艺术到现代传承
漫画&平面设计:标题设计的思路
专家教你「平板支撑」正确做法,做对15秒就能瘦!告诉你2大错误动作恐伤脊椎
程序员该如何选择职业赛道的分析
师出同门的两级战舰:扶桑级与伊势级的演变与区别
柯萨奇病毒抗体弱阳性是什么意思
什么是修订内容
助播怎样才能配合好主播?流程+话术
普洱茶一般保存多久 普洱茶饼如何长期保存
普洱茶一般保存多久 普洱茶饼如何长期保存
为什么鹦鹉白天睡觉(鹦鹉怎么睡觉?)
如何建立有效的学习习惯
乙醇汽油:新型环保燃料的利与弊
文人情怀 菖蒲情深
黄历中结婚吉日有哪些?中国传统婚礼选日子的讲究与推荐
《鬼谷八荒》最强气运介绍
解读欧冠争议判罚!小蜘蛛是否二次触球,前金哨:有钱却不装芯片
自动更新网页数据
12306火车票退票指南,详解退票方式、收费和限制
英文论文写作摘要写作公式来了!快来看看!
皮肤蜡黄可能是吃错食物害的!皮肤科医师教4招有效护肤、改善肤况
降噪技术如何让世界静悄悄
多个CSS居中方案,你可能还不知道!水平居中垂直居中水平垂直居中
桑黄种植技术全攻略:从选址到采收的完整指南
拔牙后多久可以进食和饮水?了解拔牙后的饮食注意事项