如何解释单因子方差分析的主要结果
如何解释单因子方差分析的主要结果
单因子方差分析(One-Way ANOVA)是统计学中常用的一种方法,用于检验多个样本均值之间是否存在显著差异。本文将详细介绍如何解释单因子方差分析的主要结果,包括统计显著性检验、组均值比较、模型拟合度评估以及残差分析等关键步骤。
步骤 1:确定组均值之间的差分在统计意义上是否显著
要确定均值之间的任何差值在统计意义上是否显著,请将 p 值与显著性水平进行比较以评估原假设。原假设声明总体均值均相等。通常,显著性水平(用 α 或 alpha 表示)为 .05 即可。显著性水平 .05 指示在实际上不存在差异时得出存在差异的风险为 5%。
P 值 ≤ α:一些均值之间的差值在统计意义上显著
如果 p 值小于或等于显著性水平,则否定原假设并得出并非所有总体均值都相等的结论。使用您的专业知识可以确定差值实际上是否显著。有关更多信息,请转到统计显著性和实际显著性。P 值 > α:均值之间的差值在统计意义上不显著
如果 p 值大于显著性水平,则您没有足够的证据否定原假设(总体均值相等)。请确认检验具有足够的功效来检测在实际意义上显著的差值。您应该确保检验具有足够的功效来检测到在实际意义上显著的差值。
方差分析
来源 | 自由度 | Adj SS | Adj MS | F 值 | P 值 |
---|---|---|---|---|---|
油漆 | 3 | 281.7 | 93.90 | 6.02 | 0.004 |
误差 | 20 | 312.1 | 15.60 | ||
合计 | 23 | 593.8 |
主要结果:P 值
在这些结果中,原假设表明 4 种不同的油漆的硬度均值相等。因为 p 值小于显著性水平 0.05,则可以否定原假设并得出部分油漆的均值不同。
步骤 2:检查组均值
使用区间图可显示每个组的均值和置信区间。
区间图显示如下内容:
- 每个点号都代表样本均值。
- 每个区间针对组均值具有 95% 的置信区间。组均值位于组的置信区间内的置信度为 95%。
重要信息
请谨慎解释这些区间,因为进行多重比较时出现类型 1 错误的比率会增加。也就是说,当您增加比较数后,至少有一个比较将错误得出其中一个观测差分会显著不同的概率也会相应增加。
要评估此图中显示的差分,请使用分组信息表和其他比较输出(如步骤 3 中所示)。
在区间图中,混料 2 具有最低均值,混料 4 具有最高均值。从图形中不能确定任何差分是否在统计意义上显著。要确定统计显著性,请评估均值差分的置信区间。
步骤 3:比较组均值
如果单因子方差分析 p 值小于显著性水平,您将知道部分组均值是不同的,但组对的情况并非如此。针对均值差分使用分组信息表和检验可确定特定组对之间的均值差分是否在统计意义上显著,并且根据差异程度进行估计。
有关比较方法的更多信息,请转到使用多重比较评估实际显著性和统计显著性。
分组信息表
使用分组信息表可快速确定任何组对之间的均值差值在统计意义上是否显著。
不共享字母的组存在显著差异。
均值差分检验
使用置信区间可确定差分的可能范围并确定差分是否具有实际显著性。表格会显示均值对之间差分的一组置信区间。均值差分的区间图会显示相同的信息。
不包含零的置信区间表示统计意义显著的均值差分。
根据您选择的比较方法,表格会比较不同的组对并显示下列置信区间类型之一。
- 单个置信水平
在多次反复执行研究的情况下,单个置信区间包含一对组均值间实际差分的次数的百分比。
- 整体置信水平
在多次反复执行研究的情况下,一组置信区间包含所有组比较值之间实际差分的次数的百分比。
在执行多重比较时,控制整体置信水平尤其重要。如果您没有控制同步置信水平,则至少有一个置信区间不包含实际差分的概率会随着比较次数的增加而提高。
有关更多信息,请转到了解多重比较中的单个置信水平和同时置信水平。
有关如何解释许氏 MCB 法结果的更多信息,请转到什么是许氏法与最佳值的多重比较 (MCB)?
使用 Tukey 方法和 95% 置信度对信息进行分组
油漆 | N | 均值 | 分组 |
---|---|---|---|
配方 4 | 6 | 18.07 | A |
配方 1 | 6 | 14.73 | A B |
配方 3 | 6 | 12.98 | A B |
配方 2 | 6 | 8.57 | B |
主要结果:均值、分组
在这些结果中,表显示组 A 包含混料 1、3 和 4,组 B 包含混料 1、2 和 3。混料 1 和混料 3 处于两个组中。共享一个字母的均值之间的差分在统计意义上不显著。混料 2 和混料 4 不共享一个字母,这表明混料 4 的均值比混料 2 的均值明显高很多。
均值差值的 Tukey 同时检验
水平的差值 | 均值差值 | 差值标准误 | 95% 置信区间 | T 值 | 调整的 P 值 |
---|---|---|---|---|---|
配方 2 - 配方 1 | -6.17 | 2.28 | (-12.55, 0.22) | -2.70 | 0.061 |
配方 3 - 配方 1 | -1.75 | 2.28 | (-8.14, 4.64) | -0.77 | 0.868 |
配方 4 - 配方 1 | 3.33 | 2.28 | (-3.05, 9.72) | 1.46 | 0.478 |
配方 3 - 配方 2 | 4.42 | 2.28 | (-1.97, 10.80) | 1.94 | 0.245 |
配方 4 - 配方 2 | 9.50 | 2.28 | (3.11, 15.89) | 4.17 | 0.002 |
配方 4 - 配方 3 | 5.08 | 2.28 | (-1.30, 11.47) | 2.23 | 0.150 |
主要结果:整体置信水平 95% CI,单个置信水平
在 Tukey 结果中,置信区间指示如下内容:
- 混料 2 和 4 的均值之间差分的置信区间为 3.11 到 15.89。此范围不包含零,表明这些差分在统计意义上显著。
- 其余均值对的置信区间都包括 0,表明这些差分在统计意义上不显著。
- 95% 的整体置信水平表明所有置信区间包含实际差分的置信度可能是 95%。
- 该表指示单个置信水平为 98.89%。此结果表明每个单个区间包含特定组均值对之间实际差分的置信度可能为 98.89%。每个比较的单个置信水平会针对所有六种比较产生 95% 的整体置信水平。
步骤 4:确定模型与数据拟合的程度
要确定模型与数据的拟合优度,请检查模型汇总表中的拟合优度统计量。
S
使用 S 可评估模型描述响应值的程度。
S 以响应变量的单位进行度量,它表示数据值与拟合值的距离。S 值越低,模型描述响应的程度越高。但是,自身低 S 值并不表明模型符合模型假设。您应检查残差图来验证假设。
R-sq
R2是由模型解释的响应中的变异百分比。R2值越高,模型拟合数据的优度越高。R2始终介于 0% 和 100% 之间。
高 R2值表示模型不符合模型假设。您应检查残差图来验证假设。
R-Sq(预测)
使用预测的 R2可确定模型对新观测值的响应进行预测的程度。具有较大预测 R2值的模型的预测能力也较出色。
实质上小于 R2的预测的 R2可能表明模型过度拟合。在向总体中添加不太重要的影响项的情况下,可能会发生过度拟合模型。模型针对样本数据而定制,因此可能对于总体预测不太有效。
在比较模型方面,预测的 R2还可能比调整的 R2更有效,因为它是用模型计算中未包含的观测值计算得出的。
模型汇总
S | R-sq | R-sq(调整) | R-sq(预测) |
---|---|---|---|
3.95012 | 47.44% | 39.56% | 24.32% |
主要结果:S、R-sq、R-sq(预测)
在这些结果中,因子对响应中 47.44% 的变异给出了解释。S 表示数据点和拟合值之间的标准差约为 3.95 个单位。
步骤 5:确定模型是否符合分析的假设
使用残差图可帮助您确定模型是否适用并符合分析的假设。如果不符合此假设,则模型可能无法充分拟合数据,在解释结果时应当格外小心。
残差与拟合值图
使用残差与拟合值图可验证残差随机分布和具有常量方差的假设。理想情况下,点应当在 0 的两端随机分布,点中无可辨识的模式。
下表中的模式可能表示该模型不满足模型假设。
模式:残差相对拟合值呈扇形或不均匀分散
模式的含义:异方差
模式:远离 0 的点
模式的含义:异常值
在此残差图与拟合图中,点随机散落在图上。没有组看起来具有明显不同的变化,并且没有明显的异常值。
残差与顺序图
使用残差与顺序图可验证残差独立于其他残差的假设。当以时序显示时,独立残差不显示趋势或模式。点中的模式可能表明,彼此相近的残差可能相关联,因此并不独立。理想情况下,图中的残差应围绕中心线随机分布:
如果查看模式,便可查出原因。下列类型的模式可能表明残差属于依赖项。
- 趋势
- 偏移
- 周期
在此残差与顺序图中,残差似乎会围绕中心线随机衰减。
残差的正态概率图
使用残差正态概率图可验证残差呈正态分布的假设。残差的正态概率图应该大致为一条直线。
下表中的模式可能表示该模型不满足模型假设。
模式:非直线
模式的含义:非正态性
模式:远离直线的点
模式的含义:异常值
模式:斜率不断变化
模式的含义:未确定的变量
注意:如果单因子方差分析设计符合样本数量原则,则结果不会受正态性偏离的显著影响。
在此正态概率图中,残差通常看起来是一条直线。从残差图与拟合图中,您可以看到四个组中的每一个都具有六个观测值。由于此设计不符合样本数量规则,所以满足正态假设很重要,因而检验结果是可靠的。