如何解释配对 t 检验的主要结果
如何解释配对 t 检验的主要结果
解释配对 t 检验的主要结果
配对 t 检验是一种统计方法,用于比较两个相关样本的均值是否存在显著差异。本文将通过三个主要步骤来解释配对 t 检验的结果:确定总体均值差值的置信区间、确定检验结果的统计显著性、以及检查数据是否有问题(如偏斜和异常值)。
步骤 1:确定总体均值差值的置信区间
首先考虑均值差值,然后检查置信区间。均值差值是样本中配对观测值之间的平均差值。
均值差值是对总体均值差值的估计值。由于均值差值基于样本数据而不是整个总体,因此样本均值差值通常不等于总体均值差值。使用置信区间可以更好地估计总体均值差值。
置信区间提供配对观测值的总体均值差值的可能值范围。例如,95% 置信水平表明,如果从总体中随机抽取 100 个样本,则大约 95 个样本将产生包含总体均值差值的区间。置信区间有助于评估结果的实际意义。使用您的专业知识可以确定置信区间是否包括对您的情形有实际意义的值。如果区间因太宽而毫无用处,请考虑增加样本数量。有关更多信息,请转到获得更加精确的置信区间的方法。
配对差值的估计值
均值 | 标准差 | 均值标准误 | μ_差 的 95% 置信区间 |
---|---|---|---|
2.200 | 3.254 | 0.728 | (0.677, 3.723) |
主要结果:均值差值、均值差值的 95% 置信区间
在这些结果中,心率的总体均值差值的估计值为 2.2。总体均值差值介于 0.677 和 3.723 之间的可信度为 95%。
步骤 2:确定检验结果在统计意义上是否显著
要确定总体均值的差值在统计意义上是否显著,请将 p 值与显著性水平进行比较。通常,显著性水平(用 α 或 alpha 表示)为 0.05 即可。显著性水平 0.05 指示在实际上不存在差值时得出存在差值的风险为 5%。
P 值 ≤ α:均值的差值在统计意义上显著(否定 H0)
如果 p 值小于或等于显著性水平,则决策为否定原假设。您可以得出总体均值的差值不等于假设差值的结论。如果您没有指定假设差值,Minitab 将检验均值之间是否不存在差值(假设差值= 0)请使用您的专业知识确定差值在实际意义上是否显著。有关更多信息,请转到统计显著性和实际显著性。
P 值 > α:均值的差值在统计意义上不显著(无法否定 H0)
如果 p 值大于显著性水平,则决策为无法否定原假设。您没有足够的证据得出配对观测值的平均差值在统计意义上显著的结论。您应该确保检验具有足够的功效来检测到在实际意义上显著的差值。有关更多信息,请转到配对 t 的功效和样本数量。
检验
- 原假设 H₀: μ_差 = 0
- 备择假设 H₁: μ_差 ≠ 0
T 值 | P 值 |
---|---|
3.02 | 0.007 |
主要结果:P 值
在这些结果中,原假设声明在执行某运算程序前后,患者的静息心率之间的平均差值为 0。由于 p 值为 0.007(小于显著性水平 0.05),因此决策为否定原假设并得出在执行某运算程序前后患者的静息心率之间存在差异的结论。
步骤 3:检查数据是否有问题
您数据中存在的问题(如偏度和异常值)可对结果产生不利影响。请使用图形来查找偏度以及确定可能的异常值。
检查数据的分布以确定数据看上去是否偏斜
当数据偏斜时,大多数数据会位于图形的高或低侧。通常情况下,在直方图或箱线图中最易于检测偏斜。
右偏斜
左偏斜
带右偏斜数据的直方图会显示等待时间。大部分等待时间相对较短,只有少数等待时间较长。带左偏斜数据的直方图会显示失效时间数据。少数几个项会立即失败,更多的项将在随后失败。
如果样本较小(小于 20 个值),则严重偏斜的数据可影响 p 值的有效性。如果您的数据严重偏斜,并且样本较小,请考虑增大样本数量。
在该直方图中,数据的偏斜程度似乎不严重
识别异常值
异常值是远离其他数据值的数据值,可以显著影响您的分析结果。通常情况下,在箱线图上最容易识别异常值。
在箱线图上,星号 (*) 表示异常值。
尝试确定导致任何异常值的原因。更正任何数据输入错误或测量误差。考虑删除异常、单次事件(也称为特殊原因)的数据值。然后,重新执行分析。有关更多信息,请转到标识异常值。
该箱线图中没有异常值
本文原文来自Minitab官方支持页面