问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

Robust回归分析:原理、应用场景及SPSSAU实战

创作时间:
作者:
@小白创作中心

Robust回归分析:原理、应用场景及SPSSAU实战

引用
1
来源
1.
https://spssau.com/helps/conometricstudy/robustreg.html

在数据分析和统计建模中,异常值的处理是一个常见且重要的问题。Robust回归作为一种能够有效应对异常值影响的回归方法,在实际应用中具有重要意义。本文通过一个具体案例,详细介绍了Robust回归的原理、应用场景以及在SPSSAU中的具体操作步骤。

1. 背景

现有200个研究数据,包含2个解释变量(X1、X2)和1个被解释变量(Y)。研究目的是分析这2个解释变量对被解释变量的影响情况。

2. 理论基础

Robust回归法(也称M估计)主要用于解决数据中的异常值(或极端值)问题。当数据中存在异常值时,传统的OLS回归可能会受到严重影响,导致结果失真。而Robust回归通过赋予不同观测值不同的权重,能够有效降低异常值的影响。

特别提示:

  • 在进行Robust回归之前,建议先通过散点图、箱线图等方法检查数据中的异常值情况。
  • Robust回归不仅适用于处理异常值,还可以用于验证结论的稳健性。具体来说,可以先使用OLS回归得到初步结论,再使用Robust回归进行验证,如果两种方法得到的结论基本一致,则说明结论具有较高的可靠性。

3. 案例分析

数据预处理

首先绘制X1、X2与Y的散点图,检查是否存在异常值。

从上图可以看出,数据中存在3个明显的异常值点。即使将这3个异常值点筛选出去,再次绘制散点图:

从上图可以明显看出:

  • X1与Y之间存在明显的负向关系
  • X2与Y之间没有明显的相关关系

在这种情况下,使用Robust回归进行分析更为合适。

操作步骤

本案例使用SPSSAU进行分析。具体步骤如下:

  1. 选择“进阶方法” -> “Robust回归”
  2. 将X1、X2设置为解释变量,Y设置为被解释变量
  3. 点击“开始分析”

结果解读

SPSSAU输出了两个表格结果:常规格式和简化格式。这里主要关注简化格式的结果。

变量
回归系数
标准误
t值
p值
X1
-0.423
0.055
-7.695
0.000
X2
0.087
0.082
1.061
0.289

从上表可以看出:

  • X1在0.01水平上显著(t=-7.695, p=0.000),回归系数为-0.423,表明X1对Y有显著的负向影响。
  • X2的回归系数不显著(p>0.05),说明X2对Y没有显著影响。

特别提示:
由于Robust回归对残差赋予权重,因此表格中的F检验、R方值和调整R方值已经失去了原有的意义,不能作为分析指标。

为了进一步验证结论的稳健性,我们使用OLS回归进行对比分析:

变量
回归系数
标准误
t值
p值
X1
-0.575
0.322
-1.783
0.076
X2
0.637
0.299
2.133
0.034

OLS回归的结果显示:

  • X1的回归系数为-0.575(t=-1.783,p=0.076>0.05),意味着X1对Y的影响不显著。
  • X2的回归系数为0.637(t=2.133,p=0.034<0.05),意味着X2对Y有显著的正向影响。

这一结论与散点图观察到的情况完全相反,显然是不可信的。如果将3个异常值筛选出去再进行OLS回归分析,结果会显示X1对Y有负向影响,X2对Y没有影响,这与Robust回归的结论一致,进一步验证了Robust回归在处理异常值问题上的优势。

4. 关键点总结

  • Robust回归主要用于解决数据中的异常值问题,SPSSAU默认使用Huber稳健法。
  • Robust回归可以用于结论的稳健性验证。先使用OLS回归得到初步结论,再使用Robust回归进行验证,如果两种方法得到的结论一致,则说明结论具有较高的可靠性。
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号