Robust回归分析:原理、应用场景及SPSSAU实战
创作时间:
作者:
@小白创作中心
Robust回归分析:原理、应用场景及SPSSAU实战
引用
1
来源
1.
https://spssau.com/helps/conometricstudy/robustreg.html
在数据分析和统计建模中,异常值的处理是一个常见且重要的问题。Robust回归作为一种能够有效应对异常值影响的回归方法,在实际应用中具有重要意义。本文通过一个具体案例,详细介绍了Robust回归的原理、应用场景以及在SPSSAU中的具体操作步骤。
1. 背景
现有200个研究数据,包含2个解释变量(X1、X2)和1个被解释变量(Y)。研究目的是分析这2个解释变量对被解释变量的影响情况。
2. 理论基础
Robust回归法(也称M估计)主要用于解决数据中的异常值(或极端值)问题。当数据中存在异常值时,传统的OLS回归可能会受到严重影响,导致结果失真。而Robust回归通过赋予不同观测值不同的权重,能够有效降低异常值的影响。
特别提示:
- 在进行Robust回归之前,建议先通过散点图、箱线图等方法检查数据中的异常值情况。
- Robust回归不仅适用于处理异常值,还可以用于验证结论的稳健性。具体来说,可以先使用OLS回归得到初步结论,再使用Robust回归进行验证,如果两种方法得到的结论基本一致,则说明结论具有较高的可靠性。
3. 案例分析
数据预处理
首先绘制X1、X2与Y的散点图,检查是否存在异常值。
从上图可以看出,数据中存在3个明显的异常值点。即使将这3个异常值点筛选出去,再次绘制散点图:
从上图可以明显看出:
- X1与Y之间存在明显的负向关系
- X2与Y之间没有明显的相关关系
在这种情况下,使用Robust回归进行分析更为合适。
操作步骤
本案例使用SPSSAU进行分析。具体步骤如下:
- 选择“进阶方法” -> “Robust回归”
- 将X1、X2设置为解释变量,Y设置为被解释变量
- 点击“开始分析”
结果解读
SPSSAU输出了两个表格结果:常规格式和简化格式。这里主要关注简化格式的结果。
变量 | 回归系数 | 标准误 | t值 | p值 |
|---|---|---|---|---|
X1 | -0.423 | 0.055 | -7.695 | 0.000 |
X2 | 0.087 | 0.082 | 1.061 | 0.289 |
从上表可以看出:
- X1在0.01水平上显著(t=-7.695, p=0.000),回归系数为-0.423,表明X1对Y有显著的负向影响。
- X2的回归系数不显著(p>0.05),说明X2对Y没有显著影响。
特别提示:
由于Robust回归对残差赋予权重,因此表格中的F检验、R方值和调整R方值已经失去了原有的意义,不能作为分析指标。
为了进一步验证结论的稳健性,我们使用OLS回归进行对比分析:
变量 | 回归系数 | 标准误 | t值 | p值 |
|---|---|---|---|---|
X1 | -0.575 | 0.322 | -1.783 | 0.076 |
X2 | 0.637 | 0.299 | 2.133 | 0.034 |
OLS回归的结果显示:
- X1的回归系数为-0.575(t=-1.783,p=0.076>0.05),意味着X1对Y的影响不显著。
- X2的回归系数为0.637(t=2.133,p=0.034<0.05),意味着X2对Y有显著的正向影响。
这一结论与散点图观察到的情况完全相反,显然是不可信的。如果将3个异常值筛选出去再进行OLS回归分析,结果会显示X1对Y有负向影响,X2对Y没有影响,这与Robust回归的结论一致,进一步验证了Robust回归在处理异常值问题上的优势。
4. 关键点总结
- Robust回归主要用于解决数据中的异常值问题,SPSSAU默认使用Huber稳健法。
- Robust回归可以用于结论的稳健性验证。先使用OLS回归得到初步结论,再使用Robust回归进行验证,如果两种方法得到的结论一致,则说明结论具有较高的可靠性。
热门推荐
小腿前面骨头疼怎么办
影子跟读法:提升英语听说能力的有效技巧
2025年申请公派访问学者,最易忽略的CSC评审标准细节
智能车辆工程专业全面解析:学什么、就业情况如何
条顿堡森林战役:罗马大规模扩张终止、塑造此后数百年帝国格局
口腔癌的治疗方法全解析
重庆电价政策深度解析:构成、分时电价与居民用电政策详解
适合1~3年级玩的游戏有哪些介绍2024 小朋友可以玩的游戏汇总
蓝绿双城的创新实践:用新模式“共建”好房子
又一省高考人数创新高,高校录取呈现新趋势
眼睛被油溅到看东西模糊怎么办
夏季进行高强度训练后往往会大量出汗,一定要注意这些事项
绝区零音效设计贴合度高吗?
“急急如律令” 翻译成“swift and uplift”,你怎么看?
一次性伤残补助金如何计算工资基数
个体户如何选择合适的报税方式
饮酒后尿频是因为新陈代谢加速吗?
中国迪士尼乐园全攻略:上海、香港两座乐园特色详解
如何测试聊天视频软件
二战时日本人为何要在人中处留一撮胡子?现在日本人怎么又不留了
珠海香炉湾公共沙滩存乱象:“玩沙看海”最佳位置被私人“圈地”经营
日本再现强震,岛国未来面临沉没危机?
台州国清寺旅游攻略:千年古刹的文化之旅
什么是固态电池?其在 2024 年的影响是什么?
大龄农民工也有优势,这些行业上大龄农民工就业成为“香饽饽”
爱吃面嗦粉,别怕升血糖!这7种面粉升糖超慢
当归|"补血女王",香气四溢的养生能手 🌿
逾期申报罚款的合法减免策略与处理方法
继承与发展:网络文学如何表现海派文化
2025山西高考各批次录取分数线预估 今年分数线会降吗