为什么一定要用残差图检查你的回归分析?
创作时间:
作者:
@小白创作中心
为什么一定要用残差图检查你的回归分析?
引用
1
来源
1.
https://www.pianshen.com/article/3676210356/
在进行回归分析时,检查残差图是验证模型有效性的关键步骤。本文将深入探讨残差图的概念、重要性以及如何通过残差图来判断模型的有效性。
残差图的基本概念
残差图是指以残差为纵坐标,以任何其他指定的量为横坐标的散点图。在使用普通最小二乘法(OLS)进行回归分析后,通过残差图可以检查模型的假设是否成立,从而验证模型的有效性。
回归模型的组成部分
一个有效的回归模型可以分为两个基本组成部分:
确定性部分(Deterministic Portion):由关于预测自变量的函数组成,包含了回归模型中所有可解释、可预测的信息。
随机误差(Stochastic Error):不仅包含随机性,还包含不可预测性。这两点非常重要,意味着回归模型下的预测值和观测值之间的差异必须是随机且不可预测的。
残差图的作用
残差图可以帮助我们估计观察或预测到的误差(残差)与随机误差是否一致。通过检查残差图,可以判断模型是否遗漏了可预测信息。理想情况下,残差应该呈现为以0为中心的白噪声分布。
正确的残差图示例
下面是一个使用Seaborn绘制的正确残差图示例:
%matplotlib inline
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
np.random.seed(sum(map(ord, "anscombe")))
import seaborn as sns
anscombe = sns.load_dataset("anscombe")
sns.residplot(x="x", y="y", data=anscombe.query("dataset == 'I'"), scatter_kws={"s": 80})
错误的残差图示例
下面是一个残差图存在问题的示例:
sns.residplot(x="x", y="y", data=anscombe.query("dataset == 'II'"), scatter_kws={"s": 80})
在上图中,可以根据拟合值预测残差的非零值。例如,拟合值为9的预期残差为正值,而5和13的拟合值具有负的预期残差。这表明模型的确定部分没有捕获一些可解释/可预测信息。
残差图的检查要点
- 残差不应该包含任何可预测的信息。
- 残差不应该与另外的变量有所相关。
- 相邻残差不应该相互关联。
最终,理想的残差图不仅要体现出随机性,还要体现不可预测性。
热门推荐
汽车怎样有效提升马力?提升马力后会有哪些变化?
如何在融媒体智慧生态中平衡用户体验与隐私保护的矛盾?
冲刺2030年建成通车!沿江高铁湖北段这样建
再出发的励志诗句
进击的巨人角色介绍:九大巨人能力解析和历代掌控者
2025高考报名时间官宣!事关录取,这些新变化一定要关注
心学问心理教育,多彩的青春:青春期孩子的兴趣培养与特长发展
SPSS数据分析 | 30+常用分析方法数据格式汇总
姜黄的功效与食用指南:从传统香料到现代保健食材
美的电磁炉不加热滴滴响?四种常见原因及维修方法详解
如何让团队产出做得更高
列作文提纲的方法
补阳气、益气血、强免疫,冬季这肉再贵也要吃→
跨越物种的界限,深度解析人与动物的十大区别,共创多彩生活
3招轻松提升幼儿穿衣技巧,让宝宝成为"穿衣小达人"
商业贷款买房等额本息计算公式及优缺点分析
上班感到无趣怎么办:探索工作乐趣的新路径
新手必看:花纹图案怎么画?各种风格花纹图案绘制技巧详解!
属虎的水瓶座特点分析
掌握这些技巧,Windows电脑上同时登录两个微信轻而易举!
李志刚委员:深化教育综合改革,文理融合发展是关键
机电技术应用专业课程设置详解
夏季空调使用省电攻略:设定温度与习惯的重要性分析
丁香树:从种植到管理的全面指南
二极管极性怎么判别
工业厂房结构设计策略
启动公司估值:评估年轻企业价值的方法
友升汉都莆田旅游攻略必去5个景点
论文写作一般多少字起步?
取名字大全免费查询 100个出自诗经的好名字