为什么一定要用残差图检查你的回归分析?
创作时间:
作者:
@小白创作中心
为什么一定要用残差图检查你的回归分析?
引用
1
来源
1.
https://www.pianshen.com/article/3676210356/
在进行回归分析时,检查残差图是验证模型有效性的关键步骤。本文将深入探讨残差图的概念、重要性以及如何通过残差图来判断模型的有效性。
残差图的基本概念
残差图是指以残差为纵坐标,以任何其他指定的量为横坐标的散点图。在使用普通最小二乘法(OLS)进行回归分析后,通过残差图可以检查模型的假设是否成立,从而验证模型的有效性。
回归模型的组成部分
一个有效的回归模型可以分为两个基本组成部分:
确定性部分(Deterministic Portion):由关于预测自变量的函数组成,包含了回归模型中所有可解释、可预测的信息。
随机误差(Stochastic Error):不仅包含随机性,还包含不可预测性。这两点非常重要,意味着回归模型下的预测值和观测值之间的差异必须是随机且不可预测的。
残差图的作用
残差图可以帮助我们估计观察或预测到的误差(残差)与随机误差是否一致。通过检查残差图,可以判断模型是否遗漏了可预测信息。理想情况下,残差应该呈现为以0为中心的白噪声分布。
正确的残差图示例
下面是一个使用Seaborn绘制的正确残差图示例:
%matplotlib inline
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
np.random.seed(sum(map(ord, "anscombe")))
import seaborn as sns
anscombe = sns.load_dataset("anscombe")
sns.residplot(x="x", y="y", data=anscombe.query("dataset == 'I'"), scatter_kws={"s": 80})
错误的残差图示例
下面是一个残差图存在问题的示例:
sns.residplot(x="x", y="y", data=anscombe.query("dataset == 'II'"), scatter_kws={"s": 80})
在上图中,可以根据拟合值预测残差的非零值。例如,拟合值为9的预期残差为正值,而5和13的拟合值具有负的预期残差。这表明模型的确定部分没有捕获一些可解释/可预测信息。
残差图的检查要点
- 残差不应该包含任何可预测的信息。
- 残差不应该与另外的变量有所相关。
- 相邻残差不应该相互关联。
最终,理想的残差图不仅要体现出随机性,还要体现不可预测性。
热门推荐
卡了鱼刺,别再喝醋吞米饭了!掌握两招,安全解除喉咙危机
老公孕吐是怎么回事?原因分析与应对方法
苹果人脸识别突然用不了怎么办?详细讲解:修复iPhone面容ID失灵的方法
楼道照明系统:如何营造温馨舒适的回家氛围
【美学插花】中国各朝代插花特点 || 一目了然
梨树在什么时候打石硫合剂,在春季打为佳
十位科技工作者谈创新
更年期综合征,导致的植物神经紊乱该如何调理?
探寻三孔文化魅力,传承中华千年智慧
汗疱疹如何护理
26岁女大学生爱上30岁快递员,遭到父亲强烈反对:听我的没错
搬迁入住5年后,这个全国最大的跨县易地搬迁安置区怎么样了?
怎样才能查出白血病
关于颗粒标准物质,你想知道的都在这里
外资医院在中国:接入医保、拥抱商保,但难堪“大任”?
如何进行团队优化组合
中年男人的数码追求:从充电头到NAS,你不了解的生活神器
笔记本电脑的电池如何维护
4K和8K的区别,你真的了解吗?看完涨知识了!
《补续高僧传》:《宋高僧传》之后又一重要佛教史传
孔乙己的心头好:一颗茴香豆里的中医智慧
遗传因素如何影响宝宝的皮肤状况
SpringBoot3连接MongoDB多数据源实践
职能岗位和管理岗位有何区别
软件如何测试喷油器好坏
Excel中输入PI值的多种方法及应用场景
我的汤水怎么喝?——医疗膳食流质篇
软件销售管理:八大关键步骤助力提升销售业绩
相似三角形的判定定理是什么 有哪些性质
倾听老故事 讲出新动能