资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

SPSS回归分析实战：从一元到多元回归

创作时间:

作者:

@小白创作中心

SPSS回归分析实战：从一元到多元回归

引用

CSDN

https://blog.csdn.net/weixin_51423847/article/details/138207346

SPSS（Statistical Package for the Social Sciences）是社会科学领域常用的统计分析软件，其回归分析功能可以帮助研究人员建立变量之间的关系模型。本文将详细介绍如何使用SPSS进行线性回归和多元回归分析，包括模型建立、显著性检验和残差分析等关键步骤。

SPSS回归分析基础

在SPSS中，线性回归分析功能位于【分析】-【回归】-【线性】菜单下。对于一元线性回归，可以通过【图形】-【旧对话框】-【散点图】绘制因变量y和自变量x的散点图。

通过样本数据建立回归方程后，需要进行以下几种统计检验：

回归方程的拟合优度检验（r检验）
回归方程的显著性检验（F检验）
回归系数的显著性检验（t检验）

此外，还需要进行残差分析，以确保残差满足“正态、独立、等方差（无异常值）”的前提。在SPSS中，可以通过【分析】-【回归】-【线性】-【绘图】框绘制残差的散点图、频率直方图以及正态概率图（P-P图）。

多元回归分析中的变量筛选

多元回归分析中，变量的筛选策略主要包括向前筛选、向后筛选和逐步筛选三种。逐步筛选是目前使用较多的一种方法。在SPSS中，可以在【分析】-【回归】-【线性】-【方法】框中选择一种策略。

残差的独立性检验：DW检验

DW检验（Durbin-Watson）用于检验残差的独立性：

DW=4：序列完全负自相关
2<DW<4：序列存在负自相关
DW=2：序列无自相关
0<DW<2：序列存在正自相关
DW=0：序列完全正自相关

变量的多重共线性测度

多重共线性测度方法包括：

容忍度：取值∈(0,1)，越接近0表示多重共线性越强；越接近1表示多重共线性越弱。
方差膨胀因子（VIF）：VIF≥1。多重共线性越弱，VIF越接近1；多重共线性越强，VIF越大。通常，如果VIF≥10，说明解释变量间有严重的多重共线性。
特征根和方差比：如果最大特征根的值远远大于其他特征根的值(0.7以上)，说明变量间有很强的多重共线性。
条件指数：条件指数∈[0,10)，多重共线性较弱；条件指数∈[10,100)，多重共线性较强；条件指数≥100时，存在严重多重共线性。

实战回归分析

数据集简介

使用数据集“高校科研研究.sav”，包含31个样本数据，8个变量：

x1：省市名称
x2：投入人年数
x3：投入高级职称的人数
x4：投入科研事业费（百元）
x5：课题总数
x6：专著数
x7：论文数
x8：获奖数

一元线性回归建模及显著性检验

散点图

回归分析结果

r检验：样本相关系数r=0.953，样本决定系数r²=0.909，回归拟合优度较好。
F检验：F值=289.715，p值=0.000（p值 < α=0.05），可以建立回归方程。
t检验：回归系数p值=0.000（p值 < α=0.05），线性回归显著。

残差分析

标准化残差的频率直方图

标准化残差的P-P图

标准化残差的散点图

结论：

标准化残差大部分围绕在对角线附近，近似服从正态分布。
标准化残差落入（-3 — 3）内，无异常值。
标准化残差随着因变量的增大表现出明显趋势，满足独立前提。

多元线性回归分析

“输入法”建模

输入/除去的变量表

最终进入模型中的变量：获奖数、投入科研事业费、论文数、专著数、投入人年数、投入高级职称的人年数。

模型摘要表

r检验：样本相关系数r=0.969，样本决定系数r²=0.939，调整后r²=0.924，DW值=1.838，存在正自相关性。
F检验：F值=61.532，p值=0.000（p值 < α=0.05），可以建立回归方程。

系数表

投入人年数、投入高级职称的人年数、专著数、论文数这四个指标的容忍度均＜0.1，方差膨胀因子VIF均＞10，说明解释变量间有严重的多重共线性。
其中投入人年数的P值为0.003＜0.05，说明投入人年数对课题总数的影响比较显著。

多重共线性诊断

在特征根中，最大特征根的值远远大于其他特征根的值（0.7以上），说明变量间有很强的多重共线性。
维度为7的特征根可以同时刻画投入人年数、投入高级职称的人年数、投入科研事业费、专著数、论文数、获奖数六个解释变量的方差的较大部分比例，说明这些解释变量间有较强的多重共线性。
从条件指数来看，维度为5、6、7三个的条件指数均在10—100之间，其中维度为7的条件指数最大，为58.796，多重共线性最强。