SPSS回归分析实战:从一元到多元回归
创作时间:
作者:
@小白创作中心
SPSS回归分析实战:从一元到多元回归
引用
CSDN
1.
https://blog.csdn.net/weixin_51423847/article/details/138207346
SPSS(Statistical Package for the Social Sciences)是社会科学领域常用的统计分析软件,其回归分析功能可以帮助研究人员建立变量之间的关系模型。本文将详细介绍如何使用SPSS进行线性回归和多元回归分析,包括模型建立、显著性检验和残差分析等关键步骤。
SPSS回归分析基础
在SPSS中,线性回归分析功能位于【分析】-【回归】-【线性】菜单下。对于一元线性回归,可以通过【图形】-【旧对话框】-【散点图】绘制因变量y和自变量x的散点图。
通过样本数据建立回归方程后,需要进行以下几种统计检验:
- 回归方程的拟合优度检验(r检验)
- 回归方程的显著性检验(F检验)
- 回归系数的显著性检验(t检验)
此外,还需要进行残差分析,以确保残差满足“正态、独立、等方差(无异常值)”的前提。在SPSS中,可以通过【分析】-【回归】-【线性】-【绘图】框绘制残差的散点图、频率直方图以及正态概率图(P-P图)。
多元回归分析中的变量筛选
多元回归分析中,变量的筛选策略主要包括向前筛选、向后筛选和逐步筛选三种。逐步筛选是目前使用较多的一种方法。在SPSS中,可以在【分析】-【回归】-【线性】-【方法】框中选择一种策略。
残差的独立性检验:DW检验
DW检验(Durbin-Watson)用于检验残差的独立性:
- DW=4:序列完全负自相关
- 2<DW<4:序列存在负自相关
- DW=2:序列无自相关
- 0<DW<2:序列存在正自相关
- DW=0:序列完全正自相关
变量的多重共线性测度
多重共线性测度方法包括:
- 容忍度:取值∈(0,1),越接近0表示多重共线性越强;越接近1表示多重共线性越弱。
- 方差膨胀因子(VIF):VIF≥1。多重共线性越弱,VIF越接近1;多重共线性越强,VIF越大。通常,如果VIF≥10,说明解释变量间有严重的多重共线性。
- 特征根和方差比:如果最大特征根的值远远大于其他特征根的值(0.7以上),说明变量间有很强的多重共线性。
- 条件指数:条件指数∈[0,10),多重共线性较弱;条件指数∈[10,100),多重共线性较强;条件指数≥100时,存在严重多重共线性。
实战回归分析
数据集简介
使用数据集“高校科研研究.sav”,包含31个样本数据,8个变量:
- x1:省市名称
- x2:投入人年数
- x3:投入高级职称的人数
- x4:投入科研事业费(百元)
- x5:课题总数
- x6:专著数
- x7:论文数
- x8:获奖数
相关性检验
通过双变量相关性检验(Analyze→Correlate→Bivariate Correlations),发现投入高级职称的人年数与论文数的Pearson相关系数最大,因此选择投入高级职称的人年数作为自变量,论文数为因变量。
一元线性回归建模及显著性检验
- 散点图
- 回归分析结果
- r检验:样本相关系数r=0.953,样本决定系数r²=0.909,回归拟合优度较好。
- F检验:F值=289.715,p值=0.000(p值 < α=0.05),可以建立回归方程。
- t检验:回归系数p值=0.000(p值 < α=0.05),线性回归显著。
残差分析
- 标准化残差的频率直方图
- 标准化残差的P-P图
- 标准化残差的散点图
结论:
- 标准化残差大部分围绕在对角线附近,近似服从正态分布。
- 标准化残差落入(-3 — 3)内,无异常值。
- 标准化残差随着因变量的增大表现出明显趋势,满足独立前提。
多元线性回归分析
“输入法”建模
- 输入/除去的变量表
最终进入模型中的变量:获奖数、投入科研事业费、论文数、专著数、投入人年数、投入高级职称的人年数。
- 模型摘要表
- r检验:样本相关系数r=0.969,样本决定系数r²=0.939,调整后r²=0.924,DW值=1.838,存在正自相关性。
- F检验:F值=61.532,p值=0.000(p值 < α=0.05),可以建立回归方程。
- 系数表
- 投入人年数、投入高级职称的人年数、专著数、论文数这四个指标的容忍度均<0.1,方差膨胀因子VIF均>10,说明解释变量间有严重的多重共线性。
- 其中投入人年数的P值为0.003<0.05,说明投入人年数对课题总数的影响比较显著。
多重共线性诊断
- 在特征根中,最大特征根的值远远大于其他特征根的值(0.7以上),说明变量间有很强的多重共线性。
- 维度为7的特征根可以同时刻画投入人年数、投入高级职称的人年数、投入科研事业费、专著数、论文数、获奖数六个解释变量的方差的较大部分比例,说明这些解释变量间有较强的多重共线性。
- 从条件指数来看,维度为5、6、7三个的条件指数均在10—100之间,其中维度为7的条件指数最大,为58.796,多重共线性最强。
逐步法建模
- 输入/除去的变量表
最终进入模型中的变量:投入人年数。
- 显著性检验
- r检验:样本相关系数r=0.959,样本决定系数r²=0.919,调整后r²=0.917,DW值=1.747,存在正自相关性。
- F检验:F值=331.018,p值=0.000(p值 < α=0.05),可以建立回归方程。
- t检验:回归系数p值<α=0.05,线性回归显著。
残差分析
- 标准化残差的频率直方图
- 标准化残差的P-P图
- 标准化残差的散点图
结论:
- 标准化残差近似服从正态分布。
- 标准化残差落入(-2 — 3)内,有异常值。
- 标准化残差随着因变量的增大表现出明显趋势,满足独立前提。
热门推荐
春节打卡贵州:荔波小七孔&西江千户苗寨
春节去贵州,千户苗寨的非遗文化你了解多少?
秋季家庭养护金桂全攻略
金华山&婺州古城:周末打卡胜地
来金华看演唱会?这些美景美食别错过!
婺城山水打卡地:琅琊镇上盛村
宝宝咳嗽,何时该就诊
周末DIY:黄金藕片大挑战!
创意莲藕料理大集合,让你秒变厨艺达人!
秋天必吃的糖醋藕片:酸甜脆嫩,简单易学的家常菜
海南必打卡:天涯书局+亚龙湾+免税购物
元旦海南免税购物攻略:买买买不踩雷!
香港长者生活津贴最新申请攻略!
小品和相声的区别(小品和相声的区别在哪里)
桂林至恩施动车路线及购票攻略:全面指南与实用信息汇总
义乌桥头遗址揭秘9000年前太阳纹彩陶之谜
义乌:从“鸡毛换糖”到“世界超市”的传奇之路
桂花:古诗词里的浪漫与高洁
黔东南苗族文化深度游攻略:从西江千户苗寨到丹寨万达小镇
社区居民矛盾调解:社工思维的应用与实践
希伯来书第五章:基督大祭司职分对现代人信仰成长的启示
从希伯来书看大祭司的道德担当
白龙潭派出所“一二三四”工作法 打造新时代“枫桥式”公安派出所
《语文课本中的古诗词》:激活古典智慧,补益现代心灵
温州乐清旅游攻略:必游景点推荐 + 藤桥牌温州风味大礼包
海子忌日:《面朝大海,春暖花开》的心理疗愈
海子的幸福密码:从《面朝大海,春暖花开》看诗人内心
海子《面朝大海,春暖花开》背后的心酸故事
老年司机驾驶安全:各国如何破解这道难题?
97岁婆婆的桂花日记:记录生活的点点滴滴