用ROC曲线检验模型?无需代码,用SPSS也能绘制出好看的ROC曲线哦!
创作时间:
作者:
@小白创作中心
用ROC曲线检验模型?无需代码,用SPSS也能绘制出好看的ROC曲线哦!
引用
CSDN
1.
https://blog.csdn.net/m0_69097016/article/details/141362128
ROC曲线(受试者工作特征曲线)是评估模型预测能力的常用工具,其AUC(曲线下面积)指标越大,表明模型的预测能力越好。本文将通过一个关于焦虑症预测的示例,详细介绍如何使用SPSS软件绘制ROC曲线,帮助读者快速掌握这一实用技能。
ROC简介
ROC曲线的全称是Receiver Operating Characteristic Curve(受试者工作特征)。它是用来检验模型预测能力的常用方式。ROC的常用指标是AUC(Area Under the Curve,曲线下面积)。AUC的大小反映了模型预测能力的强弱:
- AUC=1:模型能够完美区分正负样本
- 0.85≤AUC≤0.95:预测效果优秀
- 0.7≤AUC≤0.85:预测效果良好
- 0.5≤AUC≤0.7:有一定的预测能力,但效果较低
- AUC=0.5:预测能力与随机猜测无异
- AUC<0.5:预测能力比随机猜测还差
在横断面研究中,我们常常需要分析自变量对某一个因变量的关系,这时就可以用上ROC曲线。
示例说明
数据
- 自变量:人口学特征如性别、年龄、婚姻、学历、体重指数等分类变量
- 因变量:是否患有焦虑症(二分类变量)
分析目的
- 分析单个自变量与因变量的关系
- 评估多个自变量构建的模型对焦虑症的预测能力
分析思路
可以先通过单因素和多因素的logistic回归判断哪些自变量对因变量有影响(即P<0.05),然后将有统计学意义的变量构建出一个模型来预测焦虑症。最后通过绘制ROC曲线来判断模型的预测能力。
数据分析
此处省略利用SPSS进行logistic分析的过程。假设得出的结果是多因素logistic回归结果显示性别、年龄、婚姻、学历、体重指数都与焦虑症正向相关。
SPSS建立模型
- 打开SPSS,选择“分析”→“回归”→“二元logistic”
- 将变量放入相应的变量框
- 在“保存”中选中“概率”,点击继续
- 变量列表会多出一列,就是预测概率,可以理解为预测值,这个预测值将会用来与实际值比较,绘制ROC曲线
SPSS绘制ROC曲线
- 打开SPSS,选择“分析”→“ROC曲线”(不同SPSS版本这个功能位置不同,有的在“分类”模块里面)
- 将“预测概率”放入检验变量,将“焦虑症”(实际值)放入状态变量
- “状态变量值”一般指的是阳性的变量值,这里的数据有焦虑症用1表示,无焦虑症用0表示。所以这里的状态变量值为1。“显示”可以勾选前三个
- 在SPSS的输出中,查看曲线和曲线下面积值
区域下面积就是AUC值,是要得出的数据
这个AUC值还可以,模型预测能力良好
双击图像可以唤出图像编辑器对横纵坐标、颜色等进行编辑
根据需要编辑图表大小,填充与边框,变量
单击一次可以变成可输入的文本框,转成英文标题
双击轴标题可以改变字号,颜色等
保存编辑好的图
在“编辑”下面点击“复制图表”,可以把图表粘贴到word中保存下来
当需要在一张图中绘制多条ROC曲线时,就可以用R语言绘制,下期再更新。
热门推荐
中国空间站的“述职报告”
中元节烧纸有讲究,怎么烧,什么地点烧,在什么时间烧都有讲究?
马鹿日语怎么说?探究“马鹿”的用法和背后的文化含义
北京中关村朝阳园北区加快建设 科技创新高地快速崛起
老年人胳膊疼的病因是什么
眼化学伤的急救措施有哪些
嫩江路隧道动迁方案
如何增加货币供应?这些增加方法对经济有何影响?
许莫氏结节是什么意思
百衲衣为何也能“伏魔”
新疆发展改革委党组书记王岿然:厚实新疆能源底气
舌头上厚厚一层白色物质到底是啥?说明身体已经不健康了吗?你知道原因吗?
HR三支柱模型是什么?
《西游记》中的幽默与讽刺:一场寓教于乐的取经之旅
乳香:从基础到临床的全面解析
双腿无力走路不稳警惕四种病因
莫桑钻和锆石的区别 这下终于搞清楚了!
转机无需原地等待!天府国际机场过境游东区攻略
实现省金化的连接器用部分镀硬金
西洋乐器有哪些 西洋乐队的基本组成及乐器
长江经济带如何优化生产力布局?区域经济专家这样建议
汽车的分类:乘用车与商用车详解
蓝莓的种植与适应环境(了解蓝莓的适宜环境与种植技巧,助你打造蓝莓园)
古代美人王昭君
为什么粥的含糖量更高?
老年人正确补钙很重要 千万别陷入这5大补钙误区
吃西红柿对身体有什么好处
弗林德斯大学世界排名及留学指南
骑手保险守护每一份餐食的温暖,为外卖骑手撑起安全天空
G72:径向(端面)粗车循环指令详解