SPSS统计和图表
SPSS统计和图表
本文是一篇SPSS统计软件使用教程,详细介绍了各种统计分析和图表制作的步骤,包括频率分析、描述性统计、直方图、交叉表、均值计算、条形图、箱线图、相关性分析、散点图、T检验、卡方检验、方差分析和回归分析等。文章通过菜单操作和语句输入两种方式,结合具体示例和输出结果,帮助读者掌握SPSS的基本使用方法。
本文档适用于参加使用 SPSS 统计课程的学生。
如果您还不熟悉 SPSS 窗口(数据编辑器、输出查看器和语法编辑器),请阅读SPSS基础知识。
以下示例基于C:\Program Files\IBM\SPSS\Statistics\23\Samples\English\Employee data.sav
频率:计数和百分比
计数和百分比是极好的统计数据,因为它们易于解释且易于掌握。频率也是大多数概率解释的基础。它们是理解您可能处理的任何数据的绝佳起点。
菜单和对话框:
分析 - 描述统计 - 频率
在左侧的选择列表中选择一个或多个变量,点击中间的箭头将其移动到右侧的分析列表中,然后点击确定。
句法:
frequencies variables = gender minority.
输出:
请注意,这是少数几个在默认输出表中出现缺失值(无论是系统缺失“。”还是用户指定缺失)的表之一(但是,在此特定示例中并非如此)。
描述:平均值和标准差
变量的平均值和标准差是统计学中的基本量,有许多 SPSS 命令可以将它们报告给您。最直接使用的命令是Descriptives。
另外两个有用的命令是“频率”(在对话框中,单击“统计”按钮),当您想查看计数以及平均值和标准差(可能用于李克特量表)时,以及“探索”,它为您提供额外的统计数据,例如中位数和四分位距以及各种图表。
菜单和对话框:
分析 - 描述统计 - 描述性
在左侧的选择列表中选择一个或多个变量,点击中间的箭头将其移动到右侧的分析列表中,然后点击确定。
句法:
descriptives variables=educ salary.
输出:
直方图
SPSS有三组不同的图形制作命令。最容易学习和使用的是最古老的“传统”图形制作命令。它们为您提供具有默认视觉样式(使用的颜色、线条粗细、字体大小等)的图形,您可以手动自定义。
直方图令人烦恼,因为它们可能提供信息,也可能具有欺骗性,具体取决于选择条形图的方式。直方图很有用,也很受欢迎,因为它们在概念上非常简单,易于绘制和解释,如果绘制得当,它们可以很好地直观地表示变量值的分布。
菜单和对话框:
图表 - 传统对话框 - 直方图
基本直方图命令一次只能处理一个变量,因此请从左侧的选择列表中选择一个变量并将其移至变量框中。(如果您希望变量具有正态分布,则显示正态曲线是一个有用的选项。)
句法:
graph /histogram(normal) = prevexp.
输出:
在这个例子中,数据的分布与正态分布完全不同!
要编辑颜色、标题、比例等,请双击输出查看器中的图表,然后双击要更改的图表元素。
交叉表:按组计数
基本交叉表命令默认只提供计数。通常,查看行百分比或列百分比也很有用,必须将其指定为选项。
菜单和对话框:
分析 - 描述统计 - 交叉表
选择一个变量作为行,另一个变量作为列。通常,您可能会将一个独立变量放在行中,将一个因变量放在列中,尽管从数学上来说这并不重要。要获取输出中的百分比,请单击“单元格”按钮并指定要查看的百分比类型。
句法:
crosstabs
/tables=jobcat by minority
/cells=count row.
在此命令语法(以及下一个命令语法)中,您会看到用于指定将数据分成几组的分类变量的MEANS关键字。BY
输出:
按组计算的均值
菜单和对话框:
分析 - 比较平均值 - 平均值
选择您想要表示的变量,然后将其移动到从属列表。选择将数据划分为子集的变量(“分组”或“按”变量),然后将其移动到独立列表。您可能在任一/两个列表中都有多个变量,SPSS 会成对处理它们并生成单独的表格。
句法:
means tables=salary by minority.
输出:
条形图
与直方图类似,x 轴被视为分类变量,y 轴代表各种汇总统计数据之一:计数(又名直方图!)、平均值、总和等。
菜单和对话框:
图表 - 传统对话框 - 条形图
这将带你进入一个初始对话框,你可以在其中选择制作条形图的几种基本模式,
然后进入主对话框。要按组绘制平均值,请选择其他统计量作为条形所代表的内容,在变量框中选择要计算平均值的变量(平均值将是默认统计量),并在分类轴框中选择组。
句法:
graph /bar=mean(salary) by jobcat.
输出:
箱线图
菜单和对话框:
图表 - 传统对话框 - 箱线图
与条形图一样,首先从初始对话框中选择一个特定的箱线图模式,
然后选择分析变量(您想要查看中位数和四分位距的变量,y 轴)和分类变量(x 轴)。
句法:
examine variables=salary by jobcat
/plot=boxplot
/statistics=none
/nototal.
输出:
相关性
菜单和对话框:
分析 - 相关 - 双变量
SPSS计算列表中所有变量对的双变量相关性 (Pearson's r)。
句法:
correlations /variables=educ salary prevexp.
输出:
散点图
简单散点图和散点图矩阵都很容易生成。
菜单和对话框:
图表 - 传统对话框 - 散点图/点图
带您浏览两个对话框。首先,选择要使用的散点图模式,
然后使用想要绘制的点的 x 和 y 坐标指定变量。
句法:
graph /scatterplot=salary with salbegin.
graph /scatterplot(matrix)=salary salbegin prevexp.
输出:
T检验
T检验有多种使用方式,SPSS 可让您通过“比较均值”菜单快速访问其中三种方式(单变量、分组和配对)。它们都使用相同的t-test命令。
菜单和对话框:
分析 - 比较均值 - 独立样本 T 检验
在设置独立样本(分组)t 检验时,您不仅要指定要测试的变量和分组变量,还必须指定哪些数据值代表要比较的两个组(因为通常分组变量可能有任意数量的类别,而不仅仅是两个)。使用“定义组”按钮,然后输入定义要比较的组的数据值(而不是值标签)。
如果您为任何组输入了无效的数据值,SPSS 将不会发现您的错误,直到您实际运行该命令。您需要在进入此对话框之前知道您的数据是什么样子,因为 SPSS 不会让您在对话框打开时浏览数据集。
句法:
t-test groups=gender('f' 'm')
/variables=educ.
输出:
卡方检验
和 t 检验一样,卡方检验适用于各种情况,最常见的情况是评估列联表(交叉表)中两个变量的独立性。因此,此卡方检验被指定为交叉表命令的一个选项。
菜单和对话框:
分析 - 描述统计 - 交叉表
在主对话框中,单击“统计”按钮,然后选择“卡方”并继续返回主对话框。指定变量并运行。
句法:
crosstabs
/tables=jobcat by minority
/statistics=chisq
/cells=count row.
输出:
方差分析表和检验
方差分析表是统计学中的核心概念,它们由 SPSS 中的几种不同命令生成,包括ONEWAY、GLM和UNIANOVA。UNIANOVA命令可能是最容易使用的,因为它允许您使用字符串(字符)变量作为因子。
(如果您正在进行单向方差分析,并且您的因素以数字形式编码,那么ONEWAY使用起来就更容易了。)
菜单和对话框:
分析 - 一般线性模型 - 单变量
对于简单的方差分析,您的因素被视为固定因素。如果您有多个因素,并且您不想在模型中包含交互作用,则需要使用模型按钮进行指定。
句法:
unianova salary by jobcat.
输出:
回归
菜单和对话框:
分析 - 回归 - 线性
句法:
regression
/dependent salary
/method=enter salbegin.
输出: