SPSS数据分析教程1-spss基础与综合教程
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1第 章 数据分析概述与软件入门
1.1 SPSS软件概述
1.1.1 SPSS简介
SPSS(Statistics Package for Social Science )for Windows是一种运行在 Windows系统下的社会科学统计软件软件包。
SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等,具体 内容包括描述统计、列联分析,总体的均值比较、相关分析、回归模型 分析、聚类分析、主成份分析、时间序列分析、非参数检验等多个大类, 每个类中还有多个专项统计方法。
三、安装程序显示[Software License Agreement]对话框时,选择[Yes]接受 显示的协议条款。
编辑课件
6
1.2 spss操作入门
1.2.1 spss软件的启动与退出
单击Windows 的[开始]按钮,在[程序]菜单项[SPSS for Windows]中找到[SPSS 10.0 for Windows]并单击。
标尺栏 当前数据栏
标题栏 菜单栏 工具栏 数据输入区 数据编辑区
Data View表可以直 接输入观测数据值 或存放数据,表的 左端列边框显示观 测个体的序号,最 上端行边框显示变 量名。
窗口编标签辑课件
状态栏
显示区滚动条
33
Variable View表用来定义和修改变量的名称、类型及其他属性,如图所示。
在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型 变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥 原则。
编辑课件
28
(2)定序尺度(Ordinal Measurement):定序尺度是对事物之间的 等级或顺序差别的一种测度,可比较优劣或排序。
特点:由于定序变量只能侧度类别之间的顺序,无法测出类别之间的 准确差值,即测量数值不代表绝对的数量大小,所以其测量结果只能 排序,不能进行运算。
一、菜单对话方式 首先打开SPSS软件,然后选择菜单File
Open file。
然后,利用菜单Analyze
Descriptive Statistics
Frequencies,
编辑课件
14
Employm ent Ca te gory
Cu m u lative
Fre qu e ncPyerceVnatlid PercenPterce n t
只需要选择菜单Run All,运行该程序也一样 会出现相同的分析结果。
编辑课件
16
三、Include命令方式
当编写Syntax程序时,如果发现将要编写的程序语句正好是另一个 Syntax文件的内容;或者发现所需要的程序语句其实是几个Syntax文 件的总和是,除了可以通过“Copy”、“Paste”的方法利用资源,生产 一个新的Syntax文件外,还可以利用Include命令。
如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的 属性,直接输入数据,系统将默认变量Var00001,Var00002等。
编辑课件
34
在Variable View表中,每一行描述一个变量,依次是: Name:变量名。变量名必须以字母、汉字及@开头,总长度不超过8个 字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最后一个 字符不能是句号。 Type:变量类型。变量类型有8 种,最常用的是Numeric数值型变量。 其它常用的类型有:String字符型,Date日期型,Comma逗号型(隔3位数 加一个逗号)等。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在Date View 中所显示的列宽(默认列宽为8)。 Align:数据对齐格式(默认为右对齐)。 Measure:数据的测度方式。系统给出名义尺度、定序尺度和等间距尺 度三种(默认为等间距尺度)。
草稿结果是结果的一种简化文本格式。实际上就是WORD所兼容 的rtf超文本格式,因此可以在没有安装SPSS的PC机上使用文字 编辑软件打开。
编辑课件
11
(4)语法编辑窗口(SPSS Syntax Editor)
编辑课件
12
(5)脚本窗口(SPSS Script Editor)
编辑课件
13
1.2.3 SPSS的四种运行方式
(1)单击Syntax框下的“Add”按钮,到C盘根目录下打开 “syntaxsample”。 (2)单击Syntax框下的“Edit”按钮,对程序进行编辑。
(3)单击右下角的“uesr prompts”按钮,添加对程序的 交互分析界面。
(4)单击“Browse”按钮制定 结果保存路径,单击“export options”按钮还可以制定结果保 存格式。
4
五、SPSS的运行方式
SPSS提供了3种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行 方式。程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自 己的SPSS命令程序,通过语句直接运行。 SPSS中使用的对话框主要有两类,一类是文件操作对话框,文件操作对话窗 口操作与Windows应用软件操作风格一致。另一类是统计分析对话框,统计分 析对话框可以分为主窗口和下级窗口,在该类对话框中,选择参与分析的各类 变量及统计方法是对话框的主要任务。
(4)定比尺度(Scale Measurement):定比尺度是能够测算 两个测度值之间比值的一种计量尺度,它的测量结果同定距变 量一样表现为数值。
特点:定必变量是测量尺度的最高水平,它除了具有其他三种 测量尺度的全部特点外,还具有可计算两个侧度至之间笔直的 特点,因此它可以进行加、减、乘、除运算,而定居变量值可 进行加减运算。
SPSS Categories SPSS Complex Sample SPSS Conjoint SPSS Exact Test SPSS Maps SPSS Missing Value
Analysis SPSS Regression
SPSS Tables
SPSS Trends
功能 一般线性模型、混合线性模型、对数线性模型、
Include ‘c:\sytaxsample.sps’.
编辑课件
17
四、spss Production Faccility 方式
在Windows的程序菜单中,spss菜单组除了有“spss for windows”项之外, 还有一个“spss production facility”。
编辑课件
18
SPSS中,变量有三种的基本类型:数值型、字符型和日期型。
标准 数值型
逗号 数值型
圆点 数值型
科学技术法 数值型
美元 数值型
用户自 定义型
数值型:数值型的数据是0-9的阿拉伯数字和其他符号, 如美元符号、逗号或圆点组成的。
编辑课件
25
字符型:字符型数据的默认显示宽度为8个字符位,系统不区 分变量名中的大小写字母,并且不能进行数学运算。 注意:在输入数据时不应输入引号,否则双引号将会作为字 符型数据的一部分。
日期型:日期型数据是用来表示日期或时间的。日期型数据 的显示格式有很多,SPSS以菜单方式列出日期型数据的显 示格式以供用户选择。事实上,SPSS存储中的日期型变量 是该实践与1582年10月14日零点相差的秒数。
编辑课件
26
关于日期型格式的几点说明:
“m”在年与日(字母y与d)之间表示月份;在时与秒(字母h与s)之间表示 “分”钟。 “mmm”表示要求书写英文月份单词的前三个字母组成的缩写。 “ddd”三个字母d表示要求用从元月一日算起的日数表示日期。 指定了日期变量的格式,不一定在输入时就使用指定的格式。可以输入用 “/”或“—”作分隔符的具体日期,回车后,系统将自动将输入的格式转化为 指定的格式,显示在单元各种。
编辑课件
19
1.2.4 spss的四种输出结果
1、表格格式 2、文本格式 3、标准图与交互图 4、结果的保存和导出
编辑课件
20
编辑课件
21
2 第 章 数据录入与数据获取
本章主要解决两个问题: 第一个问题,根据问题类型的不同,将会从开放题、单选题和多选题的 录入方式为例进行介绍。 第二个问题,重点介绍如何用SPSS直接读取Excel类型和文本格式的数 据,以及如何用ODBC接口读取数据库文件。
2.1.2 变量属性介绍
在录入数据时,归纳为以下三步: 第一步:定义变量名; 第一步:指定每个变量的各种属性; 第一步:录入数据。 变量名不能与spss保留字相同,spss的保留字有ALL、 END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、 TO、WITH。
编辑课件
24
一、变量的储存类型
编辑课件
1
一、功能强大
(1)囊括了各种成熟的统计方法与模型,为统计分析用户提供了全 方位的统计学算法,为各种研究提供了相应的统计学方法。 (2)提供了各种数据准备与数据整理技术。 (3)自由灵活的表格功能。 (4)各种常用的统计学图形。
编辑课件
2
二、SPSS的实验环境要求
(1)系统运行环境
SPSS10.0以上版本软件包可以工作在两种模式下,单机模式和作为网络系
编辑课件
22
2.1 数据格式概述
2.1.1 统计软件中数据的录入格式 (1)不同观测对象的数据不能在同一记录中出现,即同一
观测数据应当独占一行。 (2)每一个观测量指标或影响因素只能占据一列的位置,
即同一指标的数量观测值都应当录入到同一个变量中去。
即:一个观测占一行,一个变量占一列
编辑课件
23
生存分析等 对应分析、感知图、Proxscal等 多阶段复杂抽样技术等 正交设计、联合分析等,适用于市场研究 精确P值计算、随机抽样P值计算等 在地图上展示数据等
缺失数据的报告与填补等
Logistic回归、非线性回归、Probit回归等
交互式创建各种表格(如堆积表、嵌套表、分层 表等)
Arima模编型辑、课指件 数平滑、自回归等
编辑课件
5
1.1.2 spss的安装
一、启动Windows 后,把SPSS 系统安装软盘(或光盘)插入软驱(或光 驱),并找到SPSS的安装程序的可执行文件Setup.exe。
二、双击 Setup.exe 文件,安装程序向导将给出每一步操作的提示。在出 现[Welcome(欢迎)]窗口后,选择[Next]进入下一步。
编辑课件
27
二、变量的测量尺度
在SPSS中使用Measure属性对变量的测量尺度进行定义。
(1)定类尺度(Nominal Measurement):定类尺度是对事物的类别 或属性的一种测度,按照事物的某种属性对其进行分类或分组。
特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能比 较各类之间的大小,所以各类之间没有顺序和等级。对定类尺度的变 量只能计算频数和频率。
编辑课件
7
1.2.2 SPSS的5个窗口
(1)数据编辑窗口(SPSS Data Editor)
Spss处理数据的工作 全在此窗口进行。
编辑课件
8
编辑课件
9
(2)结果管理窗口(SPSS Output viewer)
此窗口用于存放分析结果。左边是目录区,右边是内容区。
编辑课件
10
(3)草稿结果窗口(SPSS Draft Viewer)
ValidCle rica l 3 63 7 6.6
7 6.6
7 6.6
Cu s to d ial 2 7
5 .7
5 .7Βιβλιοθήκη 8 2.3Ma n ag er 8 4 1 7.7
1 7.7
1 00 .0
Tota l
4 74 1 00 .0
1 00 .0
编辑课件
15
二、程序方式
在Syntax编辑窗口中键入以下程序: Get file=‘c:\program files\spss\employee data.sav’. Frequencies variables = jobcat/order = analysis。
(3)定矩尺度(Interval Measurement):定矩尺度是对事物类 别或次序之间间距的测度。
特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指 出类别之间的差距是多少;定居变量通常以自然或物理单位为计量 尺度,因此测量结果往往表现为数值,所以计量结果可以进行加减 运算。
编辑课件
29
编辑课件
30
三、变量名与变量标签值
Label:定义变量名标签 Value:定义变量值标签
编辑课件
31
四、缺失值
Spss中缺失值有用户自定义缺失值和系统缺失值两大类。
在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默认的缺失 值为零。
编辑课件
32
2.2 数据的直接录入
2.1.1 操作界面说明
统的用户界面模式。
(2)辅助软件环境
三、SPSS的主要界面
SPSS的主要界面有数据编辑窗口和结果输出窗口。
四、SPSS的帮助系统
SPSS对一些基本模块中的统计提供了帮助,可以通过单击Help菜
单中的Statistics Coach命令,选择所需要的统计指导。
编辑课件
3
SPSS附加模块
SPSS Advanced
1.1 SPSS软件概述
1.1.1 SPSS简介
SPSS(Statistics Package for Social Science )for Windows是一种运行在 Windows系统下的社会科学统计软件软件包。
SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等,具体 内容包括描述统计、列联分析,总体的均值比较、相关分析、回归模型 分析、聚类分析、主成份分析、时间序列分析、非参数检验等多个大类, 每个类中还有多个专项统计方法。
三、安装程序显示[Software License Agreement]对话框时,选择[Yes]接受 显示的协议条款。
编辑课件
6
1.2 spss操作入门
1.2.1 spss软件的启动与退出
单击Windows 的[开始]按钮,在[程序]菜单项[SPSS for Windows]中找到[SPSS 10.0 for Windows]并单击。
标尺栏 当前数据栏
标题栏 菜单栏 工具栏 数据输入区 数据编辑区
Data View表可以直 接输入观测数据值 或存放数据,表的 左端列边框显示观 测个体的序号,最 上端行边框显示变 量名。
窗口编标签辑课件
状态栏
显示区滚动条
33
Variable View表用来定义和修改变量的名称、类型及其他属性,如图所示。
在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型 变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥 原则。
编辑课件
28
(2)定序尺度(Ordinal Measurement):定序尺度是对事物之间的 等级或顺序差别的一种测度,可比较优劣或排序。
特点:由于定序变量只能侧度类别之间的顺序,无法测出类别之间的 准确差值,即测量数值不代表绝对的数量大小,所以其测量结果只能 排序,不能进行运算。
一、菜单对话方式 首先打开SPSS软件,然后选择菜单File
Open file。
然后,利用菜单Analyze
Descriptive Statistics
Frequencies,
编辑课件
14
Employm ent Ca te gory
Cu m u lative
Fre qu e ncPyerceVnatlid PercenPterce n t
只需要选择菜单Run All,运行该程序也一样 会出现相同的分析结果。
编辑课件
16
三、Include命令方式
当编写Syntax程序时,如果发现将要编写的程序语句正好是另一个 Syntax文件的内容;或者发现所需要的程序语句其实是几个Syntax文 件的总和是,除了可以通过“Copy”、“Paste”的方法利用资源,生产 一个新的Syntax文件外,还可以利用Include命令。
如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的 属性,直接输入数据,系统将默认变量Var00001,Var00002等。
编辑课件
34
在Variable View表中,每一行描述一个变量,依次是: Name:变量名。变量名必须以字母、汉字及@开头,总长度不超过8个 字符,共容纳4个汉字或8个英文字母,英文字母不区别大小写,最后一个 字符不能是句号。 Type:变量类型。变量类型有8 种,最常用的是Numeric数值型变量。 其它常用的类型有:String字符型,Date日期型,Comma逗号型(隔3位数 加一个逗号)等。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在Date View 中所显示的列宽(默认列宽为8)。 Align:数据对齐格式(默认为右对齐)。 Measure:数据的测度方式。系统给出名义尺度、定序尺度和等间距尺 度三种(默认为等间距尺度)。
草稿结果是结果的一种简化文本格式。实际上就是WORD所兼容 的rtf超文本格式,因此可以在没有安装SPSS的PC机上使用文字 编辑软件打开。
编辑课件
11
(4)语法编辑窗口(SPSS Syntax Editor)
编辑课件
12
(5)脚本窗口(SPSS Script Editor)
编辑课件
13
1.2.3 SPSS的四种运行方式
(1)单击Syntax框下的“Add”按钮,到C盘根目录下打开 “syntaxsample”。 (2)单击Syntax框下的“Edit”按钮,对程序进行编辑。
(3)单击右下角的“uesr prompts”按钮,添加对程序的 交互分析界面。
(4)单击“Browse”按钮制定 结果保存路径,单击“export options”按钮还可以制定结果保 存格式。
4
五、SPSS的运行方式
SPSS提供了3种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行 方式。程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自 己的SPSS命令程序,通过语句直接运行。 SPSS中使用的对话框主要有两类,一类是文件操作对话框,文件操作对话窗 口操作与Windows应用软件操作风格一致。另一类是统计分析对话框,统计分 析对话框可以分为主窗口和下级窗口,在该类对话框中,选择参与分析的各类 变量及统计方法是对话框的主要任务。
(4)定比尺度(Scale Measurement):定比尺度是能够测算 两个测度值之间比值的一种计量尺度,它的测量结果同定距变 量一样表现为数值。
特点:定必变量是测量尺度的最高水平,它除了具有其他三种 测量尺度的全部特点外,还具有可计算两个侧度至之间笔直的 特点,因此它可以进行加、减、乘、除运算,而定居变量值可 进行加减运算。
SPSS Categories SPSS Complex Sample SPSS Conjoint SPSS Exact Test SPSS Maps SPSS Missing Value
Analysis SPSS Regression
SPSS Tables
SPSS Trends
功能 一般线性模型、混合线性模型、对数线性模型、
Include ‘c:\sytaxsample.sps’.
编辑课件
17
四、spss Production Faccility 方式
在Windows的程序菜单中,spss菜单组除了有“spss for windows”项之外, 还有一个“spss production facility”。
编辑课件
18
SPSS中,变量有三种的基本类型:数值型、字符型和日期型。
标准 数值型
逗号 数值型
圆点 数值型
科学技术法 数值型
美元 数值型
用户自 定义型
数值型:数值型的数据是0-9的阿拉伯数字和其他符号, 如美元符号、逗号或圆点组成的。
编辑课件
25
字符型:字符型数据的默认显示宽度为8个字符位,系统不区 分变量名中的大小写字母,并且不能进行数学运算。 注意:在输入数据时不应输入引号,否则双引号将会作为字 符型数据的一部分。
日期型:日期型数据是用来表示日期或时间的。日期型数据 的显示格式有很多,SPSS以菜单方式列出日期型数据的显 示格式以供用户选择。事实上,SPSS存储中的日期型变量 是该实践与1582年10月14日零点相差的秒数。
编辑课件
26
关于日期型格式的几点说明:
“m”在年与日(字母y与d)之间表示月份;在时与秒(字母h与s)之间表示 “分”钟。 “mmm”表示要求书写英文月份单词的前三个字母组成的缩写。 “ddd”三个字母d表示要求用从元月一日算起的日数表示日期。 指定了日期变量的格式,不一定在输入时就使用指定的格式。可以输入用 “/”或“—”作分隔符的具体日期,回车后,系统将自动将输入的格式转化为 指定的格式,显示在单元各种。
编辑课件
19
1.2.4 spss的四种输出结果
1、表格格式 2、文本格式 3、标准图与交互图 4、结果的保存和导出
编辑课件
20
编辑课件
21
2 第 章 数据录入与数据获取
本章主要解决两个问题: 第一个问题,根据问题类型的不同,将会从开放题、单选题和多选题的 录入方式为例进行介绍。 第二个问题,重点介绍如何用SPSS直接读取Excel类型和文本格式的数 据,以及如何用ODBC接口读取数据库文件。
2.1.2 变量属性介绍
在录入数据时,归纳为以下三步: 第一步:定义变量名; 第一步:指定每个变量的各种属性; 第一步:录入数据。 变量名不能与spss保留字相同,spss的保留字有ALL、 END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、 TO、WITH。
编辑课件
24
一、变量的储存类型
编辑课件
1
一、功能强大
(1)囊括了各种成熟的统计方法与模型,为统计分析用户提供了全 方位的统计学算法,为各种研究提供了相应的统计学方法。 (2)提供了各种数据准备与数据整理技术。 (3)自由灵活的表格功能。 (4)各种常用的统计学图形。
编辑课件
2
二、SPSS的实验环境要求
(1)系统运行环境
SPSS10.0以上版本软件包可以工作在两种模式下,单机模式和作为网络系
编辑课件
22
2.1 数据格式概述
2.1.1 统计软件中数据的录入格式 (1)不同观测对象的数据不能在同一记录中出现,即同一
观测数据应当独占一行。 (2)每一个观测量指标或影响因素只能占据一列的位置,
即同一指标的数量观测值都应当录入到同一个变量中去。
即:一个观测占一行,一个变量占一列
编辑课件
23
生存分析等 对应分析、感知图、Proxscal等 多阶段复杂抽样技术等 正交设计、联合分析等,适用于市场研究 精确P值计算、随机抽样P值计算等 在地图上展示数据等
缺失数据的报告与填补等
Logistic回归、非线性回归、Probit回归等
交互式创建各种表格(如堆积表、嵌套表、分层 表等)
Arima模编型辑、课指件 数平滑、自回归等
编辑课件
5
1.1.2 spss的安装
一、启动Windows 后,把SPSS 系统安装软盘(或光盘)插入软驱(或光 驱),并找到SPSS的安装程序的可执行文件Setup.exe。
二、双击 Setup.exe 文件,安装程序向导将给出每一步操作的提示。在出 现[Welcome(欢迎)]窗口后,选择[Next]进入下一步。
编辑课件
27
二、变量的测量尺度
在SPSS中使用Measure属性对变量的测量尺度进行定义。
(1)定类尺度(Nominal Measurement):定类尺度是对事物的类别 或属性的一种测度,按照事物的某种属性对其进行分类或分组。
特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能比 较各类之间的大小,所以各类之间没有顺序和等级。对定类尺度的变 量只能计算频数和频率。
编辑课件
7
1.2.2 SPSS的5个窗口
(1)数据编辑窗口(SPSS Data Editor)
Spss处理数据的工作 全在此窗口进行。
编辑课件
8
编辑课件
9
(2)结果管理窗口(SPSS Output viewer)
此窗口用于存放分析结果。左边是目录区,右边是内容区。
编辑课件
10
(3)草稿结果窗口(SPSS Draft Viewer)
ValidCle rica l 3 63 7 6.6
7 6.6
7 6.6
Cu s to d ial 2 7
5 .7
5 .7Βιβλιοθήκη 8 2.3Ma n ag er 8 4 1 7.7
1 7.7
1 00 .0
Tota l
4 74 1 00 .0
1 00 .0
编辑课件
15
二、程序方式
在Syntax编辑窗口中键入以下程序: Get file=‘c:\program files\spss\employee data.sav’. Frequencies variables = jobcat/order = analysis。
(3)定矩尺度(Interval Measurement):定矩尺度是对事物类 别或次序之间间距的测度。
特点:不仅能将事物区分为不同类型并进行排序,而且可能准确指 出类别之间的差距是多少;定居变量通常以自然或物理单位为计量 尺度,因此测量结果往往表现为数值,所以计量结果可以进行加减 运算。
编辑课件
29
编辑课件
30
三、变量名与变量标签值
Label:定义变量名标签 Value:定义变量值标签
编辑课件
31
四、缺失值
Spss中缺失值有用户自定义缺失值和系统缺失值两大类。
在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默认的缺失 值为零。
编辑课件
32
2.2 数据的直接录入
2.1.1 操作界面说明
统的用户界面模式。
(2)辅助软件环境
三、SPSS的主要界面
SPSS的主要界面有数据编辑窗口和结果输出窗口。
四、SPSS的帮助系统
SPSS对一些基本模块中的统计提供了帮助,可以通过单击Help菜
单中的Statistics Coach命令,选择所需要的统计指导。
编辑课件
3
SPSS附加模块
SPSS Advanced