SPSS统计分析基础教程总结
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Include ‘c:\sytaxsample.sps’.
四、spss Production Faccility 方式
在Windows的程序菜单中,spss菜单组除了有“spss for windows”项之外, 还有一个“spss production facility”。
(1)单击Syntax框下的“Add”按钮,到C盘根目录下打开 “syntaxsample”。
1.2 spss操作入门
1.2.1 spss软件的启动与退出
单击Windows 的[开始]按钮,在[程序]菜单项[SPSS for Windows]中找到[SPSS 10.0 for Windows]并单击。
1.2.2 SPSS的5个窗口
(1)数据编辑窗口(SPSS Data Editor)
Spss处理数据的工作 全在此窗口进行。
(2)单击Syntax框下的“Edit”按钮,对程序进行编辑。
(3)单击右下角的“uesr prompts”按钮,添加对程序的 交互分析界面。
(4)单击“Browse”按钮制 定结果保存路径,单击 “export options”按钮还可以 制定结果保存格式。
1.2.4 spss的四种输出结果
1、表格格式 2、文本格式 3、标准图与交互图 4、结果的保存和导出
(2)辅助软件环境
三、SPSS的主要界面
SPSS的主要界面有数据编辑窗口和结果输出窗口。
四、SPSS的帮助系统
SPSS对一些基本模块中的统计提供了帮助,可以通过单击Help菜 单中的Statistics Coach命令,选择所需要的统计指导。
SPSS附加模块 SPSS Advanced SPSS Categories SPSS Complex Sample SPSS Conjoint
一观测数据应当独占一行。
(2)每一个观测量指标或影响因素只能占据一列的位置 ,即同一指标的数量观测值都应当录入到同一个变量中去 。 即:一个观测占一行,一个变量占一列
2.1.2 变量属性介绍
在录入数据时,归纳为以下三步: 第一步:定义变量名; 第一步:指定每个变量的各种属性; 第一步:录入数据。 变量名不能与spss保留字相同,spss的保留字有ALL、 END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、 TO、WITH。
二、程序方式
在Syntax编辑窗口中键入以下程序: Get file=‘c:\program files\spss\employee data.sav’. Frequencies variables = jobcat/order = analysis。
只需要选择菜单Run All,运行该程序也一样 会出现相同的分析结果。
1
多个大类,每个类中还有多个专项统计方法。
一、功能强大
(1)囊括了各种成熟的统计方法与模型,为统计分析用户提供了全
方位的统计学算法,为各种研究提供了相应的统计学方法。
(2)提供了各种数据准备与数据整理技术。
(3)自由灵活的表格功能。
(4)各种常用的统计学图形。
二、SPSS的实验环境要求
(1)系统运行环境 SPSS10.0以上版本软件包可以工作在两种模式下,单机模式和作为网络系 统的用户界面模式。
在spss中,能适用定类尺度的数据可以是数值型,也可 以是字符型变量。使用定类变量对事物进行分类时,必 须符合穷尽原则和互斥原则。
(2)定序尺度(Ordinal Measurement):定序尺度是 对事物之间的等级或顺序差别的一种测度,可比较优劣或 排序。 特点:由于定序变量只能侧度类别之间的顺序,无法测出 类别之间的准确差值,即测量数值不代表绝对的数量大小, 所以其测量结果只能排序,不能进行运算。 (3)定距尺度(Interval Measurement):指如身高、 体重、血压等连续数值型数据,也包括人数、商品件数 等离散数值型数据 特点:不仅能将事物区分为不同类型并进行排序,而且 可能准确指出类别之间的差距是多少;定距变量通常以 自然或物理单位为计量尺度,因此测量结果往往表现为 数值,所以计量结果可以进行加减运算。
2.2.2 开放题和简单单选题的录入
一、在spss中定义变量
录入数据的第一步是定义变量属性,随后才能进行数据录入。 二、开放题的录入
三、单选题的录入 单选题的录入可以采用字符直接录入、字符代码+值标签、 数值代码+值标签三种方式。
2.2.3多选题的录入
一、多重二分法(Multiple Dichotomy Method) 所谓多重二分法,是在编码的时候,对应每一个选项都要定义 一个变量,有几个选项就有几个变量,这些变量均为二分类 ,他们各自代表对一个选项的选择结果。 二、多重分类法(Multiple Category Method) 多重分类法,也是利用多个变量对一个多选题的答案进行定义 ,应该用多少个变量,由被访者实际可能给出的最多答案数 而定。
功能 一般线性模型、混合线性模型、对数线性模型、 生存分析等 对应分析、感知图、Proxscal等 多阶段复杂抽样技术等 正交设计、联合分析等,适用于市场研究
SPSS Exact Test
SPSS Maps SPSS Missing Value Analysis
精确P值计算、随机抽样P值计算等
在地图上展示数据等
三、变量名与变量标签值
Label:定义变量名标签 Value:定义变量值标签
四、缺失值
Spss中缺失值有用户自定义缺失值和系统缺失值两大类。
在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默认的缺失 值为零。
2.2 数据的直接录入
标尺栏
2.1.1 操作界面说明 当前数据栏 标题栏
菜单栏
工具栏
数据输入区
数据编辑区
窗口标签
状态栏
显示区滚动条
Variable View表用来定义和修改变量的名称、类型及其他属性,如图所示。
如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的 属性,直接输入数据,系统将默认变量Var00001,Var00002等。
Name:变量名。 Type:变量类型。变量类型有8 种,最常用Numeric数值型。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在Date View 中所显示的列宽(默认为8)。 Align:数据对齐格式(默认为右对齐)。 Measure:数据的测度方式。定距尺度、定序尺度和定类距 尺度三种。
1.1.2 spss的安装
一、启动Windows 后,把SPSS 系统安装软盘(或光盘)插入软驱(或光
驱),并找到SPSS的安装程序的可执行文件Setup.exe。
二、双击 Setup.exe 文件,安装程序向导将给出每一步操作的提示。在出 现[Welcome(欢迎)]窗口后,选择[Next]进入下一步。 三、安装程序显示[Software License Agreement]对话框时,选择 [Yes]接受显示的协议条款。
为了在统计分析过程中能有效的利用其它软件产生 的数据,SPSS软件编辑窗口除可以使用*.sav扩展名 数据文件,还可以直接打开和保存下述类型的文件: SPSS DOS版本产生的数据文件*.sys; Excel 报表程序产生的数据文件*.xls; DBASE 数据库格式文件*.dbf; SAS统计软件产生的数据文件。
(2)结果管理窗口(SPSS Output viewer)
此窗口用于存放分析结果。左边是目录区,右边是内容区。
(3)草稿结果窗口(SPSS Draft Viewer)
草稿结果是结果的一种简化文本格式。实际上就是WORD所兼容 的rtf超文本格式,因此可以在没有安装SPSS的PC机上使用文字 编辑软件打开。
三、Include命令方式
当编写Syntax程序时,如果发现将要编写的程序语句正好是另一个 Syntax文件的内容;或者发现所需要的程序语句其实是几个Syntax文 件的总和是,除了可以通过“Copy”、“Paste”的方法利用资源,生 产一个新的Syntax文件外,还可以利用Include命令。
一、变量的储存类型
SPSS中,变量有三种的基本类型:数值型、字符型和日期型。
数值型:数值型的数据是0-9的阿拉伯数字和其他符号,
如美元符号、逗号或圆点组成的。
标准 数值型
逗号 Hale Waihona Puke Baidu值型
圆点 数值型
科学技术法 数值型
美元 数值型 用户自 定义型
字符型:字符型数据的默认显示宽度为8个字符位,
系统不区分变量名中的大小写字母,并且不能进行
数学运算。 注意:在输入数据时不应输入引号,否则双引号将 会作为字符型数据的一部分。
日期型:日期型数据是用来表示日期或时间的。日期型数
据的显示格式有很多,SPSS以菜单方式列出日期型数据的
显示格式以供用户选择。
关于日期型格式的几点说明:
“m”在年与日(字母y与d)之间表示月份;在时与秒 (字母h与s)之间表示“分”钟。 “mmm”表示要求书写英文月份单词的前三个字母组成 的缩写。“ddd”三个字母d表示要求用从元月一日算起 的日数表示日期。 指定了日期变量的格式,不一定在输入时就使用指定的 格式。可以输入用“/”或“—”作分隔符的具体日期, 回车后,系统将自动将输入的格式转化为指定的格式, 显示在单元各种。
缺失数据的报告与填补等 Logistic回归、非线性回归、Probit回归等 交互式创建各种表格(如堆积表、嵌套表、分层 表等)
Arima模型、指数平滑、自回归等
SPSS Regression
SPSS Tables SPSS Trends
五、SPSS的运行方式
SPSS提供了3种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行 方式。程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自 己的SPSS命令程序,通过语句直接运行。 SPSS中使用的对话框主要有两类,一类是文件操作对话框,文件操作对话窗 口操作与Windows应用软件操作风格一致。另一类是统计分析对话框,统计分 析对话框可以分为主窗口和下级窗口,在该类对话框中,选择参与分析的各类 变量及统计方法是对话框的主要任务。
第 章 数据录入与数据获取
本章主要解决两个问题:
2
第一个问题,根据问题类型的不同,将会从开放题、
单选题和多选题的录入方式为例进行介绍。 第二个问题,重点介绍如何用SPSS直接读取Excel类 型和文本格式的数据,以及如何用ODBC接口读取数 据库文件。
2.1 数据格式概述
2.1.1 统计软件中数据的录入格式 (1)不同观测对象的数据不能在同一记录中出现,即同
(4)语法编辑窗口(SPSS Syntax Editor)
(5)脚本窗口(SPSS Script Editor)
1.2.3 SPSS的四种运行方式
一、菜单对话方式 首先打开SPSS软件,然后选择菜单File
然后,利用菜单Analyze
Open file。
Frequencies,
Descriptive Statistics
Employment Category Frequency 363 27 84 474 Percent 76.6 5.7 17.7 100.0 Valid Percent 76.6 5.7 17.7 100.0 Cumulative Percent 76.6 82.3 100.0
Valid
Clerical Custodial Manager Total
统计学实践
第 章 数据分析概述与软件入门
1.1 SPSS软件概述
1.1.1 SPSS简介
SPSS(Statistics Package for Social Science )for Windows是一 种运行在Windows系统下的社会科学统计软件软件包。 SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等, 具体内容包括描述统计、列联分析,总体的均值比较、相关分析、回 归模型分析、聚类分析、主成份分析、时间序列分析、非参数检验等
二、变量的测量尺度
在SPSS中使用Measure属性对变量的测量尺度进行 定义。 (1)定类尺度(Nominal Measurement):定类尺度是对 事物的类别或属性的一种测度,按照事物的某种属性对其 进行分类或分组。
特点:其值仅代表了事物的类别和属性,即能测度类别差 异,不能比较各类之间的大小,所以各类之间没有顺序和 等级。对定类尺度的变量只能计算频数和频率。
四、spss Production Faccility 方式
在Windows的程序菜单中,spss菜单组除了有“spss for windows”项之外, 还有一个“spss production facility”。
(1)单击Syntax框下的“Add”按钮,到C盘根目录下打开 “syntaxsample”。
1.2 spss操作入门
1.2.1 spss软件的启动与退出
单击Windows 的[开始]按钮,在[程序]菜单项[SPSS for Windows]中找到[SPSS 10.0 for Windows]并单击。
1.2.2 SPSS的5个窗口
(1)数据编辑窗口(SPSS Data Editor)
Spss处理数据的工作 全在此窗口进行。
(2)单击Syntax框下的“Edit”按钮,对程序进行编辑。
(3)单击右下角的“uesr prompts”按钮,添加对程序的 交互分析界面。
(4)单击“Browse”按钮制 定结果保存路径,单击 “export options”按钮还可以 制定结果保存格式。
1.2.4 spss的四种输出结果
1、表格格式 2、文本格式 3、标准图与交互图 4、结果的保存和导出
(2)辅助软件环境
三、SPSS的主要界面
SPSS的主要界面有数据编辑窗口和结果输出窗口。
四、SPSS的帮助系统
SPSS对一些基本模块中的统计提供了帮助,可以通过单击Help菜 单中的Statistics Coach命令,选择所需要的统计指导。
SPSS附加模块 SPSS Advanced SPSS Categories SPSS Complex Sample SPSS Conjoint
一观测数据应当独占一行。
(2)每一个观测量指标或影响因素只能占据一列的位置 ,即同一指标的数量观测值都应当录入到同一个变量中去 。 即:一个观测占一行,一个变量占一列
2.1.2 变量属性介绍
在录入数据时,归纳为以下三步: 第一步:定义变量名; 第一步:指定每个变量的各种属性; 第一步:录入数据。 变量名不能与spss保留字相同,spss的保留字有ALL、 END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、 TO、WITH。
二、程序方式
在Syntax编辑窗口中键入以下程序: Get file=‘c:\program files\spss\employee data.sav’. Frequencies variables = jobcat/order = analysis。
只需要选择菜单Run All,运行该程序也一样 会出现相同的分析结果。
1
多个大类,每个类中还有多个专项统计方法。
一、功能强大
(1)囊括了各种成熟的统计方法与模型,为统计分析用户提供了全
方位的统计学算法,为各种研究提供了相应的统计学方法。
(2)提供了各种数据准备与数据整理技术。
(3)自由灵活的表格功能。
(4)各种常用的统计学图形。
二、SPSS的实验环境要求
(1)系统运行环境 SPSS10.0以上版本软件包可以工作在两种模式下,单机模式和作为网络系 统的用户界面模式。
在spss中,能适用定类尺度的数据可以是数值型,也可 以是字符型变量。使用定类变量对事物进行分类时,必 须符合穷尽原则和互斥原则。
(2)定序尺度(Ordinal Measurement):定序尺度是 对事物之间的等级或顺序差别的一种测度,可比较优劣或 排序。 特点:由于定序变量只能侧度类别之间的顺序,无法测出 类别之间的准确差值,即测量数值不代表绝对的数量大小, 所以其测量结果只能排序,不能进行运算。 (3)定距尺度(Interval Measurement):指如身高、 体重、血压等连续数值型数据,也包括人数、商品件数 等离散数值型数据 特点:不仅能将事物区分为不同类型并进行排序,而且 可能准确指出类别之间的差距是多少;定距变量通常以 自然或物理单位为计量尺度,因此测量结果往往表现为 数值,所以计量结果可以进行加减运算。
2.2.2 开放题和简单单选题的录入
一、在spss中定义变量
录入数据的第一步是定义变量属性,随后才能进行数据录入。 二、开放题的录入
三、单选题的录入 单选题的录入可以采用字符直接录入、字符代码+值标签、 数值代码+值标签三种方式。
2.2.3多选题的录入
一、多重二分法(Multiple Dichotomy Method) 所谓多重二分法,是在编码的时候,对应每一个选项都要定义 一个变量,有几个选项就有几个变量,这些变量均为二分类 ,他们各自代表对一个选项的选择结果。 二、多重分类法(Multiple Category Method) 多重分类法,也是利用多个变量对一个多选题的答案进行定义 ,应该用多少个变量,由被访者实际可能给出的最多答案数 而定。
功能 一般线性模型、混合线性模型、对数线性模型、 生存分析等 对应分析、感知图、Proxscal等 多阶段复杂抽样技术等 正交设计、联合分析等,适用于市场研究
SPSS Exact Test
SPSS Maps SPSS Missing Value Analysis
精确P值计算、随机抽样P值计算等
在地图上展示数据等
三、变量名与变量标签值
Label:定义变量名标签 Value:定义变量值标签
四、缺失值
Spss中缺失值有用户自定义缺失值和系统缺失值两大类。
在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默认的缺失 值为零。
2.2 数据的直接录入
标尺栏
2.1.1 操作界面说明 当前数据栏 标题栏
菜单栏
工具栏
数据输入区
数据编辑区
窗口标签
状态栏
显示区滚动条
Variable View表用来定义和修改变量的名称、类型及其他属性,如图所示。
如果输入变量名后回车,将给出变量的默认属性。如果不定义变量的 属性,直接输入数据,系统将默认变量Var00001,Var00002等。
Name:变量名。 Type:变量类型。变量类型有8 种,最常用Numeric数值型。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在Date View 中所显示的列宽(默认为8)。 Align:数据对齐格式(默认为右对齐)。 Measure:数据的测度方式。定距尺度、定序尺度和定类距 尺度三种。
1.1.2 spss的安装
一、启动Windows 后,把SPSS 系统安装软盘(或光盘)插入软驱(或光
驱),并找到SPSS的安装程序的可执行文件Setup.exe。
二、双击 Setup.exe 文件,安装程序向导将给出每一步操作的提示。在出 现[Welcome(欢迎)]窗口后,选择[Next]进入下一步。 三、安装程序显示[Software License Agreement]对话框时,选择 [Yes]接受显示的协议条款。
为了在统计分析过程中能有效的利用其它软件产生 的数据,SPSS软件编辑窗口除可以使用*.sav扩展名 数据文件,还可以直接打开和保存下述类型的文件: SPSS DOS版本产生的数据文件*.sys; Excel 报表程序产生的数据文件*.xls; DBASE 数据库格式文件*.dbf; SAS统计软件产生的数据文件。
(2)结果管理窗口(SPSS Output viewer)
此窗口用于存放分析结果。左边是目录区,右边是内容区。
(3)草稿结果窗口(SPSS Draft Viewer)
草稿结果是结果的一种简化文本格式。实际上就是WORD所兼容 的rtf超文本格式,因此可以在没有安装SPSS的PC机上使用文字 编辑软件打开。
三、Include命令方式
当编写Syntax程序时,如果发现将要编写的程序语句正好是另一个 Syntax文件的内容;或者发现所需要的程序语句其实是几个Syntax文 件的总和是,除了可以通过“Copy”、“Paste”的方法利用资源,生 产一个新的Syntax文件外,还可以利用Include命令。
一、变量的储存类型
SPSS中,变量有三种的基本类型:数值型、字符型和日期型。
数值型:数值型的数据是0-9的阿拉伯数字和其他符号,
如美元符号、逗号或圆点组成的。
标准 数值型
逗号 Hale Waihona Puke Baidu值型
圆点 数值型
科学技术法 数值型
美元 数值型 用户自 定义型
字符型:字符型数据的默认显示宽度为8个字符位,
系统不区分变量名中的大小写字母,并且不能进行
数学运算。 注意:在输入数据时不应输入引号,否则双引号将 会作为字符型数据的一部分。
日期型:日期型数据是用来表示日期或时间的。日期型数
据的显示格式有很多,SPSS以菜单方式列出日期型数据的
显示格式以供用户选择。
关于日期型格式的几点说明:
“m”在年与日(字母y与d)之间表示月份;在时与秒 (字母h与s)之间表示“分”钟。 “mmm”表示要求书写英文月份单词的前三个字母组成 的缩写。“ddd”三个字母d表示要求用从元月一日算起 的日数表示日期。 指定了日期变量的格式,不一定在输入时就使用指定的 格式。可以输入用“/”或“—”作分隔符的具体日期, 回车后,系统将自动将输入的格式转化为指定的格式, 显示在单元各种。
缺失数据的报告与填补等 Logistic回归、非线性回归、Probit回归等 交互式创建各种表格(如堆积表、嵌套表、分层 表等)
Arima模型、指数平滑、自回归等
SPSS Regression
SPSS Tables SPSS Trends
五、SPSS的运行方式
SPSS提供了3种基本运行方式:完全窗口菜单方式,程序运行方式、混合运行 方式。程序运行方式和混合运行方式是使用者从特殊的分析需要出发,编写自 己的SPSS命令程序,通过语句直接运行。 SPSS中使用的对话框主要有两类,一类是文件操作对话框,文件操作对话窗 口操作与Windows应用软件操作风格一致。另一类是统计分析对话框,统计分 析对话框可以分为主窗口和下级窗口,在该类对话框中,选择参与分析的各类 变量及统计方法是对话框的主要任务。
第 章 数据录入与数据获取
本章主要解决两个问题:
2
第一个问题,根据问题类型的不同,将会从开放题、
单选题和多选题的录入方式为例进行介绍。 第二个问题,重点介绍如何用SPSS直接读取Excel类 型和文本格式的数据,以及如何用ODBC接口读取数 据库文件。
2.1 数据格式概述
2.1.1 统计软件中数据的录入格式 (1)不同观测对象的数据不能在同一记录中出现,即同
(4)语法编辑窗口(SPSS Syntax Editor)
(5)脚本窗口(SPSS Script Editor)
1.2.3 SPSS的四种运行方式
一、菜单对话方式 首先打开SPSS软件,然后选择菜单File
然后,利用菜单Analyze
Open file。
Frequencies,
Descriptive Statistics
Employment Category Frequency 363 27 84 474 Percent 76.6 5.7 17.7 100.0 Valid Percent 76.6 5.7 17.7 100.0 Cumulative Percent 76.6 82.3 100.0
Valid
Clerical Custodial Manager Total
统计学实践
第 章 数据分析概述与软件入门
1.1 SPSS软件概述
1.1.1 SPSS简介
SPSS(Statistics Package for Social Science )for Windows是一 种运行在Windows系统下的社会科学统计软件软件包。 SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等, 具体内容包括描述统计、列联分析,总体的均值比较、相关分析、回 归模型分析、聚类分析、主成份分析、时间序列分析、非参数检验等
二、变量的测量尺度
在SPSS中使用Measure属性对变量的测量尺度进行 定义。 (1)定类尺度(Nominal Measurement):定类尺度是对 事物的类别或属性的一种测度,按照事物的某种属性对其 进行分类或分组。
特点:其值仅代表了事物的类别和属性,即能测度类别差 异,不能比较各类之间的大小,所以各类之间没有顺序和 等级。对定类尺度的变量只能计算频数和频率。