数据分析软件spss
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
① 变量名 为变量命名要遵循以下规则: A.SPSS变量的变量名长度应少于9个字符。 B.SPSS变量的首字符号必须为字母,在首字以后字 符可为字母、数字或者为除“?”、“ - ”、“!” 和“*”以外的字符。还应注意的是,不能用下划线 “-”和圆点“.”作为变量名的最后一个字符。 C.SPSS 变量名不能与 SPSS 的保留字相同。 SPSS 的 保 留 字 为 : ALL、AND、BY、EQ、GE、GT、LE、 LT、NE、NOT、OR、TO、WITH。 D.SPSS系统不区别变量中的大小写字符,例如系统 将FAN与fan看做同一个变量。
命 令 功 能
对变量操作的命令
Define Dates Insert Variable 对观测量操作的命令 Insert Case Go to Case 对文件操作的命令 Sort Cases Transpose Merge Files Aggregate 按选定的变量对观测量排序 对数据文件的转置 合并数据文件 对数据进行分类与不分类的汇总 进行分析前的处理命令 Split File Select Cases Weight Cases 拆分数据文件 选择观测量 加权处理观测量 插入观测值 定位到指定的观测量 定义与编辑日期变量或日期时间变量 插入变量
运用逻辑运算符,可以构成复杂的逻辑运算表达式。
3.如何定义一个变量 SPSS10.0 For Windows定义变量可以直接在“SPSS Data Editor”上进行。首先单击左下角的“Variable View” 进入定义变量属性的界面,在此界面上可以定义变量名、 变量变类型、变量的长度及小数位数、变量标签及其值 标签、变量的格式(包含显示宽度、对齐方式、缺省值 标签等等)。定义变量的界面如图2所示。
标题栏 图标 菜单栏
图1 数据编辑器窗口
1.1 数据编辑器的构成 数据编辑器主要由四部分构成:标题栏、当前数据栏、 输入数据栏、数据显示区。 ( 1 )标题栏:当数据显示区为一个已保存过的数据文 件时,标题栏将显示此文件的名字;当数据显示区显示 的为一个新建的文件时,则标题栏将显示“ UntiltedSPSS Data Editor”。入上图所示,标题栏显示的为“相 关分析.sav-SPSS Data Editor”。 (2)当前数据栏:在标题栏和菜单栏及图标之下的两 栏中,左边的即为当前数据栏。当前数据栏中用分号分 开了两个数字(或字符串),其中前一个为当前光标所 在处的记录号,而后一个为其变量名,如图1。
2 2
Scientific notation
Date
8
2
科学计数法或 标准格式
日期格式或非 常多
科学计数法
显示格式非常多 有效数字前带$以逗 点为分割符
457.8E4
457.8E4
Dollar
Custom currency String
8
2
可带$或不带 $输入或科学 计数法
$12343
$12343
由用户自定义,采用的方法是利用Edit菜单中的Options选项。 8 无 一串字符串 一串字符串 believe Believe
2.操作符与表达式 SPSS10.0 For Windows的运算共有三种:数学运算、 关系运算和逻辑运算。 ① 算术运算符和算术表达式 算术表达式可以用来连接数值型的常量、变量和函数 以构成算术表达式。它的运算结果为数值型的常量。在算 术表达式中,还存在一个优先级的问题,SPSS中的运算优 先级排序为:按“括号-函数-幂运算-乘或除-加或减”依次 递减的顺序,并且有着同一优先级的运算则应运算左边一 侧的。 ② 比较运算符和表达式 如果比较关系成立,那么比较表达式的值为“真”, 如果比较关系式不成立,那么比较表达式的值为“假”。 进行比较的两个量要求有相同的类型,比较的结果为逻辑 性变量。
④ 变量的格式 变量的格式包括显示宽度、对齐方式或缺省值。 显示宽度指变量显示在数据框中时变量所占的宽度。定 义变量的格式需要注意的是格式的长度既应大于定义变 量类型时所定义的长度,有应大于变量名的长度。否则, 变量名或变量会显示不完全。 变量的对齐方式分为三种:左对齐、右对齐和中间 对齐。系统默认的方式为:数值型变量右对齐,字符型 变量左对齐。 在 SPSS 中 变 量 还 可 以 定 义 缺 省 值 ( Missing Value),这是因为在实际统计过程中很可能产生遗漏 和错误,而这些遗漏和错误则可以用缺省值来替代。
来说,SPSS 不仅功能全面,而且在分析问题的深度上达
到了令人非常满意的效果。这正是 SPSS 软件深受用户喜 爱的原因所在,也是我们选择讲授 SPSS 软件的原因。
第一节 数据文件的建立与操作
一、数据编辑器与数据文件 1.数据编辑器 SPSS10.0 for Windows 在运行之后,屏幕上将显示出 数据编辑器的窗口,如下图所示,用户可以在此窗口中建 立数据文件。下面简要介绍数据编辑器的构成及数据编辑 器的功能。
察序号。如同Word表格中选定单元格一样,SPSS数据显
示区选定的单元格也呈现为加黑的单元格,所选定的单 元格中的数据值将显示于数据输要功能:编辑变量和观测量、编辑数据、 定义系统参数。 ① 编辑变量与观测量:实现这种功能要使用鼠标,具体 如表1所示。 表1 Data 菜单的各项命令
③ 变量标签与变量标签值 A.变量标签(Variable Labels):是为了进一步描述 变量所表示的意义,特别是当变量名不能充分描述变 量所表述的意义时。 B.变量标签值(Value Labels):是为了进一步说明 变量的可能取值,它可以定义,也可以不定义。 具体而言,如果可取值为:grade1、grade2、 grade3、grade4,其分别表示大学学生的年级,则变 量标签可为年级,而变量值标签对应变量取值为:本 科一年级、本科二年级、本科三年级、本科四年级。 注意,只有具有诸如中文Windows或中文平台的中文 环境才能采用中文标签。
Find
查找数据
(3)定义参数:通过Edit菜单中的Options来选择系统 参数。
2.数据文件 我们可以使用 File 菜单中的 New 命令来建立一个数据文 件,用File菜单中的Open命令来打开一个已存在的数据文 件。 在数据编辑器中完成了变量的定义及输入工作之后,就 产生了一个可以由SPSS 10.0for Windows分析的数据文件, 使用菜单项中的Edit中的各项命令可以对数据文件进行处 理。 如果我们想把数据文件存盘,可以单击File菜单中的 Save Data或Save as 命令,并在打开对话框中指顶存储位 置和文件名。当然,我们也可以将数据保存为诸如数据文 件、ASCⅡ文件之类的其他格式的文件。
Microsoft for Data Analysis
SPSS 是世界通用的统计软件包之一,它的全称为 Statistical Program for Social Sciences,即“社会科学 统计程序”,而 SPSS for Windows则是在Windows操作 系统下运行的社会科学统计软件包。 在统计学界,优秀 的统计软件共有3种:SPSS、SAS和SPLUS。在这3种统 计软件中,出类拔萃、更胜一筹的就是SPSS,因为 SPSS的实用范围更广,统计功能更全面。 SPSS 的实用面广阔,它在经济学、生物学、心理 学、医疗卫生、体育、农业、林业、商业、金融等各领 域有广泛的应用。除了这些应用领域外,SPSS还根据很 多社会学科的需要,为一些社会学科增加了很好特别细 致的功能,使用户能更方便地使用SPSS来完成自己的任 务。
② 变量类型与默认长度 SPSS 变量共有三种类型:数值性、字符型和日期型。 数值型变量按不同的要求共分为五种,因此SPSS变量总 共可分为8种变量。每种类型的变量由系统给出默认长度。
长度即指该变量表示的显示宽度,也就是该变量所占的
字节长度。总长度应包括小数点和其他分界符。需要注 意的是,系统的默认变量长度可以通过Edit菜单中的 OPTIONS来重新设置。下面我们将各种变量类型列表加 以介绍。
③ 逻辑运算符和表达式 逻辑运算分为三种:
A.“&” 为逻辑与运算,当“ & ”的前后两个量均为真时, 逻辑表达式的值为“真”,否则,逻辑表达式的值为 “假”。 B.“┃”为逻辑或运算,当“┃”的前后两个量均为真时, 逻辑表达式的值为“真”,否则,逻辑表达式的值为 “假”。 C.“~”为逻辑非运算,“~”不同于逻辑或和逻辑与运 算符,即它为前置符。如果“~”后的量为“真”,则运 算结果为“假”。如果“~”后的量为“假”,则运算结 果为“真”。
SPSS变量 SPSS 变量与数学中的定义类似,均指可变的量。但与 一般数学中不同的的是:除了定义变量名之外,在 SPSS 中还要定义它的其他四个属性,即变量类型(type)、变
量标签和值标签(label)、缺省值定义(missing value)、
变量的列格式(column format)。在定义SPSS变量时至 少应定义变量名和变量类型,而其他属性则可以采用默认 值。下面将依次介绍如何定义一个变量。
(3)输入数据栏:在标题栏和菜单栏及图标之下的两栏 中,右边的一栏即为输入数据栏。最初此处显示光标所 在处的数据值,在用键盘输入新的数据之后,只有回车 才将新输入的数据值写入数据显示区并显示在此处。 (4)数据显示区:数据显示区处于SPSS界面的最下端, 如上图所示。它类似于Excel表格,即在表格头部(横轴 方向上)显示变量名,而在纵轴方向上的最左端则为观
SPSS所提供的统计功能全面,相对于SAS、SPLUS而 言,SPSS所提供的统计功能更强大。以回归为例,SPSS 不仅能提供SAS、SPLUS这些统计软件所提供的常用回归 分析方法,诸如线性回归、曲线回归、非线性回归等,而 且提供了许多专业的回归统计方法,例如logistic回;除此 之外,在每一种具体的统计方法上,用户可以从不同角度 去分析同意个问题,使分析结果更能反映真实现象。总体
表3 变量类型列表
SPSS变 量类型 Numeric Comma Dot 系统默 认长度 8 8 8 小数 位数 2 输入方式 标准格式或科 学计数法 带逗点的数值 或科学计数法 带圆的数值或 科学计数法 显示方式 标准格式数值变量原 点表示小数点的数值 圆点做小数点,逗点 做三分割符的数值 逗点做小数点,圆点 做三分割符的数值 范 输入 38.42 1,343,438.1 34.3434E2 例 显示 38.42 1,343,438.1 3.434,34
图2 定义变量属性的界面
定义一个变量的步骤如下: 1.在打开SPSS运行界面后,界面为Data Variable,首先 单击左下角的Variable View,就会显示如图2的界面。 2.定义变量名 在图2中,单击“Name”所在行的第一列,就可以输入 要定义的第一个变量的变量名。 3.变量类型的定义 在“Type”栏的第一行单击,会出现省略号,再单击省 略号,就会出现定义变量类型的对话框。用户可以在此 对话框选择变量类型及改动变量的系统默认长度和小数 位数。在用户选择完变量类型并将变量长度及小数位数 该为所需要的之后,单击“OK”按钮,即可回到图2的界 面。定义变量类型的对话框如图3所示。
二、常量、变量、观测量、操作符及表达式 1.常量与变量 SPSS常量 分为三种:数值型、字符型和日期型。其中,数值型 常量表现为一个数值,字符型常量表现为扩在单引号或 双引号中的字符串。日期型常量表现为按日期格式表示 的日期、时间和日期时间。 数值型常量有两种书写方式:第一种为诸如25、 1643.5的普通书写方式;第二种书写方式为科学计数法, 即采用指数来表示数值,它的主要用途为表示特别大或 特别小的数值,例如1.34E11表示1.34×1011,2.54E-2表 示2.54×10-2。可以根据自己的需要选取书写方式,但最 好使书写方式统一,以便容易发现错误。
( 2)数据编辑功能:实现这种功能要通过使用鼠标及 菜单中的Edit命令来实现。具体如表2。
表2 数据编辑功能表 命 令 功 能
Undo Redo Cut Copy Paste Clear
删除刚输入的数据或者恢复刚修改的数据 恢复刚撤销的操作 将选定数据剪切到剪帖板 将选定数据拷贝到剪帖板 将剪帖板中的数据粘贴到指定位置 清除选定的变量和观测量