第2章 SPSS 17.0 基本操作与数据管理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、运算符与表达式
1.运算符 SPSS的基本运算有3种:数学运算、关系运算和逻辑运算,相 应 运算的运算符和表达式如下图所示。 数学运算符 符号 + * / ** () 意义 加 减 乘 除 乘方 括号 符号 < > <= >= = ~= 关系运算符 运算符 LT GT LE GE EQ NT
表 SPSS的运算符
逻辑运算符 运算符 AND OR NOT 意义 与 或 非
意义 小于 大于 小于等于 大于等于 等于 不等于
符号 & | ~
2. 表达式 表达式的具体形式有以下3种: (1)算术表达式
算数表达式是数学运算符连接用数值型的常量、变量和函数的表达式, 其运算结果一般为数值,如:表达式23+45,输出结果68 。
2.变量标签
变量标签用于对变量名和变量值的辅助说明,包含变量名标签和变量
值标签。 (1)变量名标签 : 对变量名的一些解释说明,增强分析结果的可视性,可以省略.不超过 256个字符。
(2)变量值标签:
对变量所取值的一些解释说明,增强分析结果的可视性,可以省略。 不超过120个字符。一般用于品质数据 。 如:1-男 2-女、1-高 2-中 3-低
Leabharlann Baidu(2)比较表达式
比较表达式是利用关系运算符建立起的两个变量间的比较关系,要求相 互比较的两个量类型一致,他的结果一般逻辑型。
如:x=2,则表达式“x>0”为真,系统返回1(true)。
(3)逻辑表达式
逻辑表达式由逻辑运算符、逻辑型的变量或取值为逻辑型的比较表达式 构成。他的值为逻辑型常量。如:对于表达式“true AND true” 系统 返回“true ” , “true OR false” 系统返回“true ” 。
数据文件的合并
(二)横向数据合并 (3)菜单选项: data -> merge file -> add variable (4)选项说明: – math cases on key variables in sorted files:以关键 字作为合并标志。 – Both files provide cases:合并后的文件的数据由两 个文件共同提供。 – External file is keyed table:以data editor的数据为基 础。 – Working data file is keyed table:以磁盘文件的数据 为基础。
(2)字符型:
字符型编变量由字符串组成,可以包含数字、字母和一些特殊符号。字符型变 量的默认长度为8,大于8个字符的称为长字符型变量,少于8个字符的称为短字
符型变量,字符型变量最长为32767个字符。他不能参与运算,区分大小写字母。
(3)日期型: 日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算 ,要参与必须通过日期函数进行转换。 如:1-12-2009、29.12.99等
如果保存的是新建的数据文件,当进行以上操作时,会弹出如左下图
所示的“将数据保存为”对话框。 用户可以保存所有的变量,也可以单击“变量”按钮,在弹出如右下
图所示的“数据保存为:变量”对话框中选择要保存的变量。
• 录入时应注意: – 黑框确定当前数据单元 – 录入带有变量值标签的数据:手工输入代码,屏幕 显示变量值标签 – 冻结第一列 • 数据保存: – 操作 – 保存格式: • (1)*.sav :SPSS数据文件(默认)。 • (2)*.dbf : dbase数据文件。 • (3)*.xls : Excel工作表文件。 – 注意:有些信息会丢失
该显示栏用于显示单元格位置和单元格的内容等信息。灰色显 示的区域为提示区,显示单元格的位置,空白区域为数据编辑器, 该区域内显示当前选中的单元格的内容,用户可以在该区域输入或 修改相应的内容。
(4)数据编辑显示区
在窗口的中部是编辑显示区,该区最左边列显示单元序列号, 最上边一行显示变量名称。选定的单元格呈反色显示,其内容将出 现在数据和单元格信息显示栏中。用户可以在该区域内输入或修改 单元格内容。 (5)视图转换栏 该栏用于进行变量和数据视图的切换,用户只需要单击相应的 选项卡便可以完成变量与数据视图的切换。 (6)系统状态栏 该栏显示当前的系统操作,用户可以通过该栏了解SPSS当前的 工作状态。
2.1.2 常量、变量、操作符和表达 一 、 常量与变量 式
1.SPSS常量 SPSS中的常量在一定阶段内其取值不随观测而改变的值。有3种类型 (1)数值型: 数据型常量是一个数值。他有两种书写方式: 一是普通书写方式,如:53、74.2等; 二是科学计数书写方式,其使用指数表示数值,通常用于表示贴别大 或特别小的数值。如:1.2E+05 表示1.2×105 (2)字符型: 字符型常量是被单引号或双引号括起来的一串字符。如果本身带有单 引号或半个单引号,则必须使用双引号括起来。 如:beijing 处理时用双引号扩起来,即“beijing” (3)日期型: 按特定格式存储日期数据 ,一般使用较少 格式很多,如:20-AUG-1999
2.1.3 变量列格式、缺失值和变量计量尺度
1.变量列格式 • 对齐方式 左对齐:字符型默认。 右对齐:数值型默认。 居中对齐 • 列宽度 默认值为变量的总长度。 2.缺失值 (1)什么是缺失值? 漏填数据,明显错误的数据 (2)对缺失值的一般处理 事先指定:指定某个特定值为缺失值(用户缺失值) 其他处理方法,如:以均值、众数替代等 (3)SPSS缺失值 用户缺失值 系统缺失值:数值型:点 (•) 字符型:空
打开数据文件的具体操作步骤如下: (1)在菜单栏中依次选择“文件” | “打开” | “数据” 命令或单击工具 栏中的
按钮,打开如右图所
示的“打开数据”对话框。 (2)选择相应的文件。 (3)双击需要打开的
文件或单击 “打开”
按钮打开文件。
2.数据文件的保存
在菜单栏中依次选择“文件” | “保存” 命令、“文件” | “另存为” 命 令或单击工具栏中的 按钮实现数据文件的保存操作。
第2章 SPSS 17.0 基本操作与数据管 理
2.1 SPSS 17.0 基本概
念
2.1.1 数据编辑器与数据文 件
SPSS的数据编辑器是用户进行数据处理与分析的主要窗口界面。
用户可以在数据编辑器窗口进行数据输入、观察、编辑和统计分析等操
作。 如果在启动选项中选择“输入数据” 或 “打开现有数据源” ,进
– 建立ODBC数据源
入 SPSS后的第一个窗口就是数据编辑窗口,如下图所示
标题栏 菜单栏 窗口控制按钮
数据单元格信息显示栏
常用工具按钮
数据编辑显示区
视图转换栏
系统状态栏
“数据编辑” 窗口
(1)标题栏
标题显示窗口名称和编辑的数据文件名。如果当前数据编辑器 中是一个新建的文件,其显示为 “未标题1[数据集0]-SPSS Statistics 数据编辑器 ”。 (2)菜单栏 菜单栏,包括 “文件”、“编辑”、“视图”、“数据”、 “转换”、“分析”、“图形”、“实用程序”、“附加内容”、 “窗口”和“帮助” 菜单,这些菜单可以实现编辑数据与变量、定义 系统参数、设计显示方式、绘制图形、进行各项数据分析和查阅帮 助等功能。 (3)数据单元格信息显示栏
数据文件的合并
• 目的:
将两个SPSS数据文件合并到一个数据文件 中
• 文件合并的方式:
– 纵向合并 – 横向合并
数据文件的合并
(一)纵向数据合并
(1)含义:
将磁盘上的一个SPSS数据文件追加到当前data editor窗口中的数 据文件中。
(2)前提:
两个SPSS数据文件应可以合并的内容,且最好有相同的变量名 和变量类型。
与其他软件数据共享
• 共享dbf和xls格式文件
菜单选项: Data -> Open (1)*.dbf : dbase数据文件。字段名、字段类型自动转 成SPSS数据文件中的变量名和类型。一条记录为一个 个案。 (2)*.xls : Excel文件 (Read variable name选项) • 共享数据库文件
3.变量计量尺度
• 尺度: 定距数据,一般为数值型数据。
如:收入、人数。 • 序号: 有固有顺序的顺序水准的数值型或字符型数据。 如:职称、年龄段 • 标称: 无固有顺序的名义水准的数值型或字符型数据。
如:性别、民族
2.2 数据和变量的基本操作
2.2.1 数据文件的打开与保 存 1.数据文件的打开
SPSS数据的编辑
(一)打开数据文件
菜单选项:文件 ->打开 ->数据
(二)数据定位
• 按个案号码定位 菜单: 数据 -> Go to case -> 输入样本号 • 按值定位 光标定位到某列变量上 -> Edit -> Find...
SPSS数据的编辑
(三)插入和删除一个个案
• 插入:数据->insert case • 删除:选定待删行,鼠标右键找到Cut
二、变量名与变量标签 变量名和变量标签是用户用于识别变量的标志。 1.变量名 变量名用于区分不同的变量。
起名规则:
• 不能超过64个字符 • 不区分大小写
• 默认变量名为VARn,如:var00001
• 首字符必须是字母、中文或特殊符号“@” 、“$” 、“#” 。 • 变量名中不能出现“ ?” 、“ !” 、“-” 、“+” 、“=” 、“*” 和空格。 • 变量名不能与保留字相同,保留字有:AND,BY,EQ,GE,GT,LT,NE, NOT,OR,WITH和ALL。
2.SPSS变量的类型和显示宽度 对不同的对象其取值发生变化的量称为变量。有3种类型 (1)数值型: 数据型变量一般由数字、分隔符和一些特殊符号(如美元符号)构成, 有6种形式。 • 标准数值型:默认类型 8.2 如: 12345678、12345.67、-1234.56 • 逗号数值型: 从个位开始三位一个逗号,默认类型 8.2 如:1,234.56 • 圆点数值型:他与带逗号的数值型相反,默认类型 8.2 如:1.234,56 • 科学计数法型:表示很大或很小的数据 8.2 如:1.2E+05 • 美元符号:表示货币 格式很多,如:$12.30 • 自定义货币型:用户可以创建5种自定义数据显示格式,系统自动 将自定义数据显示名称,命名为CCA、CCB、CCC、CCD和 CCE,这只是5种命名,用户可以自行设定这5种类型。
(3)菜单选项: 数据 -> 合并文件 -> 添加个案
数据文件的合并
(二)横向数据合并
(1)含义: 将磁盘上的一个SPSS数据文件中的若干个变量增加 到当前数据编辑器窗口的数据文件中。 (2)前提: a.两个数据文件必须有一个共同的变量名为关键字段 ---合并的依据; b. 两个数据文件应事先按关键字段升序排序。
(四)插入和删除一个变量
• 插入:光标定位到某列变量上 -> Data -> Insert Variable (插到某列前) 或鼠标右键 • 删除:选定列,鼠标右键Cut项
SPSS数据的编辑
(五)数据移动、复制和删除 • • • • 定义源数据块 鼠标右键:剪切、复制、 清除 确定目标单元 鼠标右键:粘贴