第二章-SPSS数据文件的建立和管理(ppt文档)
合集下载
数据文件的建立和管理PPT课件
行。
.
26
1.3.3 数据的删除
1)删除一列
用鼠标左键单击需要删除列的变量名,即可选中这 一列,然后选择“编辑”→“清除”(或单击鼠标 右键选择清除,或按Delete键),该列即被删除。
2)删除一行
用鼠标左键单击需要删除行的序号,即可选中这一 行,然后选择“编辑”→“清除”(或单击鼠标右 键选择清除,或按Delete键),该行即被删除。
.
19
标签——作用巨大,实质是变量的含义,要养成给 变量加标签的习惯。
值——对于分类变量,通常用数字代表类别,如例 子中的性别变量用1代表男,2代表女
度量标准——有三种 度量(scale,尺度数据)——数据有大小之分,并
且数值的差代表差异程度,如“年龄”、“交通事 故次数”等 序号(ordinal,顺序数据)——取值有大小之分, 但变量值仅表示顺序,差值不代表差异程度,如职 称高低,学历高低等 名义(nominal,名义数据)——变量取值没有大小 之分,如用1和2代表男和女
.
4
三、SPSS统计分析软件的特点
SPSS是世界上最早采用图形菜单驱动界面的 统计软件,其最突出的特点是操作界面友好, 输出结果美观。使用windows窗口展示出各 种管理和分析数据的功能,以对话框方式展 示出各种功能选择项。用户只要掌握一定的 windows操作技能,粗通统计分析原理,就 可以使用该软件为特定的科研工作服务,或 者进行企业级的数据分析。
SPSS的主要特点如下:
.
5
(1)操作简单(菜单、按钮、对话框)
(2)无需编程
(3)功能强大
(4)方便的数据接口
能够读取及输出多种格式的文件,如.dbf文件、.xsl文 件、.txt文件、PDF文件、word文件、Power Point 文件等。
spss2-1(文件的建立和编辑)_PPT课件
按钮完成,但应首先打开变量值标签的显示
开关: View
Variable Lable
五 数据的编辑
数据编辑功能表(Edit菜单)
命令
Undo
Redo Cut Copy Paste Clear Find
功能
删除刚输入的数据或者恢复刚修改 的数据
恢复刚撤消的操作 将选定数据剪切到剪贴板 将选定数据拷贝到剪贴板 将剪贴板的数据粘贴到指定位置 清除选定的变量和观测值
查找数据
实例
体检资料
编号 1 2 3
姓名 性别 文化程 出生 体检日 身高
度
日期 期
(cm)
李珍 女
赵小 女 英
高中 大学
பைடு நூலகம்
1966 2004年 158 年12 8月10 月8日 日
1977 2004年 155 年4月 8月12 18日 日
王清 男
初中
1953 2004年 173 年5月 8月14 6日 日
其他
Width:宽度 Decimals:小数位 Columns:变量列宽 Align:变量的对齐方式
定义的浏览
Utilities
Variables
四 数据的录入Data View
黑框框住的单元为当前数据单元
数据录入可以逐行进行,录完后按Tab 数据录入可以逐列进行,录完后按Enter
录入带有变量值标签的数据可以通过下拉
体重(kg) 疾病
55
健康
45
支气管
炎
68
心脏病
建立一个数据文件
Variable bh xm xb whcd csrq tjrq sg tz jb
Position 1 2 3 4 5 6 7 8 9
第二章SPSS数据文件的建立和管理
SPSS数据文件的特点
SPSS • 其扩展名为.sav • 是一种有结构的数据文件,由结构和内容 两部分组成 • 只能被SPSS软件打开
SPSS
结 构
SPSS
内 容
SPSS
SPSS数据的基本组织方式
• 原始数据的组织方式
• 频数数据的组织方式
原始数据的组织方式
SPSS
第二节SPSS数据的结构和定义方法 SPSS
SPSS
第五节SPSS数据的保存
• SPSS支持的数据格式 • 保存SPSS数据的基本操作
SPSS支持的数据格式
SPSS
• • • •
SPSS文件格式 Excel格式文件 Dbf格式文件 文本格式文件
扩展名
.sav
.xls
.dbf
.dat
SPSS
• 保存SPSS数据的基本操作
• 选择菜单文件
保存或另存为
SPSS
SPSS
添加 完 后 按 确 定
SPSS
得到合 并后 的数 据文 件
SPSS
横向合并数据文件
• 指将数据编辑窗口中的数据与另一个SPSS数 据文件的数据依据个案进行左右对接。 横向合并数据文件应注意:
两个数据文件必须至少有个名称相同的变量; 两个数据文件必须事先按关键变量进行了升序排序
SPSS
SPSS
第三节SPSS结构定义的应用案例
SPSS
第四节 SPSS数据的录入与编辑
• SPSS数据的录入 • SPSS数据的编辑
SPSS • • • •
SPSS数据的录入
按单元格输入数据 按变量输入数据 按个案输入数据 输入带有变量值标签的数据
SPSS数据的编辑
第二讲 创建SPSS数据文件PPT教学课件
2020/12/09
12
(五)数据文件编辑——Data菜单
Define Date Insert Variable
Insert Case Go to Case Sort Case Transpose
2020/12/09
定义、编辑日期变量或日期时间变量 插入一个变量 插入一条记录 定位到指定记录
按某变量对所有记录排序 转置数据文件
• Байду номын сангаасPSS的函数
➢ Arithmetic 算术函数 ➢ Logical 逻辑函数
➢ Statistical 统计函数
➢ Data and Time 日期和
➢ Random Variable 随机变 时间函数
量函数
➢ Missing value 缺失值
➢ Inverse Distribution 逆分 函数
2020/12/09
16
(五)数据文件编辑
• 插入/删除变量
➢ Data View ➢ Variable View
• 插入/删除记录(观测值)
➢ Data View
• 数据剪切、复制与粘贴
➢ Data View
2020/12/09
17
(五)数据文件编辑——建立新变量
• SPSS的运算符
数学运算符 关系运算符 逻辑运算符
2020/12/09
4
(二)变量——变量名
• 变量名至多8个字符
• 首字符是字母,可接字母、数字或 “? ”、“-”、“!”、“*”以外的 字符
• 最后一个字符不能是“.”和“_”
• 不能与保留字ALL、AND、BY、EQ、 GE、GT、LE、LT、NE、NOT、OR、 TO、WITH相同
第2章 数据文件的建立和管理PPT教学课件
第2章 SPSS数据文件的 建立和管理
2.1 数据文件的特点和结构 2.2 定义数据文件的结构 2.3 数据的录入与保存 2.4 数据的编辑 2.5 读取其他格式的数据文件
1
SPSS数据文件的特点
SPSS数据文件的特殊性:其扩展名是.sav; 它是一种有结构的数据文件。
SPSS数据文件由数据的结构和内容两部分组 成。其中数据的结构记录数据类型、取值说 明、数据缺失情况等必要信息,数据的内容 才是待分析的具体数据。
数据中错误或者漏填的数据。如果不特意 说明,SPSS会把缺失数据参与分析,因此 要对缺失数据进行说明。 对缺失数据进行说明的三种方法(P14):
对于漏填的数值型数据,系统默认的缺失 值用一个圆点来表示,字符型变量中的空格 或控不是系统缺失值。
11
度量尺度
定距型数据(Scale) 定序型数据(Ordinal) 定类型数据(Nominal)
14
SPSS数据的录入与保存
录入:逐行录入按Tab键,逐列输入按Enter键 (例:职工基本情况数据P49) 录入带有变量值标签的数据: View→Value Labels (单元格将显示对应的变量值标签) 数据的保存: data 保存成其他格式的文件:Save as
15
第2章 SPSS数据文件的 建立和管理
建立SPSS 数据文件应 完成两项任 务
描述SPSS数据的结 构 录入编辑SPSS数据
SPSS数据文件的结构
个案、变量、单元格、当前单元格
SPSS数据文件以二维表的形式组织数 据。一行为一个样品(CASE)或个案, 一列为一个变量(VARIABLE),行与列 交叉之处为一个单元格,可在其中输入变 量值。
9
变量值标签(Value Lable)
2.1 数据文件的特点和结构 2.2 定义数据文件的结构 2.3 数据的录入与保存 2.4 数据的编辑 2.5 读取其他格式的数据文件
1
SPSS数据文件的特点
SPSS数据文件的特殊性:其扩展名是.sav; 它是一种有结构的数据文件。
SPSS数据文件由数据的结构和内容两部分组 成。其中数据的结构记录数据类型、取值说 明、数据缺失情况等必要信息,数据的内容 才是待分析的具体数据。
数据中错误或者漏填的数据。如果不特意 说明,SPSS会把缺失数据参与分析,因此 要对缺失数据进行说明。 对缺失数据进行说明的三种方法(P14):
对于漏填的数值型数据,系统默认的缺失 值用一个圆点来表示,字符型变量中的空格 或控不是系统缺失值。
11
度量尺度
定距型数据(Scale) 定序型数据(Ordinal) 定类型数据(Nominal)
14
SPSS数据的录入与保存
录入:逐行录入按Tab键,逐列输入按Enter键 (例:职工基本情况数据P49) 录入带有变量值标签的数据: View→Value Labels (单元格将显示对应的变量值标签) 数据的保存: data 保存成其他格式的文件:Save as
15
第2章 SPSS数据文件的 建立和管理
建立SPSS 数据文件应 完成两项任 务
描述SPSS数据的结 构 录入编辑SPSS数据
SPSS数据文件的结构
个案、变量、单元格、当前单元格
SPSS数据文件以二维表的形式组织数 据。一行为一个样品(CASE)或个案, 一列为一个变量(VARIABLE),行与列 交叉之处为一个单元格,可在其中输入变 量值。
9
变量值标签(Value Lable)
第2章 SPSS数据文件的建立与管理[44页]
在录入时需要遵守相应的格式要求,其基本原则为:在数据视图窗口下, 每一行代表一个个案的所有变量的取值;每一列代表一个变量的所有取值。
2.2.1 SPSS数据的录入
第四步:在菜单栏中选择【文件(F)】→【另存为(A)】,会弹出“将数据另存为” 对话框,如图所示,在该对话框中选择保存数据文件的位置;填写数据文件的【文件 名(N)】,如“公司信息.sav”;【保存类型(T)】选择【SPSS Statistics(*.sav)】; 单击【保存(S)】按钮,则完成建立SPSS默认的数据文件。
2.使用文本向导导入文本文件
第四步:在弹出的“文本导入向导-定界,第3/6步”对话框中,需要回答以下3个问 题,第一,第一个数据个案从哪个行号开始;第二,个案的表示方式如何安排的,是一 行一个个案还是一行多个个案,通常以第一种方式安排;第三,导入全部还是部分数据 文件。从第2行开始,每一行表示一个个案,读入全部数据,如图所示,单击【下一步 (N)】按钮。
到此为止,完成了对文本文件的导入操作。接下来,可以对导入的数据进 行必要的加工或处理,并保存为SPSS格式文件。
Part 2.3
SPSS数据文件
SPSS数据合并
字段合并
横向合并(对接)
【数据】【合并文件】【添加变量】
样本合并
纵向合并(追加)
【数据】【合并文件】【添加个案】
2.3.1 字段合并
字段合并的实质是将两个数据文件按照个案对应进行左右对接,因此字段合并也叫横向合 并、变量合并。
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步:启动SPSS,在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】, 将弹出“打开数据”对话框,在该对话框中选择数据所在的路径,选择文件“招聘数 据.xlsx”,如图所示,单击【打开(O)】。
2.2.1 SPSS数据的录入
第四步:在菜单栏中选择【文件(F)】→【另存为(A)】,会弹出“将数据另存为” 对话框,如图所示,在该对话框中选择保存数据文件的位置;填写数据文件的【文件 名(N)】,如“公司信息.sav”;【保存类型(T)】选择【SPSS Statistics(*.sav)】; 单击【保存(S)】按钮,则完成建立SPSS默认的数据文件。
2.使用文本向导导入文本文件
第四步:在弹出的“文本导入向导-定界,第3/6步”对话框中,需要回答以下3个问 题,第一,第一个数据个案从哪个行号开始;第二,个案的表示方式如何安排的,是一 行一个个案还是一行多个个案,通常以第一种方式安排;第三,导入全部还是部分数据 文件。从第2行开始,每一行表示一个个案,读入全部数据,如图所示,单击【下一步 (N)】按钮。
到此为止,完成了对文本文件的导入操作。接下来,可以对导入的数据进 行必要的加工或处理,并保存为SPSS格式文件。
Part 2.3
SPSS数据文件
SPSS数据合并
字段合并
横向合并(对接)
【数据】【合并文件】【添加变量】
样本合并
纵向合并(追加)
【数据】【合并文件】【添加个案】
2.3.1 字段合并
字段合并的实质是将两个数据文件按照个案对应进行左右对接,因此字段合并也叫横向合 并、变量合并。
2.2.2导入其他类型的数据文件
1.使用Excel向导读入Excel文件
第一步:启动SPSS,在菜单栏中选择【文件(F)】→【导入数据(D)】→【Excel】, 将弹出“打开数据”对话框,在该对话框中选择数据所在的路径,选择文件“招聘数 据.xlsx”,如图所示,单击【打开(O)】。
第章SPSS基本操作与数据管理PPT课件
(3)日期型:
按特定格式存储日期数据 ,一般使用较少
2020格/1/1式0 很多,如:20-AUG-1999
5
2.SPSS变量的类型和显示宽度 对不同的对象其取值发生变化的量称为变量。有3种类型 (1)数值型: 数据型变量一般由数字、分隔符和一些特殊符号(如美元符号)构成, 有6种形式。 • 标准数值型:默认类型 8.2
(6)系统状态栏
该栏显示当前的系统操作,用户可以通过该栏了解SPSS当前的 工作状态。
2020/1/10
4
2.1.2 常量、变量、操作符和表达 式 一、 常量与变量
1.SPSS常量
SPSS中的常量在一定阶段内其取值不随观测而改变的值。有3种类型
(1)数值型:
数据型常量是一个数值。他有两种书写方式:
(2)菜单栏
菜单栏,包括 “文件”、“编辑”、“视图”、“数据”、 “转换”、“分析”、“图形”、“实用程序”、“附加内容”、 “窗口”和“帮助” 菜单,这些菜单可以实现编辑数据与变量、定 义系统参数、设计显示方式、绘制图形、进行各项数据分析和查阅 帮助等(3功)数能据。单元格信息显示栏
该显示栏用于显示单元格位置和单元格的内容等信息。灰色显 示的区域为提示区,显示单元格的位置,空白区域为数据编辑器, 该区域内显示当前选中的单元格的内容,用户可以在该区域输入或 修改相应的内容。
格式很多,如:$12.30
• 自定义货币型:用户可以创建5种自定义数据显示CCD和CCE,
2020/1/这10 只是5种命名,用户可以自行设定这5种类型。
6
(2)字符型: 字符型编变量由字符串组成,可以包含数字、字母和一些特殊符号。字符型变 量的默认长度为8,大于8个字符的称为长字符型变量,少于8个字符的称为短字 符型变量,字符型变量最长为32767个字符。他不能参与运算,区分大小写字 母。 (3)日期型: 日期型变量用于表示日期和时间,他有29种不同的日期和时间格式,不能参与运算, 要参与必须通过日期函数进行转换。
第2章:SPSS 数据文件的建立和管理
(3) 定类数据(Nominal)
定类数据只能互相区别,不能进行排序,可以用数值或
字母表示。 例如性别可以用男、女表示;民族可以用汉、回、满等
表示,它们可以和数值、字母表示,无法进行排序。
(4) 变量之间的关系与设置
定距变量包含定序变量包含定类变量。
根据分析的需要,可以将变量定义成相应的尺度。计量
建立数据集例:姓名,字符型;生日,日期型;学历,
数值(0中学,1大学,2研究生);工资x,数值。
2.数据宽度
每种数据的类型都有数据宽度和列宽,数据宽度为存储
变量值的最大位数。需要注意的是对于数值型变量,录入数
据的宽度可以大于设置好的宽度,但对于字符型变量却不是 这样。对于字符型变量,你设置几位数,它就显示几位数。
计量尺度:定序变量 列宽: 标签值: 1 小学 2 中学 3 大学 4 研究生 a5. 存款金额 计量尺度:定距变量 列宽: 8 2 显示位置:居中
3) 凡是可以用数值1、2、3表示的变量定义成数值型,
将更有利于数据分析。
4) 不同的数据根据其实际的意义与取值定义计量尺度。
5) 变量标签的作用主要用于变量的解释说明。
5.缺失数据
(1) 数据缺失在数据处理过程中不可避免
在数据分析的过程中,有时某一项数据是空的,没有填; 有时有的数据明显是错误的,例如误将年龄的20岁填成了200 岁。这两种情况在数据处理中是经常遇到的。
(2) 缺失值的种类
SPSS的缺失值有两类:系统缺失值和用户缺失值。
称没有数据的单元格为系统缺失值,用点儿“.”表示;
尺度在变量定义窗口完成。 演示:姓名,定类;学历,定序;工资,定距。
SPSS应用案例
银行为了发展储户,扩大业务范围和业务量,委托咨询 公司对本企业的发展进行评估,设计了居民储蓄调查问卷.
第2章SPSS数据文件的建立和管理
满足条件的第一个数据单元,并设置它为当 前数据单元,定位(dìngwèi)条件可是某个 case的号码,也可以是某个变量的变量值 (1)按case号码定位(dìngwèi) [编辑]—[转至个案]
精品资料
(2)按变量值自动定位 将当前单元定位在某变量列的任何一条case上; [编辑(biānjí)]—[查找]
精品资料
4.圆点型(Dot) 整数部分从个位开始每3位以一个圆点分隔
,以逗号作为整数和小数部分的分隔符。 1.234,56 5.美元符号型(Dollar) 表示货币数据,在数据前自动加美元符号$ ,格式可以用户自己选择(xuǎnzé)。 (二)字符型(String) 由一串字符串组成,区分大小写。
(三)日期型
表示日期或时间,格式用户自行选择 (xuǎnzé)
精品资料
三、变量名标签Label 是对变量名的进一步解释说明,增强变量名的可
视性和统计结果的可读性。可省略(shěnglüè) 四、变量值标签Values 对变量取值含义的解释说明信息,对于定类数据
和定序数据尤为重要。
精品资料
精品资料
(二)插入和删除一个case 在某个case前插入一个新case 1.[编辑]—[插入个案] 在当前case前插入一空行 2.在欲插入的case号码上点右键,选择”插入
个案” 3.删除一个case 在欲删除的case号码上点左键,待删除的
case数据全部黄色显示(xiǎnshì);点右键, 从弹出的菜单中选择[剪切]或[清除]
被合并的数据文件名 3.两个(liǎnɡ ɡè)待合并的文件中的所有变量都显示
在[新的活动数据集]框中 4.如果两个(liǎnɡ ɡè)待合并的文件中的case是按顺
序一一对应的,直接按OK 5.共有变量名会显示在[已排除的变量]框中,选择
精品资料
(2)按变量值自动定位 将当前单元定位在某变量列的任何一条case上; [编辑(biānjí)]—[查找]
精品资料
4.圆点型(Dot) 整数部分从个位开始每3位以一个圆点分隔
,以逗号作为整数和小数部分的分隔符。 1.234,56 5.美元符号型(Dollar) 表示货币数据,在数据前自动加美元符号$ ,格式可以用户自己选择(xuǎnzé)。 (二)字符型(String) 由一串字符串组成,区分大小写。
(三)日期型
表示日期或时间,格式用户自行选择 (xuǎnzé)
精品资料
三、变量名标签Label 是对变量名的进一步解释说明,增强变量名的可
视性和统计结果的可读性。可省略(shěnglüè) 四、变量值标签Values 对变量取值含义的解释说明信息,对于定类数据
和定序数据尤为重要。
精品资料
精品资料
(二)插入和删除一个case 在某个case前插入一个新case 1.[编辑]—[插入个案] 在当前case前插入一空行 2.在欲插入的case号码上点右键,选择”插入
个案” 3.删除一个case 在欲删除的case号码上点左键,待删除的
case数据全部黄色显示(xiǎnshì);点右键, 从弹出的菜单中选择[剪切]或[清除]
被合并的数据文件名 3.两个(liǎnɡ ɡè)待合并的文件中的所有变量都显示
在[新的活动数据集]框中 4.如果两个(liǎnɡ ɡè)待合并的文件中的case是按顺
序一一对应的,直接按OK 5.共有变量名会显示在[已排除的变量]框中,选择
第2讲:SPSS数据文件的建立和管理
2.6 SPSS数据文件合并
SPSS中合并数据文件是指将一个(或多个)已存储在磁 盘上的SPSS数据文件分别依次与SPSS数据编辑窗口中的数据合 并。因此,实现两个或多个SPSS数据文件合并,应首先将其中 的某个数据文件读入(打开)到数据编辑窗口中,然后依次与 其他数据文件合并。
SPSS提供了两种合并数据文件的方式,分别是纵向合并 (追加案例)和横向合并(追加变量)
E表示以10为底,+2表示正的2次方。—02表示负的2次 方。如0.05表示为5.0E—02
3. Comma逗号型
逗号的数值型,即整数部分每3位数加一逗号,其余定义 方式同数值型。在输入数据时,可以不输入逗号,SPSS将在相 应的位置上添加逗号。
4.Dot .圆点型
3位加点数值型,无论数值大小,均以整数形式显示,每 位加一小点(但不是小数点),可定义小数位置,但都显示0, 且小数点用逗号表示。如1.2345显示为 12.345,00(实际是 12345E-4).
5. Dollar 美元符号型
用户可从系统提供的显示形式(如,$####,$#####) 中选择自己需要的,并定义数值宽度和小数位数,显示形式为 数值前有$。
2.2.3 变量名标签
变量名标签(label)是对变量名含义的进一步解释说明, 它可增强变量名的可视性和统计分析结果的可读性。在SPSS数 据编辑窗口的变量列表视图中,在【标签(label)】列下相应 行的位置输入变量名标签即可。
1.标准型(数值,Numeric)
Numeric:数值型,同时定义数值的宽度(Width),即 整数部分+小数点+小数部分的位数,默认为8位;定义小数位 数(Decimal Places),默认为2位。
第2章SPSS数据文件的建立和管理
8
8
2
2
带圆点的数值或 科学记数法
科学记数法 标准格式或 日期格式非常多
逗点做小数点,原点 做三位分割符的数值
科学记数法 显示格式非常多 有效数值前带$以逗点 为分割符
13141567
123456
8
2
可带$或不带$输 入或科学记数法
12343
$12343
Custom Currency String 8 无 一串字符串 一串字符串 believe believe
SPSS
6、宽度与列
• • 宽度与列 宽度指的是变量宽度,是变量值可表示的 最大位数。对于字符型变量,宽度决定了 输入字符串的长度。 列指的是该变量在数据编辑窗口中的显示 位数。
•
SPSS
7、度量标准
统计分析数据的测度方法大致可分为定距度量和非 定距度量对应的数据,即为定距数据和非定距数据。 定距数据(Scale)是指连续性的数据(如年收入,绩 效评分等)。非定距数据包括顺序尺度(Ordinal)和 名义尺度(Nominal).
*.syd 格式的 Systat 数据文件 *.sys 格式的 Systat 数据文件 SPSS 便携格式的数据文件 以逗号作为分隔符的纯文本文件
EXCEL 数据文件(从 97版~ 2003版) EXCEL 数据文件(从 07版~ 2010版) Lotus 数据文件 SYLK 数据文件 Sas各版
dBase(*.dbf)
数据统计分析系统
——IBM SPSS Statistics 20
叶丽萍 计算机科学系
第2章 SPSS数据文件的 建立和管理
SPSS
本章主要内容
• • • • • SPSS数据文件的结构 数据文件的新建、保存和打开 数据文件的编辑 数据文件的合并与拆分 外部数据的获取
SPSS数据文件的建立和预处理PPT课件
A、变量名(name):
变量名的字符个数不多于8个;
首字符应以英文字母开头,后面可以跟除了!? *之外的字母或数字。下划线、圆点不能为变量 名的最后一个字符
变量名不区分大小写字母
SPSS有默认的变量名,以‘VAR’开题,后面 补足5位数字。如:VAR00001等。
2020/1/11
2020/1/11
可编辑
21
C、变量宽度(width):变量可显示的最大字符位
数
D、小数位数(decimals)
E、变量名标签(label):对变量名含义的进一步解
释说明,可增强变量名的可视性和统计结果的可读性。
2020/1/11
可编辑
22
F、变量值标签(value)
• SPSS变量的数据类型大多应定 义为数值型,这样有利于以后的 数据分析;
6
窗口主菜单4: Data数据的操作和管理操作菜 单
• 对数据编辑窗口中的数据进行加工整理,如:数据的排序、转置、
2020选/1/取11 、分类汇总、加权等
可编辑
7
窗口主菜单5: Transform数据基本处理操作菜 单
• 对数据编辑窗口中的数据进行基本处理,如:生成新变量、计数、
2020分/1/组11 等。
定义SPSS数据的结构 录入和修改SPSS数据
统计分析SPSS数据
解释SPSS分析结果
2020/1/11
可编辑
15
2.SPSS数据文件的建立
建立方式之一:直接录入。即利用SPSS数据编 辑窗口定义SPSS数据的结构并输入数据。
建立方式之二:其他数据格式导入方式。即直 接读取其他格式的数据文件并将其转为SPSS格 式数据
第2章SPSS数据文件的建立和管理(上机2)-PPT精品文档
第二章 SPSS数据文件的 建立和管理(上机2)
上机作业
1、实践SPSS数据文件的管理。 2、你的工作中数据存放在什么格式的文件中?SPSS 可以直接打开这些数据文件吗?如果不能直接打开, 是否能经过转换形成SPSS格式的数据文件? 3、现有两个SPSS数据文件,分别命名为“职工数 据.sav”和“追加职工.sav”,现将这两份数据合并在一 起。 4、现有两个SPSS数据文件,分别命名为“学生成绩 一.sav”和“学生成绩二.sav”,存放了关于学生学号、 性别和若干门课程成绩的数据。请将这两个数据文件 以学号为关键变量进行横向合并,形成一个完整的数 据文件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
教授(1)
0
15
8
副教授(2)
10
20
1
讲师(3)
20
10
1
助教(4)
35
2
0
频数数据举例
2-2 数据文件的结构和定义方法
SPSS数据的结构是对SPSS每列变量及其相关属性的描述, 它的定义是通过数据编辑窗口中的变量视图实现的。
一、变量名 二、数据类型 三、变量名标签 四、变量值标签 五、缺失数据 六、计量尺度
一、变量名(Name)
变量名是变量存取的惟一标志。在定义SPSS数据文件结构 时应首先给出每列变量的变量名。为了方便记忆,变量名最好 与代表的数据含义相对应。
变量名一般的起名规则: 1、变量名的字符个数不多于8个;变量名不区分大小写字 母。允许汉字作为变量名,汉字总数不能超过4个;
2、首字符应以英文字母开头,后面可以跟除了!,?,*之 外的字母或数字。下划线、圆点不能为变量名的最后一个字母;
3、变量名不能与SPSS内部特有的具有特定含义的保留字 相同,如ALL,BY,NOT,OR等;SPSS有默认的变量名,它 以字母“VAR”开头,后面补足5位数字,如VAR00001, VAR00012等。
二、数据的类型、宽度、小数位数 Type、 Width、Decimals
数据类型是指每个变量取值的类型。SPSS中有三种基本数 据类型,分别为数值型、字符型和日期型。相应的类型会有 默认的列宽或小数位数等。
3、日期型(Date) 日期型用来表示日期或者时间数据,如生日、成立日期 等变量可以定义为日期型。
三、变量名标签(Label)
1、 变量名标签是对变量名含义的进一步解释说明,它 可增强变量名的可视性和统计分析结果的可读性。
2、变量名标签可用中文,总长度可达120字符,但在统 计分析结果的显示中,一般不可能显示如此长的变量名标 签信息。
(5)美元符号型(Dollar)
SPSS变量 默认 小数
类型
长度 位数
显示方式
标准型
8
Numeric
科学记数法型 8
Scientific Notation
逗号型
8
Comma
圆点型
8
Dot
美元符号型 8 Dollar
字符型
8
String
日期型
Date
2 标准格式数值变量,圆点表示小数点数值
2
科学记数法
五、缺失数据(Missing)
数据中明显错误或明显不合理的数据以及漏填的数据都可看 做缺失数据。
例,在某项客户满意度的问卷调查数据中,某个被调查者 的年龄是213岁。这个数据显然是一个不符合实际情况的失真 数据。
例,在某项客户满意度的问卷调查数据中,某个被调查者的 年收入没有填,是空缺的。
SPSS中说明缺失数据的基本方法是指定用户缺失值。在SPSS中处理的方 式是:首先,在遗漏的数据处填入某个特定的标记数据,例,将遗漏的年收 入数据用特定的标记数据(如9999999)来替代;然后,再指明这个特定的 标记数据(如9999999)或那些明显的失真的数据(如213)等为用户缺失值 。这样,在进行统计分析时,SPSS就能将这些用户缺失值与正常的数据区 分开来,并依据用户选择的处理策略对其进行处理或分析等。
第二章
SPSS数据文件 --建立与管理
2-1 SPSS数据文件
一、SPSS数据文件的特点
1、SPSS数据文件的扩展名是.sav; 2、SPSS数据文件是一种有结构的数据文件。(结构+内容)
二、SPSS数据的基本组织方式 1、原始数据的组织方式 如果待分析的数据是一些原始的调查问卷数据,或是一些
基本的统计指标,那么这些数据就可按原始数据的方式组织 。
打开住房状况调查:桌面->培训->住房状况调查
一行为一个个案
一列为一个变量
二、计数数据的组织方式
有时所采集的数据不是原始的调查问卷数据,而是经过分 组汇总后的计数数据。
在研究职称和年龄的关系时汇总得到如表所示的数据。其 中职称的分组值分别为1~4,年龄段的分组值为1~3。
职称
年龄段 35岁以下(1) 36~49岁(2) 50岁以上(3)
2 圆点做小数点,逗点做三位分隔符的数值
2 逗点做小数点,圆点做三位分隔符的数值
2
ቤተ መጻሕፍቲ ባይዱ
有效数值前带$,以逗点为分隔符
无
一串字符
dd-mmm-yyyy、mm/dd/yyyy 等
2、字符型(String) 字符型也是SPSS较常用的数据类型,由一串字符串组成。如 职工号码、姓名、地址等变量都可以定义为字符型数据。
1、数值型 数值型是SPSS最常用的数据类型,通常由阿拉伯数字(0 ~9)和其他特殊符号(如美元符号、逗号、圆点)等组成 。SPSS中数值型有以下五种不同的标识方法: (1)标准型(Numeric)
(2)科学记数法型(Scientific Notation)
(3)逗号型(Comma) (4)圆点型(Dot)
定距型数据(Scale):通常是指诸如年龄、身高、体重、 血压等连续数值型数据,也包括“人数”、“商品件数”等离 散数值型数据;
定序型数据(Ordinal):具有内在固有大小或高低顺序, 一般可以用数值或字符表示,它取值的大小能够表示观测对象 的某种顺序关系(等级、方位或大小等),但是相邻级别之间 的差距是不相等。例如,职称变量可以有低级、中级、高级三 个取值,可分别用1,2,3表示。年龄段变量可以有老、中、青三 个取值,分别用A、B、C表示等。
3、变量名标签这个属性是可以省略的,但建议最好给出 变量名的标签。
四、变量值标签(Values)
变量值标签是对变量取值含义的解释说明信息,对于定 类型和定序型数据尤为总要。
例,用数值1表示男, 用数值2表示女。
可见,变量值标签对于定序数据(如收入的高、中、低) 和定类数据(如民族、性别)来说是必不可少的,它不但明确 了数据的含义,也增强了最后统计分析结果的可读性。变量值 标签可以用中文。
SPSS用户缺失值是: ★ 对字符型或数值型变量,用户缺失值可以是1~3个特
定的离散值。 ★ 对一个数值型变量,用户缺失值可以在一个连续的闭
区间内并同时附加一个区间以外的离散值。
SPSS系统缺失值: 是用一个圆点表示,它 不等于0或.00,通常出现 在数值型变量数据中。
六、计量尺度(Measure)
定类型数据(Nominal):是指没有内在固有大小或高低顺 序,而只是一种名义上的指代,一般以数值或字符表示的分类 数据。如性别变量中的男、女取值,可以分别用1,2表示。民 族变量中的各个民族,可以分别用汉、回、满等字符表示。