2013数据分析方法(SPSS入门)-1

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7
• 2.1.2 SPSS软件的安装和启动
• 安装: SPSS for Windows安装的基本步骤 与其他常用软件是基本相同的。 • 启动: 开始程序SPSS for Windows
8
2.1.3 SPSS的基本操作环境 菜单栏
标题栏 工 具 栏
数据显示区: 变量名 观察序号
数 据 编 辑 区
性,2代表女性,它不但明确了数据的含义,
也增强了最后统计分析结果的可读性,变
量值标签可以用中文。
29
鼠标单击再单击右边的省略号 弹出值标签定义窗口逐个添加
30
5) 缺失数据(Missing values)
• 数据中存在明显错误或明显不合理的数据 或漏填数据项时统计学上称为不完全数据 或缺失数据。 • 数据中如果存在缺失数据,分析时通常不 能直接采用,要进行说明。
• 学习软件的最好方式是多练多用.
• 用统计软件容易得到漂亮的数据结果,但其 中充满了危险的陷阱.
3
• 计算机无法识别你的统计方面的错误. 错误的方法、错误的数据形式都必然输 出错误的结果. 结果虽然看上去很漂亮 ,但有时得到的却是大量垃圾. • 因此,使用统计软件时,要了解相关的 统计理论方法,及其使用的前提条件和 适用性,根据实际研究问题选用准确的 4 方法.
41
保存为SPSS格式时
42
将数据保存为Excel文件格式时,将变量名写入表格Write variables names to spreadsheet选项呈可用状态,它的作用 是指定是否将SPSS变量名写入Excel工作表的第一行上。
43
2.2.5 读取其它格式的数据文件
• 直接读入其它格式的数据文件 • 使用文本向导读入文本文件(自学) • 使用数据库向导读入数据 (自学)
23
定义时直接 录入即可
1) 变量名(Variable name)
变量名是变量访问和分析的唯一标志。 在定义 SPSS 数据结构时应首先给出每列变 量的变量名。变量的命名规则如下:
1. 以前版本的首字符应以英文字母开头, 20 版本的可以直接是汉字开头。后面可以跟 除了!、?、*之外的字母或数字。下划线、 圆点不能为变量名的最后一个字符。 SPSS 允许用汉字作为变量名。 24
11
• SPSS数据的加工整理阶段。该阶段主要对 数据编辑窗口中的数据进行必要的预处理, 如数据分组、排序、分类汇总、数据计算、 变量转化、缺失值的补漏、观测值选择等。 • SPSS数据的分析阶段。该阶段选择正确的 分析方法,对数据编辑窗口中的数据进行 统计分析、建模和预测。
12
• SPSS分析结果的说明和解释。该阶段的任 务是读懂SPSS输出窗口中的分析结果,明 确其统计含义,并结合应用背景知识作出 切合实际的合理解释。在学术研究中,还 需要对结果的含义加以衍生。 • 数据和分析结果的保存。
SPSS数据的定位 插入和删除一条个案 插入和删除一个变量 数据的移动、复制和删除
38
查找
39
2.2.4 SPSS数据的保存
SPSS支持的数据格式
• 1、SPSS文件格式,扩展名为.sav
2、Excel格式文件,扩展名为.xls 3、dbf格式文件,扩展名为.dbf 4、文本格式文件,扩Hale Waihona Puke Baidu名为.dat
2.1 SPSS简介
1. SPSS的发展历程 2. SPSS20版本的安装与启动 3. SPSS的基本操作环境(重点) 4. 利用SPSS进行数据分析的步骤
2014-4-24
5
2.1.1 SPSS的发展历程
• SPSS-----Statistical Package for Social Science (社会科学统计软件包)现改名 为 Statistical Product and Service Solutions(统计产品与服务解决方案) • 20世纪60年代末,美国斯坦福大学的三位 研究生研制开发了最早的统计分析软件 SPSS,同时成立了SPSS 公司
44
1) 直接读入其它格式的数据文件
SPSS现在可以直接读入许多格式的数据 文件,其中就包括EXCEL各个版本的数 据文件。选择菜单文件File打开Open 数据Data ;或直接单击快捷工具栏上的 Open File按钮,系统就会弹出Open File 对话框,单击“文件类型”列表框,在里 面能看到直接打开的数据文件格式。
状态栏
一、数据编辑窗口(.SAV)
9
窗口主菜单
工具栏
目 录 区
内 容 区
二、SPSS结果输出窗口(.SPV)
10
2.1.4 利用SPSS进行数据分析的步骤
• 建立SPSS数据文件。在该阶段按照研究的 要求,利用SPSS提供的功能建立SPSS数据 文件。其中包括在数据编辑窗口定义SPSS 数据文件的结构,录入和修改SPSS数据等, 当然也可以从其它可转换的数据文件中读 取数据资料。
31
SPSS用户缺失值定义窗口
鼠标单击再单击右边的省略号 弹出缺失值定义窗口逐个添加
32
6) 变量对齐格式(Align)
• 定义显示对齐方式,对齐方式分为右对齐、 左对齐和中间对齐; • 系统中,数值型变量默认为右对齐,字符 型变量默认为左对齐。
33
7) 度量标准(Measure)
统计学依据数据的度量尺度将数据划分 为三大类: • 名义(Nominal)—分类数据,如民族、宗教 信仰、性别、党派; • 序号(Ordinal)—顺序数据,如职称、职务、 对某事物的赞同程度; • 度量(Scale)—数值型数据,如身高、体重。
• 变量名标签是对变量名含义的进一步解释说
明,它可以增强变量名的可视性和统计分析
结果的可读性。
• 变量名标签可用中文,总长度可达 120 个字
符,但在统计分析结果的显示中一般不能显
示如此长的变量名标签信息。
28
4) 变量值标签(Value label)
变量值标签是对变量取值含义的解释 说明信息,对于品质型数据(定性数据包括 分类和顺序数据)尤为重要,比如1代表男
16
数据 结构
数据 内容
17
基于上述特点,建立SPSS数据文
件时应完成两项任务:
• 描述SPSS数据的结构(变量视图) • 录入编辑SPSS数据的内容(数据视图)
18
SPSS数据的组织方式
(1) 原始数据的组织方式
直接的问 卷数据
• 数据编辑窗口中的一行称为一个个案或记 录(Case),所有个案组成SPSS数据文件 的内容。数据编辑窗口的一列称为一个变 量(Variable),每个变量都有一个名字, 称为变量名,它是访问和分析SPSS每个变 量的唯一标志。 SPSS数据文件的结构就是 对每个变量及相关特征的描述。
2.变量名的字符个数最好不多于8个;变量 名不区分大小写字母。 3. SPSS有默认的变量名,以字母“VAR”开 头,后面补足5位数字,如VAR00001, VAR00012等。变量名不能与SPSS内部特有 的具有特定含义的保留字同名,如ALL, BY,AND,NOT,OR等。 4.变量名最好与其代表的数据含义相对应, 每个变量名必须具有唯一性。
45
SPSS(*.sav) SPSS/PC+(*.sys) Systat(*.syd) Systat(*.sys) SPSS portable(*.por) EXCEL(*.xls) Lotus(*.w*) SYLK(*.slk) dBase(*.dbf) Text(*.txt) data(*.dat)
SPSS数据文件(6.0~10.0版) SPSS 4.0版数据文件 *.syd格式的Systat数据文件 *.sys格式的Systat数据文件 SPSS便携格式的数据文件 EXCEL数据文件(从5.0版~2000版) Lotus数据文件 SYLK数据文件 dBase系列数据文件,(从dBase II~IV) 纯文本格式的数据文件 纯文本格式的数据文件
35
36
SPSS数据文件的建立--练习
• 把Excel格式的居民储蓄调查问卷数据 导入到SPSS软件中,再定义各变量的
属性,最后对照SPSS格式的文件进行
检查。
37
2.2.3 SPSS数据的录入、编辑(自学)
• SPSS数据的录入 (与Excel类似,自学) • SPSS数据的编辑 (与Excel类似,自学)
40
保存数据的基本操作
文件File保存Save,对于新的:提示文 件名和类型;对于旧的,覆盖原来的,不 再提问; 文件File另存为Save As,另存一个数据 文件,也有格式(类型)问题; 变量Variable按钮允许用户指定保存哪些 变量,不保存哪些变量,变量名前画叉的 变量将被保存到磁盘中。
25
2) 数据类型(Type)
26
2) 变量宽度(Width)、显示宽度 (Columns)
每种类型的变量都有自己的变量宽度、小
数位和显示宽度,其中变量宽度是变量允 许的最大字符位数,列宽度是数据编辑窗 口中显示每列的字符位数。通常这两个宽 度是一致的。
27
定义时直接 录入即可
3) 变量名标签(Variable label)
34
• 通常建立SPSS数据文件时应首先定义 数据的结构部分,然后再输入数据, 但实际应用中,边录入、边分析、边 修改数据结构的情况也是常见的。数 据的结构定义完成之后,可以在变量 视图(Variable View)卡片中浏览,也可 以通过菜单选项实用程序(Utilities) 变量 (Variable)来实现。
频数数据的组织方式—SPSS格式
职称 年龄段 人数
1
1 1 2 2
1
2 3 1 2
0
15 8 10 20
2
3 3 3 4 4 4
3
1 2 3 1 2 3
2
20 10 1 35 2 0
21
2.2.2 定义变量属性
• 变量名(Name) • 数据类型(Type)、宽度 (Width) 、列宽度 (Columns)-重点 • 变量名标签(Label) • 变量值标签(Values) -重点 • 缺失数据(Missing) • 变量对齐格式(Align) • 度量标准(Measure) -重点 22
6
• 1975 年在芝加哥组建了SPSS 总部 • 1984年开发了DOS操作系统下的PC+1.0版本 • 1992年的DOS版升级为Windows版本,即最 初的4.0版 • 1999年升级到10.0版、2001年升级为11 .0版 、 2003年 Windows操作平台下版本为12.0; 目前已开发20.0
19
(2)频数数据的组织方式
例:
职称 年龄段
分组汇总 后的数据
35岁以下(1) 36-49岁(2) 50岁以上(3) 教授(1) 副教授(2) 讲师(3) 助教(4) 0 10 20 35 15 20 10 2 8 2 1 0
频数数据的组织方式中: 一行为变量的一个分组(或多 个变量交叉分组下的一个分组),所有行囊括了该变量 的所有分组情况,一列仍为一个变量,代表某个问题 (或某个方面)及频数。 20
2014-4-24 15
2.2.1 SPSS数据文件的特点
• SPSS的数据文件扩展名是.sav;
• SPSS数据文件是一种有结构的数据文件, 它由数据结构和内容两部分组成,其中的 数据结构记录数据变量的名称、类型、变 量宽度、小数位数、变量名标签、变量值 标签、缺失值、显示宽度、对齐方式和度 量尺度等必要信息,数据的内容才是那些 待分析的具体数据。
46
注:读入Excel文件时,SPSS默认将 Excel工作表中的全部数据读到SPSS数据编 辑窗口,但也可以指定仅读取工作表中某个 区域内的数据(如A5:B10)。工作表上的 一行数据为SPSS中的一个个案。 如果Excel工作表文件第一行或指定读取 区域内的第一行存储了变量名信息,则应选 择读取变量名Read variable names项,即以 第一行的文字信息作为SPSS的变量名,否 则不选。
数据分析方法及软件应用
授课教师:杨小宝 副教授 北京交通大学 2013.09
1
SPSS入门--1
2.1 SPSS简介
2.2 SPSS数据的管理 2.3 SPSS数据的预处理
2014-4-24
2
• 统计软件的种类很多。只要学会使用一种“ 傻瓜式”软件或编程软件,使用其他类似的 软件也不会困难, 最多看看帮助和说明即可.
13
2.1 总结
1. SPSS20版本的安装(前提) 2. 熟悉数据编辑窗口和结果输出窗口的 基本操作环境(重点)
3. 了解利用SPSS进行了数据分析的步骤
14
2.2 SPSS数据的管理
1. SPSS数据文件的特点 2. 定义变量属性(重点) 3. SPSS数据的录入、编辑(自学) 4. SPSS数据的保存 5. 读取其他格式的数据文件(重点) 6. SPSS数据文件的合并(自学)
相关文档
最新文档