统计分析与SPSS的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计分析与SPSS的应用
第1章SPSS统计分析软件概述
常用的统计软件:SAS、SPSS、TSP、STATISTICA、EViews、MINITAB、Excel等。
1.1 SPSS使用基础
数据编辑窗口是SPSS的主程序窗口,在软件启动时自动打开,并一直保持打开状态直到退出SPSS。在运行时只能打开一个数据编辑窗口,它是由数据视图和变量视图组成的。
主要功能是:定义数据结构、录入编辑和管理待分析的数据。
结果输出窗口,主要功能是显示管理SPSS统计分析结果、报表和图形,与数据编辑窗口不同的是:结果输出窗口允许同时创建和打开多个窗口,目的是将同一批数据的不同分析结果指定输出到不同的输出窗口。
1.2 SPSS的基本运行方式
SPSS的三种基本运行方式是:完全窗口菜单运行方式、程序运行方式、混合运行方式。
完全窗口菜单运行方式:所有的分析操作通过菜单、按钮、输入对话框等方式完成。
适合一般的统计分析人员和SPSS初学者。
程序运行方式:首先根据分析需要,将数据分析的步骤手工编写成SPSS命令程序,
然后将编写好的程序一次性提交给计算机执行。
适合大规模的统计分析工作。
混合运行方式:完全窗口菜单运行方式和程序运行方式的综合。
1.3 利用SPSS进行数据分析的基本步骤
一、数据分析的基本步骤
1、明确数据分析的目标
2、正确收集数据
3、加工整理数据
4、选择恰当的统计分析方法进行探索分析
5、读懂统计分析结果
二、利用SPSS进行数据分析的一般步骤
1、SPSS数据的准备阶段
在数据编辑窗口中定义SPSS数据的结构,录入和修改SPSS数据等。
2、SPSS数据的加工整理阶段
对数据编辑窗口中的数据进行必要的预处理。
3、SPSS数据的分析阶段
选择正确的统计分析方法,对数据编辑窗口中的数据进行分析建模。
4、SPSS分析结果的阅读和解释阶段
读懂SPSS结果输出窗口中的分析结果,明确其统计含义,并结合应用背景知识做出切合实际的合理解释。
第2章SPSS数据文件的建立和管理
2.1 SPSS数据文件
一、SPSS数据文件的特点
有结构也有内容,只能在SPSS软件中才能打开。
建立SPSS数据文件应该完成两项任务,第一,描述SPSS数据的结构;
第二,录入编辑SPSS的数据内容。
二、SPSS数据的基本组织方式
原始数据的组织方式:原始的调查问卷数据,或是一些基本的统计指标。
行:个案;列:变量
计数数据的组织方式:经过分组汇总后的计数数据(行:变量的一个分组)
2.2 SPSS数据的结构和定义方法
一、变量名
变量访问和分析的唯一标识,在定义变量名时,字符个数不多于8个,首字符应以英文字母开头,不能含有:“! ?*”,下划线、圆点不能作为变量名的最后一个字母,不区分大小写字母,不能与内部特定符号相同。
二、数据类型、列宽、小数位宽
1、数值型
2、字符型
3、日期型
三、变量名标签
总长度可达120个字符,可增加变量名的可视性和统计分析结果的可读性。
四、变量值标签
对定序型数据和定类型数据是必不可少的。
五、缺失数据
数据中明显错误或明显不合理的数据以及漏填的数据都可以看出缺失数据。
注意:字符型变量中的空格或空不是系统缺失值。
六、计量尺度
三类:定距型数据、定序型数据、定类型数据。
2.3 SPSS数据的录入与编辑2.4 SPSS数据的保存2.5读取其他格式的数据文件
一、SPSS支持的数据格式:SPSS文件格式(sav)、Excel文件格式(xls)、dbase数据文件
格式(dbf)、文本格式文件等。SAS文件格式(sas7bdat)二、扩展名:sav:SPSS数据文件;spo:SPSS结果文件;sps:SPSS语句程序文件
2.6 SPSS数据文件合并
一、纵向合并【Data】→【Merge File】→【Add Cases】
将数据编辑窗口中的数据与另一个SPSS数据文件中的数据文件中的数据进行首尾对接,在不同数据文件中数据含义相同的数据项最好起相同的变量名,含义不同的最好不要同名,否则会出差错。
二、横向合并【Data】→【Merge File】→【Add Variables】
将数据编辑窗口中的数据与另一个SPSS数据文件中的数据文件中的数据进行左右对接,两个数据文件应该至少要有一个名称相同的变量作为关键变量;两个文件都必须事先按照关键变量进行升序排序。
第3章SPSS数据的预处理
预处理的功能有:数据的排序、变量计算、数据选取、计数、分类汇总、数组分组其他功能:数据转置、加权处理、数据拆分、SPSS变量集
数据的预加工处理是服务于数据分析和建模的,需要解决的问题有:
1、缺失值和异常数据的处理
2、数据的转换处理
3、数据抽样
4、选取变量
3.1 数据的排序
【Data】→【Sort Cases】
数据排序在数据分析过程中有很重要的作用:
1、便于数据的浏览,有助于了解数据的取值状况、缺失值数量的多少等。
2、快捷找到数据的最大值和最小值,计算全距,初步把握和比较数据离散程度。
3、快捷地发现数据的异常值,为进一步明确它们是否对分析产生重要影响提供帮助。
注意:1、数据的排序不是只对某一列变量排序,而是整行数据排序,排序之后,原有的数据次序必然被打乱。
2、多重排序中指定排序变量的次序很关键,先指定的变量优于后指定变量。
3.2 变量计算
【Transform】→【Compute】
一、算术表达式
由常量、变量、算术运算符、圆括号、函数等组成的式子。
运算的先后顺序:先计算乘方,再计算乘除,最后计算加减。在同级运算中,按从左到右的顺序进行计算,通过圆括号改变原有的计算顺序。
二、条件表达式
1、简单条件表达式
关系运算符、常量、变量以及算术表达式等组成。
2、复合表达式(逻辑表达式)
逻辑运算符、圆括号、简单条件表达式
三、S PSS函数
算术函数、统计函数、分布函数、逻辑函数、字符函数、缺失值函数、日期函数和其他函数。
3.3 数据选取
【Data】→【Select cases】
1、按指定条件选取
2、随机选取(近似选取和精确选取)
3、选取某一区域内的样本
4、通过过来变量选取
3.4 计数:【Transform】→【Count】
3.5 分类汇总:【Data】→【Aggregate】
3.6 数据分组:【Transform】→【Recode】→【Into Different Variables】