实验三-IBM-SPSS软件的基本操作
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验三-IBM-SPSS软件的基本操作
云南大学软件学院
实验报告
课程:大数据分析及应用任课教师:蔡莉实验指导教师(签名):
学号: 20131170142 姓名:郭昱专业:软件工程日期: 2015/11/01 成绩:
实验三 IBM SPSS软件的基本操作
一、实验目的
1.熟悉SPSS的菜单和窗口界面,熟悉SPSS 各种参数的设置;
2.掌握SPSS的数据管理功能。
二、实验内容及步骤
(一)数据的输入和保存
1. SPSS界面
当打开SPSS后,展现在我们面前的界面如下:
菜单栏
工具栏
注意:窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。该界面和EXCEL极为相似,很多操
作也与EXCEL类似。
2.定义变量
选择菜单Data==>Define Variable。系统弹出定义变量对话框如下:
对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。
假如有两组数据如下:
GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11
GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87
先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。
现在SPSS的数据管理窗口如下所示:
第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。
现在我们来建立变量X。单击第一行第二列的单元格,然后选择菜单Data==>Define Variable,同样,将变量名改为X,然后确认。此时SPSS的数据管理窗口如下所示:
现在,第一、第二列的名称均为深色显示,表明这两列已经被定义为变量,其余各列的名称仍为灰色的“var”,表示尚未使用。同样地,各行的标号也为灰色,表明现在还未输入过数据,即该数据集内没有记录。
3.输入数据
我们先来输入变量X的值,请确认一行二列单元格为当前单元格,弃鼠标而用键盘,输入第一
个数据0.84,此时界面显示如图A所示:请注意:在回车之前,你输入的数据在数据栏内显示,而不是在单元格内显示,现在回车,界面如图B 所示:
首先,当前单元格下移,变成了二行二列单元格,而一行二列单元格的内容则被替换成了0.84;其次,第一行的标号变黑,表明该行已输入了数据;第三,一行一列单元格因为没有输入过数据,显示为“.”,这代表该数据为缺失值。
4. 保存数据
选择菜单File==>Save,由于该数据从来没有被保存过,所以弹出Save as对话框如下:
单击保存类型列表框,可以看到SPSS所支持的各种数据类型,有DBF、FoxPro、EXCEL、ACCESS等,这里我们仍然将其存为SPSS自己的数据格式(*.sav文件)。在文件名框内键入Li1_1并回车,可以看到数据管理窗口左上角由Untitled变为了现在的变量名Li1_1。
(二)数据的预分析
1. 数据的简单描述
首先我们需要知道数据的基本情况,如均数、标准差等。选择Analyze==>Descriptive Statistics==>Descriptives菜单,系统弹出描
述对话框如下:
该对话框可分为左右两大部分,左侧为所有可用的侯选变量列表,右侧为选入变量列表。我们只需要描述X,用鼠标选中X,单击中间的,变量X的标签就会移入右侧,注意这时OK按钮变黑,表明已经可以进行分析了,单击它,系统会弹出一个新的界面如下所示:
该窗口上方的名称为SPSS for Windows Viewer,即(结果)浏览窗口,整个的结构和资源管理器类似,左侧为导航栏,右侧为具体的输出结果。结果表格给出了样本数、最小值、最大值、均数和标准差这几个常用的统计量。从中可以看到,24个数据总的均数为1.2846,标准差为0.4687。
如果数据进行了分组,还可以看看分组的描述情况。这里要用到文件分割功能,请切换回数据管理窗口,选择Data==>Split File菜单,系统弹出文件分割对话框如下:
选择单选按钮Organize output by groups,将变量GROUP选入右侧的选入变量框,单击OK 钮,此时界面不会有任何改变,但请再做一次数据描述,你就可以看到现在数据是分Group=1和Group=2两种情况在描述了!从描述可知两组的均数和标准差分别为1.5209、1.0846和0.4218、0.4221。
2. 绘制直方图
统计指标只能给出数据的大致情况,没有直方图那样直观,我们就来画个直方图瞧瞧!选择Graphs==>Histogram,系统会弹出绘制直方图对话框如下:
将变量X选入Variable选择框内,单击OK
按钮。此时结果浏览窗口内将绘制出直方图。
最后,我们还要取消变量分割,免得它影响以后的统计分析,再次调出变量分割对话框,选择单选按钮中的“Analyze all cases, do not creat group”,单击OK按钮就可以了。
(三)保存和导出分析结果
1.保存结果文件
在结果浏览窗口中(注意:一定要在结果浏览窗口中)选择菜单File==>Save,由于该结果也从来没有被保存过,所以弹出和前面保存数据时极为相似的一个Save as对话框,和前面相比,他唯一的区别就是文件的保存类型只有View Files(*.spo)一种。在文件名框中键入“Li1_1”并回车,该结果文件就会按文件名Li1_1.spo被