SPSS教程1数据文件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一.数据文件
SPSS所处理的数据文件有两种来源:一是SPSS环境下建立的数据文件;二是调用其它软件建立的数据文件。

1 在SPSS数据编辑窗口建立数据文件
当用户启动SPSS后,系统首先显示一个提示窗口,询问用户要SPSS做什么时,把鼠标移至“Type in data”项上单击左键选中,然后单击“OK”按钮;或者该窗口中单击“Cancel”按钮进入SPSS数据编辑窗屏幕,如图所示。

图进入SPSS数据编辑器
(1) 数据编辑(SPSS Data Editor)界面介绍
窗口名显示栏:在窗口的顶部,显示窗口名称和编辑的数据文件名,没有文件名时显示为“Untitled-SPPS Data Editor”。

窗口控制按钮:在窗口的顶部的右上角,第一个按钮是窗口最小化,第二个按钮是窗口最大化,第三个按钮是关闭窗口。

SPSS主菜单:在窗口显示的第二行上,有:File文档,Edit编辑,View显视,Data数据,Transform转换,Analyze分析,Graphs图形,Utilities公用项,Windows视窗。

图 SPSS窗口界面
常用工具按钮:在窗口显示的第三行上,有:打开文档,保存文档,打印,对话检索,取消当前操作,重做操作,转到图形窗口,指向记录,指定变量操作,查找,在当前记录的上方插入新的空白记录,在当前变量的左边插入新的空白变量,切分文件,设置权重单元,标记单元,显示价值标签。

数据单元格信息显示栏:在编辑显示区的上方,左边显示单元格和变量名(单元格:变量名),右边显示单元里的内容。

编辑显示区:在窗口的中部,最左边列显示单元序列号,最上边一行显示变量名称,缺省为“Var”。

编辑区选择栏:在编辑显示区下方,Data View 在编辑显示区中显示编辑数据,Variable View在编辑显示区中显示编辑数据变量信息。

状态显示栏:在窗口的底部,左边显示执行的系统命令,右边显示窗口状态。

(2) 数据文件格式
数据文件格式以每一行为一个记录,或称观察单位(Cases),每一列为一个变量(Variable)。

由于SPSS不同的统计分析过程需要不同的数据类型,因此,在学习使用SPSS 软件作统计分析时要注意这个问题。

现在,我们通过一个例子来学习数据的输入操作。

例:马尾松腮扁叶蜂在林间表土层的水平分布调查数据
(3) 定义变量
建立数据文件的第一步是定义变量。

在数据编辑窗口左下角激活(Variable View)变量定义窗口,如下图
在数据窗口中,用户定义数据变量的名称、数据类型、宽度、小数位和标记等信息。

变量名称
输入字符(汉字和英文)作为变量的名称,本例为,样地1,样地2,样地3。

如不输入名称,系统依次默认为“var00001”、“var00002”、“var00003” …。

变量应遵循下列原则:
∙在SPSS10.0中限制为8个字符长度(4个汉字);在SPSS12.0中没有限制。

∙首字符必须是字母或汉字,不能以下划线“_”或圆点“,”结尾。

∙变量不能有空格或某些特殊符号,如“!?*”等。

∙变量名不能与SPSS的关键字相同,即不能用ALL、AND、BY、EQ、GT、LE等。

变量的数据类型
当鼠标指针移至单元格,单击后该单元格的右边就会显示一个“…”按钮,单击该按钮就会显示一个数据类型设置窗口,如下图所示。

可供选择的数据类型有:
∙Numeric标准数值型,系统默认。

例如: 12345.67
∙Comma逗号数值型。

例如: 12,345.67 千分位用逗号
∙Dot圆点数值型。

例如: 12.345,67 千分位用圆点
∙Scientific notal科学记数法。

例如: 1.2E+04
∙Dat日期型,有27种形式。

例如: mm/dd/yyyy
∙Dollar美元型。

例如:$12345.67
∙Custom currency自定义型。

例如:12345.67
∙String字符型。

例如:12345.67
width指定数据字符占据的总个数(包括小数点和小数位)。

Decimal 指定小数位。

根据本例的要求,变量定义如图所示。

变量标签(Label):有的时候变量名不能正确反映变量含义,有必要给它贴上标签以便识别。

这个时候,就在变量定义的标签栏里输入你的注释。

变量值标签(Values):变量值标签是用来帮助解释某些变量,特别是分类变量的数值含义。

例如,有一个数值变量,0表示女性,1表示男性。

此时,为了便于识别这些数值,我们是用变量值标签。

在下图的第一个Value栏输入数值,在第二个Value栏输入数值标签。

当两个输入栏输入内容后,Add按钮激活,点击它就定义了变量值标签。

如本例,定义了0=女和1=男。

需要修改和删除,使用Change和Remove按钮。

缺失值(Missing):缺失值是统计分析时,对数据中缺少数据的一种统计识别值。

缺失值定义窗口如下图。

No missing values 没有定义缺失值,用系统默认值圆点“.”表示。

Discrete missing values 可以定义3个缺失值,例如,第一格输入“0”,表示凡为0的数据是缺失值。

Range plus one optional discrete missing value 定义取值区间为缺失值。

例如,Low:为1,High:为5,Discrete value:为10,表示1至5之间的数据及数值10视为缺失值。

数据列的显示宽度(Columns): 显示数据的列宽,默认8个字符。

对齐方式(Align): 有左中右3种数据显示方式。

度量类型(Measure): 按度量精度将变量分为定量变量(Scale)、等级变量(Orsinal)和定性变量(Nominal)。

该选项仅用于统计绘图时坐标轴变量的区分以及决策树模块的变量定义。

定量变量,如虫口数、死亡率等;等级变量,如防治效果的好、不好等;定性变量,如害虫抗药性发生,低抗,中抗和高抗。

(4) 输入数据
变量定义完成后,在编辑区选择栏里单击“Data View”卡片,编辑显示区显示为数据编辑。

在编辑区中,把与变量名相对应的数据输入到单元格里区,如下图所示。

数据输入后的数据编辑窗口
2 调用已建立的数据文件
SPSS可以调用SPSS(*.sav),Excel(*.xls),dBASE(*.dbf),ASCII(*.dat,*.txt)等数据文件。

2.1 调用SPSS数据文件(*.sav)
从菜单选择File-Open-Data命令,在弹出的打开文件对话中指定数据文件的路径,文件名框内显示的是SPSS数据文件是系统默认的文件类型“*.sav”,点击所选文件,单击“打开”按钮,或双击所选文件。

这样就把该数据文件调入数据编辑窗口中。

2.2 调用ASCII数据文件(文本文件,*.dat, *.txt)
文本文件(ASCII)格式是我们经常使用的一种文件格式,也是许多软件都具有的数据交换格式。

文本文件分变量固定字符宽度与使用分隔符分开变量格式(‘,’、‘;’)和制表(‘Tab’)两种形式,下面我们用例子来说明其操作。

1) 定字符宽度格式文本文件的输入
我们使用Windows“记事本”创建一个显示如下格式的TEXT1.TXT的文件。

0 7 15.56 7 15.56
1 3 6.67 10 22.22
2 8 17.78 18 40.00
3 7 15.56 25 55.56
4 7 15.56 32 71.11
5 4 8.89 3
6 80.00
6 2 4.44 38 84.44
7 3 6.67 41 91.11
8 3 6.67 44 97.78
该数据文件有5个变量,9个记录。

使用这种格式使用变量名称注意宽度不能超过对应的变量数据的宽度,否则会发生一些变量名称不对的错误。

该数据文件保存在配套光盘中(\SPSS\DATA\TEXT1.TXT)。

操作过程:
(1). 在主菜单中点击“File-Open-Data”命令。

(2). 出现打开文件操作窗口,在“查找范围”栏指定文本文件“TEXT1.TXT”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉按钮(三角形按钮),在下拉选项里选中“Text (*.txt)”,然后在文件列表框里选中“Text1.txt”文件,再单击“打开”按钮,如下图所示。

(3). 出现数据引导对话窗口,一共有6个对话窗口。

① 第一个对话窗口的设置
Does your text file match a predefined format(该文本文件是否与以前定义过的格式匹配?)
○Yes选择此项,则“Browse..”按钮被激活,可以将以前定义的文件调出。

⊙No不使用保存过的匹配文件,系统默认。

然后点击“下一步”按钮,出现文本输入向导的第二个对话窗口。

②第二个对话窗的设置(设置变量的分隔方式)
图变量格式和变量名设置
How are your variables arranged(变量间分隔方式?):
○Delimited: 变量间用特殊符号分隔,系统默认;
⊙ Fixed width:变量间为固定列宽度,本例选中该项。

Are variable names included at top your file (文件顶端是否含变量名?)○ Yes:文件中第1行为变量;
⊙ NO:文件中没有变量名,系统自动给变量命名。

本例选中该项。

然后点击“下一步”按钮,出现文本输入向导的第三个对话窗口。

③第三个对话窗口的设置(设置纪录读取方式)
The first case of data begins on which:指定第一数据从那行开始,本例选1。

How many lines represent a case 多少行为一个记录?本例选择1。

How many cases do you want to import (读入多少记录?)
⊙All of the cases:全部记录。

系统默认,本例选中该项;
○The first 1000 cases:开始的1000个记录;
○A random percentage of the cases (approximately): 随机选择一定百分比。

然后,点击“下一步”按钮。

④ 在第四个对话窗口的设置(修改变量分割)
可以在窗口的数据显示(Data preview)栏里,用鼠标抓住变量分隔竖线,调整竖线位置来符合变量取值宽度。

有如下三种操作:
(1)修改变量字符宽度,用鼠标抓住分割线拖移;
(2)插入一条分割线,在插入位置点击鼠标左键;
(3)删除一条分割线,用鼠标抓住分割线拖移数据窗口。

调整完成后,点击“下一步”按钮。

⑤在第五个窗口定义变量属性
Specifications for variable(s) selected the data preview(设置在数据显示栏选中变量的属性):
Variable name: v1 重新定义变量名称。

Data: Numeric 重新定义变量的数据类型。

在窗口中,先在数据显示栏(Data preview)指定需要定义的变量,然后才在“Variable name”和“Data”栏输入变量名和数据类型。

完成后,点击“下一步”按钮。

⑥ 第六个对话窗口的设置
Would you like to save this file format for future(是否将文件格式存盘)
○ Yes选此项,“Save as ..”按钮激活,单击按钮后,将文件另存到指定的路径。

在有相同格式文本文件时调用
它来设置。

⊙ No 不保存
Would you like to paste the syntax(是否存为程序语句文件?)
○ Yes选中此项,则将上述过程保存为程序文件。

⊙ No不保存为程序语句文件,系统默认。

设置完成后,在窗口的数据显示框里观察数据读取情况,如果读出的数据不对,可以点击“上一步”按钮,回到前面的对话窗口里进行修正设置。

数据显示正确后,点击“下一步”按钮。

最后单击“完成”按钮,文本数据就输入到数据编辑窗里,完成了数据的转换过程。

2) 分隔符格式文本文件的输入
我们使用Windows“记事本”创建一个显示如下格式的TEXT2.TXT的文件。

组中值,样本数,比例,累计次数,累计比例
0,7,5.56,7,15.56
1,3,6.67,10,22.22
2,8,7.78,18,40.00
3,7,5.56,25,55.56
4,7,5.56,32,71.11
5,4,8.89,36,80.00
6,2,4.44,38,84.44
7,3,6.67,41,91.11
8,3,6.67,44,97.78
该数据文件保存在配套光盘中(\SPSS\DATA\TEXT2.TXT)。

操作过程:
(1) 在主菜单中点击“File-Open-Data”命令,出现打开文件操作窗口。

(2) 在“查找范围”栏指定文本文件“TEXT2.TXT”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉按钮(三角形按钮),在下拉选项里选中“Text (*.txt)”,然后在文件列表框里选中“Text2.txt”文件,再单击“打开”按钮。

(3) 出现数据引导对话窗口。

① 第一个对话窗口的设置
Does your text file match a predefined format(该文本文件是否与以前定义过的格式匹配?)
○ Yes选择此项,则“Browse..”按钮被激活,可以将以前定义的文件调出。

⊙ No不使用预先保存匹配的文本格式文件。

然后点击“下一步”按钮,出现文本输入向导的第二个对话窗口。

②第二个对话窗的设置
How are your variables arranged(变量间分隔方式?):
⊙Delimited: 变量间用特殊符号分隔,本例选中该项。

○Fixed width:变量间为固定列宽度。

Are variable names included at top your file (文件顶端是否含变量名?)⊙Yes:文件中第1行为变量,本例选中该项。

○NO:文件中没有变量名,系统自动给变量命名。

然后点击“下一步”按钮,出现文本输入向导的第三个对话窗口。

③第三个对话窗口的设置
The first case of data begins on which: 2 指定数据从哪一行开始,本例从第2行开始。

How are your cases represented如何表达记录,有两种选择:
⊙Each line represents a:每个记录占一行,本例选中该项;
○A specific number of variables represents:多少个变量代表1个记录。

How many cases do you want to import读入多少记录?
⊙All of the cases:全部记录。

系统默认,本例选中该项;
○The first 1000 cases: 开始的1000个记录;
○A random percentage of the cases (approximately): 随机选择一定百分比。

然后,点击下一步按钮。

④ 第四个对话窗口的设置
Which delimiters appear between variables:变量间的分隔符号
□Tab: 制表符□Space: 空格
Comma: 逗号,本例选中此项□Semicolon: 分号
□Other: 自定义,将符号填入后面框里
What is the text qualifier? (字符串文本是用什么字符限制的?)
⊙ None 没有限制符,系统默认。

○ Single quote? 单引号。

○ Double quote? 双引号。

○ Other 其它字符。

⑤第五个对话窗口的设置
Specifications for variable(s) selected the data preview(设置在数据显示栏选中变量的属性):
∙Variable name:?? 重新定义变量名称。

∙Data:? 重新定义变量的数据类型。

∙Original Name 原来的变量名称
观察数据读取情况,重新设置变量名和变量的数据类型。

⑥第六个对话窗口的设置
Would you like to save this file format for future?(是否将文件格式保存)○ Yes选此项,“Save as ..”按钮激活,单击按钮后,将文件另存到指定的路径。

在有相同格式文本文件时调用
它来设置。

⊙ No 不保存
Would you like to paste the syntax?(是否存为程序语句文件?)
○ Yes选中此项,则将上述过程保存为程序文件。

⊙ No不保存为程序语句文件,系统默认。

设置完成后,在窗口的数据显示框里观察数据读取情况,如果读出的数据不对,可以点击“上一步”按钮,回到前面的对话窗口里进行修正设置。

数据显示正确后,点击“下一步”按钮。

最后单击“完成”按钮,文本数据就输入到数据编辑窗里。

比较两种文本格式文件的输入结果,发现定界符格式文件的输入比较方便操作,数据类型也好掌握,因此,我们在使用数据输入时尽量采用这种格式的文本文件。

2.3 调用Excel文件数据
Microsoft Excel 是使用比较普遍的图表软件,用它保存的数据文件,在SPSS中也能很方便的使用,这里我们介绍其使用的操作过程。

首先,我们已经保存有在Excel里显示如下的“EXCEL01.XLS”文件,如下图所示。

操作过程:
(1) 在主菜单中选用“File-Open-Data”命令,出现打开文件操作窗口。

(2) 在“查找范围”栏指定文本文件“EXCEL01.XLS”保存的文件夹;在“文件类型”栏里,单击该输入框或者右边的下拉三角形按钮,在下拉选项里选中“Excel? (*.xls)”,然后在文件列表框里选中“EXCEL01.XLS”文件,再单击“打开”按钮,或者双击该文件。

(3) 出现打开Excel数据文件对话窗
Read variable names from the first row of data 变量名称是从数据的第一行读取吗,是点选此项。

Worksheet: 指定读出Excel文件中的工作表。

单击该选框右边的下拉三角形按钮,在出现的工作表中指定,系统缺省指定第一个工作表。

Range: ?指定读取数据的范围。

其范围按Excel格式书写,例如:A1:D8
点击“OK”按钮, Excel数据就输入到数据编辑窗里,完成数据输入转换。

总之,SPSS提供了多种数据格式的输入,我们在学习这两种方法后,能举一反三地学习其他的输入方式。

3 保存数据
SPSS可以将数据保存为SPSS(*.sav)、Excel(*.xls)、dBASE(*.dbf)、ASCII(*.dat,*txt)等数据文件形式。

保存文件,从菜单选择File-Save(或Save As)命令。

在弹出的保存文件对话框里,指定保存路径,输入文件名,确定数据类型,最后单击“保存”按钮。

4 SPSS的文件类型
∙数据文件:扩展名为“.sav”
∙结果文件:扩展名为“.spo”
∙图形文件:扩展名为“.cht”
∙语句命令文件:扩展名为“.sps”。

相关文档
最新文档