spss数据外部接口

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二讲 SPSS数据文件外部管理
教学目的:熟悉常用外部文件命令的基本操作;掌握文件格式的转换;
教学重点:文件格式转换;
教学难点:文件格式转换;
具体教学内容:
一、新文件的建立与已存在文件的打开
当系统启动时,如果忽略提示界面,很快就会进入一个未命名文件的界面,依据前面的知识就可以轻松地操作了。

如果正在操作其他文件,需要保存原有操作后,利用File文件管理命令菜单“New”新建文件,也会进入未命名文件的界面。

“New”菜单包含5个子命令,包括建立新的Data、Syntax、Output、Draft output、Script,可以分別进入数据管理窗口、程序编辑窗口、结果浏览窗口、结果草稿浏览窗口和VBs脚本语言编辑窗口1[1]。

这些新文件在File的命令菜单上可以自由地进行切换。

如果我们要建立的是一个数据文件,就可以点击“Data”进行新文件的操作了。

“Open”菜单包含有与“file”相同的菜单命令,只不过其功能是打开已经存在的Data、Syntax、Output、Draft output、Script文件。

如果想打开最近操作过的文件,也可以通过“File”菜单命令下的“Recently used Data”、“Recently used files”打开最近用过的各种文件2[2]。

二、文件类型转换
有些时候,统计业务并不是直接采用实际调查中的数据,而是利用一些二手的资源,包括一些早已做成其他形式的数据库文件。

SPSS提供了文件格式相互转换的功能,可以将其转变成为SPSS格式的数据文件。

SPSS可以直接读入许多格式的数据文件,选择菜单File==>Open==>Data或直接单击快捷工具栏上的图标,系统就会弹出Open File对话框,单击“文件类型”列表框,在里面能看到直接打开的数据文件格式,分别是:
⏹⏹SPSS(*.sav):SPSS数据文件(6.0~10.0版);
⏹⏹SPSS/PC+(*.sys):SPSS 4.0版数据文件;
⏹⏹Systat(*.syd):*.syd格式的Systat 数据文件;
1[1]后两个窗口不常用到。

2[2]在软件启动之初也可以通过凸显的小窗口中的选项直接进入最近操作过的文件。

⏹⏹Systat(*.sys):*.sys格式的Systat 数据文件;
⏹⏹SPSS portable(*.por):SPSS便携格式的数据文件;
⏹⏹EXCEL(*.xls):EXCEL数据文件(从5.0版~2000版);
⏹⏹Lotus(*.w*):Lotus数据文件;
⏹⏹SYLK(*.slk):SYLK数据文件;
⏹⏹dBase(*.dbf):dBase系列数据文件(从dBase II~IV);
⏹⏹Text(*.txt):纯文本格式的数据文件;
⏹⏹data(*.dat):纯文本格式的数据文件。

在常用的其他型的数据文件中,比较常用的是 Text纯文本格式的数据文件(*.txt)与EXCEL数据文件(*.xls)。

1. 纯文本格式的数据文件(*.txt)的转换
由于(*.txt)纯文本的数据文件转换比较常见,因此在File的命令菜单就直接具有Read Text Data的命令项。

选择菜单File=>Read Text Data,系统就会弹出Open File对话框,并自动指向(*.txt)文件。

操作如下:
⏹⏹File=>Read text data,进入Open File对话框,浏览并找到需要转换的文
件“公司资料.txt”,选中该文件,双击文件(或点击“打开”按钮),进入格式
转换界面。

⏹⏹“Step 1 of 6”说明该向导共分6步,这是第一步。

中间的“Text File:”
后面指明了引用文本的路径,无需定义。

“Does your file match a predefined format”询问“文本文件是否和预定格式相一致?”。

默认是前者。

⏹⏹选择“No”以后,可以点击“取消”停止操作,也可以单击“帮助”寻求帮
助信息。

如果没有问题,则可以点击“下一步”。

⏹⏹“Step 2 of 6”最上方的问题是“How are your variables arranged?”,
询问了变量的安排。

“Delimited”表示用Spaces(空格)、commas(逗号)、tabs
(跳格键)及其他字符间隔开来。

“Fixed”表示变量与观测值都具有固定排列的
位置,没有字符的间隔。

一般情况下文本的数据文件都是字符或空格间隔开来的,
因此,通常选择“Delimited”。

“Are variable names included at the top of your file?”则询问了变量行是否位于文本文件的首行。

如果首行的变量名不适于
SPSS软件的规定,系统将进行自动的定义。

⏹⏹“Step 3 of 6”主要是对观测值进行界定。

“The first case of data begins
on which line number? ”询问“第一个记录起始于哪一行?”。

如果第一行是变量名,这里就要选择2。

空白处的数字可以根据具体情况自由选择。

⏹⏹“How are your cases represented?”询问“记录是如何存储于文本文件中
的?”。

一般是“Each line represents a case”,表示“每一行代表一条记录”。

如果所需描述的变量较多、文本文件要用大于一行的长度来写完一条记录的特征量情况下,则是“A specific number of variables represents a case”,表示“每n行代表一条记录”,在空格中可以根据具体需要调整行数。

⏹⏹“How many cases do you want to import?”,对“你想导入多少条记录?”
进行询问。

可以是“all of the cases”(全部记录)、“the first n cases”(前n条记录)或者“a random percentage of the cases(approx n%)”(随机导入n%的记录)。

⏹⏹上述问题都提供了默认选项,并且适合于要进行的操作,因此核对完毕以后,
就可以直接点击“Next”按钮,进入下一界面。

⏹⏹“Which delimiters appear between variables?”对“变量间用的是哪种
分隔符?”进行询问,可选择的有跳格键、空格、逗号、分号或自行定义的其他符号。

而当遇到连续的分隔符时,系统自动地将其视为缺失值。

⏹⏹“What is the text qualifier? ”主要是定义校验的分隔符。

一般情况下
用不到。

有的时候,分隔符在具体的记录中出现(如“,”),这时就要对分隔符进行重新的定义。

比如定义为单引号或双引号而不是逗号,就可以避免这种现象。

⏹⏹“Specifications for variable(s) selected in the data preview”,即
“定义在数据预览窗口中所选择的变量”。

利用这个功能,可以在数据预览窗口中选择某一列变量,然后更改其变量名和类型。

⏹⏹“Would you like to save this file format for future?”询问“是否保
存这次的文件(读入)格式以备下次使用?”,第二个问题为“你是否愿意将以上操作粘贴为SPSS语句?”。

这里我们可以直接略过,点击“Finish”即可完成操作。

2.电子表格格式(*.xls)的转换
与文本文件的转换相比较,电子表格的转换则方便了许多。

⏹⏹File=>Open,进入Open File对话框,浏览并找到需要转换的文件“公司资
料.xls”,选中该文件,双击文件(或点击“打开”按钮),进入格式转换界面如
图2-14。

在对话框的上方给出了文件的路径。

“Read variable names from the first
row of data”询问是否将电子表格文件的第一行读作变量名。

默认项是选择。

⏹⏹“Worksheet”后面的选项,主要对需要转换的工作表格进行选择。

“Range”
则对选定表格需要转换的部分进行选择。

假设我们选择首项A2与尾项D8的数据,
则定义为A2:D83[3],将A2:D8包含的所有数据选择进入即将形成的数据文件。

然后
点击“OK”即转换完毕。

三、使用数据库查询建立新文件
SPSS可以直接打开许多类型的数据文件,可以使用ODBC(Open Database Capture)的数据接口4[4],以直接访问以结构化查询语言(SQL)做为数据访问标准的数据库管理系统。

ODBC 数据引擎是独立于各种应用软件,直接安装到Windows系统中的,因此你所用的系统中ODBC 所支持的数据类型取决于所安装的ODBC引擎的情况。

大多数支持该接口的软件都会在安装光盘上附送该引擎的安装文件(如MS Office)。

选择菜单File==>Open Database==>New Query,系统会弹出数据库向导的第一个窗口,其中会列出所用机器上已安装的所有数据库驱动程序,选中所需的数据源,然后单击下一步,向导会一步一步的提示你如何做,直至将数据读入SPSS。

四、File菜单其他文件管理功能
1.Display Data Info(展示文件信息)
该菜单项用于显示数据文件的基本信息,选择它后会弹出非常打开文件的对话框,用于选择需要了解的数据文件。

选择好后双击或者按OK,在结果窗口中就会列出所选文件的基本情况,如建立时间、标签设置、记录总数等。

2.Apply Data Dictionary(引用数据字典)
使用该命令,可以在格式近似(至少有一个变量名是相同的)的新数据文件中,套用定义好的其他文件的变量设置(如格式、标签等)。

需要注意的是,变量的类型是不能套用过来的。

3[3]由于表格的第一行被规定为变量名,因此,这里的A2、D8围成的表格,系统默认为A3与D8围成的部分。

另外,首项如果不是第一行,即A1、B1形式的话,变量名称不会自动读入新的数据文件,而是分别命名为V1、V2等。

4[4]该接口被大多数数据库软件和办公软件(如MS Office)支持。

由于SPSS 10.0可以直接打开EXCEL所有系列的数据文件,因此数据库查询接口的用处不是很大。

但是,在9.0及以前的版本中,该查询仍是直接打开EXCEL 95、97及2000数据文件的唯一办法。

3.Cache Data(形成数据缓冲)
如果是从远程用SQL调用数据库,使用Cache Data,可以将数据全部读入暂存盘,建立活动数据缓冲区,加快处理速度。

如果是处理本机数据的话,该命令对速度的提升不是很明显。

4.Print、Print Preview(打印与打印预览)
Print用于将窗口中的数据以表格的形式打印出来。

Print Preview用于打印预览。

5.Stop Processor(中止当前操作)该命令用于中止当前SPSS命令操作。

课堂讨论题目:一个word文档的表格如何进行转换?进行尝试。

课后作业题目:对课堂上的操作案例进行转换,并总结转换在具体应用中的注意事项。

相关文档
最新文档