实验1数据文件的编辑与整理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验一、数据文件的编辑与整理
在SPSS中,数据文件的编辑、整理等功能被集中在了Data和Transform两个
菜单项中,这两个菜单的内容如下所示:
Data 菜单项 Transform 菜单项
2.1 进一步整理数据文件--Data 菜单
【Sort Cases 对话框】
例2.1 对数据集li1_1.sav 按group 升序,x 降序的次序排列。
解:选择菜单Data==>Sort Cases,系统弹出Sort Cases 对话框,该对话框并不复杂,其中比较特殊的是下方的Sort Order 单选钮,有升序和降序两种选择。请注意,该单选钮是和上方的Sort By 框一起使用的,具体方法如下:
1. 确认升序单选钮被选择,将Group 选入Sort By 框;
2. 选择降序单选钮,将x 选入Sort By 框。
【Merge Files 对话框】
用于对数据文件进行合并。有纵向合并和横向合并两种。
纵向合并——增加观测量到当前数据;Data==>Merge File ==> Add Cases
横向合并——增加变量到当前数据文件。Data==>Merge File ==> Add Variables
【Aggregate 对话框】
用于对数据进行分类汇总,所谓分类汇总就是按指定的分类变量对观测值进行分组,对每组记录的各变量值求指定的描述统计量,结果可以存入新数据文件,也可以替换当前数据文件。
例2.2 计算Li1_1.sav中两组的血磷值标准差。
解:该题完全可以用更简单的方法完成,这里只是演示一下汇总对话框的用法。
1.Break Variables框:Group
2.Aggregate Variables框:x
3.Function钮:(Standard deviation单选钮:Continue钮)
4.Replace working data file单选钮:选中
5. OK
【 Select Cases 对话框】
很多时候我们不需要分析全部的数据,而是按某种要求分析其中的一部分(比如只分析男性的身高、只对前200个数据进行分析以了解大概情况),这时使用Select Cases对话框可以大大简化工作。 该对话框界面如下所示:
z All cases单选钮:和下面的4个单选钮为一组,选中它则分析所 有的记录;
z If condition is satisfied单选钮:只分析满足条件的记录;
z If按钮:和If单选钮一起使用,单击后弹出If对话框;
z Random sample of cases单选钮:从原数据中随机抽样;
z Sample按钮:和Random单选钮一起使用,可以设定按百分比抽取记录,或者精确设定从前若干个记录中抽取多少个记录;
z Based on time or case range单选钮:基于记录序号来选择记录;
z Range按钮:和Based单选钮一起使用,用于输入记录序号范围;
z Use filter variable单选钮:使用筛选指示变量来选择记录,必需在下面选入一个筛选指示变量,该变量取值为非0的记录将被选中,进入以
后的分析;
z Filtered单选钮:和下面的Deleted单选钮为一组,表示未被选中的记录只是被隔离,这些记录的记录号会被加上斜杠以示区别;
z Deleted单选钮:未被选中的记录将被删除,一般不要使用。
当对数据集做出筛选后,所做的筛选将在以后的分析中一直有效,直到再次
改变选择条件为止。同时在多数情况下,系统会自动产生一个名为filter_$的筛选指示变量,被选中的记录该变量取值为1,反之则为0。
【Weight Cases对话框】
用于对数据进行加权处理,如计算加权平均数,尤其用于处理一些频数信息等等。
1、选择菜单Data==>Weight cases;
2、选择Weight cases by选项,并将某变量作为加权变量选到Weight cases by 框中。
至此便完成了加权变量的指定。
一旦指定了加权变量,那么以后的分析处理中加权是一直有效的,直到取消加权为止。取消加权应在同一窗口中选择DO not weight cases选项。
【Split File对话框】
用于对数据进行拆分,不仅按指定变量进行简单排序,更重要的是根据变量对数据进行分组,为以后所进行的分组统计分析提供便利。
1、选择菜单Data==>Split File;
2、将拆分变量选择到Groups Based on框中;
3、拆分会使后面的分组统计产生两种不同格式的结果。其中Compare groups
表示将分组统计结果输出在同一张表格中,以便于不同组之间的比较;Organize output by groups表示将分组统计结果分别输出在不同的表格中,通常选择第一种输出方式。
4、如果数据编辑窗口中的数据已经事先按所指定的拆分变量进行了排序,则可以选择File is already sorted 项,可以提高拆分执行的速度,否则,选择另一项。
数据拆分将对后面的分析一直起作用,即无论进行哪种统计分析,都将按拆
分变量的不同组别分别进行分析计算。如果希望对所有数据进行整体分析,则需要重新执行数据拆分,即在窗口中选择Analyze all cases项。
2.2 从原有变量计算新变量(Transform功能)
【Compute Variable对话框】
例2.2 在li1_1.sav中建立新变量temp,令其值当血磷值大于1时为2。
解:选择菜单Transform==>Compute,系统弹出记录选择对话框如下:
单击中下部的“If”按钮,系统弹出记录选择对话框如下: