SPSS统计分析课件第2章 数据与数据文件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
SPSS统计分析
经济管理学院 邓维斌
§第2章 数据与数据文件 §2.1变量与变量值
SPSS 统 计 分 析
视图
变量的定义信息
包括:Name,Type,Width, Decimal,Label,Values,Missing, Columns, Align,Meas变量 Gender Height 变量标签 性别 身高 变量值 f m 1 2 3 4 5 男 女 <=1.49m 1.50~1.59m 1.60~1.69m 1.70~1.79m >=1.80m 4 变量值标签
SPSS 统 计 分 析
§第2章 数据与数据文件
数据定义信息的复制
SPSS 统 计 分 析
SPSS 统 计 分 析
10
§第2章 数据与数据文件
缺失值的处理(Replace Missing Values)
SPSS 统 计 分 析
由于种种原因,在统计表中可能会有一些缺失值,在很多时候需 要在进行分析前进行处理。用Transform菜单的Replace Missing Values 命令项。常用方法;Series mean,Mean of nearby points;Median of nearby points;Linear interpolation和Linear trend at point。(以data02-01为例演 示)
SPSS 统 计 分 析
数据的合并(Merge files)
变量合并 个案合并 注:最好是在EXCEL中进行合并。
9
§第2章 数据与数据文件
数据的选择(Select Cases)
有时为了进行特定的分析,需要从所有的数据资料中选择出一些数 据进行统计分析。Data02-01数据为例,选择女性(sex=F)和变量Maths 在70.00到90数值范围内的观察值。步骤如下: 从Data菜单选择Select Cases命令项,弹出Select Cases对话框。All Cases表示所有的数据;If condition is satisfied表示不按条件选择; Random sample of cases表示对观测值进行随机抽样;Based on time of case range表示顺序抽样。 点击“If”按钮,弹出如图1-12所示对话框,先选择变量,然后定义条 件,假设要定义的是Maths成绩在70到100之间的女生,则对话框中的 表达式为:sex=’f’ AND Maths>=70.00 AND Maths<=100.00。
SPSS 统 计 分 析
数据的拆分(Split Cases)
在进行数据的处理时经常要对文件中的观测量进行分组分析,如 按男女生统计成绩。这里的拆分并非将一个数据文件拆分为两个或者 更多的文件,而是按性别变量进行排序,创造按男生和女生考试成绩 数据分别进行分析的条件的过程。
8
§第2章 数据与数据文件
按Data|Split File打开Split File对话框; 选择Compare groups,激活Groups Based on栏,将变量sex, Maths选入Groups Based on栏中,因原来数据文件为对变量 sex,Maths进行排序,并进行分析发现已按sex和Maths进行了分组。 (以data02-01演示)
变量命名规则
以字母、汉字或字符@开头; 变量最后一个不可是句号; 总长不超过8字符(4汉字); 变量名必须唯一(不能有两个相同的); 不能用空白字符或其它特殊字符(!?等); 不区分大小写,如HXH、hxh或Hxh均为同一变量; 保留字(Reserved Keywords)不能作为变量的名称,如ALL,AND, WITH,OR等。
6
§第2章 数据与数据文件 §2.3数据的管理
SPSS 统 计 分 析
数据文件的管理主要是一些关于数据的排序、排秩、行列转置、文 件的合并与分割,观察值的选择与加权,数据的变换与计算等。
数据的排序(Sort Cases)
Data|Sort Cases进入Sort Cases对话框,如图2-1所示。在Sort Order 中选中需排序的变量,可有多个变量作为Sort by变量,排序结果与这 多个变量在其中出现的先后顺序有关Ascending表示升序,Descending 表示降序。
数据的加权(Weight Cases)
以实际统计中,经常需要计算数据的加权平均数。如计算某超市 中某天售出商品的平均价格,如仅以各种商品的单价平均数作为平均 价格是不合理的,还应考虑到各商品的销售量对平均价格的影响。 观察值的加权功能是设定某变量为频数变量,其操作是从数所管 理窗口选中Data|Weight Cases项,进入Weight Cases对话框。 以data02-03为例进行演示。 注:加权只对数值型数据进行。
变量标签与变量值标签
是对变量名的附加的更进一步的说明,由于变量名只能由8个 及8个以下的字符组成,当这8个字符不能表示这个变量的含义 时,就需要用变量的标签来对这个变量含义进行解释。在统计分 析的输出结果中会在变量名相应的位置显示该变量的标签,有助 于分析输出结果得出结论。变量值标签是对变量的取值所附加的 进一步说明。对分类变量往往要定义其取值的标签。如对收入以 500的间距进行分类,
图2-1 Sort by对话框
7
§第2章 数据与数据文件
数据的行列转置(Transpose)
Data|Transpose打开Transpose对话框,Variable(s)中放入将要进 行转置的变量名。在数据文件中,未放入框中的变量名将丢失,字符 串变量不能进行行列转置,否则数据将丢失。Name Variable为变量 名栏,在左侧源变量栏中选择一个变量,放入Name Variable栏,即 该变量的数据作为转置后的变量名。(以data02-02为例演示) 注:一般不在SPSS中进行列转置,可先在EXCEL中处理后进 行,很多处理均可在EXCEL中处理后进行。
11
如果有多个变量的类型相同,可以先定义一个变量,然后把该变量的 定义信息复制给新变量。
5
§第2章 数据与数据文件 §2.2数据的录入与编辑
SPSS 统 计 分 析
数据的录入等基本操作 数据文件的保存 打开EXCEL文件(见data02-01) 打开TXT文件(data02-01.txt) 分析结果查看及保存
SPSS 统 计 分 析
变量类型
SPSS中有三种基本类型:Numeric(数值型),String(字符 型),Date(日期型)。数值型变量按不同要求可分为五种,再加上 自定义型,所以可以定义的类型变量有八种。系统默认的变量类型为 标准数值型,长度为8,小数占两位。 (以建立的实际例子作演示)
3
§第2章 数据与数据文件
相关文档
最新文档