SPSS统计分析课件第2章数据与数据文件

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

SPSS统计分析
经济管理学院邓维斌
§第2章数据与数据文件 §2.1变量与变量值
SPSS 统计分析
视图
变量的定义信息
包括:Name,Type,Width, Decimal,Label,Values,Missing, Columns, Align,Meas变量 Gender Height 变量标签性别身高变量值 f m 1 2 3 4 5 男女 <=1.49m 1.50~1.59m 1.60~1.69m 1.70~1.79m >=1.80m 4 变量值标签
SPSS 统计分析
§第2章数据与数据文件
数据定义信息的复制
SPSS 统计分析
SPSS 统计分析
10
§第2章数据与数据文件
缺失值的处理(Replace Missing Values)
SPSS 统计分析
由于种种原因，在统计表中可能会有一些缺失值，在很多时候需要在进行分析前进行处理。用Transform菜单的Replace Missing Values 命令项。常用方法;Series mean，Mean of nearby points;Median of nearby points;Linear interpolation和Linear trend at point。（以data02-01为例演示）
SPSS 统计分析
数据的合并(Merge files)
变量合并个案合并注：最好是在EXCEL中进行合并。
9
§第2章数据与数据文件
数据的选择(Select Cases)
有时为了进行特定的分析，需要从所有的数据资料中选择出一些数据进行统计分析。Data02-01数据为例，选择女性(sex=F)和变量Maths 在70.00到90数值范围内的观察值。步骤如下：从Data菜单选择Select Cases命令项，弹出Select Cases对话框。All Cases表示所有的数据；If condition is satisfied表示不按条件选择； Random sample of cases表示对观测值进行随机抽样;Based on time of case range表示顺序抽样。点击“If”按钮，弹出如图1-12所示对话框，先选择变量，然后定义条件，假设要定义的是Maths成绩在70到100之间的女生，则对话框中的表达式为：sex=’f’ AND Maths>=70.00 AND Maths<=100.00。
SPSS 统计分析
数据的拆分(Split Cases)
在进行数据的处理时经常要对文件中的观测量进行分组分析，如按男女生统计成绩。这里的拆分并非将一个数据文件拆分为两个或者更多的文件，而是按性别变量进行排序，创造按男生和女生考试成绩数据分别进行分析的条件的过程。
8
§第2章数据与数据文件
按Data|Split File打开Split File对话框; 选择Compare groups，激活Groups Based on栏，将变量sex， Maths选入Groups Based on栏中，因原来数据文件为对变量 sex,Maths进行排序，并进行分析发现已按sex和Maths进行了分组。（以data02-01演示）
变量命名规则
以字母、汉字或字符@开头；变量最后一个不可是句号；总长不超过8字符（4汉字）；变量名必须唯一（不能有两个相同的）；不能用空白字符或其它特殊字符（！？等）；不区分大小写，如HXH、hxh或Hxh均为同一变量；保留字（Reserved Keywords）不能作为变量的名称，如ALL，AND， WITH，OR等。
6
§第2章数据与数据文件 §2.3数据的管理
SPSS 统计分析
数据文件的管理主要是一些关于数据的排序、排秩、行列转置、文件的合并与分割，观察值的选择与加权，数据的变换与计算等。
数据的排序(Sort Cases)
Data|Sort Cases进入Sort Cases对话框，如图2-1所示。在Sort Order 中选中需排序的变量，可有多个变量作为Sort by变量，排序结果与这多个变量在其中出现的先后顺序有关Ascending表示升序，Descending 表示降序。
数据的加权（Weight Cases）
以实际统计中，经常需要计算数据的加权平均数。如计算某超市中某天售出商品的平均价格，如仅以各种商品的单价平均数作为平均价格是不合理的，还应考虑到各商品的销售量对平均价格的影响。观察值的加权功能是设定某变量为频数变量，其操作是从数所管理窗口选中Data|Weight Cases项，进入Weight Cases对话框。以data02-03为例进行演示。注：加权只对数值型数据进行。
变量标签与变量值标签
是对变量名的附加的更进一步的说明，由于变量名只能由8个及8个以下的字符组成，当这8个字符不能表示这个变量的含义时，就需要用变量的标签来对这个变量含义进行解释。在统计分析的输出结果中会在变量名相应的位置显示该变量的标签，有助于分析输出结果得出结论。变量值标签是对变量的取值所附加的进一步说明。对分类变量往往要定义其取值的标签。如对收入以 500的间距进行分类，
图2-1 Sort by对话框
7
§第2章数据与数据文件
数据的行列转置(Transpose)
Data|Transpose打开Transpose对话框，Variable(s)中放入将要进行转置的变量名。在数据文件中，未放入框中的变量名将丢失，字符串变量不能进行行列转置，否则数据将丢失。Name Variable为变量名栏，在左侧源变量栏中选择一个变量，放入Name Variable栏，即该变量的数据作为转置后的变量名。（以data02-02为例演示）注：一般不在SPSS中进行列转置，可先在EXCEL中处理后进行，很多处理均可在EXCEL中处理后进行。
11
如果有多个变量的类型相同，可以先定义一个变量，然后把该变量的定义信息复制给新变量。
5
§第2章数据与数据文件 §2.2数据的录入与编辑
SPSS 统计分析
数据的录入等基本操作数据文件的保存打开EXCEL文件（见data02-01）打开TXT文件（data02-01.txt）分析结果查看及保存
SPSS 统计分析
变量类型
SPSS中有三种基本类型：Numeric（数值型），String（字符型），Date（日期型）。数值型变量按不同要求可分为五种，再加上自定义型，所以可以定义的类型变量有八种。系统默认的变量类型为标准数值型，长度为8，小数占两位。 (以建立的实际例子作演示)
3
§第2章数据与数据文件

SPSS统计分析课件第2章 数据与数据文件

SPSS统计分析课件第2章数据与数据文件