第二讲 数据录入及录入

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

例:居民储蓄的调查问卷,包括了被调查 者的性别、职业、年龄、收入。而问卷的 数量即为数据的行数。 下表为数据举例
性别 女 男 职业 教师 公司职员 年龄 30 35 收入 4000 8000
男 女
公务员 自由职业
45 32
3000 1800
数据组织方式
性别
1 2
职业
教师 公司职员
年龄
30 35
收入
第一步 制定变量名(name)
• 变量名是变量访问和分析的唯一标志。 • 变量名的字符个数不多于8个。 • 首字符应以英文字母开头,后面可以跟除了! 、?、*之外的字母或数字。下划线、原点不能 为变量名的最后一个字符。 • 变量名不区分大小写字母。允许汉字作为变量 名,汉字总数不能超过4个,不能使用特定含义 名如:ALL、BY、AND、NOT、OR等 • SPSS有默认的变量名,以字母“VAR”开头, 后面补足5为数字,如:VAR00001、 VAR00002等。
果同定距变量一样表现为数值。
特点:定比变量是测量尺度的最高水平,它除了具有其他三 种测量尺度的全部特点外,还具有可计算两个测度值之间比 值的特点,因此它可以进行加、减、乘、除运算,而定距变 量值只可进行加减运算。
三、变量名与变量标签值
Label:定义变量名标签
Value:定义变量值标签
四、缺失值
自定义类型
字符型 • 字符型数据的默认显示宽度为8个字符位,系统不 区分变量名中的大小写字母,并且不能进行数学 运算。 • 注意:在输入数据时不应输入引号,否则双引号 将会作为字符型数据的一部分。
日期型 • 用来表示日期或时间。日期型数据的显示 格式有很多,SPSS以菜单方式列出日期型 数据的显示格式以供用户选择。 • 事实上,SPSS存储中的日期型变量是该实 践与1582年10月14日零点相差的秒数。
三、多选题录入在spss中的实现 可以通过Multiple Response和Tables两种方式实现 (注: Multiple Response 不能在数据文件集中保存)
第二个问题 外部数据的获取
SPSS读入非SPSS类型的文件数据,有三种主要方式:直接打开, 利用文本导向读入文本数据以及利用数据库OBDC接口读入数据。 1、电子表格数据如何导入spss中 SPSS中可以直接读入许多常用格式的数据文件,选择菜单File
(2)定序尺度(Ordinal Measurement):定序尺度是对事 物之间的等级或顺序差别的一种测度,可比较优劣或排序。 特点:由于定序变量只能测度类别之间的顺序,无法测出类 别之间的准确差值,即测量数值不代表绝对的数量大小,所 以其测量结果只能排序,不能进行运算。
Βιβλιοθήκη Baidu
(3)定距尺度(Interval Measurement):定距尺度是对 事物类别或次序之间间距的测度。
Spss中缺失值有用户自定义缺失值和系统缺失值两大类。
在SPSS中,对字符型变量,默认的缺失值为空格;对数值型变量,默 认的缺失值为零。
2、开放题和简单单选题的录入
一、在spss中定义变量
录入数据的第一步是定义变量属性,随后才能进行数据录入。
二、开放题的录入
三、单选题的录入 单选题的录入可以采用字符直接录入、字符代码+值标 签、数值代码+值标签三种方式。
第二步 制定每个数据的属性 一、变量的储存类型
• SPSS中,变量有三种的基本类型:数值型、字符型 和日期型。
数值型:数值型的数据是0-9的阿拉伯数字和其他符号,
如美元符号、逗号或圆点组成的。
标准型(Numeric) • 标准型是SPSS默认的数据类型,默认最大 宽度为8位,包括正负符号位、小数点和小 数位在内,小数位默认为2位。如果数据的 实际宽度大于8,SPSS将自动按照科学计数 法显示。 • (*注:数据的显示不影响数据的存储和计 算)
8 10 20 2 20 10 1 35 2 0
第一个问题 数据的录入
在录入数据时,归纳为以下三步: 第一步:定义变量名; 第二步:指定每个变量的各种属 性; 第三步:录入数据。
Variable View表用来定义和修改变量的名称、 类型及其他属性,如图所示。
如果输入变量名后回车,将给出变量的默认属性。如果不定 义变量的属性,直接输入数据,系统将默认变量 Var00001,Var00002等。
3、多选题的录入
一、多重二分法(Multiple Dichotomy Method) 所谓多重二分法,是在编码的时候,对应每一个 选项都要定义一个变量,有几个选项就有几个变量, 这些变量均为二分类,他们各自代表对一个选项的选 择结果。
二、多重分类法(Multiple Category Method) 多重分类法,也是利用多个变量对一个多选题的 答案进行定义,应该用多少个变量,由被访者实际可 能给出的最多答案数而定。
逗号型(comma) • 此类型数据从整数部分的各位开始每三位以一 个逗号分隔,默认的最大宽度为8,小数位为2 ,逗号所占的位数包括在总显示宽度之内。 • 例:1,234.56 • (*注:在输入时不用输入逗号,SPSS自动在 对应位添加逗号。)
圆点型(Dot)
• 此类型数据从整数部分的各位开始每三位 以一个原点分隔,逗号作为整数和小数部 分的分隔符。默认的最大宽度为8,小数位 为2。 • (*注:在输入时不用输入原点,SPSS自 动在对应位添加原点。)
Open Data或直接单击快捷键工具栏上的
快捷按钮,系统就
会弹出Open File 对话框,单击“文件类型”列表框,在里面能 够看到可以直接打开的数据文件格式。
2、文本数据如何导入spss中
第一步:首先,在Open File 文件框中选中文件,单击“打开”,系统 会自动启动文本倒入向导对话框。(你的文本文件和预定义格式相一致 码?)
第二步:选择“NO”并单击“下一步”按钮。
用某种字 符区分 固定宽度
变量名包 括在文件 最前面了 吗?
第三步:分别选择“Delimited”和“yes”,然后单击“下一步”按 钮。
第四步
第一条记 录从第几 行开始?
你的记录 是怎样存 储在文件 中的? 你想导入 多少条记 录?
第五步
数据中采用的是什么文本限定符? 注:如果数据中的字符串变量使用 了限定符进行分隔要在此说明
为了在统计分析过程中能有效的利用其它软件产生的数
据,SPSS软件编辑窗口除可以使用*.sav扩展名数据文件, 还可以直接打开和保存下述类型的文件: SPSS DOS版本产生的数据文件*.sys; Excel 报表程序产生的数据文件*.xls; DBASE 数据库格式文件*.dbf; SAS统计软件产生的数据文件。
标尺栏 当前数据栏 标题栏 菜单栏 工具栏 数据输入区 数据编辑区
输入观测
数据值或 存放数据, 表的左端 列边框显 示观测个 体的序号, 最上端行 边框显示 变量名。
窗口标签 状态栏 显示区滚动条
• 问题:由于一般的文本文件仅有数据部分,无数 据结构的描述(见图2.3),所以SPSS数据文件 不能像一般文本文件那样被大多数编辑软件打开 。只能在SPSS中打开。
关于日期型格式的几点说明:
“m”在年与日(字母y与d)之间表示月份;在时 与秒(字母h与s)之间表示“分”钟。
“mmm”表示要求书写英文月份单词的前三个字 母组成的缩写。 “ddd”三个字母d表示要求用从元月一日算起的 日数表示日期。 指定了日期变量的格式,不一定在输入时就使用 指定的格式。可以输入用“/”或“—”作分隔符的 具体日期,回车后,系统将自动将输入的格式转 化为指定的格式,显示在单元各种。
第二讲 数据录入与获取
本讲主要解决两个问题:
第一个问题,根据问题类型的不同,将会从开放题、单
选题和多选题的录入方式为例进行介绍。 第二个问题,重点介绍如何用SPSS直接读取Excel类型 和文本格式的数据,以及如何用ODBC接口读取数据库 文件。
数据录入的前期准备
• 数据文件的收集
主要包括:数据结构的收集 数据内容的收集
美元符号型(Dollar)
• 此类型主要用来表示货币数据,在数据前 附加美元符号$。 • 例:$123,456.78
用户自定义型(Custom Currency) • 如果用户认为上述五种类型均不能满足需要,可 以再定义不超过四种的表示方式。 • 这四种方式的名字为:CCA、CCB、CCC、CCD 。 • SPSS系统预先将它们定义成逗号数值型,用户可 以进行重新定义。 • 重新定义的菜单顺序为: Edit→Options→Currency。
二、变量的测量尺度
在SPSS中使用Measure属性对变量的测量尺度进行定义。 如下图所示
(1)定类尺度(Nominal Measurement):定类尺度是对事物的 类别或属性的一种测度,按照事物的某种属性对其进行分类或分组。 特点:其值仅代表了事物的类别和属性,即能测度类别差异,不能 比较各类之间的大小,所以各类之间没有顺序和等级。对定类尺度 的变量只能计算频数和频率。 在spss中,能适用定类尺度的数据可以是数值型,也可以是字符型 变量。使用定类变量对事物进行分类时,必须符合穷尽原则和互斥 原则。
SPSS数据的组织方式
• 1、原始数据的组织方式 • (1)不同观测对象的数据不能在同一记录中出现,即同一
观测数据应当独占一行。对应的数据编辑窗口中的一行称
为一个个案(case)
• (2)每一个观测量指标或影响因素只能占据一列的位置,
即同一指标的数量观测值都应当录入到同一个变量中去。对应 的数据编辑窗口中的一列称为一个变量
特点:不仅能将事物区分为不同类型并进行排序,而且可能准 确指出类别之间的差距是多少;定距变量通常以自然或物理单 位为计量尺度,因此测量结果往往表现为数值,所以计量结果 可以进行加减运算。
( 4 )定比尺度( Scale Measurement ):定比尺度是能
够测算两个测度值之间比值的一种计量尺度,它的测量结
在Variable View表中,每一行描述一个变量,依次是: Name:变量名。 Type:变量类型。 Width:变量所占的宽度。 Decimals:小数点后位数。 Label:变量标签。关于变量涵义的详细说明。 Values:变量值标签。关于变量各个取值的涵义说明。 Missing:缺失值的处理方式。 Columns:变量在Date View 中所显示的列宽(默认列宽为8)。 Align:数据对齐格式(默认为右对齐)。 Measure:数据的测度方式。系统给出名义尺度、定序尺度和等 间距尺度三种(默认为等间距尺度)。
变量间用 的是那种 分隔符
第六步
定义在数据预览 窗口中所选择的 变量 注:需要变更变 量名和类型的在 此操作
频数数据
年龄段 职 称 教 讲 助 授(1) 师(3) 教(4) 35岁以下 50岁以上 36~49(2) ( 1) ( 3) 0 10 20 35 15 20 10 2 8 2 1 0
副教授(2)
频数数据组织方式
职称 年龄段 人数
1 1
1 2
0 15
1 2 2 2 3 3 3 4 4 4
3 1 2 3 1 2 3 1 2 3
4000 8000
2
1
公务员
自由职业
45
32
3000
1800
2、频数数据的组织方式 • 如果待分析数据为经过分组汇总后的汇总 数据,对该类数据应以频数数据的组织方 式组织。 • 数据编辑窗口中的一行为变量的一个分组 (或多个变量交叉分组下的一个分组) • 数据中的一列仍为一个变量,它代表某个 问题及频数

数据文件的组织
主要包括:原始数据的组织方式 频数数据的组织方式
SPSS数据文件收集
• • SPSS数据文件的保存形式为“xxx . sav”格式。 SPSS数据文件的结构
1、数据结构 类型、取值说明、数据的缺失情况(图2.1) 2、数据内容: 待分析数据(图2.2)
数据结构
• 数据内容
数据视图 可以直接
科学记数法型(Scientific Notation) • 科学记数法型是一种常见的数值型数据的表达方 式。 • 例:1.2E±02。E表示以十为底,±02表示正( 负)的2次方。 • 科学记数法默认最大宽度为8,其中包括了正负 符号位、字母E和符号位后的两位幂次数字。 • (*注:当类型设定为科学记数法型时可以按照 标准型方式输入,SPSS会自行转换)
相关文档
最新文档