数据文件的处理

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

W05.4 W05.5
14 15
直接11 过录CC
0-1 0-1
9
9
9
9
W05.6 16
1
C
0-1
9
9
W05.7 17
1
C
0-1
W06
18 0-1编1 码 C
D
9
9
9
9
W07
19
1
C
D
7
9
W08.1 20-21 2
I
D
97
98
99
99
W08.2 22-23 2
I
D
97
98
99
99
W08.3 24-25 2
100011
1□电话
2□传真机
3□有线电视
4□卫星电视
5□手机
6□笔记本
3)编码:
根据编码表对问卷进行编码,而后将编码结果记录 在问卷上或编码纸上。
定义变量:
即定义变量名、变量类型、变量长度、变量名标签、 变量值标签和缺失值等。
定义变量名(Name)的要求: •变量名不能超过8个字符; •变量名不能以数字开头; •变量名中不能包含+,-,×,/、?、=等运 算和逻辑符号。 •变量名必须唯一,系统中不区分变量名中的大 小写字符。
I
D
97
98
99
99
问 题 001: 您 的 性 别 :
1□ 男
2□ 女
2
问 题 0 0 2 : 您 目 前 的 婚 姻 状 况 ( 单 选 ):
1□ 未 婚
2□ 已 婚
3□ 离 婚 后 未 再 婚
3
4□ 离 婚 后 再 婚
5□ 丧 偶 后 未 再 婚
6□ 丧 偶 后 再 婚
7□ 未 婚 同 居
问题 011:您家中是否有下列物品:(可多选)
第二章 数据文件的处理
数据文件的处理是指把科研、教学 工作过程中的各种信息、数据(Data) 以某种方式存入到计算机的磁盘中,并 进行随时存取、修改、统计分析的全过 程。一般来说,它包括数据编码、建立 数据文件的框架结构、数据录入、选定 数据文件名及保存数据等几个步骤。
第二章 数据文件的处理
数据编码 定义变量 数据录入 数据编辑
或: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 .
或: Variable Labels num 编号 W01 性别 W01a 出生年 W02 婚姻状况 W03 文化程度 .
要求:
•变量名要和已定义过的名称相一致; •标签用中、西文均可,但长度不要超过120个字符, 即60个汉字。
• 数据行列互换: Data Transpose
数据编辑命令
数据子集的选择:Data SelHale Waihona Puke Baiduct Cases • All cases:选择所有的观察量,该选项可以用于
解除先前的选择。
• If condition is satisfied:按指定条件选择。 • Random sample of cases:对观察单位进行随
内部式录入
采用SPSS数据编辑器(SPSS Data Editor)录 入。其优点是不容易错位,缺点是不能自动 后移,录入速度慢,数据错误不容易修改。
数据编辑命令
• 数据搜索
按指定观察量序号搜索:Data Go to Case
搜索指定数据:Edit Find
• 数据排序:Data
行排序)
Sort Cases(对观察量进
变量值标签定义命令:Value labels 该命令是给变量的每一取值加一个说明标注。
格式:
Value Labels 变量名 值1 ‘标签’ 值2 '标签 ' 值3 '标签' … /变量名 值1 ‘标签’ 值2 ‘标签’ 值3 ‘标 签’ … .
数据录入
外部式录入
采用DOS、WPS、CCED等软件,按ASCII码 方式录入成文本文件(*.dat;*.txt)。这种 录入方式的特点是,数据之间没有间隔,录 完一个数码后自动后移,录入速度较快。缺 点是容易错位。
日期型 带有美元符号的数值型 用户自定义型
字符串型
变量名标签定义命令:Variable labels 该命令是给变量名一个说明标注。
命令格式: Variable labels 变量1名 标签 /变量2名 标签 /变量3名 标签 ………/变量n名 标签 .
示例:
Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 .
数据编码:
根据一定的规则将研究资料转换为可进行统计分析 的数码资料的过程。
问题025:您认为打工的外地人对北京市的社会秩
序是否有影响?(单选)
1□有很大影响
2□有较大影响
3□没有影响
4□不好说
4
答案
编码
编码的步骤:
1)确定变量; •变量:
用来反映文意概念的量化形式。在统计中往往指最 小的分析单位。编码就是对变量进行编码。变量由 两个部分构成:变量名和变量值。要注意区分何为 变量,何为变量值。在调查问卷中还要注意区分问 题和变量。
问题009:您有几个儿子?几个女儿? 1□儿子___2____人
变量1的值
2□女儿___3_____人
问题
变量1
变量2
变量2的值
2)制作编码表
变量名 码位 码数 尺度 编码 不适用 不知道 未回答 缺失值 备注
num
1-4
4 Interval Direct
一个该还前WWWWWWWW00000000变11234555变a...变是者123量数量量字在名只码据61111589-是 串 统:0123某不 一 被 一7能一位文数 型 计一适 般 访 般有个:件值 ( 中一变12111111于 采 人 采数某中个S型 可据量被用回用被一tC一占O唯ar文r(以t由码d访答78问一ei访般iICOCCC变据gn一n,,件oaN做r几数g人不l卷般y人采名量的)中99u高位:回知78中采m称拒用000,在栏,---DDDDD,,111级e数答道。出用绝9r位如99,i运组的时99c现9回0定)78,9,算成问的等等9漏答9类—9,,。题编。。答9某、—,9后的码时变9定如99者编。的9量等序定9则码处等9时。9999999。距不。理。的、可编编9定9999999以码码比。。。,
• 定义变量类型(Type)
Numeric Comma
Dot
Scientific N0tation Date Dollar Custom currency String
数值型 加显逗号的数值型,即整数部分每3位数加一个 逗号,其余定义方式同数值型 3位加点数值型,无论数值大小,均以整数形式 显示,每3位加一小点,可定义小数位置,但都 显示0,且小数点用逗号表示。 科学计数法
相关文档
最新文档