SPSS简介及数据编码录入
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
/
4-2 要求: 缺失值的定义与前面的命令格式不同,它是按照 缺失值的码位数来排列变量的。有相同码位数的 变量放在一组。
上机作业: 1、在DOS下的Edit编辑器下录入问卷。 2、运用SPSS的4个数据定义命令对问卷的 第一页进行定义。
/
Value Labels 变量名 值1 ‘标签’ 值2 '标签 ' 值3 '标签' … /变量名 值1 ‘标签’ 值2 ‘标签’ 值3 ‘标 签’ … .
/
示例: Value labels
W01 1'男' 2'女'
/W02 1‘未婚’ 2‘已婚’ 3‘离婚后未再婚’ 4‘离 婚后再婚’ 5‘丧偶后未再婚’ 6‘丧偶后再婚’ 7‘未婚同居' /W03 1‘不识字或识字很少’ 2‘初小’ 3‘高小’
2-2 要求: •变量名要和已定义过的名称相一致;
•标签用中、西文均可,但长度不要超过120个字符, 即60个汉字。
练习: 问卷 p1变量名标签定义并运行。
/
3. 变量值标签定义命令:Value labels 该命令是给变量的每一取值加一个说明标注。
3-1 格式:
不适用 不知道 未回答 缺失值 9 99 9 9 9 99 9 9
备注
码位:某一变量在 码数: 数据文件中占据的栏位 该变量是数值型( Numeric)——如定距、定比, 某一变量由几位数组成。 0,9 不适于被访人回答的问题的编码。 还是字串型( String ),如定类、定序。 被访人回答不知道时的编码。 被访人拒绝回答某变量时的编码。 9 9 问卷中出现漏答时的处理编码。 一般采用 7 , 97 , 997 等。 前者在统计中可以做高级运算,后者则不可以。 9 9 一般采用 8,98, 998 等。 一般采用 9 , 99 , 999 等。 一般采用9,99,999等。 直接过录
年代推出,迄今已有近30年的历史。是国际著名
三大社会科学统计软件包之一(SAS、SPSS、
Statis)。我们现在使用的是SPSS for Windows 8.0
版。
/
2 进入SPSS之前的准备工作
编码
录入
2-1数据资料的形式及编码
2-1-1数据资料的形式:
5□丧偶后未再婚
6□丧偶后再婚
7□未婚同居
/
问题 011:您家中是否有下列物品: (可多选)
100011
1□电话 2□传真机 3□有线电视
4□卫星电视
5□大哥大
6□BP 机
/
3)编码: 根据编码表对问卷进行编码,而后将编码结果记录 在问卷上或编码纸上。
/
练习:
问卷 p1变量名定义;
问卷问题010、011变量名定义;
问题012变量名定义; 运行。
/
2 变量名标签定义命令:Variable labels 该命令是给变量名一个说明标注。 2-1 命令格式:
Variable labels 变量1名 标签 /变外部式录入
采用DOS、WPS、CCED等软件,按ASCII码 方式录入成文本文件(*.dat;*.txt)。这种 录入方式的特点是,数据之间没有间隔,录 完一个数码后自动后移,录入速度较快。缺 点是容易错位。
内部式录入 采用SPSS数据编辑器(SPSS Data Editor)录 入。其优点是不容易错位,缺点是不能自动 后移,录入速度慢,数据错误不容易修改。
1-2要求: •变量名不能超过8个字符; •变量名不能以数字开头; •变量名中不能包含+,-,×, / 、?、=等运 算和逻辑符号。 •当相邻变量名称上存在顺序且码位相同时,可 用简略方法 : W02 8 W03 9 W04 10.可换为 W02 to W04 8-10. •当变量值是字符时,在码位后加(a);如: W7 12(a); •当变量值包含小数时,在码位后加( n ), n 表 示小数的位数。如:446.79,在录入时要录成 44679,定义时为:W12 12-16(2);
答案
编码 /
2-1-3编码的步骤: 1)确定变量; •变量: 用来反映文意概念的量化形式。在统计中往往指最 小的分析单位。编码就是对变量进行编码。变量由 两个部分构成:变量名和变量值。要注意区分何为
变量,何为变量值。在调查问卷中还要注意区分问
题和变量。 /
矩阵式数据数据要求每一横行为一个个案(Case),
纵列按变量排列,形成矩阵格式。 /
/
/
/
2-1-2 编码的概念: 根据一定的规则将研究资料转换为可进行统计分析 的数码资料的过程。 问题025:您认为打工的外地人对北京市的社会秩 序是否有影响?(单选) 1□有很大影响 2□有较大影响 3□没有影响 4□不好说 4
Statistical Program for Social Sciences
/
第一讲 SPSS简介及数据编码录入
1 简介
SPSS是Statistical Program for Social Sciences 的简
称,即社会科学统计程序,由美国SPSS公司1970
/变量3名 标签 ………/变量n名 标签 .
/
示例:
Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 . 或: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 . 或: Variable Labels num 编号 W01 性别 W01a 出生年 W02 婚姻状况 W03 文化程度 . /
/
练习:
作业:将问卷填答好,并做出问题 001—问题011的编码表,将自己的答案 在问卷上编码。下一节课带问卷上机。
/
第二讲 SPSS数据定义
SPSS的运行步骤如下:
录入数据
定义数据
整理数据 统计数据
察看结果
/
问题009:您有几个儿子?几个女儿? 变量1的值 2 1□儿子_______人 3 2□女儿________ 人 问题
变量2的值
变量1 变量2
/
2)制作编码表
/
变量名 码位 码数 尺度 编码 num 1-4 4 Interval Direct W01 5 1 Category D 变量名 : 一个数据文件中 , W01a 6-7 2 I D 一个变量只能有一个唯一名称。 W02 8 1 C D W03 9 1 Ordinal D W04 10 1 O D W05.1 11 1 C 0-1 W05.2 12 1 C 0-1 W05.3 13 1 C 0-1 W05.4 14 1 C 0-1 W05.5 15 1 C 0-1 W05.6 16 1 C 0-1 W05.7 17 1 C 0-1 W06 18 1 C D W07 19 1 C D W08.1 20-21 2 I D W08.2 22-23 2 I D W08.3 24-25 2 I D
9 9 9 9 9 9 9 99 99 99 9 9 9 9 9 9
0-1编码
7 97 97 97
98 98 98
99 99 99
/
问题 001:您的性别:
1□男
2□女
2
问题 002:您目前的婚姻状况(单选) :
1□未婚
2□已婚
3□离婚后未再婚
3
4□离婚后再婚
/
4 缺失值定义命令:Missing Value 4-1 格式: Missing Value 变量名 变量名 变量名……(缺失值1, 缺失值2,……)
/ 变 量 名 变 量 名 变 量 名 ……( 缺 失 值 1 , 缺 失 值
2,……) .
示例: Missing Value W01 W02 W03(9)/W04 (0,9) /W01a W8.1 W8.2 W8.3(99) .
4‘初中’
5‘高中中专或中技’ 6‘大专’ 7‘大学本科’
8‘研究生以上’
/W04 1‘不识字或识字很少’ 2‘初小’ 3‘高小’ 4‘初中’ /
3-2 要求:
•变量名要和已定义过的名称相一致;
•标签用中、西文均可,但长度不要超过60个字符,
即30个汉字。 练习: 问卷问题001—007的变量值标签定义并运行。
示例: Data list file=’c:\lianxi\lianxi.dat’/ num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10. 或: Data list file=’c:\lianxi\lianxi.dat’/ num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10. /
SPSS数据定义的命令共有4个,分别用来定义数据 的变量名、变量名标签、变量值标签和缺失值。
这些数据定义命令都要写在SPSS的语句窗口 (Syntax)里,而后运行。 1 变量名定义命令:Data List
1-1命令格式:
Data List File=‘原始数据文件名(*.dat)’
/变量1名 码位 变量2名 码位……变量n名 码位. /
4-2 要求: 缺失值的定义与前面的命令格式不同,它是按照 缺失值的码位数来排列变量的。有相同码位数的 变量放在一组。
上机作业: 1、在DOS下的Edit编辑器下录入问卷。 2、运用SPSS的4个数据定义命令对问卷的 第一页进行定义。
/
Value Labels 变量名 值1 ‘标签’ 值2 '标签 ' 值3 '标签' … /变量名 值1 ‘标签’ 值2 ‘标签’ 值3 ‘标 签’ … .
/
示例: Value labels
W01 1'男' 2'女'
/W02 1‘未婚’ 2‘已婚’ 3‘离婚后未再婚’ 4‘离 婚后再婚’ 5‘丧偶后未再婚’ 6‘丧偶后再婚’ 7‘未婚同居' /W03 1‘不识字或识字很少’ 2‘初小’ 3‘高小’
2-2 要求: •变量名要和已定义过的名称相一致;
•标签用中、西文均可,但长度不要超过120个字符, 即60个汉字。
练习: 问卷 p1变量名标签定义并运行。
/
3. 变量值标签定义命令:Value labels 该命令是给变量的每一取值加一个说明标注。
3-1 格式:
不适用 不知道 未回答 缺失值 9 99 9 9 9 99 9 9
备注
码位:某一变量在 码数: 数据文件中占据的栏位 该变量是数值型( Numeric)——如定距、定比, 某一变量由几位数组成。 0,9 不适于被访人回答的问题的编码。 还是字串型( String ),如定类、定序。 被访人回答不知道时的编码。 被访人拒绝回答某变量时的编码。 9 9 问卷中出现漏答时的处理编码。 一般采用 7 , 97 , 997 等。 前者在统计中可以做高级运算,后者则不可以。 9 9 一般采用 8,98, 998 等。 一般采用 9 , 99 , 999 等。 一般采用9,99,999等。 直接过录
年代推出,迄今已有近30年的历史。是国际著名
三大社会科学统计软件包之一(SAS、SPSS、
Statis)。我们现在使用的是SPSS for Windows 8.0
版。
/
2 进入SPSS之前的准备工作
编码
录入
2-1数据资料的形式及编码
2-1-1数据资料的形式:
5□丧偶后未再婚
6□丧偶后再婚
7□未婚同居
/
问题 011:您家中是否有下列物品: (可多选)
100011
1□电话 2□传真机 3□有线电视
4□卫星电视
5□大哥大
6□BP 机
/
3)编码: 根据编码表对问卷进行编码,而后将编码结果记录 在问卷上或编码纸上。
/
练习:
问卷 p1变量名定义;
问卷问题010、011变量名定义;
问题012变量名定义; 运行。
/
2 变量名标签定义命令:Variable labels 该命令是给变量名一个说明标注。 2-1 命令格式:
Variable labels 变量1名 标签 /变外部式录入
采用DOS、WPS、CCED等软件,按ASCII码 方式录入成文本文件(*.dat;*.txt)。这种 录入方式的特点是,数据之间没有间隔,录 完一个数码后自动后移,录入速度较快。缺 点是容易错位。
内部式录入 采用SPSS数据编辑器(SPSS Data Editor)录 入。其优点是不容易错位,缺点是不能自动 后移,录入速度慢,数据错误不容易修改。
1-2要求: •变量名不能超过8个字符; •变量名不能以数字开头; •变量名中不能包含+,-,×, / 、?、=等运 算和逻辑符号。 •当相邻变量名称上存在顺序且码位相同时,可 用简略方法 : W02 8 W03 9 W04 10.可换为 W02 to W04 8-10. •当变量值是字符时,在码位后加(a);如: W7 12(a); •当变量值包含小数时,在码位后加( n ), n 表 示小数的位数。如:446.79,在录入时要录成 44679,定义时为:W12 12-16(2);
答案
编码 /
2-1-3编码的步骤: 1)确定变量; •变量: 用来反映文意概念的量化形式。在统计中往往指最 小的分析单位。编码就是对变量进行编码。变量由 两个部分构成:变量名和变量值。要注意区分何为
变量,何为变量值。在调查问卷中还要注意区分问
题和变量。 /
矩阵式数据数据要求每一横行为一个个案(Case),
纵列按变量排列,形成矩阵格式。 /
/
/
/
2-1-2 编码的概念: 根据一定的规则将研究资料转换为可进行统计分析 的数码资料的过程。 问题025:您认为打工的外地人对北京市的社会秩 序是否有影响?(单选) 1□有很大影响 2□有较大影响 3□没有影响 4□不好说 4
Statistical Program for Social Sciences
/
第一讲 SPSS简介及数据编码录入
1 简介
SPSS是Statistical Program for Social Sciences 的简
称,即社会科学统计程序,由美国SPSS公司1970
/变量3名 标签 ………/变量n名 标签 .
/
示例:
Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 . 或: Variable Labels num 编号 /W01 性别 /W01a 出生年 /W02 婚姻状况 /W03 文化程度 . 或: Variable Labels num 编号 W01 性别 W01a 出生年 W02 婚姻状况 W03 文化程度 . /
/
练习:
作业:将问卷填答好,并做出问题 001—问题011的编码表,将自己的答案 在问卷上编码。下一节课带问卷上机。
/
第二讲 SPSS数据定义
SPSS的运行步骤如下:
录入数据
定义数据
整理数据 统计数据
察看结果
/
问题009:您有几个儿子?几个女儿? 变量1的值 2 1□儿子_______人 3 2□女儿________ 人 问题
变量2的值
变量1 变量2
/
2)制作编码表
/
变量名 码位 码数 尺度 编码 num 1-4 4 Interval Direct W01 5 1 Category D 变量名 : 一个数据文件中 , W01a 6-7 2 I D 一个变量只能有一个唯一名称。 W02 8 1 C D W03 9 1 Ordinal D W04 10 1 O D W05.1 11 1 C 0-1 W05.2 12 1 C 0-1 W05.3 13 1 C 0-1 W05.4 14 1 C 0-1 W05.5 15 1 C 0-1 W05.6 16 1 C 0-1 W05.7 17 1 C 0-1 W06 18 1 C D W07 19 1 C D W08.1 20-21 2 I D W08.2 22-23 2 I D W08.3 24-25 2 I D
9 9 9 9 9 9 9 99 99 99 9 9 9 9 9 9
0-1编码
7 97 97 97
98 98 98
99 99 99
/
问题 001:您的性别:
1□男
2□女
2
问题 002:您目前的婚姻状况(单选) :
1□未婚
2□已婚
3□离婚后未再婚
3
4□离婚后再婚
/
4 缺失值定义命令:Missing Value 4-1 格式: Missing Value 变量名 变量名 变量名……(缺失值1, 缺失值2,……)
/ 变 量 名 变 量 名 变 量 名 ……( 缺 失 值 1 , 缺 失 值
2,……) .
示例: Missing Value W01 W02 W03(9)/W04 (0,9) /W01a W8.1 W8.2 W8.3(99) .
4‘初中’
5‘高中中专或中技’ 6‘大专’ 7‘大学本科’
8‘研究生以上’
/W04 1‘不识字或识字很少’ 2‘初小’ 3‘高小’ 4‘初中’ /
3-2 要求:
•变量名要和已定义过的名称相一致;
•标签用中、西文均可,但长度不要超过60个字符,
即30个汉字。 练习: 问卷问题001—007的变量值标签定义并运行。
示例: Data list file=’c:\lianxi\lianxi.dat’/ num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10. 或: Data list file=’c:\lianxi\lianxi.dat’/ num 1-4 W01 5 W01a 6-7 W02 8 W03 9 W04 10. /
SPSS数据定义的命令共有4个,分别用来定义数据 的变量名、变量名标签、变量值标签和缺失值。
这些数据定义命令都要写在SPSS的语句窗口 (Syntax)里,而后运行。 1 变量名定义命令:Data List
1-1命令格式:
Data List File=‘原始数据文件名(*.dat)’
/变量1名 码位 变量2名 码位……变量n名 码位. /