SPSS数据的录入 (2)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2012-5-5
例如:变量名 变量值 变量取值(标签) Gender 1 男 2 女
定义变量类型
变量类型种类(见下表): • Numeric“ 标准数值型变量,系统默认 • "Comma" 带逗点的数值型变量:千进位用逗 号分隔, 小数与整数间用圆点分隔 • “Dot” 圆点数值型变量:千进位用圆点分隔, 小数与整数间用逗号分隔 • “Scientific notation” 科学计数法 • “Date” 日期型变量 • “Dollar” 带美元符号的数值型变量 • “Custom currency” 自定义变量 2012-5-5 • "String" 字符型变量
2
变量
您目前的婚姻状况( 单选) 问题 002 : 您目前的婚姻状况 ( 单选 ) : 1□未婚 2□已婚 3□离婚后未再婚 5□丧偶后未再 婚 7□未婚同居
4□离婚后再婚 6□丧偶后再婚
1
2012-5-5
您家中是否有下列物品: 可多选) (可多选 问题 011:您家中是否有下列物品: 可多选) ( 1□电话 4□卫星电视 2□传真机 5□手机 3□有线电视 6□BP 机
2012-5-5
定义变量取值标签(Value label)
每个变量名对应一个数据项,每个变 量取不同的值,表示数据项中的不同信息。 有时为了更好理解统计分析过程中的输出 结果,要给变量的取值(简称变量值)赋 以标签。那么在输出结果的相应位置上就 会出现该标签,使读者一目了然。并不是 所有变量值都要取标签,一般来说离散变 量才给变量值定义标签。
选择
这种情况被称为边缘编码
编码
再比如:您有几个儿子?几个女儿? 再比如:您有几个儿子?几个女儿? 2 1□儿子_______人 变量1的值 变量 的值 2□女儿________人 3
问题
变量2的值 变量 的值
变量1 变量 变量2 变量
2012-5-5
还比如:请将您的父母的学历写 在下面的横线上。 父亲:中学 母亲: 小学 编码步骤是: 这种情况称为事后编码,要尽量少用。 这种情况称为事后编码,要尽量少用。
一次观 测的值 数据编辑器
输入数据
定义缺省值
2012-5-5
数据录入
数据录入的一般方式: (1)按变量输入数据 (2)按观察序号输入数据 (3)按全屏幕任意单元格输入数据
2012-5-5
保存数据
• 单击保存类型列表框,可以看到SPSS所支持 的各种数据类型,有DBF、FoxPro、EXCEL、 ACCESS等,这里我们仍然将其存为SPSS自 己的数据格式(*.sav文件)。在文件名框内 键入变量名并回车,可以看到数据管理窗口左 上角由Untitled变为了现在的新变量名。
2012-5-5
例如:择业中考虑的主要因素
(依据重要性先后排列) 1、经济收入 2、专业对口 3、发展前途 4、地理区位 5、个人爱好 6、风险大小 7、劳动强度 8、社会福利 9、其他 316 4785 因为是依据重要性排列,不限制选项, 因为是依据重要性排列,不限制选项, 故应设九个变量,编码依次为: 故应设九个变量,编码依次为: 3,1,6,4,7,8,5,99,99。利用 表示未回答或者空) , , , , , , , , 。利用99表示未回答或者空 表示未回答或者空) ( 2012-5-5
2012-5-5
资料的统一性审查
1. 检查所有问卷、报表填答的方法是否统一。 2. 检查统一指标的数值所使用的量度单位是 否统一,不同的表格对同一指标所使用的 计算方法是否统一。 3. 对于统计资料,尤其要注意:
① 指标的定义和分析的标准是否与自己的研究分 类相一致; ② 审查指标总体范围是否一致
• SPSS11.0中变量定义的一共有10个项目: 变量名(name)、变量类型(type)、变 量长度(width)、小数位数(decimals)、 变量标签(label)、变量值标签 (values)、缺省值(missing)、变量显 示宽度(columns)、变量对齐方式 (align)、变量测量尺度(measure)。 • 注意区分变量的标签(Variable Labels)与 变量值的标签(Value Labels)。
1356
有6个选项,故应设6个变量,运用0-1编码方法 个选项,故应设6个变量,运用0 编码, 编码,即:1,0,1,0,1,1。 此外,多选还有另外一种编码方法, 此外,多选还有另外一种编码方法,即直接编 码输入法,编码为1 。(此处 码输入法,编码为1,3,5,6, , 。(此处 2012-5-5 表示无回答,我们建议使用“99 ) “ ”表示无回答,我们建议使用“99”)
② 变量取值:是变量所有可供选择的范围。
例如性别的取值范围是男、女,那么;年龄来自百度文库 取值范围是0-100岁(当然有长寿的)。
3. 变量标签(label)与取值标签(value label)
标签:标签是对物体的说明,是对物 体信息的描述。例如,中药箱子里的标签 是提醒医生药的具体地点;商品标签则说 明了商品的产地、质量、品牌等信息。 变量标签是对变量的说明。例如 gender=“性别” 取值标签是对取值的说明。例如1=男, 2=女。
这种情况被称为预先编码
比如:您的性别: (1)男 (2)女
变量
变量的取值
选择为 2
编码就是确定变量、变量取值和变量取值标签(选择) 编码就是确定变量、变量取值和变量取值标签(选择)
又比如: 又比如:您认为打工的外地人对太原市的 社会秩序是否有影响?(单选) ?(单选 社会秩序是否有影响?(单选) 1□有很大影响 2□有较大影响 4 3□没有影响 4□不好说
2012-5-5
资料的合格性审查
1. 审查提供资料者的身份是否符合规定的调 查对象的身份。 2. 审查所提供的资料是否符合填答的要求。 3. 审查所提供的资料是否正确。通常有三种 方法:
① 判断检验:依据已知情况来判断是否真实正确。 ② 逻辑检验:从资料的逻辑关系来检验是否正确。 ③ 计算检验:通过各种数字的运算来检验是否正确。
问题012:您择业中考虑的主要因素有(依据 重要性大小排列,限选三项)
1 3 5 7 9
经济收入 发展前途 个人爱好 劳动强度 社会地位
2 专业对口 4 地理区位 6 风险大小 8 社会福利 10 其他
316
因为是依据重要性大小排列,限选三项, 因为是依据重要性大小排列,限选三项,故 应设三个变量,编码依次为3, , 。 应设三个变量,编码依次为 ,1,6。
一、统计分析前的准备工作
资料审查 资料编码
2012-5-5
资料审查
主要考察三个方面:
资料的完整性 资料的统一性 资料的合格性
2012-5-5
资料的完整性
包括资料总体上的完整性和每份 资料的完整性。
1.资料总体的完整性主要考虑问卷发 放的数量、回收率等。 2.每份资料的完整性主要看问卷的填 答情况,是否是有效问卷。
定义变量标签(Variable Label)
定义标签是对该变量名所表示的数据 项内涵的进一步说明。由于变量名最多只 能由8个字符组成,8个字符不足以表示该 变量的内涵。而变量标签最多可由256个字 符组成。在统计分析过程的输出中会在变 量名对应的位置显示该变量的标签,有助 于理解输出结果。变量标签为可选项 (option),可以定义,也可以不定义。
第一讲 数据输入
学习目的
学会常用数据的录入方法 掌握资料录入前的工作
本章主要内容
一 录入数据 录入单选数据 录入多选数据 二
统计分析前的准备工作,包括:
资料的审查 资料编码
一 录入单选数据
变量/指标名称 变量/指标类型 变量/指标的显示方式 录入数据
2012-5-5
SPSS11.0变量定义项目
2012-5-5
定义变量
步骤: 首先启动SPSS,进入 SPSS 的主画面 数据编辑窗口 激活定义变量对话框 定义变量名 定义变量类型 定义变量标签和变量值标签 定义变量的显示格式
2012-5-5
定义变量名
定义变量名应遵循如下原则: (1)变量名最长不超过8个字符(4个汉字)。 (2)首字符必须是英文字母或汉字,不能以下划线“_” 或圆点“.”结尾。 (3) 变量名不能使用SPSS的保留字。SPSS的保留字有: ALL、AND、BY、OR、NOT、EQ、GE、GT、LE、LT、NE、 TO、WIIH等。 (4)变量名中不能有空格或某些特殊符号,如"!"、"?" 和"*"等。 (5)系统中不区分变量名中的大小写字符。例如WANG与 wang被认为是同一变量。
显示格式非常多
Dollar
8
2
可带$或不带 输 可带 或不带$输 或不带 入或科学记数法
有效数值前带$以逗点 有效数值前带 以逗点 为分割符
$12343
$12343
Custom Currency String 8 无 一串字符串 一串字符串 believe believe
录入数据
概率事件(观测量 在数据编辑器的二维表中 概率事件 观测量):在数据编辑器的二维表中 观测量 在数据编辑器的二维表中, 每列为一个变量,每行记录 一次观测(Case) 每列为一个变量 每行记录 一次观测
• 无回答:建议采用“99”/”9”/”999”等作为无 回答的编码 • 不适用:采用“98”/’998”等作为编码
2012-5-5
几种常见的编码方式
1. 封闭性问卷
① 单项选择题 ② 多项选择题 ③ 多项排序选择题 a.固定选择项 b.不固定选择项
2. 开放性问卷
2012-5-5
变量
您的性别: 问题 001 : 您的性别 : 1□男 2□女
择业中考虑的主要因素(多选)
1、经济收入 3、发展前途 5、个人爱好 7、劳动强度 9、其他 2、专业对口 4、地理区位 6、风险大小 8、社会福利
SPSS11.0中变量定义的操作
单击Variable View 进入; 进入; 单击 单击, 单击, 定义 变量 名 单击, 单击,定义 变量类型
定义变量标签
定义变 量宽度
定义 对齐 方式 变量标 签值 定义测度层次
2012-5-5
定义变量类 型对话框
定义变量标签 值对话框
定义变量定义缺 省值对话框
2012-5-5
编码
几个基本概念
1. 编码 2. 变量与取值 3. 变量标签与取值标签
2012-5-5
几个基本概念
1. 编码:将文字资料转化为数字 形式的过程。编码的过程实质 上就是确定变量、变量取值以 及选择的过程
2012-5-5
2. 变量与变量取值
① 变量:
变量是概念的一种类型,是概念的具体化。概念是 对研究范围内同一类现象的概括性表述。概念、变 量、陈述、形式共同构成了理论。例如,公民这一 概念,具体化为一个国家的所有公民后,就成为了 变量。变量反映了概念的可变动性,说明了现象在 规模、重量、密度、速度等方面的变化。(袁方) 反映对象某一特性的指标。例如,性别、年龄等
变量的类型
SPSS变量 变量 类型 Numeric Comma Dot Scietific notation Date 系统默 认长度 8 8 8 8 小数位数 输入方式 显示方式 输入 2 2 2 2 标准格式或科学 记数法 带逗点的数值或 科学记数法 带圆点的数值或 科学记数法 科学记数法 标准格式或 日期格式非常多 标准格式数值变量原点 表示小数点的数值 原点做小数点,逗点做 原点做小数点, 三位分割符的数值 逗点做小数点, 逗点做小数点,原点做 三位分割符的数值 科学记数法 38.42 1,343,438. 1 34,3434E2 457.8E4 范例 显示 38.42 1,343,438.1 3.434,34 457.8E4
• SPSS for Windows提供两种数据保存方式: 1.保存为SPSS for Windows数据文件中 2.保存为其他格式的数据文件 SPSS的文件类型 数据文件:扩展名为.sav 结果文件:扩展名为.spo 图形文件:扩展名为.cht 命令文件:扩展名为.sps
定义数值长度和小数点位数
(1)编码:将学历按照“未上过学”=1,“小 学”=2,“中学”=3……依次列出 (2)各变量为“父亲学历、母亲学历”,取值为 “未上过学,小学,中学,……” (3)输入问卷时,按照编码中的“小学”=2, “中学=3”输入“父亲学历 3”,“母亲学历 2”即 可。
附带说明:关于无回答与不适用的编码
相关文档
最新文档