SPSS问卷的数据处理教学教案

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

W05.4 W05.5
11直45 接过11 录
C C
0-1 0-1
9
9
9
9
W05.6 16
1
C
0-1
9
9
W05.7 17
1
C
0-1
W06
108 -1编1码 C
D
9
9
9
9
W07
19
1
C
D
7
9
W08.1 20-21 2
I
D
97
98
99
99
W08.2 22-23 2
I
D
97
98
99
99
W08.3 24-25 2
根据二分法,就可以处理成这样:
选择您喜欢的颜色?
4.1 红色:1=有选,0=没选 4.2 橙色:1=有选,0=没选 4.3 黄色:1=有选,0=没选 4.4 缘色:1=有选,0=没选 4.5 蓝色:1=有选,0=没选 4.6 其他:1=有选,0=没选 这样对这道题进行拆分之后,就可以像
来测量 K (1
K1
i
i1 2
)
T
累加李克特量表的信度,其中 K 表示量表中题项
的总数,
2 i
代表第
i
题得分的题内方差,
为总 2
T
题项(总得分)的方差。这种方法是目前最常用
的信度系数。
经验上,如果克朗巴哈系数大于0.9,则认为量 表的内在信度很高,如果克朗巴哈系数大于 0.8,则认为是克接受的,如果系数大于0.7,则认 为量表的设计存在一定的问题,但仍有一定的 参考价值;如果克朗巴哈系数小于0.7,则认为 量表设计存在很大问题应考虑重新设计。
例如,我们正在进行一项消费者对某种商 品评价的调查,要求被调查者回答以下问 题:①消费者的性别。②消费者的职业。 ③消费者的年龄。④消费者对此商品综合 评价分数(0~10)。编码说明书如下:
问题序号及 编码及说明
内容
1.性别
1.男
2.女
2.职业
1.工人 3.军人
2.农民 4.机关干部
5.学生
6.公司职员
Statistical Program for
第一讲 SPSS简介及数据编码录入
1 简介 SPSS是Statistical Program for Social Sciences 的简 称,即社会科学统计程序,由美国SPSS公司1970 年代推出,迄今已有近30年的历史。是国际著名 三大社会科学统计软件包之一(SAS、SPSS、 Statis)。
处理单项选择题一样来处理多选题了。
当一个多项选择题规定要了选择的项目数时, 就采用分类法。它是多选题中要求要选择几个 选项,就定义几个单选变量。每个变量的选项 都和多项选择题的选项相同。每个变量代表被 调查者的一次选择,即记录的是被选中的选项 的代码。比如,有一道多选题(设为题1), 请选出三个最喜欢的洗涤剂品牌,1汰渍,2碧 浪,3立白,4雕牌,5其他。这时则设置三个 单选变量,1.1、1.2、1.3,如果被调查者选择 的是汰渍,雕牌和其他,则变量值1.1取值为1, 1.2取值为4,1.3取值为5。不过此时要注意, 在对数据进行分析的时候,一定要把这几个变 量打包在一个集里,SPSS才能识别这是对多 选题的处理。关于多项选择题的分析,将在最 后一部分的实例中进行详细说明。
在具体处理各种类型问题的数据录入的 时候,情况要区分为单项选择题、多项 选择题和开放题型三种情况。
①单项选择题:单选题情况比较简单, 只需要将各题的选项数字录入到所对应 的题目序号位置就可以了。但是要注意 的是,输入的时候按照一行一份问卷 (即一行一个个案),一列一个问题 (即一列一个变量)进行录入。
用SPSS进行信度分析时注意的问题:由于综 合评价量表中通常包含若干个子方面,因此, 信度分析应针对各个方面主格进行,不可直接 对整个量表进行分析。
如果某特征下设的多个评估项目并非全 部同向,存在反向计分题时,应对它们 进行反向处理后再进行信度分析。对于 事先设计好的量表进行预测试,就可以 用得到的数据在SPSS中进行信度分析, 选择菜单项Analyze下的Scale, Reliability Analysis,把参与信度分析的 表量选择好,并且选择信度系数和要输 出的统计量,就可以对量表进行信度分 析了。
②多项选择题:多选题比单选题要复杂,通常 的处理方法有如下两种:二分法和分类法。
当一个多项选择题没有规定要选多少个选项的 时候,对多选题的录入采用二分法。二分法要 求按照选项来把问题拆开,有几个选项就拆为 几个变量,然后每个变量再分别赋值,选择了 则赋值为1,不选则赋值为0。比如下面的题目, 4、(代表题号)选择您喜欢的颜色_____ (可以多选)。红色、橙色、黄色、绿色、蓝 色、其他。
I
D
97
98
99
99
问 题 001: 您 的 性 别 :
1□ 男
2□ 女
2
源自文库
问 题 0 0 2 : 您 目 前 的 婚 姻 状 况 ( 单 选 ):
1□ 未 婚
2□ 已 婚
3□ 离 婚 后 未 再 婚
3
4□ 离 婚 后 再 婚
5□ 丧 偶 后 未 再 婚
6□ 丧 偶 后 再 婚
7□ 未 婚 同 居
问 题 0 1 1 : 您 家 中 是 否 有 下 列 物 品 :( 可 多 选 )
将该量表发放给20人回答,可以得到回 收后的原始数据,然后就可以用SPSS进 行因子分析的操作,具体操作步骤如下:
① 录入数据
② 因子分析
(1)选择“Analyze Data Reduction Factor…”命令,将变量“A1”到“A10”选 入“Variables”框中
100011
1□ 电 话
2□ 传 真 机
3□ 有 线 电 视
4□ 卫 星 电 视
5□ 大 哥 大
6□ BP 机
3)编码:
根据编码表对问卷进行编码,而后将编码结果记录 在问卷上或编码纸上。
2-2 数据录入
外部式录入
采用DOS、WPS、CCED等软件,按ASCII码 方式录入成文本文件(*.dat;*.txt)。这种 录入方式的特点是,数据之间没有间隔,录 完一个数码后自动后移,录入速度较快。缺 点是容易错位。
序是否有影响?(单选)
1□有很大影响
2□有较大影响
3□没有影响
4□不好说
4
答案
编码
2-1-3编码的步骤: 1)确定变量; •变量:
用来反映文意概念的量化形式。在统计中往往指最 小的分析单位。编码就是对变量进行编码。变量由 两个部分构成:变量名和变量值。要注意区分何为 变量,何为变量值。在调查问卷中还要注意区分问 题和变量。
信度,用 T 表示真分数,B 表示偏差分即系
统误差,E 表示测量误差即随机误差,X 表示按照量表测
到的实得分数,那么X T B E 。若 X=T 则称此量表是可信 的。信度一般规定为真分数的方差在总方差中所占的比
2
2
2
例,即信度=
T
2
1
E
2
或者定义为;信度=
。 T
2
X
X
X
效度,由X Tx T0 B E ,此式即把真分数 T 分 解成了Tx 设计问卷想得到的东西和T0 与测量目的 无关的东西。若 X=T=Tx,则称此量表是有效的, 所以效度一般定义为是与测量目的有关的分数
9
9
99
99
9
9
W数03该据变某文量9一件是变中数量1占值由据型Or几的di(na位栏l N数位uDm组e成ric。)——如定9 距、9 定比,
W W W W
00004555还前...123 是 者字 在11110123 不 一串 统被 一适 般型 计访 般1111于 采( 中人 采被用可S被一回用t问一访7OCCCr以访般答8,in卷般,人做g人采不9中采)9回7000高---D拒用知8,111 出用,,答级绝9道9现9如,9的9运0,回时97,9漏定98问等算9答9的等答9类,题。,,某编。时、9的后9变9码的9定9编者9量等。处等序码999则时。理。。。不的编可999编码以码。。。
举一个具体例子:消费者甲,男性,职 业是农民,年龄为36 岁, 对商品评价为 10分。其编码为10203010。
在资料编码中,应把握好以下问题:① 正确掌握分类的尺度,避免过细导致过 于复杂,或者过粗造成资料信息流失。 ②为保证每一类回答都有类可归,又避 免分类过细,可设置一个“其他”的分 类。③每一个问题中的分类应含义明确, 避免与其他分类产生交叉。④对错误或 疏漏的回答可作为特殊的分类,并指定 一个特殊的数字或字符代表,如用0或-1 等,而不应将其归入其他类中。
问题009:您有几个儿子?几个女儿? 1□儿子___2____人
变量1的值
2□女儿___3_____人
问题
变量1
变量2
变量2的值
2)制作编码表
变量名 码位 码数 尺度 编码 不适用 不知道 未回答 缺失值 备注
num
1-4
4 Interval Direct
一个变WWW变000112量a量码名只位:6能58-一:7 有个某一数121一个据码变唯文Ca数t一量件eICgo名:r中在y 称, DDD。
的方差 2 和总方差 2 中所占的比例,即效度=
Tx
X
2
2
2
2
,或者定义为效度= 。 Tx
2
1
T0
E
2
Tx 2
X
X
X
二者的关系:信度高时效度不一定高,效度
高时信度一定高。下面主要说明信度分析,常用
的信度分析的方法有:重复检测法、交错法、折
半法、克朗巴哈 信度系数法。这里重点说明最后
K
2
一种方法,克朗巴哈提出的用
内部式录入 采用SPSS数据编辑器(SPSS Data Editor)录 入。其优点是不容易错位,缺点是不能自动 后移,录入速度慢,数据错误不容易修改。
一、按照问卷处理的步骤进行描述
1、数据输入
1)数据编码
在进行问卷调查之后,首先要对问卷资料进 行整理,包括对调查所得的各种原始资料进 行审查、检验和分类汇总。在完成了资料的 基本整理以后,就要开始对资料进行编码。 所谓资料的编码就是使用一个规定的数字或 字符代表一个种类回答。对资料进行编码, 可以使众多的资料简化为一连串数字,使这 些资料能输入并存储在计算机中,便于进一 步分析研究。
在进行了信度和效度分析之后,还可以进行问卷 的难易度和鉴别度进行分析,这些主要是在进行 一些试卷研究的分析中采用的。
如果在问卷中有一个题目是以量表的形式出现的, 那么分析问卷中的此题可以用因子分析来进行, 如现要对远程学习者对教育技术资源的了解和使 用情况进行了解,设计一个李克特量表, 远程学 习者对于教育技术资源的了解和使用。
7.教师
8.其他
1.18 岁以下
3.年龄
2.19-30 岁 3.31-45 岁
4.46 岁以上
4.评价
如 10
编码的含义为:①用数字1代表男性; 2代表女性。②根据分析的需要,将消
费者的职业分为工人、农民、军人、机
关干部、学生、公司职员、教师和其他 8大类,并分别用数字1~8代表。③根 据分析的需要,将消费者的年龄分为18 岁以下、19~30岁、31~45岁、46岁以 上四组,并分别用数字1~4代表。④根 据分析需要,用数字1~10分别代表消费 者对商品评价的。
但是在多项选择题中就要注意到,不同 的题型使用不同的方法进行分析的时候, 编码也会有所不同,用二分法进行编码 时和用分类法进行编码时就会有所不同, 根据对一个题目的拆分内容不同编码也 不同,具体的说明在数据录入部分会说 明。
2)数据录入
编码结束以后,就要把数据录入到电脑中,但 是在此之前还需要对变量进行定义。这些在 SPSS中都可以在Data View中完成,包括对变 量名、变量类型、变量标签、指标签、缺失值 和变量尺度等变量的属性进行规定,规定好以 后就可以输入问卷数据了。需要特别注意的是 字符型变量的录入。字符型变量仍然可以转化 为数字录入,但是必须在Data View中对本变 量的Value进行规定,用0表示男,1表示女。 定义好之后在录入的时候就不必输男或女,只 需要输入1或0就可以了。
量表分析
在社会调查研究中,常常涉及到需要测量一些比 较抽象的量,例如“经济地位”、“传统价值 观”、“现代化成都”、“生活态度”、“兴趣 爱好”等等。这样就需要围绕有关的研究目的或 主题设计合理的问卷,那么根据设计出的问题 (这里主要是指量表的设计)得到的问卷结果数 值是否可靠、准确?这就涉及到问卷信度和效度 的分析问题,而在SPSS中,可以很方便地进行这 一方面的分析。因此,在进行问卷调查前,应先 对问卷进行信度和效度的分析。
2 进入SPSS之前的准备工作
编码 录入
2-1数据资料的形式及编码 2-1-1数据资料的形式:
矩阵式数据数据要求每一横行为一个个案(Case), 纵列按变量排列,形成矩阵格式。
2-1-2 编码的概念:
根据一定的规则将研究资料转换为可进行统计分析 的数码资料的过程。
问题025:您认为打工的外地人对北京市的社会秩
相关文档
最新文档