第二章 数据的初步整理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
离散变量(不连续变量)
7个女人
3个男人
连续变量
女=0 称名变量
男=1
B 品牌好于A品牌。
A 1 极差 2 3 4 5 6 极好 1 极差
B 2 3 4 5 6 极好
顺序变量(等级变量)
ቤተ መጻሕፍቲ ባይዱ
℃
℉ 212
100
0 -18
32 0
零点不是绝对的零点。
等距变量
B
A 1kg
2kg
A的重量是B的两倍。
比率变量
数据文件的建立与管理
• 数据文件的建立
– 使用SPSS DATA EDITOR直接建立 – 调用其它格式的数据
• 数据文件的管理
– 文件的排序、分割与合并 – 数据变换
问卷的题目
• 一般包括两部分资料:
– 个人的背景资料 – 具体调查的内容
个人背景资料
• 可放在问卷前面,也可放在问卷的后面。
– 例如:一项对教师调查的个人背景资料部分
• 用于对数据进行分组处理-SPLIT FILE
– Data ->split file…
部分数据的选取(P43)
• 样本的选取,用于选取部分数据进行分析 -SELECT CASES
– Data->select cases…
修改与建立变量—COMPUTE(P30)
• 最常用的一个过程。用于给变量赋值。
练习
• 将数据文件score1.sav与数据文件 score2.sav合并,然后存为SPSS数据文件 score.sav。 (增加变量还是个案?) • 将learnstr.sav与数据文件score.sav合并, 保存为文件strscore.sav 。(增加变量还 是个案?)
文件的分割(P42)
复选题
• 单选题中,每题只能选一个选项,因而可以用一 个变量代表一个题号,如T1、T2…… • 在复选题中,每个选项均有可能被选答,因而要 对每个选项均要定义一个变量。 • 由于每个选项不是被选中,就是没被选中,故对 每个选项的量化就可以采用二分变量的方式,在 输入数据时,选中了就输入1,没被选中就输入0。
个人信息 年龄: 岁 教龄: 年 性别:……1、男 …… ……2、女 婚姻状况:1、未婚…………2、已婚 学历:……1、中师或中专…2、大专 …3、本科或本科以上 职务:……1、班主任………2、(非班主任)任课教师 3、管理人员……4、其他 来源:……1、师范类………2、非师范类 学校性质:1、小学 2、中学
a8m4
0 0 0
4
5
1
1
1
1
0
0
1
0
练习
• 尝试对《黄冈市中小学教师流失的调查研 究》问卷的变量进行定义。
调用其它格式的数据
File->open->data…
SPSS(*.sav) SPSS/PC+(*.sys) Systat(*.syd) Systat(*.sys) SPSS portable(*.por) EXCEL(*.xls) Lotus(*.w*) SYLK(*.slk) dBase(*.dbf) Text(*.txt) data(*.dat) SPSS for WINDOWS版本的数据格式 SPSS for DOS版本的数据格式 *.syd格式的Systat数据文件 *.sys格式的Systat数据文件 SPSS便携格式的数据文件 EXCEL数据文件(从5.0版~2000版) Lotus数据文件 SYLK数据文件 dBase系列数据文件,(从dBase II~IV) 纯文本格式的数据文件 纯文本格式的数据文件
问卷项目 编号 学校 姓名 性别 题1 … 题50 变量名 ID SCHOOL NAME Gender s1 … s50
复选题
• 研究者期望问卷答案不只一个,被试能尽 量提供自己的多样想法,即被试所圈选的 选项并非单选,而是复选的形式,在统计 上,此即称为复选题(multiple response).
– Transform->compute…
做一做
• 使用已录好的数据文件strscore.sav.将各 维度加在一起,各定义一个新变量: memory, Cognitiv, Compensa, metacogn, Affectiv, Social。
重编码命令——RECODE (p33)
用于从原变量值按照某种一一对应 的关系生成新变量值。 反向计分的处理-同变量的重编码
一、请您根据平时工作的状况和您自己的实际感受和态度进行判断,并在每项陈
述后面相应的数字上划“√”,判断标准如下:
非常不同意 1 不同意 2 不好确定 3 同意 4 非常同意 5
1.我真的把学校的事情当作我自己的事情来处理了 2.我非常乐意今后一直在这所学校工作 3.我对这所学校有很深的个人感情 4.我在学校有那种“大家庭里一分子”的感觉 5.我对这所学校并没有很强的归属感 6.从感情上而言,我并不是很喜欢这所学校
Transform->recode->into same variables…
重编码后存为新的变量
Transform->recode->into different variables…
做一做
• 对组织承诺.sav中的反向计分题目进行重 新编码。
做一做
• 重新编码后存为新的变量schotyp,将城镇 重点与城镇普通学校合并为“城镇学校”。
第二章 数据资料的整理
徐长江 浙江师范大学教师教育学院心理系 E-mail xucj@
本章纲要
• 数据的概念与种类 • 数据文件的建立 • 数据文件的管理
数据及其种类
• 数据
– 是通过具体事物进行计数或测量所得到的描述 事物特征的数量依据。
• 数据的种类
– 变量的测量水平:称名变量、顺序变量、等距 变量、比率变量 – 数据的获得方式:计数数据、测量数据 – 数据分布的形式:连续变量、离散变量
例
有四个选项,则可以定义四个变量:a8m1、a8m2、 a8m3、a8m4,其中a8表示第8题,m1-m4表示四个 选项,此四个选项所组成的集合,称为“复选题题 集”(multiple response sets),以a8表示。
输入数据
id
1 2 3
a8m1
0 1 0
a8m2
1 1 0
a8m3
1 0 1
1 1 1 1 1 1
2 2 2 2 2 2
3 3 3 3 3 3
4 4 4 4 4 4
5 5 5 5 5 5
1. 在用英语时, 如感到紧张 , 我会试着放松自己。1 2 3 4 5 2. 即使害怕出错,我也鼓励自己去多说英语。 1 2 3 4 5
3. 当英语学习效果不错时,我会奖励一下自己。 1 2 3 4 5
具体调查的内容
• 如:你对自己喜欢的明星的熟悉程度如何?
A 只是认识,知道名字,看过他们的表演或节目 B 知道他们的基本情况,例如身高、体重、爱好、 家庭等 C 努力地搜集有关他们的一切消息和新闻
问卷题目的形式
• 最常见的有两种:
– 选择式 – 利克特(Likert)式
选择式
• 从列举的多种答案中挑选最适合个人实际 情况的答案。 • 可以为单选,也可为多选。要求多选时须 在题后注明。
练习
• 调用case目录中“描述部分案例.xls” 。
数据文件的管理
• 文件的合并 • 文件的分割与部分数据的选取 • 数据变换
文件的合并(P39)
• 用于合并文件。 • 纵向合并:增加个案
– Data->merge files->add cases
• 横向合并:增加变量
– Data->merge files->add variables
利克特(Likert)式
• 是现代调查研究中被普遍采用的态度测量 表。 • 基本形式是给出一组陈述,这些陈述都与 某人对某一事物的态度有关。 • 一般分5个等级,也可根据需要简化或增加 等级。如答案选择是:“完全同意;同意; 不一定;不同意;完全不同意”,则选择 “完全同意”的得 5 分,“同意”的得 4 分……。 • 被试做答后,把分数相加就可得出总分。
1 完 全 不 符 合
2 基 本 不 符 合
3 有 点 符 合
4 大 部 分 符 合
5 完 全 符 合
1. 说英语时,我会请对方纠正我所犯的错误。 2. 我和其他同学一起练习英语。 3. 我向会英语的人士请教问题或寻求帮助。
1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
练习(P13)
以学习策略问卷为蓝本,在spss data editor中定义以下变 量,并输入两个样本,然后将其保存在文件learnstr1.sav中。