SPSS在调查研究中的应用解析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

离散变量和连续变量



上述四类变量又可以分为二大类: 离散变量和连续变量。 离散变量:名义变量和序次变量。把人、 物、事按照他们的性质或特性划分,也叫 分类变量。分类变量不能用来进行数学计 算或转换,比如计算平均数。 连续变量 :间距变量和比率变量。把人、 物、事按照他们的某一特征的数量进行划 分。

然后 Continue、OK就完成。这一过程形成 下面的命令:

与没有限制条件时的命令对比:
2、变量的重新赋值 (Recode)

对某一个变量的类别进行重新分组和赋值。 例如,文化程度(a9), 有9个类别,现在 要重新分类合并为5类或3类。

使用 Recode

Into Same Variables Into Different Variables
每个人可以按照某种特征分类:
身高
很高 比较高 中等 比较矮 很矮
经济状况
富裕 中上 中下 一般 贫穷
健康状况
很好 较好
一般
较差 很差
间距(定距)变量


对于间距变量,次序和数量都很重要。 间距变量的值就是变量的实际值。每二 类之间差异都是相等的。 比如:年龄、身高、体重等。 定距变量的数学运算特性:等于、不等 于,大于、小于,加、减。
带斜杠的都是非党员,不带斜杠的都是党员
如果选择 Unselected Cases Are:Deleted,那 么刚才带斜杠的人都会被从数据中删除掉
所以,数据再保存时,需要特别注意。
5、Temporary 命令(暂时)


前面讲到“选择案例”进行分析。通过 Filter或Delete,把你需要的研究对象挑选 出来。实际上还有一种更简单的办法,就 是使用Temporary 命令,这一命令不能通 过点击菜单得到,必须自己写。 Temporary 命令和你所要做的分析同时运 行;做下一个分析时,上次的Temporary 命令就已经失效。这就带来了很大方便。
二、数据的转换与处理



计算新变量(Compute) 变量的重新赋值(Recode) 变量值的计数(Count) 选择部分案例(Select Cases) Temporary命令 缺失值的处理
1、计算新变量(Compute)


数据分析经常要在已有变量的基础上, 计算一些新变量。例如,计算年龄:调 查时间减去出生时间。 使用 Compute
因变量与自变量


因变量:也叫结果变量或反映变量 (i.e. 自变量影响的结果)。可以是连续变量或 分类变量。 自变量:也叫解释变量或预测变量 (i.e. 用来解释或预测因变量)。可以是连续变 量或分类变量。
变量之间的关系
因果关系
相关关系
第二节 数据整理
SPSS软件概览 数据的转换与处理

二、各种类型变量的比较
变量类型 比例变量和等距变量 基本功能 1、分类识别 2、分辨同一变量数值 之间程度差别 3、分辨同一变量数值 之间程度差距 4、分辨同一变量数值 比例关系 同类变量 1、是否等价(=或≠) 数值关系 2、可排顺序(>或<) 3、任意差距可作比较 (+或-) 4、 任意数值可求比例关系 (×或÷) 常 用 频数、成数; 统计方法 众数、中数、平均数; 方差、标准差; 积差相关、复相关; 正态检验、t 检验、F 检验 等级变量 分类变量 1、分类识别 分类识别 2、分辨同一变量数值 之间程度差别
变量定义

变量名

以英文字母、中文开头,不超过8个字符 唯一性,空格或特殊符号不能使用

变量类型 数值型、字符型、日期型 变量名标签
对变量名的解释说明,增强可读性。

变量值标签
对定类和定序变量是必不可少的。
变量值标签
变量(个案)的增删

增加 Insert variables (cases) 删除 Clear
省份
北京 天津 河北 山西 内蒙古
Байду номын сангаас农民
不祥
黑龙江
吉林 辽宁 ……
序次(定序)变量




序次变量与名义变量类似,所不同的是各类 是有次序之分的,即由小到大、由低到高排 列,或相反。 序次变量的数学运算特性除具有等于或不等 于之外,还有大于或小于之分。但是类与类 之间的距离是不相等的。 健康状况、文化程度、技术等级(职务等级) 您对您目前从事的职业是否满意?


假如你想要计算党员的平均收入,可以有两 种办法:一种是用“选择案例”(Filter或 Delete)将党员挑出来,然后计算平均收入; 另一种就是用Temporary 命令,将我的计算 操作暂时限制在党员。 Temporary 命令的用法:
temporary. select if a6=1. DESCRIPTIVES VARIABLES=a49z /STATISTICS=MEAN STDDEV MIN MAX .

再如:工作环境中 有几种职业危害

然后 Continue、OK就完成。这一过程形成下 面的命令:

我们显示一下计数结果的频数分布,计算一下 平均参保数量(下页)
计数结果的分布情况
每人参加了2种保险
4、选择部分案例(Select Cases)

有时候你只想对数据中 的某一部分案例进行分 析,比如,你只想对党 员这部分人进行分析, 这时就用Select Cases, 把非党员暂时或永久地 排除。
受教育年限
文盲
半文盲 小学
0
3 6
初中
高中 中专 大专及以上
9
12 12 16
比率(定比)变量



受教育年限是间距变量,但是实际上它是测 量等级更高的变量,叫比率变量。 定比变量的数学运算特性:等于、不等于、 大于、小于,加、减、乘、除。 在社会科学中,只满足间距变量而不能同时 满足比率变量的情况极为少见。 一般不区分间距变量和比率变量,而是当作 一类,称为间距变量。 如:年龄、受教育年限、工龄、上一周实际 工作多少小时、上月从本单位获得的全部货 币收入(元)
社会统计软件SPSS 在调查研究中的应用
全总研究室调研四处 张倩颖 2011年10月

第一节 第二节 第三节 第四节
变量及其关系 数据整理 单变量分析 双变量分析
第一节 变量及其关系
变量(数据) 分为四类: 名义变量、序次变 量、间距变量、比率变量。 (定类、定序、定距、定比 ) 了解变量(数据)类型很重要,因为不同 类型的变量(数据)往往使用不同的统计 方法进行分析。
rs 1 6 xi y i
i 1 n 2
皮尔逊(Pearsion) 积差相关
r
列联相关
xi
i 1
n
x y i y n x y
n n2 1


2 C n2
(0≤C<1) 卡方( 2 )检验
ni .n. j nij r s n 2 ni .n. j i 1 j 1 n

选择 Into Different Variables
文化程度:9类变成5类

然后 Continue、OK就完成。这一过程形成下 面的命令:

变量重新赋值也可以进行条件限制,和限 制性的计算新变量的过程基本一样。例如, 你只想对年龄40岁及以上的职工,进行文 化程度的重新赋值,使用If 进行限制


在Target Variable中,写入新的变量名 在Numeric Expression中,写入计算公式
计算年龄

计算的新变量 默认放在数据 的最后一列
计算年龄

变量可以 有条件的 计算。例 如,你只 想计算男 性年龄, 用If 限制

选择 Include if case satisfies condition
一、SPSS概览

讲解统计方法之前,先要熟悉SPSS 软件,操作过程:变量定义、数据 输入、数据整理、变量计算等。
什么是SPSS SPSS窗口 变量定义 数据输入、输出



什么是SPSS?



SPSS是软件英文名称的首字母缩写,原意为 Statistical Package for the Social Sciences,即 “社会科学统计软件包” 随着SPSS产品服务领域的扩大和服务深度的增 加,SPSS公司于2000年正式将英文全称更改为 Statistical Product and Service Solutions,意为 “统计产品与服务解决方案” SPSS已有40年历史,是应用最广的定量数据分 析和管理的统计软件。
名义变量


有很多名义变量,例如 省份、地区、性别、户 口、政治面貌、宗教信 仰、民族、婚姻状况、 职业、国家等 类别的排列和赋值没有 任何实际意义。
宗教
1=佛教 2=天主教 3=基督教 4=穆斯林 5=其他 6=无
婚姻状况 职业
未婚 初婚 再婚 离婚 丧偶 党政机关、企事业单位负责人 办事人员 工人 专业技术人员 商业服务员人员

名义(定类)变量



名义变量是最简单的一种数据类型, 表示为没 有次序的类别。如果只有二类,就是二分类变 量,如果是三类或更多类,就叫多分类变量。 从数学运算特性来讲,名义变量只能有等于或 不等于的性质。 最常见的名义变量就是性别。性别只有二类: 男性和女性。并且没有次序之分。习惯上用1表 示男性,2表示女性。这样赋值是随意的,没有 任何的数学或统计学上的理由。

除非重新选全部,否 则此种筛选一直存在。
选择 If condition is satisfied,点击 If :
Unselected Cases Are:Filter? Delete?
选择 If condition is satisfied,点击 If :
Unselected Cases Are:Filtered (下页)
SPSS窗口
SPSS有三个窗口:

数据编辑窗口 Data Editor Window


数据显示窗口 Data View 变量显示窗口 Variable View

结果输出窗口 Output Viewer Window 命令编辑窗口 Syntax Editor Window
主菜单

菜单引导

1、是否等价(=或≠) 是否等价(=或≠) 2、可排顺序(>或<)
频数、成数; 众数、中数; 全距; 等级相关; 卡方检验
频数、成数; 众数; 异众比; 列联相关; 卡方检验
变量类型 举 例 集中分析
比例变量 和 等距变量 (定比变量) (定距变量) 绝对温度、摄氏温度工资、年龄 平均数
x x 1 x2 xn n

选择 Include if case satisfies condition

然后 Continue、OK就完成。这一过程形成 下面的命令:
3、变量值的计数(Count)


计算一些变量中,某一个值出现的次数。例 如,a631-a638有8个关于保险的问题(1=已 参保,2=未参保,3=不知道),现在我想知 道每个职工都分别已参保了几种保险。 使用 Countc
等级变量 (定序变量) 职级、考试分数等 中数(中位数)
分类变量 (定类变量) 性别、职业分类等 众数
x
i 1
n
i
n
离散分析
标准差
全距
n
异众比
Vr n nm n

常 用 相关分析
( xi x ) 2 n i 1
R xman xmin
斯皮尔曼(Spearman) 等级相关
与Windows Office其他软件类似

10个菜单:
Details in Text page 5
结果输出窗口
命令编辑窗口
数据输入、保存、输出



可以直接输入 可以从Excel导入 使用数据录入软件,例如EpiData,免 费下载 http://www.epidata.dk/download.php 保存Save、另存为Save As 输出为其他类型格式的数据,如Excel、 HTML
2
(-1 < r < +1)
(-1 < rs < +1)
常 用 假设检验
正态分布检验、t 检验、 F 检验等
卡方( 2 )检验
常用量表
里克特( Likert ) 量表 古德曼(Guttman)量表
个案与变量



个案:调查数据所描述的对象。可以是人、动 物、事物。社会调查研究的对象就是人。 变量:指所研究对象的特征,对于不同的人某 个变量的值可以不同。 如调查中,数据所描述的对象或个案就是职工, 对于每个职工都有许多变量,例如出生年月、 文化程度、职业等。数据的每一行是一个职工 个案,每一列是一个变量。
相关文档
最新文档