利用SPSS分析调查问卷数据
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
饼图
定性变量的图表示:条形图
• 而用同样数据画的图6称为条形 图(bar chart)。
• 从每一条可以看出讲各种语言 的实际人数,而且分别给出了 每个语种中母语和日常使用的 人数(在图中并排放置)。条 形图显示比例不如饼图直观。
条形图
如何用少量数字来概括数据?
• 大量的数字既繁琐又不直观;需 要对数据做人们时间和耐心所允 许的简化
茎叶图
Stem width: 10.00
Each leaf:
1 case(s)
定量变量的图表示:4.散点图
• 数据会有两个变量,如美国男士和女 士初婚年限数据(marriage.txt)。
• 该数据描述了自1900年到1998年男女 第一次婚姻延续的时间。
• 这里年份是一个变量,婚姻延续时间 是第二个变量。由于不可能将所有人 的婚姻年限都给出来,所以每年就取 了一个中间的值(中位数)作为代表。
描述统计分析主要是计算一些 基本的统计量,其中比较 重要的统计量有均值、方差和标准差、峰度、偏度。
数据的描述
• 在对数据进行深入加工之前, 总应该对数据有所印象。
• 可以借助于图形和简单的运算, 来了解数据的一些特征。
• 由于数据是从总体中产生的, 其特征也反映了总体的特征。 对数据的描述也是对其总体的 一个近似的描述。
该图40的横坐标是身高区间,这里每一格代表5cm的身高范围(格子
宽度因不同的数据性质或要求而定,这里的格子宽度为5cm),而
纵坐标为各种身高区间的身高的频数。
30
直方图
20
10
0 150.0 155.0 160.0 165.0 170.0 175.0 180.0 185.0 190.0 195.0 200.0
37
定量变量的图表示
• 直方图
– Age, NetWorth – SPSS: GraphsInteractiveHistogram
Count Co un t
75
50
25
0
40.00
60.00
80.00
Age
600
400
200
0
10.00
20.00
30.00
40.00
NetWorth
38
• 横坐标
28
27
散点图
26
25
24
23
22
21
20 1900
1920
1940
1960百度文库
1980
女
男 2000
定性变量的图表示:饼图
• 定性变量(或属性变量,分类变 量)不能点出直方图、散点图或 茎叶图,但可以描绘出它们各类 的比例。
• 下面用SPSS绘的图5(饼图,pie chart)表示了说世界各种主要语 言人数的比例(language.txt).
数据录入
Rich.sav
数据 \Rich.xls
(rich.sav):福布斯世界富豪排行榜 Rank:排名 Name:姓名 Citizenship:国籍 Region:地区 Age:年龄 NetWorth:净财富(10亿美元) Residence :居住地
问卷调查数据常用的统计分析方法
频数分析、描述统计分析和列联表分析 这是问卷调查最基本、 最常用的分析方法。频数分析是描述统计的初步,分门别类的 统计有效样本量,计算其比重。频数分析可以计算的统计量有: 分位数、中位数、众数等,并可以绘制柱状图、直方图、饼图。
25.00
Africa
Europe
South America
Asia and Pacific
North America
Region
40
• 中间横线
– 中位数
• 封闭盒子的上下两边
– 上下四分位点
• 线段的端点
– 最大值,最小值(线长小于1.5倍盒长)
• 离群点(outlier),极端值(extreme)
• 在spss的数据录入窗口中直接输入就可以了, 几点注意事项: • a. 在数据录入窗口,可看到有一个表格,这个表格中的每一行代表一
份问卷,也称为一个个案. • b. 在数据录入窗口中,可看到表格上方出现了1、2、3、4、5…….的
标签名,这其实是我们在第一步定义变量中,我们为问卷的每一个问题 取的变量名,即1代表第一题,2代表第二题.以次类推.只需要在变量名 下面输入对应问题的答案即可完成问卷的数据录入.比如上述年龄段查 询的例题,如果问卷上勾选了A答案,在1下面输入1就行了(不要忘记我 们通常是用1、2、3、4来代替A、B、C、D的). • c.一行代表一份问卷,所以有几分问卷,就要有几行的数据. 在数据录入完成后, 要做的关键部分就是 问卷的统计分析了.
• 在表格上方可以看到一个变量要设置如下几 项:name(变量名)、type(变量类型)、width(变量值的 宽度)、decimals(小数位) 、label(变量标签) 、 Values(定义具体变量值的标签)、Missing(定义变量 缺失值)、Colomns(定义显示列宽)、Align(定义显示 对齐方式)、Measure(定义变量类型是连续、有序分类 还是无序分类).
HEIGHT Stem-and-Leaf Plot
Frequency Stem & Leaf
9.00
15 . 001223344
17.00
15 . 55666667778899999
20.00
16 . 01112222223333333444
35.00
16 . 55555666666667777788888888888999999
210
200
591658
190
180
170
盒型图
248 322255390
高三男生身高
160
150
盒子的中间横线是数据的中位数(median),封闭盒子的上下两横线 (边)140为上下四分位数(点);按照SPSS的默认选项,如果所有 样本中的N =数目都在离地四区1分613 位点1.5倍盒子长地度区1275之内,则线的端点为 最大和最小值,否则线长就是1.5倍的盒子长度(盒子长度称为四 分位间距地)区,在其外面的度量单独点出
变量设置可如下: name即变量名为1,type即类型可根据答案的类型设置,答案我 们可以用1、2、3、4来代替A、B、C、D,所以我们选择数字型的,即选择Numeric, width宽度为4,decimals即小数位数位为0(因为答案没有小数点),label即变量 标签为“年龄段查询”。Values用于定义具体变量值的标签,单击Value框右半部的 省略号,会弹出变量值标签对话框,在第一个文本框里输入1,第二个输入20—29, 然后单击添加即可.同样道理我们可做如下设置,即1=20—29、2=30—39、3=40— 49、4=50--59;Missing,用于定义变量缺失值, 单击missing框右侧的省略号,会 弹出缺失值对话框, 界面上有一列三个单选钮,默认值为最上方的“无缺失值”; 第二项为“不连续缺失值”,最多可以定义3个值;最后一项为“缺失值范围加可选 的一个缺失值”,在此我们不设置缺省值,所以选中第一项如图;Colomns,定义 显示列宽,可自己根据实际情况设置;Align,定义显示对齐方式,有居左、居右、 居中三种方式;Measure,定义变量类型是连续、有序分类还是无序分类。
定量变量的图表示:3.茎叶图
• 在直方图和盒形图中,很难恢复数据 的原貌。而另一种图:茎叶图(stemand-leaf plots)可以恢复数据
• 以地区1高三男生身高为例(图3), 茎叶图既展示了分布形状又有原始数 据。它象一片带有茎的叶子。茎为较 大位数的数字,叶为较小位数的数字。
其中茎叶图中茎的单位为10cm,而叶子单位为1cm。比如,由于 第一行茎为150cm,因此叶子中的九个数字001223344代表九个数 目150、150、151、152、152、153、153、154、154cm等。每 行左边有一个频数(比如第一行有9个数目,第二行有17个等等); 可以看出最长的一行为从165cm到169cm的一段(有35个数)。
• 下面将从这四个方面来对问卷的处理做详 细的介绍.
定义变量
• 大多数情况下我们需要从头定义变量,在打开SPSS后, 我们可以看到和excel相似的界面,在界面的左下方可 以看到Data View, Variable View两个标签,只需单击 左下方的Variable View标签就可以切换到变量定义界 面开始定义新变量。
• 我们可以用 “平均”,“差距” 或百分比等来概括大量数字。
• 由于定性变量主要是计数,比较 简单,常用的概括就是比例或百 分比。下面主要介绍关于定量变 量的数字描述。
小结
• 例(rich.sav):福布斯世界富豪排行榜
– Rank:排名 – Name:姓名 – Citizenship:国籍 – Region:地区 – Age:年龄 – NetWorth:净财富(10亿美元) – Residence :居住地
41
• 茎叶图
– 欧洲区域富人的年龄 – SPSS: AnalyzeDescriptive Statistics Explore
Frequency Stem & Leaf
1.00 Extremes (=<22) 2.00 3 . 44 9.00 3 . 789999999 18.00 4 . 000001112333344444 14.00 4 . 55555677789999 27.00 5 . 000011111112223333333344444 22.00 5 . 5555666666777888889999 27.00 6 . 000111111112222222333444444 23.00 6 . 55555566678888888899999 16.00 7 . 0000000111123333 18.00 7 . 555666677888999999 12.00 8 . 000222233344 7.00 8 . 5566899 2.00 9 . 22 1.00 9 . 5
SPSS分析调查问卷数据
问卷数据的预处理
SPSS分析调查问卷数据的方法
• 当我们的调查问卷在把调查数据拿回来后, 我们该做的工作就是用相关的统计软件进 行处理,在此,我们以spss为处理软件,来简 要说明一下问卷的处理过程,它的过程大致 可分为四个过程:
• 定义变量﹑数据录入﹑统计分析和结果保存.
开放式题型的设置:诸如你所在的省份是_____这样的填空题即 为开放题,设置这些变量的时候只需要将Value 、Missing两项不 设置即可.
数据录入:Spss数据录入方式
1.读取SPSS格式的数据 2.读取Excel等格式的数据 3.读取文本数据(Fixed和Delimiter) 4.读取数据库格式数据(分如下两步) (1)配置ODBC (2)在SPSS中通过ODBC和数据库进行
§1 如何用图来表示数据?
定量变量的图表示:1.直方图
• 对于一个定量变量,比如某个地区 (地区1)测量了163个高三男生的身 高(S3height1.txt)。
• 用图形来表示这个数据,使人们能够 看出这个数据的大体分布或“形状” 的一个办法是画直方图(histogram)。
• 图1就是利用这个数据由SPSS软件所 画的直方图。
25.00
17 . 0000000011112222233333344
24.00
17 . 555666677777777777888899
13.00
18 . 0111111122333
11.00
18 . 55667788899
4.00
19 .
2.00
19 .
3.00 Extremes
2333 56 (>=198)
图 3.1 地 区 1高 三 男 生 身 高 的 直 方 图
Std. Dev (标准差)=10.91,Mean(均值)=170.9,N(人数)=163
定量变量的图表示:2.盒型图
• 简单一些的是盒形图(boxplot,又称 箱图、箱线图、盒子图)。
• 图2的左边一个是根据地区1高三男生 的身高数据所绘的盒形图;其右边的 图代表另一个地区(地区2)的高三 学生的身高 。 (height.txt,height.sav,第三章例.xls)
调查问卷中的数据编码和录入
调查问卷中的数据编码和录入
调查问卷中的数据编码和录入
调查问卷中的数据编码和录入
• 把一份问卷上面的每一个问题设为一个变量,这样一份问 卷有多少个问题就要有多少个变量与之对应,每一个问题 的答案即为变量的取值.现在我们以问卷第一个问题为例 来说明变量的设置.为了便于说明,可假设此题为: 1.请问你的年龄属于下面哪一个年龄段( )? A:20—29 B:30—39 C:40—49 D:50--59
– 要研究的变量的取值范围 – 格子的宽度因数据性质而定
• 纵坐标
– 频数 – 百分比
• 数据分布的简单描述
– 单峰/双峰 – 对称/非对称 – 数据的疏密
39
• 盒型图
– 不同区域年龄分布 – SPSS: GraphsInteractive Boxplot
100.00
75.00
Age
50.00