SPSS分析调查问卷数据的方法.docx

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS分析调查问卷数据的⽅法.docx
S P S S分析调查问卷数据的⽅法
(2012-05-2921:45:13)
标签:分类:
当我们的调查问卷在把调查数据拿回来后 ,我们该做的⼯作就是⽤相关的统计软件进⾏
处理 ,在此 ,我们以 spss为处理软件 ,来简要说明⼀下问卷的处理过程 ,它的过程⼤致可
分为四个过程 :定义变量﹑数据录⼊﹑统计分析和结果保存 .下⾯将从这四个⽅⾯来对问
卷的处理做详细的介绍 .
Spss处理 :
第⼀步 :定义变量
⼤多数情况下我们需要从头定义变量,在打开SPSS后,我们可以看到和excel 相似
的界⾯,在界⾯的左下⽅可以看到DataView,VariableView 两个标签 ,只需单击左下⽅
的 VariableView 标签就可以切换到变量定义界⾯开始定义新变量。

在表格上⽅可以
看到⼀个变量要设置如下⼏项 :name(变量名 )、type(变量类型 )、width(变量值的宽度 )、
decimals(⼩数位 )、label(变量标签 )、Values(定义具体变量值的标签 )、Missing(定义变量缺失值 )、Colomns(定义显⽰列宽)、Align( 定义显⽰对齐⽅式 )、Measure(定义变量
类型是连续、有序分类还是⽆序分类).
我们知道在 spss中,我们可以把⼀份问卷上⾯的每⼀个问题设为⼀个变量,这样⼀份问
卷有多少个问题就要有多少个变量与之对应,每⼀个问题的答案即为变量的取值.现
在我们以问卷第⼀个问题为例来说明变量的设置.为了便于说明 ,可假设此题为 :
1.请问你的年龄属于下⾯哪⼀个年龄段()?
A:20—29B:30—39C:40—49D:50--59
那么我们的变量设置可如下:name 即变量名为 1,type 即类型可根据答案的类型设置,
答案我们可以⽤1、2、3、4 来代替 A、B、C、 D,所以我们选择数字型的,即选择
Numeric,width 宽度为 4,decimals 即⼩数位数位为 0(因为答案没有⼩数点), label 即变量标签为“年龄段查询”。

Values ⽤于定义具体变量值的标签 ,单击 Value 框右半部的省略号,会弹出变量值标签对话框 ,在第⼀个⽂本框⾥输⼊ 1,第⼆个输⼊20—29, 然后单击添加即可 .同样道理我们可做如下设置 ,即 1=20—29、2=30—39、3=40—49、4=50--59;Missing,⽤于定义变量缺失值 ,单击 missing 框右侧的省略号,会弹出缺失值对话框 ,界⾯上有⼀列三个单选钮,默认值为最上⽅的“⽆缺失值”;第⼆项为“不连续缺失值”,最多可以定义 3 个值;最后⼀项为“缺失值范围加可选的⼀个缺失值”,在此我们不设置缺省值,所以选中第⼀项如图; Colomns,定义显⽰列宽 ,可⾃⼰根据实际情况设置; Align ,定义显⽰对齐⽅式 ,有居左、居右、居中三种⽅式; Measure,定义变量类型是连续、有序分类还是⽆序分类。

以上为问卷中常见的单项选择题型的变量设置,下⾯将对⼀些特殊情况的变量设置也
作⼀下说明 .
1.开放式题型的设置 :诸如你所在的省份是 _____这样的填空题即为开放题,设置这些
变量的时候只需要将Value、Missing 两项不设置即可 .
2.多选题的变量设置 :这类题型的设置有两种⽅法即多重⼆分法和多重分类法,在这⾥我们只对多重⼆分法进⾏介绍.这种⽅法的基本思想是把该题每⼀个选项设置成⼀个
变量 ,然后将每⼀个选项拆分为两个选项项,即选中该项和不选中该项.现在举例来说
明在 spss中的具体操作 .⽐如如下⼀例 :
请问您通常获取新闻的⽅式有哪些()
1报纸 2杂志 3电视 4收⾳机 5⽹络
在 spss中设置变量时可为此题设置五个变量 ,假如此题为问卷第三题 ,那么变量名分别为3_1、3_2、3_3、3_4、3_5,然后每⼀个选项有两个选项选中和不选中 ,只需在 Value ⼀
项中为每⼀个变量设置成 1=选中此项、 0=不选中此项即可 .
使⽤窗⼝,我可以把⼀个卷中的所有作量在个窗⼝中⼀次定。

到此 ,我的定量的⼯作就基本上可以束了 .下⾯我要作就是数据的⼊了 . ⾸先 ,我要回到数据⼊窗⼝ ,很 ,只要我点件左下⽅的DataView 就可以了 .
第⼆步 :数据⼊
Spss数据⼊有很多⽅式 ,⼤致有⼀下⼏种 :
1.取 SPSS格式的数据
2.取 Excel 等格式的数据
3.取⽂本数据( Fixed 和 Delimiter)
4.取数据格式数据 (分如下两步 )
(1)配置 ODBC (2)在 SPSS中通 ODBC 和数据⾏
但是于卷的数据⼊其很,只要在 spss的数据⼊窗⼝中直接⼊就可以
了,只是在⾥有⼏点注意的事需要明⼀下.
1.在数据⼊窗⼝ ,我可以看到有⼀个表格,个表格中的每⼀⾏代表⼀份卷,我也称⼀个个案 .
2.在数据⼊窗⼝中 ,我可以看到表格上⽅出了 1、2、3、4、5??.的名 , 其是我在第⼀步定量中 ,我卷的每⼀个取的量名 ,即 1 代表第⼀
,2 代表第⼆ .以次推 .我只需要在量名下⾯⼊的答案即可完成卷的数据⼊ .⽐如上述年段的例 ,如果卷上勾了 A 答案 ,我在 1 下⾯⼊ 1 就⾏了 (不要忘我通常是⽤1、2、3、4 来代替 A 、B、 C、D 的).
3.我知道⼀⾏代表⼀份卷,所以有⼏分卷 ,就要有⼏⾏的数据 .
在数据录⼊完成后 ,我们要做的就是我们的关键部分,即问卷的统计分析了 ,因为这时我们已经把问卷中的数据录⼊我们的软件中了.
第三步 :统计分析
有了数据,可以利⽤SPSS的各种分析⽅法进⾏分析,但选择何种统计分析⽅法,即
调⽤哪个统计分析过程,是得到正确分析结果的关键。

这要根据我们的问卷调查的
⽬的和我们想要什么样的结果来选择.SPSS有数值分析和作图分析两类⽅法.
1.作图分析 :
在 SPSS中,除了⽣存分析所⽤的⽣存曲线图被整合到Analyze 菜单中外,其他的统计绘图功能均放置在graph 菜单中。

该菜单具体分为以下⼏部分::
(1)Gallery:相当于⼀个⾃学向导,将统计绘图功能做了简单的介绍,初学者可以通
过它对 SPSS的绘图能⼒有⼀个⼤致的了解。

(2)Interactive:交互式统计图。

(3)Map:统计地图。

(4)下⽅的其他菜单项是我们最为常⽤的普通统计图,具体来说有:
条图
散点图
线图
直⽅图
饼图
⾯积图
箱式图
正态 Q-Q 图
正态 P-P图
质量控制图
Pareto图
⾃回归曲线图
⾼低图
交互相关图
序列图
频谱图
误差线图
作图分析简单易懂 ,⼀⽬了然 ,我们可根据需要来选择我们需要作的图形 ,⼀般来讲 ,我们较常⽤的有条图 ,直⽅图 ,正态图 ,散点图 ,饼图等等 ,具体操作很简单 ,⼤家可参阅相关书籍 ,作图分析更多情况下是和数值分析相结合来对试卷进⾏分析的 ,这样的效果更好 . 2.数值分析 :
SPSS数值统计分析过程均在Analyze 菜单中,包括:
(1)、Reports 和 DescriptiveStatistics:⼜称为基本统计分析 .基本统计分析是进⾏其他更深⼊的统计分析的前提,通过基本统计分析,⽤户可以对分析数据的总体特征有
⽐较准确的把握,从⽽选择更为深⼊的分析⽅法对分析对象进⾏研究。

Reports 和DescriptiveStatistics 命令项中包括的功能是对单变量的描述统计分析。

DescriptiveStatistics 包括的统计功能有:
Frequencies(频数分析 ):作⽤ :了解变量的取值分布情况
Descriptives(描述统计量分析 ):功能:了解数据的基本统计特征和对指定的变量值进
⾏标准化处理
Explore(探索分析 ):功能 :考察数据的奇异性和分布特征
Crosstabs(交叉分析 ):功能 :分析事物(变量)之间的相互影响和关系
Reports 包括的统计功能有:
OLAPCubes(OLAP 报告摘要表 ):功能 :以分组变量为基础,计算各组的总计、均值和其他统计量。

⽽输出的报告摘要则是指每个组中所包含的各种变量的统计信息。

CaseSummaries(观测量列表 ):察看或打印所需要的变量值ReportSummariesinRow:⾏形式输出报告
ReportSummariesinColumns:列形式输出报告
(2)、CompareMeans(均值⽐较与检验 ):能否⽤样本均值估计总体均值两个变量均值
接近的样本是否来⾃均值相同的总体换句话说,两组样本某变量均值不同,其差异
是否具有统计意义能否说明总体差异这是各种研究⼯作中经常提出的问题。

这就要
进⾏均值⽐较。

以下是进⾏均值⽐较及检验的过程:
MEANS 过程:不同⽔平下(不同组)的描述统计量,如男⼥的平均⼯资 ,各⼯种的平均⼯资。

⽬的在于⽐较。

术语:⽔平数(指分类变量的值数,如 sex 变量有 2 个值,称为有两个⽔平)、单元 Cell(指因变量按分类变量值所分的组)、⽔平组合
Ttest 过程:对样本进⾏T 检验的过程
单⼀样本的 T 检验:检验单个变量的均值是否与给定的常数之间存在差异。

独⽴样本的 T 检验:检验两组不相关的样本是否来⾃具有相同均值的总体(均值是
否相同,如男⼥的平均收⼊是否相同,是否有显着性差异)
配对 T 检验:检验两组相关的样本是否来⾃具有相同均值的总体(前后⽐较,如训练效果,治疗效果 )
one-WayANOVA :⼀元 (单因素 )⽅差分析,⽤于检验⼏个(三个或三个以上)独⽴的组,是否来⾃均值相同的总体。

(3)、ANOVAModels( ⽅差分析 ):⽅差分析是检验多组样本均值间的差异是否具有统
计意义的⼀种⽅法。

例如:医学界研究⼏种药物对某种疾病的疗效;农业研究⼟壤、
肥料、⽇照时间等因素对某种农作物产量的影响;不同饲料对牲畜体重增长的效果等,都可以使⽤⽅差分析⽅法去解决
(4)、Correlate(相关分析 ):它是研究变量间密切程度的⼀种常⽤统计⽅法,常⽤的相关分析有以下⼏种 :
1、线性相关分析:研究两个变量间线性关系的程度。

⽤相关系数r 来描述。

2、偏相关分析:它描述的是当控制了⼀个或⼏个另外的变量的影响条件下两个变量
间的相关性,如控制年龄和⼯作经验的影响,估计⼯资收⼊与受教育⽔平之间的相
关关系
3、相似性测度:两个或若⼲个变量、两个或两组观测量之间的关系有时也可以⽤相
似性或不相似性来描述。

相似性测度⽤⼤值表⽰很相似,⽽不相似性⽤距离或不相
似性来描述,⼤值表⽰相差甚远
(5)、Regression(回归分析 ):功能 :寻求有关联(相关)的变量之间的关系在回归过程
中包括: Liner:线性回归 ;CurveEstimation:曲线估计 ;BinaryLogistic :⼆分变量逻辑回归 ;MultinomialLogistic :多分变量逻辑回归 ;Ordinal 序回归 ;Probit:概率单位回
归;Nonlinear:⾮线性回归 ;WeightEstimation:加权估计 ;2-StageLeastsquares:⼆段
最⼩平⽅法 ;OptimalScaling 最优编码回归 ;其中最常⽤的为前⾯三个 .
(6)、NonparametricTests(⾮参数检验 ):是指在总体不服从正态分布且分布情况不明时,
⽤来检验数据资料是否来⾃同⼀个总体假设的⼀类检验⽅法。

由于这些⽅法⼀般不
涉及总体参数故得名。

⾮参数检验的过程有以下⼏个:
卡⽅检验
⼆项分布检验
游程检验
⼀个样本柯尔莫哥洛夫 -斯⽶诺夫检验
两个独⽴样本检验
个独⽴样本检验
两个相关样本检验
两个相关样本检验
(7)、DataReduction(因⼦分析 )
(8)、Classify(聚类与判别 )等等
以上就是数值统计分析Analyze 菜单下⼏项⽤于分析的数值统计分析⽅法的简介,在我们的变量定义以及数据录⼊完成后,我们就可以根据我们的需要在以上⼏种分析⽅
法中选择若⼲种对我们的问卷数据进⾏统计分析,来得到我们想要的结果 .
第四步 :结果保存
我们的 spss软件会把我们统计分析的多有结果保存在⼀个窗⼝中即结果输出窗⼝
(output),由于 spss软件⽀持复制和粘贴功能,这样我们就可以把我们想要的结果复制
﹑粘贴到我们的报告中 ,当然我们也可以在菜单中执⾏file->save 来保存我们的结果 ,
⼀般情况下 ,我们建议保存我们的数据 ,结果可不保存 .因为只要有了数据 ,如果我们想要
结果的 ,我们可以随时利⽤数据得到结果 .
总结 :
以上便是 spss处理问卷的四个步骤,四个步骤结束后,我们需要 spss软件做的⼯作基本上也就结束了,接下来的任务就是写我们的统计报告了.值得⼀提的是.spss是⼀款在社会统计学应⽤⾮常⼴泛的统计类软件,学好它将对我们以后的⼯作学习产⽣很⼤的意义和作⽤.
SPSS 的问卷分析中⼀份问卷是⼀个案,⾸先要根据问卷问题的不同定义变量。

定义变量值得注意的两点:⼀区
分变量的度量, Measure 的值,其中 Scale 是定量、 Ordinal 是定序、 Nominal 是指定类;⼆注意定义不同的数据类型Type
各⾊各样的问卷题⽬的类型⼤致可以分为单选、多选、排序、开放题⽬四种类型,他们的变量的定义和处理的⽅
法各有不同,我们详细举例介绍如下:
1单选题:答案只能有⼀个选项
例⼀当前贵组织机构是否设有⾯向组织的职业⽣涯规划系统?
A 有
B 正在开创
C 没有
D 曾经有过但已中断
编码:只定义⼀个变量,Value 值 1、 2、3、 4 分别代表 A 、 B、 C、D 四个选项。

录⼊:录⼊选项对应值,如选C则录⼊ 3
2多选题:答案可以有多个选项,其中⼜有项数不定多选和项数定多选。

( 1)⽅法⼀(⼆分法):
例⼆贵处的职业⽣涯规划系统⼯作涵盖哪些组群画钩时请把所有提⽰
考虑在内。

A ⽉薪员⼯
B ⽇薪员⼯
C 钟点⼯
编码:把每⼀个相应选项定义为⼀个变量,每⼀个变量Value 值均如下定义:“0未”选,“1选”。

录⼊:被调查者选了的选项录⼊1、没选录⼊ 0,如选择被调查者选 AC ,则三个变量分别录⼊为1、 0、1。

(2)⽅法⼆:例三你认为开展保持党员先进性教育活动的最重要的⽬标是那三项:
1() 2() 3()
A 、提⾼党员素质B、加强基层组织C、坚持发扬民主
D 、激发创业热情E、服务⼈民群众F、促进各项⼯作
编码:定义三个变量分别代表题⽬中的1、 2、3 三个括号,三个变量Value 值均同样的以对应的选项定义,即:“ 1”A,“2”B,“ 3”C,“ 4”D,“ 5”E,“ 6”F
录⼊:录⼊的数值 1、 2、 3、4、 5、6 分别代表选项 ABCDEF ,相应录⼊到每个括号对应的变量下。

如被调查者三
个括号分别选 ACF ,则在三个变量下分别录⼊ 1、 3、 6。

注:能⽤⽅法⼆编码的多选题也能⽤⽅法编码,但是项数不定的多选只能⽤⼆分法,即⽅法⼀是多选题⼀般处理⽅法。

3排序题:对选项重要性进⾏排序
例四您购买商品时在①品牌②流⾏③质量④实⽤⑤价格中对它们的关注程度先后顺序是(请填代号重新排列)
第⼀位第⼆位第三位第四位第五位
:定五个量,分可以代表第⼀位第五位,每个量的Value都做如下定:“1品”牌,“2流”⾏,“3”量,“4”⽤,“5价”格
⼊:⼊的数字 1、2、3、4、5 分代表五个,如被者把量排在第⼀位在代表第⼀位的量下⼊“3“。

4排序:
例五把例三中的改“你开展保持党先性教育活的最重
的⽬是那三,并按重要性从⾼到低排序”,不。

:以ABCDEF6 个分定 6 个量,每个量的Value都做同的如下定:“1未” ,“2排”第⼀,“3”第⼆,排“4排”第三。

6 个量的分⼊:1(代⼊:以量的 Value ⼊。

⽐如三个括号⾥分的是 ECF,的表 A 未)、 1、 3(代表
C 排在第⼆)、 1、 2、4。

注:⽅法是多和排序的⽅法合的⼀种⽅法,⼀般排序(例四)也同适⽤,只是两者⽤的分析⽅法不同(例四⽤
数分析、例五⽤描述分析),出果从不同的⾯反映的重要性(前⼀种⽅法从位次从量的数看排序,后⼀种⽅法
从量出看排序)。

5开放性数和量表:⽬要求被者⾃⼰填⼊数,或者打分例六你的年():
______
:⼀个量,不定Value
⼊:即⼊被者填⼊的数。

6开放性⽂字:
如果可能的可以按照含相似的答案⾏,成封式⾏分析。

如果答案内容丰富、不容易的,直接做定性分析。

三卷⼀般性分析
下⾯具体介SPSS 中卷的⼀般理⽅法,操作以版本例,以下提到的菜均在Analyze主菜下
1 数分析:Frequencies 程可以做量的数分布表;⽰数据⽂件中由⽤指定的量的特定⽣的
数;得某些描述量和描述数范的量。

适⽤范:(例⼀),排序(例四),多的⽅法⼆(例三)
数分析也是卷分析中最常⽤的⽅法。

:Descriptivestatistics?? Frequencies
2 描述分析:Descriptives: 程可以算量的描述量。

些述量有平均、算和、准差,最⼤、
最⼩、⽅差、范和平均数准等。

适⽤范:并排序(例五)、开放性数(例六)。

:Descriptivestatistics?? Descriptives,需要的量点按Statistics中?
3多重反下的次分析:
适⽤范:多的⼆分法(例⼆)
:第⼀步在MultipleResponse ?? DefineSets 把⼀道多中定了的所有量集合在⼀起,新的集合
量取名,在DichotomiesCountedvalue 中⼊ 1。

第⼆步在MultipleResponse ?? Frequencies中做数分析。

4交叉数分析:解决多量的各⽔平合的数分析的
适⽤范:,适⽤于由两个或两个以上量⾏交叉分形成的列表,量之的关性⾏分析。

⽐如要知道不同⼯作性的
⼈上班使⽤交通⼯具的情况,可以通交叉分析得到⼀个⼆数表⼀⽬了然。

:第⼀步根据分析的⽬的来确定交叉分析的,确定控制量和解量(如上例中不同⼯作性的⼈是
控制量,使⽤交通⼯具是解量)。

第⼆步Descriptivestatistics??Crosstabs
四简单图形描述介绍
SPSS 的作图功在做上述频数分析、描述分析等分析时就可以直接做出图形,简单⽅便,同时也可以另外作图。

能在菜单 Graphs 下,功能强⼤,图形清晰优美。

现在把常⽤图简单介绍如下
1饼图:⼜称圆图,是以圆的⾯积代表被研究对象的总体,按各构成部分占总体⽐重的⼤⼩把圆⾯积分割成若⼲
扇形,⽤以表⽰现象的部分对总体的⽐例关系的统计图。

频数分析的结果宜⽤饼图表⽰。

2曲线图:是⽤线段的升降来说明数据变动情况的⼀种统计图。

它主要表⽰现象在时间上的变化趋势、现象的分
配情况和 2 个现象的依存关系等。

3⾯积图:⽤线段下的阴影⾯积来强调现象变化的统计图。

4条形图:利⽤相同宽度条形的长短或⾼低表现统计数据⼤⼩及变化的统计图。

五问卷深⼊分析
除了以上简单的分析, spss强⼤的功能还可以对问卷进⾏深⼊分析,⽐如常⽤的有聚类分析、交叉分析、因⼦分析、均值⽐分析(参数检验)、相关分析、回归分析等。

因为涉及到很专业的统计知识,下⾯只将个⼈觉得⽐较有⽤的⽅法的适⽤范围和分析⽬的简单做介绍:
1聚类分析
样本聚类,可以将被调查者分类,并按照这些属性计算各类的⽐例,以便明确研究所关⼼的群体。

⽐如按消费特征对被调查者的进⾏聚类。

2相关分析
相关分析是针对两变量或者多变量之间是否存在相关关系的分析⽅法,要根据变量不同特征选择不同的相关性的度量⽅式。

问卷分析中的多数⽤的变量都属于分类变量,要采⽤斯⽪尔曼相关系数。

其中可以⽤卡⽅检验,其是对两变量之间是否具有显着性影响的分析⽅法
3均值的⽐较与检验
(1) Means 过程:对指定变量综合描述分析,分组计算计算均值再⽐较。

⽐如可以按性别变量分为男和⼥来
研究⼆者收⼊是否存在差距。

(2) T 检验:
独⽴样本 t 检验⽤于不相关的样本是否开来⾃具有相同均值的总体的检验。

⽐如,研究购买该产品的顾客和不购
买的顾客的收⼊是否有明显差异。

如果样本不独⽴则要⽤配对t 检验。

⽐如研究参加职业培训后⼯作效率是否提⾼。

4回归分析
问卷分析中的回归分析常采⽤的是⽤离散回归模型,⼀般是逻辑斯蒂模型,解释⼀个变量对另⼀变量的影响具体有多⼤。

⽐如,研究对某商品的消费受收⼊的影响程度。

相关文档
最新文档