spss课后习题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
spss课后习题答案
【篇一:《spss统计软件》练习题库及答案】
t>《spss统计软件》练习题库及答案(本科)
一、选择题(选择类)
(a)1、在数据中插入变量的操作要用到的菜单是:
a insert variable;
b insert case;
c go to case;
d weight cases
(c)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜
单是:
a sort cases;
b select cases;
c compute;
d categoriz
e variables
(c)3、transpose菜单的功能是:
a 对数据进行分类汇总;
b 对数据进行加权处理;
c 对数据进行行列转置;
d 按某变量分割数据
(a)4、用one-way anova进行大、中、小城市16岁男性青年平均
身高的比较,结果给出sig.=0.043,说明:
a. 按照0.05显著性水平,拒绝h0,说明三种城市的平均身高有差别;
b. 三种城市身高没有差别的可能性是0.043;
c. 三种城市身高有差别的可能性是0.043;
d. 说明城市不是身高的一个影响因素
(b)5、下面的例子可以用paired-samples t test过程进行分析的是:
a 家庭主妇和女大学生对同种商品喜好的差异;
b 服用某种药物前后病情的改变情况;
c 服用药物和没有服用药物的病人身体状况的差异;
d性别和年龄对雇员薪水的影响
二、填空题(填空类)
6、merge files菜单用于合并数据库有两种情况:如果两数据库变
量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。
7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡
方检验的菜单是_ crosstabs __。
8、one-samples t test过程用于进行样本所在总体均数___与__已知总体均数_的比较。
三、名词解释(问答类)
9、repeated measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。
10、chi-square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。
比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。
四、简答题(问答类)
11、用spss对数据进行分析的基本流程是什么?
答:(1)、将数据输入spss,并保存;
(2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法;
(3)、按题目要求进行统计分析;
(4)、保存和导出分析结果。
12、对数据进行方差分析时,univariate菜单和multivariate菜单最大的区别是什么?
答:当因变量只有一个时,使用univariate菜单,当因变量不止一个时,使用multivariate菜单。
13、简述spss打开其它格式数据的几种方法?
答:(1)、直接打开:选择菜单file==open==data或直接单击快捷工具栏上的打开按钮;
(2)、使用数据库查询打开:选择菜单file==open database==new query,根据向导打开数据;
(3)、使用文本向导读入文本文件:选择菜单file==read text data 14、指定数据按某个变量进行排序需要用到哪个菜单?
答:date==sort cases
15、两因素以上的方差分析在spss中用什么来完成?
答:这些方差分析一律可归入一般线性模型,所以在spss中都被归入了general lineal model子菜单。
16、简述descriptive statistics菜单的组成和功能。
答:描述性统计分析是统计分析的第一步,做好这第一步是下面进
行正确统计推断的先决条件。
spss中专门为该目的而设计的几个模
块集中在descriptive statistics菜单中,最常用的是列在最前面的
四个过程:
(1)、frequencies过程的特色是产生频数表
(2)、descriptives过程进行一般性的统计描述;
(3)、explore过程用于对数据概况不清时的探索性分析;
(4)、crosstabs过程则完成计数资料和等级资料的统计描述和一般
的统计检验,我们常用的卡方检验也在其中完成。
17、简述在多元线性回归分析中,spss筛选自变量进入回归方程的四种方法。
答:这四种方法是:强迫法、逐步法、向前法、向后法。
(1)逐步回归法(stepwise),是运用甚为广泛的复回归分析方
法之一,也是多元回归分析报告中出现几率最多的一种预测变量的
方法。
它结合“向前法”(forward selection)和“向后法”(backward elimination)二种方式的优点。
(2)向前法是自变量一个一个进入回归模式中,而向后法是先将所
有的自变量纳入回归模式中,之后再逐一将对模式贡献最小的预测
变量移除,直到所有的自变量均达到标准为止。
(3)强迫回归法(enter)也是一种常见的方法,强迫所有变量有
顺序进入回归方程。
18. 试说明多元线性回归分析中的“共线性”问题及判断标准。
答:多元回归分析中要留意“共线性”(collinarity)问题,它是指
由于自变量间的相关太高,造成回归分析的情境困扰,使回归模式
的参数不能完全被估计出来。
自变量间的共线性问题可由容忍度(tolerance)、变异数膨胀因素(vif)和条件指针(condition index;ci)。
一般而言,容忍度越接近0、vif越大或条件指针越大(大于15),则越有可能存在共线性问题。
19、下表是不同职业与工作满意感之间相关分析的结果,试判断不
同职业与满意感之间是否有相关,如果有,相关系数是多少?
答:由于显著性水平p=0.6620.05,说明二者之间不存在显著性相关。
五、分析题(问答类)
20、某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/l)如下:
患者: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07
2.11
健康: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35
1.48 1.56 1.87
(1)将数据录入spss,保存为li1_1.sav;
(2)分析该地克山病患者和健康人的血磷脂是否不同;
(3)保存结果。
21、在数据li1_1.sav中生成新变量temp,当血磷值小于1.5时取
值为1,1.5~2时取值为2,大于2时取值为3,并保存结果。
答:操作步骤如下:
(1)、output variable框:选入x;
(2)、output variable name框:键入temp,单击change钮;
(3)、选中x-temp:单击old and new values钮;
(4)、range: lowest through*单选钮:键入1.5; new value value 单选钮:键入1;单击add钮;
(5)、range: *through*单选钮:两侧分别键入1.5、2;new value value单选钮:键入2;单击add钮;
(6)、range: all other values单选钮; new value value单选钮:
键入3;单击add钮;
(7)、单击continue;
(8)、单击ok;
22、数据li3_1.sav记录的是某班50名学生语、数、外三门科目的考试成绩,分别作出三科得分频数表、计算均数、标准差、中位数、p2.5和p97.5,并画出直方图。
答:操作步骤如下:
(1).analyze==descriptive statistics==frequencies;
(2).variables框:选入变量engl(外)、chin(语)、math (数);
(3).单击statistics钮;
(4).选中mean、std.deviation、median复选框;
(5).单击percentiles:输入2.5:单击add;输入97.5:单击add;
(6)单击continue钮;
(7).单击charts钮;
(8).选中bar charts;
(9).单击continue钮;
(10).单击ok;
23、根据数据li3_1.sav分析该班男、女生在语、数、外三科得分
上有无差异。
答:(1).analyze==compare means==independent-samples t test;
(2)test variables框:选入变量engl(外)、chin(语)、math (数);
(3)grouping variable框:选入变量gender;
(3)单击define groups钮;
(4)选择use specified values,在group1中填1,在group2中填2;
(5)单击continue钮;
(6)单击ok。
24、某驾校学校欲购进一批驾驶模拟训练器,为了知道它们的效果,进行了一次实验。
从新学员中随机抽取12名进行训练,训练前和训
练后分别对学员驾驶技能进行测试,结果如下:
训练前66.0 68.0 70.0 65.0 67.0 82.0 60.5 59.0 71.0 77.0
66.0 70.5
训练后62.5 85.0 70.0 73.0 65.0 63.5 60.5 76.0 75.5 65.0
62.5 72.0
试问模拟器训练的效果如何?
答:用paired-sample t test分析
(1)、录入数据:设变量x1,x2 分别代表训练前和训练后值,在
spss 中输入数据。
(2)、统计分析:依次选择analyze-compare means-paired samples t test(配对t检验),弹出对话框,将变量x1、x2同时
选入paired variables框(同时选中x1、x2)。
在options子对话
框中可定义可信区间和缺失值的处理。
单击ok键提交执行即可得结果。
25、美国国家计算机产品公司在亚特兰大、达拉斯以及西雅图都设
有工厂,生产传真机与打印机。
为了确定这三个工厂的工人的产品
质量管理意识水平,特意从每个工厂随机选取10个工人,对他们进
行质量意识考试,员工考试的结果如下。
请问这三个工厂员工的质
量管理意识水平有无显著差异?若有显著差异,根据统计结果直接
观察,哪个工厂最低?
亚特兰大 85 75 82 76 71 85 79 83 74 78
达拉斯71 75 73 74 69 82 74 78 76 68
西雅图59 64 62 69 75 67 66 62 69 70
答:数据已经输好,分组变量为group,三组取值分别为1、2、3,结果变量为x。
此处先进行单因素方差分析,然后进行两两比较,这
里选择s-n-k法进行两两比较。
操作如下:
(1).选择analyze-compare means- one-way
anova(2).dependent list框:选入x
(3).factor框:选入group
(4).post hoc钮:选中s-n-k复选框,单击continue钮
(5).单击ok钮
26、某项研究欲探讨不同年龄的人完成所有不同难度任务的手眼协
调性情况。
研究数据见task.sav。
年龄下1代表儿童组,2代表青
年组,3代表老年组。
后面分数为手眼协调性分数,越高表示手眼协
调性越好。
试问年龄、任务难度两个因素是如何影响人的手眼协调
性的?
本题的组间变量为年龄,组内变量为不同难度任务。
答:操作步骤如下:(1)、analyze==general lineal
model==repeated measures
(2)、within-subject factor name框:选入组内变量,即不同难度
的任务,我们给其命名为task;
(3)、number of levels框:表示组内变量有几个水平,键入3 ;
(4)、单击add;单击define
(5)、within-subject variables (task)框:选入a1~a3
(6)、 between subjects factor框:选入组间变量,即年龄age
(7)、post hoc纽:对选入因素各水平进行两两比较,选入age;
在s-n-k框打勾。
单击continue
(8).单击ok,结果显示年龄和任务的主效应显著,并且二者交互
作用显著,即二者共同影响人的眼手协调性。
27、设某个计算公司所使用的现行系统,通过每个程序的平均时间
为45秒。
今采用一个新系统进行试验,发现通过9个程序所需的计
算时间如下(单位:秒):
303742353640474845
28、某份调查数据li7_1.sav记录了雇员的性别、工作类型、教育
背景(年)、工作经验(月)和薪水情况,对此数据进行以下分析:(1)不同性别雇员的薪水是否有显著差异?
(2)不同工作类型雇员的薪水是否有显著差异?
(3)雇员的教育背景与薪水之间是否相关,相关程度如何?
(4)雇员的工作经验与薪水之间是否相关,相关程度如何?
答:(1)有;
(2)有,多重比较(post hoc)结果表明:经理与主管和职员的薪水差异都显著,但主管和职员的薪水差异不显著;
(3)雇员的教育背景与薪水之间有显著相关,相关系数为0.661;(4)雇员的工作经验与薪水之间有显著相关,相关系数为0.780。
29、根据数据li7_1.sav,分析雇员的性别、工作类型、教育背景(年)和工作经验(月)是否对其薪水高低有影响,进行多元回归分析,并求出直线方程。
并试着判断是否存在自变量共线性问题。
1.analyze==regression==liner
2.dependent框:选入salary
3.independent框:选入gender、educ、job和prevexp
4.method钮:选择stepwise
5.单击ok钮
结果显示四个变量都进入回归方程,且变量间不存在共线性问题。
30一位老师前后间隔两个月对10名学生的作文进行评分(满分30),利用非参数检验的方法判断这位老师的评分前后是否一致?(数据见teacher.sav)
答:用nonparametric test==two-related-samples tests菜单进行分析,结果显示评分前后是一致的,无显著差异。
31、根据数据li7_1.sav,完成以下任务:
(1)分别对变量工作经验(prevexp)和教育背景(educ)作饼图;
(2)以雇员的不同教育背景(年)对其薪水作条形图,反映不同教育背景下的薪水情况。
操作步骤如下:
(1)选择graph==pie,分别选入prevexp和educ。
(2)选择graph==bar,选择simple,点击define。
在variable 框中选入变量salary,在category axis框中选入变量educ。
点击ok。
【篇二:spss课后作业答案】
>frequencies
frequency table
frequencies
结果解释:
(1)statistics表显示了变量package design,price 和 brand name 都有22个有效观测值。
missing行的值为0表明任何一个变
量都没有缺失值。
频数表—package design,表明package design的每一类的频数,在表中a*有9个、b*有6个、c*有7个;所占的比例分别为:
40.9%、27.3% 和31.8%。
频数表-price,表明price的每一类频数,在表中¥1.19有8个、¥1.39有6个、¥1.59有8个;所占的比例分别为:36.4%、27.3%和36.4%。
频数表—brand name,表明brand name的每一类的频数,在表中k2r 有7个、glory有7个、bissell有8个;所占的比
例分别为31.8%、31.8%和36.4%。
(2)statistics表显示了连续变量goodhousekeeping seal的均
值和标准差分别为1.3636和0.49237,money-back guatantee的
均值和标准差分别为1.2727 和0.45584。
二、相关性分析:correlations
结果解释:表中数据显示以22个数据为基础的package design 和price的相关性是0.126,相应的p-值0.557明显大于0.05,不拒绝
原假设,即package design和price 变量总体上没有相关性。
三、方差分析(一维组间方差分析):
post hoc tests
homogeneous subsets
结果解释:表格descriptives列出了描述统计量,a*的均值最高17.75,其次是c*均值为8.2857,最低的是b*均值为6.00
anova中的一个假设—方差相等的建设。
因为由第二个表得出p值
为0.791大于0.05,不能拒绝原假设,假定三个包装设计的方差相等。
由anova中,总体均值是否相等的检验中的p值,因为p值为0小
于0.05,表示三个包装设计相等的原假设被拒绝。
最后一个表格中包装a*不与b*和c*在同一列,所以它的显著性不同于(高于)包装b*和包装c*;因为包装b*和包装c*在同一列,所以包装b*和包装c*无显著差异。
四、回归分析: regression
【篇三:spss第4、5、6章课后题答案】
计量:39.668
原理:
f0
(3)、先设婆媳关系与住房条件无关,因为显著水平为0.000x小于0.01,则拒绝原假设,两者是有关系的。
8、该窗口是多选项变量集定义窗口
操作流程:1
【多重响应】
【定义变量集】 2、从数值型变量中选择进入多选项变量集的变量到【集合中的变量】 3、在【将变量编码变为】框中指定多选项变量集是按照哪种方法分解的。
4、【名称】框中输入多选项变量集的名称,在【标签】框中输入多选项变量集名称的说明文字。
5、按add键将定义好的多选项变量集加到【多响应集】中。
9、多选项分类法
目的:避免二分法的数据丢失第五章 2、
group statistics
是否做出购买决定
购买方式票丢后购买钱丢后购买
n 200 183
mean .4600 .8798
std. deviation
.49965 .32611
std. error mean
.03533 .02411
原假设为决策与方式无关,由表可知检验值为0小于0.05,则推翻原假设,认为两者有关,心理学家的观点更可信。
原假设为不一致,检验值为0.215大于0.05,则原假设成立,实际结果与模型一致。
4、假设:无显著不同
paired samples statistics
pair 1
饲料一饲料二
mean 32.5778 34.2667
n
9 9
std. deviation
3.81077 5.59933
std. error mean
1.27026 1.86644
paired samples correlations
pair 1
饲料一饲料二
n
9
correlation
.571
sig. .108
paired samples test
pair 1
paired differences
mean std. deviation std. error mean
95% confidence interval of the lower difference
t df
sig. (2-tailed)
upper
饲料一 - 饲料
二 -1.68889 4.63666 1.54555 -5.25294 1.87516 -1.093
8 .306
检验值为0.1530.05 不用拒绝原假设。
independent samples test
钙含量
levenes test for equality of f variances
t-test for equality of means
sig. t df
sig. (2-tailed) mean difference
equal variances assumed
.059 .811 -.584 19 .566 -.89167
equal variances not assumed
-.599 18.645 .557 -.89167
std. error difference
95% confidence interval of the lower difference
upper
1.52682 -4.08734
2.30400
1.48967 -4.01360
2.23027
检验值0.4050.05,不用拒绝原假设以上两种情况均显示没有显著
不同。
7、假设无显著效果
paired samples statistics
pair 1
培训前培训后
mean 489.1667 560.0000
n
12 12
std. deviation
78.09765 61.93839
std. error mean
22.54485 17.88007
paired samples correlations
pair 1
培训前培训后
n
12
correlation
-.135
sig. .675
检验值为0.2050.05不应拒绝原假设第六章
2、(1)、有题知显著水平为0.05,检验值0.010.05,则拒绝原假设。
认为不同类型患者的血压差的总体方差有显著差异。
(2)、1104.128、63.000、11.403 检验值0.0000.05,则拒绝原
假设,认为降压药对不同组患者的降压效果存在显著差异。
(3)、三组、四组分别于1、2、5组具有显著差异,而1、2、5
组与3、4有差
异,综上,3、4组更适合。
4、
由表可知加盟时间平均数为3.5、4,评分增加量平均数为10.6111、12.5556
between-subjects factors
method
1.00
2.00
value label 旧方法新方法
n
9 9
contrast results (k matrix)
dependent variable
method simple contrast level 1 vs. level 2 contrast estimate hypothesized value
a
scoreadd
-1.461。