统计分析及SPSS的应用课后练习答案解析

合集下载

《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第3章)第三章:统计分析与SPSS的应用(第五版) 课后练习答案第一节:描述性统计在本章的课后习题中,我们将通过SPSS软件进行一系列的统计分析。

本节将提供第三章的课后习题答案,通过展示实际的数据和分析结果,帮助读者更好地理解统计分析的应用和SPSS软件的操作。

1. 描述性统计分析题目:使用某城市2019年1月至12月的气温数据,计算月平均气温、最高气温和最低气温的描述性统计指标。

答案:通过SPSS导入数据,选择变量"月份"和"气温",并进行描述性统计分析。

结果显示,2019年1月至12月的气温数据的月平均气温、最高气温和最低气温的描述性统计指标如下:月平均气温:- 平均值:20°C- 标准差:2°C- 最小值:15°C- 最大值:25°C最高气温:- 平均值:28°C- 标准差:3°C- 最小值:22°C- 最大值:35°C最低气温:- 平均值:12°C- 标准差:2°C- 最小值:8°C- 最大值:18°C根据以上结果,我们可以得出结论:2019年该城市的月平均气温在20°C左右,最高气温在28°C左右,最低气温在12°C左右。

气温的变化范围相对较小,波动性较小。

这些结果可以帮助我们对该城市的气候情况进行初步了解。

2. 相关性分析题目:使用某企业2018年1月至12月的销售额和广告投入数据,计算销售额和广告投入之间的相关性。

答案:通过SPSS导入数据,选择变量"销售额"和"广告投入",并进行相关性分析。

结果显示,2018年1月至12月的销售额和广告投入之间的Pearson 相关系数为0.85,表明二者呈现强正相关关系。

《统计分析与SPSS的应用》课后练习答案

《统计分析与SPSS的应用》课后练习答案

《统计分析与SPSS的应用》课后练习答案在学习《统计分析与 SPSS 的应用》这门课程后,通过课后练习能够帮助我们更好地掌握所学知识,并将其应用到实际的数据分析中。

以下是针对部分课后练习的答案及解析。

一、选择题1、在 SPSS 中,用于描述数据集中变量分布特征的统计量是()A 均值B 标准差C 中位数D 众数答案:ABCD解析:均值、标准差、中位数和众数都是描述数据分布特征的常用统计量。

均值反映了数据的集中趋势;标准差反映了数据的离散程度;中位数是将数据排序后位于中间位置的数值;众数则是数据集中出现次数最多的数值。

2、进行独立样本 t 检验时,需要满足的前提条件是()A 样本来自正态分布总体B 两样本方差相等C 两样本相互独立D 以上都是答案:D解析:独立样本 t 检验要求样本来自正态分布总体、两样本方差相等以及两样本相互独立。

只有在这些条件满足的情况下,t 检验的结果才是可靠的。

3、以下哪种方法适用于多组数据的比较()A 单因素方差分析B 配对样本 t 检验C 相关分析D 回归分析答案:A解析:单因素方差分析用于比较三个或三个以上组别的数据是否存在显著差异。

配对样本 t 检验适用于配对数据的比较;相关分析用于研究变量之间的线性关系;回归分析用于建立变量之间的预测模型。

二、简答题1、请简述 SPSS 中数据录入的基本步骤。

答:SPSS 中数据录入的基本步骤如下:(1)打开 SPSS 软件,选择“新建数据文件”。

(2)在变量视图中定义变量的名称、类型、宽度、小数位数等属性。

(3)切换到数据视图,按照定义好的变量逐行录入数据。

(4)录入完成后,保存数据文件。

2、解释相关分析和回归分析的区别。

答:相关分析主要用于研究两个或多个变量之间的线性关系程度和方向,但它并不确定变量之间的因果关系。

相关分析的结果通常用相关系数来表示,如皮尔逊相关系数。

回归分析则不仅可以确定变量之间的关系,还可以建立数学模型来预测因变量的值。

《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章)

《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第9章SPSS的线性回归分析1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。

请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore和phy两门成绩体系散点图步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex导入设置标记→确定。

接下来在SPSS输出查看器中,双击上图,打开图表编辑→点击子组拟合线→选择线性→应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。

但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。

只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。

如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。

与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量的影响显著、哪些不显著。

主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第7章)

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第7章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第7章SPSS的非参数检验1、为分析不同年龄段人群对某商品满意程度的异同,进行随机调查收集到以下数据:满意程度年龄段青年中年老年很不满意126 297 156不满意306 498 349满意88 61 75很满意27 17 44请选择恰当的非参数检验方法,以恰当形式组织上述数据,分析不同年龄段人群对该商品满意程度的分布状况是否一致。

卡方检验步骤:(1)数据→加权个案→对“人数”加权→确定(2)分析→描述统计→交叉表格→行:满意度;列:年龄→Statistics→如图选择→确定满意程度 * 年龄交叉表计数年龄总计青年中年老年满意程度很不满意126 297 156 579 不满意306 498 349 1153满意88 61 75 224很满意27 17 44 88 总计547 873 624 2044卡方检验值自由度渐近显著性(双向)皮尔逊卡方66.990a 6 .000似然比(L) 68.150 6 .000线性关联.008 1 .930McNemar-Bowker 检验. . .b有效个案数2044a. 0 个单元格 (0.0%) 具有的预期计数少于 5。

最小预期计数为 23.55。

b. 仅为 PxP 表格计算(其中 P 必须大于 1)。

因概率P值小于显著性水平(0.05),拒绝原假设,不同年龄度对该商品满意程度不一致。

2、利用第2章第7题数据,选择恰当的非参数检验方法,分析本次存款金额的总体分布与正态分布是否存在显著差异。

分析→非参数检验→旧对话框→1-样本-K—S…→选择相关项:本次存款金额[A5] →确定结果如下:单样本 Kolmogorov-Smirnov 检验本次存款金额数字282正态参数a,b平均值4738.09标准偏差10945.569最极端差分绝对.333正.292负-.333检验统计.333渐近显著性(双尾).000ca. 检验分布是正态分布。

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第 4 章 SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。

Statistics户口所在职业年龄地Valid282282282NMissing000户口所在地Frequency Percent Valid CumulativePercent Percent中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0Total282100.0100.0职业Frequency Percent Valid CumulativePercent Percent 国家机关248.58.58.5商业服务业5419.119.127.7文教卫生18 6.4 6.434.0公交建筑业15 5.3 5.339.4Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1一般农户3512.412.463.5种粮棉专业4 1.4 1.464.9户WORD 格式整理种果菜专业10 3.5 3.568.4户工商运专业3412.112.180.5户退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0Total282100.0100.0年龄Frequency Percent Valid CumulativePercent Percent20 岁以下4 1.4 1.4 1.420~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.550 岁以上4114.514.5100.0Total282100.0100.0分析:本次调查的有效样本为282 份。

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第8章)

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第8章)

《统计分析和SPSS的应⽤(第五版)》课后练习答案解析(第8章)《统计分析与SPSS的应⽤(第五版)》(薛薇)课后练习答案第8章SPSS的相关分析1、对15家商业企业进⾏客户满意度调查,同时聘请相关专家对这15家企业的综合竞争⼒进⾏评分,结果如下表。

编号客户满意度得分综合竞争⼒得分编号客户满意度得分综合竞争⼒得分1 90 70 9 10 602 100 80 10 20 303 150 150 11 80 1004 130 140 12 70 1105 120 90 13 30 106 110 120 14 50 407 40 20 15 60 508 140 130请问,这些数据能否说明企业的客户满意度与其综合竞争⼒存在较强的正相关,为什么?能。

步骤:(1)图形→旧对话框→散点/点状→简单分布→进⾏相应设置→确定;(2)再双击图形→元素→总计拟合线→拟合线→线性→确定(3)分析→相关→双变量→进⾏相关项设置→确定相关性客户满意度得分综合竞争⼒得分客户满意度得分Pearson 相关性 1 .864**显著性(双尾).000N 16 15 综合竞争⼒得分Pearson 相关性.864** 1显著性(双尾).000N 15 15 **. 在置信度(双测)为 0.01 时,相关性是显著的。

两者的简单相关系数为0.864,说明存在正的强相关性。

2、为研究⾹烟消耗量与肺癌死亡率的关系,收集下表数据。

(说明:1930年左右⼏乎极少的妇⼥吸烟;采⽤1950年的肺癌死亡率是考虑到吸烟的效果需要⼀段时间才可显现)。

国家1930年⼈均⾹烟消耗量1950年每百万男⼦中死于肺癌的⼈数澳⼤利亚480 180加拿⼤500 150丹麦380 170芬兰1100 350英国1100 460荷兰490 240冰岛230 60挪威250 90瑞典300 110瑞⼠510 250美国1300 200绘制上述数据的散点图,并计算相关系数,说明⾹烟消耗量与肺癌死亡率之间是否存在显著的相关关系。

《统计分析及SPSS的应用(第五版)》课后练习答案解析(第5章)

《统计分析及SPSS的应用(第五版)》课后练习答案解析(第5章)

统计分析与SPSS 的应用(第五版)》(薛薇)课后练习答案第 5 章SPSS 的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。

现从雇员中随机选出11人参加考试,得分如下:80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。

原假设:样本均值等于总体均值即u=u0=75步骤:生成spss 数据→ 分析→ 比较均值→ 单样本t 检验→ 相关设置→ 输出结果(Analyze->compare means->one-samples T test ;)采用单样本T 检验(原假设H0:u=u0=75, 总体均值与检验值之间不存在显著差异);单个样本统计量N均值标准差均值的标准误成绩1173.739.551 2.880单个样本检验检验值= 75tdf Sig.(双侧)均值差值差分的95% 置信区间下限上限成绩-.44210.668-1.273-7.69 5.14分析:指定检验值: 在test 后的框中输入检验值(填75),最后ok!分析:N=11人的平均值(mean )为73.7 ,标准差(std.deviation )为9.55 ,均值标准误差均值标准误差(std errormean )为2.87. t 统计量观测值统计量观测值为-4.22 ,t 统计量观测值的双尾概率p-值(sig.(2-tailed ))为0.668 ,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14), 由此采用双尾检验比较a 和p 。

T 统计量观测值的双尾概率p-值(sig.(2-tailed ))为0.66 8>a=0.05 所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14), 所以均值在67.31~80.14 内,75 包括在置信区间内, 所以经理的话是可信的。

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第6章)

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第6章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第6章SPSS的方差分析1、入户推销有五种方法。

某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。

从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。

一段时期后得到他们在一个月内的推销额,如下表所示:第一组20.0 16.8 17.9 21.2 23.9 26.8 22.4第二组24.9 21.3 22.6 30.2 29.9 22.5 20.7第三组16.0 20.1 17.3 20.9 22.0 26.8 20.8第四组17.5 18.2 20.2 17.7 19.1 18.4 16.5第五组25.2 26.2 26.9 29.3 30.4 29.7 28.21)请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。

2)绘制各组的均值对比图,并利用LSD方法进行多重比较检验。

(1)分析→比较均值→单因素ANOVA→因变量:销售额;因子:组别→确定。

ANOVA销售额平方和df 均方 F 显著性组之间405.534 4 101.384 11.276 .000组内269.737 30 8.991总计675.271 34概率P-值接近于0,应拒绝原假设,认为5种推销方法有显著差异。

(2)均值图:在上面步骤基础上,点 选项→均值图;事后多重比较→LSD多重比较因变量: 销售额 LSD(L)(I) 组别 (J) 组别 平均差(I-J) 标准 错误 显著性95% 置信区间下限值 上限 第一组第二组 -3.30000*1.60279 .048 -6.5733 -.0267 第三组 .72857 1.60279 .653 -2.5448 4.0019 第四组3.05714 1.60279 .066 -.2162 6.3305 第五组-6.70000* 1.60279 .000 -9.9733 -3.4267 第二组第一组 3.30000* 1.60279 .048 .0267 6.5733 第三组 4.02857* 1.60279 .018 .7552 7.3019 第四组 6.35714* 1.60279 .000 3.0838 9.6305 第五组-3.40000* 1.60279 .042 -6.6733 -.1267 第三组第一组 -.72857 1.60279 .653 -4.0019 2.5448 第二组 -4.02857* 1.60279 .018 -7.3019 -.7552 第四组 2.32857 1.60279 .157 -.9448 5.6019 第五组-7.42857*1.60279.000-10.7019-4.1552第四组第一组-3.05714 1.60279 .066 -6.3305 .2162 第二组-6.35714* 1.60279 .000 -9.6305 -3.0838第三组-2.32857 1.60279 .157 -5.6019 .9448第五组-9.75714* 1.60279 .000 -13.0305 -6.4838第五组第一组 6.70000* 1.60279 .000 3.4267 9.9733 第二组 3.40000* 1.60279 .042 .1267 6.6733第三组7.42857* 1.60279 .000 4.1552 10.7019第四组9.75714* 1.60279 .000 6.4838 13.0305*. 均值差的显著性水平为 0.05。

《统计分析与SPSS的应用(第五版)》课后练习答案(第9章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第9章SPSS的线性回归分析1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS提供的绘制散点图功能进行一元线性回归分析。

请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore和phy两门成绩体系散点图步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy 导入X轴,将sex导入设置标记→确定。

接下来在SPSS输出查看器中,双击上图,打开图表编辑在图表编辑器中,选择“元素”菜单→选择总计拟合线→选择线性→应用→再选择元素菜单→点击子组拟合线→选择线性→应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。

但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。

只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。

如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。

与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量的影响显著、哪些不显著。

《统计分析和SPSS的应用(第五版)》课后练习的答案解析(第9章)

《统计分析和SPSS的应用(第五版)》课后练习的答案解析(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第9章SPSS的线性回归分析1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。

请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore和phy两门成绩体系散点图步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex导入设置标记→确定。

接下来在SPSS输出查看器中,双击上图,打开图表编辑在图表编辑器中,选择“元素”菜单→选择总计拟合线→选择线性→应用→再选择元素菜单→点击子组拟合线→选择线性→应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。

但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。

只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。

如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。

与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量的影响显著、哪些不显著。

统计分析与SPSS的应用(第五版)》课后练习答案(第11章)

统计分析与SPSS的应用(第五版)》课后练习答案(第11章)

统计分析与SPSS的应用(第五版)》课后练习答案(第11章)因子分析是一种用于降维的统计方法,其主要步骤包括:前提条件、因子提取、使因子具有命名解释性和计算样本的因子得分。

针对“基本建设投资分析.sav”数据,我们可以利用主成分方法进行因子分析,以特征根大于1为原则提取因子变量,并从变量共同度角度评价因子分析的效果。

如果因子分析效果不理想,可以重新指定因子个数并进行分析,对两次分析结果进行对比。

另外,对比未旋转的因子载荷矩阵和利用方差极大法进行旋转的因子载荷矩阵,可以直观理解因子旋转对因子命名可解释性的作用。

在进行因子分析之前,我们需要先检查原有变量之间是否存在较强的相关关系。

从相关系数矩阵表中可以看出,一些变量的相关系数都较高,呈较强的线性关系,因此适合进行因子分析。

接下来,我们可以进行KMO和___检验。

从表二中可以看出,巴特利特球度检验统计量的观测值为119.614,相应的概率P-值接近0,说明相关系数矩阵与单位阵有显著差异,原有变量适合做因子分析。

同时,KMO值为0.706,根据KMO 度量标准可知原有变量可以进行因子分析。

最后,我们可以进行因子提取。

在本例中,我们采用主成份分析的方法,并以特征根大于1为原则提取因子变量。

根据结果表格,我们可以看到提取出了一个因子,其初始值为1.000,提取值为0.196,表明该因子解释了一定的方差。

提取方法采用主成份分析,旋转方法采用Kaiser标准化最大方差法。

经过3次迭代后,旋转已收敛。

首先,根据成分矩阵计算各变量的变量共同度以及各因子变量的方差贡献,以此评价因子分析的总体效果。

各变量的共同度如下:食品为0.8999,衣着为0.827,居住为0.788,家庭设备用品及服务为0.806,医疗保健为0.747,交通和通信为0.915,教育文化娱乐服务为0.936,杂项商品和服务为0.814.变量共同度反映了因子对变量信息解释的程度。

在本次因子分析中,大多数原有变量的变量共同度较高,说明提取的因子可以解释原有变量的大部分信息,因子分析效果较好。

统计分析及SPSS的应用课后练习答案解析

统计分析及SPSS的应用课后练习答案解析

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析一一描述统计一一频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表一一条形图一一图表值(频率)一一继续,勾选显示频率表格,点击确定。

职业种果菜专业户10工商运专业34尸退役人员17金融机构35现役军人3Total282年龄Freque ncy Perce nt Valid Perce nt CumulativePerce nt 20岁以下420~35 岁146Valid 35~50 岁9150岁以上41Total282.I賊MItl分析:本次调查的有效样本为282份。

常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。

由于变量中无缺失数据,因此频数分布表中的百分比相同。

2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。

进一步,对不同常住地储户存款金额的基本特征进行对比分析。

分析一一描述统计一一描述,选择存款金额到变量中。

点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续一一确定。

分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。

与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

分析:由表中可以看出,中心城市有200人,边远郊区为82人。

两部分样本存取款金额均呈右偏尖峰分布,且边远郊区更明显。

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第5章)教学教材

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第5章)教学教材

《统计分析和S P S S 的应用(第五版)》课后练习答案解析(第5章)《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第5章SPSS的参数检验1、某公司经理宣称他的雇员英语水平很高,如果按照英语六级考试的话,一般平均得分为75分。

现从雇员中随机选出11人参加考试,得分如下: 80, 81, 72, 60, 78, 65, 56, 79, 77,87, 76 请问该经理的宣称是否可信。

原假设:样本均值等于总体均值即u=u0=75步骤:生成spss数据→分析→比较均值→单样本t检验→相关设置→输出结果(Analyze->compare means->one-samples T test;)采用单样本T检验(原假设H0:u=u0=75,总体均值与检验值之间不存在显著差异);分析:N=11人的平均值(mean)为73.7,标准差(std.deviation)为9.55,均值标准误差(std error mean)为2.87.t统计量观测值为-4.22,t统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668,六七列是总体均值与原假设值差的95%的置信区间,为(-7.68,5.14),由此采用双尾检验比较a和p。

T统计量观测值的双尾概率p-值(sig.(2-tailed))为0.668>a=0.05所以不能拒绝原假设;且总体均值的95%的置信区间为(67.31,80.14),所以均值在67.31~80.14内,75包括在置信区间内,所以经理的话是可信的。

2、在某年级随机抽取35名大学生,调查他们每周的上网时间情况,得到的数据如下(单位:小时):(1)请利用SPSS对上表数据进行描述统计,并绘制相关的图形。

(2)基于上表数据,请利用SPSS给出大学生每周上网时间平均值的95%的置信区间。

(1)分析→描述统计→描述、频率(2)分析→比较均值→单样本T检验每周上网时间的样本平均值为27.5,标准差为10.7,总体均值95%的置信区间为23.8-31.2.3、经济学家认为决策者是对事实做出反应,不是对提出事实的方式做出反应。

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

统计分析与SPSS 的应用(第五版)》(薛薇)课后练习答案第 4 章SPSS 基本统计分析1、利用第2 章第7 题数据采用SPSS 频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析——描述统计——频率,选择“常住地” ,“职业”和“年龄”到变量中,然后,图表——条形图图表值(频率)——继续,勾选显示频率表格,点击确定。

户口所在地职业分析:本次调查的有效样本为282 份。

常住地的分布状况是:在中心城市的人最多,有200 人,而在边远郊区只有82 人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50 岁的人最多。

由于变量中无缺失数据,因此频数分布表中的百分比相同。

2、利用第2 章第7 题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。

进一步,对不同常住地储户存款金额的基本特征进行对比分析。

分析——描述统计——描述,选择存款金额到变量中。

点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。

分析:由表中可以看出,有效样本为282 份,存(取)款金额的均值是4738.09 ,标准差为10945.09 ,峰度系数为33.656 ,偏度系数为5.234 。

与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

200 人,边远郊区为82 人。

两部分样本存取款金额均分析:由表中可以看出,中心城市有呈右偏尖峰分布,且边远郊区更明显。

3、利用第2 章第7 题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能,找到存款金额“与众不同”的样本,并说明理由。

分析——描述统计——描述,选择存款金额到变量中。

《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章)(可打印修改)

《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章)(可打印修改)

X2
80.6107
14.7676
5.4586
0.00001
X3
0.5012
0.1259
3.9814
0.00049
1) 将第一张表中的所缺数值补齐。
2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归
系数的意义。
3) 检验回归方程的线性关系是否显著?
4) 检验各回归系数是否显著?
720.317 8.106 76.643
1.037 -.185
-460006.046 137.667 -293.439
110231.478 14.399 61.803
.737 -.166
244.920
56.190
.323
-512023.307 139.944
68673.579 8.925
.749
-302.324 253.115
2.451
38.305 34.827
.344
-.171 .334 .141
t 35.554 19.720 28.407 23.897 -4.269 -4.173 9.561 -4.748 4.359 -7.456 15.680 -7.893 7.268 7.126
显著性
.000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000
模型
平方和
ANOVAa 自由度
均方
1
回归
1887863315.616
残差
160199743.070
总计
2048063058.686
1 1887863315.616

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第9章)

《统计分析和SPSS的应用(第五版)》课后练习答案解析(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第9章SPSS的线性回归分析1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。

请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore和phy两门成绩体系散点图步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex导入设置标记→确定。

接下来在SPSS输出查看器中,双击上图,打开图表编辑→点击子组拟合线→选择线性→应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。

但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。

只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。

如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。

与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量的影响显著、哪些不显著。

主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。

《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章)

《统计分析和SPSS的应用(第五版)》课后练习答案与解析(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第9章SPSS的线性回归分析1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。

请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。

选择fore和phy两门成绩体系散点图步骤:图形→旧对话框→散点图→简单散点图→定义→将fore导入Y轴,将phy导入X轴,将sex导入设置标记→确定。

接下来在SPSS输出查看器中,双击上图,打开图表编辑在图表编辑器中,选择“元素”菜单→选择总计拟合线→选择线性→应用→再选择元素菜单→点击子组拟合线→选择线性→应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。

但回归直线的拟合效果都不是很好。

2、请说明线性回归分析与相关分析的关系是怎样的?相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。

只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。

如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之前,就进行回归分析,很容易造成“虚假回归”。

与此同时,相关分析只研究变量之间相关的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才能达到研究和分析的目的。

线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或减少。

3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验?检验其可信程度并找出哪些变量的影响显著、哪些不显著。

《统计分析与SPSS的应用》课后练习答案

《统计分析与SPSS的应用》课后练习答案

《统计分析与SPSS的应用》课后练习答案在学习《统计分析与 SPSS 的应用》这门课程后,通过课后练习,我们对所学知识有了更深入的理解和掌握。

以下是针对课后练习的详细答案及相关解释。

一、单选题1、在 SPSS 中,用于描述数据集中变量分布特征的命令是()A FrequenciesB DescriptivesC ExploreD Crosstabs答案:B解释:Descriptives 命令可以提供变量的集中趋势、离散程度等分布特征的统计量。

2、进行独立样本 t 检验时,需要满足的前提条件是()A 样本来自正态分布总体B 两样本方差相等C 以上都是D 以上都不是答案:C解释:独立样本 t 检验要求样本来自正态分布总体,且两样本方差相等。

3、用于分析两个变量之间线性关系强度的统计量是()A 相关系数B 决定系数C 方差D 标准差答案:A解释:相关系数用于衡量两个变量之间线性关系的密切程度。

二、多选题1、以下哪些是 SPSS 中的数据类型()A 数值型B 字符型C 日期型D 以上都是答案:D解释:SPSS 中的数据类型包括数值型、字符型和日期型。

2、方差分析的基本假定包括()A 正态性B 方差齐性C 独立性D 以上都是答案:D解释:方差分析需要满足正态性、方差齐性和独立性这三个基本假定。

三、简答题1、请简述 SPSS 中数据录入的基本步骤。

答:首先打开 SPSS 软件,在变量视图中定义变量的名称、类型、宽度、小数位数等属性。

然后切换到数据视图,逐行录入数据。

在录入过程中,要注意数据的准确性和完整性。

2、解释均值、中位数和众数的含义及适用情况。

答:均值是所有数据的算术平均值,反映数据的集中趋势,但容易受极端值影响。

适用于数据分布较为对称、不存在极端值的情况。

中位数是将数据从小到大排序后位于中间位置的数值,不受极端值影响,适用于数据分布偏态或存在极端值的情况。

众数是数据中出现次数最多的数值,适用于描述数据的集中趋势,尤其在类别数据中常用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第4章SPSS基本统计分析1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。

分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。

Statistics户口所在地职业年龄N Valid282282282Missing000户口所在地Frequency Percent Valid Percent CumulativePercentValid 中心城市200边远郊区82Total282职业Frequency Percent Valid Percent CumulativePercentValid 国家机关24商业服务业54文教卫生18公交建筑业15经营性公司18学校15一般农户35种粮棉专业户4种果菜专业户10工商运专业户34退役人员17金融机构35现役军人3Total282年龄Frequency Percent Valid Percent CumulativePercentValid 20岁以下4 20~35岁146 35~50岁91 50岁以上41 Total282分析:本次调查的有效样本为282份。

常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。

由于变量中无缺失数据,因此频数分布表中的百分比相同。

2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。

进一步,对不同常住地储户存款金额的基本特征进行对比分析。

分析——描述统计——描述,选择存款金额到变量中。

点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。

分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。

与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

分析:由表中可以看出,中心城市有200人,边远郊区为82人。

两部分样本存取款金额均呈右偏尖峰分布,且边远郊区更明显。

3、利用第2章第7题数据,如果假设存款金额服从正态分布,能否利用本章所讲解的功能,找到存款金额“与众不同”的样本,并说明理由。

分析——描述统计——描述,选择存款金额到变量中。

对“将标准化得分另存为变量”打上勾,然后对数据编辑窗口中的最后一列变量标准化Z变量进行排序,并观察,找到它的绝对值大于3的都是“与众不同”的样本。

理由:标准化值反映的是样本值与样本均值的差是几个标准差单位。

如果标准化值等于0,则表示该样本值等于样本均值;如果标准化值大于0,则表示该样本值大于样本均值;如果标准化值小于0,则表示该样本值小于样本均值。

如果标准化值的绝对值大于3,则可认为是异常值。

4、利用第2章第7题数据,结合被调查者的常住地或职业或年龄状况,分析储户的收入分布特征。

分析——描述统计——交叉表,选择常住地、职业、年龄到行中,选择收入水平到列中,勾选“显示复式条形图”。

点击单元格——选择观测值、期望、行、列、合计。

点击统计量——选择卡方。

点击继续。

确定利用列联分析实现。

首先编制列联表,然后进行卡方检验。

以户口和收入的列联分析为例:表中,卡方统计量的观测值等于,概率-P值等于。

若显着性水平设为,由于<,拒绝原假设,表明户口地与收入水平不独立。

5、说明第2章第7题资料中的多选项问题是按照哪种拆分方式拆分的。

利用多选项分析被调查者本次存款的最主要目的是什么。

答:第2章第7题资料的多选项问题是按照分类法拆分的。

目的是为了把多选项问题的分析转化为对多个问题的分析,即对多个SPSS变量的分析。

多选项分类法;存款的最主要目的是正常生活零用6、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了了解住房条件对婆媳关系的影响,对600户家庭进行了调查并进行了列联分析,如下表:1)补充表中第一行和第四行空缺的计算结果。

差一般好Count577860195Expected Count 48.7568.2578195% within婆媳关系29.23%40.00%30.77%100.00%% within住房条件38.00%37.14%25.00%32.50%Count458763195Expected Count48.7568.2578195% within婆媳关系23.08%44.62%32.31%100.00%% within住房条件30.00%41.43%26.25%32.50%Count4845117210Expected Count 52.573.584210% within婆媳关系22.86%21.43%55.71%100.00%% within住房条件32.00%21.43%48.75%35.00%Count150210240600Expected Count150210240600% within婆媳关系25.00%35.00%40.00%100.00%% within住房条件100.00%100.00%100.00%100.00%婆媳关系*住房条件Crosstabulation婆媳关系Total紧张一般和睦住房条件Total2) 写出卡方检验的统计量并说明其构造基本原理。

∑-=ee f f f X 202)(3) 婆媳关系与住房条件有无联系判断婆媳关系与住房条件有无关系:因为P 值为,小于显着性水平,属于高度显着,拒绝原假设,所以婆媳关系与住房条件有关系。

计算结果:卡方统计量:∑∑==-=ricjeijeijoijfff1122) (χ,用于测度各个单元格的观测频数与期望频数的差异,并依卡方理论分布判断差异是否统计显着。

由于期望频数代表的是行列变量独立下的分布,所以卡方值越大表明实际分布与期望分布差异越明显。

本例中,由于概率P值小于显着性水平,应拒绝原假设,婆媳关系与住房条件有关系。

7、利用第2章第4题资料,分析两种减肥产品所产生的效果分布是否一致。

分析——描述统计——交叉表,选择“产品类型”到行,选择“体重变化”到列。

点击统计量——勾选卡方。

点击单元格——选择观察值、期望值、行、列、总计。

点击继续,确定。

将计数数据还原为原始数据,采用交叉分组下的频数分析,并进行卡方检验。

表中,卡方统计量观测值为,对应的概率P-值为,小于显着性水平,应拒绝原假设,说明减肥效果并不一致。

8、根据第2 章第8题数据,回答以下问题:(1)该问卷中的多选项问题是按照哪种方式分解的(2)请给出调查问卷数排在前三位的城市编码。

这三个城市的有效问卷共有多少份(3)股民中有多大比例的人赚钱了有多大比例的人亏钱了(4)股民买卖股票主要依据的是哪种办法股民买卖股票最少依据的是哪种办法(5)要研究专职投资者与业余投资者在股票投资结果上是否有差异,请给出你的分析思路、计算结果和分析绪论。

(1)多选项二分法;(2)102(794份)、101(514份)、401(400份)(3)赚钱比例:%,赔钱比例38%(4)主要依据:基本因素法;最少依据:更跟方法(5)采用列联分析。

卡方检验结果表明:专职和业余投资者在投资结果上存在显着差异。

9、为分析私家车主倾向接受的汽车销售价格是否与其居住地区有关,一家汽车企业的销售汽车价格东部地区中部地区西部地区10万元以下20404010万~20万元50605020万~30万元30202030万元以上402010(1(2)可使用哪种分析方法分析上表请说明分析的基本思路并利用SPSS 进行分析。

(1)变量:汽车价格、居住地区;类型:定序型变量、定类型变量(2)上述是计数数据的组织方式,应首先组织到SPSS的数据编辑器窗口中,再利用交叉分组下的频数分析方法。

利用【交差表】来分析上表,步骤如下:①先将上表中数据录入SPSS 中。

共有400 个个案。

②【分析】→【描述统计】→【交叉表】,将“地区”作为列变量,将“汽车价格”作为行变量,在【统计量】中选择“卡方”,在【单元格】中选择观察值、期望值、行、列和总计,得到分析结果。

③提出原假设:认为地区和汽车价格无关系。

列联分析。

原假设:不同居住区的私家车主接受的汽车价格具有一致性的。

上表可知,如果显着性水平为,由于卡方检验的概率P-值小于显着性水平,因此应拒绝原假设。

由卡方检验表可知,渐进Sig(双侧)为,如果认为显着性水平为,因为< ,所以拒绝原假设,认为地区和汽车价格有关系,地区分布不同,汽车价格也不同。

相关文档
最新文档