《统计分析与SPSS的应用(第五版)》课后练习答案(第9章)
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
选择线性 应用 再选择元素菜单
分析:如上图所示,通过散点图,被解释变量 y(即: fore)与解释变量 phy有一定 的线性关系。但回归直线的拟合效果都不是很好。
2、 请说明线性回归分析与相关分析的关系是怎样的? 相关分析是回归分析的基础和前提, 回归分析则是相关分析的深入和继续。
相关分析需要依
靠回归分析来表现变量之间数量相关的具体形式, 而回归分析则需要依靠相关分析来表现变
3) 检验回归方程的线性关系是否显著? 4) 检验各回归系数是否显著? 5) 计算判定系数,并解释它的实际意义。 6) 计算回归方程的估计标准误差,并解释它的实际意义。
(1)
模型
1
回归
残差 总计
平方和
自由度
12026774.1
3
1431812.6
26
13458586.7
29
均方 4008924.7
F 72.8
《统计分析与 SPSS的应用(第五版) 》(薛薇) 课后练习答案
第 9 章 SPSS的线性回归分析
1、利用第 2 章第 9 题的数据, 任意选择两门课程成绩作为解释变量和被解释变量, 利用 SPSS 提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程 成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条 分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。
剔除 农业劳动者人数 (百万人 )和粮食播种面积 (万公顷 )后:
步骤: 分析 回归 线性 将粮食总产量导入因变量、 其余 4 个变量 (施用化肥量 (kg/ 公顷 ), 风灾面积比例 (%), 年份 , 总播种面积 (万公顷 ))导入自变量 方法项选 “输入” 确定。 如 下图:
模型
1
(常量)
年份
Model
Sum of Squares
Df
Mean Square
F
Sig.
Regression
4008924.7
8.88341E-13
Residual
Total
13458586.7
29
Unstandardized Codfficients
B
Std.Error
t
Sig.
(Constant)
7589.1025
t -7.456 7.268 7.126 15.680 -7.893
显著性 .000 .000 .000 .000 .000
粮食总产量回归方程: Y=-7.893X1+15.68X2+7.126X3+7.268X4-7.456
6、 一家产品销售公司在 30 个地区设有销售分公司。为研究产品销售量 (y) 与该公司的销售 价格( x1)、各地区的年人均收入 (x2) 、广告费用 (x3) 之间的关系,搜集到 30 个地区的有关 数据。进行多元线性回归分析所得的部分分析结果如下:
方法:采用进入回归策略。
步骤:分析 回归 线性 将 MathSAT 导入因变量、其余变量导入自变量
确定。
结果如下:
已输入 / 除去变量 a
模型
已输入变量
已除去变量
方法
1
Gender, SAT b. 已输入所有请求的变量。
模型摘要
模型 1
R
a
.710
量之间数量变化的相关程度。 只有当变量之间存在高度相关时, 进行回归分析寻求其相关的
具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之
前,就进行回归分析,很容易造成“虚假回归” 。与此同时,相关分析只研究变量之间相关
的方向和程度, 不能推断变量之间相互关系的具体形式, 也无法从一个变量的变化来推测另
(kg/ 公顷 ) (kg/ 公顷 ), 风灾面积比例 (%) (kg/ 公顷 ), 风灾面积比例 (%), 年
(kg/ 公顷 ), 风灾面积比例 (%), 年
ANOVAa
模型
平方和
自由度
均方
1
回归
1887863315.616
1 1887863315.616
残差
160199743.070
33
4854537.669
主要包括回归方程的拟合优度检验、 显著性检验、 回归系数的显著性检验、 残差分析等。
线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释 变量和解释变量之间确实存在显著的线性关系。
回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著
,用
线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等。
标准估算的错误
.919
2203.30154
.947
1785.90195
.966
1428.73617
.987
885.05221
a. 预测变量:(常量),施用化肥量 b. 预测变量:(常量),施用化肥量 c. 预测变量:(常量),施用化肥量 份 d. 预测变量:(常量),施用化肥量 份 , 总播种面积 ( 万公顷 )
选择 fore和 phy两门成绩体系散点图 步骤:图形 旧对话框 散点图 简单散点图 sex导入设置标记 确定。
定义 将 fore导入 Y 轴,将 phy导入 X 轴,将
接下来在 SPSS输出查看器中,双击上图,打开图表编辑
在图表编辑器中, 选择“元素” 菜单 选择总计拟合线 点击子组拟合线 选择线性 应用。
总播种面积 ( 万公顷 )
施用化肥量 (kg/ 公顷 )
风灾面积比例 (%)
a. 因变量:粮食总产量 (y 万吨 )
系数 a
非标准化系数
B
标准错误
-512023.307
68673.579
253.115
34.827
2.451
.344
139.944
8.925
-302.324
38.305
标准系数 贝塔
.334 .141 .749 -.171
总计
2048063058.686
34
2
回归
1946000793.422
残差
102062265.263
总计
2048063058.686
2 973000396.711
32
3189445.789
34
3
回归
1984783160.329
3 661594386.776
残差
63279898.356
31
2041287.044
采用二次曲线 步骤:图形 旧对话框 结果如下:
显著性 .000 b
305.069
.000 c
324.106
.000 d
646.150
e
.000
c. 预测变量:(常量),施用化肥量 d. 预测变量:(常量),施用化肥量 e. 预测变量:(常量),施用化肥量 顷)
(kg/ 公顷 ), 风灾面积比例 (%) (kg/ 公顷 ), 风灾面积比例 (%), 年份 (kg/ 公顷 ), 风灾面积比例 (%), 年份 , 总播种面积 ( 万公
其余变量导入自变量
方法项选 “前
模型 1
已输入 / 除去变量 a
已输入变量
已除去变量
方法
施用化肥量 (kg/ 公顷 )
向前(准则: . F-to-enter 的
概率 <= .050 )
2 风灾面积比例 (%)
3 年份
4 总播种面积 ( 万 公顷 )
a. 因变量:粮食总产量 (y 万吨 )
向前(准则: . F-to-enter 的
2445.0213
3.1039
0.00457
X1
-117.8861
31.8974
-3.6958
0.00103
X2
80.6107
14.7676
5.4586
0.00001
X3
0.5012
0.1259
3.9814
0.00049
1) 将第一张表中的所缺数值补齐。
2) 写出销售量与销售价格、年人均收入、广告费用的多元线性回归方程,并解释各回归 系数的意义。
概率 <= .050 ) 向前(准则: . F-to-enter 的 概率 <= .050 ) 向前(准则: . F-to-enter 的 概率 <= .050 )
模型摘要
模型 1 2 3 4
R
.960 a .975 b
c
.984 .994 d
R 平方 .922 .950 .969 .989
调整后的 R 平 方
显著性 8.88341E-13 b
55069.7154
(2) Y=7589.1-117.886 X1+80.6X2+0.5X3
(3)回归方程显著性检验:整体线性关系显著
(4)回归系数显著性检验:各个回归系数检验均显著
(5)略
(6)略
7、对参加 SAT 考试的同学成绩进行随机调查,获得他们阅读考试和数学考试的成绩以及 性别数据。通常阅读能力和数学能力具有一定的线性相关性,请在排除性别差异的条件下, 分析阅读成绩对数学成绩的线性影响是否显著。
-.166
244.920
56.190
.323
-512023.307
68673.579
139.944
8.925
.749
-302.324
38.305
-.171
253.115
34.827
.334
2.451
.344
.141
t 35.554 19.720 28.407 23.897 -4.269 -4.173 9.561 -4.748 4.359 -7.456 15.680 -7.893 7.268 7.126
R 平方 .505
调整后的 R 平 方
标准估算的错误
.499
69.495
a. 预测变量:(常量), Gender, Verbal SAT ANOVaA
模型
平方和
自由度
均方
F
1
回归
782588.468
2
391294.234
81.021
残差
767897.951
159
4829.547
总计
1550486.420
10.940
.190
t 5.418 12.446 3.402
显著性 .000 .000 .001
因概率 P 值小于显著性水平( 0.05),所以表明在控制了性别之后,阅读成绩对数学成绩有 显著的线性影响。
8、试根据 “粮食总产量 .sav ”数据, 利用 SPSS 曲线估计方法选择恰当模型, 对样本期外的粮 食总产量进行外推预测,并对平均预测误差进行估计。
非标准化系数
标准系数
B
标准错误
贝塔
17930.148
504.308
179.287
9.092
.960
20462.336
720.317
193.701
8.106
1.037
-327.222 -460006.046
76.643 110231.478
-.185
137.667
14.399
.737
-293.439
61.803
显著性 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000 .000
结论:如上 4 个表所示, 影响程度中大到小依次是: 年份 , 总播种面积 (万公顷 )。(排除农业劳动者人数 总产量的影响)
施用化肥量 (kg/ 公顷 ), 风灾面积比例 (%), (百万人 ) 和粮食播种面积 (万公顷 )对粮食
模型
1
(常量)
施用化肥量 (kg/ 公顷 )
2
(常量)
施用化肥量 (kg/ 公顷 )
风灾面积比例 (%)
3
(常量)
施用化肥量 (kg/ 公顷 )
风灾面积比例 (%)
年份
4
(常量)
施用化肥量 (kg/ 公顷 )
风灾面积比例 (%)
年份
总播种面积 ( 万公顷 )
a. 因变量:粮食总产量 (y 万吨 )
系数 a
161
a. 因变量: Math SAT b. 预测变量:(常量), Gender, Verbal SAT
a
系数
显著性
b
.000
模型
1
(常量)
Verbal SAT
Gender
a. 因变量: Math SAT
非标准化系数
标准系数
B
标准错误
贝塔
184.582
34.068
.686
.055
.696
37.219
总计
2048063058.686
34
4
回归
2024563536.011
4 506140884.003
残差
23499522.675
30
783317.423
总计
2048063058.686
34
a. 因变量:粮食总产量 (y 万吨 ) b. 预测变量:(常量),施用化肥量
(kg/ 公顷 )
F 388.886
4、请说明 SPSS 多元线性回归分析中提供了哪几种解释变量筛选策略? 向前、向后、逐步。
5、 先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用 建立多元线性回归方程, 分析影响粮食总产量的主要因素。 数据文件名为 “粮食总产量 .sav ”。
方法:采用“前进“回归策略。 步骤: 分析 回归 线性 将粮食总产量导入因变量、 进” 确定。 如下图:(也可向后、或逐步)
一个变量的变化情况,因此,在具体应用过程中, 只有把相关分析和回归分析结合起来,才
能达到研究和分析的目的。
线性回归分析是相关性回归分析的一种, 变量的增加或减少。
研究的是一个变量的增加或减少会不会引起另一个
3、 请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验? 检验其可信程度并找出哪些变量的影响显著、哪些不显著。