应用回归分析-第9章课后习题答案

合集下载

应用技术回归分析第九章部分完整答案

第9章非线性回归9.1 在非线性回归线性化时，对因变量作变换应注意什么问题？答：在对非线性回归模型线性化时，对因变量作变换时不仅要注意回归函数的形式，还要注意误差项的形式。

如：(1) 乘性误差项，模型形式为e y AK L αβε=， (2) 加性误差项，模型形式为y AK L αβε=+。

对乘法误差项模型（1）可通过两边取对数转化成线性模型，（2）不能线性化。

一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式，为了方便通常省去误差项，仅考虑回归函数的形式。

9.2为了研究生产率与废料率之间的关系，记录了如表9.14所示的数据，请画出散点图，根据散点图的趋势拟合适当的回归模型。

表9.14生产率x （单位/周） 1000 2000 3000 3500 4000 4500 5000 废品率y （%）5.26.56.88.110.2 10.3 13.0解：先画出散点图如下图：5000.004000.003000.002000.001000.00x12.0010.008.006.00y从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线，由此采用二次方程式和指数函数进行曲线回归。

（1）二次曲线 SPSS 输出结果如下：Mode l Sum mary.981.962.942.651R R SquareAdjusted R SquareStd. E rror of the E stim ateThe independent variable is x.ANOVA42.571221.28650.160.0011.6974.42444.2696Regression Residual TotalSum of Squares dfMean SquareF Sig.The independent variable is x.Coe fficients-.001.001-.449-.891.4234.47E -007.0001.4172.812.0485.843 1.3244.414.012x x ** 2(Constant)B Std. E rror Unstandardized Coefficients BetaStandardizedCoefficientstSig.从上表可以得到回归方程为：72ˆ 5.8430.087 4.4710yx x -=-+⨯ 由x 的系数检验P 值大于0.05，得到x 的系数未通过显著性检验。

《应用回归分析》部分课后习题答案-何晓群版

《应用回归分析》部分课后习题答案第一章回归分析概述1.1 变量间统计关系和函数关系的区别是什么？答：变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系，而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。

1.2 回归分析与相关分析的联系与区别是什么？答：联系有回归分析和相关分析都是研究变量间关系的统计学课题。

区别有 a.在回归分析中，变量y称为因变量，处在被解释的特殊地位。

在相关分析中，变量x和变量y处于平等的地位，即研究变量y与变量x的密切程度与研究变量x与变量y的密切程度是一回事。

b.相关分析中所涉及的变量y与变量x全是随机变量。

而在回归分析中，因变量y是随机变量，自变量x可以是随机变量也可以是非随机的确定变量。

C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。

而回归分析不仅可以揭示变量x对变量y的影响大小，还可以由回归方程进行预测和控制。

1.3 回归模型中随机误差项ε的意义是什么？答：ε为随机误差项，正是由于随机误差项的引入，才将变量间的关系描述为一个随机方程，使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系，由于客观经济现象是错综复杂的，一种经济现象很难用有限个因素来准确说明，随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么？答：线性回归模型的基本假设有：1.解释变量x1.x2….xp是非随机的，观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)=｛σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数，即n>p.1.5 回归变量的设置理论根据是什么？在回归变量设置时应注意哪些问题？答：理论判断某个变量应该作为解释变量，即便是不显著的，如果理论上无法判断那么可以采用统计方法来判断，解释变量和被解释变量存在统计关系。

统计学原理第九章(相关与回归)习题答案

第九章相关与回归一．判断题部分题目1：负相关指的是因素标志与结果标志的数量变动方向是下降的。

（）答案：×题目2：相关系数为+1时，说明两变量完全相关；相关系数为-1时，说明两个变量不相关。

（）答案：√题目3：只有当相关系数接近+1时，才能说明两变量之间存在高度相关关系。

（）答案：×题目4：若变量x的值增加时，变量y的值也增加，说明x与y之间存在正相关关系；若变量x的值减少时，y变量的值也减少，说明x与y之间存在负相关关系。

（）答案：×题目5：回归系数和相关系数都可以用来判断现象之间相关的密切程度。

（）答案：×题目6：根据建立的直线回归方程，不能判断出两个变量之间相关的密切程度。

（）答案：√题目7：回归系数既可以用来判断两个变量相关的方向，也可以用来说明两个变量相关的密切程度。

（）答案：×题目8：在任何相关条件下，都可以用相关系数说明变量之间相关的密切程度。

（）答案：×题目9：产品产量随生产用固定资产价值的减少而减少，说明两个变量之间存在正相关关系。

（）答案：√题目10：计算相关系数的两个变量，要求一个是随机变量，另一个是可控制的量。

（）答案：×题目11：完全相关即是函数关系，其相关系数为±1。

（）答案：√题目12：估计标准误是说明回归方程代表性大小的统计分析指标，指标数值越大，说明回归方程的代表性越高。

（）答案×二．单项选择题部分题目1：当自变量的数值确定后，因变量的数值也随之完全确定，这种关系属于（）。

A.相关关系B.函数关系C.回归关系D.随机关系答案：B题目2：现象之间的相互关系可以归纳为两种类型，即（）。

A.相关关系和函数关系B.相关关系和因果关系C.相关关系和随机关系D.函数关系和因果关系答案：A题目3：在相关分析中，要求相关的两变量（）。

A.都是随机的B.都不是随机变量C.因变量是随机变量D.自变量是随机变量答案：A题目4：测定变量之间相关密切程度的指标是（）。

应用回归分析课后习题

2.16* 表 2.8 是 1985 年美国 50 个州和哥伦比亚特区公立学校中教师的人均年工资 y（美元）和对学生的人均经费收入 x（美元）。（1）绘制 y 对 x 的散点图，可以用直线回归描述两者之间的关系吗？（2）建立 y 对 x 的线性回归。（3）用线性回归的 Plots 功能绘制标准残差的直方图和正态概率图，检验误差项的正态性假设。
使用其中的一个。
2.12* 如果把自变量观测值都乘以 2，回归参数的最小二乘估计 ˆ0 和 ˆ1 会发生什么变化？
#;
.
如果把自变量观测值都加上 2，回归参数的最小二乘估计 ˆ0 和 ˆ1 会发生什么变化？
2.13 如果回归方程 yˆ ˆ0 ˆ1x 相应的相关系数 r 很大，则用它预测时，预测误差一定较小。
#;
.
第三章习题
3.1 写出多元线性回归模型的矩阵表示形式，并给出多元线性回归模型的基本假设。 3.2 讨论样本量 n 与自变量个数 p 的关系，它们对模型的参数估计有何影响？
3.3 证明ˆ 2 1 SSE 是误差项方差 2 的无偏估计。 n p 1
3.4 一个回归方程的复相关系数 R=0.99，样本决定系数 R2 0.9801 ，我们能判断这个回归
2.15 一家保险公司十分关心其总公司营业部加班的程度，决定认真调查一下现状。经过 10
周时间，收集了每周加班工作时间的数据和签发的新保单数目，x 为每周签发的新保单数目，
y 为每周加班工作时间（小时）。见表
周序 1
2
3
4
5
6
7
8
9
10
号
X
825 215 1070 550 480 920 1350 325 670 1215

《应用回归分析》课后题答案解析

1.8 为什么要对回归模型进行检验？答：我们建立回归模型的目的是为了应用它来研究经济问题，但如果马上就用这个模型去预测，控制，分析，显然是不够慎重的，所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。
1.9 回归模型有那几个方面的应用？答：回归模型的应用方面主要有：经济变量的因素分析和进行经济预测。
1.5 回归变量的设置理论根据是什么？在回归变量设置时应注意哪些问题？答：理论判断某个变量应该作为解释变量，即便是不显著的，如果理论上无法判断那么可以采用统计方法来判断，解释变量和被解释变量存在统计关系。应注意的问题有：在选择变量时要注意与一些专门领域的专家合作，不要认为一个回归模型所涉及的变量越多越好，回归变量的确定工作并不能一次完成，需要反复试算，最终找出最合适的一些变量。
t /2
0

0
1 n
( x)2 Lxx
t
/
2
)
1
可得 1的置信度为95%的置信区间为（ 7.77,5.77）
n
( yi y)2
（6）x 与 y 的决定系数 r 2
i 1 n
490 / 600 0.817
3
精品文档
（5）由于 1
N
(1,
2 Lxx
)
t
1 1 2 / Lxx
(1
)
Lxx
服从自由度为 n-2 的 t 分布。因而
P
|
(
1
)
Lxx
|
t
/
2
(n
2)
1
也即： p(1 t /2
Lxx
1 1 t /2
) =1 Lxx
可得
1

《应用回归分析》课后题答案解析

.
.
《应用回归分析》部分课后习题答案
第一章回归分析概述
1.1 变量间统计关系和函数关系的区别是什么？答：变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系，而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么？答：联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a. 在回归分析中，变量 y 称为因变量，处在被解释的特殊地位。在相关分析中，变量 x 和变量 y 处于平等的地位，即研究变量 y 与变量 x 的密切程度与研究变量 x 与变量 y 的密切程度是一回事。b.相关分析中所涉及的变量 y 与变量 x 全是随机变量。而在回归分析中，因变量 y 是随机变量，自变量 x 可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量 x 对变量 y 的影响大小，还可以由回归方程进行预测和控制。
1 3
即为：（2.49，11.5）
33，7+2.353 1 3
33）
0
N
(0
,
(
1 n
(x)2 Lxx
)
2
)
t
0 0
0 0
(
1
(
x)2
)
2
1 (x)2
n Lxx
n Lxx
服从自由度为 n-2 的 t 分布。因而
P |
0 0
1 (x)2
| t /2 (n 2) 1
n Lxx页脚源自 ..1330 6.1
3
（5）由于 1
N
(1,

应用回归分析第四版课后答案

假设 3、随机误差项ε与解释变量 X 之间不相关：
Cov(Xi, εi)=0
i=1,2, …,n
假设 4、ε服从零均值、同方差、零协方差的正态分布
εi~N(0, 2 )
i=1,2, …,n
2.3 证明（2.27 式），ei =0 ，eiXi=0 。
n
n
Q (Yi Yˆi )2 (Yi (ˆ0 ˆ1 X i ))2
方法。
答：普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同，是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下，普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差的条件下，平方和中的每一项的地位是不相同的，误差项的方差大的项，在残差平方和中的取值就偏大，作用就大，因而普通最小二乘估计的回归线就被拉向方差大的项，方差大的项的拟合程度就好，而方差小的项的拟合程度就差。由 OLS
X 2n

X kn
量的观测值矩阵； β(k 1)1

0 1

2
k

为总体回归参数向量；
μ
n1

1 2 n

为随机误差项向量。
多元回归线性模型基本假定：课本 P57
第四章
4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与
法。
答：运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回
归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数 wi ，
以调整各项在平方和中的作用，加权最小二乘的离差平方和为：

应用回归分析第四版课后习题答案全何晓群刘文卿

实用回归分析第四版第一章回归分析概述1.3回归模型中随机误差项ε的意义是什么？答：ε为随机误差项，正是由于随机误差项的引入，才将变量间的关系描述为一个随机方程，使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系，由于客观经济现象是错综复杂的，一种经济现象很难用有限个因素来准确说明，随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么？答：线性回归模型的基本假设有：1.解释变量x1.x2….xp是非随机的，观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)=｛σ^23.正态分布的假定条件为相互独立。

4.样本容量的个数要多于解释变量的个数，即n>p.第二章一元线性回归分析思考与练习参考答案2.1一元线性回归有哪些基本假定?答：假设1、解释变量X是确定性变量，Y是随机变量；假设2、随机误差项ε具有零均值、同方差和不序列相关性：E(εi)=0 i=1,2, …,nVar (εi)=σ2i=1,2, …,nCov(εi,εj)=0 i≠j i,j= 1,2, …,n假设3、随机误差项ε与解释变量X之间不相关：Cov(X i, εi)=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布εi~N(0, σ2) i=1,2, …,n2.3 证明（2.27式），∑e i =0 ，∑e i X i=0 。

证明：∑∑+-=-=niiiniXYYYQ12121))ˆˆ(()ˆ(ββ其中：01ˆˆˆˆi i i i iY X e Y Yββ=+=-0100ˆˆQ Qββ∂∂==∂∂即： ∑e i =0 ，∑e i X i =02.5 证明0ˆβ是β0的无偏估计。

证明：)1[)ˆ()ˆ(1110∑∑==--=-=ni i xx i n i iY L X X X Y n E X Y E E ββ )] )(1([])1([1011i i xx i n i i xx i ni X L X X X n E Y L X X X n E εββ++--=--=∑∑==1010)()1(])1([βεβεβ=--+=--+=∑∑==i xx i ni i xx i ni E L X X X nL X X X n E 2.6 证明证明：)] ()1([])1([)ˆ(102110i i xx i ni i xx i ni X Var L X X X nY L X X X n Var Var εβββ++--=--=∑∑== 222212]1[])(2)1[(σσxxxx i xx i ni L X n L X X X nL X X X n +=-+--=∑=2.7证明平方和分解公式：SST=SSE+SSR证明：2.8 验证三种检验的关系，即验证：（1）21)2(r r n t --=；（2）2221ˆˆ)2/(1/t L n SSE SSR F xx ==-=σβ 证明：（1）())1()1()ˆ(222122xx ni iL X n X XX nVar +=-+=∑=σσβ()()∑∑==-+-=-=n i ii i n i i Y Y Y Y Y Y SST 1212]ˆ()ˆ[()()()∑∑∑===-+--+-=ni ii ni i i i ni iY Y Y Y Y Y Y Y 12112)ˆˆ)(ˆ2ˆ()()SSESSR )Y ˆY Y Y ˆn1i 2ii n1i 2i +=-+-=∑∑==ˆt======（2）2222201111 1111ˆˆˆˆˆˆ()()(())(()) n n n ni i i i xxi i i iSSR y y x y y x x y x x Lβββββ=====-=+-=+--=-=∑∑∑∑2212ˆ/1ˆ/(2)xxLSSRF tSSE nβσ∴===-2.9 验证（2.63）式：2211σ)L)xx(n()e(Varxxii---=证明：0112222222ˆˆˆvar()var()var()var()2cov(,)ˆˆˆvar()var()2cov(,())()()11[]2[]()1[1]i i i i i i ii i i ii ixx xxixxe y y y y y yy x y y x xx x x xn L n Lx xn Lβββσσσσ=-=+-=++-+---=++-+-=--其中：222221111))(1()(1))(,()()1,())(ˆ,(),())(ˆ,(σσσββxxixxiniixxiiiniiiiiiiiLxxnLxxnyLxxyCovxxynyCovxxyCovyyCovxxyyCov-+=-+=--+=-+=-+∑∑==2.10 用第9题证明2ˆ22-=∑neiσ是σ2的无偏估计量证明：2221122112211ˆˆ()()()22()111var()[1]221(2)2n ni ii in niii i xxE E y y E en nx xen n n Lnnσσσσ=====-=---==----=-=-∑∑∑∑第三章1.一个回归方程的复相关系数R=0.99，样本决定系数R2=0.9801，我们能判断这个回归方程就很理想吗？答：不能断定这个回归方程理想。

应用技术回归分析第九章部分完整答案

如：(1) 乘性误差项，模型形式为e y AK L αβε=， (2) 加性误差项，模型形式为y AK L αβε=+。

对乘法误差项模型（1）可通过两边取对数转化成线性模型，（2）不能线性化。

一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式，为了方便通常省去误差项，仅考虑回归函数的形式。

9.2为了研究生产率与废料率之间的关系，记录了如表9.14所示的数据，请画出散点图，根据散点图的趋势拟合适当的回归模型。

《应用回归分析》课后习题答案

1.7构造回归理论模型的基本依据是什么？
答：选择模型的数学形式的主要依据是经济行为理论，根据变量的样本数据作出解释变量与被解释变量之间关系的散点图，并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进行计算机模拟，对不同的模拟结果，选择较好的一个作为理论模型。
df
均方
F
显著性
组间
（组合）
1231497.500
7
175928.214
5.302
.168
线性项
加权的
1168713.036
1
1168713.036
35.222
.027
偏差
62784.464
6
10464.077
.315
.885
组内
66362.500
2
33181.250
总数
1297860.000
9
由于 ,拒绝 ,说明回归方程显著，x与y有显著的线性关系。
.212
.586
1.708
a.因变量: y
（6）可以看到P值最大的是x3为0.284，所以x3的回归系数没有通过显著检验，应去除。
去除x3后作F检验，得：
Anovab
模型
平方和
df
均方
F
Sig.
1
回归
12893.199
2
6446.600
11.117
.007a
残差
4059.3.500
.724
.433
.212
.586
1.708
a.因变量: y
(2)
所以三元线性回归方程为
模型汇总
模型
R

(完整word版)应用回归分析,第9章课后习题参考答案

第9章含定性变量的回归模型思考与练习参考答案9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0—1型自变量，用SPSS 软件计算的结果中总是自动删除了其中的一个自变量，他为此感到困惑不解。

出现这种情况的原因是什么？答：假如这个含有季节定性自变量的回归模型为:t t t t kt k t t D D D X X Y μαααβββ++++++=332211110其中含有k 个定量变量,记为x i 。

对春夏秋冬四个季节引入4个0—1型自变量，记为D i ，只取了6个观测值,其中春季与夏季取了两次，秋、冬各取到一次观测值，则样本设计矩阵为：⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然，(X ，D)中的第1列可表示成后4列的线性组合，从而(X ，D)不满秩,参数无法唯一求出。

这就是所谓的“虚拟变量陷井",应避免。

当某自变量x j 对其余p —1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型.称Tol j =1—2j R 为自变量x j 的容忍度（Tolerance ），SPSS 软件的默认容忍度为0。

0001。

也就是说，当2j R ＞0.9999时,自变量x j 将被自动拒绝在回归方程之外，除非我们修改容忍度的默认值。

而在这个模型中出现了完全共线性，所以SPSS 软件计算的结果中总是自动删除了其中的一个定性自变量。

⎪⎪⎪⎪⎪⎭⎫⎝⎛=k βββ 10β⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=4321ααααα9。

2对自变量中含有定性变量的问题，为什么不对同一属性分别建立回归模型,而采取设虚拟变量的方法建立回归模型？答：原因有两个，以例9.1说明。

一是因为模型假设对每类家庭具有相同的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最佳估计；二是对于其他统计推断，用一个带有虚拟变量的回归模型来进行也会更加准确，这是均方误差的自由度更多。

应用回归分析第四版课后习题答案-全-何晓群-刘文卿精选全文完整版

可编辑修改精选全文完整版实用回归分析第四版第一章回归分析概述1.3回归模型中随机误差项ε的意义是什么？答：ε为随机误差项，正是由于随机误差项的引入，才将变量间的关系描述为一个随机方程，使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系，由于客观经济现象是错综复杂的，一种经济现象很难用有限个因素来准确说明，随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。

1.4 线性回归模型的基本假设是什么？答：线性回归模型的基本假设有：1.解释变量x1.x2….xp是非随机的，观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)=｛σ^23.正态分布的假定条件为相互独立。

证明：∑∑+-=-=niiiniXYYYQ12121))ˆˆ(()ˆ(ββ其中：即： ∑e i =0 ，∑e i X i =02.5 证明0ˆβ是β0的无偏估计。

证明：)1[)ˆ()ˆ(1110∑∑==--=-=ni i xxi ni i Y L X X X Y n E X Y E E ββ)] )(1([])1([1011i i xx i n i i xx i ni X L X X X n E Y L X X X n E εββ++--=--=∑∑==01010)()1(])1([βεβεβ=--+=--+=∑∑==i xxi ni i xx i ni E L X X X n L X X X n E 2.6 证明证明：)] ()1([])1([)ˆ(102110i i xxi ni i xx i n i X Var L X X X n Y L X X X n Var Var εβββ++--=--=∑∑==222212]1[])(2)1[(σσxx xx i xx i ni L X n L X X X nL X X X n +=-+--=∑=2.7 证明平方和分解公式：SST=SSE+SSR证明：2.8 验证三种检验的关系，即验证：（1）21)2(r r n t --=；（2）2221ˆˆ)2/(1/t L n SSE SSR F xx ==-=σβ 证明：（1）01ˆˆˆˆi i i i iY X e Y Y ββ=+=-())1()1()ˆ(222122xx ni iL X n X XX nVar +=-+=∑=σσβ()()∑∑==-+-=-=n i ii i n i i Y Y Y Y Y Y SST 1212]ˆ()ˆ[()()()∑∑∑===-+--+-=ni ii ni i i i ni iY Y Y Y Y Y Y Y 12112)ˆˆ)(ˆ2ˆ()()SSE SSR )Y ˆY Y Y ˆn1i 2i i n1i 2i+=-+-=∑∑==0100ˆˆQQββ∂∂==∂∂ˆt======（2）2222201111 1111ˆˆˆˆˆˆ()()(())(()) n n n ni i i i xxi i i iSSR y y x y y x x y x x Lβββββ=====-=+-=+--=-=∑∑∑∑2212ˆ/1ˆ/(2)xxLSSRF tSSE nβσ∴===-2.9 验证（2.63）式：2211σ)L)xx(n()e(Varxxii---=证明：0112222222ˆˆˆvar()var()var()var()2cov(,)ˆˆˆvar()var()2cov(,())()()11[]2[]()1[1]i i i i i i ii i i ii ixx xxixxe y y y y y yy x y y x xx x x xn L n Lx xn Lβββσσσσ=-=+-=++-+---=++-+-=--其中：222221111))(1()(1))(,()()1,())(ˆ,(),())(ˆ,(σσσββxxixxiniixxiiiniiiiiiiiLxxnLxxnyLxxyCovxxynyCovxxyCovyyCovxxyyCov-+=-+=--+=-+=-+∑∑==2.10 用第9题证明是σ2的无偏估计量证明：2221122112211ˆˆ()()()22()111var()[1]221(2)2n ni ii in niii i xxE E y y E en nx xen n n Lnnσσσσ=====-=---==----=-=-∑∑∑∑第三章1.一个回归方程的复相关系数R=0.99，样本决定系数R2=0.9801，我们能2ˆ22-=∑neiσ判断这个回归方程就很理想吗？答：不能断定这个回归方程理想。

(整理)统计学原理第九章相关与回归习题答案

第九章相关与回归一．判断题部分题目1：负相关指的是因素标志与结果标志的数量变动方向是下降的。

（）答案：×题目2：相关系数为+1时，说明两变量完全相关；相关系数为-1时，说明两个变量不相关。

（）答案：√题目3：只有当相关系数接近+1时，才能说明两变量之间存在高度相关关系。

（）答案：×题目5：回归系数和相关系数都可以用来判断现象之间相关的密切程度。

（）答案：×题目6：根据建立的直线回归方程，不能判断出两个变量之间相关的密切程度。

（）答案：√题目7：回归系数既可以用来判断两个变量相关的方向，也可以用来说明两个变量相关的密切程度。

（）答案：×题目8：在任何相关条件下，都可以用相关系数说明变量之间相关的密切程度。

（）答案：×题目9：产品产量随生产用固定资产价值的减少而减少，说明两个变量之间存在正相关关系。

（）答案：√题目10：计算相关系数的两个变量，要求一个是随机变量，另一个是可控制的量。

（）答案：×题目11：完全相关即是函数关系，其相关系数为±1。

（）答案：√题目12：估计标准误是说明回归方程代表性大小的统计分析指标，指标数值越大，说明回归方程的代表性越高。

（）答案×二．单项选择题部分题目1：当自变量的数值确定后，因变量的数值也随之完全确定，这种关系属于（）。

A.相关关系B.函数关系C.回归关系D.随机关系答案：B题目2：现象之间的相互关系可以归纳为两种类型，即（）。

A.相关关系和函数关系B.相关关系和因果关系C.相关关系和随机关系D.函数关系和因果关系答案：A题目3：在相关分析中，要求相关的两变量（）。

A.都是随机的B.都不是随机变量C.因变量是随机变量D.自变量是随机变量答案：A题目4：测定变量之间相关密切程度的指标是（）。

《应用回归分析》课后题答案解析

(8) t
1
2
/ Lxx
1
Lxx
2
其中
1 n2
n i1
ei 2
1 n2
n i1
( yi
2
yi )
0.0036 1297860 8.542 0.04801
t /2 1.895
t 8.542 t /2
接受原假设 H 0: 1 0, 认为 1 显著不为 0，因变量 y 对自变量 x 的一元线性回归成立。
( yi
2
yi )
1 n-2
n i=1
( yi
( 0 1
2
x))
=
1 3
（ 10-（-1+71））2 （10-（-1+7 （20-（-1+7 4））2 （40-（-1+7
2））2 （20-（-1+7 5））2
3））2
1 16 9 0 49 36
3
110 / 3
1
330 6.1
《应用回归分析》部分课后习题答案
第一章回归分析概述
变量间统计关系和函数关系的区别是什么答：变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系，而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
回归分析与相关分析的联系与区别是什么答：联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有 a. 在回归分析中，变量 y 称为因变量，处在被解释的特殊地位。在相关分析中，变量 x 和变量 y 处于平等的地位，即研究变量 y 与变量 x 的密切程度与研究变量 x 与变量 y 的密切程度是一回事。b.相关分析中所涉及的变量 y 与变量 x 全是随机变量。而在回归分析中，因变量 y 是随机变量，自变量 x 可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量 x 对变量 y 的影响大小，还可以由回归方程进行预测和控制。

统计学课后答案(第3版)第9章相关与回归分析习题答案

第九章相关与回归分析习题答案一、单选1.C ；2.B ；3.C ；4.D ；5.A ；6.C ；7.B ；8.C ；9.A ；10.C 二、多选1.ACD ；2.AE ；3.AD ；4.ABCD ；5.ACD ；6.AB ；7.ABDE ；8.ACE ；9.AD ；10.ABE 三、计算分析题 1、解：（1）（2）建立线性回归方程xy ∧∧∧+=10ββ，根据最小二乘法得：⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑∑∑∧∧∧n x n y x x n y x y x n i i i i i i i i 10221βββ）（由此可得∧1β=0.732，∧0β=-2.01，则回归方程是∧y =-2.01+0.732x（3）当受教育年数为15年时，其年薪的点估计值为：∧y =-2.01+0.732×15=8.97（万元）估计标准误差： 733.0538.0222===-=--=∑∧M S E n S S En y y S i iy ）（置信区间为：∑=∧--+±n i i yx x x x nS t y 1202/)()(12α=8.97±2.228×0.733×9167.120917.6151212）（-+=8.97±1.290预测区间为：∑=∧--++±ni i yx x x x nS t y 1202/)()(112α=8.97±2.228×0.733×9167.120917.61512112）（-++ =8.97±2.081 2、解：（1）建立线性回归方程xy ∧∧∧+=10ββ，根据最小二乘法得：⎪⎪⎪⎩⎪⎪⎪⎨⎧-=--=∑∑∑∑∑∑∑∧∧∧n x n y x x n y x y x n i i i i i i i i 10221βββ）（由此可得0093.00=∧β，316.01=∧β，则回归方程是x y 316.00093.0+=∧（3）当GDP 达到16时，其货币供应量的点估计值为：∧y =0.0093+0.316×16=5.065亿元估计标准误差：Sy=22--∑∧n y y i i）（=2-n SSE=MSE =09294.0=0.305置信区间为：∑=∧--+±n i i yx x x x nS t y 1202/)()(12α=5.065±2.228×0.305×21863.135711.11161212）（-+ 3、（1）利用EXCEL 的CORREL 函数计算相关系数r=0.9937.相关系数接近于1，表明农业总产值与农村购买力之间有较强的正线性相关关系。

《应用回归分析》课后习题部分答案何晓群版

第二章一元线性回归2.14 解答：（1）散点图为：（2）x 与y 之间大致呈线性关系。

（3）设回归方程为01y x ββ∧∧∧=+1β∧=12217()ni ii nii x y n x yxn x --=-=-=-∑∑0120731y x ββ-∧-=-=-⨯=-17y x ∧∴=-+可得回归方程为（4）22ni=11()n-2i i y y σ∧∧=-∑ 2n 01i=11(())n-2i y x ββ∧∧=-+∑=2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦（10-（-1+71））（10-（-1+72））（20-（-1+73））（20-（-1+74））（40-（-1+75）） []1169049363110/3=++++=6.1σ∧=≈ （5）由于211(,)xxN L σββ∧t σ∧==服从自由度为n-2的t 分布。

因而/2|(2)1P t n αασ⎡⎤⎢⎥<-=-⎢⎥⎣⎦也即：1/211/2(p t t ααβββ∧∧∧∧-<<+=1α-可得195%β∧的置信度为的置信区间为（7-2.3537+2.353 即为：（2.49，11.5）2201()(,())xxx Nn L ββσ-∧+t ∧∧==服从自由度为n-2的t 分布。

因而/2(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦即0/200/2()1p βσββσα∧∧∧∧-<<+=- 可得195%7.77,5.77β∧-的置信度为的置信区间为（）（6）x 与y 的决定系数22121()490/6000.817()nii nii y y r y y ∧-=-=-==≈-∑∑（7）由于(1,3)F F α>,拒绝0H ,说明回归方程显著，x 与y 有显著的线性关系。

（8）t σ∧==其中2221111()22n ni i i i i e y y n n σ∧∧====---∑∑ 7 3.661==≈ /2 2.353t α= /23.66t t α=>∴接受原假设01:0,H β=认为1β显著不为0，因变量y 对自变量x 的一元线性回归成立。

应用回归分析第四版课后习题答案_全_何晓群_刘文卿

1.4 线性回归模型的基本假设是什么？答：线性回归模型的基本假设有：1.解释变量x1.x2….xp是非随机的，观测值xi1.xi2…..xip是常数。

2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)=｛σ^23.正态分布的假定条件为相互独立。

证明：∑∑+-=-=niiiniXYYYQ12121))ˆˆ(()ˆ(ββ其中：即： ∑e i =0 ，∑e i X i =02.5 证明0ˆβ是β0的无偏估计。

证明：)1[)ˆ()ˆ(1110∑∑==--=-=ni i xxi n i i Y L X X X Y n E X Y E E ββ )] )(1([])1([1011i i xx i n i i xx i ni X L X X X n E Y L X X X n E εββ++--=--=∑∑==1010)()1(])1([βεβεβ=--+=--+=∑∑==i xx i ni i xx i ni E L X X X nL X X X n E 2.6 证明证明：)] ()1([])1([)ˆ(102110i i xxi ni ixx i ni X Var L X X X n Y L X X X n Var Var εβββ++--=--=∑∑== 222212]1[])(2)1[(σσxx xx i xx i ni L X n L X X X nL X X X n +=-+--=∑=2.7 证明平方和分解公式：SST=SSE+SSR证明：2.8 验证三种检验的关系，即验证：（1）21)2(r r n t --=；（2）2221ˆˆ)2/(1/t L n SSE SSR F xx ==-=σβ 01ˆˆˆˆi i i i iY X e Y Y ββ=+=-())1()1()ˆ(222122xx ni iL X n X XX nVar +=-+=∑=σσβ()()∑∑==-+-=-=n i ii i n i i Y Y Y Y Y Y SST 1212]ˆ()ˆ[()()()∑∑∑===-+--+-=ni ii ni i i i ni iY Y Y Y Y Y Y Y 12112)ˆˆ)(ˆ2ˆ()()SSESSR )Y ˆY Y Y ˆn1i 2ii n1i 2i +=-+-=∑∑==0100ˆˆQQββ∂∂==∂∂证明：（1）ˆt======（2）2222201111 1111ˆˆˆˆˆˆ()()(())(()) n n n ni i i i xxi i i iSSR y y x y y x x y x x Lβββββ=====-=+-=+--=-=∑∑∑∑2212ˆ/1ˆ/(2)xxLSSRF tSSE nβσ∴===-2.9 验证（2.63）式：2211σ)L)xx(n()e(Varxxii---=证明：0112222222ˆˆˆvar()var()var()var()2cov(,)ˆˆˆvar()var()2cov(,())()()11[]2[]()1[1]i i i i i i ii i i ii ixx xxixxe y y y y y yy x y y x xx x x xn L n Lx xn Lβββσσσσ=-=+-=++-+---=++-+-=--其中：222221111))(1()(1))(,()()1,())(ˆ,(),())(ˆ,(σσσββxxixxiniixxiiiniiiiiiiiLxxnLxxnyLxxyCovxxynyCovxxyCovyyCovxxyyCov-+=-+=--+=-+=-+∑∑==2.10 用第9题证明是σ2的无偏估计量证明：2221122112211ˆˆ()()()22()111var()[1]221(2)2n ni ii in niii i xxE E y y E en nx xen n n Lnnσσσσ=====-=---==----=-=-∑∑∑∑第三章2ˆ22-=∑neiσ1.一个回归方程的复相关系数R=0.99，样本决定系数R 2=0.9801，我们能判断这个回归方程就很理想吗？答：不能断定这个回归方程理想。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第9章含定性变量的回归模型思考与练习参考答案9.1 一个学生使用含有季节定性自变量的回归模型，对春夏秋冬四个季节引入4个0-1型自变量，用SPSS 软件计算的结果中总是自动删除了其中的一个自变量，他为此感到困惑不解。

出现这种情况的原因是什么？答：假如这个含有季节定性自变量的回归模型为：tt t t kt k t t D D D X X Y μαααβββ++++++=332211110其中含有k 个定量变量，记为x i 。

对春夏秋冬四个季节引入4个0-1型自变量，记为D i ，只取了6个观测值，其中春季与夏季取了两次，秋、冬各取到一次观测值，则样本设计矩阵为：⎪⎪⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=000110010110001010010010100011)(616515414313212111k k k k k k X X X X X X X X X X X XD X,显然，(X,D)中的第1列可表示成后4列的线性组合，从而(X,D)不满秩，参数无法唯一求出。

这就是所谓的“虚拟变量陷井”，应避免。

当某自变量x j 对其余p-1个自变量的复判定系数2j R 超过一定界限时，SPSS 软件将拒绝这个自变量x j 进入回归模型。

称Tol j =1-2j R 为自变量x j 的容忍度（Tolerance ），SPSS 软件的默认容忍度为0.0001。

也就是说，当2j R ＞0.9999时，自变量x j 将被自动拒绝在回归方程之外，除非我们修改容忍度的默认值。

⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=k βββ 10β⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=4321ααααα而在这个模型中出现了完全共线性，所以SPSS软件计算的结果中总是自动删除了其中的一个定性自变量。

9.2对自变量中含有定性变量的问题，为什么不对同一属性分别建立回归模型，而采取设虚拟变量的方法建立回归模型？答：原因有两个，以例9.1说明。

一是因为模型假设对每类家庭具有相同的斜率和误差方差，把两类家庭放在一起可以对公共斜率做出最佳估计；二是对于其他统计推断，用一个带有虚拟变量的回归模型来进行也会更加准确，这是均方误差的自由度更多。

9.3 研究者想研究采取某项保险革新措施的速度y对保险公司的规模x1和保险公司类型的关系（参见参考文献【3】）。

因变量的计量是第一个公司采纳这项革新和给定公司采纳这项革新在时间上先后间隔的月数。

第一个自变量公司的规模是数量型的，用公司的总资产额（百万美元）来计量；第二个自变量公司是定性变量，由两种类型构成，即股份公司和互助公司。

数据资料见表9.8，试建立y对公司规模和公司类型的回归。

表9.8i y x1公司类型1 17 151 互助2 26 92 互助3 21 175 互助4 30 31 互助5 22 104 互助6 0 277 互助7 12 210 互助8 19 120 互助9 4 290 互助10 16 238 互助11 28 164 股份12 15 272 股份13 11 295 股份14 38 68 股份15 31 85 股份16 21 224 股份17 20 166 股份18 13 305 股份19 30 124 股份20 14 246 股份解：对定型变量“公司类型”进行数量化处理：引入虚拟变量x2：公司类型为“互助”时，x2=1，为“股份”时， x2=0。

则表9.5中数据转换成以下数据：i y x1公司类型1 17 151 12 26 92 13 21 175 14 30 31 15 22 104 16 0 277 17 12 210 18 19 120 19 4 290 110 16 238 111 28 164 012 15 272 013 11 295 014 38 68 015 31 85 016 21 224 017 20 166 018 13 305 019 30 124 020 14 246 0建立回归方程 y＝b0+b1x1+b2x2+ε用SPSS软件作线性回归，得到输出结果如下：R检验：拟合优度R2=0.883，接近1，说明回归拟合的效果较好。

F检验：F值=72.497，Sig.值为0，说明回归方程通过F检验。

T检验：回归系数通过t检验，回归方程为：y= 41.930－0.102 x1－8.055 x2说明：若引入虚拟变量x2，当公司类型为“互助”时，x2=0，为“股份”时， x2=1。

则回归方程为：y= 33.874－0.102x1 + 8.055x2结果分析：（1）股份制公司采取保险革新措施的积极性比互助型公司高，原因可能在于股份制公司建立在共同承担风险上，所以更愿意革新；（2）公司规模越大，采取保险革新措施的倾向越大：大规模公司的保险制度的更新对公司的影响程度比小规模公司大，因此大规模公司更倾向于比较更新措施和现有政策带来的效益，最终表现在采纳革新措施的时间间隔较短。

9.4．表9.9的数据是我国历年铁路里程数据，根据散点图观察在某时间点有折点，用折线回归拟合这个数据。

解：由散点图9(见下图)可看出在1995年（t=16）有折点，考虑由两段构成的分段线性回归，这可以通过引入一个0-1型虚拟自变量实现。

由散点图可知该折点为t=16，则引入虚拟自变量x ，⎩⎨⎧>-≤=16,16t 16,0t t x 由SPSS 输出的调整后的决定系数20.980R =，说明拟合优度较好。

由输出的系数表可以得出回归方程为：x t y106.0055.0183.5ˆ++= 由SPSS 输出方程分析表可知，F 值为594.524，且P 值约为零，说明回归方程非常显著；系数表中回归参数对应的t 检验P 值都约等于零，说明回归参数均通过了显著性检验。

因此，折线方程成立。

散点图方差分析表ANOVA b11.1132 5.557594.524.000a.20622.00911.31924Regression Residual TotalModel 1Sum of Squares dfMean SquareF Sig.P redictors: (Constant), x, t a. Dependent Variable: yb.系数表Coe fficientsa5.183.049106.303.000.055.005.58911.859.000.106.012.4509.065.000(Constant)t xModel 1B Std. E rror Unstandardized Coefficients BetaStandardizedCoefficientstSig.Dependent Variable: ya.9.5 某省统计局1990年9月在全省围进行了一次公众安全感问卷调查，参考文献【10】选取了调查表中的一个问题进行分析。

本题对其中的数据做了适当的合并。

对1391人填写的问卷设计：“一人在家是否害怕生人来”。

因变量y=1表示害怕，y=2表示不害怕。

2个自变量：x1是年龄，x2是文化程度。

各变量的取值含义如表9.10所示。

表9.10现在的问题是：公民一人在家害怕生人来这个事件，与公民的年龄x1、文化程度x2有没有关系呢？调查数据见表9.11。

表9.11其中，p i 是根据（9.44）式计算的。

（1）把公民的年龄x1、文化程度x2作为数值型变量，建立y 对x1、x2的logistic 回归。

（2）把公民的年龄x1、文化程度x2作为定性型变量，用0-1变量将其数量化，建立y 对公民的年龄和文化程度的logistic 回归。

（3）你对回归的效果是否满意，你认为主要的问题是什么？解：(1) 先对P i 进行逻辑变换，令ln()1ii ip p p '=-，则 01122i i i i p x x βββε'=+++直接用SPSS 进行y 与x1、x2的logistic 回归，输出结果如下：由SPSS 输出系数表结果得到回归方程：p'ˆ=-0.144-0.0061x -0.1362x 则还原后logistic 回归方程为：pˆ=)136.0006.0144.0ex p(1)136.0006.0144.0ex p(2121x x x x ---+---由方差分析表知F 值=0.386，P 值=0.687，大于5%，说明回归方程不显著；由系数表知回归参数的t 检验均没有通过，因为P 值都大于5%，说明回归参数未通过显著性检验。

由于logistic 回归模型存在异方差，所以采用加权最小二乘法重新拟合，权重：(1)i i i i n p p ω=-S PSS 输出结果如下：由输出结果得到回归方程：p 'ˆ=21331.0002.0146.0x x -+ 还原后的回归方程：pˆ=)331.0002.0146.0ex p(1)331.0002.0146.0ex p(2121x x x x -++-+由方差分析表结果知:F 值=4.304，P 值=0.037，小于5%，说明回归方程显著；由系数表知1x 对应的回归系数相应的P 值=0.697，大于5%，说明1x 对应的回归系数没有通过检验，不显著；2x 对应的回归系数相应的P 值=0.013，小于5%，说明2x 对应的回归系数通过检显著性验，且该回归系数为-0.331，，表明文化程度越高越不害怕。

(2) 把公民的年龄x1、文化程度x2作为定性型变量，引入6个0-1变量表示年龄1x11111121311122221222322222,2237,3753,530,220,370,531,01,11,20,00,10,2x x x x x x x x x x x x x x x x x x ===⎧⎧⎧===⎨⎨⎨≠≠≠⎩⎩⎩===⎧⎧⎧===⎨⎨⎨≠≠≠⎩⎩⎩，，，，1)直接进行y与6个虚拟变量的未加权的logistic回归，SPSS输出结果如下：由方差分析表知F=2.472，P值=0.106，大于5%，说明回归方程不显著；且除了x外，其它自变量对应的回归系数都没通过检验。

12下面通过后退法选择变量对上述模型改进。

SPSS输出结果如下表：后退法的过程中剔除了211,x x ，留下了1312,x x ，但是13x 对应的回归系数未通过检验，将其剔除，最后留下了12x ；而且回归方程显著，2) 加权回归：用后退法选择变量，由输出结果（如下）可知最后只留下了2x 。

从上表可以看出，最后只保留了变量2x （P 值小于0.05），回归方程为：2ˆ0.220.335px '=-从模型概要表中可以看出模型四的回归方程的拟合优度不佳。

（3）对回归的效果不满意。

变量x在不同的回归方法下显著性不同，1对该变量的显著性判定还有待改进。