《应用回归分析》课后题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
、
《应用回归分析》部分课后习题答案
第一章回归分析概述
1.1 变量间统计关系和函数关系的区别是什么?
答:变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。
1.2 回归分析与相关分析的联系与区别是什么?
答:联系有回归分析和相关分析都是研究变量间关系的统计学课题。区别有a.在回归分析中,变量y称为因变量,处在被解释的特殊地位。在相关分析中,变量x和变量y处于平等的地位,即研究变量y与变量x的密切程度与研究变量x 与变量y的密切程度是一回事。b.相关分析中所涉及的变量y与变量x全是随机变量。而在回归分析中,因变量y是随机变量,自变量x可以是随机变量也可以是非随机的确定变量。C.相关分析的研究主要是为了刻画两类变量间线性相关的密切程度。而回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。
1.3 回归模型中随机误差项ε的意义是什么?
答:ε为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2…..xp的关系,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。
1.4 线性回归模型的基本假设是什么?
答:线性回归模型的基本假设有:1.解释变量x1.x2….xp是非随机的,观测值xi1.xi2…..xip是常数。2.等方差及不相关的假定条件为{E(εi)=0 i=1,2…. Cov(εi,εj)={σ^2
3.正态分布的假定条件为相互独立。
4.样本容量的个数要多于解释变量的个数,即n>p.
1.5 回归变量的设置理论根据是什么?在回归变量设置时应注意哪些问题?答:理论判断某个变量应该作为解释变量,即便是不显著的,如果理论上无法判断那么可以采用统计方法来判断,解释变量和被解释变量存在统计关系。应注意的问题有:在选择变量时要注意与一些专门领域的专家合作,不要认为一个回归模型所涉及的变量越多越好,回归变量的确定工作并不能一次完成,需要反复试算,最终找出最合适的一些变量。
1.6 收集,整理数据包括哪些内容?
答;常用的样本数据分为时间序列数据和横截面数据,因而数据收集的方法主要
有按时间顺序统计数据和在同一时间截面上统计数据,在数据的收集中,样本容量的多少一般要与设置的解释变量数目相配套。而数据的整理不仅要把一些变量数据进行折算差分甚至把数据对数化,标准化等有时还需注意剔除个别特别大或特别小的“野值”。
1.7 构造回归理论模型的基本依据是什么?
答:选择模型的数学形式的主要依据是经济行为理论,根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,并将由散点图显示的变量间的函数关系作为理论模型的数学形式。对同一问题我们可以采用不同的形式进行计算机模拟,对不同的模拟结果,选择较好的一个作为理论模型。
1.8 为什么要对回归模型进行检验?
答:我们建立回归模型的目的是为了应用它来研究经济问题,但如果马上就用这个模型去预测,控制,分析,显然是不够慎重的,所以我们必须通过检验才能确定这个模型是否真正揭示了被解释变量和解释变量之间的关系。
1.9 回归模型有那几个方面的应用?
答:回归模型的应用方面主要有:经济变量的因素分析和进行经济预测。
1.10 为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?答:在回归模型的运用中,我们还强调定性分析和定量分析相结合。这是因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定性,
单纯的表面上的数量关系是否反映事物的本质?这本质究竟如何?必须依靠专门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确应用。
第二章一元线性回归
2.14 解答:(1)散点图为:
(2)x 与y 之间大致呈线性关系。
(3)设回归方程为01y x ββ∧∧∧=+
1β∧=12217()n i i i n i i x y n x y x
n x --
=-=-=-∑∑
0120731y x ββ-∧-
=-=-⨯=-
17y x ∧∴=-+可得回归方程为
(4)22n
i=1
1()n-2i i y y σ∧∧=-∑ 2n
01i=11(())n-2i y x ββ∧∧=-+∑ =2222213⎡⎤⨯+⨯+⨯⎢⎥+⨯+⨯⎣⎦(10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1169049363
110/3
=
++++=
6.1σ∧=≈
(5)由于211(,)xx N L σ
ββ∧
t σ∧==
服从自由度为n-2的t 分布。因而 /2|(2)1P t n αασ⎡⎤⎢⎥<-=-
⎢⎥⎣⎦
也即:1/2
11/2(p t t ααβββ∧∧∧∧-<<
+=1α-
可得195%β∧的置信度为的置信区间为(7-2.3537+2.353 即为:(2.49,11.5)
22001()(,())xx x
N n L ββσ-
∧
+ t ∧∧==
服从自由度为n-2的t 分布。因而
/2(2)1P t n αα∧⎡⎤⎢⎥⎢⎥<-=-
⎢⎥⎢⎥⎢⎥
⎢⎥⎣⎦ 即0/200/2()1p βσ
ββσα∧∧∧∧-<<+=- 可得195%7.77,5.77β∧-的置信度为的置信区间为()
(6)x 与y 的决定系数221
21()490/6000.817()
n i i n i
i y y r y y ∧-=-
=-==≈-∑∑