第三章回归测法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 回归预测法
基本内容
一、一元线性回归预测法
是指成对的两个变量数据分布大体上呈直线趋势时,运用合适的参数估计方法,求出一元线性回归模型,然后根据自变量与因变量之间的关系,预测因变量的趋势。由于很多社会经济现象之间都存在相关关系,因此,一元线性回归预测具有很广泛的应用。进行一元线性回归预测时,必须选用合适的统计方法估计模型参数,并对模型及其参数进行统计检验。 1、建立模型
一元线性回归模型: i i i x b b y μ++=10
其中,0b ,1b 是未知参数,i μ为剩余残差项或称随机扰动项。 2、用最小二乘法进行参数的估计时,要求i μ满足一定的假设条件: ①i μ是一个随机变量;
②i μ的均值为零,即()0=i E μ;
③在每一个时期中,i μ的方差为常量,即()2
σμ=i D ;
④各个i μ相互独立; ⑤i μ与自变量无关; 3、参数估计
用最小二乘法进行参数估计,得到的0b ,1b 的公式为: ()()()
∑∑---=
2
1x x y y x x b x b y b 10-=
4、进行检验
①标准误差:估计值与因变量值间的平均平方误差。其计算公式为:()2
ˆ2
--=
∑n y y SE 。
②可决系数:衡量自变量与因变量关系密切程度的指标,在0与1之间取值。其计算公式
为:()()()()
()()∑∑∑∑∑---=⎥⎥⎦
⎤⎢⎢
⎣
⎡
----=222
2
2
2
ˆ1y y y
y y y x x y y x x R 。
③相关系数;计算公式为:()()()()
∑∑∑----=2
2
y y x x y y x x r 。
④回归系数显著性检验
i 检验假设:0:10=b H ,0:11≠b H 。 ii 检验统计量:b
S b t 1
=
~()2-n t ,其中()
∑-=2
x x SE
S b 。
iii 检验规则:给定显著性水平α,若αt t >,则回归系数显著。 ⑤回归模型的显著性检验
i 检验假设::0H 回归方程不显著 ,:1H 回归方程显著。
ii 检验统计量:()()()
2ˆˆ2
2
---=
∑∑n y
y y y
F ~()2,1-n F 。
iii 检验规则:给定显著性水平α,若()2,1->n F F α,则回归方程显著。 ⑥得宾—沃森统计量(D —W ):检验i μ之间是否存在自相关关系。
()∑∑==--=
-n
i i
n
i i i W D 1
222
1μ
μμ,其中i i i y
y ˆ-=μ。 5、进行预测
小样本情况下,近似的置信区间的常用公式为:置信区间=tSE y
±ˆ。 二、多元线性回归预测法
社会经济现象的变化往往受到多个因素的影响,因此,一般要进行多元回归分析,我们把包括两个或两个以上自变量的回归成为多元回归。多元回归与医院回归类似,可以用最小二乘法估计模型参数。也需对模型及模型参数进行统计检验。选择合适的自变量是正确进行多元回归预测的前提之一,多元回归模型自变量的选择可以利用变量之间的相关矩阵来解决。
1、 建立模型—以二元线性回归模型为例
二元线性回归模型:222110i i x b x b b y μ+++=。类似使用最小二乘法进行参数估计。 2、 拟合优度指标
①标准误差:对y 值与模型估计值之间的离差的一种度量。其计算公式为:
()3
ˆ2
--=
∑n y y SE
②可决系数:()()
∑∑---
=2
22
ˆ1y y y
y R
。02
=R 意味着回归模型没有对y 的变差做出任
何解释;而12=R 意味着回归模型对y 的全部变差做出解释。 3、 置信范围
置信区间的公式为:置信区间=SE t y
p ±ˆ,其中p t 是自由度为k n -的t 统计量数值表中的数值,n 是观察值的个数,k 是包括因变量在内的变量的个数。
4、自相关和多重共线性问题
①自相关检验:()∑∑==--=
-n i i n
i i i W D 12
2
2
1μμμ,其中i i i y
y ˆ-=μ。 ②多重共线性检验
由于各个自变量所提供的是各个不同因素的信息,因此假定各自变量同其他自变量之间是无关的。但是实际上两个自变量之间可能存在相关关系,这种关系会导致建立错误的回归模型以及得出使人误解的结论。为了避免这个问题,有必要对自变量之间的相关与否进行检验。任何两个自变量之间的相关系数为:()()
()()
∑∑∑----=
2
2
y y x x y y x x r ,经验法则认为相
关系数的绝对值小于0.75,或者0.5,这两个自变量之间不存在多重共线性问题。
三、非线性回归预测法 在社会现实经济生活中,很多现象之间的关系并不是线性关系,对这种类型现象的分析预测一般要应用非线性回归预测,通过变量代换,可以将很多的非线性回归转化为线性回归。因而,可以用线性回归方法解决非线性回归预测问题。 选择合适的曲线类型不是一件轻而易举的工作,主要依靠专业知识和经验。常用的曲线类型有幂函数,指数函数,抛物线函数,对数函数和S 型函数。
四、应用回归预测法时应注意的问题
应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。 正确应用回归分析预测时应注意:
①用定性分析判断现象之间的依存关系; ②避免回归预测的任意外推; ③应用合适的数据资料;