第三章回归测法
第三章 一元线性回归模型
第三章 一元线性回归模型一、预备知识(一)相关概念对于一个双变量总体,若由基础理论,变量和变量之间存在因果),(i i x y x y 关系,或的变异可用来解释的变异。
为检验两变量间因果关系是否存在、x y 度量自变量对因变量影响的强弱与显著性以及利用解释变量去预测因变量x y x ,引入一元回归分析这一工具。
y 将给定条件下的均值i x i yi i i x x y E 10)|(ββ+=(3.1)定义为总体回归函数(PopulationRegressionFunction,PRF )。
定义为误差项(errorterm ),记为,即,这样)|(i i i x y E y -i μ)|(i i i i x y E y -=μ,或i i i i x y E y μ+=)|(i i i x y μββ++=10(3.2)(3.2)式称为总体回归模型或者随机总体回归函数。
其中,称为解释变量x (explanatory variable )或自变量(independent variable );称为被解释y 变量(explained variable )或因变量(dependent variable );误差项解释μ了因变量的变动中不能完全被自变量所解释的部分。
误差项的构成包括以下四个部分:(1)未纳入模型变量的影响(2)数据的测量误差(3)基础理论方程具有与回归方程不同的函数形式,比如自变量与因变量之间可能是非线性关系(4)纯随机和不可预料的事件。
在总体回归模型(3.2)中参数是未知的,是不可观察的,统计计10,ββi μ量分析的目标之一就是估计模型的未知参数。
给定一组随机样本,对(3.1)式进行估计,若的估计量分别记n i y x i i ,,2,1),,( =10,),|(ββi i x y E 为,则定义3.3式为样本回归函数^1^0^,,ββi y ()i i x y ^1^0^ββ+=n i ,,2,1 =(3.3)注意,样本回归函数随着样本的不同而不同,也就是说是随机变量,^1^0,ββ它们的随机性是由于的随机性(同一个可能对应不同的)与的变异共i y i x i y x 同引起的。
第三章多元线性回归模型案例
第三章多元线性回归模型案例第三章多元线性回归模型案例⼀、邹式检验(突变点检验、稳定性检验) 1.突变点检验1985—2002年中国家⽤汽车拥有量(t y ,万辆)与城镇居民家庭⼈均可⽀配收⼊(t x ,元),数据见表3.1。
表3.1 中国家⽤汽车拥有量(t y )与城镇居民家庭⼈均可⽀配收⼊(t x )数据年份 t y (万辆)t x (元)年份 t y (万辆)t x (元)1985 28.49 739.1 1994 205.42 3496.2 1986 34.71 899.6 1995 249.96 4283 1987 42.29 1002.2 1996 289.67 4838.9 1988 60.42 1181.4 1997 358.36 5160.3 1989 73.12 1375.7 1998 423.65 5425.1 1990 81.62 1510.2 1999 533.88 5854 1991 96.04 1700.6 2000 625.33 6280 1992 118.2 2026.6 2001 770.78 6859.6 1993155.772577.42002968.987702.8下图是关于t y 和t x 的散点图:从上图可以看出,1996年是⼀个突变点,当城镇居民家庭⼈均可⽀配收⼊突破4838.9元之后,城镇居民家庭购买家⽤汽车的能⼒⼤⼤提⾼。
现在⽤邹突变点检验法检验1996年是不是⼀个突变点。
H 0:两个⼦样本(1985—1995年,1996—2002年)相对应的模型回归参数相等 H 1:备择假设是两个⼦样本对应的回归参数不等。
在1985—2002年样本范围内做回归。
在回归结果中作如下步骤:输⼊突变点:得到如下验证结果:由相伴概率可以知道,拒绝原假设,即两个样本(1985—1995年,1996—2002年)的回归参数不相等。
所以,1996年是突变点。
2.稳定性检验以表3.1为例,在⽤1985—1999年数据建⽴的模型基础上,检验当把2000—2002年数据加⼊样本后,模型的回归参数时候出现显著性变化。
数学地质第三章 回归分析
yi
n
(3-9)
n 1 1 y yi x xi n i 1 n i 1 则式(3-9)可化为
n
n n 2 na x b xi xi y i i 1 i 1 a bx y
(3-10)
二、参数a,b的最小二乘估计
由式(3-10)中第一个方程得
y x
一、一元线性回归的数学模型
将式(3-2)及式(3-3)两边取对数,则分别为 Lny=lnα+βx (3-4) 及 lny=lnα+βlnx (3-5) 如果在式(3-4)中令Y=lny,则Y与x即成线性 关系;如果在式(3-5)中令Y=lny,X=lnx,则Y与X 就成线性关系。此外,还有一些函数,只要经过简单 变换,也可变为线性关系。这些统称为可化为线性关 系的情况,只要线性情况得到解决,可化为线性的情 况也就不难解决。
一元线性回归分析,主要是处理两个变量
x、y之间的关系。两个变量之间的关系有线性 和非线性两种情况,这里主要讨论线性关系及 可化为线性关系的非线性情况。
一、一元线性回归的数学模型
线性关系数学模型,如 y=a+bx (a,b为常数) (3-1) 非线性的情况,如指数函数 x y e (α,β为常数) (3-2) 幂函数形式 (3-3)
n Q 2 ( yi a bxi ) 0 a i 1 n Q 2 ( yi a bxi ) xi 0 b i 1
( 3-8)
二、参数a,b的最小二乘估计
即
令
i 1 i 1 n n n a xi b xi2 xi y i i 1 i 1 i 1 na b xi
二、参数a,b的最小二乘估计
气象统计方法课件 3回归分析
当b<0,回归直线斜率为负,预报量y随预报因子x增加而减少, 反映预报量与因子是负相关; 当b>0,回归直线斜率为正,预报量y随预报因子x增加而增加, 反映预报量与因子是正相关。
二、回归问题的方差分析
1、意义 评价回归方程的优劣。
2、预报量的方差可以表示成回归估计值的方差 (回归方差)和误差(残差)方差之和。
1
n
n i 1
( yi
y)2
1 n
n i 1
( yˆi
y)2
1 n
n i 1
( yi
yˆ )2
(4)
即: sy2 syˆ2 se2
• 方差分析表明,预报量y的变化可以看成由 前期因子x的变化所引起的,同时加上随机 因素e变化的影响,这种前期因子x的变化影 响可以用回归方差的大小来衡量。如果回 归方差大,表明用线性关系解释y与x的关系 比较符合实际情况,回归模型比较好。
xi
n i 1
yi
n
n
n
b0
i 1
xi
b
i 1xi 2源自i 1xiyi
(3)
(3)式称为求回归系数的标准方程组。
回归系数也可直接表示为:
b0 y bx
n
b
xi yi nxy
i 1
n
xi2 nx 2
i 1
Sxy Sx2
将 b0 =y bx 代入回归方程 yˆi =b0 bxi,得
回归分析与相关分析的区别:
1. 相关分析中,变量x、y处于平等的地位;回归分析中,
变量y称为因变量,处在被解释的地位,x称为自变量, 用于预测因变量的变化。 2. 相关分析中所涉及的变量x和y都是随机变量;回归分 析中,因变量y是随机变量,自变量x可以是随机变量, 也可以是非随机的确定变量。 3. 相关分析主要是描述两个变量之间线性关系的密切程 度;回归分析不仅可以揭示变量x对变量y的影响大小, 还可以由回归方程进行预测和控制。
人教版高中数学第三章3.1第2课时线性回归分析
+
8.95
+
9.90
+
10.9
+
11.8)≈9.487,
所以 R2=1-01.40.16378184≈0.999 1, 所以回归模型的拟合效果较好.
(3)由表中数据可以看出残差点比较均匀地落在不超 过 0.15 的狭窄的水平带状区域中,说明选用的线性回归 模型的精度较高,由以上分析可知,弹簧长度与拉力成线 性关系.由残差表中的数值可以看出第 3 个样本点的残差 比较大,需要确认在采集这个数据的时候是否有人为的错 误,如果有的话,需要纠正数据,重新建立回归模型.
由公式得:^z =0.69x+1.115,则有^y=e0.69x+1.115. (2)由计数器得如下数表:
^y 6.08 12.12 24.17 48.18 96.06 191.52 y 6 12 25 49 95 190
R2=1-244.8614621.8≈0.999 8, 即解释变量天数对预报变量繁殖细菌个数解释了 99.98%.
x 21 23 25 27 29 32 35 z 1.946 2.398 3.045 3.178 4.190 4.745 5.784
利用公式求得回归直线方程为^z =0.272x-3.849, 所以^y =e0.272x-3.849
残差:
yi 7
11
21
24
66 115
yi 6.443 11.101
解析:因为^z =0.25x-2.58,^z =ln y,所以 y=e0.25x
-2.58.
答案:y=e0.25x-2.58
类型 1 线性回归分析(自主研析)
[典例 1] 为研究重量 x(单位:克)对弹簧长度 y(单位: 厘米)的影响,对不同重量的 6 个物体进行测量,数据如 下表所示:
03第三章 回归分析预测法
ˆ ˆ x )2 ˆi ) 2 ( yi Q ei2 ( yi y 0 1 i
第三章>>第一节
二、一元线性回归模型参数的估计
根据微分学求极值的原理,对上式求偏导,并令其为 零 得方程组:
yi n 0 1 xi 2 xi yi 0 xi 1 xi
即哪个或哪些是被解释变量哪个或哪些是解释变量将影响研究对象的最主要的定量的经常发生作用的有数据支持的因素作为解释变量纳入模型之中并确定解释变量和被解释变量之间的变动方向解释变量之间相关性研究建模用于经济结构分析时选用恰当的统计指标慎重使用虚拟变量4确定模型的数学形式依据数理经济理论由散点图相关图趋势图观察样本数据变动模式
随机误差项的影响因素
人们的随机行为 回归模型中 省略的变量
2
1
随机误差项 建立的数学模型 的形式不够完善
3
的影响因素
测量误差
5 4
经济变量之间的 合并误差
第三章>>第一节
一、一元线性回归模型的建立
• (二)随机误差项的意义和标准假定
– 随机误差项u是无法直接观测的,为了进行回归分析, 通常设其满足以下标准假定: – 古典线性回归模型(classical linear regression model,CLRM)基本假定: 1. 零均值假定:u i 的期望为0,即:
• 一致性:随着样本量的增大,估计量的 • 值越来越接近被估计的总体参数
ˆ) P(
较大的样本量
B A
较小的样本量
ˆ
最小方差性证明略。
第三章>>第一节
三、一元线性回归模型的检验
• (一)经济检验
第三章_回归分析
第三章 回歸分析 §1 一元線性回歸 一、回歸模型設隨機變數y 與引數x 之間存在線性關係,它們的第i 次觀測數據是:(xi,yi)(i=1,2,…,n)那麼這組數據可以假設具有如下的數學結構式:i i i x y εββ++=0(i=1,…,n ),其中β0, β為待估參數,),0(~2σεN i ,且n εεε,,,21 相互獨立,這就是一元線性回歸的數學模型。
二、參數估計 1.回歸係數設b0和b 分別是參數β0, β的最小二乘估計,於是一元線性回歸方程為:i i bx b y+=0ˆ (i=1,2,…,n ) b0,b 叫做回歸係數,它使偏差平方和∑∑==--=-=ni i i ni i i bx b y yy Q 12012)()ˆ(取最小值。
由 ⎝⎛=---=∂∂=---=∂∂∑∑==0)(20)(210100ni i i i ni i i x bx b y b Q bx b y b Q整理得正規方程組: 020()()()i ii i i inb x b y x b x b x y +∑=∑⎛∑+∑=∑⎝解得 xx xy S S b x b y b /,0=-= 其中 222)(x n x x x S i i xx -∑=-∑=y x n y x y y x x S i i i i xy -∑=--∑=))((另外 y n y y y S i i yy -∑=-∑=22)( 2.最小二乘估計b0,b 的統計性質 (1)E(b)= β,E(b0)= β0即b0,b 分別是β0,β的無偏估計 (2)22()/()i D b x x σ=∑-22201()[/()]i D b x x x nσ=+∑-即回歸係數b0,b 與σ2,x 的波動大小有關,b0還與n 有關,這就是說,x 值越分散,數據越多,估計b0,b 越精確。
三、假設檢驗 1.回歸方程顯著性檢驗欲檢驗y 與x 之間是否有線性關係,即檢驗假設H0:β=0。
第三章 回归诊断(2)(计量经济模型课件-中科院,许健)
本期GDP高于期望,有理由预测下一期也会 高;某个家庭的消费偏低,有理由推测另一 个家庭消费也偏低(正相关)
(一)自相关的经济背景
遗漏关键变量 如果这些关键变量在时间顺序上的影响 正相关,就会出现序列正相关 经济周期 不正确的函数形式 蛛网现象
(一)自相关的经济背景
数据处理导致自相关
1
广义差分法
Yt 0 1 X t ut
Yt 1 0 1 X t 1 ut 1 Yt Yt 1 0 1 1 X t X t 1 vt
广义差分法实现的关键就在于对自相关 系数的估计
自相关系数的估计
自相关系数的估计
如果样本量过小,那么第一个观测值也 不能损失,此时可以采用Prais-Winsten 变换:
Y1 1 2 X1 1
2
自相关系数的估计
Durbin两步法
Yt Yt 1 0 1 1 X t X t 1 vt Yt 0 1 1 X t 1 X t 1 Yt 1 vt 作Yt 对X t,X t 1和Yt 1的回归 将得到的Yt 1之前的系数作为对 的估计 ˆ 获得后,按一般方法将变量 作广义差分进行回归
(二)自相关的影响
14 y = 0.7528x + 4.0004 12 10 8 6 4 2 0 0 2 4 6 8 10 12 R2 = 0.8176
拟合回归线
(二)自相关的影响
真实回归线
12 10 8 6 4 2 0 0 2 4 6 8 10 12
(二)自相关的影响
真实残差平方和:130.7
计量地理学第三章——2 回归分析
例1
一元线性回归方法的基本公式为:
y a bx
式中:a,b为待定参数,其表达式如下:
b Lxy Lxx
n i 1
xi yi
1 n
n
(
i 1
xi )(
n i 1
n i 1
xi2
1 n
n
(
i 1
xi )2
yi )
a y bx
变差 来源 回归
误差
总和
平方和
自由度
n
SSR (Yˆi Y )2
地区编号 1 2 3 4 5 6 7 8
月平均销售收 入(万元)y
31
40
30
34
25
20
35
40
月平均广告支 出(万元)x
5 10 5
7
4
3
7
9
要求:对于不同的月平均广告支出预测月平均销售收入
解:由计算结果可知,回归方程为
SST=338.875 SSR=314.532 SSE=24.343
Y 14.669 2.753X
因此,对于不同的月平均广告支出,其月平均销售收入的预测 结果如下:单位:万元
月平均广告支出 平均收入的点预测 平均收入的区间预测
6
31.187
(25.956,36.418)
8
36.693
(31.296,42.090)
12
47.705
(40.872,54.538)
直线回归、相关分析的注意事 项:
1)相关分析只是以相关系数来描述两个变量间线性相关 的程度和方向,并不阐明事物间存在联系的本质,也不是两事 物间存在联系的证据。要阐明两事物间的本质联系,必须凭专 业知识从理论上加以论证。因此,把两个毫无关系的事物放在 一起作相关分析是毫无意义的。同样,回归分析也要有实际意 义。
第三章回归分析基本方法最小二乘法
第三章回归分析基本方法最小二乘法回归分析是统计学中一种常用的方法,主要用于研究一个或多个自变量与因变量之间关系的强度和方向。
在回归分析中,最常用的方法是最小二乘法。
最小二乘法是一种通过最小化观测值与拟合值之间的平方误差来估计参数的方法。
其基本思想是通过找到使得平方误差最小的参数值来拟合数据。
最小二乘法可以应用于各种类型的回归模型,包括简单线性回归和多元线性回归。
在简单线性回归中,我们研究一个自变量与一个因变量之间的关系。
假设我们有一组观测数据(x_i,y_i),其中x_i为自变量的取值,y_i为相应的因变量的取值。
我们想要找到一条直线来拟合这些数据点,使得误差最小化。
最小二乘法的目标是找到最合适的斜率和截距来拟合数据,最小化残差平方和。
具体而言,假设我们的模型为y=β_0+β_1*x,其中β_0为截距,β_1为斜率。
我们的目标是找到最合适的β_0和β_1来最小化残差平方和,即最小化∑(y_i-(β_0+β_1*x_i))^2最小二乘法的求解过程是通过对残差平方和关于β_0和β_1求偏导数,令偏导数为0,得到关于β_0和β_1的方程组。
通过求解这个方程组,我们可以得到最佳的β_0和β_1的估计值。
在多元线性回归中,我们考虑多个自变量与一个因变量之间的关系。
假设我们有p个自变量,我们的模型可以表示为y=β_0+β_1*x_1+β_2*x_2+...+β_p*x_p。
最小二乘法的求解过程与简单线性回归类似,只是需要求解一个更复杂的方程组。
最小二乘法在回归分析中的应用非常广泛。
它可以用于预测和建模,也可以用于建立因果关系的推断。
此外,最小二乘法还可以用于进行参数估计和统计检验。
总结起来,最小二乘法是一种基本的回归分析方法,通过最小化观测值与拟合值之间的平方误差来估计参数。
它在简单线性回归和多元线性回归中都有广泛应用,是统计学中重要的工具之一。
第三章 回归分析预测法 《统计预测与决策》PPT课件
残差分析; 异方差及自相关检验(DW)
24
拟合优度
• 拟合优度是指样本回归直线对观测数据 拟合的优劣程度。
• 如果全部观测值都在回归直线上,我们 就获得“完全的”拟合,但这是罕见的 情况,通常都存在一些正ei或负ei。我们 所希望的就是围绕回归直线的剩余尽可 能的小。
(基本假定)
1) 误差项ε是一个期望值为0的随机变量,即 E(ε)=0。对于一个给定的 x 值,y 的期望值
为E ( y ) =b 0+ b 1 x
2) 对于所有的 x 值,ε的方差σ2 都相同
3) 误差项ε是一个服从正态分布的随机变量,且 相互独立。即ε~N( 0 ,σ2 )
a. 独立性意味着对于一个特定的 x 值,它所对应 的ε与其他 x 值所对应的ε不相关
y
(xn ,yn)
yˆ bˆ0 + bˆ1x
(x2 ,y2)
}
ei = yi^-yi
(x1 ,y1) (xi , yi)
17
x
最小二乘估计式
• 根据最小二乘准则建立样本回归函数的 过程为最小二乘估计,简记OLS估计。
• 由此得到的估计值得计算式称为最小二 乘估计式。
18
双变量线性回归模型的最小二乘估计
36
▪ 包含在y里面但不能被p个自变量的线性关系
所解释的变异性
多元回归模型
(基本假定)
1. 误差项ε是一个期望值为0的随机变量,即
E()=0 2. 对于自变量x1,x2,…,xp的所有值,的
方差2都相同 3. 误差项ε是一个服从正态分布的随机变量,
即ε~N(0,2),且相互独立
37
多元回归方程
第三章回归分析预测方法课件
简单线性回归方程的形式为 y b0 b1x e ,
也称为直线回归方程。其中, b0是回归直线在y轴上的截距; b1是直线的斜率,称为回归系数,表示当x每变动一个单位 时,y的平均变动值。
x
相关但无
线性关系
-3
-2
-1
0
1
2
3
x
2、回归分析与相关分析
研究和测度两个或两个以上变量之间关系的方 法有回归分析和相关分析。
相关分析。研究两个或两个以上随机变量之 间线性依存关系的紧密程度。通常用相关系 数表示,多元相关时用复相关系数表示。
回归分析。研究某一随机变量(因变量)与 其他一个或几个普通变量(自变量)之间的 数量变动的关系。
-1
0
1
2
x
(c)
-2
-1
0
1
2
x
(d)
y 02468
y -2 -1 0 1 2
-2
-1
0
1
2
x
-3
-2
-1
0
1
2
3
x
(a)
y -2 -1 0 1 2
不相关
-3
-2
-1
0
1
2
x
(c)
y -2 -1 0 1 2
(b)
正相关
-2
-1
0
1
2
x
(d)
y 02468
y -2 -1 0 1 2
-2
-1
0
1
2
负相关
法国数学家勒让德于1806年首次发表最小二乘理论。事实上, 德国的高斯于1794年已经应用这一理论推算了谷神星的轨道, 但迟至1809年才正式发表。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 回归预测法
基本内容
一、一元线性回归预测法
是指成对的两个变量数据分布大体上呈直线趋势时,运用合适的参数估计方法,求出一元线性回归模型,然后根据自变量与因变量之间的关系,预测因变量的趋势。
由于很多社会经济现象之间都存在相关关系,因此,一元线性回归预测具有很广泛的应用。
进行一元线性回归预测时,必须选用合适的统计方法估计模型参数,并对模型及其参数进行统计检验。
1、建立模型
一元线性回归模型: i i i x b b y μ++=10
其中,0b ,1b 是未知参数,i μ为剩余残差项或称随机扰动项。
2、用最小二乘法进行参数的估计时,要求i μ满足一定的假设条件: ①i μ是一个随机变量;
②i μ的均值为零,即()0=i E μ;
③在每一个时期中,i μ的方差为常量,即()2
σμ=i D ;
④各个i μ相互独立; ⑤i μ与自变量无关; 3、参数估计
用最小二乘法进行参数估计,得到的0b ,1b 的公式为: ()()()
∑∑---=
2
1x x y y x x b x b y b 10-=
4、进行检验
①标准误差:估计值与因变量值间的平均平方误差。
其计算公式为:()2
ˆ2
--=
∑n y y SE 。
②可决系数:衡量自变量与因变量关系密切程度的指标,在0与1之间取值。
其计算公式
为:()()()()
()()∑∑∑∑∑---=⎥⎥⎦
⎤⎢⎢
⎣
⎡
----=222
2
2
2
ˆ1y y y
y y y x x y y x x R 。
③相关系数;计算公式为:()()()()
∑∑∑----=2
2
y y x x y y x x r 。
④回归系数显著性检验
i 检验假设:0:10=b H ,0:11≠b H 。
ii 检验统计量:b
S b t 1
=
~()2-n t ,其中()
∑-=2
x x SE
S b 。
iii 检验规则:给定显著性水平α,若αt t >,则回归系数显著。
⑤回归模型的显著性检验
i 检验假设::0H 回归方程不显著 ,:1H 回归方程显著。
ii 检验统计量:()()()
2ˆˆ2
2
---=
∑∑n y
y y y
F ~()2,1-n F 。
iii 检验规则:给定显著性水平α,若()2,1->n F F α,则回归方程显著。
⑥得宾—沃森统计量(D —W ):检验i μ之间是否存在自相关关系。
()∑∑==--=
-n
i i
n
i i i W D 1
222
1μ
μμ,其中i i i y
y ˆ-=μ。
5、进行预测
小样本情况下,近似的置信区间的常用公式为:置信区间=tSE y
±ˆ。
二、多元线性回归预测法
社会经济现象的变化往往受到多个因素的影响,因此,一般要进行多元回归分析,我们把包括两个或两个以上自变量的回归成为多元回归。
多元回归与医院回归类似,可以用最小二乘法估计模型参数。
也需对模型及模型参数进行统计检验。
选择合适的自变量是正确进行多元回归预测的前提之一,多元回归模型自变量的选择可以利用变量之间的相关矩阵来解决。
1、 建立模型—以二元线性回归模型为例
二元线性回归模型:222110i i x b x b b y μ+++=。
类似使用最小二乘法进行参数估计。
2、 拟合优度指标
①标准误差:对y 值与模型估计值之间的离差的一种度量。
其计算公式为:
()3
ˆ2
--=
∑n y y SE
②可决系数:()()
∑∑---
=2
22
ˆ1y y y
y R。
02
=R 意味着回归模型没有对y 的变差做出任
何解释;而12=R 意味着回归模型对y 的全部变差做出解释。
3、 置信范围
置信区间的公式为:置信区间=SE t y
p ±ˆ,其中p t 是自由度为k n -的t 统计量数值表中的数值,n 是观察值的个数,k 是包括因变量在内的变量的个数。
4、自相关和多重共线性问题
①自相关检验:()∑∑==--=
-n i i n
i i i W D 12
2
2
1μμμ,其中i i i y
y ˆ-=μ。
②多重共线性检验
由于各个自变量所提供的是各个不同因素的信息,因此假定各自变量同其他自变量之间是无关的。
但是实际上两个自变量之间可能存在相关关系,这种关系会导致建立错误的回归模型以及得出使人误解的结论。
为了避免这个问题,有必要对自变量之间的相关与否进行检验。
任何两个自变量之间的相关系数为:()()
()()
∑∑∑----=
2
2
y y x x y y x x r ,经验法则认为相
关系数的绝对值小于0.75,或者0.5,这两个自变量之间不存在多重共线性问题。
三、非线性回归预测法 在社会现实经济生活中,很多现象之间的关系并不是线性关系,对这种类型现象的分析预测一般要应用非线性回归预测,通过变量代换,可以将很多的非线性回归转化为线性回归。
因而,可以用线性回归方法解决非线性回归预测问题。
选择合适的曲线类型不是一件轻而易举的工作,主要依靠专业知识和经验。
常用的曲线类型有幂函数,指数函数,抛物线函数,对数函数和S 型函数。
四、应用回归预测法时应注意的问题
应用回归预测法时应首先确定变量之间是否存在相关关系。
如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。
正确应用回归分析预测时应注意:
①用定性分析判断现象之间的依存关系; ②避免回归预测的任意外推; ③应用合适的数据资料;。