线性回归的基本模型

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.回归方程拟合程度检验 在回归方程拟合程度检验中,应用可决系数指标来回加以检验,
可决系数越大,说明回归方程对实际数值的拟合程度越好
R2= ∑(ŷ-y)2/ ∑(y-y)2= S回/ S总=1- S残/ S总 在考虑变量自由度的情况下,修正的可决系数:
R2= [S回/(n-k)]/[ S总/(n-1)]=1- [S残/(n-k)]/ [S总/(n-1)] =1-[27.08/(10-3)]/244.4/(10-1)]=0.84
592
-0.2054 -0.0286 0.1389
1.6416 -0.0839 B= (x’x)-1×x’y= -0.0839 0.0188
-0.2054 -0.0286 由此得多元回归方程为:
ŷ=4.58751+1.86847x1-1.79957x2
-0.2054 -0.0286 0.1389
166
多元回归模型中的回归系数检验采用t检验,公式如下:
tbj=bj/sbj
sbj= sy2×Ωjj=sy Ωjj
式中Ωjj为(x’x)-1矩阵中的第j个对角线的元素,上例中Sy=1.97;
Ω11=1.6416; Ω22=0.0188; Ω33=0.1389
则tb1=4.5875/(1.97 × 1.6416 )=1.82
n=6<30时,查七分布表ta/2(n-2)=t(0.025)(4)2.78 ta/2(n-2) ×Sy × 1+1/n+(x0-x)2/ ∑ (x-x)2=0.6579 所以建造成本的区间预测在显著性水平为a=5%,即以95%的概
率计算y0=15.081±0.6579,即在[14.4231—15.7389]万元之间
得y’=a+bx’化成直线方程的形式
p
可求出a、b的参考值。该方程的
特点是某变量刚开始时,随着X
x
的增加,y的增长速度逐渐增加, I
II III IV
当y达到一定水平时,其增长速度又放慢,最后超近于 一条渐近 线。该方程经常用来描述某消费品的生命周期的变化,可将其 分为四个阶段,即缓慢增长→快速增长→增速放慢→相对饱和 p为一拐点。
二、非线性回归模型—曲线回归模型
在对客观现象选择回归模型时,应注意:
1、回归方程的形式应与经济学的基本理论相一致,应该在定 性分析和定量分析的基础上选择适当的回归模型
2、回归方程与实际现象的变量值应要有较高的拟合程度,能 较好地反映经济实际运行趋势
3、在对方程的模型一时无法判断时,可先画散点图,观察现 象实际值的变动趋势,来选择相应的拟合回归模型。或者 多选择几个回归模型,加以拟合,分别计算估计标准误差, 选择估计标准误差最小的那个回归模型
Sy= ∑(y- ŷ)2/(n-2)= 0.0181924/(6-2)=0.2133
r=Lxy/ LxxLyy = (∑xy- ∑x ∑y/n)/ [∑x2-(∑x)2/n][∑y2-(∑y)2/n] =0.973 预测:假设x0=4.5时,y0=10.59+0.998×4.5=15.081(万元),当
估计标准误差: Sy= ∑(y- ŷ)2/(n-2) =
(∑y2-a ∑y-b ∑xy)/n-2
相关系数: R=Lxy/ LxxLyy
Lxy= ∑xy- (∑x ∑y)/n Lxx= ∑x2-(∑x)2/n Lyy= ∑y2- (∑y)2/n
●线性回归模型预测
当计算回归模型由大样本计算时(n>30), 其预测区间的误差分布服从正态分布,则预 测区间为:
123201
148.2
140
532
367
74480
51384
195244
283024
134698
138.1
149 ∑ 968
550 3622
374 2472
81950 501415
55726 341923
205700
302500
139876
148.8
1281444
1877174
875116
968.0
《计量经济模型与经济预测》
福州大学管理学院 林筱文教授编 联系电话:0591-3710642;7937642
一、线性回归模型
最小二方程原理和参数估计
Ŷ=a+bx
y
Q=∑(y- ŷ) →最小
=∑(y-a-bx)2 →最小
ŷ
对a和b求一阶微分
2Q/2A=2 ∑(y-a-bx)(-a)=0
2Q/2B= 2 ∑(y-a-bx)(-bx)=0
指数曲线因a、b的取值不同而表现出不同的变化形式:
x
x
x
x
y
y
y
y
●对数函数曲线
ŷ=a+blnx,令x’=lnx,把方程变成直线方程的形式,求出 a、b的参数值。
对数函数的特点是随着x的增大,x的单位变动对Y的影响 效果递减。
●S函数曲线(逻辑曲线)
ŷ =1/a+be-x
y
换元令y’=1/y, x’=e-x
0.214
0.045796
13.588
-0.084
0.047524
15.580
-0.180
0.032400
14.582
-0.282
0.079524
15.580 86.49
-0.320 _____
0.010240 0.181924
解:
b=[338.4-1/6(23)(86.5)]/[95-1/6(23)2]=0.998 a=86.5/6-0.998×(23/6)=10.59 待线性回归方程: ŷ=10.59+0.998x 即建筑面程每增加一万m2,建造成本要平均增加0.998万元
1 52 X= 1 7 3
…… … 1 15 4
166
10 Y= 10
… 23
1.6416
b1
10 98 35
B= b2 (x’x)= 98 1038 359

35 359 133
b3
-0.0839 -0.2054
(x’y)= 1743 (x’x)-1 = -0.0839 0.0188 -0.0286
tb2=1.8685/(1.97 × 0.0188 )=6.92
tb3=-1.7996/(1.97 × 0.1398 )=-2.45
查t分布表(a=0.05),双侧临界值t(a/2)(n-k)=t(0.05/2)(10-3)=2.365, 上述tb2=6.92>2.365,tb3= -2.45 >2.365,说明b1和b2均能通过检 验,说明x1和x2对y的影响是显著的,而tb1=1.82<2.365,不 能通过检验,说明在建立回归方程时,不必设常数项,由此 再根据实际资料,建立拟合的多元回归方程。
例:下表列出某商品销售量(Y)与居民人均收入 (x1)和单价(x2)的有关资料。`
年份
1
2
3
4
5
6
7
8
9
10
销售量 (y百件)
10 10 15 13 14 20 18 24 19 23
居民人均收入
(x 百元)
5
7
8
9
9 10 10 12 13 15
1
单价(x 十元) 1
2
3
2
5
4
3
4
3
5
4
上表中有关数据的矩阵表示为:
ŷ0=(a+bx0) ±(Z2/2)×Sy
当计算回归模型由小样本计算时(n<30), 其预测区间的误差分布服从七分布,则预测 区间为:
ŷ0 =(a+ bx0) ±(Ta/2) × Sy ×1+1/n+[(X0-X)2/ ∑(XX)2]
例:
建筑面积 (万m2)x
建造成本 (万元)y
4
14.8
2
12.8
2.回归系数的显著性检验
在这一检验的目的是为了检验各回归系数对应的自变量(x i)对因 变量(y)的影响是否显著,以便对各个自变量的选择作出正确 的判断。一般说来,当某个自变量(x i)的回归系数(b i)的显著 性检验无法通过,则说明该自变量对因变量的影响在一定显著 水平(一般 a=0.05)不够显著,则就可以将该自变量从回归模型 中删除,这样才能以尽可能少的自变量去建立回归模型,达到 到尽可能高的拟合度,同时也可减少计算工作量
4.58751
1743 = 1.86847
592 -1.79957
●回归方程的方差估计
Sy2=∑(y- ŷ)2/(n-k)= ∑e2/(n-k)
∑e2=e’e=Y’Y-BX’Y=2980-4.58751×166-1.86847 ×1743+1.79957+1.79957 ×592=3
13.3
5
15.4
4
14.3
5
15.9
∑ 23
86.5
x2
y2
xy
16
219.04
59.2
4
163.84
25.6
9
176.89
39.6
25
237.16
77.0
16
204.49
57.2
25
252.81
79.5
95
1254.23
338.4
ŷ
y- ŷ
(y- ŷ)2
14.582
0.218
0.047524
12.586
y
∑xy=a ∑x+b ∑x2+c ∑x3
∑x2y=a ∑x2+b ∑x3+C ∑x4
x 判定某变量趋势是否符合抛物线议程时,可利用差分法: 1、当X以一个常数变化时,Y的一阶差分即△Y=Yt-Yt-1的绝对值也
接近一个常数时,该变量的变化可用直线方程来拟合。 2、当X从一个常数变化时,Y的二阶差分即△Y2t= △Yt- △Yt-1的绝
对值接近一个常数时,该变量的变化可用抛物线方程来拟合。
●指数曲线方程
该于方一程个常常用数于时拟,合就某可变用量指值数的曲环线比方,程即来拟Yt/Y合t-。1的绝对值近似
ŷ=abx
对方程两边求对数:
lgy=lga+lgb×x
换元令lgy=Y lga=A lgb=B
得:
Y=A+Bx,化成直线方程的形式,求出A、B的参数值,再分别 求反对数,就可求出a、b的参数值,
∑x1y= a∑x1 +b∑x12 +c∑ x1 x2 ∑x2y= a∑x2 +b∑ x1 x2 +c∑x22
例:根据下表计算二元回归方程
利润额
销售额
流通费用
Xy
Xy
Xx
X2
X2
ŷ
y
x
x
1
2
12
1
2
1
2
124
500
350
62000
43400
175000
250000
122500
124.1
142
480
4、回归模型的数学形式要尽可能简单,一般说来,数字型式 越简单,则基回归模型的可操作性越强。过于复杂的回归 模型的数学形式在实际经济分析和经济预测中,其实际应 用价值不大
●抛物线方程
抛物线方程: ŷ=a+bx+cx2
根据最小二乘法原理,求该方程待定a、b、c参数的方程组如下:
∑y=na+b ∑x+c ∑x2
●多元回归方程的矩阵形式
二元回归方程的矩阵形式表现为:
Y=XB 其中:
y1
y2
Y=

1 x21 … … xk1 1 x22 … … xk2 X= … … … … …
yn
1 x2n … … xkn
b1 b2 B= …
bn
按矩阵计算原理: Y=XB→X’Y’=X’XB →(X’X)-1×X’Y=(X’X)-1(X’X)B →B=(X’X)-1X’Y
三、多元回归模型
模型与参数估计
ŷ =a+bx1+cx2+dx3+…….. 多元回归就是分析在多个自变量(x)与因变量(y)相互关系的基
础上,确定一个多元回归模型,然后根据各个自变量的变动来 估计或预测因变量的变动程度。 根据最小二乘法原理,以二元回归方程为例,说明求其参数的方 法: ŷ=a+ bx1+cx2 ∑y=na+b∑x1+c∑x2
27.08
S= S2 = n-k = 10-3 = 3.8686 =1.97
S称为回归方程的估计标准误差,S越小 则表明样本回 归方程的代表性越强
●多元回归方程的检验
根据线性方程方差分析的原理: ∑(y-y)2= ∑(ŷ-y)2+ ∑(y-ŷ)2 S总=S回+S残
(y- ŷ) ŷ (y-y) (ŷ-y) y
x
得: ∑y-na-b ∑x=0 → ∑y=na+b∑x=0 ∑xy-a∑x-b∑x2=0 ∑xy=a∑x+b∑x2=0
得: a= ∑y/n-b (∑y/n)
b= [∑xy- (∑x) (∑y) /n]/ ∑x2-(∑x)2=Lxy/Lxx 回归系数b说明当x变动一个单位时,y平均变动一个b的值
回归误差估计和相关系数
将上述有关数字代入二元回归的方程组:
986=7a+3622b+2472c 501415=3622a+1877174b+1281444c 341923=2472a+1281444b875116c
得:a=-5.0657 b=1.0072 c=-1.0698
二元回归方程: ŷ=-5.0657+1.0072x1-1.0698x2
315
68160
44730
151200
230400
99225
141.4
132
520
360
68640
47520
187200
270400
129600
133.5
134
515
355
69010
47570
182825
265225
126025
133.9
147
525
351
77175
51597
184275
275625
相关文档
最新文档