南开大学计量经济学课件第5章-一元线性回归模型
一元线性回归模型(计量经济学)
总体回归函数说明被解释变量Y的平均状 态(总体条件期望)随解释变量X变化的 规律。至于具体的函数形式,则由所考 察的总体的特征和经济理论来决定。
在例2.1中,将居民消费支出看成是其可 支配收入的线性函数时,该总体回归函
数为: E (Y |X i)01 X i
它是一个线性函数。其中,0,1是未知
第二章 经典单方程计量经济学模型: 一元线性回归模型
§2.1 回归分析概述 §2.2 一元线性回归模型的基本假设 §2.3 一元线性回归模型的参数估计 §2.4 一元线性回归模型的统计检验 §2.5 一元线性回归模型的预测 §2.6 一元线性回归建模实例
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念 二、总体回归函数 三、随机扰动项 四、样本回归函数
1430 1650 1870 2112
1485 1716 1947 2200
2002
2420 4950 11495 16445 19305 23870 25025 21450 21285 15510
一个抽样
由于调查的完备性,给定收入水平X的消费 支出Y的分布是确定的。即以X的给定值为条 件的Y的分布是已知的,如 P(Y=561 | X = 800) =1/4。 进而,给定某收入Xi,可得消费支出Y的条 件均值,如 E(Y | X = 800) =605。 这样,可依次求出所有不同可支配收入水平 下相应家庭消费支出的条件概率和条件均值 ,见表2.1.2.
相关分析主要研究随机变量间的相关形式 及相关程度。变量间的相关程度可通过计 算相关系数来考察。
具有相关关系的变量有时存在因果关系,
这时,我们可以通过回归分析来研究它们
之间的具体依存关系。
课堂思考题
计量经济学课件 第5章 回归模型的函数形式
• 模型选择的重点不是在判定系数大小,而是要考 虑进入模型的解释变量之间的相关性(即理论基 础)、解释变量系数的预期符号、变量的统计显 著性、以及弹性系数这样的度量工具。
线性回归模型的弹性系数计算
• 平均弹性:
E
Y X
X Y
B2
X Y
多元对数线性回归模型
• 偏弹性系数的含义: 在其他变量(如,X3)保持不变的条件下,X2 每变动1%,被解释变量Y变动的百分比为B2;
• (3)菲利普斯曲线
被解释变量:英国货币工资变化率,解释变量:失业率 结论:失业率上升,工资增长率会下降。 在自然失业率UN上下,工资变动幅度快慢不同。即失业率低于自然失业率时,工 资随失业率单位变化而上升快于失业率高于自然失业率时工资随失业率单位变化而下 降。
(P113例5-6) 倒数模型: 菲利普斯曲线
依据经济理论,失业率上升,工资增长率会下降;且 当失业率处于不同水平时,工资变动率变动的程度会 不一样,即Y对X 的斜率(Y / X)不会是常数。
Y / X 20.588*(1/ X 2 )
R2 0.6594
模型选择:
1、依据经济理论
以及经验判断;
2、辅助于对拟合
R2 0.5153 Y / X 0.79
1、B1、B2、B4 0; 2、B3 0 3、B32 3B2B4
WHY? —所以经济理论的学习对于模型的建立、选择
和检验有非常关键和重要的意义。 24
四、模型(形式)选择的依据
经济理论
工作经验
1、模型的建立需要正确地理论、合适可用的数据、 对各种模型统计性质的完整理解以及经验判断。
模型选择的基本准则:进入模型中的解释变量的关系(即 理论基础)、解释变量系数的预期符号、弹性系数等经济 指标、统计显著性等
《一元线性回归》ppt课件
E (Y|Xi)01Xi2 E (Y|Xi)01 2Xi
三、总体回归模型与随机干扰项 〔 population regression model,PRM & stochastic disturbance/error〕
• 描画总体中解释变量X和被解释变量Y的个体值Yi之间的变 化规律:Yi=f〔Xi〕+μi
称为线性总体回归函数。其中,0,1是未知参数,称为回归系 数〔regression coefficients〕。
A1:“线性〞的含义
• 对变量为线性——解释变量以一次方的方式出现 • ○ 从几何上看,此时总体回归线是一条直线
• 对参数为线性——回归系数以一次方的方式出现 • ○ 从几何上看,此时总体回归线并不一定是直线
四、样本回归函数 〔sample regression function,SRF〕
•描画样本中解释变量X和被解释变量Y的之间的平均变化规 律:Y^i=f〔Xi〕
1、样本回归函数〔SRF〕
• 总体的信息往往无法掌握,因此PRF实践上未知 • 现实的情况只能是在一次观测中得到总体的一个样本,经过样本的信息来 估计总体回归函数。
1969 1991 2046 2068 2101
968 1045 1243 1474 1672 1881 1078 1254 1496 1683 1925
2189 2233
1122 1298 1496 1716 1969 1155 1331 1562 1749 2013
2244 2299
1188 1364 1573 1771 2035 1210 1408 1606 1804 2101
问题:能否从样本估计总体回归函数?
例2.2:从例2.1的总体中获得如下一个样本:
21一元线性回归模型.ppt
同理,p(Y= ? /X=260)=1/7
条件均值(条件期望 ) :
对Y的每一条件概率分布,我们能算出它 的均值 :
记做E(Y/X=Xi)
[简写为E(Y/Xi) ]
并读为“在X取特定Xi值时的Y的期望值”。
计算方法:
将表2.1中的有关列乘以表2.2中的相应列 的条件概率,然后对这些乘积求和便是。
第二章 一元线性回归模型
§2.1 一元线性回归模型概念基础 回归是计量经济学的主要工具 一、“回归”一词的历史渊源
Francis Galton F.加尔顿
回归一词最先由F.加尔顿 (FrancisC,alton)引入
加尔顿的普遍回归定律还被他的朋友 K.皮尔逊(KartPearson)证实
Karl Pearson K.皮尔逊
综合来看,回归分析一般可以用来:
(1) 通过已知变量的值来估计因变量的均值。
(2)对独立性进行假设检验―――根据经济理 论建立适当的假设。
例如,对于需求函数,你可以检验假设:需求的 价格弹性为-1.0;即需求曲线具有单一的价格 弹性。也就是说,在其他影响需求的因素保持 不变的情况下,如果商品的价格上涨1%,平 均而言,商品的需求量将减少1%。
P (
1/7 1/5 1/5 1/6 1/5 1/7 1/5 1/7 1/5
Y/ 1/7 1/5 1/5 1/6 1/5 1/7 1/5 1/7 1/5
Xi ) 1/7
1/6
1/7
1/7
1/7
1/7
1/7
Y的条 48 46 44 42 40 38 36 34 32 30
件均值
E(Y/X=Xi) Y的条件均值
·
·
·
· ·
计量经济学第五章(新)
利用Eviews得回归方程为:
ˆ ln y 1.6524 0.3397 ln x1 0.9460 ln x2
t = (-2.73) p= (0.0144*) R2=0.995 (1.83) (0.085) (9.06) (0.000**)
对回归方程解释如下:斜率系数0.3397表示 产出对劳动投入的弹性,即表明在资本投入保持 不变的条件下,劳动投入每增加一个百分点,平 均产出将增加0.3397个百分点。同样地,在劳动 投入保持不变的条件下,资本投入每增加一个百 分点,产出将平均增加0.8640个百分点。两个弹 性系数相加为规模报酬参数,其数值等于1.1857 ,表明墨西哥经济的特征是规模报酬递增的(如 果数值等于1,属于规模报酬不变;小于1,则属 于规模报酬递减)。
20.5879 z 1 20.5879 x (4.6794 ) (4.3996 ** )
3、半对数模型和双对数模型
形式为:
ln y 0 1 x u y 0 1 ln x u
的模型称为半对数模型。 把形式为:
ln y 0 1 ln x u
即可利用多元线性回归分析的方法处理了。
例如,描述税收与税率关系的拉弗曲线:抛物线 t = a + b r + c r2 c<0
t:税收;
r:税率
设 z1 = r, z 2 = r2, 则原方程变换为 s = a + b z1 + c z 2 c<0
例 某生产企业在1981-1995年间每年的产量和总成本如下 表,试用回归分析法确定其成本函数。
表5-1 墨西哥的实际GDP、就业人数和实际固定资本
年份 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968 1969 1970 1971 1972 1973 1974 GDP 114043 120410 129187 134705 139960 150511 157897 165286 178491 199457 212323 226977 241194 260881 277498 296530 306712 329030 354057 374977 就业人数 8310 8529 8738 8952 9171 9569 9527 9662 10334 10981 11746 11521 11540 12066 12297 12955 13338 13738 15924 14154 固定资产 182113 193749 205192 215130 225021 237026 248897 260661 275466 295378 315715 337642 363599 391847 422382 455049 484677 520533 561531 609825
《计量经济学》第五章最新完整知识
第五章 多元线性回归模型在第四章中,我们讨论只有一个解释变量影响被解释变量的情况,但在实际生活中,往往是多个解释变量同时影响着被解释变量。
需要我们建立多元线性回归模型。
一、多元线性模型及其假定 多元线性回归模型的一般形式是i iK K i i i x x x y εβββ++++= 2211令列向量x 是变量x k ,k =1,2,的n 个观测值,并用这些数据组成一个n ×K 数据矩阵X ,在多数情况下,X 的第一列假定为一列1,则β1就是模型中的常数项。
最后,令y 是n 个观测值y 1, y 2, …, y n 组成的列向量,现在可将模型写为:εββ++=K K x x y 11构成多元线性回归模型的一组基本假设为 假定1. εβ+=X y我们主要兴趣在于对参数向量β进行估计和推断。
假定2. ,0][][][][21=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n E E E E εεεε 假定3. n I E 2][σεε='假定4. 0]|[=X E ε我们假定X 中不包含ε的任何信息,由于)],|(,[],[X E X Cov X Cov εε= (1)所以假定4暗示着0],[=εX Cov 。
(1)式成立是因为,对于任何的双变量X ,Y ,有E(XY)=E(XE(Y|X)),而且])')|()([(])')((),(EY X Y E EX X E EY Y EX X E Y X Cov --=--=))|(,(X Y E X Cov =这也暗示 βX X y E =]|[假定5 X 是秩为K 的n ×K 随机矩阵 这意味着X 列满秩,X 的各列是线性无关的。
在需要作假设检验和统计推断时,我们总是假定: 假定6 ],0[~2I N σε 二、最小二乘回归 1、最小二乘向量系数采用最小二乘法寻找未知参数β的估计量βˆ,它要求β的估计βˆ满足下面的条件 22min ˆ)ˆ(ββββX y X y S -=-∆ (2)其中()()∑∑==-'-=⎪⎪⎭⎫ ⎝⎛-∆-nj Kj j ij i X y X y x y X y 1212ββββ,min 是对所有的m 维向量β取极小值。
计量经济学及其应用:第5章
• 在检验经济结构是否发生突变方面,引入虚拟 变量的方式优于chow检验。
5.2参数的标准化
线性模型的参数标准化
重新定义解释变量和被解释变量
Yi*
Yi Y SeY
令
Z1i
Xi , Z2i
X
2 i
,
, Zki
X
k i
则上式转化为:
Yi 0 1Z1i 2Z2i K Zki
2、半对数模型和双对数模型
半对数模型
ln Yi 0 1Xi i Yi 0 1 ln Xi i
双对数模型 ln Yi 0 1 ln Xi i
对以上两种模型 分别令
Yi* ln Yi
X
* i
ln
Xi
即可将原模型转化为标准线性模型
3、双曲线函数模型
对于模型
Yi
0
1
1 Xi
i
令
X
* i
1 Xi
, Yi *
Y
即可将原模型转化为标准线性模型。
非线性模型变量的间接代换
柯布—道格拉斯生产函数模型
Qi
ALi
K
i
e
i
F (k 1, n1 n2 2k 2)
(5-14)
原假设
H0 :i i
对于给定的 若
F F
则拒绝 H0,认为回归模型(5-11)和(5-12)
之间的差异显著
2、虚拟变量和chow检验的比较
计量经济学一元线性回归模型PPT课件
习题答案
• (1)收入、年龄、家庭状况、政府的相关政策等也是 影响生育率的重要的因素,在上述简单回归模型中, 它们被包含在了随机扰动项之中。有些因素可能与增 长率水平相关,如收入水平与教育水平往往呈正相关、 年龄大小与教育水平呈负相关等。
• (2)当归结在随机扰动项中的重要影响因素与模型中 的教育水平educ相关时,上述回归模型不能够揭示教 育对生育率在其他条件不变下的影响,因为这时出现 解释变量与随机扰动项相关的情形,基本假设4不满足。
存在原因
一般用希腊字母 或 表示
第一,人类的经济行为本身带有随机性; 第二,通常一个变量总是受众多因素的影响; 第三,任何函数反映经济变量之间的关系都只是一种简化反映; 第四,经济数据来源于调查统计,而非严格的控制实验;
第22页/共162页
二、随机误差项
结论
一个经济变量通常不能被另一个经济变量完全精确地决定,需要 引入随机误差项来反映各种误差的综合影响,主要包括:
i 1
(2-3)
相关系数的取值介于1—1之间, 取值为负表示两变量之间存在负相关关系; 取值为正表示两变量之间存在正相关关系; 取值为1表示两变量之间存在完全负相关关系; 取值为0表示两变量不相关; 取值为1表示两变量之间存在完全正相关关系。
第14页/共162页
例如:
函数关系:
圆面积 f ,半径 半径2
主要内容
得到回归方程; 3)对回归方程中的变量、方程进行显著性检验,推求参数
的置信区间、模型的预测置信区间;
4)利用回归模型解决实际经济问题。
第16页/共162页
4. 相关分析与回归分析之间的关系
联系:
1)都是对存在相关关系的变量的统计相关关系的研究; 2)都能测度线性相关程度的大小; 3)都能判断线性相关关系是正相关还是负相关。
计量经济学课件一元线性回归
二、参数的普通最小二乘估计(OLS)
给定一组样本观测值(Xi, Yi)(i=1,2,…n)要 求样本回归函数尽可能好地拟合这组值. 普通最小二乘法(Ordinary least squares, OLS) 给出的判断标准是:二者之差的平方和
ˆ ˆ X )) 2 ˆ ) (Y ( Q (Yi Y i i 0 1 i
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448
ˆ Y 顺便指出 ,记 y ˆi Y i
则有
ˆ ˆ X ) ( ˆ ˆ X e) ˆi ( y 0 1 i 0 1 ˆ (X X ) 1 e 1 i n i
可得
ˆx ˆi y 1 i
(**)
(**)式也称为样本回归函数的离差形式。
注意:
在计量经济学中,往往以小写字母表示对均值 的离差。
易知 故
x k x
i
i
2 i
0
k X
i
i
1
ˆ k i i 1 1
ˆ ) E ( k ) k E ( ) E( i i 1 i i 1 1 1
同样地,容易得出
ˆ ) E ( w ) E( ) w E ( ) E( i i i i 0 0 0 0
1 (2 ) n
n 2
1 2
计量经济学【一元线性回归模型——参数估计】
ˆ0计量ˆ1 和
可以分别表示为被解释变量观测Y值i
的线
性组合(线性函数);
ˆ证1 明
如( X下i : X )(Yi (Xi X )2
Y
)
(Xi X) (Xi X )2
(Yi
Y
)
ki (Yi Y )
其中ki :
(Xi X) (Xi X )2
ki
对ki于引0 进的 ki (X容i 易X证) 明有k如i X下i 的1 特性k:i2
2
,
,
,
,
,
,
,
,
i
1,
2,
n
假设3:随机误差项在不同样本点之间是独立的,不
存
Cov(i , j ) 0,,,,,,,i j,,,,i, j 1, 2, n
在序列相关,即:
一、一元线性回归模型的基本假设
假设 4:随机误差项与解释变量之间不相关, 即:
Cov( Xi , i ) 0,,,,,,,,,,,i 1, 2, n
:待估
E(Y
总样体本回回归归函函数数形形式式::Yˆi
| Xi)
ˆ0
0 ˆ1X i
1X i
其 计
中 估
方
ˆ0 , ˆ1 法ˆ0,, ˆ1求
是ˆ00,,ˆ11 出
的估计值,我们需要找到一种参数 , 并0 ,且1 这 种 参 数 估 计 方 法 保 证 了 估
计值 数
与总体真值
尽可能地接近;这种参
i
根据微 小,
积
分中
ˆ0 , ˆ1
求
极
值
的
原
理
,
要
使 i
ei2
待定系数
计量经济学(第四版)课件:一元线性回归分析基础
一元线性回归分析基础
第三节 最小二乘估计量的性质
β*1= - β1 =(1/n)∑Yt- ∑btYt =∑[(1/n)- bt]Yt 令 at= [(1/n)- bt] 由于和bt均为非随机变量,所以at也是非随机变量。 因此 β*1 =∑atYt 即β*1是Yt的线性组合。
一元线性回归分析基础
第三节 最小二乘估计量的性质
二、无偏性 指β*1和β*2 的期望值分别等于总体参数β1和β2。 即E(β*1)=β1 E(β*2 )=β2 E(β*2 )=E(β2+∑btut) =β2+∑btE(ut) =β2 E(β*1)=E(β1+∑atut) =β1
总体
有限总体
无限总体
任何样本都是有限的
一元线性回归分析基础
第三节 最小二乘估计量的性质
一、线性特性
是指参数估计值β*1和β*2分别为观察值Yt或扰动项ut的线性组合。
证: β*2 =∑Xtyt/ ∑Xt2 =∑Xt(Yt- )/∑X2t =∑(Xt/∑Xt2)Yt 令 bt= (Xt/∑Xt2) 得 β*2 = ∑ bt Yt 即β*2 是Yt的线性组合
一元线性回归分析基础
第三节 最小二乘估计量的性质
2.证明最小方差性 假设β**2是其他方法得到的关于β2的线性无偏估计 β**2=∑ctYt 其中,ct=bt+dt,dt为不全为零的常数 则容易证明 var(β**2)≥ var(β*2) 同理可证明β1的最小二乘估计量β*1具有最小方差。 高斯—马尔可夫定理(Gauss-Markov theorem): 满足性质1、2、3的最小二乘估计量是最优线性无偏估计量(best linear unbiased estimator:BLUE)
计量经济学一元线性回归分析PPT课件
其用意:在于通过后者的已知或设定值, 去估计和(或)预测前者的(总体)均值。
这里:前一个变量被称为被解释变量
(Explained Variable)或因变量(Dependent
V a r i a b l e ) , 后 一 个第(5页些/共8)5页 变 量 被 称 为 解 释 变 量
5
回归分析构成计量经济学的方法论基础,其主要内容包括: • 根据样本观察值对经济计量模型参数进行估计,求得回归方程; • 对回归方程、参数估计值进行检验; • 利用回归方程进行分析、评价及预测。
其他为随机或非确定性(nonsystematic)部分 ui。
ui
ui
12
第12页/共85页
ui
ui
称为总体回归函数(PRF)的随机设定形 式。表明被解释变量除了受解释变量的系统 性影响外,还受其他因素的随机性影响。由 于方程中引入了随机项,成为计量经济学模 型,因此也称为总体回归模型。
13
第13页/共85页
第80页共85页2无偏性即估计量的均值期望等于总体回归参数真值第81页共85页3有效性最小方差性即在所有线性无偏估计量中最小二乘估计量第82页共85页2证明最小方差性假设为不全为零的常数则容易证明具有最的小方差普通最小二乘估计量ordinaryleastsquaresestimators称为最佳线性无偏估计量bestlinearunbiasedestimatorblue第83页共85页由于最小二乘估计量拥有一个好的估计量所应具备的小样本特性它自然也拥有大样本特性
-973 1314090 1822500 947508
-929 975870 1102500 863784
-445 334050 562500 198381
一元线性回归模型PPT课件
b1、b2
Yi B1 B2 Xi ui
ei
第18页/共67页
3.3 参数的最小二乘估计
• 参数估计:普通最小二乘法(OLS)
• 普通最小二乘法就是要选择参数 ,使得残差平方和(residual sum of squares, RSS) 最小。
•即
b1、b2
ei2
Q ei2
Yi Yˆi 2
Xi 也称 自变量(independent variable)
称为 参数(parameter)
B , B 1 称2为 随机扰动项(random error term)
ui
第13页/共67页
3.2 随机扰动项的来源
• 上式如何解释?
• 可以认为,在给定家庭收入水平 上,第i个学生的数学分数可以表达为两部分之和:
第14页/共67页
3.2 随机扰动项的来源
•
第15页/共67页
3.2 随机扰动项的来源
• 性质1:扰动项代表了未纳入模型变量的影响。例如个人健康状况、居住区域等等。 • 性质2:反映了人类行为的内在随机性。即使模型中包括了决定数学分数的所有变量,其内在随机性也
不可避免,这是做任何努力都无法解释的。 • 性质3:还代表了度量误差,例如收入的数据可能不等于真实值。 • 性质4:“奥卡姆剃刀原则”——即描述应该尽可能简单,只要不遗漏重要的信息,此时可以把影响Y
第8页/共67页
3.1 回归的涵义
• 样本回归函数(sample regression function, SRF) • 可用样本回归函数(SRF)表示样本回归线:
其中, 总体条件均值
的估计量;
Yˆi b1 b2 Xi
Yˆ E Y X • 并非所有样本数据都准确地i落在样本回归线上,因此建立随机i 样本回归函数:
经济学一元线性回归模型计量经济学PPT课件
n
n
2021/5/22
10
第10页/共39页
某地区居民家庭可支配收入xt与家庭消 费支出yt的资料如右表所示(单位百 元)。
要求:建立居民家庭消费支出yt对家庭 可支配收入xt的回归直线方程;指出居 民可支配收入每增加200元时,家庭消 费支出增加多少。
2021/5/22
11
第11页/共39页
可决系数(决定系数) R2
R2 ESS 1 RSS TSS TSS
0 R2 1
2021/5/22
16
第16页/共39页
相关系数R
R
yˆi yi
y 2 y 2
1
yi yi
yˆi y
2 2
R xi x yi y cov(x, y) xi x 2 • yi y 2 var(x)var( y)
2021/5/22
12
第12页/共39页
第三节 一元线性回归方程的检验与预测
回归直线是否有意义,可否能用于预测或控制?需要 通过显著性检验 相关系数检验法 F检验法 T检验法
2021/5/22
13
第13页/共39页
一、离差平方和的分解和可决系数 离差平方和的分解
Lxy yi y 2
2021/5/22
36
第36页/共39页
2021/5/22
37
第37页/共39页
例4:给出我国1989-2008年农业总产量y(万吨)、有效灌 溉面积x1(千公顷)、化肥施肥量x2(万吨)及农机总动力 x3(万千瓦)。根据数据回答下列问题:
试估计下面三个一元线性回归模型,并进行结构分析和统计检 查
2021/5/22
22
第22页/共39页
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第5章
一元线性回归模型
建立计量经济模型一般分为如下几个步骤: 确定 研究对象 画变量 散点图 设定,估计,诊断、检验模型, 分析回归参数,预测。
收集数据
本章先介绍最简单的一元线性回归模型。内容包括 模型的建立及其假定条件, 一元线性回归模型的参数估计, 回归参数估计量的分布, 最小二乘(OLS)估计量的统计性质, OLS 回归函数的性质, 拟合优度的测量, 回归参数的显著性检验, 回归参数的置信区间, 模型的预测, 案例分析等。
x)
=
(xt xt ) yt 2 (xt x)
(5-12)
根据假定 (6),xi 是非随机的,所以令 kt =
(xt xt )
(xt
x)
2
代入式(5-12),得 ˆ 1 = kt yt
则 E( ˆ 1 ) = E( kt yt) = E[ kt (0 + 1 xt + ut) ] = E ( 0 kt + 1 kt xt + kt ut) = E[1 kt (xt - x ) + kt ut ] (其中 kt (xt - x ) = kt xt) = 1 + E( kt ut ) = 1 在上式的推导过程中利用了结论, kt = 0, kt x = 0。 (5-15)
2012-9-2 计量经济学
第5章
一元线性回归模型
5.2 一元线性回归模型的参数估计 5.2.1 估计方法初探 对于所研究的经济问题,假定变量 yt 和 xt 之间服从线性关系。通常真实的回归 直线是观测不到的。收集样本的目的就是要对这条真实的回归直线做出估计。 设估计的回归直线用
ˆ yt
= ˆ 0 + ˆ 1 xt
t t t t t t t t
x( yt y)
x (xt x ) 计量经济学
( x x )( y = (x x)
t t 2 t
y)
第 5 章 一元线性回归模型
5.3 yt, ˆ 1 和 ˆ 0 的分布 5.3.1 yt 的分布 根据假定条件 ut N (0, ),得 yt 的期望, E(yt) = E(0 + 1 xt + ut) = 0 + 1 xt + E(ut) = 0 + 1 xt E(yt) = 0 + 1 xt 表示真实的回归直线。当 xt 固定时,E(yt)表示 yt 取值的期望。 Var(yt) = Var (0 + 1 xt + ut) = Var (0 + 1 xt) + Var (ut) = 根据模型(5-1),yt 是 ut 的线性函数。因为根据假定条件,ut 服从正态分布, 所以 yt 也服从正态分布。 yt N (0 + 1 xt, )。 (5-11)
Q ˆ
0
= 2
t 1
T
ˆ ˆ ( yt 0 1xt )
(-1) = 0
(5-5)
Q
2012-9-2
ˆ 1
= 2
t 1
T
ˆ ˆ ( yt 0 1xt )
(- xt) = 0
计量经济学
(5-6)
由式(5-5)(5-6)得, 、
( yt
i 1
T
ˆ ˆ 0 1xt )
2012-9-2 计量经济学
第5章
一元线性回归模型
yt = 0 + 1 xt + ut (5-1) 5.1.4 模型的假定条件 (5) Cov(ui, uj) = E[(ui - E(ui) ) ( uj - E(uj) )] = E(ui, uj) = 0, (i j )。 (6) xt 是非随机的。 xt 的值是事先确定的。注意,这一假定条件在自然科学领域的实验研究中容易得 到满足,因为实验是可控的,而在经济领域内,xt 的观测是不可控的,所以这一假定 条件不容易满足。 (7) Cov(ut, xt) = 0。 (8) 对于含有多个解释变量的线性回归模型,解释变量之间不能完全相关或高度相 关。否则称解释变量之间存在多重共线性。 E(yt) = 0 +1 xt 是回归模型 (5-1) 的一部分。由此可见回归模型有两个特点。 (1) 建立在某些假定条件不变前提下抽象出来的回归函数不能百分之百地再现所研究的 经济过程。 (2)从另一方面看,也正是由于这些假定, 才能对经济问题进行高度抽象, 从而更深刻地揭示经济变量之间的变化规律。
1
) = [
(xt xt )
(xt
x)
2
] =
2
(xt
x)
2
(5-16)
因为 ˆ 1 是 yt 的线性函数 (见式(5-14)) yt 服从正态分布, , 所以 ˆ 1 也服从正态分布。
ˆ 1
N ( 1,
1
(xt
x)
2
)
计量经济学
ˆ yt )
2
=
( yt
t 1
T
2 ˆ ˆ 0 1xt )
(5-4)
OLS 法是以 Q 取最小值为条件确定回归直线,即确定 ˆ 0 和 ˆ 1 的值。当样本已知时, 上式中的 yt,xt 是已知量, ˆ 0 和 ˆ 1 是未知量。把 Q 看作是 ˆ 0 和 ˆ 1 的函数。这是一个 二元函数求极值问题。 解法是求 Q 对 ˆ 0 和 ˆ 1 的偏导数并令其为零, 得正规方程如下,
(5-2)
ˆ 表示。其中 y t 称作 yt 的拟合值, ˆ 0 和 ˆ 1 分别是 0 和1 的估计量。观测点到这 ˆ ˆ ˆ 条估计的回归直线的纵向距离用 u t 表示。 u t 称作残差, u t 是对 ut 的估计。 ˆ ˆ ˆ yt = y t + u t = ˆ 0 + ˆ 1 xt + u t
2012-9-2
计量经济学
5.3.2 ˆ 1 的分布 下面讨论 ˆ 1 的分布。先求 ˆ 1 的期望。由式(5-10),
ˆ 1 =
( x t x t )( y t y t ) = ( x t 2 (xt x)
xt ) yt yt
(xt
2
xt )
(xt
(5-3)
称作估计的回归模型。
计量经济学
2012-9-2
5.2.2 最小二乘估计法原理
ˆ 最小二乘法的估计原理是以“残差平方和( t 1 u t 2 )最小”为原则确定直线位置。
T
5.2.3 最小二乘估计的计算 设残差平方和用 Q 表示, Q=
t 1
T
ˆ ut
2
=
( yt
t 1
T
2012-9-2 计量经济学
第5章
一元线性回归模型
yt = 0 + 1 xt + ut (5-1) 5.1.4 模型的假定条件 在对回归函数进行估计之前应该对随机误差项 ut 做出如下假定。 因为最小二乘法 (OLS)是以如下假定条件为基础的。 (1) ut , (t =1, 2, …, T ), 是 T 个随机变量,ut 的取值服从概率分布。 (2) E(ut) = 0, (t =1, 2, …, T )。 (3) Var(ut) = E[ut - E(ut) ]2 = E(ut)2 = 2, (t =1, 2, …, T )。 称 ut 具有同方差性。这个假定的含义是对于任意 ut, (t =1, 2, …, T )其分布的方差 都是常量2,此条件下,称 ut 具有同方差性。当此条件得不到满足时,称 ut 具有 异方差性。 (4) ut 服从正态分布。 根据中心极限定理, 如果能保证 ut 由众多的微小随机因素所组成, 那么就可以认 为 ut 近似地服从正态分布。以上四个假定条件可表达如下, ut N (0, ) 在假定(1)(2)成立条件下有 E(yt) = E(0 +1 xt +ut ) = 0 +1 xt。称 E(yt)为真实的 , 回归函数。通常 E(yt) = 0 +1 xt 是观测不到的,利用样本得到的只是对它的估计
2012-9-2
计量经济学
第5章
一元线性回归模型
5.1.3 一元线性回归模型的经济含义与特征 以研究家庭支出与收入的关系为例。假设家庭支出与收入呈线性函数关系。实际 上,数据来自各个不同家庭,来自各个不同收入水平,从而使收入以外的影响支 出变化的其他因素维持不变是不可能的。随机误差项 ut 中包括了家庭人口数,消 费习惯,不同地域的物价水平,家庭的额外收入等因素。由 yt 与 xt 数据得到的观 测点也不在一条直线上(不呈线性函数关系) ,而是散布在一条直线周围,这些观 测点服从统计关系,见图 5-1,其中直线 E(yt) = 0 + 1 xt 称作真实的回归直线。
ut E(yt) = 0 + 1 xt
图 5-1
2012-9-2
真实的回归直线 计量经济学
第 5 章 一元线性回归模型 yt = 0 + 1 xt + ut (5-1) 一般来说,回归模型的随机误差项 ut 中包括如下几项内容。 (1)未在模型中专门列出的影响 yt 变化的非重要解释变量。如上例中家庭人口 数、消费习惯、物价水平差异等因素的影响都包括在随机误差项中。 (2)人的随机行为。经济活动都是人参与的。人的经济行为的变化也会对随机误 差项产生影响。 (3)数学模型形式欠妥。对于同一组观测值,若拟合的数学模型形式不同,则相 应的随机误差项的值也不同。显然当模型形式欠妥时,会直接对随机误差 项的值带来影响。 (4)归并误差。模型中被解释变量的值常常是归并而成的。当归并不合理时,会 产生误差。比如由不同种类粮食合并构成的粮食产量的不合理归并会带来 归并误差。 (5)测量误差等。当对被解释变量的测量存在误差时,这种误差将包括在随机误 差项中。