2.2一元线性回归模型的参数估计
§2.2 一元线性回归模型的参数估计
β 0 = Y β1 X
例2.2.1:在上述家庭可支配收入-消费支出例中,对 :在上述家庭可支配收入-消费支出例中, 于所抽出的一组样本数, 于所抽出的一组样本数,参数估计的计算可通过下面的 进行。 表2.2.1进行。 进行
表 2.2.1 数 计 计 参 估 的 算表
Xi
Yi
xi
1
的样本方差: 2 = σ 2 x 2 / n ( x x )2 ∑ i ∑ i β0 Sβ
0
β1 =
∑x y ∑x
i 2 i
i
5769300 = = 0.777 7425000
β 0 = Y β 0 X = 1567 0.777 × 2150 = 103.172
因此,由该样本估计的回归方程为:
Yi = 103.172 + 0.777 X i
三、最小二乘估计量的性质
(1)线性性,即它是否是另一随机变量的线性 )线性性, 函数; 函数; (2)无偏性,即它的均值或期望值是否等于总 )无偏性, 体的真实值; 体的真实值; (3)有效性,即它是否在所有线性无偏估计量 )有效性, 中具有最小方差。 中具有最小方差。
中,最小二乘估计量 β 0 、 β1 具有最小方差。
(2)证明最小方差性
β 1* 是其他估计方法得到的关于β1 的线性无偏估计量: 假设
β 1* = ∑ ci Yi
其中,ci=ki+di,di为不全为零的常数 则容易证明
var(β 1* ) ≥ var(β 1 )
同理,可证明β0 的最小二乘估计量 β 0 具有最的小方差
-973 1314090 1822500 947508 640000 352836 -929 975870 1102500 863784 1210000 407044 -445 334050 562500 198381 1960000 1258884 -412 185580 202500 170074 2890000 1334025 -159 23910 22500 25408 4000000 1982464 28 4140 22500 762 5290000 2544025 402 180720 202500 161283 6760000 3876961 511 382950 562500 260712 8410000 4318084 1018 1068480 1102500 1035510 10240000 6682225 963 1299510 1822500 926599 12250000 6400900 5769300 7425000 4590020 53650000 29157448
§2.1线性回归模型概述解析
01-2-28
重庆商学院经济系
总体分布
200
150
Y
100 50 50
100
150 X
200
250
300
01-2-28
重庆商学院经济系
8
总体回归曲线 (Popular Regression Curve)
条件分布:以X取定值为条件的Y的条件分布 条件概率:给定X的Y的概率,记为P(Y|X)。 例如,P(Y=55|X=80)=1/5;P(Y=150|X=260)=1/7。 条件期望(conditional Expectation):给定X的Y的 期望值,记为E(Y|X)。 例如,E(Y|X=80)=55×1/5+60×1/5+65×1/5+ 70×1/5+75×1/5=65 (总体回归曲线的几何意义):当解释变量给定值时 因变量的条件期望值的轨迹。
重庆商学院经济系 2
01-2-28
§2.1 线性回归模型概述
一、 线性回归模型的特征 二、 线性回归的普遍性 三、 线性回归模型的基本假设
01-2-28
重庆商学院经济系
3
单方程回归模型概述
单方程回归模型分为;线性和非线性 线性模型(按变量划分);变量以1次的形式出现 线性模型(按参数划分);参数以1次的形式出现 线性回归模型是线性模型的一种,参数以1次形式出现, 通常可以通过一些变换,将非1次的变量化为1次。 线性回归模型的数学基础;回归分析,企图通过回归 模型的形式揭示变量之间的因果关系 线性回归模型是是一类最为普遍的计量经济模型
展开泰勒级数,得到一个线性近似公式
01-2-28
重庆商学院经济系
22
三、线性回归模型的基本假定
一元线性回归模型(计量经济学)
总体回归函数说明被解释变量Y的平均状 态(总体条件期望)随解释变量X变化的 规律。至于具体的函数形式,则由所考 察的总体的特征和经济理论来决定。
在例2.1中,将居民消费支出看成是其可 支配收入的线性函数时,该总体回归函
数为: E (Y |X i)01 X i
它是一个线性函数。其中,0,1是未知
第二章 经典单方程计量经济学模型: 一元线性回归模型
§2.1 回归分析概述 §2.2 一元线性回归模型的基本假设 §2.3 一元线性回归模型的参数估计 §2.4 一元线性回归模型的统计检验 §2.5 一元线性回归模型的预测 §2.6 一元线性回归建模实例
§2.1 回归分析概述
一、变量间的关系及回归分析的基本概念 二、总体回归函数 三、随机扰动项 四、样本回归函数
1430 1650 1870 2112
1485 1716 1947 2200
2002
2420 4950 11495 16445 19305 23870 25025 21450 21285 15510
一个抽样
由于调查的完备性,给定收入水平X的消费 支出Y的分布是确定的。即以X的给定值为条 件的Y的分布是已知的,如 P(Y=561 | X = 800) =1/4。 进而,给定某收入Xi,可得消费支出Y的条 件均值,如 E(Y | X = 800) =605。 这样,可依次求出所有不同可支配收入水平 下相应家庭消费支出的条件概率和条件均值 ,见表2.1.2.
相关分析主要研究随机变量间的相关形式 及相关程度。变量间的相关程度可通过计 算相关系数来考察。
具有相关关系的变量有时存在因果关系,
这时,我们可以通过回归分析来研究它们
之间的具体依存关系。
课堂思考题
2.2 一元线性回归模型的参数估计
于是,Y的概率函数为
P(Yi ) = 1
− 1 2σ
2
ˆ ˆ (Yi − β 0 − β1 X i ) 2
σ 2π
e
(i=1,2,…n)
4/29/2012
14
因为Yi是相互独立的,所以的所有样本观测值的联 合概率,也即或然函数(likelihood function) 或然函数(likelihood function)为: 或然函数
§2.2 一元线性回归模型的参数估计
一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计(OLS) 参数的普通最小二乘估计(OLS) 参数估计的最大或然法(ML) 三、参数估计的最大或然法(ML) * 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干扰项方差的估计
4/29/2012
1
640000 352836 1210000 407044 1960000 1258884 2890000 1334025 4000000 1982464 5290000 2544025 6760000 3876961 8410000 4318084 10240000 6682225 12250000 6400900 53650000 29157448
4/29/2012
-973 1314090 1822500 947508 -929 975870 1102500 863784 -445 334050 562500 198381 -412 185580 202500 170074 -159 23910 22500 25408 28 4140 22500 762 402 180720 202500 161283 511 382950 562500 260712 1018 1068480 1102500 1035510 963 1299510 1822500 926599 5769300 7425000 4590020
一元线性回归模型的参数估计解读
为表达得更简洁,可以用离差形式表示OLS估计式:
( X i X )(Yi Y ) xi yi ˆ 1 __ 2 x 2 i (Xi X )
__ __
ˆ Y ˆX 0 1
__
其中xi X i X,yi Yi Y
注意:在计量经济学中,往往以小写字母表示对 均值的离差。 由于参数的估计结果是通过普通最小二乘法得到的, 故称为普通最小二乘估计量(ordinary least squares estimators)。
1969 2078 2585 2530 15674
5290000
6760000 8410000 10240000 12250000 53650000
3668500
5119400 6026200 8272000 8855000 39468400
n X iYi X i Yi 10 39468400 21500 15674 ˆ 1 2 2 10 53650000 215002 n X i ( X i )
xi ˆ 1 Y kiYi 2 i xi
1 1 ˆ ˆ 0 Y 1 X Yi kiYi X ( Xki )Yi wY i i n n
ˆ 、 ˆ 的均值(期望)等于总体 2.无偏性,即估计量 0 1 回归参数真值0与1
ˆ k Y k ( X u ) 证: ii i 0 1 i i 1
假定1:解释变量X i是确定性变量,不是随机变量
假定2:E(ui ) 0,即随机误差项的均值或期望为零
2 假定3:Var (ui ) ( 2为常数),即各个随机误差
项的方差相同
假定4:Cov(ui , u j ) 0(i j ),即不同的随机误差项 之间是互不相关的
2.1 线性回归模型概述
△几点注意
– 不线性相关并不意味着不相关; 不线性相关并不意味着不相关; – 有相关关系并不意味着一定有因果关系; 有相关关系并不意味着一定有因果关系; – 相关分析对称地对待任何( 两个 )变量,两 变量, 相关分析对称地对待任何 对称地对待任何 个变量都被看作是随机的;回归分析对变量的 个变量都被看作是随机的;回归分析对变量的 处理方法存在不对称性,即区分因变量( 处理方法存在不对称性,即区分因变量(被解 不对称性 释变量)和自变量(解释变量):前者是随机 释变量)和自变量(解释变量):前者是随机 ): 变量,后者不是。 变量,后者不是。
• 回归与因果关系
– 回归分析研究的一个变量对另一个变量的依 赖关系可以是一种因果关系,但也可能不是 因果关系。 – 统计关系本身不可能意味着任何因果关系
• 回归与相关
– 回归分析和相关分析都是研究变量间关系的统计学 课题 – 两者的主要差别: 两者的主要差别: – ◇回归分析中需要区别自变量和因变量;相关分析 回归分析中需要区别自变量和因变量; 中则不需要区分 – ◇相关分析中所涉及的变量y与x全是随机变量。而 相关分析中所涉及的变量y 全是随机变量。 回归分析中,因变量y是随机变量,自变量x 回归分析中,因变量y是随机变量,自变量x 可以 是随机变量, 是随机变量,也可以是非随机的确定变量 –◇相关分析的研究主要是为刻画两类变量间线性相 ◇ 关的密切程度。而回归分析不仅可以揭示变量X 关的密切程度。而回归分析不仅可以揭示变量X对 变量y的影响大小, 变量y的影响大小,还可以由回归方程进行预测和 控制
描出散点图发现:随着收入的增加,消费 “平均地说”也在增加,且Y的条件均值均落在 平均地说” 平均地说 总体回归线。 一根正斜率的直线上。这条直线称为总体回归线 总体回归线
计量经济学第二篇一元线性回归模型
第二章 一元线性回归模型2.1 一元线性回归模型的基本假定有一元线性回归模型(统计模型)如下, y t = β0 + β1 x t + u t上式表示变量y t 和x t 之间的真实关系。
其中y t 称被解释变量(因变量),x t 称解释变量(自变量),u t 称随机误差项,β0称常数项,β1称回归系数(通常未知)。
上模型可以分为两部分。
(1)回归函数部分,E(y t ) = β0 + β1 x t ,(2)随机部分,u t 。
图2.1 真实的回归直线这种模型可以赋予各种实际意义,居民收入与支出的关系;商品价格与供给量的关系;企业产量与库存的关系;身高与体重的关系等。
以收入与支出的关系为例。
假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。
但实际上数据来自各个家庭,来自同一收入水平的家庭,受其他条件的影响,如家庭子女的多少、消费习惯等等,其出也不尽相同。
所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。
“线性”一词在这里有两重含义。
它一方面指被解释变量Y 与解释变量X 之间为线性关系,即另一方面也指被解释变量与参数0β、1β之间的线性关系,即。
1ty x β∂=∂,221ty β∂=∂0 ,1ty β∂=∂,2200ty β∂=∂2.1.2 随机误差项的性质随机误差项u t 中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。
所以在经济问题上“控制其他因素不变”是不可能的。
随机误差项u t 正是计量模型与其它模型的区别所在,也是其优势所在,今后咱们的很多内容,都是围绕随机误差项u t 进行了。
回归模型的随机误差项中一般包括如下几项内容: (1)非重要解释变量的省略,(2)数学模型形式欠妥, (3)测量误差等,(4)随机误差(自然灾害、经济危机、人的偶然行为等)。
2.1.3 一元线性回归模型的基本假定通常线性回归函数E(y t ) = β0 + β1 x t 是观察不到的,利用样本得到的只是对E(y t ) =β0 + β1 x t 的估计,即对β0和β1的估计。
8.2.2一元线性回归模型参数的最小二乘估计(1)课件高二下学期数学人教A版选择性
解题技巧总结
1.回归直线方程中系数的 2 种求法 (1)公式法:利用公式,求出回归系数^b,^a.
(2)待定系数法:利用回归直线过样本点中心( x , y )求 系数.
2.注意分步计算
3:灵活选择与转化两个公式
对于n个样本数据:( x1, y1 ),( x2 , y2 ), ,( xn , yn )
残差
1
2
3
4
5
6
7
165 165 157 170 175 165 155
48 57 50 54 64 61 43
-6.375 2.627 2.419 -4.618 1.137 6.627 -2.883
n
n
yi βxi y βx2 2yi βxi y βx
i1
i1
y βx α ny βx α2,
探究2. 推导 回归 方程
n
注意到 yi βxi y βx y βx α i1 n
y βx α yi βxi y βx i1
y
βx
αn
yi
n
β
xi
ny
βx
i1
=3,
5+9+14+17+20
y=
5
=13,
5
x2i =12+22+32+42+52=55,
i=1
5
xiyi=1×5+2×9+3×14+4×17+5×20=233,
i=1
5
5
xi- x yi- y xiyi-5 x y
i=1
则b^ =
5
xi- x 2
i=1
=
5
=2335-5-5×5×3×32 13=3.8,
i1
y βx αny nβx ny βx 0,
一元线性回归模型的参数估计实验报告
一元线性回归模型的参数估计实验报告一、实验目的通过实验了解一元线性回归模型,理解线性回归模型的原理,掌握回归系数的计算方法和用途,并运用Excel对一组数据进行一元线性回归分析,并解释拟合结果。
二、实验原理1.一元线性回归模型一元线性回归模型是指只有一个自变量和一个因变量之间存在线性关系,数学为:`Y = β0 + β1X + ε`其中,Y表示因变量的数值,X表示自变量的数值,β0和β1分别是系数,ε表示误差项。
系数是待求的,误差项是不可观测和无法准确计算的。
2.回归系数的计算方法回归系数通常使用最小二乘法进行计算,最小二乘法是一种通过最小化误差平方和来拟合数据的方法。
具体计算方法如下:(1)计算X的平均值和Y的平均值;(2)计算X和Y的样本标准差;(3)计算X和Y的协方差以及相关系数;(4)计算回归系数β1和截距β0;三、实验步骤1.导入实验数据将实验数据导入Excel,并进行清理。
2.绘制散点图在Excel中绘制散点图,判断是否存在线性关系。
3.计算相关系数通过Excel的相关系数函数计算出X和Y的相关系数。
通过Excel的回归分析函数计算出回归方程。
5.分析结果分析回归方程的拟合程度以及回归系数的意义。
四、实验结果1.数据准备通过Excel的回归分析函数,计算出回归系数为β0=1.1145,β1=2.5085,回归方程为`Y=1.1145+2.5085X`,如下图所示:(1)拟合程度:相关系数为0.870492,说明自变量和因变量之间存在一定的线性关系,回归方程的拟合程度较好。
(2)回归系数的意义:截距为1.1145,表示当自变量为0时,因变量的值为1.1145;回归系数为2.5085,表示自变量增加1个单位,因变量会增加2.5085个单位。
一元线性回归模型的参数估计
散点图
某居民小区家庭收入(X)与消费支出(Y)
Y
1500
的散点图
1300
1100
900
Yˆ = aˆ + bˆX
700
500
X
600
1100
1600
2100
最小二乘准则
Y
.(Xi,Yi)
. Yˆ = aˆ + bˆX (X j ,Yˆj )
ei
. . (Xi,Yˆi)
0
. ej
(Xj,Yj)
X
min
参数估计计算表
Yi
xi
yi
3637 3919 4185 4331 4616 4998 5359 6030
37075
-1517.4 -961.4 -640.4 -375.4 53.6 479.6 1058.6 1902.6 ——
-997.4 -715.4 -449.4 -303.4 -18.4 363.6 724.6 1395.6 ——
X = X i = 46403 = 5800.375
n
8
Y = Yi = 37075 = 4634.375
n
8
根据表 2 合计栏的数据及以上关于 X 和Y 的计
算结果可得:
bˆ1 =
xi yi = 6198658.9 0.7083 xi2 8751239.9
bˆ0 = Y - bˆ1 X 525.8662
2.对回归系数(斜率)进行统计假设检验,信度为 0.05。
3.估计可决系数并进行统计假设检验,信度为 0.05。
4.若下一年度居民货币收入为 25.5 亿元,预测购买消费品
支出的金额及预测区间,信度为 0.05。
8.2.2 一元线性回归模型参数的最小二乘估计 (2)
i 1
i 1
与经验回归方程有关,因此R2越大,表示残差平方和越小,即模型的拟合效果
越好; R2越小,表示残差平方和越大,即模型的拟合效果越差.
决定系数R2:
n
( yi yˆi )2
R2
1
i 1 n
( yi y)2
i 1
n
( yˆi y)2
i1 n ( yi y)2 i 1
回归平 方和
总偏差 平方和
决定系数是总偏差平方和中回归平方和所占的比重. 显然0≤R2≤1,
R2越接近1,则线性回归刻画的效果越好.
还可以证明,在一元线性回归模型中R2=r2,即决定系数R2等于响
应变量与解释变量的样本相关系数r的平方.
n
( xi x)( yi y)
r
i 1
n
n
( xi x)2
( yi y)2
编号 胸径/cm 树高/cm
1 2 3 4 5 6 7 8 9 10 11 12 18.1 20.1 22.2 24.4 26.0 28.3 29.6 32.4 33.7 35.7 38.3 40.2 18.8 19.2 21.0 21.0 22.1 22.1 22.4 22.6 23.0 24.3 23.9 24.7
为了利用一元线性回归模型估计参数c1和c2,我们引进一个中间变量x, 令x=ln(t-1895). 通过x=ln(t-1895),将年份变量数据进行变换,得到新的成
对数据(精确到0.01),如下表所示.
编号 x Y/s
1
2
3
4
5
6
7
8
0.00 2.83 3.26 3.56 3.71 4.11 4.17 4.29
(5)
计量经济学【一元线性回归模型——参数估计】
ˆ0计量ˆ1 和
可以分别表示为被解释变量观测Y值i
的线
性组合(线性函数);
ˆ证1 明
如( X下i : X )(Yi (Xi X )2
Y
)
(Xi X) (Xi X )2
(Yi
Y
)
ki (Yi Y )
其中ki :
(Xi X) (Xi X )2
ki
对ki于引0 进的 ki (X容i 易X证) 明有k如i X下i 的1 特性k:i2
2
,
,
,
,
,
,
,
,
i
1,
2,
n
假设3:随机误差项在不同样本点之间是独立的,不
存
Cov(i , j ) 0,,,,,,,i j,,,,i, j 1, 2, n
在序列相关,即:
一、一元线性回归模型的基本假设
假设 4:随机误差项与解释变量之间不相关, 即:
Cov( Xi , i ) 0,,,,,,,,,,,i 1, 2, n
:待估
E(Y
总样体本回回归归函函数数形形式式::Yˆi
| Xi)
ˆ0
0 ˆ1X i
1X i
其 计
中 估
方
ˆ0 , ˆ1 法ˆ0,, ˆ1求
是ˆ00,,ˆ11 出
的估计值,我们需要找到一种参数 , 并0 ,且1 这 种 参 数 估 计 方 法 保 证 了 估
计值 数
与总体真值
尽可能地接近;这种参
i
根据微 小,
积
分中
ˆ0 , ˆ1
求
极
值
的
原
理
,
要
使 i
ei2
待定系数
第2章⑵一元线性回归的参数估计
于 是 , Yi 的 概 率 函 数 为
P (Y i ) 1
1 2
2 2 ˆ ˆ ( Yi 0 1 X i )
2
e
i= 1 ,2 ,„ ,n
因为Yi是相互独立的,所以Y的所有样本观测值的 联合概率,也即似然函数(likelihood function) 为:
• 记
1 X Xi n 1 Y Yi n x Xi X i y i Yi Y
则参数估计量可以写成:
x y ˆ i i 1 2 xi ˆ ˆ 0 Y 1X
注:在计量经济学中,往往以大写字母表示原始数据(观测 值),而以小写字母表示对均值的离差(deviation)。
可见,在满足一系列基本假设的情况下,模型结 构参数的最大似然估计量与普通最小二乘估计量是
相同的。(见教材P34)
但是,随机误差项的方差的估计量是不同的。 (见教材P39)
解或然方程
2
L
*
n 2
2
1 2
4
2 ˆ ˆ (Y i 0 1 X i ) 0
证明如下: (补充)
ei
2
2 ˆ2 yi 1
2
xi
2
Y
Yi
2 ˆ yi 1 yi xi 2 i 2
nY nY
2
ˆ 1 Y i X
i
i
nY X
Y Y Y
Yi
ˆ 1 Yi X
第2章 一元线性回归模型
(regression analysis)来完成的
2020/2/6
中山学院经济与管理系
4
2.1 模型的建立及其假定条件
2 回归分析的概念 回归分析研究一个变量关于另一个(些)变量的
具体依赖关系的计算方法和理论。
其用意:在于通过后者的已知或设定值,去估计 (或)预测前者的(总体)均值。
2020/2/6
中山学院经济与管理系
5
2.1 模型的建立及其假定条件
回归分析的基本思想和方法以及“回归”名称的由来 英国统计学家高尔顿(F.Galton,1822-1911)和他
的学生皮尔逊(K.Pearson,1856-1936)在研究父母身高 与其子女身高的遗传问题时,观察了1078对夫妇,以每对 夫妇的平均身高作为自变量,而取他们的一个成年儿子的 身高作为因变量,将结果在平面直角坐标系上绘成散点图 ,发现趋势近乎一条直线,计算出的回归直线方程为:
二乘法(Ordinary least squares, OLS)给出的
判断标准是:二者之差的平方和最小
n
n
Q (Yi Yˆi )2 (Yi (ˆ0 ˆ1 X i )) 2
1
1
即在给定样本观测值之下,选择出 ˆ0、ˆ1能使 yi
, 之y?i差的平方和最小(即为使残差平方和最小)
(4)被解释变量的样本平均值等于其估计值的平均值
2020/2/6
中山学院经济与管理系
26
2.2 一元线性回归模型的参数估计
4 截距为零的一元线性回归模型的参数估计 截距为零的一元线性回归模型的一般形式为:
yi xi ui
这个模型只有一个参数 需要估计,其最小二乘估
计量的表达式为
一元线性回归模型及参数估计
步骤:收集数据、建立模型、 计算参数、评估模型
优点:简单易行,适用于线 性回归模型
最大似然估计法
定义:最大似然 估计法是一种基 于概率的参数估 计方法,通过最 大化样本数据的 似然函数来估计
参数。
原理:利用已知 样本数据和概率 分布函数,计算 出样本数据出现 的概率,然后选 择使得概率最大 的参数值作为估
参数估计的性质
无偏性
定义:参数估计量是 无偏估计时,其期望 值等于参数的真实值。
性质:无偏性是线性 回归模型参数估计的 最基本性质之一,是 评价估计量优劣的重 要标准。
证明:可以通过数学 推导证明无偏性,具 体过程可以参考相关 教材或论文。
应用:在回归分析中, 无偏性可以保证估计 的参数具有最小误差, 从而提高预测的准确 性和可靠性。
计值。
优点:简单易行, 适用于多种分布 类型的数据,具
有一致性。
局限:对样本数 据的要求较高, 当样本数据量较 小或分布不均时, 估计结果可能不
准确。
最小绝对误差准则
定义:最小化预测值与实际值之间的绝对误差
优点:对异常值不敏感,能够更好地处理数据中的噪声和异常值
缺点:可能导致模型过于复杂,过拟合数据 应用场景:适用于预测连续变量,尤其是当因变量和自变量之间的关系是 非线性的情况
行处理。
处理方法:包括 删除不必要的自 变量、合并相关 性较高的自变量、 使用其他模型等
方法。
模型预测与决策应用
预测未来趋势
利用一元线性回 归模型预测未来 趋势
模型参数估计的 方法和步骤
预测结果的解读 与决策应用
模型预测的局限 性及改进方法
制定决策依据
利用回归方程进行 预测
ห้องสมุดไป่ตู้
2.2 一元线性回归模型的基本假设
n→∞
(2.2.3)
变异性假设是为了通过X的变化来解释被解释变量Y的变化;非零 有限常数假设旨在排除时间序列数据出现持续上升或下降的变量作为 解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往 产生伪回归问题(也称虚假回归:P261,274,295)
三、对随机干扰项的假设 假设4: 随机干扰项具有给定X条件下的零均值、同方差和序列不相关性: (违背该假设则出现随机解释变量问题、异方差性和序列相关性, 分别在第4.4、4.1和4.2节分析) E(i|Xi)=0 (2.2.4) Var(i|Xi)=2 (2.2.5) Cov(i,j)=0 i≠j (2.2.6) 式(2.2.4)意味着的期望不随X变化而变化,且总为0,即与不相关; 该假设成立时也称X为外生解释变量,否则称X为内生解释变量。只有该 假设成立时,总体回归函数的随机形式(2.1.7)式才能等价于非随机形式 (2.1.4)式。 式(2.2.5)表明的方差不依赖于X的变化而变化,且为常数2。图2.2.1 根据期望迭代法则,式(2.2.4) 、(2.2.5),有 E(i)=0 (2.2.7) Var(i)=2 (2.2.8) 式(2.2.6)表明在给定解释变量任意两个不同值时,对应的不相关, 即序列不相关性。
因此要对这些假设进行检验。
以上假设都是针对普通最小二乘法的。在违背这 些基本假设的情况下,普通最小二乘法估计量就不再 是最佳线性无偏估计量,因此使用普通最小二乘法进 行估计已无多大意义。但模型本身还是可以估计的,
尤其是可以通过最大似然法等其它原理进行估计。
(练习题3)
补充思考题
1、一元线性回归模型有哪些基本假设(经典假设)?
(2.2.1) i=1,2,…,n (2.2.2)
Y为被解释变量,X为解释变量,0与1为待估 参数, 为随机干扰项。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§2.2 一元线性回归模型的参数估计单方程计量经济学模型分为线性模型和非线性模型两大类。
在线性模型中,变量之间的关系呈线性关系;在非线性模型中,变量之间的关系呈非线性关系。
线性回归模型是线性模型的一种,它的数学基础是回归分析,即用回归分析方法建立的线性模型,用以揭示经济现象中的因果关系。
一元线性回归模型是最简单的计量经济学模型,在模型中只有一个解释变量,其一般形式是:i i i X Y μββ++=10 i=1,2,…n (2.2.1) 其中,Y 为被解释变量,X 为解释变量,0β与1β为待估参数,μ为随机干扰项。
一、一元线性回归模型的基本假设回归分析的主要目的是要通过样本回归函数(模型)SRF 尽可能准确地估计总体回归函数(模型)PRF 。
估计方法有多种,其种最广泛使用的是普通最小二乘法(ordinary least squares, OLS )。
为保证参数估计量具有良好的性质,通常对模型提出若干基本假设。
如果实际模型满足这些基本假设,普通最小二乘法就是一种适用的估计方法;如果实际模型不满足这些基本假设,普通最小二乘法就不再适用,而要发展其它方法来估计模型。
所以,严格地说,下面的基本假设并不是针对模型的,而是针对普通最小二乘法的。
对模型(2.2.1),基本假设包括对解释变量X 的假设,以及对随机扰动项μ的假设: 假设1:解释变量X 是确定性变量,不是随机变量,而且在重复抽样中取固定值。
假设2:随机误差项μ具有0均值、同方差及不序列相关性。
即 )(i E μ=0 i=1,2,…n )(i Var μ=2σ i=1,2,…n),(j i Cov μμ=0 i ≠j i,j=1,2,…n假设3:随机误差项与解释变量之间不相关。
即),(i i X C o v μ=0 i=1,2,…n假设4:随机误差项服从0均值、同方差、零协方差的正态分布。
即),0(~2σμN i i=1,2,…n需注意的是,如果假设1、2成立,则假设3成立,因为这时显然有),(i i X Cov μ= 0)]([)(())]())(([(=--=--i i i i i i i i E E X E X E X E X E μμμμ;另外,如果假设4成立,则假设2成立,因为对两正态分布变量来说,零协方差就意味着两变量相互独立。
以上假设也称为线性回归模型的经典假设或高斯(Gauss )假设,满足该假设的线性回归模型,也称为经典线性回归模型(Classical Linear Regression Model, CLRM )。
另外,在进行模型回归时,还有两个暗含的假设:假设5:随着样本容量的无限增加,解释变量X 的样本方差趋于一有限常数。
即∞→→-∑n Q n X Xi,/)(2假设6:回归模型是正确设定的。
假设5旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生所谓的伪回归问题(spurious regression problem )。
关于伪回归的确切含义将在第九章中讨论。
假设6也被称为模型没有设定偏误(specification error ),它的确切含义将在第五章中讨论。
在实际建立模型的过程中,除了随机误差项的正态假设外,对模型是否满足其他假设都要进行检验。
这就是“建立计量经济学模型步骤”中“计量经济学检验”的任务。
对于随机误差项的正态假设,根据中心极限定理,当样本容量趋于无穷大时,都是满足的。
二、参数的普通最小二乘估计(OLS )已知一组样本观测值(i i X Y ,),(i=1,2,…n ),要求样本回归函数尽可能好地拟合这组值,即样本回归线上的点iY ˆ与真实观测点i Y 的“总体误差”尽可能地小,或者说被解释变量的估计值与观测值应该在总体上最为接近,最小二乘法(Ordinary least squares, OLS )给出的判断标准是:二者之差的平方和21)ˆ(in i Y Y Q -=∑=2101))ˆˆ((i ni X Y ββ+-∑ (2.2.2) 最小。
即在给定样本观测值之下,选择出0ˆβ、1ˆβ能使i Y 与i Y ˆ之差的平方和最小。
为什么用平方和?因为样本回归线上的点iY ˆ与真实观测点i Y 之差可正可负,简单求和可能将很大的误差抵消掉,只有平方和才能反映二者在总体上的接近程度。
这就是最小二乘原理。
根据微积分学的运算,当Q 对 β0、 β1的一阶偏导数为0时,Q 达到最小。
即 ∂∂β∂∂βQQ 0100⎧⎨⎪⎪⎩⎪⎪==可推得用于估计0ˆβ、1ˆβ的下列方程组: ⎪⎩⎪⎨⎧=--=--∑∑0)ˆˆ(0)ˆˆ(1010i i i ii X X Y X Y ββββ (2.2.3)或 ⎩⎨⎧∑+∑=∑∑+=∑21010ˆˆˆˆii i i ii X X X Y X n Y ββββ (2.2.4) 解得:⎪⎪⎩⎪⎪⎨⎧∑-∑∑∑-∑=∑-∑∑∑-∑∑=2212220)(ˆ)(ˆi i i i i i i i i i i i i X X n X Y X Y n X X n X Y X Y X ββ (2.2.5)方程组(2.2.3)或(2.2.4)称为正规方程组(normal equations )。
记()22221)(∑∑∑∑-=-=i i i i X nX X X x ∑∑∑∑∑-=--=i i i i i i i i Y X nY X Y Y X X y x 1))(((2. 2.5)的参数估计量可以写成:⎪⎩⎪⎨⎧-=∑∑=XY x y x i i i 1021ˆˆˆβββ (2.2.6)称为OLS 估计量的离差形式(deviation form )。
在计量经济学中,往往以小写字母表示对均值的离差。
由于0ˆβ、1ˆβ的估计结果是从最小二乘原理得到的,故称为普通最小二乘估计量(ordinary least squares estimators )。
顺便指出,记Y Y y ii -=ˆˆ,则有 ∑--=++-+=in i i i e X X e X X y 111010)(ˆ)ˆˆ()ˆˆ(ˆβββββ可得ii x y 1ˆˆβ= (2.2.7) 其中,用到了正规方程组的第一个方程∑∑=+-=0))ˆˆ((10iiiX Y e ββ。
(2.2.7)式也称为样本回归函数的离差形式。
在结束普通最小二乘估计的时候,需要交代一个重要的概念,即“估计量”(estimator )和“估计值”(estimate)的区别。
由(2.2.5)式或(2.2.6)式给出的参数估计结果是由一个具体样本资料计算出来的,它是一个“估计值”,或者“点估计”,是参数估计量 β0和 β1的一个具体数值;但从另一个角度,仅仅把(2.2.5)或(2.2.6)看成 β0和 β1的一个表达式,那么,则是i Y 的函数,而i Y 是随机变量,所以 β0和 β1也是随机变量,在这个角度上,称之为“估计量”。
在本章后续内容中,有时把 β0和 β1作为随机变量,有时又把 β0和 β1作为确定的数值,道理就在于此。
三、参数估计的最大或然法(ML)最大或然法(Maximum Likelihood, ML),也称最大似然法,是不同于最小二乘法的另一种参数估计方法,是从最大或然原理出发发展起来的其它估计方法的基础。
虽然其应用没有最小二乘法普遍,但在计量经济学理论上占据很重要的地位,因为最大或然原理比最小二乘原理更本质地揭示了通过样本估计母体参数的内在机理,计量经济学理论的发展,更多地是以最大或然原理为基础的,对于一些特殊的计量经济学模型,只有最大或然方法才是很成功的估计方法。
对于最小二乘法,当从模型总体随机抽取n 组样本观测值后,最合理的参数估计量应该使得模型能最好地拟合样本数据。
而对于最大或然法,当从模型总体随机抽取n 组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n 组样本观测值的概率最大。
显然,这是从不同原理出发的两种参数估计方法。
从总体中经过n 次随机抽取得到样本容量为n 的样本观测值,在任一次随机抽取中,样本观测值都以一定的概率出现,如果已经知道总体的参数,当然由变量的频率函数可以计算其概率。
如果只知道总体服从某种分布,但不知道其分布参数,通过随机样本可以求出总体的参数估计量。
以正态分布的总体为例。
每个总体都有自己的分布参数期望和方差,如果已经得到n 组样本观测值,在这些可供选择的总体中,哪个总体最可能产生已经得到的n 组样本观测值呢?显然,要对每个可能的正态总体估计取得n 组样本观测值的联合概率,然后选择其参数能使观测值的联合概率为最大的那个总体。
将样本观测值联合概率函数称为变量的或然函数。
在已经取得样本观测值的情况下,使或然函数取极大值的总体分布参数所代表的总体具有最大的概率取得这些样本观测值,该总体参数即是所要求的参数。
通过或然函数极大化以求得总体参数估计量的方法被称为极大或然法。
在满足基本假设条件下,对一元线性回归模型:i i i X Y μββ++=10 i=1,2,…n随机抽取n 组样本观测值i i X Y ,(i=1,2,…n ),假如模型的参数估计量已经求得到,为 β0和 β1,那么i Y 服从如下的正态分布:i Y ~),ˆˆ(210σββiX N + 于是,i Y 的概率函数为 2102)ˆˆ(2121)(ii X Y i eY P ββσπσ---=i=1,2,…,n因为i Y 是相互独立的,所以Y 的所有样本观测值的联合概率,也即或然函数为:),,,(),ˆ,ˆ(21210nY Y Y P L ⋅⋅⋅=σββ 21022)ˆˆ(21)2(1ii nX Y neββσσπ--∑-=(2.2.8)将该或然函数极大化,即可求得模型参数的极大或然估计量。
由于或然函数的极大化与或然函数的对数的极大化是等价的,所以,取对数或然函数如下:2102*)ˆˆ(21)2l n ()l n (ii X Y n L L ββσσπ--∑--== (2.2.9) 对L *求极大值,等价于对210)ˆˆ(i i X Y ββ--∑ 求极小值。
210)ˆˆ(ii X Y ββ--∑极小值的条件为:⎪⎪⎩⎪⎪⎨⎧=--∑=--∑0)ˆˆ(ˆ0)ˆˆ(ˆ21012100i i i i X Y X Y βββ∂∂βββ∂∂解得模型的参数估计量为:⎪⎪⎩⎪⎪⎨⎧∑-∑∑∑-∑=∑-∑∑∑-∑∑=2212220)(ˆ)(ˆi i i i i i i i i i i i i X X n X Y X Y n X X n X Y X Y X ββ可见,在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。