计量经济学ch4 正态假定 经典线性回归模型
计量经济学 线性回归模型概述
Yi f ( X i ) i
• 后者在总体回归函数(方程)的基础上引入 了随机干扰项i,称为总体回归模型。
样本回归函数(教材P27-28)
• 但是,总体的信息往往无法掌握,所以总体回归函数 是未知的。 • 回归分析的任务就在于,利用对总体的n次观测所得 到的一组样本数据,去近似地估计总体回归函数。
被解释变量Y的总体均值(期望值)可以表示为:
E(Y X i ) f ( X i )
–上式说明了被解释变量Y 平均来说随解释变量X 变化的
规律,一般称为总体回归函数(population regression function,PRF);对应的曲线称为总体回归曲线 (population regression curve),它可以是线性的或非 线性的。
单方程线性回归模型的一般形式
• 总体回归方程
E(Yi X1i ,, X ki ) 0 1 X1i 2 X 2i k X ki
• 总体回归模型 Yi 0 1 X1i 2 X 2i k X ki i • 样本回归方程
ˆ ˆ ˆ ˆ ˆ Yi 0 1 X1i 2 X 2i k X ki
§2.4 一元线性回归分析的应用:预测问题
§2.5 实例及时间序列问题
§2.1
线性回归模型概述
一、回归分析概述 二、线性回归模型的特征 三、线性回归模型的普遍性
四、线性回归模型的基本假设
一、回归分析概述
1.变量间的关系(教材P22)
△ 经济变量之间的关系,大体可分为两类:
• 确定性关系或函数关系:也就是确定性现象之间的 关系。
• 样本回归模型
ˆ ˆ ˆ ˆ Yi 0 1 X1i 2 X 2i k X ki ei
计量经济学课程教学课件第四章正态性假定:经典正态线性回归模型CNLRM
• 在正态分布条件下
ui N (0, 2 )
ui NID(0, 2 )
2020/7/21
Hongfeng Peng Department of
4
Finance, Wuhan University
4.3 正态性假定下OLS估计量 的性质
• 无偏性
• 最小方差
• 一致性
ˆ1与ˆ2均是正态分布的
6
Finance, Wuhan University
ˆ1
N(1,
2 1
)
ˆ2
(n 2)ˆ 2 2
2 (n 2)
N(2,
2 2
)
2020/7/21
Hongfeng Peng Department of
5
Finance, Wuhan University
4.4 各分布及它们之间的关系
• 请见教材P93
2020/7/21
Hongfeng Peng Department of
Chapter 4 正态性假定:经典正态线 性回归模型(CNLRM)
经济与管理学院 金融系
4.1 回顾第三章对干扰项的假 定
• 第三章对干扰项 ui 的假定:
– 均值为零Leabharlann – 无序列相关对参数进行点估计够用
– 同方差
• 点估计只是统计推断的一方面,另一方 面是假设检验
2020/7/21
Hongfeng Peng Department of
2
Finance, Wuhan University
目标
Yi ˆ1 ˆ2 Xi uˆi
Yi 1 2 X i ui
有必要假定干扰项的概率分布!
计量经济学----几种常用的回归模型
• 考虑以下指数回归模型
Yi 1X e
2 i
i
ln Yi ln1 2 ln X i i
ln Yi 2 ln X i i
2的含义?
• 其测度了Y对X的弹性,即X变动百分之一引起Y变 动的百分数。 • 例如,Y为某一商品的需求量,X为该商品的价格, 那么斜率系数为需求的价格弹性。
证明:
d(ln Y ) dY Y 2 d(ln X ) dX X
适用性?
• 画出lnYi对lnXi的散点图,看是否近似为一 条直线,若是,则考虑此模型。 • P165例6.3
例:柯布--道格拉斯生产函数(P210)
Y AK L e
i
ln Y ln A ln K ln L i ln Y 0 lnK lnL i
回归子的相对改变量 2 回归元的绝对改变量
• 半对数模型的斜率系数度量了解释变量一个单位 的绝对变化,对应的因变量的相对变化量。 • P166例6.4
对数到线性模型(解释变量对数形式)
Yi 1 2 ln X i i
dY 2 d(lnX ) dX X
dY
2的含义?
2的含义?
• 其测度了Y的瞬时增长率,即Y随着时间t变化的变 化率。 • 例如,Y为个人的年消费支出,t为年度,那么斜 率系数为个人消费支出的年增长率。
证明:
d(ln Y ) dY Y dY dt 2 dt dt Y
• 注意根据斜率系数的估计值也可以求出复 合增长率r的值。
线性到对数模型
计量经济学几种常用的回归模型计量经济学回归模型计量经济学常用模型常用回归模型常用的回归模型计量经济学回归分析计量经济学线性回归计量经济学回归计量经济学逐步回归法计量经济学非线2. 半对数模型 3. 倒数模型 4. 对数倒数模型
计量经济学第3章 线性回归模型
计量经济学-第3章 线性回归模型
4
(3)等方差性:Var (i ) 2,i 1,2,, n ,因而
Var ( yi ) 2 , i 1,2,, n
(4)正态性:i ~ N (0, 2 ), i 1,2,, n ,因而
yi ~ N ( xi , 2 ), i 1,2,, n
上述四个条件可简化为: ij
1 lxx
n
xi
i 1
x E( yi )
1 n
lxx i1
xi x
(
xi
)
1 lxx
n i 1
xi x xi
1 lxx
lxx
E(ˆ)
2021/5/8
计量经济学-第3章 线性回归模型
14
E(ˆ ) E(Y ˆx )
1 n
n
E(
i 1
Yi )
E(ˆ ) x
1 n
n
i 1
i 1
i 1
2021/5/8
计量经济学-第3章 线性回归模型
21
n i 1
( yi
y)2
2 lxy lxx
lxy
(
lxy lxx
)2
lxx
n i 1
( yi
y)2
l
2 xy
lxx
n i 1
yi2
ny 2
l
2 xy
lxx
n i 1
yi2
n( 1 n
n i 1
yi )2
n
(
i 1
( xi
x)(yi lxx
y))2
n i 1
yi2 (
1 n
n i 1
yi )2
n
《计量经济学》第四章知识
《计量经济学》第四章知识第四章古典线性回归模型在引论中,我们推出了满足凯恩斯条件的消费函数与收入有关的一个最普通模型:C=α+βX+ε,其中α>0,0<β<1ε是一个随机扰动。
这是一个标准的古典线性回归模型。
假如我们得到如下例1的数据例1 可支配个人收入和个人消费支出年份可支配收入个人消费1970 751.6 672.11971 779.2 696.81972 810.3 737.11973 864.7 767.91974 857.5 762.81975 847.9 779.41976 906.8 823.11977 942.9 864.31978 988.8 903.21979 1015.7 927.6 来源:数据来自总统经济报告,美国政府印刷局,华盛顿特区,1984。
(收入和支出全为1972年的十亿美元)一、线性回归模型及其假定一般地,被估计模型具有如下形式:y i=α+βx i+εi,i=1,…,n,其中y是因变量或称为被解释变量,x是自变量或称为解释变量,i标志n个样本观测值中的一个。
这个形式一般被称作y对x的总体线性回归模型。
在此背景下,y称为被回归量,x称为回归量。
构成古典线性回归模型的一组基本假设为:1. 函数形式:y i=α+βx i+εi,i=1,…,n,2. 干扰项的零均值:对所有i,有:E[εi]=0。
σ是一个常数。
3. 同方差性:对所有i,有:Var[εi]=σ2,且24. 无自相关:对所有i ≠j ,则Cov[εi ,εj ]=0。
5. 回归量和干扰项的非相关:对所有i 和j 有Cov[x i ,εj ]=0。
6. 正态性:对所有i ,εi 满足正态分布N (0,2σ)。
模型假定的几点说明:1、函数形式及其线性模型的转换具有一般形式i i i x g y f εβα++=)()(对任何形式的g(x)都符合我们关于线性模型的定义。
[例] 一个常用的函数形式是对数线性模型:βAx y =。
计量经济学第二章经典线性回归模型
Yt = α + βXt + ut 中 α 和 β 的估计值 和
,
使得拟合的直线为“最佳”。
直观上看,也就是要求在X和Y的散点图上
Y
* * Yˆ ˆ ˆX
Yt
* **
Yˆt
et * *
*
*
**
*
**
**
*
Xt
X
图 2.2
残差
拟合的直线 Yˆ ˆ ˆX 称为拟合的回归线.
对于任何数据点 (Xt, Yt), 此直线将Yt 的总值 分成两部分。
β
K
βK
β1 β1
...
βK
βK
Var(β 0 )
Cov(β1 ,β
0
)
Cov(β 0 ,β1 )
Var(β1 )
...
Cov(β
0
,β
K
)
...
Cov(β1
,β
K
)
...
...
...
...
Cov(β
K
,β
0
)
Cov(β K ,β1 )
...
Var(β K )
不难看出,这是 β 的方差-协方差矩阵,它是一 个(K+1)×(K+1)矩阵,其主对角线上元素为各 系数估计量的方差,非主对角线上元素为各系 数估计量的协方差。
ut ~ N (0, 2 ) ,t=1,2,…n
二、最小二乘估计
1. 最小二乘原理
为了便于理解最小二乘法的原理,我们用双
变量线性回归模型作出说明。
对于双变量线性回归模型Y = α+βX + u, 我 们
的任务是,在给定X和Y的一组观测值 (X1 ,
线性回归模型的经典假定及检验修正
线性回归模型的经典假定及检验、修正一、线性回归模型的基本假定1、一元线性回归模型一元线性回归模型是最简单的计量经济学模型,在模型中只有一个解释变量,其一般形式是Y =β0+β1X 1+μ其中,Y 为被解释变量,X 为解释变量,β0与β1为待估参数,μ为随机干扰项。
回归分析的主要目的是要通过样本回归函数(模型)尽可能准确地估计总体回归函数(模型)。
为保证函数估计量具有良好的性质,通常对模型提出若干基本假设。
假设1:回归模型是正确设定的。
模型的正确设定主要包括两个方面的内容:(1)模型选择了正确的变量,即未遗漏重要变量,也不含无关变量;(2)模型选择了正确的函数形式,即当被解释变量与解释变量间呈现某种函数形式时,我们所设定的总体回归方程恰为该函数形式。
假设2:解释变量X 是确定性变量,而不是随机变量,在重复抽样中取固定值。
这里假定解释变量为非随机的,可以简化对参数估计性质的讨论。
假设3:解释变量X 在所抽取的样本中具有变异性,而且随着样本容量的无限增加,解释变量X 的样本方差趋于一个非零的有限常数,即∑(X i −X ̅)2n i=1n→Q,n →∞ 在以因果关系为基础的回归分析中,往往就是通过解释变量X 的变化来解释被解释变量Y 的变化的,因此,解释变量X 要有足够的变异性。
对其样本方差的极限为非零有限常数的假设,旨在排除时间序列数据出现持续上升或下降的变量作为解释变量,因为这类数据不仅使大样本统计推断变得无效,而且往往产生伪回归问题。
假设4:随机误差项μ具有给定X 条件下的零均值、同方差以及无序列相关性,即E(μi|X i)=0Var(μi|X i)=σ2Cov(μi,μj|X i,X j)=0, i≠j随机误差项μ的条件零均值假设意味着μ的期望不依赖于X的变化而变化,且总为常数零。
该假设表明μ与X不存在任何形式的相关性,因此该假设成立时也往往称X为外生性解释变量随机误差项μ的条件同方差假设意味着μ的方差不依赖于X的变化而变化,且总为常数σ2。
计量经济学 第4讲 线性回归模型的扩展
多重共线性的诊断
运用一些指标进行诊断
1) 方差膨胀因子:计算每个解释变量的方差膨胀因子VIF,一 般认为如果VIF大于10,说明该变量与其他变量存在高度共 线性
假定10对于大样 本数据不是必需的 假定。
本讲主要考虑放 宽了其余假定后面 临的问题
引言:放宽经典模型的假设
微数缺测性
o 从理论上讲,样本容量n和解释变量数目k必须满足n>k+2 ,才能进行OLS估计和假设检验。但事实上,即便n满足 上述条件,但如果样本很小,那么虽然能够进行估计和检 验,也很难通过t检验。
a.根据模型用OLS方法估计出每个 ui2
b.做以下模型的 OLS回归,得到 Ru2
ui2
0
1 X1i
2 X2i
3 X3i
4
X
2
1i
5
X
2
2i
6
X
2
3i
v
i
7 X1i X 2i 8 X1i X 3i 9 X 2i X 3i vi
o 任意两个解释变量之间的相关系数较大,比如大于0.9 o 解释变量之间的偏相关系数较大
简单方法一般来说不很精确
多重共线性的诊断
运用回归分析进行诊断
o 逐步分析法:先引入经济意义明显,并且在统计上最显著的 解释变量,然后逐步引入其他解释变量。如果新引入的解释 变量使原有解释变量的系数估计值发生明显变化,或t统计量 明显变小,则说明新引入的解释变量与原有解释变量之间存 在多重共线性,可以去掉新引入的解释变量
计量经济学回归分析模型
称为样本回归函数(sample regression function,SRF)。
注意: 这里将样本回归线看成总体回归线的近似替代
则
样本回归函数的随机形式/样本回归模型:
同样地,样本回归函数也有如下的随机形式:
ˆ ˆ X e ˆ ˆi Yi Y i 0 1 i i
式中,ei 称为 (样本)残差 (或剩余)项 ( residual) ,代表
例如: 函数关系:
圆面积 f , 半径 半径2
统计依赖关系/统计相关关系:
农作物产量 f 气温, 降雨量, 阳光, 施肥量
对变量间统计依赖关系的考察主要是通过相关分析(correlation analysis)或回归分析(regression analysis)来完成的:
ቤተ መጻሕፍቲ ባይዱ 概念:
在给定解释变量Xi条件下被解释变量Yi的期望 轨迹称为总体回归线(population regression line), 或更一般地称为总体回归曲线(population regression curve)。
相应的函数:
E (Y | X i ) f ( X i )
称为(双变量)总体回归函数(population regression function, PRF)。
正相关 线性相关 统计依赖关系 不相关 相关系数: 有因果关系 无因果关系 回归分析 相关分析 负相关 1 XY 1 正相关 非线性相关 不相关 负相关
▲注意:
①不线性相关并不意味着不相关; ②有相关关系并不意味着一定有因果关系; ③回归分析/相关分析研究一个变量对另一个 (些)变量的统计依赖关系,但它们并不意味着一定 有因果关系。 ④相关分析对称地对待任何(两个)变量,两个 变量都被看作是随机的。回归分析对变量的处理方法 存在不对称性,即区分应变量(被解释变量)和自变 量(解释变量):前者是随机变量,后者不是。
经典正态线性回归模型
OLS估计量的值是根据样本数据利用公式计 算得出的。对于一个给定的总体,由于研究 者通常仅有一个样本,因此,计量经济学的 初学者常常假定回归分析只能产生的一个估 计值。然而,事实上,来自于相同总体的不 同样本都会产生不同的估计值。所有可能的 样本集有一个相同的分布,该分布具有均值 和方差。尽管在大多数实际应用中,我们面 对的是从总体抽取的唯一样本,但我们仍需 要讨论的抽样分布性质。务必记住,抽样分 布是指不同值的分布,这些值来自不同的样 本,而不是同一样本。因为误差项的正态分 布同样意味着的OLS估计量也是正态分布, 所以这些被假定为正态分布。
x
2 i
。
由
于
k
,
i
和
X
i
都
是
固
定
的
,
所
以
ˆ
2
最
终
是
随
机
变
量
u
的
i
一
个
线
性
函
数
。
于
是
,
ˆ
的
2
概
率
分
布
将
取
决
于
u
的
i
概
率
分
布
。
若
没
有
假
定
u
的
i
概
率
分
布
,
则
不
可
能
对
估
计
的
参
数
做
出任何推断,也就不可能对估计做出有意义的评价,也不能对总
体
进
行
相
关
的
检
验
。
因
第4章 经典正态线性回归模型
中心极限定理为ui的正态性假定提供了理论基础。
大数定理:在大量随机现象中,无论个别随机现象 的结果如何,或者它们在进行过程中的个别特征如何, 大量随机现象的平均结果实际上与每一个个别随机现象 的特征无关,并且几乎不再是随机的了。 切贝谢夫定理:(以确切的数学形式表达了大数定 律的内容) 设 1, 2, , n, 是相互独立的随机变量,它们各有 数学期望 E1,E 2, ,E n, 及方差 D1,D 2, ,D n,
在满足基本假设条件下,对一元线性回归模型:
Yi 0 1 X i ui
Yi服从如下的正态分布:
Yi N ( 0 1 X i , 2 )
于是,Y的概率函数为:
1 P(Yi ) e 2
1 2 2 (Yi 0 1 X i )
(i=1,2,…n)
E (ui ) 0
(4.2.1) (4.2.2)
E (ui u j ) 0, i j
E (ui ) 2
2
协方差: cov(ui , u j )
(4.2.3) (4.2.4)
这些假定可以归结为:
ui ~ N (0, 2 )
N代表正态分布(normal distribution)
对于两个正态分布变量来说,零协方差和零相关就意味 着两个变量互相独立。
期望之差,当 n 时,依概率收敛到0。
中心极限定理:如果每一项偶然因素对总和的影响 是均匀的、微小的,即没有一项起特别突出的作用,那 么就可以断定这些大量独立的偶然因素的总和是近似地 服从正态分布的。 李雅普诺夫定理(Liapounov theorem):(提供了中 心极限定理的数学形式)。设 1, 2, , n, 是相互 独立的随机变量,
计量经济学ch4
21
4.9 学生t-分布
如果假设(1-7)成立,则
ˆ i i tn k ( ˆ) se i
( ˆ ) 是 se( ˆ ) 的估计量:后者可用 其中 se 2 2 误差项的标准差 来表示,但 是未知的, 用其无偏估计量( k 等于参数的个数)
2 ˆ u i nk ( ˆ )。 来代替,则得到 se 2
残差平方和最小的必要条件
n S ˆ ˆ X ˆ X )(1) 0 2(Yi 1 2 2i k ki ˆ 1 i 1 n S ˆ ˆ X ˆ X )( X ) 0 2(Yi 1 2 2i k ki 2i ˆ 2 i 1
Consum 1 2 Wage 3 E-Income u 这使得我们在研究工资收入对消费的影响时, 可以剥离非工资性收入的影响。反之亦然。
5
4.3 多元回归模型的OLS方法
第2章总体回归函数可以推广到多元函数 (PRF) Y 1 2 X 2 k X k u 或
u & Y 的方差分别用无偏估计量来代替: RSS TSS 得到 var(u) , var(Y )
19
4.7 误差项的正态性假设
为了获得OLS估计量的分布,还需要增 加如下假设 假设 7 :误差项服从正态分布 2 ui N (0, )
该假设与一元回归模型类似,其合理性 由中心极限定理来保证。
20
4.8 OLS估计量的抽样分布
在假设1-7下,OLS估计量服从正态分 布 该结论是假设检验的基础
增加一个自变量,拟合优度增加。 增加一个自变量损失一个自由度(正规方 程多一个方程),但这种“不利影响”没 有体现在拟合优度中。 我们需要一个指标,它能“权衡”增加自 变量的“得失”。
第4章:经典正态线性回归模型
体进行相关的检验。因此,必须对ui的概率分布做出假定。
ui的正态性假定:
经典正态线性回归假定每个ui都是正态分布的: 均值: E(ui Xi ) 0
方差: var(ui Xi ) 2
协方差: cov(ui ,u j Xi , X j ) 0
i, j,i j
表示为:ui N (0, 2 ) N表示“正态分布(normal distribution)?
大到所有无偏估计类,即无论是线性还是非线性估计量,OLS估
计量的方差最小。
暨南大学经济学院统计系 陈文静
23
4.4 最大似然估计(ML估计)
方法:将每一个Yi的分布函数相乘,取对数再取偏导并令其为0.
由于假定了ui为独立同(正态)分布, 那么Yi也为独立同(正态)分布,
其均值为1 2 Xi方差为 2 , 密度函数为:
/ n
中心极限定理为误差项ui的正态性假定提供了理论支持。
回忆参数估计时对ui的假定:均值为0,方差相同 2,协方差
为0,ui代表的是未直接出现在模型中的影响因素对被解释变量
的影响之和。基于这些假设,根据中心极限定理,提出正态性假定。
Central Limit Theorem
As Sample Size Gets Large Enough
(ˆ
2 LS
uˆi2 / (n 2)
性质:在正态假定下,参数1和2的估计与OLS相同, 总体方差的估计是一个有偏估计,因为 2的OLS估计
是一个无偏估计,但显然,ML估计不等于OLS估计,
所以有偏。但可证明, 2的ML估计是一个渐近无偏估计,
也是一致估计,即有:
lim
n
E
关于计量经济学经典线性回归模型基本假定的思考
关于计量经济学经典线性回归模型基本假定的思考关于计量经济学经典线性回归模型基本假定的思考在计量经济学建模实践中,研究者都力所能及的令所创建的模型满足经典线性回归模型的所有基本假定,因为只有这样,该模型的参数估计才具有一系列的优良统计性质,与之相关的各种假设检验才精确可靠,模型总体l来讲也才具有最佳的应用价值,否则,模型将或多或少存在着不足之处,使得其应用性能大打折扣。
为什么计量经济学模型需要这些基本假定呢?这些假定又具有什么样的意义呢?对于这些最基本的问题,笔者将结合计量经济学的教学实践经验以及对该学科的理解,来对计量经济学经典线性回归模型的基本假定作出通俗的解释。
1.计量经济学模型需要完美性辨证唯物主义告诉我们,不管是什么偶然的现象,其背后都有必然的规律性在起着支配作用,世界是偶然性与必然性的辩证统一。
科学研究的目的,即是在诸多的偶然性现象中发现其不变的必然性,从而推动人类物质文明和精神文明的进步。
计量经济学的研究也不例外,其目的是为了在复杂多变的经济现象中发现其不变的本质,从而获得对特定经济系统的规律性认识,为经济发展与社会进步服务。
计量经济学通过创建数学模型来揭示经济现象的数量规律,从而弥补了以逻辑推理和文字描述为主、缺乏定量分析的经济理论的不足。
以研究商品需求为例,传统的经济学理论“需求定律”只能告诉我们商品需求与价格之间具有反向变动的关系,但无法告诉我们当价格变化一定量时,需求会随之变化多少量,而计量经济学的建模分析则能够把两者之间的定量关系估计出来,这种能力是其他经济学理论所不能替代的。
既然计量经济学建模分析的目的是通过创建适当的数学模型来揭示经济变量之间的数量规律性,那么计量经济学就必须首先要回答这样一个问题一一“我们到底需要一个什么样的计量经济学模型?”这个问题的答案是显而易见的,那就是,我们需要一个“尽可能完全揭示经济变量之间的数量规律性”(以下称“第一大完美性特征”)并且“便于进行研究” (以下称“第二大完美性特征”)的计量经济学模型。
线性回归模型(计量经济学)
REPORTING
定义与目的
定义
线性回归模型是一种预测模型, 用于描述因变量与一个或多个自 变量之间的线性关系。
目的
基于历史数据,通过建立线性回 归模型,预测因变量的未来趋势 ,并分析自变量对因变量的影响 程度。
线性回归模型的基本假设
线性关系
因变量与自变量之间存在线性关系, 即它们之间的关系可以用一条直线来 近似表示。
优点
能够给出参数的最优解, 具有一致性和无偏性,适 用于多种类型的数据。
工具变量法
原理
工具变量法是一种用于处理内生 性问题的估计方法,通过引入与 内生解释变量相关,但与误差项 无关的工具变量来估计参数。
计算方法
工具变量法通过最小化误差平方 和,同时利用工具变量与内生解 释变量的相关性,求解出最佳拟 合直线的参数。
计的参数不准确。
原因
自变量之间可能存在某种关联 ,或者由于数据收集过程中的 误差导致自变量测量误差。
影响
参数估计值不稳定,可能导致 预测失效。
处理方法
减少自变量数量、使用主成分 分析、逐步回归等方法。
自相关问题
定义
自相关是指时间序列数据中,当前值与过去 值之间的相关性。
影响
模型的估计参数不准确,导致预测误差。
原因
时间序列数据中,同一数据点之间存在某种 关联性。
处理方法
使用差分法、ARIMA模型等方法处理自相 关问题。
异方差性检验与处理
定义
异方差性是指模型残差项的方差不恒定,即方差随预测变量的变化而变化。
原因
模型未正确反映自变量与因变量之间的关系,或者数据存在异常值。
影响
模型的估计参数不准确,导致预测误差。
《计量经济学》第二章 简单线性回归模型
Yi 与 E(Yi Xi ) 不应有偏差。若偏
差 u i 存在,说明还有其他影响因素。
Xi
X
u i实际代表了排除在模型以外的所有因素对 Y 的影响。
◆性质 u i 是其期望为 0 有一定分布的随机变量
重要性:随机扰动项的性质决定着计量经济分析结
果的性质和计量经济方法的选择
19
引入随机扰动项 u i 的原因
数 是客观存在的特定数值。
●总体的两个变量 X 和 Y的全部数值通常不可能直接观测,所
以总体相关系数一般是未知的。
7
X和Y的样本线性相关系数:
如果只知道 X 和 Y 的样本观测值,则X和Y的样本线性
__
__
相关系数为: rXY
( Xi X )(Yi Y )
__
__
( Xi X )2 (Yi Y )2
如果能够通过某种方式获得 ˆ1 和 ˆ 2 的数值,显然: ● ˆ1和 ˆ 2 是对总体回归函数参数1 和2 的估计 ● Yˆ i 是对总体条件期望 E(Yi Xi ) 的估计
么,可以计算出总体被解释变量Y的条件期望 E(Y Xi ) ,
并将其表现为解释变量X的某种函数
E(Y Xi ) f (Xi )
这个函数称为总体回归函数(PRF) 本质: 总体回归函数实际上表现的是特定总体中被解释变 量随解释变量的变动而变动的某种规律性。 计量经济学的根本目的是要探寻变量间数量关系的规律,也 就要努力去寻求总体回归函数。
条件均值形式:
样本回归函数如果为线性函数,可表示为
Yˆi ˆ1 ˆ2 Xi
其中:Yˆi 是与 X i 相对应的 Y 的样本条件均值 ˆ1 和 ˆ2 分别是样本回归函数的参数
个别值(实际值)形式:
第四章 正态性假定:经典正态线性回归模型
ui ~ NID(0, )
2
为何提出正态性假定?
(1)u代表回归模型中未明显引进的许多自变量(对因 变量)的总影响。期望这些影响微小而且是随机的。 根据中心极限定理,如果存在大量独立且同分布的随 机变量,那么,除了少数例外情形,随着这些变量的 个数无限增大,它们的总和将趋向正态分布。 (2)中心极限定理的另一解释,即使变量个数并不很大 或这些变量还不是严格独立的,它们的总和仍可视同 正态分布。 (3)正态分布的一个性质是,正态分布变量的任何线性 函数都是正态分布的。在正态性假定下,容易导出 OLS估计量的概率分布。 (4)正态分布是一个比较简单的,仅涉及两个参数(均 值和方差)的分布,它为人们所熟知,其理论性质在 数理统计中得到广泛研究。
取代最小二乘法的另一方法似最大似然 法(Maximum Likelihood,简称 ML)。 为了使用ML法,必须对随机扰动项u的 概率分布作一假定。在回归分析中,最 常作的假定就是u服从正态分布。
最小二乘估计是指当从模型总体随机抽 取n组样本观测值后,最合理的参数估 计量应该使得模型能最好地拟合样本数 据。而最大似然估计量是指当从模型总 体随机抽取n组样本观测值后,最合理 的参数估计量应该使得从中抽取该n组 样本观测值的概率最大 。
2 Y X 0 1 i 2 i
ˆ 0
ˆ Y
i
ˆX 0 1 i
0
2
ˆ ˆX Y i 0 1 i ˆ 1
0
2
解得模型参数估计量为 :
2 X i Yi X i Yi X i ˆ 0 2 2 n X i X i ˆ n Yi X i Yi X i 2 1 2 n X i X i
计量经济学第4章经典假设的模型估计
4.2 异方差性
4.2.4异方差性下模型的估计方法 1.模型变换法 常见的 变换方法有以下几种:
4.2 异方差性
4.2.4异方差性下模型的估计方法 1.模型变换法 常见的 变换方法有以下几种:
4.2 异方差性
4.2.4异方差性下模型的估计方法 1.模型变换法 常见的 变换方法有以下几种:
4.5 应用案例分析
1.模型参数的OLS估计
首先,建立EViews工作文件,并录入数据,利用OLS估计消费性支出对可支配收入的回归模型。样本回 归结果如下:
4.5 应用案例分析
2. 对模型是否存在异方差性进行检验。 (1)图示法检验 首先,利用OLS估计结果,生成残差平方序列。在得到方程的回归结果后, 立即用生成命令建立序列 ,记为 。 其次,绘制 对 的散点图。选择变量x和e2,按照路径Quick\Graph\scatter,就 可以得到x和e2的散点图.
利用样本数据分别建立上述各式的回归方程,选择 最大 R 2 的函数形式进行分析,若回归结果显示斜率参数显著不为 0,则认为存在异方差性。
4.2 异方差性
4.2.3异方差性的检验 4.戈德菲尔德—匡特检验 检验步骤:
4.2 异方差性
4.2.3异方差性的检验 5.怀特检验 检验步骤:
4.4 随机解释变量
4.4.2工具变量法
工具变量法的基本思想是:选择一个有效的工具变量,在 模型估计过程中用工具变量替代与随机干扰项相关的随机 解释变量,对相关参数进行估计,得到一个一致估计结果。
工具变量的选择,必须满足下述四个条件:
(1)与所替的随机解释变量高度相关; (2)与随机误差项不相关; (3)与模型中其他解释变量不相关; (4)同一模型中需要引入多个工具变量时,这些工具变量之 间不相关。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Ch4 正态性假定: 经典正态线性回归模型
对于模型
i i i u X Y ++=21ββ (4.1)
我们首先讨论扰动的分布。
i u
4.1. 的概率分布
i u 没有分布假设,不可能对参数估计量作出任何推断,也不可能对任何有关总体的假定作出检验
4.2. 的概率分布假定为正态分布
i u 经典正态线性回归假定具有正态分布,且 i u 均值:
0)(=i u E 方差: ,表示对每一个,方差相同 22)(σ=i u E i u 协方差 j i u u j i ≠=0),cov(
概率密度函数: 22
221
)(σ
π
σi u i e
u f −=
概率分布函数
∫
∞
−−=x
i
i du e
u F i 22221
)(σ
μπ
σ
上述假定采取记为
2~(0,i u NID )σ (4.2)
简称为为独立同分布。
其分布特征如图所示.
i u
正态分布特征:
为什么假定为正态分布? 1. 中心极限定理
独立同分布随机变量X i , 其均值为μ, 方差为σ2, 则:
)/,(/2
n N n X X n i σμ⎯⎯→⎯=∞
→∑
)1,0()
(/N X n n
X z n ⎯⎯→⎯−=
−=
∞
→σ
μσμ
正是中心极限定理,为的正态假设提供了理论支持。
i u 2. 正态变量所具有的性质: 线性变换仍为正态变量,分布函数仅有两个参数即均值和方差。
4.3.正态假定下OLS 估计量的性质
用OLS 方法所得到的估计量,在正态假定下具有性质: )2,1(ˆ=i i
β1. 无偏性; 2. 最小方差;
3. 一致性,即随着样本个数的无限增大,估计量将收敛于它们的真值。
用公式表示
{}
01ˆlim >=<−∞
→εεββi
i n P 或
i
i p ββ=ˆlim 4. 估计量服从正态分布
212222
~(,ˆ~(,var())i i Y N X N )
ˆββσβββ+ (4.3) 对其标准化,有
)
1,0(~)ˆvar(ˆ2
22N Z βββ−=
5.
)2(~ˆ)2(22
2−−n n χσσ
(4.4)
为什么?
6. 的(联合)分布独立于的分布。
)ˆ,ˆ(2
1ββ2ˆσ7. 在所有无偏估计类(线性和非线性)中,方差最小。
)2,1(ˆ=i i
β高斯定理限于线性无偏估计中,在正态假定下,方差最小扩大到所有无偏估计类,即无论是线性还是非线性估计量,OLS 估计量都是最优估计量。
4.4.ML 估计
方法: Y 的联合概率密度函数(在正态和无自相关假定下,每一个Y i 的概率密度函数相乘)值通过一阶条件最大化,取对数后,对参
数取偏导并令其为0。
假定为独立同(正态)分布, 有也为独立同(正态)分布, 其均值为β1+β2X i, 方差为σ2, 密度函数为
i u i Y ⎭
⎬⎫⎩⎨⎧−−−=2
221)(21exp 21
)(σββπσi i i X Y Y f 而联合密度函数(由于独立性)为每一个的密度函数相乘,即有极大似然函数为 i Y
⎭
⎬⎫⎩⎨⎧−−−=++=+=∑222122122112211)(21exp )2(1
),(),(),,...(σββπσσββσββσββi i n
n i n i i n X Y X Y f X Y f X Y Y f LF "
对LF 取对数,有
∑∑
−−−−−=−−−−−=2
22
122
221)(21)2ln(2ln 2)(21)2ln(2ln ln σββπσσββπσi i X Y n n X Y n
n LF 上述似然函数中,含待估参数,分别对待估参数求偏导并令其为0,即可求出参数估计.
0)()2/1()2/(ˆln 0
)()()/1(ˆ
ln 0)1()()/1(ˆln 2214
22
2122
2121
=−−+−=∂∂=−−−−=∂∂=−−−−=∂∂∑∑∑i i i i X Y n LF X X Y LF
X Y LF
ββσσσ
ββσβββσβ
联立求解上述方程组,有
2
2
12
22
22
()(ˆ,
()
ˆˆˆˆˆˆ//i
i i
ML
i LS
i X X Y Y X X Y X u n u n βββσσ−−=−=−==∑∑∑∑(2)−
性质:
在正态假定下,参数β1的β2的估计与OLS 相同,总体方差的估计是一个有偏估计。
因为σ2的OLS 估计是一个无偏估计, 但显然,ML 估计不等于OLS 估计,所以有偏.
2
2
)21()ˆ(σσ
n
E ML −= 但可证明, σ2的ML 估计是一个渐近无偏估计,也是一致估计:
2222ˆlim (),ˆlim M n M n E p σσσσ→∞
→∞
==
4.5. 与正态分布相关联的分布或由正态分布所派生的分布
定理4.1. 设为n 个相互独立正态变量,其均值和方差分别
为,则它们的线性组合,
n i Z i ,..2,1,=2,i i σμ))(,(~2∑∑∑=i i i i i i k k N Z k Z σμ
定理4.2. 设为n 个相互不独立正态变量,其均值和方差分
别为,则它们的线性组合为正态变量,且有
n i Z i ,..2,1,=2,i i σμ)),,cov(2)(,(~2∑∑∑∑≠+=j i Z Z k k k k N Z k Z J i j i i i i i i i σμ
定理4.3. 设为n 个相互独立且分布相同的正态变量,其均
值和方差分别为0和1(标准正态变量),则它们的平方的和为卡方变量,即
n i Z i ,..2,1,=)(~22
n Z
i
χ∑
期望:n ;方差:2n
)(2n χ的概率密度函数
定理4.4.设),..2,1(n i Z i =为相互独立且自由度分别为的卡方分布,则和
有
i k ∑∑)(~2i i
k Z
χ
定理4.5.学生t-分布
)
1,0(~/)(~),1,0(~2
121221N t Z k Z k
Z Z t k Z N Z d
k ⎯→⎯=
=
⇒
χ
期望:0 (k>1) 方差:)2/(−k k (k>2)
学生t-分布与正态分布
Student’s t-Distribution
图4.1 学生t-分布与正态分布
定理4.6. 如果,则
)(~)2,1(2i i k i Z χ=),(~//212
21
1k k F k Z k Z F =
其中分子(母)的自由度分别为k 1(或m)和k 2(或n).
期望: (k 2>2)
)2/(22−k k 方差:)
4()2()
2(222
212122−−−+k k k k k k (k 2>4)
F 分布的概率密度函数(2,6)、(6,10),(10,20) 定理4.7. 2),1(k t k F = 要点:
正态分布,正态分布下的估计量的性质.
ML 估计,卡方分布, F 分布, t 分布的定义和构成。