计量经济学第二章教学课件
合集下载
计量经济学课件-第二章
重要提示
• 几乎没有哪个实际问题能够同时满足所有基本假设; • 通过模型理论方法的发展,可以克服违背基本假设 带来的问题; • 违背基本假设问题的处理构成了单方程线性计量经 济学理论方法的主要内容: 异方差问题(违背同方差假设) 序列相关问题(违背序列不相关假设) 共线性问题(违背解释变量不相关假设) 随机解释变量(违背解释变量确定性假设)
Back
第 二 章:一元线性回归模型
§2.2 一元线性回归模型的参数估计
一、古典(基本)假定 二、用普通最小二乘法(OLS)估计模型的参数 三、OLS回归直线的性质(数值性质) 四、最小二乘估计式的统计性质 (前提:满足古典(基本)假定)
一、古典(基本)假定
简单线性回归模型:
(一) 对变量和模型的假定 1)重复抽样中,解释变量 X i 与干扰项 u独立; i 是一组固定的值或虽然是随机的,但
估计总体回归方程(PRF)。
设样本回归方程为:
ˆ ˆ X ˆ Y i 1 2 i
ˆ 实际值与拟合值的离差为: Y Y i i
离差平方和为:
ˆ) Q e (Y Y
2 i i i
2
最小二乘法的基本思想(原则):寻找实际值与拟合值的离 差平方和为最小的回归直线。
ˆ ˆ X) ˆ ) (Y e (Y Y
ˆ x ˆi y 2 i
ˆ ˆ X ˆ Y i 1 2 i
ˆ ˆ X e Yi 1 2 i i
ˆ e Yi Y i i
ˆ ˆ X) ˆ ˆ X) ˆi y ( ( 1 2 i 1 2 ˆ(X X) ˆ x ˆi y 2 i 2 i
i=1,2,„n (2.1.3)
X X , X , 1 2 其中,Y 称被解释变量, „ k 称解释变量,k 为解
计量经济学第二章(第一部分)
i= 1
同
上
该准则消除了正负误差抵消,其缺点是:
不能保证找到的直线具有无偏性。如:
+2 -1
-1
+3
0 0
3 Yi -Yˆ i = 4
3
2
Yi -Yˆ i =6
i=1
i=1
3
3
2
Yi -Yˆ i = 3
Yi -Yˆ i =9
i=1
i=1
33 计量经济学
(3)使得
13 计量经济学
Y i01X iui,i1,2n,..., 同
上
其中 0,1 称为回归参数;u为随机误差 项; X称为解释变量;Y称为被解释变量。 “一元”是指:只有一个解释变量;
14 计量经济学
Y i01X iui,i1,2n,..., 同
上
“线性”包含:
被解释变量与间 解为 释线 变性 量关系
量Y的影响;
16 计量经济学
同 上
(2)变量观测值的观测误差的影响; (3)模型数学形式的设定误差影响; (4)其它随机因素的影响。
17 计量经济学
同 上
2、随机误差项u的特性
(1)对被解释变量Y的影响方向,有正有负;
(2)由于代表次要因素,因此,对Y的总平
均影响可视为零;
(3)对被解释变量Y的影响是非趋势的,是
假定2、3统称为高斯-马尔可夫假定。
23 计量经济学
假定4 cov(Xi,ui)=Exiui=0 ,
假
定
i=1,2,…,n且X为确定性变量,而非 4
随机变量。
如果解释变量X是确定性变量而非随机变 量该假定自动成立,即EXi=Xi ,EXiui= XiEui= 0 。该假定表明X与u不相关。因 为在模型中u包含了除X对Y的影响外其它 因素对Y的影响,因此应与X对Y的影响分 开。
第2章计量经济学回归分析的性质ppt课件
§2.4 数据
一、数据的分类 按照数据与时间的关系,可以分为: ❖ 时间序列数据(time series data) ❖ 横截面数据(cross-section data) ❖ 面板数据(panel data/ pooling data)
实例:我国地区的生产总值
二、数据的来源和质量
❖ 社会科学数据都是非实验所得,存在测量误 差,或出于疏漏或差错 ;
cov(Xt,Yt)
Var(Xt) Var(Yt)
样本相关系数r
rXYˆ
1 T1
(Xt X)(Yt Y)
1 T1
(Xt X)2
1 T1
(Yt Y)2
(Xt X)(Yt Y)
(Xt X)2 (Yt Y)2
性质: (1)r具有对称性 (2)r与原点和尺度都无关
400
200
0 0
X
10
20
30
40
50
完全相关
Y 2
1
X
0
10
20
30
40
50
高度相关
3.0
2.5
Y
2.0
1.5
1.0
0.5
2.0
2.5
3.0
3.5
弱相关
X
4.0
4.5
4
Y 2
0
-2
X -4
-4
-2
0
2
4
零相关
2、按变量个数
200 150 100
50 0 0
Y
X
50
100
150
200
250
非线性相关/负相关
Y 2
1
计量经济学课件4
以上5个假设也称为线性回归模型的经典假设,满足该假设的线性回归模型称为 经典线性回归模型。而前4个假设称为高斯-马尔可夫假设,这些假设能保证估计
方法G有i*良好的统计性质。
2.3 一元线性回归模型的参数估计 2.3.1普通最小二乘法
由(2.3.2)、(2.3.3)式得:
(2.3.4)
(2.3.5)
这样我们就定义了变量x和y之间的一个简单线性回归模型,也称为两变 量或一元线性回归模型。其线性的含义表示无论变量x的取值如何,它 的任何一单位变化都对变量y产生相同的影响。
2.2 一元线性回归模型的基本假设 2.2.1对回归模型设定的假设
假设1:回归模型是正确设定的。 模型的正确设定主要包括两方面的内容:(1)模型选择了正确的变量 ;(2)模型选择了正确的函数形式。 计量经济模型应用于现实经济问题时,因果关系必须有经济理论为其依 据,函数关系也必须要有可靠的依据。 模型选择了正确的变量指既没有遗漏重要的相关变量,也没有多选无关 变量且有经济理论支持该因果关系。当假设1满足时,称模型没有设定 偏误,否则模型存在设定偏误。 假设1‘:线性回归模型 回归模型对变量不一定是线性的,但对参数是线性的。在计量经济学里 说到的线性回归都是指关于参数是线性的。要注意的是回归模型的估计 原理不依赖于y和x的定义,但系数的解释依赖于它们的定义。
xi(yi y ) (xi x )xi
x(y i x(xi
y) x)
(xi x )(yi y ) (xi x )2
2.3 一元线性回归模型的参数估计 2.3.2最小二乘估计量的统计性质
(1)线性性
这里指 ˆ0和 ˆ1分别是 y1, y2 , , yn 的线性函数。
令 ki
(xi x ) ,代入上式得
方法G有i*良好的统计性质。
2.3 一元线性回归模型的参数估计 2.3.1普通最小二乘法
由(2.3.2)、(2.3.3)式得:
(2.3.4)
(2.3.5)
这样我们就定义了变量x和y之间的一个简单线性回归模型,也称为两变 量或一元线性回归模型。其线性的含义表示无论变量x的取值如何,它 的任何一单位变化都对变量y产生相同的影响。
2.2 一元线性回归模型的基本假设 2.2.1对回归模型设定的假设
假设1:回归模型是正确设定的。 模型的正确设定主要包括两方面的内容:(1)模型选择了正确的变量 ;(2)模型选择了正确的函数形式。 计量经济模型应用于现实经济问题时,因果关系必须有经济理论为其依 据,函数关系也必须要有可靠的依据。 模型选择了正确的变量指既没有遗漏重要的相关变量,也没有多选无关 变量且有经济理论支持该因果关系。当假设1满足时,称模型没有设定 偏误,否则模型存在设定偏误。 假设1‘:线性回归模型 回归模型对变量不一定是线性的,但对参数是线性的。在计量经济学里 说到的线性回归都是指关于参数是线性的。要注意的是回归模型的估计 原理不依赖于y和x的定义,但系数的解释依赖于它们的定义。
xi(yi y ) (xi x )xi
x(y i x(xi
y) x)
(xi x )(yi y ) (xi x )2
2.3 一元线性回归模型的参数估计 2.3.2最小二乘估计量的统计性质
(1)线性性
这里指 ˆ0和 ˆ1分别是 y1, y2 , , yn 的线性函数。
令 ki
(xi x ) ,代入上式得
第四讲(计量经济学第二章)PPT课件
1C(o Q X,v)1Q 01
12
六、参数估计量的概率分布及随机扰 动项方差的估计
13
经典假设下,普通最小二乘估计的分布
^
0 0 wii
ˆ1 1 ki i
^
0~N(0,2
w2) i
^
1~N(1,2
k2) i
14
古典假设下,随机扰动项方差的估计
^
2
1
n2
ei2
^2
(n2)2 ~2(n2) (证明略)
6
2、一元线性回归模型普通最小二乘估 计量的性质
高斯—马尔可夫定理(Gauss-Markov theorem)
在古典回归模型的基本假定下,最小 二乘估计量是具有最小方差的线性 无偏估计量,具有一致性。
7
无偏性:即
^
^
E00,E11
证: ˆ1 1 ki i
E ( ˆ 1 ) E ( 1 k ii ) 1 k i E ( i ) 1
1
x12i x22i(x1ix2i)2
[( x2 2i)x1iyi][( x1ix2i)x2iyi]
[ ]y x1 2i x2 2i(x1ix2i)2
( x2 2i)x1i( x1ix2i)x2i x12i x2 2i(x1ix2i)2 i
^
( x22i)x1i( x1ix2i)x2i
参数β0的区间估计所需要的统计量:
~t(n2) ^
T 00
0
S^
0
设置信水平 1
p{T|0|t}1
2
^
^
得置信区间: ( 0t2S^0, 0t2S^0)
17
二元线性回归模型
二元线性回归模型 Y i01 X 1 i2 X 2 i u i
12
六、参数估计量的概率分布及随机扰 动项方差的估计
13
经典假设下,普通最小二乘估计的分布
^
0 0 wii
ˆ1 1 ki i
^
0~N(0,2
w2) i
^
1~N(1,2
k2) i
14
古典假设下,随机扰动项方差的估计
^
2
1
n2
ei2
^2
(n2)2 ~2(n2) (证明略)
6
2、一元线性回归模型普通最小二乘估 计量的性质
高斯—马尔可夫定理(Gauss-Markov theorem)
在古典回归模型的基本假定下,最小 二乘估计量是具有最小方差的线性 无偏估计量,具有一致性。
7
无偏性:即
^
^
E00,E11
证: ˆ1 1 ki i
E ( ˆ 1 ) E ( 1 k ii ) 1 k i E ( i ) 1
1
x12i x22i(x1ix2i)2
[( x2 2i)x1iyi][( x1ix2i)x2iyi]
[ ]y x1 2i x2 2i(x1ix2i)2
( x2 2i)x1i( x1ix2i)x2i x12i x2 2i(x1ix2i)2 i
^
( x22i)x1i( x1ix2i)x2i
参数β0的区间估计所需要的统计量:
~t(n2) ^
T 00
0
S^
0
设置信水平 1
p{T|0|t}1
2
^
^
得置信区间: ( 0t2S^0, 0t2S^0)
17
二元线性回归模型
二元线性回归模型 Y i01 X 1 i2 X 2 i u i
高级计量经济学ppt课件
p(xi,yj) =the proportion of the 1027 families who reported the combination (X=xi and Y=yj).
Table 2.1 Joint frequency distribution of X=income and Y=saving rate
-用平滑线估计总体均值,要比样本均值估计效 果更好吗? •如果经济理论表明: Y|X=X
- 如何寻找该曲线(curve)? 平滑的样本曲线 m*Y|X 仍 能告知有关 Y|X的相关信息吗?
7
二、条件分布
假设(X,Y)的联合概率密度函数( joint probability density function , pdf) 为 f(x,y) ,则
12.5 0.014 0.008 0.013 0.024 0.042 0.000 0.004 0.006 0.002 0.113
17.5 0.004 0.007 0.006 0.020 0.007 0.000 0.003 0.002 0.003 0.052 4
The conditional mean of Y given X=xi is
mY|xi
j
y j p( y j | xi )
j
yj
p(xi , y j ) p(xi )
Conditional mean function of Y on X
mY|X
Savings Rate
-0.05 0.00 0.05 0.10 0.15 0.20
0.5 1.5 2.5 3.5 4.5 5.5 6.7 8.8 12.5 17.5 Income(thousands of dollars)
Table 2.1 Joint frequency distribution of X=income and Y=saving rate
-用平滑线估计总体均值,要比样本均值估计效 果更好吗? •如果经济理论表明: Y|X=X
- 如何寻找该曲线(curve)? 平滑的样本曲线 m*Y|X 仍 能告知有关 Y|X的相关信息吗?
7
二、条件分布
假设(X,Y)的联合概率密度函数( joint probability density function , pdf) 为 f(x,y) ,则
12.5 0.014 0.008 0.013 0.024 0.042 0.000 0.004 0.006 0.002 0.113
17.5 0.004 0.007 0.006 0.020 0.007 0.000 0.003 0.002 0.003 0.052 4
The conditional mean of Y given X=xi is
mY|xi
j
y j p( y j | xi )
j
yj
p(xi , y j ) p(xi )
Conditional mean function of Y on X
mY|X
Savings Rate
-0.05 0.00 0.05 0.10 0.15 0.20
0.5 1.5 2.5 3.5 4.5 5.5 6.7 8.8 12.5 17.5 Income(thousands of dollars)
计量经济学第二章(第三部分)
3
计量经济学 第二章C
二、实际经济问题中的异方差性
比如:我们建立一个服装需求函数模型,以 服装需求量Q作为被解释变量,以收入Y,服 装价格 P0 和其他商品价格 P1 为解释变量,于 是有模型 : P Q = f ( Y , 0 ,P1 ;u) 在该模型中,气候因素没包含在解释变量里, 而是放在误差项中。但它对服装需求量Q是有 影响的,若该因素构成误差项的主要部分, 则可能产生异方差。
1 2 f(X i ) 而var( ) varui 2 , 即消除了异方差 f(X i ) f(X i ) f(X i )
29
计量经济学 第二章C
同 上
()对新模型进行 OLS 估计, 3 可得到 0, 1具有 BLUE 性质的估计量。
30
计量经济学 第二章C
2、加权最小二乘法
为WLS估计量。
32
计量经济学 第二章C
(2)利用加权最小二乘法处理异方差 假设已知 varui 2 f(X i ) ,
判断模型可能存在 复杂型异方差
14
计量经济学 第二章C
同 上
(2)以残差平方 e 2 为纵轴,某个解释变 量X为横轴,画出残差序列分布图。
15
计量经济学 第二章C
分布图
e
(1)
2
e2
(2) x x
同 上
判断模型基本不 存在异方差
e2
(3) x (4)
e2
x
(2)—(4)可能存在 异方差
16
计量经济学 第二章C
5451.91
6797.71 7869.16 5483.73 5382.91 5853.72
同 上
海南
重庆 四川
349.44
计量经济学 第二章C
二、实际经济问题中的异方差性
比如:我们建立一个服装需求函数模型,以 服装需求量Q作为被解释变量,以收入Y,服 装价格 P0 和其他商品价格 P1 为解释变量,于 是有模型 : P Q = f ( Y , 0 ,P1 ;u) 在该模型中,气候因素没包含在解释变量里, 而是放在误差项中。但它对服装需求量Q是有 影响的,若该因素构成误差项的主要部分, 则可能产生异方差。
1 2 f(X i ) 而var( ) varui 2 , 即消除了异方差 f(X i ) f(X i ) f(X i )
29
计量经济学 第二章C
同 上
()对新模型进行 OLS 估计, 3 可得到 0, 1具有 BLUE 性质的估计量。
30
计量经济学 第二章C
2、加权最小二乘法
为WLS估计量。
32
计量经济学 第二章C
(2)利用加权最小二乘法处理异方差 假设已知 varui 2 f(X i ) ,
判断模型可能存在 复杂型异方差
14
计量经济学 第二章C
同 上
(2)以残差平方 e 2 为纵轴,某个解释变 量X为横轴,画出残差序列分布图。
15
计量经济学 第二章C
分布图
e
(1)
2
e2
(2) x x
同 上
判断模型基本不 存在异方差
e2
(3) x (4)
e2
x
(2)—(4)可能存在 异方差
16
计量经济学 第二章C
5451.91
6797.71 7869.16 5483.73 5382.91 5853.72
同 上
海南
重庆 四川
349.44
计量经济学全册课件(完整)pptx
预测与置信区间
阐述如何利用一元线性回归模型进行 预测,并给出预测值的置信区间,以 评估预测的不确定性。
2024/1/28
8
多元线性回归模型
模型设定与参数估计
介绍多元线性回归模型的基本形 式,解释多个自变量对因变量的 影响,以及最小二乘法在多元线 性回归中的应用。
模型的统计性质
探讨多元线性回归模型的统计性 质,包括回归系数的解释、拟合 优度的度量、多重共线性的诊断 与处理等。
经典线性回归模型
REPORTING
2024/1/28
7
一元线性回归模型
模型设定与参数估计
介绍一元线性回归模型的基本形式, 解释因变量、自变量和误差项的含义 ,阐述最小二乘法(OLS)进行参数 估计的原理。
模型的统计性质
探讨一元线性回归模型的统计性质, 包括回归系数的解释、拟合优度的度 量(如R方)、回归系数的显著性检 验等。
贝叶斯计量经济学的定义
贝叶斯计量经济学是应用贝叶斯统计推断方法,对经济模 型进行参数估计、假设检验和预测的一门学科。
贝叶斯计量经济学的研究对象
贝叶斯计量经济学主要关注经济模型的参数估计和不确定 性问题,如线性回归模型、时间序列模型、面板数据模型 等。
贝叶斯计量经济学的研究方法
贝叶斯计量经济学的研究方法主要包括先验分布的设定、 后验分布的推导、马尔科夫链蒙特卡罗模拟(MCMC)等 。
介绍如何在EViews中导入数据,进行 数据清洗、转换和预处理等操作。
计量经济学模型估计
介绍如何在EViews中建立计量经济学 模型,进行参数估计、模型检验和预 测等操作。
24
Stata软件介绍及操作指南
Stata软件概述
Stata是一款流行的计量经济学软件,具有强大 的数据处理和统计分析功能。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0
ˆ 0
xi2 y i xi y i xi n xi2 ( xi ) 2
Q 0 ˆ β
1
ˆ n y i xi y i xi 1 n xi2 ( xi ) 2
普通最小二乘法(OLS)
随机误差项方差估计值
ˆ2 ei2 n2
i 1,2,, n
y x 其中, 被称为被解释变量, 被称为解释变 量。为随机误差项, 为观测值下标, i n为样本容量, 为待估参数。 方程被称为随机总体方程。
残差项
ˆ ei yi yi yi ( ˆ 0 β 1 xi ) β ˆ ˆ ˆ y β β x e
回归分析
总体与样本 总体回归函数 样本回归函数 回归的主要内容
总体与样本(补充)
总体(Population or Sample Space):随机试验所 有可能结果的集合,又叫样本空间。 样本点(Sample Point):样本空间的每一元素。 事件(Events):随机试验的可能结果组成的集合, 是总体的一个子集。 在理论上,总体是有限的,但在实际中很难收集每 一个信息。实践中我们所能做到的是从总体中抽 取一个“有代表性的”或“随机”的样本。
无偏性
有效性
一致性
参数估计量的性质
高斯-马尔可夫假定: 1、参数线性,总体模型可写成
yi β 0 β 1 xi ... β i xi μ i
2、随机抽样性 我们有一个含n次观测的随机样本,它来自总 体模型。 3、均值为0
E ( xi ) 0
4、不存在完全共线性 在样本(因而在总体中),没有一个自变量 是常数,自变量之间也不存在严格的线性 关系。 5、同方差性 Var ( xi ) 2 高斯-马尔可夫定理 β ˆ β 在上述假定下,ˆ 0 ,β 1 ,... ˆ i分别是β 0 ,β 1 ,... i 的 β 最优线性无偏估计量(BLUE)。
表2-1
图2-1
总体回归函数
总体回归函数(PRF)
E ( y ) β 0 β 1 x
其中, 0,1 为参数,也称为回归系数。 0 又称为截距, 1 又称为斜率。
图2-3 样本回归直线
样本回归函数
样本回归函数(SRF)
ˆ ˆ ˆ y β 0 β 1 x
y ˆ y 表示总体条件均值, 的估计量;ˆ0 , 1分别 ˆ 是 0 , 1 的估计量。
将式中
ln( 1 K 2 L )
展开台劳级数,取关于 线性近似值。
0
的线性项,即得到一个
第二节 一元线性回归 模型的参数估计
一、线性回归模型的基本假设
1、解释变量是确定性的。
2、随机干扰项均值为0。即
E ( i ) 0, i 1,2,..., n
3、随机干扰项序列同方差。即
估计量和估计值
三、最大或然法(ML)
总体回归函数
2 Var ( i )
yi β 0 β 1 xi μ i E ( i ) 0
2 i ~ N (0, )
பைடு நூலகம்
i 1,2,...n
样本回归函数
2 ˆ ˆ yi ~ N ( 0 1 xi , )
1 P(yi) e 2
~ t ( n 2)
se(Y 0 ) 这样,给定值,查表得t / 2 ,由此有: P[ t / 2
Y 0 E (Y / X 0 )
t / 2 ] 1 -
se(Y 0 ) P[Y 0 - t / 2 se(Y 0 ) E (Y / X 0 ) Y 0 t / 2 se(Y 0 )] 1 - 于是得 Y 0 平均值E (Y / X 0 )的区间估计: [Y F - t / 2 (n 2) se(Y F ), Y F t / 2 (n 2) se(Y F )]
1 2
2
ˆ ˆ ( yi 0 1 xi ) 2
三、最大或然法(ML)
最大或然法(Maximum Likelihood):选择估 ˆ ˆ 计参数 0,1 ,使得抽取该观察值的概率 最大。即:
ˆ ˆ 2 max : L( 0 , 1 , ) P(y1 , y2 ,... yi) 1
随机误差项方差估计值
1 ˆ ˆ ˆ ( yi 0 1 xi ) 2 n
2
四、参数估计量的性质
1、线性:即参数估计值是随机变量的线性函数。 2、无偏性:即参数估计值的均值和期望是否与真实 值相一致。 3、有效性(最小方差性):即求得的参数估计量小 于任何其他方法得到的估计量。 4、一致性:如果随着样本容量的增加,估计量越来 越接近于真实值,则称估计量是真实值的一致估 计。
ln Q ln A ln K ln L
线性回归模型的普遍性
3、级数展开 CES生产函数将产出量与投入要素之间的关系描述为如下形 式
Q A( 1 K 2 L )
1
( 1 2 1)
方程两边取对数后,得到 1 ln Q ln A ln( 1 K 2 L )
s a br cr , c 0
2
可以用
x1 r , x2 r
2
进行置换,将方程变成
s a bx1 cx2 , c 0
线性回归模型的普遍性
2、对数变换 C-D生产函数将产出量与投入要素之间的关系描述为幂函数 的形式
Q AK L
方程两边取对数后,即成为一个线性形式
回归的主要内容
根据样本观察值确定样本回归方程 检验样本回归方程对总体回归方程的近似 程度 利用样本回归方程分析总体的平均变化规 律
模型的随机设定
随机误差项 残差项 产生随机误差项的原因
随机误差项
μ i yi E ( yi ) yi 0 β 1 xi β yi β 0 β 1 xi μ i
2 Var ( i ) , i 1,2,..., n
5、随机干扰项序列不相关。即
Cov( i , j ) 0, i j
i, j 1,2,..., n
6、随机干扰项与解释变量之间不相关。即
Cov( x ji , i ) 0, j 1,2..., k , i 1,2..., n
图2-5 异方差
图2-6 自相关
无自相关
正的自相关
负的自相关
普通最小二乘法 参数估计量的性质
二、普通最小二乘法(OLS)
复习: 总体回归函数
yi β 0 β 1 xi μ i
样本回归函数
ˆ ˆ yi β 0 β 1 xi ei
ˆ ei=yi yi
残差项
图2-3 样本回归直线
基本思想 (1)计量经济预测是利用所估计的样本回归模型,用 解释变量的已知值或预测值,对预测期或样本以 外的应变量作出定量的估计。 (2)计量经济预测是一种条件预测: 条件:a.所估计参数不变 b.模型设定关系不变 c.解释变量在预测期的取值已作出预测
一、 点预测:
将解释变量预测值直接代入估计的方程:
第三节 一元线性回归模型的统计检验
拟合优度检验 变量的显著性检验 参数的置信区间
一、拟合优度的检验
1、总离差平方和TSS 2、回归平方和ESS 3、残差平方和RSS
TSS=RSS+ESS
二、变量显著性的检验
目的:解释变量与被解释变量之间的线性 关系是否显著成立。 基本思想:“小概率事件在一次事件中几 乎是不可能发生的”,反证法 H0下构造一个小概率事件, -拒绝H0 ,小概率事件没有出现 -接受H0 ,小概率事件出现了 检验方法:F检验,t检验,z检验
普通最小二乘法(OLS)
最小二乘法(Ordinary Least Squares):选 ˆ ˆ 择估计参数 0,1 ,使得全部观察值的残 差平方和最小。即:
ˆi )2 min : Q ei = ( yi y
2
为什么是平 方和?
普通最小二乘法(OLS)
求解步骤: 参数估计值
Q 0 ˆ β
n (2 ) n 2
e
( yi ˆ0 ˆ1xi ) 2 2 2
1
三、最大或然法(ML)
求解步骤 参数估计值
0
ˆ 0
Q 0 ˆ β
xi2 y i xi y i xi n xi2 ( xi ) 2
ˆ n y i xi y i xi 1 n xi2 ( xi ) 2
7、随机干扰项服从正态分布。 即
2 i ~ N (0, ), i 1,2,..., n 8、解释变量之间不相关,无多重共线性。
9、随着样本容量的无限增加,解释变量的样 本方差趋于一个有限常数,即
( X i X )2 n Q, n
10、回归模型是正确设定的。
图2-4 同方差
Y 0 0 1 X0
计算的 Y0 是一个点估计值。
二、区间预测:
1、总体条件均值预测值的置信区间 2、总体个别预测值的置信区间
1、总体条件均值预测值的置信区间
Y F 作为总体真实平均值E (YF / X F )估计是有误差的, 它本身也是随机变量,服从正态分布。 1 ( X 0 X )2 可证 Y 0 ~N(E (Y / X 0 ), 2 [ ]) , 2 n xi
t 检验图示
ˆ 0
xi2 y i xi y i xi n xi2 ( xi ) 2
Q 0 ˆ β
1
ˆ n y i xi y i xi 1 n xi2 ( xi ) 2
普通最小二乘法(OLS)
随机误差项方差估计值
ˆ2 ei2 n2
i 1,2,, n
y x 其中, 被称为被解释变量, 被称为解释变 量。为随机误差项, 为观测值下标, i n为样本容量, 为待估参数。 方程被称为随机总体方程。
残差项
ˆ ei yi yi yi ( ˆ 0 β 1 xi ) β ˆ ˆ ˆ y β β x e
回归分析
总体与样本 总体回归函数 样本回归函数 回归的主要内容
总体与样本(补充)
总体(Population or Sample Space):随机试验所 有可能结果的集合,又叫样本空间。 样本点(Sample Point):样本空间的每一元素。 事件(Events):随机试验的可能结果组成的集合, 是总体的一个子集。 在理论上,总体是有限的,但在实际中很难收集每 一个信息。实践中我们所能做到的是从总体中抽 取一个“有代表性的”或“随机”的样本。
无偏性
有效性
一致性
参数估计量的性质
高斯-马尔可夫假定: 1、参数线性,总体模型可写成
yi β 0 β 1 xi ... β i xi μ i
2、随机抽样性 我们有一个含n次观测的随机样本,它来自总 体模型。 3、均值为0
E ( xi ) 0
4、不存在完全共线性 在样本(因而在总体中),没有一个自变量 是常数,自变量之间也不存在严格的线性 关系。 5、同方差性 Var ( xi ) 2 高斯-马尔可夫定理 β ˆ β 在上述假定下,ˆ 0 ,β 1 ,... ˆ i分别是β 0 ,β 1 ,... i 的 β 最优线性无偏估计量(BLUE)。
表2-1
图2-1
总体回归函数
总体回归函数(PRF)
E ( y ) β 0 β 1 x
其中, 0,1 为参数,也称为回归系数。 0 又称为截距, 1 又称为斜率。
图2-3 样本回归直线
样本回归函数
样本回归函数(SRF)
ˆ ˆ ˆ y β 0 β 1 x
y ˆ y 表示总体条件均值, 的估计量;ˆ0 , 1分别 ˆ 是 0 , 1 的估计量。
将式中
ln( 1 K 2 L )
展开台劳级数,取关于 线性近似值。
0
的线性项,即得到一个
第二节 一元线性回归 模型的参数估计
一、线性回归模型的基本假设
1、解释变量是确定性的。
2、随机干扰项均值为0。即
E ( i ) 0, i 1,2,..., n
3、随机干扰项序列同方差。即
估计量和估计值
三、最大或然法(ML)
总体回归函数
2 Var ( i )
yi β 0 β 1 xi μ i E ( i ) 0
2 i ~ N (0, )
பைடு நூலகம்
i 1,2,...n
样本回归函数
2 ˆ ˆ yi ~ N ( 0 1 xi , )
1 P(yi) e 2
~ t ( n 2)
se(Y 0 ) 这样,给定值,查表得t / 2 ,由此有: P[ t / 2
Y 0 E (Y / X 0 )
t / 2 ] 1 -
se(Y 0 ) P[Y 0 - t / 2 se(Y 0 ) E (Y / X 0 ) Y 0 t / 2 se(Y 0 )] 1 - 于是得 Y 0 平均值E (Y / X 0 )的区间估计: [Y F - t / 2 (n 2) se(Y F ), Y F t / 2 (n 2) se(Y F )]
1 2
2
ˆ ˆ ( yi 0 1 xi ) 2
三、最大或然法(ML)
最大或然法(Maximum Likelihood):选择估 ˆ ˆ 计参数 0,1 ,使得抽取该观察值的概率 最大。即:
ˆ ˆ 2 max : L( 0 , 1 , ) P(y1 , y2 ,... yi) 1
随机误差项方差估计值
1 ˆ ˆ ˆ ( yi 0 1 xi ) 2 n
2
四、参数估计量的性质
1、线性:即参数估计值是随机变量的线性函数。 2、无偏性:即参数估计值的均值和期望是否与真实 值相一致。 3、有效性(最小方差性):即求得的参数估计量小 于任何其他方法得到的估计量。 4、一致性:如果随着样本容量的增加,估计量越来 越接近于真实值,则称估计量是真实值的一致估 计。
ln Q ln A ln K ln L
线性回归模型的普遍性
3、级数展开 CES生产函数将产出量与投入要素之间的关系描述为如下形 式
Q A( 1 K 2 L )
1
( 1 2 1)
方程两边取对数后,得到 1 ln Q ln A ln( 1 K 2 L )
s a br cr , c 0
2
可以用
x1 r , x2 r
2
进行置换,将方程变成
s a bx1 cx2 , c 0
线性回归模型的普遍性
2、对数变换 C-D生产函数将产出量与投入要素之间的关系描述为幂函数 的形式
Q AK L
方程两边取对数后,即成为一个线性形式
回归的主要内容
根据样本观察值确定样本回归方程 检验样本回归方程对总体回归方程的近似 程度 利用样本回归方程分析总体的平均变化规 律
模型的随机设定
随机误差项 残差项 产生随机误差项的原因
随机误差项
μ i yi E ( yi ) yi 0 β 1 xi β yi β 0 β 1 xi μ i
2 Var ( i ) , i 1,2,..., n
5、随机干扰项序列不相关。即
Cov( i , j ) 0, i j
i, j 1,2,..., n
6、随机干扰项与解释变量之间不相关。即
Cov( x ji , i ) 0, j 1,2..., k , i 1,2..., n
图2-5 异方差
图2-6 自相关
无自相关
正的自相关
负的自相关
普通最小二乘法 参数估计量的性质
二、普通最小二乘法(OLS)
复习: 总体回归函数
yi β 0 β 1 xi μ i
样本回归函数
ˆ ˆ yi β 0 β 1 xi ei
ˆ ei=yi yi
残差项
图2-3 样本回归直线
基本思想 (1)计量经济预测是利用所估计的样本回归模型,用 解释变量的已知值或预测值,对预测期或样本以 外的应变量作出定量的估计。 (2)计量经济预测是一种条件预测: 条件:a.所估计参数不变 b.模型设定关系不变 c.解释变量在预测期的取值已作出预测
一、 点预测:
将解释变量预测值直接代入估计的方程:
第三节 一元线性回归模型的统计检验
拟合优度检验 变量的显著性检验 参数的置信区间
一、拟合优度的检验
1、总离差平方和TSS 2、回归平方和ESS 3、残差平方和RSS
TSS=RSS+ESS
二、变量显著性的检验
目的:解释变量与被解释变量之间的线性 关系是否显著成立。 基本思想:“小概率事件在一次事件中几 乎是不可能发生的”,反证法 H0下构造一个小概率事件, -拒绝H0 ,小概率事件没有出现 -接受H0 ,小概率事件出现了 检验方法:F检验,t检验,z检验
普通最小二乘法(OLS)
最小二乘法(Ordinary Least Squares):选 ˆ ˆ 择估计参数 0,1 ,使得全部观察值的残 差平方和最小。即:
ˆi )2 min : Q ei = ( yi y
2
为什么是平 方和?
普通最小二乘法(OLS)
求解步骤: 参数估计值
Q 0 ˆ β
n (2 ) n 2
e
( yi ˆ0 ˆ1xi ) 2 2 2
1
三、最大或然法(ML)
求解步骤 参数估计值
0
ˆ 0
Q 0 ˆ β
xi2 y i xi y i xi n xi2 ( xi ) 2
ˆ n y i xi y i xi 1 n xi2 ( xi ) 2
7、随机干扰项服从正态分布。 即
2 i ~ N (0, ), i 1,2,..., n 8、解释变量之间不相关,无多重共线性。
9、随着样本容量的无限增加,解释变量的样 本方差趋于一个有限常数,即
( X i X )2 n Q, n
10、回归模型是正确设定的。
图2-4 同方差
Y 0 0 1 X0
计算的 Y0 是一个点估计值。
二、区间预测:
1、总体条件均值预测值的置信区间 2、总体个别预测值的置信区间
1、总体条件均值预测值的置信区间
Y F 作为总体真实平均值E (YF / X F )估计是有误差的, 它本身也是随机变量,服从正态分布。 1 ( X 0 X )2 可证 Y 0 ~N(E (Y / X 0 ), 2 [ ]) , 2 n xi
t 检验图示