面板数据模型形式的选择(张晓峒讲稿PPT)
合集下载
面板数据模型PPT
(9) (10)
计算步骤:
计量经济学,面板数据模型,1王7 少平
▪ 引入虚拟变量:
▪ ▪
D i,i1,2,L,N
D i 1 表示第i个观测个体 D i 0 表示不是第i个观测个体。
则模型(10)可表述为:
Y i t0 1 D 1 N D N 1 X i tu it
(11)
▪ 为解决虚拟变量的完全多重共线性,可直接估计模型:
计量经济学,面板数据模型,1王9 少平
四、静态面板-随机效应GLS估计
Yit 12X2it LkXkit it it i t uit
i1,2,L,N t1,2,L,T
(14)
随机效应:个体效应或时间效应与模型中的解释变量不相关
OLS估计量:
无偏的,但估计量有较大的方差。
本质问题:
个体(或时间)效应导致了误差项自相关。
数协方差矩阵估计量; ˆ R ,ˆ R 分别为回归系数的GLS估计系数,估计系数
协方差矩阵估计量。
计量经济学,面板数据模型,2王3 少平
五、Hausman检验
若随机效应为真时,豪斯曼检验统计量:
H~2(K)
自由度K为模型中解释变量(不包括截距项)的个数。
计量经济学,面板数据模型,2王4 少平
(3)
计量经济学,面板数据模型,1王0 少平
三、面板数据模型及其分类
动态面板数据模型
Yit 1 X 2 2it LkXkit Yit1it it i t uit
i1,2,L,N t1,2,L,T
(4)
例如:
Iit12F it3 C itIit 1it u it (5)
i 1 ,2 ,L,N t 1 ,2 ,L,T
面板数据分析方法 ppt课件
(14.1.3)
it i t uit
i 1,2, N t 1,2,T
面板数据:多个观测对象的时间序列数据所组 成的样本数据。
i 反映不随时间变化的个体上的差异性,
被称为个体效应
t 反映不随个体变化的时间上的差异性,
被称为时间效应。
ppt课件 33
第二节 面板数据的模型形式
11,000 10,000 9,000 8,000 7,000 6,000 5,000 4,000 3,000 IP 2,000 3,000 5,000 7,000 9,000 11,000 13,000 CP_1996 CP_1997 CP_1998 CP_1999 CP_2000 CP_2001 CP_2002
安徽 北京 福建 河北 黑龙江 吉林 江苏 江西 辽宁 内蒙古 山东 上海 山西 天津 浙江
14000 12000 10000 8000 6000 4000 2000 0 1996 1997 1998 1999 2000 2001
浙江 山西 山东 辽宁 江苏
山西
14000 12000 10000 8000 6000 4000 2000
ppt课件
16
二、面板数据的分类
2.微观面板数据与宏观面板数据 微观面板数据一般指一段时期内不同个体或者家庭 的调查数据,其数据中往往个体单位较多,即 N较大( 通常均为几百或上千)而时期数 T较短(最短为两个时 期,最长一般不超过20个时期)。
ppt课件
17
二、面板数据的分类
2.微观面板数据与宏观面板数据 宏观面板数据通常为一段时间内不同国家或地区的 数据集合,其个体单位数量N不大(一般为7-200)而时 期数T较长(一般为20-60年)。
it i t uit
i 1,2, N t 1,2,T
面板数据:多个观测对象的时间序列数据所组 成的样本数据。
i 反映不随时间变化的个体上的差异性,
被称为个体效应
t 反映不随个体变化的时间上的差异性,
被称为时间效应。
ppt课件 33
第二节 面板数据的模型形式
11,000 10,000 9,000 8,000 7,000 6,000 5,000 4,000 3,000 IP 2,000 3,000 5,000 7,000 9,000 11,000 13,000 CP_1996 CP_1997 CP_1998 CP_1999 CP_2000 CP_2001 CP_2002
安徽 北京 福建 河北 黑龙江 吉林 江苏 江西 辽宁 内蒙古 山东 上海 山西 天津 浙江
14000 12000 10000 8000 6000 4000 2000 0 1996 1997 1998 1999 2000 2001
浙江 山西 山东 辽宁 江苏
山西
14000 12000 10000 8000 6000 4000 2000
ppt课件
16
二、面板数据的分类
2.微观面板数据与宏观面板数据 微观面板数据一般指一段时期内不同个体或者家庭 的调查数据,其数据中往往个体单位较多,即 N较大( 通常均为几百或上千)而时期数 T较短(最短为两个时 期,最长一般不超过20个时期)。
ppt课件
17
二、面板数据的分类
2.微观面板数据与宏观面板数据 宏观面板数据通常为一段时间内不同国家或地区的 数据集合,其个体单位数量N不大(一般为7-200)而时 期数T较长(一般为20-60年)。
课件:混合面板数据模型
容
2021/6/10
财大 面板数据与非参数计量 Ch2 混合 面板数据模型
11
Ch2 混合面板数据模型
• Ch2.1 混合面板数据模型及估计 • Ch2.2 模型设定检验 • Ch2.3 案例分析
2021/6/10
财大 面板数据与非参数计量 Ch2 混合 面板数据模型
12
Ch2.3 案例分析
• 请参见 • 第三、四章中的案例分析
•
第八章 微观面板数据模型(离散选择模型、
Tobit模型)
• 下篇 非平稳面板数据模型
•
第五章 面板单位根检验(第一、二、三代单位检验)
•
2021/6/10
第六章 面财板大 面协板数整据与检非参验数计量与Ch误2 混合差修正模型 面板数据模型
2
Ch2 混合面板数据模型
张华节 统计学院 Email:hjzhang@
财大 面板数据与非参数计量 Ch2 混合 面板数据模型
9
Ch2 混合面板数据模型
• Ch2.1 混合面板数据模型及估计 • Ch2.2 模型设定检验 • Ch2.3 案例分析
2021/6/10
财大 面板数据与非参数计量 Ch2 混合 面板数据模型
10
Ch2.2 模型设定检验
• 与固定效应和随机效应检验结合判断。 • 具体内容,请参见 • 综合第三、四章关于模型检验中的部分内
8
• 对混合模型通常采用的是混合最小二乘 (Pooled OLS)估计法。
• 然而,在误差项服从独立同分布条件下由 OLS法得到的方差协方差矩阵,在这里通 常不会成立。
• 因为对于每个个体 i 及其误差项来说通常
是序列相关的。NT个相关观测值要比 NT
2021/6/10
财大 面板数据与非参数计量 Ch2 混合 面板数据模型
11
Ch2 混合面板数据模型
• Ch2.1 混合面板数据模型及估计 • Ch2.2 模型设定检验 • Ch2.3 案例分析
2021/6/10
财大 面板数据与非参数计量 Ch2 混合 面板数据模型
12
Ch2.3 案例分析
• 请参见 • 第三、四章中的案例分析
•
第八章 微观面板数据模型(离散选择模型、
Tobit模型)
• 下篇 非平稳面板数据模型
•
第五章 面板单位根检验(第一、二、三代单位检验)
•
2021/6/10
第六章 面财板大 面协板数整据与检非参验数计量与Ch误2 混合差修正模型 面板数据模型
2
Ch2 混合面板数据模型
张华节 统计学院 Email:hjzhang@
财大 面板数据与非参数计量 Ch2 混合 面板数据模型
9
Ch2 混合面板数据模型
• Ch2.1 混合面板数据模型及估计 • Ch2.2 模型设定检验 • Ch2.3 案例分析
2021/6/10
财大 面板数据与非参数计量 Ch2 混合 面板数据模型
10
Ch2.2 模型设定检验
• 与固定效应和随机效应检验结合判断。 • 具体内容,请参见 • 综合第三、四章关于模型检验中的部分内
8
• 对混合模型通常采用的是混合最小二乘 (Pooled OLS)估计法。
• 然而,在误差项服从独立同分布条件下由 OLS法得到的方差协方差矩阵,在这里通 常不会成立。
• 因为对于每个个体 i 及其误差项来说通常
是序列相关的。NT个相关观测值要比 NT
第4讲面板数据模型-PPT文档资料
第4讲 面板数据模型
计量经济学
Econometrics
李平
2019年1月
© School of Management, 2005
第4讲 面板数据模型
主要内容
面板数据(Panel data) 固定效应 随机效应 固定效应和随机效应模型的比较
© School of Management, 2005
若所有的级差截距和基础斜率系数都显著,就可 以得出结论:4家公司的投资函数各不相同,从而 说明这4家公司的数据不能一视同仁,而要区别对 待,单独估计每家公司的X对Y的影响关系
© School of Management, 2005
© School of Management, 2005
第4讲 面板数据模型
混合回归(PLS)
所有系数都不随时间和个体的变化而变化
Y X Xu 1 2 2 3 3
直接用OLS估计
© School of Management, 2005
双击
单击
存在的问题:假设4家不同的公司的截距项和斜率系数 都完全相同,这是相当严格的假设,很可能扭曲了4个 公司Y和X之间关系的真实情况
© School of Management, 2005
例子:投资理论研究
为研究实际总投资(I)对实际资本存量(CAP)和企业 实际价值(PL)的关系,收集了4个公司,即通用电气 (GE)、通用汽车(GM)、美国钢铁(US)和西屋 (WEST),20年(1935-1954)的数据,共80个观测值。
1 9 22 i t 33 i t i t
D U M 5 3 X Xu
U M 3 5 , D U M 3 6 , . . . , D U M 3 5 其中 D 表示时间虚拟变量, 0 表示将1954年的截距项作为基准 由于考虑了回归模型随时间的改变,因此称为时间效 应模型(一个问题:自由度的损失)
计量经济学
Econometrics
李平
2019年1月
© School of Management, 2005
第4讲 面板数据模型
主要内容
面板数据(Panel data) 固定效应 随机效应 固定效应和随机效应模型的比较
© School of Management, 2005
若所有的级差截距和基础斜率系数都显著,就可 以得出结论:4家公司的投资函数各不相同,从而 说明这4家公司的数据不能一视同仁,而要区别对 待,单独估计每家公司的X对Y的影响关系
© School of Management, 2005
© School of Management, 2005
第4讲 面板数据模型
混合回归(PLS)
所有系数都不随时间和个体的变化而变化
Y X Xu 1 2 2 3 3
直接用OLS估计
© School of Management, 2005
双击
单击
存在的问题:假设4家不同的公司的截距项和斜率系数 都完全相同,这是相当严格的假设,很可能扭曲了4个 公司Y和X之间关系的真实情况
© School of Management, 2005
例子:投资理论研究
为研究实际总投资(I)对实际资本存量(CAP)和企业 实际价值(PL)的关系,收集了4个公司,即通用电气 (GE)、通用汽车(GM)、美国钢铁(US)和西屋 (WEST),20年(1935-1954)的数据,共80个观测值。
1 9 22 i t 33 i t i t
D U M 5 3 X Xu
U M 3 5 , D U M 3 6 , . . . , D U M 3 5 其中 D 表示时间虚拟变量, 0 表示将1954年的截距项作为基准 由于考虑了回归模型随时间的改变,因此称为时间效 应模型(一个问题:自由度的损失)
面板数据模型选择-张晓桐
关系的面板数据研究 案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究 :
个省级地区(不包括重庆、西藏和港澳台地区) 以中国 29 个省级地区(不包括重庆、西藏和港澳台地区)1995-2006 年间 12 年的面板数据来对我国的经济增长与环境问题做出分析, 年的面板数据来对我国的经济增长与环境问题做出分析,所选数据均为平衡 面板数据, 组数据。 其中, RGDP 表示人均国内生产总值 单位: ) 面板数据, 348 组数据。 共 其中, (单位: 元 , SO2 表示工业二氧化硫排放量(单位:吨)。用 BJ、TJ、HEB、SX、NMG、 表示工业二氧化硫排放量(单位: )。用 、 、 、 、 、 LN、JL、HLJ、SH、JS、ZJ、AH、FJ、JX、SD、HEN、HUB、HUN、 、 、 、 、 、 、 、 、 、 、 、 、 、 GD、GX、HAN、SC、GZ、YN、SHX、GS、QH、NX、XJ 分别表示北京、 、 、 、 、 、 、 、 、 、 、 分别表示北京、 天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、 天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、安 徽、福建、江西、山东、河南、湖北、湖南、广东、广西、海南、四川、贵 福建、江西、山东、河南、湖北、湖南、广东、广西、海南、四川、 云南、陕西、甘肃、青海、宁夏、新疆。 州、云南、陕西、甘肃、青海、宁夏、新疆。 各地区 1995-2006 的人均国内生产总值和工业二氧化硫排放量数据均来 中国统计年鉴》。 自于 1996-2007 年《中国统计年鉴》。
关系的面板数据研究 案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究 :
线性混合模型估计结果是 线性混合模型估计结果是 SO2it = 557081.4 + 1.1111 RGDPit (16.0) (0.4) ) ) R2 = 0.0005,DW=0.11, N×T= 29×12= 348 , × × 说明二氧化硫排放量 二氧化硫排放量( 人均国内生产总值( 之间不 说明二氧化硫排放量(SO2it, 吨)与人均国内生产总值(RGDPit, 元)之间不 知数据一定非常散。 存在线性关系。 存在线性关系。由可决系数 R2 = 0.0005 知数据一定非常散。 二次多项式混合模型估计结果是 SO2it = 423499.3 + 23.4691 RGDP it - 0.00055 RGDP it 2 (8.0) (3.2) ) ) (-3.3) ) R2 = 0.0315,DW=0.12, N×T= 29×12= 348 , × × 说明二氧化硫排放量 二氧化硫排放量( 人均国内生产总值( 说明二氧化硫排放量(SO2it)与人均国内生产总值(RGDPit)有可能存在二 知数据一定非常散。 次非线性关系。 次非线性关系。由可决系数 R2 = 0.0315 知数据一定非常散。 据此就可以建立二次多项式形式的面板数据模型吗 首先分析数据散点图 分析数据散点图。 据此就可以建立二次多项式形式的面板数据模型吗?首先分析数据散点图。
张晓峒面板数据eviews
2.面板数据模型分类
对于个体固定效应模型,个体效应i 未知,E(i Xit)随 Xit 而变化,但不知
怎样与 Xit 变化,所以 E(yit Xit)不可识别。对于短期面板数据,个体固定效应
模型是正确设定的,的混合 OLS 估计量不具有一致性。
下面解释设定个体固定效应模型的原因。假定有面板数据模型
1.面板数据定义 面板数据分两种特征:(1)个体数少,时间长。(2)个体数多,时间短。
面板数据主要指后一种情形。 面板数据用双下标变量表示。例如
yi t, i = 1, 2, …, N; t = 1, 2, …, T i 对应面板数据中不同个体。N 表示面板数据中含有 N 个个体。t 对应面板数据 中不同时点。T 表示时间序列的最大长度。若固定 t 不变,yi ., ( i = 1, 2, …, N)是
横截面上的 N 个随机变量;若固定 i 不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个
时间序列(个体)。 对于面板数据 yi t, i = 1, 2, …, N; t = 1, 2, …, T,如果每个个体在相同的时期
内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。 若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平 衡面板数据(unbalanced panel data)。
9.2
LOG(CP1999)
9.0
8.8
6000
8.6
5000
8.4
4000
8.2
3000 2000
IP
8.0
2000 4000 6000 8000 10000 12000 14000 7.8
IPCROSS
面板数据模型PPT课件
第5页/共99页
浙江 山西 山东 辽宁 江苏 黑龙江 福建 安徽 1996 1998 2000 2002
14000 12000 10000 8000 6000 4000 2000 0
安徽 北京 福建 河北 黑龙江 吉林 江苏 江西 辽宁 内蒙古 山东 上海 山西 天津 浙江
面板数据散点图 15 个地区 7 年人均消费对收入的面板数据散点图见图 6 和图 7。
9000
8000
7000
6000
5000
4000
3000
2000 2000 4000 6000 8000
IP_T 10000 12000 14000
图8 图9
第8页/共99页
2.面板数据模型分类 用面板数据建立的模型通常有 3 种,即混合模型、固定效应模型和随机效应模型。 2.1 混合模型(Pooled model)。 如果一个面板数据模型定义为,
注意: (1)在 EViews 输出结果中i 是以一个不变的常数部分和随个体变化的部分相加而成。 (2)在 EViews 5.0 以上版本个体固定效应对话框中的回归因子选项中填不填 c 输出结 果都会有固定常数项。
第11页/共99页
第4章 面板数据模型
2.2.1 个体固定效应模型(entity fixed effects model)
如果模型是正确设定的,解释变量与误差项不相关,即 Cov(Xit,it) = 0。那么无论是 N,还是 T,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。
以案例 1(file:5panel02)为例得到的混合模型估计结果如下:
LnCPit = 0.0187 + 0.9694 LnIPit +it (0.2) (79.2) R2 = 0.984, SSE = 0.1702, DW = 0.62
浙江 山西 山东 辽宁 江苏 黑龙江 福建 安徽 1996 1998 2000 2002
14000 12000 10000 8000 6000 4000 2000 0
安徽 北京 福建 河北 黑龙江 吉林 江苏 江西 辽宁 内蒙古 山东 上海 山西 天津 浙江
面板数据散点图 15 个地区 7 年人均消费对收入的面板数据散点图见图 6 和图 7。
9000
8000
7000
6000
5000
4000
3000
2000 2000 4000 6000 8000
IP_T 10000 12000 14000
图8 图9
第8页/共99页
2.面板数据模型分类 用面板数据建立的模型通常有 3 种,即混合模型、固定效应模型和随机效应模型。 2.1 混合模型(Pooled model)。 如果一个面板数据模型定义为,
注意: (1)在 EViews 输出结果中i 是以一个不变的常数部分和随个体变化的部分相加而成。 (2)在 EViews 5.0 以上版本个体固定效应对话框中的回归因子选项中填不填 c 输出结 果都会有固定常数项。
第11页/共99页
第4章 面板数据模型
2.2.1 个体固定效应模型(entity fixed effects model)
如果模型是正确设定的,解释变量与误差项不相关,即 Cov(Xit,it) = 0。那么无论是 N,还是 T,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。
以案例 1(file:5panel02)为例得到的混合模型估计结果如下:
LnCPit = 0.0187 + 0.9694 LnIPit +it (0.2) (79.2) R2 = 0.984, SSE = 0.1702, DW = 0.62
01面板数据分析PPT课件
12 i
变截距模型:
12 i
24
最简单的模型就是忽略数据集中每个横截 面个体可能有的特殊效应,而简单的将模 型视为横截面数据堆积的模型,即混合横 截面模型。 注意:尽管我们可以将横截面数据简单的 堆积起来用普通回归模型进行处理,但此 时丧失了分析个体特殊效应的机会。
25
2. 面板数据模型的设定检验
检验统计量:
F (S S R R S S R U R )/k S S R U R/(n 1 n 2 2 k)
F (k,n 1 n 2 2 k)
31
面板数据模型的设定检验
假定模型1、2和3的残差分别为S2、S3和S1。 构造F统计量
F 1 ( S S 1 2 /[ N S T 1 ) /[N (N (k 1 ) 1 k )] ] F [(N 1 )k ,N (T k 1 )] F 2 ( S 3 S 1 / S [ 1 N ) T /[ ( N N ( 1 k ) ( k 1 ) ] 1 ) ]F [ ( N 1 ) ( k 1 ) ,N ( T k 1 ) ]
H2 :1 2 N
1 2 N
26
检验步骤:
首先对假设H2进行检验,如果H2成立,则无 需进行下一步检验,并选择模型(2);
如果拒绝H2 ,则需对假设H1进行检验; 如果拒绝H1 ,则选择模型(3);如果不能拒绝
假设H1 ,则选择模型(1);
检验思路:
以Chow检验为基础;
27
Chow检验
;
有N个横截面,即
;
时间指标
。
变量: ——因变量在横截面i和时间t上的观测值;
——第k个解释变量在横截面i和时间t上的观测值;
第i个横截面的数据为
其中 是在横截面i和时间t上的随机误差项。
变截距模型:
12 i
24
最简单的模型就是忽略数据集中每个横截 面个体可能有的特殊效应,而简单的将模 型视为横截面数据堆积的模型,即混合横 截面模型。 注意:尽管我们可以将横截面数据简单的 堆积起来用普通回归模型进行处理,但此 时丧失了分析个体特殊效应的机会。
25
2. 面板数据模型的设定检验
检验统计量:
F (S S R R S S R U R )/k S S R U R/(n 1 n 2 2 k)
F (k,n 1 n 2 2 k)
31
面板数据模型的设定检验
假定模型1、2和3的残差分别为S2、S3和S1。 构造F统计量
F 1 ( S S 1 2 /[ N S T 1 ) /[N (N (k 1 ) 1 k )] ] F [(N 1 )k ,N (T k 1 )] F 2 ( S 3 S 1 / S [ 1 N ) T /[ ( N N ( 1 k ) ( k 1 ) ] 1 ) ]F [ ( N 1 ) ( k 1 ) ,N ( T k 1 ) ]
H2 :1 2 N
1 2 N
26
检验步骤:
首先对假设H2进行检验,如果H2成立,则无 需进行下一步检验,并选择模型(2);
如果拒绝H2 ,则需对假设H1进行检验; 如果拒绝H1 ,则选择模型(3);如果不能拒绝
假设H1 ,则选择模型(1);
检验思路:
以Chow检验为基础;
27
Chow检验
;
有N个横截面,即
;
时间指标
。
变量: ——因变量在横截面i和时间t上的观测值;
——第k个解释变量在横截面i和时间t上的观测值;
第i个横截面的数据为
其中 是在横截面i和时间t上的随机误差项。
最新第六章面板数据模型精品课件
第三页,共49页。
1996-2002年中国15个省级地区的居民家庭人均收入数据(shùjù)(不变价格)
bǎn)数据示意图
第五页,共49页。
人均消费和收入的面板数据从纵剖面观察分别见 图2和图3。从横截面观察分别见图4和图5。用CP表示 (biǎoshì)消费,IP表示(biǎoshì)收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示 (biǎoshì)安徽省、北京市、福建省、河北省、黑龙江 省、吉林省、江苏省、江西省、辽宁省、内蒙古自治 区、山东省、上海市、山西省、天津市、浙江省。
(2)
第十八页,共49页。
(2) 随机效应模型(random effects model)
如果个体效应存在,但我们假设其与解释变量 不
相关,即 cov(Zi*, X kit ) 0, k 1, 2,..., K ,
那么Yi我t 们可i 以(k1ěXyǐ1)i建t 立以2 X下2i随t 机,..效., 应模K 型X :Kit it
YˆitF
ˆi
X
F it
' ˆ,i
1,..., n,t
注意:固定效应模型是不能进行(jìnxíng)个体外样本外预测的
第二十五页,共49页。
二. 面板数据模型的估计
1. 混合普通最小二乘估计(Pool OLS)
Pool OLS是针对于混合模型的估计方法:
对于混合模型直接使用OLS进行估计
NT
(ˆ, ˆ) arg min( , i1
4. 面板数据模型的预测(yùcè)
对于给定的解释变量
X
F it
,在对模型参数进行估计的基
1996-2002年中国15个省级地区的居民家庭人均收入数据(shùjù)(不变价格)
bǎn)数据示意图
第五页,共49页。
人均消费和收入的面板数据从纵剖面观察分别见 图2和图3。从横截面观察分别见图4和图5。用CP表示 (biǎoshì)消费,IP表示(biǎoshì)收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示 (biǎoshì)安徽省、北京市、福建省、河北省、黑龙江 省、吉林省、江苏省、江西省、辽宁省、内蒙古自治 区、山东省、上海市、山西省、天津市、浙江省。
(2)
第十八页,共49页。
(2) 随机效应模型(random effects model)
如果个体效应存在,但我们假设其与解释变量 不
相关,即 cov(Zi*, X kit ) 0, k 1, 2,..., K ,
那么Yi我t 们可i 以(k1ěXyǐ1)i建t 立以2 X下2i随t 机,..效., 应模K 型X :Kit it
YˆitF
ˆi
X
F it
' ˆ,i
1,..., n,t
注意:固定效应模型是不能进行(jìnxíng)个体外样本外预测的
第二十五页,共49页。
二. 面板数据模型的估计
1. 混合普通最小二乘估计(Pool OLS)
Pool OLS是针对于混合模型的估计方法:
对于混合模型直接使用OLS进行估计
NT
(ˆ, ˆ) arg min( , i1
4. 面板数据模型的预测(yùcè)
对于给定的解释变量
X
F it
,在对模型参数进行估计的基
演示文稿第九章面板数据模型
第34页,共49页。
变系数模型的一般形式如下:
K
yit 0 ki xkit uit , uit i t it k 1
ki 为变系数,反映模型结构随截面的变化而变化。
类似于变截距模型,变系数模型也分为固定影响 变系数模型和随机影响变系数模型两种类型。
第35页,共49页。
EViews按下列步骤估计变系数模型:
第8页,共49页。
4. 计数面板模型: 被解释变量是计数面板数据的例子很多。例如 ,一段时间内一家公司的竟标次数、一个人去 看医生的次数、每天吸烟者的数量及一个研发 机构登记专利的数目。虽然可以运用传统面板 回归模型对计数面板数据建模,但鉴于被解释 变量具有0及非负离散取值的特征,运用泊松 面板回归模型建模更为合适。
我们就称这种个时体间效应是固定效应。反之,如果
个时体间效应 ti 与模型中的解释变量是不相关的,我
们称之为随机效应。
第19页,共49页。
第三节 混合回归模型
一、混合回归模型 从时间上看,不同年份之间不存在显著性差异; 从截面上看,不同个体之间也不存在显著性差异 ,那么就可以直接把面板数据混合在一起(相当于 将多个时期的截面数据放在一起作为样本数据), 用普通最小二乘法(OLS)估计参数,且估计量 是线性、无偏、有效和一致的。
固定效应变截距模型、时点个体固定效应变截距模
型。
K
yit 0 ki xkit uit ,
k 1
uit i t it
第22页,共49页。
K
yit 0 k xkit uit , uit i t it k 1
1.个体固定效应变截距模型一般形式:
K
yit 0 k xkit uit , uit i it k 1 其中,i 表示不同个体之间的差异化效应。
变系数模型的一般形式如下:
K
yit 0 ki xkit uit , uit i t it k 1
ki 为变系数,反映模型结构随截面的变化而变化。
类似于变截距模型,变系数模型也分为固定影响 变系数模型和随机影响变系数模型两种类型。
第35页,共49页。
EViews按下列步骤估计变系数模型:
第8页,共49页。
4. 计数面板模型: 被解释变量是计数面板数据的例子很多。例如 ,一段时间内一家公司的竟标次数、一个人去 看医生的次数、每天吸烟者的数量及一个研发 机构登记专利的数目。虽然可以运用传统面板 回归模型对计数面板数据建模,但鉴于被解释 变量具有0及非负离散取值的特征,运用泊松 面板回归模型建模更为合适。
我们就称这种个时体间效应是固定效应。反之,如果
个时体间效应 ti 与模型中的解释变量是不相关的,我
们称之为随机效应。
第19页,共49页。
第三节 混合回归模型
一、混合回归模型 从时间上看,不同年份之间不存在显著性差异; 从截面上看,不同个体之间也不存在显著性差异 ,那么就可以直接把面板数据混合在一起(相当于 将多个时期的截面数据放在一起作为样本数据), 用普通最小二乘法(OLS)估计参数,且估计量 是线性、无偏、有效和一致的。
固定效应变截距模型、时点个体固定效应变截距模
型。
K
yit 0 ki xkit uit ,
k 1
uit i t it
第22页,共49页。
K
yit 0 k xkit uit , uit i t it k 1
1.个体固定效应变截距模型一般形式:
K
yit 0 k xkit uit , uit i it k 1 其中,i 表示不同个体之间的差异化效应。
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
60000
RGDP_BJ_XJ
以每个个体观测值为一种符号的面板数据散点图如下(北京、天津、上海、浙江、 山东、广东和青海的数据分别连在一起)。发现北京、天津、上海二氧化硫排放量 (SO2)增加的很慢,尤其是北京,呈现出逐年减少的特征。而对于其他省级地区, 二氧化硫排放量(SO2)仍然呈逐年增加态势。整体上呈倒 U 字特征并不明显。
案例 2:全国省级地区城镇居民人均食品支出与收入关系研究
5000 food 4000
3000
2000
1000 income 0 0 4000 8000 12000 16000 20000
SO2_HAN SO2_SC SO2_GZ SO2_YN SO2_SHX SO2_GS SO2_QH SO2_NX SO2_XJ
30000
40000
50000
60000
RGDP_BJ_XJ
从面板数据个体连线散点图看,人均国内生产总值超过 4 万元的只有北京、 天津、上海三个地区。其余 26 个省级地区仍都处于二氧化硫排放量(SO2) 逐年增加的阶段。用倒 U 字曲线拟合是不恰当的。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
以中国 29 个省级地区(不包括重庆、西藏和港澳台地区)1995-2006 年间 12 年的面板数据来对我国的经济增长与环境问题做出分析,所选数据均为平衡 面板数据, 348 组数据。 共 其中, RGDP 表示人均国内生产总值 (单位: 元) , SO2 表示工业二氧化硫排放量(单位:吨)。用 BJ、TJ、HEB、SX、NMG、 LN、JL、HLJ、SH、JS、ZJ、AH、FJ、JX、SD、HEN、HUB、HUN、 GD、GX、HAN、SC、GZ、YN、SHX、GS、QH、NX、XJ 分别表示北京、 天津、河北、山西、内蒙古、辽宁、吉林、黑龙江、上海、江苏、浙江、安 徽、福建、江西、山东、河南、湖北、湖南、广东、广西、海南、四川、贵 州、云南、陕西、甘肃、青海、宁夏、新疆。 各地区 1995-2006 的人均国内生产总值和工业二氧化硫排放量数据均来 自于 1996-2007 年《中国统计年鉴》。
二氧化硫排放量(SO2it)与人均国内生产总值(RGDPit)面板数据散点图。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
SO2_95_06 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000 30000 RGDP 40000 50000 60000
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
SO2_95 SO2_96 SO2_97 SO2_98 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000 30000 RGDP 40000 50000 60000 SO2_99 SO2_00 SO2_01 SO2_02 SO2_03 SO2_04 SO2_05 SO2_06
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
SO2_95_06 vs. Polynomial (degree=3) of RGDP 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000 30000 RGDP 40000 50000 60000
案例 2: 全国省级地区城镇居民人均食品支出与收入关系研究
28 个省市自治区(不包括西藏、新疆和重庆市)21 年(19852005)共 588 个观 测值。 线性混合模型估计结果是 F1it = 335.84 + 0.2667 I1it (20.6)(88.8) R2 = 0.93,DW=0.15, NT= 2821= 588 线性个体固定效应模型估计结果是 F1it = …+ 374.75 + 0.2577 I1it (26.6)(96.8) R2 = 0.95,DW=0.23, NT= 2821= 588 克服误差项自相关的线性个体固定效应模型估计结果是 F1it = …+ 604.98 + 0.2225 I1it +1.1979AR(1) -0.3620AR(2) (11.8)(34.1) (28.5) (-8.8) R2 = 0.99,DW=2.24, NT= 2821= 532 R2 = 0.99,DW=2.24,一定认为找到了模型的最好估计形式。事实并不是这样。 F1it 和 I1it 的散点图如下:
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
分析中国二氧化硫排放量(SO2)与人均国内生产总值(RGDP)面板数据的特征。
SO2_95 SO2_96 SO2_97 SO2_98 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000 30000 RGDP 40000 50000 60000 SO2_99 SO2_00 SO2_01 SO2_02 SO2_03 SO2_04 SO2_05 SO2_06
SO2_BJ SO2_TJ SO2_HEB SO2_SX SO2_NMG SO2_LN SO2_JL SO2_HLJ SO2_SH SO2_JS 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000
SO2_ZJ SO2_AH SO2_FJ SO2_JX SO2_SD SO2_HEN SO2_HUB SO2_HUN SO2_GD SO2_GX
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
线性混合模型估计结果是 SO2it = 557081.4 + 1.1111 RGDPit (16.0) (0.4) R2 = 0.0005,DW=0.11, NT= 2912= 348 说明二氧化硫排放量(SO2it, 吨)与人均国内生产总值(RGDPit, 元)之间不 存在线性关系。由可决系数 R2 = 0.0005 知数据一定非常散。 二次多项式混合模型估计结果是 SO2it = 423499.3 + 23.4691 RGDP it - 0.00055 RGDP it 2 (8.0) (3.2) (-3.3) R2 = 0.0315,DW=0.12, NT= 2912= 348 说明二氧化硫排放量(SO2it)与人均国内生产总值(RGDPit)有可能存在二 次非线性关系。由可决系数 R2 = 0.0315 知数据一定非常散。 据此就可以建立二次多项式形式的面板数据模型吗?首先分析数据散点图。
SO2_95_06
SO2_95_06F1
2500000 2000000 1500000 1000000 500000 0 -500000 0
SO2_95_06 vs. Polynomial (degree=2) of RGDP
10000
20000
30000 RGDP
40000
50000
60000
线性混合模型的回归直线
SO2_ZJ SO2_AH SO2_FJ SO2_JX SO2_SD SO2_HEN SO2_HUB SO2_HUN SO2_GD SO2_GX
SO2_HAN SO2_SC SO2_GZ SO2_YN SO2_SHX SO2_GS SO2_QH SO2_NX SO2_XJ
பைடு நூலகம்
30000
40000
50000
面板数据模型形式的选择
张晓峒
南开大学数量经济研究所
nkeviews@
面板数据模型形式的选择
张晓峒
【摘要】 面板数据模型除了应用 F 检验和 Hausman 检验确定 应该建立混合模型、固定效应模型还是随机效应模型之外, 如何恰当地选择模型的形式也是一个重要问题。本文运用多 组经济数据展示模型形式的选择过程以及模型形式不合理时 对模型参数估计带来的影响。
以每个截面观测值为一种符号的面板数据散点图如下(图中把 1995、2001 和 2006 年 数据分别连在一起。):发现二氧化硫排放量(SO2)有逐年增加的趋势。
SO2_BJ SO2_TJ SO2_HEB SO2_SX SO2_NMG SO2_LN SO2_JL SO2_HLJ SO2_SH SO2_JS 2400000 2000000 1600000 1200000 800000 400000 0 0 10000 20000
SO2it = 349806.2+ 41.5645 RGDPit - 0.00156 RGDPit 2 + 1.38 108 RGDPit 2 (4.3) (2.4) (-1.8) (1.2) R2 = 0.035,DW=0.12, NT= 2912= 348
SO2_95_06
面板数据的三次多项式混合模型拟合图(按库兹涅茨曲线假说拟合)。 估计结果显示这种拟合没有显著性,即不存在倒 U 字特征。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
相对应,估计随机效应模型如下: SO2it = … + 465399.6 + 10.1736 RGDPit (6.4) (6.1) R2 = 0.10,DW=0.72, NT= 2912= 348
从检验结果看应该建立个体随机效应模型。如果建立二次多项式模型,预测 将带来很大误差。 本例不应建立倒 U 字模型, 中国目前处于工业化发展阶段, 还没有逾越二氧化硫排放量的最高值。
案例 1:工业 SO2 排放及人均 GDP 关系的面板数据研究
回到线性拟合形式上来。与混合模型 SO2it = 557081.4 + 1.1111 RGDPit (16.0) (0.4) R2 = 0.0005,DW=0.11, NT= 2912= 348 相对应,估计个体固定效应模型如下: SO2it = … + 461948.1 + 10.5148 RGDPit (24.2) (5.2) R2 = 0.86,DW=0.79, NT= 2912= 348 从全国平均水平来看,人均国内生产总值(RGDP)每增加 1 元,二氧化硫 排放量(SO2)增加 10.5 吨。从检验结果看应该建立个体固定效应模型。