面板数据模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9000 8000 7000
CP1996 CP1997 CP1998 CP1999 CP2000 CP2001 CP2002
CP_IAH CP_IBJ CP_IFJ CP_IHB CP_IHLJ
CP_IJL CP_IJS CP_IJX CP_ILN CP_INMG
6000
5000
4000
3000
2000 2000
4000
IP
6000 8000 10000 12000 14000 IPCROSS
11000 CP_ISD CP_ISH 10000 CP_ISX CP_ITJ 9000 CP_IZJ 8000
7000
6000
5000
4000
3000
2000 2000
4000
6000
IP_I 8000 10000 12000 14000
panel 原指对一组固定调查对象的多次观测,近年来 panel data 已经成为 专业术语。
面 板 数 据 从 横 截 面 ( cross section ) 看 , 是 由 若 干 个 体 ( entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看 每个个体都是一个时间序列。
9.2
LOG(CP1999)
9.0
8.8
6000
8.6
5000
8.4
4000
8.2
3000 2000
IP
8.0
2000 4000 6000 8000 10000 12000 14000 7.8
IPCROSS
8.0 8.2 8.4 8.6 8.8 9.0 9.2 9.4 9.6
LOG(IPCROSS)
横截面上的 N 个随机变量;若固定 i 不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个
时间序列(个体)。 对于面板数据 yi t, i = 1, 2, …, N; t = 1, 2, …, T,如果每个个体在相同的时期
内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。 若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平 衡面板数据(unbalanced panel data)。
人均消费和收入两个面板数据都是平衡面板数据,各有 15 个个体。
安徽 河北 江苏 内蒙古 山西 1996 1998 2000 2002
山西 内蒙古 江苏 河北 安徽 1996 1999 2002
1996 1997 1998 1999 2000 2001 2002
12000 10000 8000 6000 4000 2000 0
1.面板数据定义 面板数据分两种特征:(1)个体数少,时间长。(2)个体数多,时间短。
面板数据主要指后一种情形。 面板数据用双下标变量表示。例如
yi t, i = 1, 2, …, N; t = 1, 2, …, T i 对应面板数据中不同个体。N 表示面板数据中含有 N 个个体。t 对应面板数据 中不同时点。T 表示时间序列的最大长度。若固定 t 不变,yi ., ( i = 1, 2, …, N)是
File:panel02c
图 7 对数的人均消费对收入的面板数据散点图
本例用对数研究更合理
面板数据模型与应用
1.面板数据定义 为了观察得更清楚,图 8 给出北京和内蒙古 1996-2002 年消费对收入散点图。从图中
可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古 2002 年的收 入与消费规模还不如北京市 1996 年的大。图 9 给出该 15 个省级地区 1996 和 2002 年的 消费对收入散点图。6 年之后 15 个地区的消费和收入都有了相应的提高。
利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计 量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估 计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。
案例 1(file:5panel02):1996-2002 年中国东北、华北、华东 15 个省级 地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据。数据 是 7 年的,每一年都有 15 个数据,共 105 组观测值。
面板数据模型
1.面板数据定义 时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到
的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截 面上取得的二维数据。所以,面板数据(panel data)也称作时间序列与截面混 合数据(pooled time series and cross section data)。面板数据是截面上个体在不 同时点的重复观测数据。
12000 10000 8000 6000 4000 2000 0
安徽 北京 福建 河北 黑龙江 吉林 江苏 江wenku.baidu.com 辽宁 内蒙古 山东 上海 山西 天津 浙江
安徽 河北 江苏 内蒙古 山西 1996 1999 2002 浙江 山西 山东 辽宁 江苏 黑龙江 福建 安徽 1996 1998 2000 2002
图6
图7
用原变量建模还是用对数变量建模?
11000 10000
9000 8000 7000
CP1996 CP1997 CP1998 CP1999 CP2000 CP2001 CP2002
LOG(CP1996) LOG(CP2000)
9.4
LOG(CP1997) LOG(CP2001)
LOG(CP1998) LOG(CP2002)
14000 12000 10000
8000 6000 4000 2000
0
1996 1997 1998 1999 2000 2001 2002
14000 12000 10000 8000 6000 4000 2000 0
安徽 北京 福建 河北 黑龙江 吉林 江苏 江西 辽宁 内蒙古 山东 上海 山西 天津 浙江
面板数据散点图 15 个地区 7 年人均消费对收入的面板数据散点图见图 6 和图 7。
图 6 中每一种符号代表一个年度的截面散点图(共 7 个截面)。相当于 观察 7 个截面散点图的叠加。图 7 中每一种符号代表一个省级地区的 7 个观测点组成的时间序列。相当于观察 15 个时间序列。
11000 10000
CP1996 CP1997 CP1998 CP1999 CP2000 CP2001 CP2002
CP_IAH CP_IBJ CP_IFJ CP_IHB CP_IHLJ
CP_IJL CP_IJS CP_IJX CP_ILN CP_INMG
6000
5000
4000
3000
2000 2000
4000
IP
6000 8000 10000 12000 14000 IPCROSS
11000 CP_ISD CP_ISH 10000 CP_ISX CP_ITJ 9000 CP_IZJ 8000
7000
6000
5000
4000
3000
2000 2000
4000
6000
IP_I 8000 10000 12000 14000
panel 原指对一组固定调查对象的多次观测,近年来 panel data 已经成为 专业术语。
面 板 数 据 从 横 截 面 ( cross section ) 看 , 是 由 若 干 个 体 ( entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看 每个个体都是一个时间序列。
9.2
LOG(CP1999)
9.0
8.8
6000
8.6
5000
8.4
4000
8.2
3000 2000
IP
8.0
2000 4000 6000 8000 10000 12000 14000 7.8
IPCROSS
8.0 8.2 8.4 8.6 8.8 9.0 9.2 9.4 9.6
LOG(IPCROSS)
横截面上的 N 个随机变量;若固定 i 不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个
时间序列(个体)。 对于面板数据 yi t, i = 1, 2, …, N; t = 1, 2, …, T,如果每个个体在相同的时期
内都有观测值记录,则称此面板数据为平衡面板数据(balanced panel data)。 若面板数据中的个体在相同时期内缺失若干个观测值,则称此面板数据为非平 衡面板数据(unbalanced panel data)。
人均消费和收入两个面板数据都是平衡面板数据,各有 15 个个体。
安徽 河北 江苏 内蒙古 山西 1996 1998 2000 2002
山西 内蒙古 江苏 河北 安徽 1996 1999 2002
1996 1997 1998 1999 2000 2001 2002
12000 10000 8000 6000 4000 2000 0
1.面板数据定义 面板数据分两种特征:(1)个体数少,时间长。(2)个体数多,时间短。
面板数据主要指后一种情形。 面板数据用双下标变量表示。例如
yi t, i = 1, 2, …, N; t = 1, 2, …, T i 对应面板数据中不同个体。N 表示面板数据中含有 N 个个体。t 对应面板数据 中不同时点。T 表示时间序列的最大长度。若固定 t 不变,yi ., ( i = 1, 2, …, N)是
File:panel02c
图 7 对数的人均消费对收入的面板数据散点图
本例用对数研究更合理
面板数据模型与应用
1.面板数据定义 为了观察得更清楚,图 8 给出北京和内蒙古 1996-2002 年消费对收入散点图。从图中
可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古 2002 年的收 入与消费规模还不如北京市 1996 年的大。图 9 给出该 15 个省级地区 1996 和 2002 年的 消费对收入散点图。6 年之后 15 个地区的消费和收入都有了相应的提高。
利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计 量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估 计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。
案例 1(file:5panel02):1996-2002 年中国东北、华北、华东 15 个省级 地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据。数据 是 7 年的,每一年都有 15 个数据,共 105 组观测值。
面板数据模型
1.面板数据定义 时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到
的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截 面上取得的二维数据。所以,面板数据(panel data)也称作时间序列与截面混 合数据(pooled time series and cross section data)。面板数据是截面上个体在不 同时点的重复观测数据。
12000 10000 8000 6000 4000 2000 0
安徽 北京 福建 河北 黑龙江 吉林 江苏 江wenku.baidu.com 辽宁 内蒙古 山东 上海 山西 天津 浙江
安徽 河北 江苏 内蒙古 山西 1996 1999 2002 浙江 山西 山东 辽宁 江苏 黑龙江 福建 安徽 1996 1998 2000 2002
图6
图7
用原变量建模还是用对数变量建模?
11000 10000
9000 8000 7000
CP1996 CP1997 CP1998 CP1999 CP2000 CP2001 CP2002
LOG(CP1996) LOG(CP2000)
9.4
LOG(CP1997) LOG(CP2001)
LOG(CP1998) LOG(CP2002)
14000 12000 10000
8000 6000 4000 2000
0
1996 1997 1998 1999 2000 2001 2002
14000 12000 10000 8000 6000 4000 2000 0
安徽 北京 福建 河北 黑龙江 吉林 江苏 江西 辽宁 内蒙古 山东 上海 山西 天津 浙江
面板数据散点图 15 个地区 7 年人均消费对收入的面板数据散点图见图 6 和图 7。
图 6 中每一种符号代表一个年度的截面散点图(共 7 个截面)。相当于 观察 7 个截面散点图的叠加。图 7 中每一种符号代表一个省级地区的 7 个观测点组成的时间序列。相当于观察 15 个时间序列。
11000 10000