面板数据分析PPT课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
这正是时点固定效应模型形式。对于每个截面,回归函数的斜率
相同(都是1),t 却因截面(时点)不同而异。可见时点固定效应 模型中的截距项t 包括了那些随不同截面(时点)变化,但不随个 体变化的难以观测的变量的影响。t 是一个随机变量。
以家庭消费性支出与可支配收入关系为例,“全国零售物价指数” 就是这样的一个变量。对于不同时点,这是一个变化的量,但是对 于不同省份(个体),这是一个不变化的量。
变换上式: yi = + X i ' +( i - + i ), i = 1, 2, …, N
称作平均数模型。对上式应用 OLS 估计,则参数估计量称作平均数 OLS 估 计量。此条件下的样本容量为 N,(T=1)。
如果 X i 与( i - + i )相互独立,和的平均数 OLS 估计量是一致估计量。
yit = + Xit ' +it, i = 1, 2, …, N; t = 1, 2, …, T 如果模型是正确设定的,且解释变量与误差项不相关,即 Cov(Xit,it) = 0。 那么无论是 N,还是 T,模型参数的混合最小二乘估计量都具有 一致性。 对于经济序列每个个体 i 及其误差项来说通常是序列相关的。NT 个相关 观测值要比 NT 个相互独立的观测值包含的信息少。从而导致误差项的标 准差常常被低估,估计量的精度被虚假夸大。
为误差项(标量),满足通常假定条件。Xit 为 k 1 阶回归变量列
向量(包括 k 个回归变量),为 k 1 阶回归系数列向量,则称此
模型为时点固定效应模型。
第8页/共30页
2.2.2 时点固定效应模型(time fixed effects model)
设定时点固定效应模型的原因。假定有面板数据模型
第9页/共30页
2.2.3 个体时点固定效应模型
如果一个面板数据模型定义为,
yit = 0 +i +t + Xit ' +it, i = 1, 2, …, N; t = 1, 2, …, T
其中 yit 为被回归变量(标量);i 是随机变量,表示对于 N 个个体有 N 个不同的截距项,且其变化与 Xit 有关系;t 是随机变量,表示对于
1.面板数据模型简介
• 面板数据(panel data)也称作时间序列与截面混 合数据(pooled time series and cross section data)。面板数据是截面上个体在不同时 点的重复观测数据。
N=30,T=50的面板数据示意图
中国各省级地区消费性支出占可支配收入比例走势图 第1页/共30页
• 平均数(between)OLS估计 (适用于混合模型和个体随机效应模型)
• 离差变换(within)OLS估计 (适用于个体固定效应回归模型)
• 一阶差分(first difference)OLS估计 (适用于个体固定效应模型)
• 可行GLS(feasible GLS)估计 (适用于随机效应模型)
第14页/共30页
3.面板数据模型估计方法
3.1 混合最小二乘(Pooled OLS)估计
如果模型存在个体固定效应,即i 与 Xit 相关,那么对模型应用混合
OLS 估计方法,估计量不再具有一致性。
假定模型实为个体固定效应模型 yit = i + Xit ' +it,但却当作混
合模型来估计参数,则模型写为
•
yit = i + Xit ' +it, i = 1, 2, …, N; t =
1, 2, …, T
• 其中i是随机变量,表示对于i个个体有i个不同的截距项, 且其变化与Xit有关系;Xit为k 1阶回归变量列向量(包 括k个回归量),为k 1第阶6页回/共归30页系数列向量,对于不同个
2.2 固定效应模型(fixed effects model)。
第13页/共30页
3.面板数据模型估计方法
面板数据模型中的估计量既不同于截面数据估计量,也不同于时间序列 估计量,其性质随设定固定效应模型是否正确而变化。 3.1 混合最小二乘(Pooled OLS)估计 混合 OLS 估计方法是在时间上和截面ห้องสมุดไป่ตู้把 NT 个观测值混合在一起,然 后用 OLS 法估计模型参数。给定混合模型
注意:术语“随机效应模型”和“固定效应模型”用得并不十分恰当。 其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应 该称之为“非相关效应模型”。因为固定效应模型和随机效应模型中 的i 都是随机变量。
第12页/共30页
3. 面板数据模型估计方法
• 混合最小二乘(Pooled OLS)估计 (适用于混合模型)
面板数据分两种特征:(1)个体数少,时间长。(2)个 体数多,时间短。面板数据用双下标变量表示。
yi t, i = 1, 2, …, N; t = 1, 2, …, T i 对应面板数据中不同个体。N表示面板数据中含有N个个 体。t 对应面板数据中不同时点。T表示时间序列的最大长
度。 利用面板数据建立模型的好处是:(1)由于观测值的增多, 可以增加估计量的抽样精度。(2)对于固定效应回归模型 能得到参数的一致估计量,甚至有效估计量。(3)面板数 据建模比单截面数据建模可以获得更多的动态信息。
计模型参数。具体步骤是,对于个体固定效应回归模型 yit = i + Xit'
+it 中的每个个体计算平均数,可得到如下模型,yi = i + X i ' + i 上两
式相减,消去了i,得
yit - yi = (Xit - X i )' + (it - i )
此模型称作离差变换数据模型。对上式应用 OLS 估计,所得的估计量称
• 2.1 混合模型(Pooled model)。
• 如果一个面板数据模型定义为,
•
yit = + Xit ' +it, i = 1, 2, …, N; t = 1,
2, …, T
• 其中yit为被回归变量(标量), 表示截距项,Xit为k 1阶回 归变量列向量(包括k个回归量),为k 1阶回归系数列向量, it为误差项(标量)。则称此模型为混合回归模型。混合回归模 型的特点是无论对任何个体和截面,回归系数和都相同。
• 面板数据是不同个体和不同时期被观察的数据(Longitudinal or Panel Data)
yi 1x1i 2x2i i
横截面数据
yt 1x1t 2x2t t 时间序列数据
yit 1x1it 2x2it it
面板数据
第4页/共30页
2.面板数据模型分类
• 用面板数据建立的模型通常有3种,即混合模型、固定效应模型 和随机效应模型。
第2页/共30页
• yi t, i = 1, 2, …, N; t = 1, 2, …, T • 若固定t不变,yi ., ( i = 1, 2, …, N)是横截面上的N个随机变量; • 若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个
体)。
第3页/共30页
第10页/共30页
2.3 随机效应模型
对于面板数据模型
yit = i + Xit' +it, i = 1, 2, …, N; t = 1, 2, …, T 如果i 为随机变量,其分布与 Xit 无关; Xit 为 k 1 阶回归变量列向 量(包括 k 个回归量),为 k 1 阶回归系数列向量,对于不同个体回 归系数相同,yit 为被回归变量(标量),it 为误差项(标量),这种模
yit = 0 + 1 xit +2 zt +it, i = 1, 2, …, N; t = 1, 2, …, T 其中0 为常数,不随时间、截面变化;对于 T 个截面有 T 个不同的
截距项,zt 表示随不同截面(时点)变化,但不随个体变化的难以
观测的变量。令t = 0 +2 zt,上式变为 yit = t + 1 xit +it, i = 1, 2, …, N; t = 1, 2, …, T
平均数 OLS 估计法的步骤是首先对面板数据中的每个个体求平均数,共得到 N 个平均数(估计值)。然后利用 yit 和 Xit 的 N 组观测值估计参数。以个体固 定效应回归模型
yit = i + Xit ' +it
为例,首先对面板中的每个个体求平均数,从而建立模型
yi = i + X i ' + i , i = 1, 2, …, N
yit = + Xit ' + (i - +it) = + Xit ' + uit 其中 uit = (i - +it)。因为i 与 Xit 相关,也即 uit 与 Xit 相关,所以个
体固定效应模型的参数若采用混合 OLS 估计,估计量不具有一致性。
第15页/共30页
3.2 平均数(between)OLS 估计
第5页/共30页
• 2.2 固定效应模型(fixed effects model)。
• 固定效应模型分为3种类型,即个体固定效应模型、时点 固定效应模型和个体时点双固定效应模型。下面分别介绍。
• 2.2.1个体固定效应模型(entity fixed effects model)
• 如果一个面板数据模型定义为,
i = 0 +2 zi,于是变为 yit = i + 1 xit +it, i = 1, 2, …, N; t = 1, 2, …, T
以家庭消费性支出与可支配收入关系为例,省家庭平均人口数就是这样 的一个变量,即对于短期面板,这是一个基本不随时间变化的量,但是 对于不同的省份,这个变量的值是不同的。 因为 zi 是不随时间变化的量,所以当对个体固定效应模型中的变量进行 差分时,可以剔除那些随个体变化,但不随时间变化的 zi 的影响。
T 个截面(时点)有 T 个不同的截距项,且其变化与 Xit 有关系;Xit
为 k 1 阶回归变量列向量(包括 k 个回归量);为 k 1 阶回归系数 列向量;it 为误差项(标量)满足通常假定(it Xit, i, t) = 0;则称此
模型为个体时点固定效应模型。 如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型 进行混合 OLS 估计,全部参数估计量都是不一致的。正如个体固定 效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方 法也可以使个体时点双固定效应模型得到更有效的参数估计量。
平均数 OLS 估计法适用于短期面板的混合模型和个体随机效应模型。
对于个体固定效应模型来说,由于i 和 Xit 相关,也即i 和 X i 相关,所以,
回归参数的平均数 OLS 估计量是非一致估计量。
第16页/共30页
3.3 离差变换(within)OLS 估计
对于短期面板数据,离差变换 OLS 估计法的原理是先把面板数据中每个 个体的观测值变换为对其平均数的离差观测值,然后利用离差变换数据估
型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其 假定条件是
i iid(, 2) it iid(0, 2)
都被假定为独立同分布,但并未限定何种分布。 同理也可定义时点随机效应回归模型和个体时点随机效应回归模型, 但个体随机效应回归模型最为常用。
第11页/共30页
2.3 随机效应模型
对于个体随机效应模型,E(i Xit) = ,则有,E(yit xit) = + Xit', 对 yit 可以识别。所以随机效应模型参数的混合 OLS 估计量具有一致 性,但不具有有效性。
作离差变换 OLS 估计量。
对于个体固定效应回归模型,的离差变换 OLS 估计量是一致估计量。如 果it 还满足独立同分布条件,的离差变换 OLS 估计量不但具有一致性而
解释设定个体固定效应模型的原因。假定有面板数据模型
yit = 0 + 1 xit +2 zi +it, i = 1, 2, …, N; t = 1, 2, …, T 其中0 为常数,不随时间、截面变化;每个个体回归函数的斜率1 相同;
zi 表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以 被解释为含有 N 个截距,即每个个体都对应一个不同截距的模型。令
第7页/共30页
2.2.2 时点固定效应模型(time fixed effects model)
如果一个面板数据模型定义为,
yit = t + Xit ' +it, i = 1, 2, …, N 其中t 是模型截距项,随机变量,表示对于 T 个截面有 T 个不同 的截距项,且其变化与 Xit 有关系;yit 为被回归变量(标量),it
相同(都是1),t 却因截面(时点)不同而异。可见时点固定效应 模型中的截距项t 包括了那些随不同截面(时点)变化,但不随个 体变化的难以观测的变量的影响。t 是一个随机变量。
以家庭消费性支出与可支配收入关系为例,“全国零售物价指数” 就是这样的一个变量。对于不同时点,这是一个变化的量,但是对 于不同省份(个体),这是一个不变化的量。
变换上式: yi = + X i ' +( i - + i ), i = 1, 2, …, N
称作平均数模型。对上式应用 OLS 估计,则参数估计量称作平均数 OLS 估 计量。此条件下的样本容量为 N,(T=1)。
如果 X i 与( i - + i )相互独立,和的平均数 OLS 估计量是一致估计量。
yit = + Xit ' +it, i = 1, 2, …, N; t = 1, 2, …, T 如果模型是正确设定的,且解释变量与误差项不相关,即 Cov(Xit,it) = 0。 那么无论是 N,还是 T,模型参数的混合最小二乘估计量都具有 一致性。 对于经济序列每个个体 i 及其误差项来说通常是序列相关的。NT 个相关 观测值要比 NT 个相互独立的观测值包含的信息少。从而导致误差项的标 准差常常被低估,估计量的精度被虚假夸大。
为误差项(标量),满足通常假定条件。Xit 为 k 1 阶回归变量列
向量(包括 k 个回归变量),为 k 1 阶回归系数列向量,则称此
模型为时点固定效应模型。
第8页/共30页
2.2.2 时点固定效应模型(time fixed effects model)
设定时点固定效应模型的原因。假定有面板数据模型
第9页/共30页
2.2.3 个体时点固定效应模型
如果一个面板数据模型定义为,
yit = 0 +i +t + Xit ' +it, i = 1, 2, …, N; t = 1, 2, …, T
其中 yit 为被回归变量(标量);i 是随机变量,表示对于 N 个个体有 N 个不同的截距项,且其变化与 Xit 有关系;t 是随机变量,表示对于
1.面板数据模型简介
• 面板数据(panel data)也称作时间序列与截面混 合数据(pooled time series and cross section data)。面板数据是截面上个体在不同时 点的重复观测数据。
N=30,T=50的面板数据示意图
中国各省级地区消费性支出占可支配收入比例走势图 第1页/共30页
• 平均数(between)OLS估计 (适用于混合模型和个体随机效应模型)
• 离差变换(within)OLS估计 (适用于个体固定效应回归模型)
• 一阶差分(first difference)OLS估计 (适用于个体固定效应模型)
• 可行GLS(feasible GLS)估计 (适用于随机效应模型)
第14页/共30页
3.面板数据模型估计方法
3.1 混合最小二乘(Pooled OLS)估计
如果模型存在个体固定效应,即i 与 Xit 相关,那么对模型应用混合
OLS 估计方法,估计量不再具有一致性。
假定模型实为个体固定效应模型 yit = i + Xit ' +it,但却当作混
合模型来估计参数,则模型写为
•
yit = i + Xit ' +it, i = 1, 2, …, N; t =
1, 2, …, T
• 其中i是随机变量,表示对于i个个体有i个不同的截距项, 且其变化与Xit有关系;Xit为k 1阶回归变量列向量(包 括k个回归量),为k 1第阶6页回/共归30页系数列向量,对于不同个
2.2 固定效应模型(fixed effects model)。
第13页/共30页
3.面板数据模型估计方法
面板数据模型中的估计量既不同于截面数据估计量,也不同于时间序列 估计量,其性质随设定固定效应模型是否正确而变化。 3.1 混合最小二乘(Pooled OLS)估计 混合 OLS 估计方法是在时间上和截面ห้องสมุดไป่ตู้把 NT 个观测值混合在一起,然 后用 OLS 法估计模型参数。给定混合模型
注意:术语“随机效应模型”和“固定效应模型”用得并不十分恰当。 其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应 该称之为“非相关效应模型”。因为固定效应模型和随机效应模型中 的i 都是随机变量。
第12页/共30页
3. 面板数据模型估计方法
• 混合最小二乘(Pooled OLS)估计 (适用于混合模型)
面板数据分两种特征:(1)个体数少,时间长。(2)个 体数多,时间短。面板数据用双下标变量表示。
yi t, i = 1, 2, …, N; t = 1, 2, …, T i 对应面板数据中不同个体。N表示面板数据中含有N个个 体。t 对应面板数据中不同时点。T表示时间序列的最大长
度。 利用面板数据建立模型的好处是:(1)由于观测值的增多, 可以增加估计量的抽样精度。(2)对于固定效应回归模型 能得到参数的一致估计量,甚至有效估计量。(3)面板数 据建模比单截面数据建模可以获得更多的动态信息。
计模型参数。具体步骤是,对于个体固定效应回归模型 yit = i + Xit'
+it 中的每个个体计算平均数,可得到如下模型,yi = i + X i ' + i 上两
式相减,消去了i,得
yit - yi = (Xit - X i )' + (it - i )
此模型称作离差变换数据模型。对上式应用 OLS 估计,所得的估计量称
• 2.1 混合模型(Pooled model)。
• 如果一个面板数据模型定义为,
•
yit = + Xit ' +it, i = 1, 2, …, N; t = 1,
2, …, T
• 其中yit为被回归变量(标量), 表示截距项,Xit为k 1阶回 归变量列向量(包括k个回归量),为k 1阶回归系数列向量, it为误差项(标量)。则称此模型为混合回归模型。混合回归模 型的特点是无论对任何个体和截面,回归系数和都相同。
• 面板数据是不同个体和不同时期被观察的数据(Longitudinal or Panel Data)
yi 1x1i 2x2i i
横截面数据
yt 1x1t 2x2t t 时间序列数据
yit 1x1it 2x2it it
面板数据
第4页/共30页
2.面板数据模型分类
• 用面板数据建立的模型通常有3种,即混合模型、固定效应模型 和随机效应模型。
第2页/共30页
• yi t, i = 1, 2, …, N; t = 1, 2, …, T • 若固定t不变,yi ., ( i = 1, 2, …, N)是横截面上的N个随机变量; • 若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个
体)。
第3页/共30页
第10页/共30页
2.3 随机效应模型
对于面板数据模型
yit = i + Xit' +it, i = 1, 2, …, N; t = 1, 2, …, T 如果i 为随机变量,其分布与 Xit 无关; Xit 为 k 1 阶回归变量列向 量(包括 k 个回归量),为 k 1 阶回归系数列向量,对于不同个体回 归系数相同,yit 为被回归变量(标量),it 为误差项(标量),这种模
yit = 0 + 1 xit +2 zt +it, i = 1, 2, …, N; t = 1, 2, …, T 其中0 为常数,不随时间、截面变化;对于 T 个截面有 T 个不同的
截距项,zt 表示随不同截面(时点)变化,但不随个体变化的难以
观测的变量。令t = 0 +2 zt,上式变为 yit = t + 1 xit +it, i = 1, 2, …, N; t = 1, 2, …, T
平均数 OLS 估计法的步骤是首先对面板数据中的每个个体求平均数,共得到 N 个平均数(估计值)。然后利用 yit 和 Xit 的 N 组观测值估计参数。以个体固 定效应回归模型
yit = i + Xit ' +it
为例,首先对面板中的每个个体求平均数,从而建立模型
yi = i + X i ' + i , i = 1, 2, …, N
yit = + Xit ' + (i - +it) = + Xit ' + uit 其中 uit = (i - +it)。因为i 与 Xit 相关,也即 uit 与 Xit 相关,所以个
体固定效应模型的参数若采用混合 OLS 估计,估计量不具有一致性。
第15页/共30页
3.2 平均数(between)OLS 估计
第5页/共30页
• 2.2 固定效应模型(fixed effects model)。
• 固定效应模型分为3种类型,即个体固定效应模型、时点 固定效应模型和个体时点双固定效应模型。下面分别介绍。
• 2.2.1个体固定效应模型(entity fixed effects model)
• 如果一个面板数据模型定义为,
i = 0 +2 zi,于是变为 yit = i + 1 xit +it, i = 1, 2, …, N; t = 1, 2, …, T
以家庭消费性支出与可支配收入关系为例,省家庭平均人口数就是这样 的一个变量,即对于短期面板,这是一个基本不随时间变化的量,但是 对于不同的省份,这个变量的值是不同的。 因为 zi 是不随时间变化的量,所以当对个体固定效应模型中的变量进行 差分时,可以剔除那些随个体变化,但不随时间变化的 zi 的影响。
T 个截面(时点)有 T 个不同的截距项,且其变化与 Xit 有关系;Xit
为 k 1 阶回归变量列向量(包括 k 个回归量);为 k 1 阶回归系数 列向量;it 为误差项(标量)满足通常假定(it Xit, i, t) = 0;则称此
模型为个体时点固定效应模型。 如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型 进行混合 OLS 估计,全部参数估计量都是不一致的。正如个体固定 效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方 法也可以使个体时点双固定效应模型得到更有效的参数估计量。
平均数 OLS 估计法适用于短期面板的混合模型和个体随机效应模型。
对于个体固定效应模型来说,由于i 和 Xit 相关,也即i 和 X i 相关,所以,
回归参数的平均数 OLS 估计量是非一致估计量。
第16页/共30页
3.3 离差变换(within)OLS 估计
对于短期面板数据,离差变换 OLS 估计法的原理是先把面板数据中每个 个体的观测值变换为对其平均数的离差观测值,然后利用离差变换数据估
型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其 假定条件是
i iid(, 2) it iid(0, 2)
都被假定为独立同分布,但并未限定何种分布。 同理也可定义时点随机效应回归模型和个体时点随机效应回归模型, 但个体随机效应回归模型最为常用。
第11页/共30页
2.3 随机效应模型
对于个体随机效应模型,E(i Xit) = ,则有,E(yit xit) = + Xit', 对 yit 可以识别。所以随机效应模型参数的混合 OLS 估计量具有一致 性,但不具有有效性。
作离差变换 OLS 估计量。
对于个体固定效应回归模型,的离差变换 OLS 估计量是一致估计量。如 果it 还满足独立同分布条件,的离差变换 OLS 估计量不但具有一致性而
解释设定个体固定效应模型的原因。假定有面板数据模型
yit = 0 + 1 xit +2 zi +it, i = 1, 2, …, N; t = 1, 2, …, T 其中0 为常数,不随时间、截面变化;每个个体回归函数的斜率1 相同;
zi 表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以 被解释为含有 N 个截距,即每个个体都对应一个不同截距的模型。令
第7页/共30页
2.2.2 时点固定效应模型(time fixed effects model)
如果一个面板数据模型定义为,
yit = t + Xit ' +it, i = 1, 2, …, N 其中t 是模型截距项,随机变量,表示对于 T 个截面有 T 个不同 的截距项,且其变化与 Xit 有关系;yit 为被回归变量(标量),it