空间面板随机前沿模型及技术效率估计

空间面板随机前沿模型及技术效率估计
空间面板随机前沿模型及技术效率估计

空间面板随机前沿模型及技术效率估计

林佳显1 , 龙志和1 , 林光平2

(1. 华南理工大学经济与贸易学院, 广东广州510006;

摘要: 随机前沿模型是测算技术效率的重要方法之一。通常,模型假设生产单元之间彼此独立,然而在技术扩散过程中,空间外部性起着重要作用。文章结合随机前沿模型理论与空间经济计量分析方法,构建空间面板随机前沿模型,同时考虑空间滞后因变量和空间误差自相关,并逐步放松模型设定条件,首先考虑技术效率时变,接着引入技术无效率项的异方差性,之后考虑观察数据中潜在的截面异质性,分别以引入随机截面特有项和设定随机系数的形式来表示截面

文章编号: 1000 22154 ( 2010 )05 20071 208 中图分类号: F064. 1文献标识码: A

一、引言

随机前沿模型( SF M ) 的理论最初由A igne r、Love l l和Schm id t(AL S) ( 1977 ) [ 1 ] , M eeu s en 和V a n den B r oeck (MB ) ( 1977 )[ 2 ]提出,并很快成为计量经济学中一个引人注目的分支,被广泛应用于效率测算和生

产率分析,尤其是在Jond r ow等( J LM S) ( 1982 )[ 3 ]指出各个生产单元的技术无效率可以通过条件分布[ u |

i

v i - u

i

]的期望 E [ u i | v i - u i ]或模M o de [ u i | v i - u i ]来估算以后。随机前沿分析( SFA ) 始于对生产最优

化的研究,经过30多年的发展,其在理论研究与实践应用方面都得到了深入的发展,已被尝试性地应用于生产经济学以外的领域,如劳动经济学、公共经济学以及金融经济学等。

SF M 假定,生产单位由于各种组织、管理及制度等非价格性因素导致生产过程中效率的损耗,而达不到最佳的前沿技术水平[4 ] 。SF M 的基本模型表述如下:

Y i = f (X

i

;β) exp ( v i - u i )

T E i = exp ( -

i = 1, 2, ?, N

u i )

(1 )

(2 )

其中: Y

i 代表第i个生产单位的产出; X

i

代表第i个生产单位的k ×1维投入向量; f (X

i

;β) exp ( v i ) 是随机

生产前沿;β为待估计的参数向量; T E

i

= exp ( - u i ) 表示技术效率; v i 是随机干扰项。

通常, SF M 假设v

i 、u

i

都是独立同分布的,然而,空间和区域经济学的研究都指出,地理接近性是产生

外部性和一系列相邻效应的关键因素。在技术扩散过程中,空间外部性起着重要作用,生产单元彼此独立的假设存在着很大漏洞。胡晶、魏传华和吴喜之( 2007 )提到,“任何一个地区的经济都不可能独立存在,它

收稿日期: 2009 - 03 - 08

基金项目: 教育部人文社会科学研究规划基金项目“面板数据随机前沿模型的空间计量经济分析”( 08JA790045 )

作者简介: 林佳显( 1983 - ) ,男,广东陆丰人,华南理工大学经济与贸易学院博士研究生,主要从事随机前沿分析和空间经济计量的研究;龙志和( 1954 - ) ,男,湖南安化人,华南理工大学经济与贸易学院教授,博士生导师,主要从事空间经济计量理论和实证的研究;林光平( 1948 - ) ,男,美籍华人,美国波特兰州立大学经济系教授,主要从事空间经济计量学、数理经济学、计算经济学等研究。

总是与其他经济区域间存在着各种各样的联系 。当某外生干扰对一个地区的经济造成冲击时 ,其产生的影

响往往会向外扩散 ,波及临近地区甚至更远的区域 。”[ 5 ]

如果生产单元间存在空间相互作用 , SF M 中没引 入空间计量分析可能会导致模型设定偏误 。

因此 ,本研究认为有必要把空间效应引入 SF M 分析框架中 ,将一般 SF M 扩展到空间 SF M ,避免由于 忽略空间效应所产生的模型估计偏误等问题 ,从而能更加客观地评估生产单元的效率 ,且进一步有助于开 展以效率测算为基础的后续相关研究 (如全要素生产率增长的研究等 ) 。

当前文献上 , SF M 中引入空间因素的计量分析鲜见 。D ru ska 和 Ho rrace ( 2004 )提出空间误差自相关固 定效应面板模型的 G MM 估计 ,随之将其引入 SF A 框架中 ,并对印度尼西亚的米业农场进行实证分析 ,结 果发现空间相关性确实影响农场效率的估计和排名

[ 6 ]

; Igli o ri ( 2005 ) 测算巴西亚马逊区域各市农业和牧

业的技术效率 ,并将空间计量分析引入技术效率外生决定因素的研究中 [ 7 ]

; Sch m id t 等 ( 2009 )分析巴西中

西部地区 370个市区农场的生产率 ,将潜在的空间结构引入 SF M 的单边误差项中 ,研究结果支持空间效应

的重要性

[ 8 ]

;胡晶 、魏传华和吴喜之 ( 2007 )构建了基于横截面数据的空间误差自相关 SF M ,并采用极大似

然方法对模型参数进行估计 。

综合目前国内外关于 SF M 空间计量分析的研究情况 ,尚存在以下不足 : ( 1 ) 已有的空间 SF M 仅考虑 空间误差自相关 ,缺乏对空间滞后模型的研究 ; ( 2 ) 已有的面板模型仅采用 G MM 估计方法研究固定效应 的情形 ,未见涉及随机效应模型和极大似然法 (ML )的研究 ; ( 3 ) 当面板的时间维度 T 较大时 ,技术效率非 时变 ( ti m e 2inva r ian t )的假设显得与实际不符 ; ( 4 ) 当技术无效率项存在异方差性时 ,其同方差的设定会使 模型参数估计有偏 ,导致技术效率测算不可靠 ; ( 5 ) 如果观察数据中存在非时变的潜在截面异质性 ( la t en t

c r o s s un i t he t e r ogene i ty )与技术效率不相关 ,忽略截面异质性的模型设定就会将这部分异质引入技术无效

率项的估计值中 ,由此得出的技术效率测算有偏 。

有鉴于此 ,作者在已有研究的基础上 ,进一步将空间效应引入 SF M 分析框架中 ,完善空间面板 SF M 的理论基础 ,同时考虑空间滞后因变量和空间误差自相关 ,并逐步放松模型设定条件 ,建立若干不同形式 的空间面板 SF M 。首先考虑技术效率时变 ,接着引入技术无效率项的异方差性 ,之后考虑观察数据中潜在 的截面异质性 ,分别以引入随机截面特有项 ( random fir m s p ec ific te r m )和设定随机系数的形式来表示截面 异质性 。针对各种模型设定形式提出相应的参数估计方法 ,最后给出各种模型相应技术效率的估计 。

二 、空间面板随机前沿模型及其估计

(一 ) 基本模型及其 M L 估计

在 SF M 中 ,与横截 面 数 据 相 比 较 , 面 板 数 据 更 能 提 供 生 产 单 元 技 术 效 率 可 靠 的 估 算 。P i tt 和 L e e

( 1981 )

[ 9 ]

, Schm id t 和 Sick le s ( 1984 )

[ 10 ]

将横截面 SF M 扩展到面板 SF M 。早期的面板模型都基于技术效率

非时变的假设 ,当面板的时间维度 T 较大时 ,这一假设显得与实际不符 。随后 , Co rn we ll 、Schm id t 和 Sick le s

( 1990 ) , Kum b haka r ( 1990 ) , L e e 和 Schm id t ( 1993 ) , B a t te s e 和 Coe l li ( 1995 ) , L e e ( 2006 ) , A h n 、L e e 和 这些有关技术效率时变的假设都遵从一个严格的函数结构 ,如 L e e 和 Schm id t ( 1993 )建议 = δ( t ) u i , 其

u it 2 - 1

中 δ( t ) = ∑δt d t , d t 是

虚 拟 变 量 ; Kum bhaka r ( 1990 ) 提 出 δ( t ) = [ 1 + exp (δ1 t +δ2 t ) ] ; B a

tte se 和 t

Coe lli ( 1995 ) 建议 δ( t ) = exp [ - δ( t - T ) ] 。

胡晶 、魏传华和吴喜之 ( 2007 )构建了基于横截面数据的空间误差自相关 SF M ,并采用极大似然方法

对模型参数进行估计 。现在本研究提出以下基于面板数据的空间 SF M ,同时考虑空间滞后因变量和空间 误差自相关 ,并放松了技术效率非时变的约束 ,且不赋予时变技术效率一定的函数结构 。为了便于描述 ,

f ( x,β) 采取对数线性 Cobb - Dougla s 函数形式 :

y t = α + x t β +λW 1 y t + v t - u t

v t = ρW 2 v t +ηt

( 3 )

( 4 )

其中 : y t = [ y 1 t , y 2 t , ?, y N t ] ′表示 N 个生产单位在第 t 时段 N ×1维的产出 (取对数 ) 向量 , x t 是 N 个生产 单位在第 t 时段 K ×1维投入 (取对数 ) 向量组成的 N ×K 维矩阵 , t = 1, 2, ?, T;β为待估计的 K ×1维参 数向量 ;α = α ×[ 1, 1, ?, 1 ] ′是 N ×1维的截距项向量 ; u t = [ u 1 t , u 2 t , ?, u N t ] ′≥ 0是 N ×1维的技术无 效率项向量 , 代表生产单位在第 t 时段的技术无效率程度 ; v t = [ v 1 t , v 2 t , ?, v N t ] ′是 N ×1维的双边误差项 向量 , 代表不可控的经济系统外部影响因素和数据测度误差等 ;ηt = [η1 t ,η2 t , ?,ηN t ] ′

是 N ×1维的随机 干扰项向量 ; W 1 、W 2

是空间权重矩阵 , 表示不同生产单位之间的空间相关性 , W 1 y t 为空间滞后因变量 , W 2 v t 为空间滞后误

差项 ;λ是待估计的空间自回归系数 ;ρ是待估计的空间误差自相关系数 。为了进行 ML 估计 , 模型假定 :

+

2 2

- 1

- 1

u t ~ iid N ( 0,ζu I ) , E ( u t u ′t ) = 0, t 1 ≠ t 2 ; v t ~ iid N ( 0,ζv

) , = [ ( I - ρ

W 2

) ] ′( I - ρW 2 )

,

∑ ∑ 1 2

2

E ( v t v ′t ) = 0, t 1 ≠ t 2 ;ηit ~ iid N ( 0,ζv ) , i = 1, 2, ?, N , t = 1, 2, ?, T 。另外 , u it 、ηit 和 x it 相互之间不相关 。 1 2

根据以上的假定 , 可得到如下的分布密度函数 :

N

2

f ( u t ) =

exp ( 5 )

2

πζ2

u

N

1

- 1 / 2

f ( v t ) =

∑ ( 6 )

2

πζ2

v N

1

- 1 / 2

f ( u t , v t ) =

exp ( 7 )

πζζ u v

设 εt = v t - u t , 则 ( u t ,εt ) 的联合分布密度函数为 :

- 1

N

(ε + u ) ′

(ε + u )

1

u ′u - 1 / 2

f ( u t ,εt ) =

∑ exp t t t t

t t

-

-

πζζ 2ζ2

2

2ζ u v

u v N

1

- 1 ( u 1ε′ζ2 - 1 / 2 ∑

exp - 1

ε - μ ) ′Ω - 1

( u - μ ) exp 2 ( 8 )

=

t

I +ζ v

- t t t t

t

πζu ζv

2

2

u

2

2

2

- 1 其中 :μt = - ζu [ζu I +ζv ∑]

ε

t

( 9 )

( 10 )

= ζ2 Ω ζ2 2 2

- 1

I - u (ζu I +ζv ∑)

u 将式 ( 8 ) 对 u t 求积分 , 得到 εt 的分布密度函数 :

f (εt ) =

f ( u t ,εt

) d u

t

N

1

1ε′ζ2 1 ( u - μ ) ′Ω - 1 ( u 0

- 1

ε - 1 / 2

|

exp = |

2 exp - μ ) d u - t

I +ζ v

- t

πζu ζv

t t t t

t 2

u

2

N

2

1ε′ζ2 I +ζ2 - 1 / 2

1

- 1

ε Φ Ω - 2μ ζ2

I +ζ2

v

exp ( 11 )

=

v

-

u

t t

t 2

π 2

u

其中 :Φ (·

) 是多元标准正态分布函数 , ζu

- 1 / 2

- 1 / 2

Ω - 1 / 2μ

2 2 ε ζu I +ζv ∑ ( 12 )

= - ζ

t

t

v

基于式 ( 11 ) , 可得到模型的对数似然函数 :

N T

T ll (α,β,ζu ,ζv ,λ,ρ

) = N T ln ( 2 ) - ln ( 2

π) 2 2 -

ln

2

ζu I +ζv

2

T T

1 ∑

ε′ζ2 I +ζ2

- 1

- 1 / 2

ε + ∑ln [Φ (Ω

μ ) ]

v

( 13 )

- t t t 2 u t = 1

t = 1

通过最大化对数似然函数式 ( 13 ) , 可得到上述模型的参数估计 (α^,β^,ζ^ ,ζ^ ,λ^,ρ^) 。 u v

(二 ) 考虑技术无效率项 u it 的异方差性

如果影响技术效率的因素随不同生产单位而有差异 ,那么技术无效率项 u i t 可能存在异方差 。Ku m b 2

haka r 和 Love l l ( 2000 )

[ 11 ]

指出 ,与经典线性回归模型相比较 ,由于 SF M 具有非对称的复合误差项结构 ,异

方差性问题在 SF M 框架中显得更加突出 ,尤其是当异方差性存在于单边误差项 u i t 中时 。异方差性可以出 现在单边误差项 u it 或双边误差项 v it 中 ,将之忽略不但会影响生产技术参数和误差项参数的估计推断 ,也

2ζι

- 1

- 1

E ( y t ) = ( I - λW 1 )

+ ( I - λW

x β

)

( 14 )

α -

1

t u N

π

1

1

其中 :ιN =

, 其它变量 、参数定义参见前文 。

?

1

N ×1

2

下面假设技术无效率项 u it 存在异方差 , u it ~ iid N ( 0,ζu i ) , 观察忽略异方差性所产生的问题 。此时 ,

式 ( 14 ) 将变成 :

+ N

- 1

- 1 E ( y t ) = ( I - λW 1 )

+ ( I - λW x β

) ( 15 )

α -

u i e i

1

t π i = 1

其中 : e i 是 N ×1维向量 , 第 i 个分量为 1, 其它分量为 0。

比较式 ( 14 ) 和式 ( 15 ) , 忽略 u it 中的异方差性将导致截距项的估计是有偏的 , 而由此导致生产技术参 数的估计也是有偏的 。此时 , 技术无效率项 u it 的估计式中 (参见本文第三部分 ) ,ζu i 将代替 ζu 。

当然 , 正如 Kum bhaka r 和 Love ll ( 2000 ) 所说的 , 在仅有横截面数据的情形下 , 估计每个生产单位的 ζ2

u i

显然不可 能 , 而 当 面 板 数 据 的 截 面 维 N 远 大 于 时 间 维 T 时 ,ζ2

估 计 也 不 大 可 行 。Kum bhaka r 和 u i 2

Love ll ( 2000 ) 建议采用相关变量 z i 的函数 g ( z i ;δ

) 代替 ζu i , 这样可大大有效减少待估计的参数 , 而又不会 忽略 u it 的异方差性 。

2 2 +

在前文模型假设的基础上 , 考虑技术无效率项 u it 的异方差性 , 令 u it ~ iid N ( 0,ζu i ) ,ζu i = g ( z i ;δ) , 下面给出模型的 ML 估计 。

+

由于 u it ~ iid N (

( δ

) u t = [ u 1 t , u 2 t , ?, u N t ] ′的分布密度函数式 ( 5 ) 变为 :

N

u 2 N

1

u 2

N

2

it

it

f ( u t ) =

exp exp ∑ ( 16 )

=

-

-

N

2 g ( z i ;δ) 2 g ( z i

;δ)

2

π i = ∏

i = 1

δ) g ( z ;

i i = 1 因此 , u t 与 v t 的联合分布密度函数式 ( 7 ) 变为 :

- 1

N

t ∑

t

1 N

2 u v ′ v 1

- 1 / 2

f ( u t , v t ) ∑

exp ( 17 )

=

it

-

- N

πζ

2 g ( z i ;δ) 2 ζ 2

v

g ( z i ;δ

) i = 1

v i = 1

1

1

? 0

? 0

ζ

2 g ( z ;δ

) u 1

1 同样地 , 令 εt = v t

u t , 并且 Q , 则式 ( 8 ) 变为 :

- =

?

ω ? 1

=

?

ω ?

1

?

?

ζ

2 g ( z ;δ

) N uN - 1

N

u 2

(ε + u t ) ′ (ε + u ) ∑

1

N

1

- 1 / 2

f ( u t ,εt ) =

exp t t t ∑

i t -

- πζ

N

2 g ( z i ;δ) 2 ζ 2

v

g ( z i ;δ

) i = 1

v i = 1

N

1 1

- 1 ( u - μ ) ′Θ ( u 1ε′ - 1 / 2

exp - μ )

exp Θ- 1 ε =

- Q - Q Q N

t

t t

t t t πζv

2 2

g ( z i ;δ

) i = 1

( 18 )

- 1

+ ∑ Θ 其中 :

= Q ( 19 )

ζ2 v

- 1

- 1 +

μt

- I εt

=

Q ( 20 )

Q ζ

2 v

同样地 , 将式 ( 18 ) 对 u t 求积分 , 式 ( 11 )εt 的分布密度函数变为 :

- 1

- 1

N

+ ∑

2

1

1 0

f (εt ) =

f ( u ,εt

) d u

t

1 εt Φ Θ μt

exp ε′t

2

( 21 )

=

- 1

Q - - Q Θ Q 2

Q 2

πζ ζ

2 v v

1

- 1

- 1

- 1

+

+

1

其中 :Θ 2μt =

- I εt Q ( 22 )

Q Q 2

2

ζv

ζv

因此 , 可得到模型的似然函数 : - 1

T

T

+ ∑

N

T T

1 1

- 1

ll (α,β,ζu ,ζv ,λ,ρ,δ

) = - 2

ln ( 2

πζv ) - 2 ln

- ∑

ε′(Q 2 - Q Θ Q )εt +

ln [Φ (Θ μ ) ]

∑ 2

Q t t

ζ

2

t = 1

t = 1

v

( 23 )

参数向量 (α,β,ζu ,ζv ,λ,ρ,δ

) 可通过对式 ( 23 ) 求最大化而得到 。 (三 ) 引入潜在的截面异质性

如果观察数据中存在非时变的潜在截面异质性 (可能是由于遗漏非时变的投入变量或忽视难于量化 或无法获得观测数据的解释变量等而造成的 )与技术效率不相关 ,忽略截面异质性的模型设定将会把部 分异质引入技术无效率项 u it 中 , 由此得出的 u it 的估计不仅包含真正意义上的技术无效率 ,同时也测算了 模型所忽略的截面异质性 ,这样势必会影响到最后有关技术效率的估算 [ 12 , 13 ]

。在不考虑空间相关性的一

般 SF M 中 , Greene ( 2005 )的实证结果支持了以上论述 。

下面本文所建立的空间面板 SF M ,不仅考虑技术无效率项 u it 的异方差性 ,还进一步将潜在的截面异 质性引入模型中 ,分别以引入随机截面特有项和设定随机系数的形式来表示截面异质性 ,并采用模拟 ML

( si m u l a t ed ML )进行估计 ,给出模拟对数似然函数 ( si m u l a t ed l og like l ihood func t i on )

[ 12 - 15 ]

1. 引入随机截面特有项

y t = α +ω + x t β +λ

W 1 y t + v t - u t ( 24 )

其中 :ω = [ω1 ,ω2 , ?,ωn ] ′, 将 ω看作已知的向量 , 以 ω为条件 , 则

u t 与 εt 的条件联合分布密度为 :

- 1

N 2

u

(ε + u t

′∑

+ u t )

(εt

1 N

) 1

- 1 / 2

f ( u t ,εt | ω) =

exp t it

-

-

N

πζ

2 g ( z i ;δ

) 2

ζ 2

v

g ( z i ;δ

) i = 1

v i = 1

N

1

1

- 1 ( u - μ ) Θ′ ( u - μ ) - 1ε′(Q - Q

Θ- 1 Q )ε - 1 / 2

exp (25)

=

exp N

πζv

t t t t

t t

2

2

g ( z i ;δ

) i = 1

其中 :Θ、

μt 的表达式参见式 ( 19 ) 及式 ( 20 ) 。 以 ω为条件 ,εt 的条件分布密度函数为 :

2

-

1

- 1 N

+

2

1

1 0

∫ t

t

t

f (εt | ω) =

f ( u ,ε | ω ) d u =

1

- Q Θ Q )εt

Φ Θ μt - 1

exp ε - ′t

(Q 2 Q 2

πζ 2 ζ2 v

v

( 26 )

1

其中 :Θ 2μt 的表达式参见式 ( 22 ) 。

ω

由于 f (εt ) =

f (εt

| ω) g (ω;θ) d ω等价于 E

ω

, 从 ω的联合概率分布 g (ω;θ) 中模拟抽取

f (εt | ω)

足够多的样本 , 代入式 ( 26 ) , 并对其取平均 , 能够得到 E ω [ f (εt |

ω ) ]充分精确的估计 。用 ω( r ) 表示从 g (ω; θ) 中的第 r 次抽样 , r = 1, 2 ?, R , 可得 :

1

- 1

- 2

R

N

+

1

1

1

f (εt ) =

Φ Θ μ | ω

- 1

εt ω

Θ Q

2 Q t R r = 1

2

πζv r

ζ

2 r

v

( 27 )

基于式 ( 27 ) , 可得到模拟对数似然函数如下T

R

1

ll (α,β,ζu ,ζv ,λ,ρ,δ,θ) =

∑ln

R ∑

×

t = 1

r = 1

1 (ε′| ω 1

) (Q - Q Θ- 1

Q ) (ε | ω

) Φ Θ μexp ( 28 )

- 2 ω t ( r )

t ( r ) t

( r )

2

当然 , 为了使模拟 ML 实际可行 , 能够在 ω的联合分布 g (ω;θ) 中抽取样本 , 我们令 ω =θ

ω0 , 其中 ω0 的分布参数已知 , 比如 ,ω服从联合正态分布 , 那么 θ就是其标准差 , 而 ω0 ~ N [ 0, I ]。只要式 ( 28 ) 是平滑 并且连续二阶可微的 , 以上模拟方法是可行的

[ 12, 14, 15 ]

。由于实际上积分不需要运算 , 一般来说 , 假设任何 ω 的

分布都可以进行模拟抽样 , 构建模拟对数似然函数 。

2. 随机系数模型

在模型式 ( 24) 的基础上 ,放宽确定性斜率系数 β的设定 ,让其具有随机性

[ 16 ]

,进一步考虑截面异质性 :

y t = α +ω + x t βi +λW 1 y t

( 29 )

( 30 )

+ v t - u t βi ~ iid N (β,Ξ)

变量 、参数定义及其它假设参见前文 。实质上 , 上述模型可等价于 :

y t = α +ω + x t βˉ +λW 1 y t + v t

( 31 )

( 32 )

- u t 2

v t ~ iid N ( 0,ζv

∑ + M )

其中 : M = x ′t

Ξ x t 。

模拟似然函数的求解采用

+

1

M ∑ 代替式 ( 25 ) 至式 ( 28 ) 中的

即可 。

当然 , 在进行实证研究 ζ

2 v

2

时 , 还需对 βi 的方差协方差阵 Ξ的设定做进一步的研究 , 譬如一种简单可行的处理方法是令 Ξ = ζβ I , 此 2

2

时式 ( 30 ) 变为 βi ~ iid N (β,ζβ I ) , 模型新增一个待估计的参数 ζβ。而当 Ξ = 0k ×k 时 , 模型就回复到式 ( 24 ) 的形式 , 不再具有随机系数 。

如果不考虑空间相关性 , 即 ∑ = I , 此时随机系数模型相当于一般双异方差面板 SF M , 同时考虑 v it 和

u it 的异方差性 。

三 、技术效率估计

上述所有模型的参数估计不是最终目的 ,令人感兴趣的还有生产单位技术效率的估计 。AL S 建议采用

[ 1 - E ( u ) ]来估计所有生产单位的平均技术效率 ; L e e 和 Tyle r ( 1978 ) 提出 TE = E ( ex p { - u } ) ; JLM S

( 1982 )指出各个生产单元的技术无效率项 u i 可以通过 E ( u i |εi )或 Mode ( u i |εi )来估算 ,第 i 个生产单位 的技术效率 TE i = exp { u ^i } ,其中 u ^i = E ( u i |εi )或 Mode ( u i |εi ) ; B a t te s e 和 Coe l li ( 1988 )则提出 TE i = E ( exp { - u i } |εi ) 。

基于 JL M S ( 1982 )的方法 ,本文给出针对前文所述各种模型的技术效率估计 。 首先估计模型式 ( 3 )及式 ( 4 )的技术效率 , u t 的条件分布密度函数为 :

f (

u t ,εt ) 1 - 1

f ( u t | εt ) = - μt ) ′Ω ( u t - μt )

( 33 ) exp ( u t - f (t ) 2 1

- | Ω |

1 / 2

(ζ2 I +ζ2

)

1 / 2

其中 , v

( 34 )

= ζu ζv

u - 1 / 2

μt 、Ω、Ω

μt 分别参见式 ( 9 ) 、式 ( 10 ) 易见式 ( 33 ) 是一个 N 维截尾正态分布 N M o ( 35 )

E ( u it | εt ) = μ-( 36 )

r k t

k = 1

1

-

1

其中 ,Φ ·是标准正态分布函数 ; < ·是标准正态密度函数 ; c ig 是 Ω 2 的第 i 行 ; r k t 是 - Ω μt 的第 k 个

分量 。

所以 , 第 i 个生产单位在第 t 时段的技术效率为 :

N

^ 1

TE it = exp { - u ^ } = exp - μ - ∑< μ 或 exp ( 37 )

c Φ - r k t i t it ik it

- r k = 1

k t - 1

当考虑技术无效率项 u it 的异方差性时 , 技术效率的估计参见式 ( 37 ) , 其中 , c ig 是 Θ 的第 i 行 ; r k t 是 1

1

- Θ 2μt 的第 k 个分量 ;Θ、μt 、Θ 2μt 分别参见式 ( 19 ) 、式 ( 20 ) 及式 ( 22 ) 。

当引入随机截面特有项 ωi 时 , 技术效率的估计等同于考虑 u it 异方差性时的情形 , 只是计算中所要求

R R 的 ω用其模拟抽样的均值 1

ω 来代替 。而随机系数模型的技术效率估计 , 除了用 1 ∑

ω 代替 ω之

( r ) ( r )

R r = 1 R r = 1

1

M 外 , 还要将 ∑替换成 ∑

+ 。

ζ

2 v

四 、研究结论与展望

本研究构建了空间面板 SF M 的理论基础 ,进一步将空间效应引入 SF M 分析框架中 ,同时考虑空间滞

后因变量和空间误差自相关 ,并逐步放松模型设定条件 ,建立若干不同形式的空间面板 SF M 。首先放松技 术效率非时变的约束 ,考虑时变的技术效率 ,且不赋予技术效率一定的函数结构 ; 接着引入技术无效率项

2

u it 的异方差性 , 当面板数据的截面维 N 远大于时间维 T 时 , 直接估计每个生产单元的 ζu i 不大可行 , 本文采 2

用相关变量 z i 的函数 g ( z i ;δ

)来代替 ζu i ; 之后考虑观察数据中潜在的截面异质性 , 通过两种形式来考察 截面异质性 :其一是在模型中引入一个非时变的随机截面特有项 ωi , 并为其设定某种常用的概率分布 ; 其

二是放宽确定性斜率系数 β的设定 , 让其具有随机性 。针对上述各种模型设定形式提出相应的参数估计 方法 , 最后给出各种模型相应技术效率的估计 。

为了行文的方便 , 本研究仅考虑随机前沿生产函数模型 , 研究结果只要略作改动 , 可以直接应用到随 机前沿成本函数模型 , 用以研究成本效率 。

当然 , 本文还有进一步深入研究的空间 。譬如就空间误差自相关模型形式而言 , 除考虑随机干扰项 v t

具有空间相关性外 , 还可将空间误差自相关结构运用于技术无效率项 u it 。就技术无效率项 u it 而言 ,首先可 以为其设定其它概率分布形式 ,如截尾正态分布 、指数分布以及 Gamm a 分布等 ;其次可以放宽其在截面维

度N 和时间维度T上都是独立同分布的假设,对于一个生产单元来说,其技术效率在时间上具有一定相关性的假设应该更接近现实,而同地区同行业生产单元之间技术效率相互独立的约束条件也未免显得比较强。在模型估计方法方面,除了ML (或模拟ML )法,还可以进一步研究其它方法,譬如G MM、贝叶斯分析。本文以上研究结果均可用于将来进行的实证研究。

参考文献:

[ 1 ] A I G N E R D , LOV E LL K, SCH M I D T P. Fo r m u l a t i on and E s ti m a t i on of St ocha s tic F r on t ie r P r oduc t i on Func t i on Mode l s [ J ].

Jou r na l of Econom e t ric s, 1977 ( 6): 21- 37.

[ 2 ]M EEU S E N W , VAN D E N BRO E CK J. Effic i ency E s ti m a t i on fr om Cobb2Dougla s P r oduc t i on Func t i on s w ith Compo s ed E r r o r[ J ].

I n t e r na t i ona l Econom ic R e vie w, 1977 ( 18 ): 435 - 444.

[ 3 ] J ONDROW J , LOV E LL K, MA T EROV I, SCHM I D T P. O n the E s ti m a t i on of Techn i ca l I neffic i ency in the St ocha s tic F r on t ie r P r oduc t i on Func t i on Mode l[ J ]. Jou r na l of Econom e t ric s, 1982 ( 19 ): 233 - 238.

[ 4 ]涂正革,肖耿.中国的工业生产力革命———用随机前沿生产模型对中国大中型工业企业全要素生产率增长的分解及分析[ J ]. 经济研究, 2005 ( 3) : 4 - 15.

[ 5 ]胡晶,魏传华,吴喜之.空间误差自相关随机前沿模型及其估计[ J ]. 统计与信息论坛, 2007 , 22 ( 2): 26- 28.

[ 6 ]DRU S K A V , HORRACE W. Gene r a l ized Mom e n t s E s ti m a t i on f o r Sp a t ia l Pane l D a t a: I ndone s ian R ice Fa r m ing [ J ]. Am e r ican Jou r na l of A g ricu l tu r a l Econom ic s, 2004 , 86 ( 1): 185 - 198.

[ 7 ] I G L I O R I D. D e t e r m inan t s of Techn i ca l Effic i ency in A g ricu l tu r e and Ca t tle R a nch i ng: A Sp a t ia l A n a l ysis f o r the B razilian Am a zon [ C ]. P r oceed i ngs of the 33 th B razilian Econom ic s M ee t ing, 2005.

[ 8 ] S CH M I D T A , MOR E I RA A , H E L F AND S, e t a l. Sp a t ia l St ocha s tic F r on t ie r Mode l s: A c coun t ing f o r U n ob s e r ved Loca l

D e t e r m inan t s of I neffic i ency[ J ]. Jou r na l of P r oduc t ivity A n a l ysis, 2009 ( 31 ): 101 - 112.

[ 9 ] P I TT M , L E E L. the M ea s u r e m en t and S ou r ce s of Techn i ca l I neffic i ency in I ndone s ian W eaving I ndu s try [ J ]. Jou r na l of

D e ve l opm en t Econom ic s, 1981 ( 9): 43 - 64.

[ 10 ] SCH M I D T P, S I CK L E S R. P r oduc t i on F r on t ie r s and Pane l D a t a [ J ]. Jou r na l of B u s ine s s and Econom ic Sta t istic s, 1984, 2 ( 4 ): 367- 374.

[ 11 ] K UMBHA K AR S, LOV E LL K. St ocha s tic F r on t ie r A n a l ysis[M ]. Cam b r idge: Cam b r idge U n i ve r sity P r e s s, 2000: 115 - 130.

[ 12 ] GR E EN E W. F i xed and R a ndom Effec t s in St ocha s tic F r on t ie r Mode l s[ J ]. Jou r na l of P r oduc t ivity A n a l ysis, 2005 ( 23 ): 7- 32. [ 13 ] GR E E N E W. R e con s ide r ing H e t e r ogene i ty in Pane l D a t a E s ti m a t o r s of the St ocha s tic F r on t ie r Mode l [ J ]. Jou r na l of Econom e t ric s, 2005 ( 126 ): 269 - 303.

[ 14 ] GR E EN E W. Si m u l a t ed L ike l ihood E s ti m a t i on of the No r m a l2Gamm a St ocha s tic F r on t ie r Func t i on [ J ]. Jou r na l of P r oduc t ivity

A n a l ysis, 2003 ( 19) : 179- 190.

[ 15 ] G OUR I EROUX C, M ON F OR T A. Si m u l a t i on B a s ed Econom e t ric s[M ]. N e w Yo r k: O x fo r d U n i ve r sity P r e s s, 1996: 41- 49.

Spa t i a l Pan e l S t ocha st i c Fron t i er M ode l an d Techn i ca l Eff ic ien c y E s t i m a t i on

L IN J ia2xian1 , LON G Zh i2he1 , L IN Kuang2p ing2

( 1. S chool of Econo m ics and C o mm ence, S ou th Ch ina U n i versity of Technology, Guangzhou 510006, Ch ina;

2. D epa rt m en t of Econo m ics, Portland S ta te U n i versity, Portland 97207, U S A )

A b s tra c t: St ocha s tic fr on t ie r mode l is one of i m po r tan t m e t hod s f o r m e a s u r ing techn i ca l effic i ency. Gene r a l ly, the mode l a s sum e s tha t p r oduc t i on un i ts a r e indep e nden t of each o t he r.Howeve r, s p a t ia l exte r na l itie s p lay an i m po r tan t r o l e in d i ffu s ing techn i ca l p r ogre s s and po i n t s in s p a ce a r e co2re l a t ed.

B y com b i n i ng st ocha s tic fr on t ie r p r oduc t i on theo r y w ith s p a t ia l econom e t ric ana l ysis, we p r opo s e a s p a t ia l p a ne l st ocha s tic fr on t ie r mode l in wh i ch bo t h of s p a t ia l ly lagged dep e nden t va r iab l e s and s p a t ia l ly au t o r egre s sive e r r o r te r m s a r e con s ide r ed, a t the sam e ti m e, we re l ax the mode l a s su mp ti on s tha t see m t o be str ong one s. F i rstly, ti m e2va r ying techn i ca l effic i ency mode l is ana l yzed. Second l y, the con s equence of he t e r o s keda s tic i ty in the techn i ca l ineffic i ency is inve s tiga t ed. Then, we con s ide r s om e exten s i on s tha t accoun t fo r the la t en t c r o s s un i t he t e r ogene i ty. Exp lic i t mode l s f o r unm e a s u r ed c r o s s un i t he t e r ogene i ty a r e bu i lt in t o the st ocha s tic fr on t ie r. E s ti m a t i on m e t hod s f o r va r i ou s k i nd s of ref o r m u l a t ed mode l s a r e p re s en t ed. F i na l ly, we focu s on the e s ti m a t i on and comp a r is on of techn i ca l effic i ency m e a s u r e s.

Key word s: technical efficiency; st ochastic fr ontier; s patial econo metrics; maxi m u m likelihood; si m ulated likelihood functi on

(责任编辑孙敬水)

MATLAB空间面板数据模型操作介绍

MATLAB空间面板数据模型操作简介 MATLAB安装:在民主湖资源站上下载MA TLAB 2009a,或者2010a,按照其中的安装说明安装MATLAB。(MATLAB较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局: 首先我们说一下MA TLAB处理空间面板数据时,数据文件是怎么布局的,熟悉eviews的同学可能知道,eviews中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中“1-94”“1-95”“1-96”“1-97”中,1是省份的代号,94,95,96,97表示年份,eviews是将每个省份的数据放在一起,再将所有省份堆放在一起。 与eviews不同,MATLAB处理空间面板数据时,面板数据的布局是(在excel中说明):先排放一个横截面上的数据(即某年所有省份的数据),再将不同年份的横截面按时间顺序堆放在一起。如图:

这里需要说明的是,MA TLAB中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。 二、数据的输入: MATLAB与excel链接:在excel中点击“工具→加载宏→浏览”,找到MA TLAB的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为:C:\Programfiles\MATLAB\R2009a\toolbox\exlink,点击excllink.xla即可完成excel与MATLAB的链接。这样的话excel中的数据就可以直接导入MATLAB中形成MATLAB的数据文件。操作完成后excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB”即表示我们希望excel 与MATLAB实现链

随机前沿模型(SFA)-原理解读

随机前沿模型(SFA )原理和软件实现 一、SFA 原理 在经济学中,常常需要估计生产函数或者成本函数。生产函数f (x)的定义为:在给定投入x 情况下的最大产出。但现实中的产商可能达不到最大产出的前沿,为了,假设产商i 的产量为: i i i y f (x ,)βξ= (1) 其中,β为待估参数;i ξ为产商i 的水平,满足i 01ξ<≤。如果i =1ξ,则产商i 正好处于效率前沿。同时,考虑生产函数还会受到随机冲击,故将方程(1)改写成: i v i i i y f (x ,)e βξ= (2) 其中,i v e 0>为随机冲击。方程(2)意味着生产函数的前沿i v i f (x ,)e β是随机的,故此类模型称为“随机前沿模型”(stochastic frontier model )。随机前沿模型最早由Aigner, Lovell and Schmidt(1977)提出,并在实证领域运用广泛,Kumbhakar and Lovell(2000)为该领域的研究写了一本著作,有兴趣的同学可以去参考。 假设o k 1i 1i ki f (x ,)e x x ββββ=L (柯布道格拉斯生产函数,共有K 个投入品),则对方程(2)取对数可得: K i 0k ki i i k 1ln y =+ln x ln ββξν=++∑ (3) 由于i 01ξ<≤,故i ln 0ξ≤。定义i i u =-ln 0ξ≥,则方程3可以写成: K i 0k ki i i k 1ln y =+ln x -u ββν=+∑ 其中,i u 0≥为“无效率”项,反映产商i 距离效率前沿面的距离。混合扰动项 i i i ενμ=-分布不对称, 使用OLS 估计不能估计无效率项i u 。为了估计无效率项i u ,必须对i i νμ、的分布作出假设,并进行更有效率的MLE (最大似然估计)估计。 一般,无效率项的分布假设有如下几种: (1) 半正态分布 (2) 截断正态分布 (3) 指数分布 在一般的论文中,使用的最多的是半正态分布 随机前沿模型可以很容易地用于估计成本函数,经过与生产函数的随机前沿模型类似的推导可得: K i 0y i k ki i i k 1ln c =+lny ln P +u βββν=++∑

六步学会用MATLAB做空间计量回归详细步骤

1.excel与MATLAB链接: Excel: 选项——加载项——COM加载项——转到——没有勾选项 2. MATLAB安装目录中寻找toolbox——exlink——点击,启用宏 E:\MATLAB\toolbox\exlink 然后,Excel中就出现MATLAB工具 (注意Excel中的数据:) 3.启动matlab (1)点击start MATLAB (2)senddata to matlab ,并对变量矩阵变量进行命名(注意:选取变量为数值,不包括各变量) (data表中数据进行命名) (空间权重进行命名) (3)导入MATLAB中的两个矩阵变量就可以看见 4.将elhorst和jplv7两个程序文件夹复制到MATLAB安装目录 的toolbox文件夹

5.设置路径: 6.输入程序,得出结果 T=30; N=46; W=normw(W1); y=A(:,3); x=A(:,[4,6]); xconstant=ones(N*T,1); [nobs K]=size(x); results=ols(y,[xconstant x]); vnames=strvcat('logcit','intercept','logp','logy'); prt_reg(results,vnames,1); sige=results.sige*((nobs-K)/nobs); loglikols=-nobs/2*log(2*pi*sige)-1/(2*sige)*results.resid'*results.resid % The (robust)LM tests developed by Elhorst LMsarsem_panel(results,W,y,[xconstant x]); % (Robust) LM tests 解释

贝叶斯空间计量模型

贝叶斯空间计量模型集团企业公司编码:(LL3698-KKI1269-TM2483-LUI12689-ITT289-

贝叶斯空间计量模型一、采用贝叶斯空间计量模型的原因 残差项可能存在异方差,而ML估计方法的前提是同方差,因此,当残差项存在异方差时,采用ML方法估计出的参数结果不具备稳健性。二、贝叶斯空间计量模型的估计方法 (一)待估参数 对于空间计量模型(以空间自回归模型为例) 假设残差项是异方差的,即 上述模型需要估计的参数有: 共计n+2个参数,存在自由度问题,难以进行参数检验。 服从自由度为r的卡方分布。如为此根据大数定律,增加了新的假设:v i 此以来,待估参数将减少为3个。 (二)参数估计方法 采用MCMC(MarkovChainMonteCarlo)参数估计思想,具体的抽样方法选择吉布斯抽样方法(Gibbssamplingapproach) 在随意给定待估参数一个初始值之后,开始生成参数的新数值,并根据新数值生成其他参数的新数值,如此往复,对每一个待估参数,将得到一组生成的数值,根据该组数值,计算其均值,即为待估参数的贝叶斯估计值。 三、贝叶斯空间计量模型的类型 空间自回归模型far_g()

空间滞后模型(空间回归自回归混合模型)sar_g() 空间误差模型sem_g() 广义空间模型(空间自相关模型)sac_g() 四、贝叶斯空间模型与普通空间模型的选择标准 首先按照参数显着性,以及极大似然值,确定普通空间计量模型的具体类型,之后对于该确定的类型,再判断是否需要进一步采用贝叶斯估计方法。 标准一:对普通空间计量模型的残差项做图,观察参数项是否是正态分布,若非正态分布,则考虑使用贝叶斯方法估计。 技巧:r=30的贝叶斯估计等价于普通空间计量模型估计,此时可以做出v的分布图,观察其是否基本等于1,若否,则应采用贝叶斯估计方法。 标准二:若按标准一发现存在异方差,采用贝叶斯估计后,如果参数结果与普通空间计量方法存在较大差异,则说明采用贝叶斯估计是必要的。 例1:选举投票率普通SAR与贝叶斯SAR对比: loadelect.dat; loadford.dat; y=elect(:,7)./elect(:,8); x1=elect(:,9)./elect(:,8); x2=elect(:,10)./elect(:,8); x3=elect(:,11)./elect(:,8);

贝叶斯空间计量模型

贝叶斯空间计量模型 Prepared on 22 November 2020

贝叶斯空间计量模型 一、采用贝叶斯空间计量模型的原因 残差项可能存在异方差,而ML估计方法的前提是同方差,因此,当残差项存在异方差时,采用ML方法估计出的参数结果不具备稳健性。 二、贝叶斯空间计量模型的估计方法 (一)待估参数 对于空间计量模型(以空间自回归模型为例) 假设残差项是异方差的,即 上述模型需要估计的参数有: 共计n+2个参数,存在自由度问题,难以进行参数检验。 为此根据大数定律,增加了新的假设:v i服从自由度为r的卡方分布。如此以来,待估参数将减少为3个。 (二)参数估计方法 采用MCMC(Markov Chain Monte Carlo)参数估计思想,具体的抽样方法选择吉布斯抽样方法(Gibbs sampling approach) 在随意给定待估参数一个初始值之后,开始生成参数的新数值,并根据新数值生成其他参数的新数值,如此往复,对每一个待估参数,将得到一组生成的数值,根据该组数值,计算其均值,即为待估参数的贝叶斯估计值。

三、贝叶斯空间计量模型的类型 空间自回归模型 far_g() 空间滞后模型(空间回归自回归混合模型) sar_g() 空间误差模型 sem_g() 广义空间模型(空间自相关模型) sac_g() 四、贝叶斯空间模型与普通空间模型的选择标准 首先按照参数显着性,以及极大似然值,确定普通空间计量模型的具体类型,之后对于该确定的类型,再判断是否需要进一步采用贝叶斯估计方法。 标准一:对普通空间计量模型的残差项做图,观察参数项是否是正态分布,若非正态分布,则考虑使用贝叶斯方法估计。 技巧:r=30的贝叶斯估计等价于普通空间计量模型估计,此时可以做出v的分布图,观察其是否基本等于1,若否,则应采用贝叶斯估计方法。 标准二:若按标准一发现存在异方差,采用贝叶斯估计后,如果参数结果与普通空间计量方法存在较大差异,则说明采用贝叶斯估计是必要的。 例1:选举投票率普通SAR与贝叶斯SAR对比: load ; load ; y=elect(:,7)./elect(:,8);

面板数据的计量方法

1.什么是面板数据? 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是截面数据与时间序列综合起来的一种数据资源,是同时在时间和截面空间上取得的二维数据。 如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。 如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为: 北京市分别为8、9、10、11、12; 上海市分别为9、10、11、12、13; 天津市分别为5、6、7、8、9; 重庆市分别为7、8、9、10、11(单位亿元)。 这就是面板数据。 2.面板数据的计量方法 利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000 年30 个省份的农业总产值数据。固定在某一年份上,它是由30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。面板数据由30 个个体组成。共有330 个观测值。 面板数据模型的选择通常有三种形式:混合估计模型、固定效应模型和随机效应模型 第一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。 第二种是固定效应模型(Fixed Effects Regression Model)。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。(1)个体固定效应模型。 个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型。注意:个体固定效应模型的EViwes输出结果中没有公共截距项。 (2)时刻固定效应模型。 时刻固定效应模型就是对于不同的截面(时刻点)有不同截距的模型。如果确知

MATLAB空间面板数据模型操作介绍

MATLAB 空间面板数据模型操作简介 MATLAB 安装: 在民主湖资源站上下载 MA TLAB 2009a ,或者 2010a ,按照其中的安装说明 安装 MATLAB 。( MATLAB 较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局 首先我们说一下 MA TLAB 处理空间面板数据时,数据文件是怎么布局的,熟悉 eviews 的同学 可能知道, eviews 中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间 序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中 “1-94”“1-95” “1-96” “ 1-97”中, 1是省份的代号, 94,95,96,97 表示年份, eviews 是将每个省 份的数据放在一起,再将所有省份堆放在一起。 与 eviews 不同, MATLAB 处理空间面板数据时,面板数据的布局是(在 excel 中说明): 先排 放一个横截面上的数据(即某年所有省份的数据) ,再将不同年份的横截面按时间顺序堆放在一起。 如图:

这里需要说明的是, MA TLAB 中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。二、数据的输入: MATLAB 与 excel链接:在 excel中点击“工具→加载宏→浏览” ,找到 MA TLAB 的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为: C:\Programfiles\MATLAB\R2009a\toolbox\exlink ,点击 excllink.xla 即可完成 excel 与 MATLAB 的链接。这样的话 excel 中的数据就可以直接导入 MATLAB 中形成 MATLAB 的数据文件。操作完成后 excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB ”即表示我们希望 excel 与

空间面板数据分析——R的splm包资料

空间面板数据分析——R的splm包 (任建辉,暨南大学) The splm package provides methods for fitting spatial panel data by maximum likelihood and GM. 安装R软件及其编辑器Rstudio 网址:https://www.360docs.net/doc/fe253657.html, https://www.360docs.net/doc/fe253657.html,/ 下载好Rstudio以后,操作都可以Rstudio中完成了,包括命令的编写、命令运行、图形展示,最方便的要数查看数据了。 R界面 Rstudio界面,形如matlab

下面进入正题,了解splm包中的数据、命令及结果展示。所有命令都写在编辑窗口(studio 左上区域),可以单独的运行每行命令,也可选取一段一起执行,点run按钮。 1、首先,安装splm包并导入,命令如下: intall.packages(“splm”),选择最近的下载点 library(splm) > library(splm) 载入需要的程辑包:MASS 载入需要的程辑包:nlme 载入需要的程辑包:spdep 载入需要的程辑包:sp 载入需要的程辑包:Matrix 载入需要的程辑包:plm 载入需要的程辑包:bdsmatrix 载入程辑包:‘bdsmatrix’ 下列对象被屏蔽了from ‘package:base’: backsolve 载入需要的程辑包:Formula 载入需要的程辑包:sandwich 载入需要的程辑包:zoo 载入程辑包:‘zoo’ 下列对象被屏蔽了from ‘package:base’: as.Date, as.Date.numeric 载入需要的程辑包:spam 载入需要的程辑包:grid Spam version 0.40-0 (2013-09-11) is loaded. Type 'help( Spam)' or 'demo( spam)' for a short introduction and overview of this package. Help for individual functions is also obtained by adding the suffix '.spam' to the function name, e.g. 'help( chol.spam)'. 载入程辑包:‘spam’ 下列对象被屏蔽了from ‘package:bdsmatrix’:

随机前沿模型-原理解读

一、SFA 原理 在经济学中,常常需要估计生产函数或者成本函数。生产函数f (x)的定义为:在给定投入x 情况下的最大产出。但现实中的产商可能达不到最大产出的前沿,为了,假设产商i 的产量为: i i i y f (x ,)βξ= (1) 其中,β为待估参数;i ξ为产商i 的水平,满足i 01ξ<≤。如果i =1ξ,则产商i 正好处于效率前沿。同时,考虑生产函数还会受到随机冲击,故将方程(1)改写成: i v i i i y f (x ,)e βξ= (2) 其中,i v e 0>为随机冲击。方程(2)意味着生产函数的前沿i v i f (x ,)e β是随机的,故此类模型称为“随机前沿模型”(stochastic frontier model )。随机前沿模型最早由Aigner, Lovell and Schmidt(1977)提出,并在实证领域运用广泛,Kumbhakar and Lovell(2000)为该领域的研究写了一本著作,有兴趣的同学可以去参考。 假设o k 1i 1i ki f (x ,)e x x ββββ=L (柯布道格拉斯生产函数,共有K 个投入品),则对方程(2)取对数可得: K i 0k ki i i k 1ln y =+ln x ln ββξν=++∑ (3) 由于i 01ξ<≤,故i ln 0ξ≤。定义i i u =-ln 0ξ≥,则方程3可以写成: K i 0k ki i i k 1ln y =+ln x -u ββν=+∑ 其中,i u 0≥为“无效率”项,反映产商i 距离效率前沿面的距离。混合扰动项 i i i ενμ=-分布不对称,使用OLS 估计不能估计无效率项i u 。为了估计无效率项i u ,必须对i i νμ、的分布作出假设,并进行更有效率的MLE (最大似然估计)估计。 一般,无效率项的分布假设有如下几种: (1)半正态分布 (2)截断正态分布 (3)指数分布 在一般的论文中,使用的最多的是半正态分布 随机前沿模型可以很容易地用于估计成本函数,经过与生产函数的随机前沿模型类似的推导可得: K i 0y i k ki i i k 1ln c =+lny ln P +u βββν=++∑

面板数据的计量方法

面板数据的计量方法 1.什么是面板数据? 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是截面数据与时间序列综合起来的一种数据资源,是同时在时间和截面空间上取得的二维数据。 如:城市名:北京、上海、重庆、天津的GDP分别为10、11、9、8(单位亿元)。这就是截面数据,在一个时间点处切开,看各个城市的不同就是截面数据。如:2000、2001、2002、2003、2004各年的北京市GDP分别为8、9、10、11、12(单位亿元)。这就是时间序列,选一个城市,看各个样本时间点的不同就是时间序列。 如:2000、2001、2002、2003、2004各年中国所有直辖市的GDP分别为: 北京市分别为8、9、10、11、12; 上海市分别为9、10、11、12、13; 天津市分别为5、6、7、8、9; 重庆市分别为7、8、9、10、11(单位亿元)。 这就是面板数据。 2.面板数据的计量方法 利用面板数据建立模型的好处是:(1)由于观测值的增多,可以增加估计量的抽样精度。(2)对于固定效应模型能得到参数的一致估计量,甚至有效估计量。(3)面板数据建模比单截面数据建模可以获得更多的动态信息。例如1990-2000 年30 个省份的农业总产值数据。固定在某一年份上,它是由30 个农业总产值数字组成的截面数据;固定在某一省份上,它是由11 年农业总产值数据组成的一个时间序列。面板数据由30 个个体组成。共有330 个观测值。 面板数据模型的选择通常有三种形式:混合估计模型、固定效应模型和随机效应模型 第一种是混合估计模型(Pooled Regression Model)。如果从时间上看,不同个体之间不存在显著性差异;从截面上看,不同截面之间也不存在显著性差异,那么就可以直接把面板数据混合在一起用普通最小二乘法(OLS)估计参数。 第二种是固定效应模型(Fixed Effects Regression Model)。在面板数据散点图中,如果对于不同的截面或不同的时间序列,模型的截距是不同的,则可以采用在模型中加虚拟变量的方法估计回归参数,称此种模型为固定效应模型(fixed effects regression model)。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model)、时刻固定效应模型(time fixed effects regression model)和时刻个体固定效应模型(time and entity fixed effects regression model)。(1)个体固定效应模型。 个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序列(个体)截距是不同的,但是对于不同的横截面,模型的截距没有显著性变化,那么就应该建立个体固定效应模型。注意:个体固定效应模型的EViwes输

空间面板数据计量经济分析

空间面板数据计量经济分析 空间面板数据计量经济分析 *以上分别介绍了区域创新过程中空间效应(依赖性和异质性)的空间计量检测,以及纳入空间效应的计量模型的估计方法——空间常系数回归模型(空间滞后模型,SLM 和空间误差模型,SEM )和空间变系数回归模型(地理加权回归模型,GWR );同时还介绍和分析了面板数据(Panel Data )计量经济学方法的估计和检验。 *可以看出,目前的空间计量经济学模型使用的数据集主要是截面数据,只考虑了空间单元之间的相关性,而忽略具有时空演变特征的时间尺度之间的相关性,这显然是一个美中不足。 *Anselin (1988)也认识到这一点。当然,大多学者通过将多个时期截面数据变量计算多年平均值的办法来综合消除时间波动的影响和干扰,但是这种做法仍然造成大量具有时间演变特征的创新行为信息的损失,从而无法科学和客观地认识和揭示具有时空二维特征的研发与创新过程的真实机制。*面板数据(Panel Data )计量经济模型作为目前一种前沿的计量经济估计技术,由于其可以综合创新行为变量时间尺度的信息和截面(地域空间)单元的信息,同时集成考虑了时间相关性和空间(截面)相关性,因而能够科学而客观地反映受到时空交互相关性作用的创新行为的特征和规律,是定量揭示研发、知识溢出与区域创新相互作用关系的有效方法。但是,限于在所有时刻对所有个体(空间)均相等的假定(即不考虑空间效应),面板数据计量经济学理论也有其美中不足之处,具有很大的改进余地。 *鉴于空间计量经济学理论方法和面板数据计量经济学理论方法各有所长,把面板数据模型的优点和空间计量经济学模型的特点有机结合起来,构建一个综合考虑了变量时空二维特征和信息的空间面板数据计量经济模型,则是一种新颖的研究思路。以下根据空间计量经济模型和标准的面板数据模型[1]的建模思路,提出空间面板数据(Spatial Panel Data Model ,SPDM )模型的建模思路和过程。 [1]与动态面板数据模型的建模思路类似,只要施加一些假定,引入因变量的滞后项,则为空间动态面板数据模型。 空间滞后面板数据计量分析 *考虑一个标准的面板数据模型: it it it it it y αx βμ=++*如果将变量的真实的区域空间自相关性(依赖性)(Anselin &Florax ,1995)考虑到创新行为中来,这种创新行为的空间自相关性可以视为区域创新过程中的一种外部溢出形式,这样则可以设定如下模型: it it it it it it y αWy x βμρ=+++*上式为空间滞后面板数据(Spatial Lag Panel Data Model ,SLPDM )计量经济模型。其中,是创新的空间滞后变量,主要度量在地理空间上邻近地区的外部知识溢出,是一个区域在地理上邻近的区域在时期创新行为变量的加权求和。 空间误差面板数据计量分析 *如果在创新行为的空间依赖性存在误差扰动项中来测度邻近地区创新因变量的误差冲击对本地区创新行为的影响程度,则可以通过空间误差模型的空间依赖性原理可得: it it it it it y αx βμ=++it it it W μλμε=+*上式即为空间误差面板数据(Spatial Error Panel Data Model ,SEPDM )计量经济模型。其中,参数衡量了样本观察值的误差项引进的一个区域间溢出成分。 *因为已经在面板数据模型中考虑了创新行为变量的空间依赖性,因此采用一般面板数据模型的估计技术如OLS 或GLS 等将具有良好的估计效果。如果能够综合考虑面板数据模型中的一些假定,如时间加权(Period Weights )或截面加权(Cross-section Weights ),则可获得更加符合创新现实的估计结果。

六步学会用做空间计量回归详细步骤

与MATLAB链接: Excel: 选项——加载项——COM加载项——转到——没有勾选项 2. MATLAB安装目录中寻找toolbox——exlink——点击,启用宏 E:\MATLAB\toolbox\exlink 然后,Excel中就出现MATLAB工具

(注意Excel中的数据:) 3.启动matlab (1)点击start MATLAB (2)senddata to matlab ,并对变量矩阵变量进行命名(注意:选取变量为数值,不包括各变量)

(data表中数据进行命名) (空间权重进行命名) (3)导入MATLAB中的两个矩阵变量就可以看见

4.将elhorst和jplv7两个程序文件夹复制到MATLAB安装目录的toolbox文件夹 5.设置路径:

6.输入程序,得出结果 T=30; N=46; W=normw(W1); y=A(:,3);

x=A(:,[4,6]); xconstant=ones(N*T,1); [nobs K]=size(x); results=ols(y,[xconstant x]); vnames=strvcat('logcit','intercept','logp','logy'); prt_reg(results,vnames,1); sige=*((nobs-K)/nobs); loglikols=-nobs/2*log(2*pi*sige)-1/(2*sige)*'* % The (robust)LM tests developed by Elhorst LMsarsem_panel(results,W,y,[xconstant x]); % (Robust) LM tests 解释 每一行分别表示:

空间面板数据分析R的splm包

空间面板数据分析——R的s p l m包 (任建辉,暨南大学) The splm package provides methods for fitting spatial panel data by maximum likelihood and GM. 安装R软件及其编辑器Rstudio 网址:https://www.360docs.net/doc/fe253657.html, 下载好Rstudio以后,操作都可以Rstudio中完成了,包括命令的编写、命令运行、图形展示,最方便的要数查看数据了。 R界面 Rstudio界面,形如matlab 下面进入正题,了解splm包中的数据、命令及结果展示。所有命令都写在编辑窗口(studio左上区域),可以单独的运行每行命令,也可选取一段一起执行,点run按钮。 1、首先,安装splm包并导入,命令如下: intall.packages(“splm”),选择最近的下载点 library(splm) > library(splm) 载入需要的程辑包:MASS 载入需要的程辑包:nlme 载入需要的程辑包:spdep 载入需要的程辑包:sp 载入需要的程辑包:Matrix 载入需要的程辑包:plm 载入需要的程辑包:bdsmatrix 载入程辑包:‘bdsmatrix’ 下列对象被屏蔽了from ‘package:base’: backsolve

载入需要的程辑包:Formula 载入需要的程辑包:sandwich 载入需要的程辑包:zoo 载入程辑包:‘zoo’ 下列对象被屏蔽了from ‘package:base’: 载入需要的程辑包:spam 载入需要的程辑包:grid Spam version 0.40-0 (2013-09-11) is loaded. Type 'help( Spam)' or 'demo( spam)' for a short introduction and overview of this package. Help for individual functions is also obtained by adding the suffix '.spam' to the function name, e.g. 'help( chol.spam)'. 载入程辑包:‘spam’ 下列对象被屏蔽了from ‘package:bdsmatrix’: backsolve 下列对象被屏蔽了from ‘package:base’: backsolve, forwardsolve 载入需要的程辑包:ibdreg 载入需要的程辑包:car 载入需要的程辑包:lmtest 载入需要的程辑包:Ecdat 载入程辑包:‘Ecdat’ 下列对象被屏蔽了from ‘package:car’: Mroz 下列对象被屏蔽了from ‘package:nlme’: Gasoline 下列对象被屏蔽了from ‘package:MASS’: SP500 下列对象被屏蔽了from ‘package:datasets’: Orange 载入需要的程辑包:maxLik 载入需要的程辑包:miscTools Please cite the 'maxLik' package as: Henningsen, Arne and Toomet, Ott (2011). maxLik: A package for maximum likelihood es timation in R. Computational Statistics 26(3), 443-458. DOI 10.1007/s00180-010-0217 -1. If you have questions, suggestions, or comments regarding the 'maxLik' package, plea se use a forum or 'tracker' at maxLik's R-Forge site: Warning message: 程辑包‘Matrix’是用R版本3.0.3 来建造的 注意:在导入splm时,如果发现还有其他配套的包没有安装,需要先安装。 2、接着,查看数据及结构,命令如下:

Stata命令大全-面板数据计量分析与软件实现

Stata命令大全面板数据计量分析与软件实现 说明:以下do文件相当一部分内容来自于中山大学连玉君STATA教程,感谢他的贡献。本人做了一定的修改与筛选。 *----------面板数据模型 * 1.静态面板模型:FE 和RE * 2.模型选择:FE vs POLS, RE vs POLS, FE vs RE (pols混合最小二乘估计) * 3.异方差、序列相关和截面相关检验 * 4.动态面板模型(DID-GMM,SYS-GMM) * 5.面板随机前沿模型 * 6.面板协整分析(FMOLS,DOLS) *** 说明:1-5均用STATA软件实现, 6用GAUSS软件实现。 * 生产效率分析(尤其指TFP):数据包络分析(DEA)与随机前沿分析(SFA) *** 说明:DEA由DEAP2.1软件实现,SFA由Frontier4.1实现,尤其后者,侧重于比较C-D与Translog生产函数,一步法与两步法的区别。常应用于地区经济差异、FDI 溢出效应(Spillovers Effect)、工业行业效率状况等。 * 空间计量分析:SLM模型与SEM模型 *说明:STATA与Matlab结合使用。常应用于空间溢出效应(R&D)、财政分权、地方政府公共行为等。 * --------------------------------- * --------一、常用的数据处理与作图----------- * --------------------------------- * 指定面板格式 xtset id year (id为截面名称,year为时间名称) xtdes /*数据特征*/ xtsum logy h /*数据统计特征*/ sum logy h /*数据统计特征*/ *添加标签或更改变量名 label var h "人力资本"

空间计量经济学模型归纳

空间计量经济学模型 空间相关性是指 () ,i j y f y i j =≠即i y 与j y 相关 模型可表示为() (),1i j j i i y f y x i j βε=++≠ 其中,()f g 为线性函数,(1)式的具体形式为 () ()2,0,2i ij j i i i i j y a y x N βεεδ≠=++∑: 如果只考虑应变量空间相关性,则(2)式变为(3)式 ()()21 ,0,,1,2...3n i ij j i i i y W y N i n ρεεδ==+=∑: 式中 1 n ij j i W y =∑为空间滞后算子,ij W 为维空间权重矩阵n n W ?中的元素,ρ为待估的空间自相 关系数。0ρ≠,存在空间效应 (3)式的矩阵形式为() ()21, 0,4u n y Wy N I ρεδ?=: (4)式称为一阶空间自回归模型,记为FAR 模型 当在模型中引入一系列解释变量X 时,形式如下 () ()2,0,5n y Wy X N I ρβεεδ=++: (5)式称为空间自回归模型,记为SAR 模型 当个体间的空间效应体现在模型扰动项时有 () ()21,,0,6u n y X u u Wu N I βλεδ?=+=: (6)式成为空间误差模型,记为SEM 模型 当应变量与扰动项均存在空间相关时有 () ()2121,,0,7u n y W y X u u W u N I ρβλεεδ?=++=+: (7)式称为一般空间模型,记为SAC 模型 当0X =且20W =时,SAC →FAR ;当20W =时,SAC →SAR 当10W =时,SAC →SEM

第十六章-面板数据模型一

第16章静态面板数据模型时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 对于面板数据y it(i=1,2,…,N,t=1,2,…,T)来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 本章主要讨论静态面板数据模型的相关理论及软件操作,首先从模型的检验开始到介绍变截距模型中的固定影响变截距模型和随机影响变截距模型,然后到变系数模型。本章的流程图如下:

16.1面板数据模型建模的基本原理 在应用多元回归分析建立的计量经济模型时,如果所建的模型中缺失了某些不可观测的重要解释变量,使得回归模型随机误差项常常存在自相关。于是回归参数的最小二乘法OLS 估计量不再是无偏估计或有效估计。但是,运用面板数据建立的计量经济模型时,对于一些忽略的解释变量可以不需要其实际观察值,而通过控制该变量对被解释变量的影响的方法获得模型参数的无偏估计。 由此可见,面板数据不仅可以同时利用截面数据和时间序列数据建立计量经济模型,而且能更好地识别和度量单纯的时间序列模型和单纯截面数据模型所不能发现的影响因素,它能够构造和检验更复杂的行为模型。例如:在宏观领域,它被广泛用于劳动经济学、国际金融、经济增长、产业结构、技术创新、税收政策等领域。 16.1.1面板数据模型基本框架 面板数据能更好地识别和度量时间序列或截面数据不可发觉的效应,有助于建立和检验更复杂的行为模型,其基本模型是如下形式的一般回归模型: 1,2,,,1,2,,it it it i t it y x i N t T αβδγε=++++==L L (16.1.1) 其中:it y 是个体i 在时间t 时期的观测值,α表示模型的常数项,i δ代表固定或者随机的截面效应,t γ代表固定或者随机的时期效应,it x 表示k 阶解释变量观测值向量。β表示解释变量的系数向量,并且在根据其条件的限制分为三种值,一是对所有截面和时期都是相同的常数,二是在不同的截面是不同的系数,三是在不同的时期是不同的。it ε是独立同分布的误差项,即()0it E ε=。 在公式(16.1.1)中,如果考虑k 个解释变量,自由度NT 远小于参数个数,对于截面成员方程,待估计参数的个数为((1))NT k N ++,对于时间截面方程,待估计参数的个数为((1))NT k T ++,这使得该模型无法估计。为了对模型进行估计,则可以建立以下的两类模型:从个体成员角度考虑,建立含有N 个个体成员方程的面板数据模型;在时间点上截面,建立含有T 个时间点截面方程的面板数据模型。 1)含有N 个个体成员方程的面板数据模型 模型形式如下: i T i it i T T i y l x l I αβδγε=++++ (16.1.2) 其中:i y 是个体i 的观观测值的时间序列。系数向量β取值受不同个体的影响,i x 表示个体i 解释变量观测值时间序列。T l 是T 阶的单位行向量,T I 是T 阶的单位列向量。 '12()T γγγγ=L ,,,,包括所有的时点效应。该式含有N 个截面方程。

随机前沿模型(SFA)-原理解读

随机前沿模型(S F A)- 原理解读 -CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

随机前沿模型(SFA )原理和软件实现 一、SFA 原理 在经济学中,常常需要估计生产函数或者成本函数。生产函数f (x)的定义为:在给定投入x 情况下的最大产出。但现实中的产商可能达不到最大产出的前沿,为了,假设产商i 的产量为: i i i y f (x ,)βξ= (1) 其中,β为待估参数;i ξ为产商i 的水平,满足i 01ξ<≤。如果i =1ξ,则产商i 正好处于效率前沿。同时,考虑生产函数还会受到随机冲击,故将方程(1)改写成: i v i i i y f (x ,)e βξ= (2) 其中,i v e 0>为随机冲击。方程(2)意味着生产函数的前沿i v i f (x ,)e β是随机的,故此类模型称为“随机前沿模型”(stochastic frontier model )。随机前沿模型最早由Aigner, Lovell and Schmidt(1977)提出,并在实证领域运用广泛,Kumbhakar and Lovell(2000)为该领域的研究写了一本着作,有兴趣的同学可以去参考。 假设o k 1i 1i ki f (x ,)e x x ββββ=(柯布道格拉斯生产函数,共有K 个投入品),则对方程(2)取对数可得: K i 0k ki i i k 1ln y =+ln x ln ββξν=++∑ (3) 由于i 01ξ<≤,故i ln 0ξ≤。定义i i u =-ln 0ξ≥,则方程3可以写成: K i 0k ki i i k 1ln y =+ln x -u ββν=+∑ 其中,i u 0≥为“无效率”项,反映产商i 距离效率前沿面的距离。混合扰动项i i i ενμ=-分布不对称,使用OLS 估计不能估计无效率项i u 。为了估计无效率项 i u ,必须对i i νμ、的分布作出假设,并进行更有效率的MLE (最大似然估计)估 计。

相关文档
最新文档