经济研究:技术进步、教育收益与收入不平等

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

技术进步、教育收益与收入不平等
*
徐 舒
内容提要:本文建立了一个基于技能偏向型技术进步的一般均衡模型,表明教育回报率的变化是引起我国劳动者收入不平等扩大的重要原因。

基于该模型的进一步推导分解出了教育的要素回报效应与要素结构效应,前者拉大了收入不平等,后者降低了收入不平等,但总效应仍然是收入不平等的扩大。

利用基于RIF 回归的分解方法,本文验证了上述理论预测与实际数据的高度一致性。

关键词:收入不平等 技能偏向型技术进步 RIF 回归分解
* 徐舒,西南财经大学经济与管理研究院,邮政编码:610074,电子信箱:s xu@mail.s 。

本文受西南财经大学/211工程03期建设项目资助。

感谢香港岭南大学魏向东教授在文章实证方法上的指导以及范承泽教授的热情帮助。

感谢两位匿名审稿人的宝贵意见,他们对文章的改进和完善起到了非常重要的作用。

当然,文责自负。

¹ 详见邓曲恒(2007);另外,黎波等(2007)对现有的收入差距扩大成因的分解方法进行了较为全面的回顾和评述。

一、引言与文献综述
近年来,我国劳动者收入差距不断扩大的现象受到政府、学术界以及社会大众的高度关注,也越来越成为媒体和群众讨论的焦点。

据世界银行估算,我国2001年的基尼系数约为01447。

依照2006年2月14日5光明日报6的引述,中国社科院收入分配课题组根据城乡入户调查数据计算出的我国2002年的基尼系数约为01454。

2008年2月,5望6周刊载文指出,我国的基尼系数高于绝大多数发展中国家,并处于我国历史的最高点。

此后,关于各种衡量收入不平等的指标,尤其是基尼
系数的计算方法及其在我国的适用性的争论愈加激烈。

虽然各种衡量收入分配不平等的指标在我国的适用性仍有待商榷,但改革开放以来我国收入差距扩大却是不争的事实。

经济学界对收入分配不平等问题的关注由来已久,我国学者也进行了广泛而深入的研究。

夏庆杰等(2007)利用中国家庭收入调查项目(C HIP)数据,分析了我国1988)2002年城镇贫困的变化趋势和模式。

研究表明在样本时期内,我国城镇居民的绝对贫困显著减少,但收入分配不平等加剧;徐现祥、王海港(2008)讨论了我国初次分配中的两极分化及其成因,表明两极分化主要是由劳动贡献这个分配标准在产业间的差异造成的;洪兴建、李金昌(2007)在对收入两极分化测度方法进行评述的基础上,运用几个主要指标实证分析了中国居民的收入两极分化,说明中国城乡两极分化、城镇及农村内部的两极分化、沿海与内陆的两极分化以及行业两极分化大多呈现上升趋势。

对收入不平等研究的另一个活跃领域是工资收入不平等的分解。

这部分的研究多采用计量经济学方法,将两个不同群体(或相同群体在不同时期)的工资收入差异分解为劳动力个体特征(如性别、年龄、受教育程度等)的影响,借此探索不同社会群体在工资收入上存在差别的原因。

常采用的方法有:基于线性回归的Blinder -Oaxaca 分解、Juhn et al(1993)的方法,以及Machado &Mata(2005)提
出的基于分位数回归的分解方法。

¹例如,姚先国、李晓华(2007)就利用quantile -J MP 方法从总体上
研究了工资收入不平等上升的结构效应与价格效应。

具体到研究内容,上述研究已经涉及到的方面有工资收入的性别差异(王美艳,2005a;迟巍,2008)、行业差异(罗楚亮、李实,2007)以及流动人口
与本地人口的工资收入差异等(王美艳,2005b;邓曲恒,2007)。

与上述文献不同,本文利用中国健康与营养调查数据(C HNS)研究了1991年到2006年我国工资收入不平等程度在时间维度上的纵向变化特征。

文章建立了一个基于技能偏向型技术进步(skil-l biased technical change)的一般均衡模型,并通过实证表明该模型与现实数据的高度吻合)))教育的要素结构效应(指高等教育劳动者比重的增加)降低了工资收入不平等程度,但教育的要素报酬效应(指教育回报率的上升)在更大程度上扩大了工资收入不平等程度,其总效果仍然是收入不平等程度上升,并且这种效应对城镇劳动者更加显著。

本文的主要贡献,亦即与既有文献的区别主要有两个方面:一是通过理论模型的推导,分解出教育的要素结构效应及要素报酬效应,并预测了两种效应对工资收入不平等的不同作用方向。

二是在实证方法上采用Firpo et al (2007)发展出的基于再中心化影响函数回归(recentered influence function regression,下称RIF 回归)的分解方法,以反映收入不平等的不同统计指标分别刻画出教育的要素结构效应与要素报酬效应对收入分配不平等程度的影响。

二、我国的工资收入不平等与教育回报率:1991)2006年
如前文所述,本文的实证研究主要基于中国健康与营养调查数据(C HNS)。

¹
根据研究目的,我
们选取了1991年、1993年、2004年及2006年的数据,并将1991年和1993年的样本合并,定义为基
期(t 0时期);将2004年与2006年的样本合并,定义为报告期(t 1时期)。

º
和现有的国内外文献类
似,文中的劳动者样本指的是年龄在18)65岁、并有正常工作的劳动者;收入指的是劳动者的月工资收入,包括工资、奖金和其他补贴收入。

不同年份的收入都通过CPI 调整为2006年的名义收入,在实际分析中根据惯例对月收入取自然对数。

(一)工资收入不平等的变化趋势
为了反映工资收入分配不平等在时间上的纵向变化情况,将t 0时期和t 1时期样本中劳动者的收入分布加以对比,如图1所示。

图1左图显示的是两个时期对数工资的核密度估计。

可以看出:与t 0时期相比,t 1时期对数工资的密度函数明显左偏,左尾的厚度增加,且分布的离散程度增加,方差上升。

图1右图显示的是两个时期对数工资的分位数(左轴)及分位数之差(右轴)。

右图中有两个特征非常明显:第一,t 1时期连接各分位数的斜线较t 0时期更加陡峭,在左尾分位数较为接近的情况下右尾分位数产生巨大差异,这说明与t 0时期相比,t 1时期收入分布的离散程度上升;第二,两个时期的分位数之差是一条向上倾斜的曲线,也说明收入分布的离散程度在不断扩大。

由此可见,从上世纪90年代初到2006年,我国劳动者的收入分配不平等确有显著上升。

(二)教育回报率的变化趋势
根据本文的研究目的,进一步对两个样本时期的教育回报率进行比较,见表1。

表1
高等教育劳动者比例与教育回报率变化
样本数
大学生比重
非大学生对数平均工资
大学生对数平均工资
工资比对数工资方差
t 0时期586301065161517611030145t 1时期
4623
0115
6151
7118
1110
0190
¹º
本文没有选取1989年的数据,一方面因为当年数据中含有较多缺失与异常值;另一方面国外相关文献的研究结论,普遍
认为收入差距扩大的现象始于上世纪90年代初。

由于目前国内使用CHNS 数据进行的研究很多,本文不对数据进行详细介绍。

感兴趣的读者可以通过CHNS 网站(http:P P
P projec ts P china)了解更多信息。

图1收入分布变化趋势
表1中有两个趋势值得注意:一是在t1时期,接受高等教育的劳动者比重较t0时期有了明显增加,其比重由6%大幅上升至15%;二是在接受高等教育劳动者比重增加的同时,高等教育劳动者的相对工资也有明显上升。

在t0时期,大学生与非大学生的对数工资比为1103,两者基本持平,其绝对水平都处于对数工资分布的50%)60%分位数之间。

在t1时期,大学生的对数平均工资为7118,处于对数工资分布75%)80%的分位数之间;而非大学生的对数平均工资为6151,处于对数工资分布35%)40%的分位数之间,两者的差距明显增大。

值得注意的是,这里的计算没有控制影响收入的其他因素,如工作经验。

通常认为没有大学学位的劳动者拥有更长的工作经验,如果将工作经验予以控制,则高等教育的收入溢价程度会更高。

此外,t1时期对数工资的方差为019,几乎是t0时期的两倍,再次验证了在样本期间内我国劳动者收入差距显著扩大这一事实。

通过一个简化的例子,我们可以将前文描述的我国劳动力市场在1991年至2006年间产生的两大变化)))(1)接受高等教育劳动者的比重大幅增加,(2)两类劳动者的相对收入差距不断扩大,与整个劳动力市场的收入不平等程度(收入的方差)上升联系起来。

假设市场上只有高技术工人(大学生)与低技术工人(非大学生)两类劳动者,所占比重分别为A及(1-A);大学生与非大学生的工资分别为y c与y nc,其中y c>y nc。

在此假设下,劳动力市场上的平均工资为:
E(y)=A y c+(1-A)y nc(1)劳动者的收入分配不平等程度由收入的方差衡量,简单计算可得:
var(y)=E(y2)-[E(y)]2=A(1-A)(y c-y nc)2=(y nc)2A(1-A)(y c P y nc-1)2(2)
从(2)式可以得到:
5var(y)P5A=(1-2A)(y n c)2(y c P y nc-1)2>0(当A<015)(3)
5var(y)P5(y c P y nc)=2(y nc)2A(1-A)(y c P y nc-1)>0(4)上述(3)式与(4)式的结论正是数据所表现出的特征:高技术工人的比重上升(但比重仍小于50%)以及两类劳动者的相对收入差距扩大,从而整个劳动群体的收入不平等程度增大。

¹
¹当然,在这样简化的假设下,y c P y nc自身就是对收入不平等程度的测度。

三、技能偏向型技术进步与收入不平等的理论模型
技能偏向型技术进步理论的提出始于国外学者对美国劳动力市场结构性变化的研究。

自上世纪60年代起,美国劳动力市场出现了收入不平等扩大、高技能劳动力的相对供给增加以及相伴随的教育回报率上升等结构性变化,技能偏向型技术进步理论正是在这样的背景下应运而生,并为解释这些变化提供了理论支持。

Ace moglu(1996,1998,2002a,2002b)的一系列文章对技术进步引起的收入不平等及其作用机制进行了全面阐述。

Autor et al(2003)基于该理论研究了计算机的普及对不同类型劳动力需求的影响,研究表明计算机的普及和随后价格的下降增加了对计算机不可替代的劳动力,尤其是高教育劳动力的需求。

Autor et al(2006)的研究进一步表明,技术进步的技能偏向与高技能劳动力相对供给增速的下降能很好解释美国劳动力市场的极化现象以及不断上升的收入不平等。

虽然Card&DiNado(2002)详细讨论并指出了技能偏向型技术进步理论与实证结果存在一些矛盾,但该模型仍然是解释上述现象最有力的理论工具之一。

本文在这一部分建立一个基于技能偏向型技术进步的一般均衡模型,并以此揭示文章第二部分描述的我国劳动力市场的变化特征。

(一)模型设定
首先,假设经济中厂商的生产函数为CES形式:
Y=[(A l(S)L)Q+(A h(S)H)Q]1P Q(0<Q[1)(5)
其中,Y是产出,L是低技能劳动投入,H是高技能劳动投入,A l(S)和A h(S)分别代表低技能劳动和高技能劳动的单位技术回报率,S代表外生的技术水平,且满足5A l(S)P5S>0,5A h(S)P5S>0。

令R S1P(1-Q),即高技能劳动与低技能劳动间的替代弹性。

厂商的生产满足最优化的一阶条件,由此得到两类劳动力的单位工资分别为:
w l=A Q l(S)#L Q-1#[(A l(S)L)Q+(A h(S)H)Q]Q-1(6)
w h=A Q h(S)#H Q-1#[(A l(S)L)Q+(A h(S)H)Q]Q-1(7)其次,假设劳动者总是可以提供1单位的低技术劳动,但提供的高技术劳动数量G i取决于该劳动者的受教育程度以及教育成本,即满足G i=[f(edu i)-c i]I[0,1],其中f表示特定受教育程度下提供高技术劳动的能力,且有5f P5edu i>0,c i为劳动者个体的异质性受教育成本。

劳动者在两种劳动力供给方式间选择。

当G i\w l P w h时,劳动者选择提供G i单位的高技术劳动;当G i<w l P w h时,选择提供1单位的低技术劳动。

¹由此,两种劳动力的总供给分别为:
H s=E i G i#I(G i\w l P w h),L s=E i I(G i<w l P w h)(8)
其中,I(#)为示性函数,当括号中条件满足时取1,否则取0。

令r w S w l P w h,即低技术劳动与高技术劳动的相对工资。

在式中,对任意i,显然有5H s P5G i>0,5L s P5G i<0,以及5H s P5r w<0,5L s P5r w>0。

最后,劳动力市场出清要求H=H s和L=L s同时成立。

上述一般均衡模型中最重要的假设是:外生的技术进步具有技能偏向性,即技术进步对高技术劳动力更加有利。

º这一假设在上述模型中可以表述为:
5[A l(S)P A h(S)]P5S<0(9)
(二)技术进步、收入不平等与劳动力相对供给
技能偏向型技术进步加剧劳动力市场收入不平等的作用机制可以由如下推导过程得到:显然,一个隐含的假设是w l<w h,否则经济中将不会有劳动者提供高技能劳动。

¹
º后文将从数据中验证该假设的合理性。

r w S w l P w h =[A l (S )P A h (S )]Q (H P L )
1-Q
(10)对(10)式两边取对数:
ln(r w )S ln(w l P w h )=Q ln[A l (S )P A h (S )]+(1-Q )ln(H P L )
(11)
等式(11)两边同时对S 求导:
5ln(r w )5S =1r w #5r w 5S =Q A h A l 5(A l P A h )5S +(1-Q )5r w 5S (5H s P 5r w )H -(5L s
P 5r w )L (12)
上述推导使用到了H =H s
,L =L s
这个结论。

进一步整理得到:
HL r w +
-(1-Q )L 5H s 5r w -+(1-Q )H 5L s
5r w +
+
#5r w 5S =HL Q A h A l +
5(A l P A h )5S
-
(13)
显然有5r w P 5S <0。

这表明随着技术进步(S 上升),低技术工人的相对收入减少(r w 下降),劳动力市场的不平等程度上升。

在此基础上可以进一步得到技能偏向型技术进步对两类劳动力相对供给
的影响(H =H s ,L =L s
):
5(H P L )P 5S =[(5H s
P 5r w )-(5r w P 5S )-L -(5L s P 5r w )+
(5r w P 5S )-H ]P L 2
>0
(14)
至此,本文从模型中得到了数据反映出的两个特征)))第一,高技术劳动力的相对工资上升,
收入差距扩大;第二,与此同时,高技术劳动力相对供给增加。

¹
上述推导揭示了劳动力市场的动态调整过程。

技能偏向型技术进步使高技术工人的相对工资上升,这引起高技术工人的相对供给增加;高技术工人相对供给的增加降低了高技术工人的相对工
资,在一定程度上缓解了劳动力市场的收入不平等。

º
但是,这个调整过程的最终结果仍然是收入分配不平等程度的上升,原因在于高技术工人相对供给的增加不能完全弥补由于技术进步带来的收入差距扩大。

(三)教育回报与收入不平等
上文的分析框架为使用教育年限作为劳动者技术水平的衡量标准提供了支持。

在文章的模型中,由于低技术劳动者的最优选择是不进行教育投入(或者说,在现实中只进行基础水平的教育投入),而只有高技术劳动者进行教育投入。

因此,受教育程度是劳动者技术水平的等价测度,二者的信息是重合的。

在这个意义上,可以把教育水平看作是/连续0的,反映劳动者技术水平的分组指标。

不同教育水平劳动者的收入差距,就是不同技术水平劳动者的收入差距。

这解决了无法从数据中直接识别高技能劳动者和低技能劳动者的问题。

具体而言,在上述模型框架下,我们可以进一步将收入差距扩大与劳动者的受教育程度联系起来,分解出劳动者的受教育程度对收入差距扩大的两种不同效应。

根据前文假设,社会的平均受教育程度可以由如下等式衡量:
»
G S E
i
edu i #I (G i \w l P w h )=E
i
f -1
(G i +c i )I (G i \r w )(15)
注意等式(15)成立的原因是:由于劳动者总是可以提供1单位的低技术劳动,因此对于G i <w l P w h 的劳动者而言,其最优选择是不进行教育投入(edu i =0)而直接从事低技术劳动。

等式(15)两侧对r w 求导,得到:
¹º»
不失一般性,假设经济中的劳动者总量为1。

等式(11)两边对l n(H P L )求导可得5ln r w P 5ln(H P L )=1-Q >0。

在劳动力市场总体供给水平不变的情况下,这意味着高技术劳动供给上升,低技术劳动供给下降。

这个结论也可以由H s 、L s 直接对S 求导得到。

5 G P 5r w =
E
i
f -1
G i +c i 5I G i \r w P 5r w <0
(16)
因此有5ln r w P 5 G =(5r w P 5 G )P r w <0。

这说明在技能偏向型技术进步条件下,受教育程度的总体上升(5 G P 5S =5 G P 5r w #5r w P 5S >0)加剧了劳动者的收入不平等。

这是教育因素对收入不平等影响的总效应。

同时,受教育程度的上升意味着市场上高技术劳动相对供给的增加,如前文所述,这在一定程度上缓和了收入不平等:
5(H s
P L s
)P 5 G =[(5H s
P 5 G )L s
-(5L s
P 5 G )H s
]P (L s
)
2=[(5H s
P 5r w )(5r w P 5 G )+
L s
-(5L s
P 5r w )(5r w P 5 G )-H s
]P (L s
)2
>0(17)
本文把这部分效应定义为教育的要素结构效应。

这样,可以将外生的技能偏向型技术进步引起劳动者收入不平等的总效应分解成如下两个与劳动者受教育程度相关的部分:
总效应(+)=教育的要素结构效应(-)+教育的要素回报效应(+)
(18)
其中,正号表示该效应扩大了劳动者收入不平等,负号表示该效应减小了劳动者的收入不平等。

教育的要素回报效应定义为总效应与教育结构效应之差,反映的是由技能偏向型技术进步带来的边际教育回报率的上升。

(四)技能偏向型技术进步的存在性
由于本文的理论推导以及后面的实证研究都建立在技术进步具有技能偏向性这一关键假设上,因此验证这一假设,即(9)式成立,具有十分重要的意义。

在进入本文的实证部分前,此处依照Author et al(1998)以及Ace moglu(2002)的方法,证明技能偏向型技术进步这一条件在我国是成立的。

结合(6)式与(7)式,得到如下等式:
S h =w h H P w l L =(A h P A l )
(R -1)P R
(H P L )
(R -1)P R
(19)其中,R S 1P (1-Q ),S h 是高技术劳动力的相对工资份额。

通过简单变换可以得到:
A h P A l =S R P (R -1)
h
P (H P L )
(20)
图2 A h P A l 在样本期间的变化
由于相对工资份额S h 与劳动力的相对供给H P L 都可以从数据中得到,因此可以通过等式(20)计算出A h P A l 在样本区间内的变化情况,如图2所示。

图2给出了1991)2006年从
CHNS 数据中计算出的A h P A l 的数值。

借鉴Acemoglu(2002)的做法,分别取R =114以及R =2。

可以看出,在整个样本区间内,A h P A l 都呈现上升趋势,并且在20世纪90年代中期以后上升速度明显加快。

由于技术进步与时间是一致的,这就验证了5(A h P A l )P 5S >0,即5(A l P A h )P 5S <0,也就是技能偏向
型技术进步在我国是确实存在的。

这里需要注意的是,上述结论的成立基于这样一个隐含假设:技术水平S 随着时间推移是不
断上升的,即5S P 5t >0。

¹
本文中的技术水平S 可以理解为劳动专有技术(labor -specific)。

虽然不
¹非常感谢匿名审稿人指出在文章中需要对该隐含假设的合理性进行讨论。

能直接从数据中验证5S P 5t >0这一条件,但一般而言,劳动专有技术水平与全要素生产率(TFP)是密切相关的,二者呈正相关关系。

因此,与我国全要素生产率相关的研究结论可以从侧面佐证该假设的合理性。

郭庆旺、贾俊雪(2005),傅勇、白龙(2009),魏下海(2009)以及刘秉镰、李清彬(2009)分别采用全国、省级和市级数据,应用不同方法研究了我国不同时期的TFP 变化情况,其研究结论均认为我国的TFP 随时间有不同程度的增长。

进一步考虑到1991)2006年间信息技术的发展和计算机的普及对劳动者劳动生产率的影响,显然5S P 5t >0是一个合理的假设。

四、基于RIF 回归分解的实证研究
本文的这一部分将通过实证方法从数据中验证(18)式。

如文章第一部分所言,当前在收入不平等问题上的实证研究,其中一个重要的领域是通过计量经济学方法将收入不平等分解成劳动者个体特征的要素贡献。

而本文的研究主要关注受教育程度这一个体特征对劳动者收入不平等的影响。

具体来说,需要在控制其他因素的情况下验证:(1)劳动者平均受教育水平的提高缩小了收入差距;(2)教育回报率的提高在更大程度上加剧了收入差距;(3)劳动者受教育程度这一个体特征的变化在总体上加剧了收入不平等。

(一)Blinder -Oaxaca 分解与RIF 回归分解Blinder -Oaxaca 分解方法是基于线性回归的均值分解。

关注变量y 为劳动者的对数月平均收入,在线性回归的假设下有:
y t =x t c B +u t , E (u t |x t )=0, t ={1,0}
(21)
本文关注收入y 在t 0时期(1991)1993年)以及t 1时期(2004)2006年)的平均差异Dy =E
(y 1)-E (y 0)如何受到其他因素X 的影响。

代入(21)式可以得到:
Dy =E (y 1)-E (y 0)=E (x 1c )B 1-E (x 0c )B 0
=E (x 1c )(B 1-B *
)+[E (x c )B *
-E (x 0c )B 0]
=E (x 1c )(B 1-B *
)+[E (x c )-E (x 0c )]B 0+E (x 1c )(B *
-B 0)
(22)
其中,B *
为均衡的要素回报率;$S S E (x 1c )(B 1-B *
)称为要素的报酬效应,反映的是相同要素结构下由要素回报率不同引起的收入差别;$X S [E (x 1c )-E (x 0c )]B 0称为要素的结构效应,¹
反映
的是由要素分布结构不同引起的收入差别;R =E (x 1c )(B *
-B 0)是不可解释的部分。

Blinder -Oaxaca 分解的局限性在于它考察的仅仅是收入y 的均值在不同时期的差异。

更理想的方法应该从y 的边际分布函数出发,研究要素X 及其回报如何影响y 在不同时期的分布。

Firpo et al (1996)开创性地提出可以通过构造反事实状态的分布函数的方法来研究不同要素对收入分布的影响。

所谓反事实状态的分布函数,即t 0时期在具有与t 1时期相同的要素分布X 1时y 0所具有的分布。

记反事实状态的分布函数为F (y C ),它可以看作是一个/公平0的分布,通过比较F
(y 0)、F (y 1)与F (y C )的差别,可以得到各要素X 的变化对y 分布变化的影响。

º
Firpo et al (2007)
改进了其1996年的研究成果,提出了一种基于RI F 回归的新分解方法。

该方法通过建立RIF 与各种统计量间的对应关系,可以将任意的统计量表示成其他变量的线性投影,进而应用类似于
¹º
如何构造反事实状态的分布函数,以及如何得到各要素X 的变化对y 分布的影响的具体方法将在下文阐述。

黎波等
(2007)也对该方法进行了较为详细的介绍。

M achado &Mata (2005)利用分位数回归(quantile regres sion)的方法先得到y 给定X 的条件分布,再通过bootstrap 方法对X 进行抽样来构造y 的边际分布,从而成功将要素分布及其回报与y 的边际分布联系起来。

这成为另一个被广泛使用的方法。

国外文献中称$S 为s truc tural effec t,称$X 为composition effect 。

为了便于与前文统一,并更贴近现实含义,本文采取了不同的命名方式。

Blinder -Oaxaca 的分解方法,分解出各解释变量对该统计量的影响。

令v =v (F )是定义在任意分布函数F 上的泛函。

本文中v 特指刻画分布F (y )的各种统计量,包括均值、方差、分位数以及基尼系数等。

y 1与y 0的分布差异可以用各种统计量来衡量,即:
D =v (F 1)-v (F 0)=[v (F 1)-v (F C )]+[v (F C )-v (F 0)]
(23)
其中F C (#)是反事实状态的分布函数。

相应地,v (F C )是定义在F C 上的统计量。

任意分布F (y )
的再中心化影响函数RIF 定义为:
RIF(y ;v )S v (F )+IF(y ;v )=v (F )+lim E y 0
v (F E )-v (F )
E
(24)
Firpo et al.(2007)证明有如下等式成立:
Q
RIF(y ;v )#dF (y )=
E y (RIF(y ;v ))=v (
F )
(25) 通过迭代期望原理,可以将统计量v (F )表示成其他变量X 的函数,即:
v (F )=E y (RIF(y ;v ))=E x [E y (RIF(y ;v )|X )]=E [m v
(X )]
(26)其中E y (RIF(y ;v )|X )S m v
(X )。

令m v
L (X )=X #C v
是m v
(X )在X 上的线性投影,显然有:
C v
=E (XX T )
-1#E (X T m v
(X ))
(27)
由线性投影的性质可以得到E [m v
L (X )]=E [m v
(X )]。

结合式(23)、(26)和(27)可以得到:
D =[
E (m v
1(X 1))-E (m v C (X 1))]+[E (m v
C (X 1))-E (m v
0(X 0))]=[E (X T
1)#(C v
1-C v
C )]+[E (X T
1)#C v
C -E (X T
0)#C v
0]
=[E (X T
1)#(C v
1-C v
C )]+[E (X T
1)-E (X T
0)]#C v
0+E (X T
1)(C v
C -C v
0)
(28)
(28)式与(22)式相对应。

因此,在得到C v
l (l =1,0,c )的一致估计后,可以应用与Blinder -Oa xaca 相似的方法来对不同效应进行分解。

总地来说,获得(28)式的分解结果可以分两步进行。

首先是得到目标统计量(分位数、方差或
基尼系数)RIF 的一致估计;¹得到RIF 的一致估计后,C v
l (l =1,0,c )的一致估计可以简单地由加权最小二乘法得到,考虑到RIF 估计的误差,Firpo et al.(2007)建议使用W hite 异方差一致估计。

(二)基于RIF 回归的分解结果
本文中使用到的反映收入y 分布的统计量包括方差、基尼系数以及分位数。

方差与基尼系数能在总体上反映两个时期收入不平等的变化情况,而不同分位数能在整个分布上刻画y 的变化情况,从而得到更加细致、精确的结果。

不同统计量的RIF 一致估计可以通过Firpo et.al(2007)介绍的方法得到。

在第二阶段的RIF 回归中,必须控制影响收入分配的其他因素来得到受教育程度对收入分配的影响。

具体而言,RIF 回归方程的设定如下:
v (F l )S E y (RIF(y l ;v ))=m v
L (X )+E =C 0
l +educ #C *
l +Z C v
l +E (l =0,1,c )其中educ 是劳动者的受教育程度,采用受教育年限来衡量;
º
Z 是影响收入的其他因素,包括劳动
者的性别(female ,1为女性,0为男性)、城乡户籍(rural ,1为农村户口,0为城市户口)、性别与受教育程度的交互项、户籍与受教育程度的交互项、年龄及其平方项(age ,agesq )、公司性质虚拟变量以及地域(省份)虚拟变量;E 是回归的残差。

¹
º
附录A 列出了采用离散化教育测度的RIF 分位数回归及分解结果,与正文中采用连续教育测度所得到的结果是一致的。

感谢匿名审稿人的这一建议。

Fi rpo et al.(2007)介绍了不同统计量RIF 的估计方法,并证明了RIF 估计的渐进正态性质。

其中以分位数为统计量的RIF
回归也成为无条件分位数回归(unconditional quantile regress ion,见Firpo e t al.(2009))。

由于RIF(y l ;v )的估计过程较为复杂,且随统计量的不同而不同,此处不对其估计方法进行具体讨论,有兴趣的读者可以参考Firpo et al.(2007)。

相关文档
最新文档