基尼系数的计算方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
n∑Yi-∑ ∑ Yi+∑ Yi Yn+Yn-1+…Y2 Yn+Yn-1+…Y3-Y1 Yn+Yn-1+…Y4-Y1-Y2 …
…
Y1+Y2+…Yn Y1+Y2+…Yn
Y1+Y2+…Yn-2+Y1+Y2+…Yn-1 Y1+Y2+…Yn-1+Y1+Y2+…Yn
Yn-Y1-Y2-…Yn-2 -Y1-Y2-…Yn-1
1
发展经济学论文
nn 2 △= ∑∑ Yj-Yi∣/n , 0≤△≤2u j=1 i=1∣
式(2)
式中,△是基尼平均差,∣Yj-Yi∣是任何一对收入样本差的绝对值,n 是样本容量, u 是收入均值。定义 G=△/2u, 0≤G≤1 式(3) ,而由式(1)G= SA/ SA+B,SA+B=1/2, 可以证明:G=△/2u=2SA(证明过程见附录一) 、 (3) ,基尼系数的计算方法 G=2SA,因此,式(2)中定义的 G 即为基尼系数,综合式(2) 为: G= 1 nn 2n2 u ∑∑ Yj-Yi∣ j=1 i=1∣ 式(4)
3
发展经济学论文
有给出 Wi、Ib 和ε(fi)的具体计算方法,还不能用于基尼系数的计算。 经济学家 Sundrum(1990)在他的《欠发达国家的收入分配》一书中介绍了一种对一国 或地区基尼系数进行分解的方法,其数学公式为:
2 2 G=P1 u1 G1+ P2 u2 G2+P1P2︱ u1-u2 ︱ 式(13) u u u 式中,G 表示总体基尼系数,G1 和 G2 分别表示农村和城镇的基尼系数,P1、P2 分别表 示农村人口和城镇人口占总人口的比重,u1、u2、u 分别表示农村、城镇和总体的人均收入。 2 对比式(12)和式(13) ,可以发现式(13)是式(12)的一种具体运用,P1 u1 u
1
m n+1
式(6)
拟合曲线法的在两个环节容易产生谬误:一是拟合洛伦茨曲线,得出函数表达式的过 程中,可能产生误差;二是拟合出来的函数应该是可积的,否则就无法计算。 3、分组计算法 这种方法的思路有点类似用几何定义计算积分的方法,在 X 轴上寻找 n 个分点,将洛 伦茨曲线下方的区域分成 n 部分,每部分用以直代曲的方法计算面积,然后加总求出面积。 分点越多,就越准确,当分点达到无穷大时,则为精确计算。
二、基尼系数的计算方法
式(1)虽然是一个极为简明的数学表达式,但它并不具有实际的可操作性。为了寻求 具有可操作性的估算方法, 自基尼提出基尼比率以来, 许多经济学家和统计学家都进行了这 方面的探索。在已有的研究成果中,主要有四种有代表性的估算方法,结合自己的计算,笔 者将它们归纳为直接计算法、拟合曲线法、分组计算法和分解法。 1、直接计算法 直接计算法在基尼提出收入不平等的一种度量时,就已经给出了具体算法,而且这种 算法并不依赖于洛伦茨曲线,它直接度量收入不平等的程度。定义
5
发展经济学论文
加总最后一行,得到: n∑Yi-∑ ∑ Yi+∑ Yi=(n-1)Yn+(n-2)Yn-1+……+Y2—(n-1)Y1-(n- 2)Y2-……-Yn-1=(n-1)Yn+(n-3)Yn-1+(n-5)Yn-2……-(1-n)Y2-(n -1)Y1
i+∑Yi = 1 SA= 1 n∑Yi-∑ ∑ Y (n-1)Yn+(n-3)Yn-1+(n-5)Yn n n 〔 2n 2n ∑Yi ∑Yi 式(15) -2……-(1-n)Y2-(n-1)Y1〕 比较式(14)和式(15)可得 G=△/2u=2SA。
n
取样本均值u= Y1+Y2+……Yn = ∑Yi n n 1 = 1 n 2n2u 2n ∑Y i
4
发展经济学论文
综上,第一步、第二步,得到 1 〔 G= (n-1)Yn+(n-3)Yn-1+(n-5)Yn-2……-(1-n)Y2-(n-1) n n ∑Y
i
Y1〕 第三步,计算 SB
式(14)
D Y
n i n =1 (2n-2 ∑ ∑yi+2∑yi)- n+1 2n 2n
分解 n- ∑ ∑yi 得到矩阵 C: n y1+y2+……yn y1+y2+……yn ∑ ∑yi y1 y1+y2 y1+y2+y3 ……
n i
n
i
n- ∑ ∑yi Yn+Yn-1+……Y2 Yn+Yn-1+……Y3 Yn+Yn-1+……Y4 …… Yn 0
直接计算法只涉及居民收入样本数据的算术运算,很多学者认为理论上看,只要不存 在来源于样本数据方面的误差,就不存在产生误差的环节。实际上,在附录一证明过程当中 将看到, 直接计算法依然采用了以直代曲法计算面积, 只不过这个过程在样本数据范围内达 到了最小近似,其精确度直接取决于样本数据本身。因此,可以认为它不带任何误差的计算 了样本数据的基尼系数值。 2、拟合曲线法 拟合曲线法计算基尼系数的思路是采用数学方法拟合出洛伦茨曲线,得出曲线的函数 表达式,然后用积分法求出 B 的面积,计算基尼系数。通常是通过设定洛伦茨曲线方程, 用回归的方法求出参数,再计算积分。例如,设定洛伦茨曲线的函数关系式为幂函数: β 式(5) I=αP seo 根据选定的样本数据,用回归法求出洛伦茨曲线,例如,α=m,β=n.求积分 SB=∫0 mpndp= 计算 = SA+B-SB G= SA SA+B SA+B =1- 2m n+1 式(7)
∑ Yi+∑ Yi = 1 n∑Yi-∑ ∑ Yi+∑ Yi n n 2n ∑Yi ∑Yi
n
n i-1
i
分解n∑Yi-∑ ∑ Yi+∑ Yi 得到矩阵 B
n n i-1 i n n i-1 i
n∑Yi Y1+Y2+…Yn Y1+Y2+…Yn
∑ ∑ Yi+∑ Yi +Y1 Y1+Y1+Y2 Y1+Y2+Y1+Y2+Y3 …
G1 和
k 2 2 2 P2 u2 G2 可以作为以P1 u1 和P2 u2 为权重的∑WiGi,P1P2︱ u1-u2 ︱则为组间差距指 u u u u 数Ib。值得注意的是式中没有ε(fi)项,意味着ε(fi)=0 成立,因此这种算法隐含的假 设条件是农村与城镇的收入分布完全不重叠。此外,采用这种计算方法还必须满足条件:在 估算城乡内部的基尼系数时所用的居民收入数据的口径是相同或相近的。 这种方法会在可能在两个环节产生误差:一是用其他方法估计城乡各自的基尼系数 G1 和 G2 时,可能产生误差;二是城乡收入分布一般会在不同程度上重叠。
E
C
C
A P O Xi-1 Xi 图三 如图四,计算每一部分面积 SP
i-1 i n
P B Xn X A i-1 图四 B i
SP= 1 AB(AC+BD)= 1 2 2n
i-1 n i
∑ Yi+∑ Yi ∑Yi
Yi SB=∑ 1 ∑ Yi+∑ n 2n ∑Yi 第四步,计算 SA
i-1 n SA=SA+B-SB= 1 - ∑ 1 2 2n n n i-1 i i
……
……
……
……
……
……
Yn-1 Yn
Yn-1-Y1 Yn-1-Y2 …… 0 Yn-Yn-1 Yn-Y2 …… 0 Yn-Y1 将矩阵中各项加总得到: 2〔 (n-1)Yn+(n-2)Yn-1+……+Y2—(n-1)Y1-(n-2)Y2-……-Yn-1〕 =2〔 (n-1)Yn+(n-3)Yn-1+(n-5)Yn-2……-(1-n)Y2-(n-1)Y1〕 第二步,计算 1 2n2u
n
n i-1
i
n
n i-1
i
附录二: 证明:当分点个数n有限时,G=2SA= 2 (y1+2y2+· · ·+nyn)-( n+1 ) n n 定义:y = Yi
i
∑Yi
i-1 i n i i-1
n
SP= 1 AB(AC+BD)= 1 2 2n
i-1 n i
∑ Yi+∑ Yi ∑Yi
Yi + =1 ( ∑ n 2n ∑Yi
∑ Yi ) n ∑Yi
Yi SB=∑ 1 ∑ Yi+∑ n 2n ∑Yi
i-1 n SA=SA+B-SB= 1 - ∑ 1 2 2n n n i i
∑ Yi+∑ Yi = 1 n∑Yi-(∑ ∑ Yi+∑ Yi) n n 2n ∑Yi ∑Yi
n n i
n
n i-1
i
i-Yi) i-Yi) =1 n∑Yi-∑(2 ∑ Y =1 n∑Yi-∑(2 ∑ Y n n 2n 2n ∑Yi ∑Yi
k
式(12)
,Wi 是 Gi 的权数, 式中,G 是总体基尼系数,Gi 是第 i 组内部的基尼系数(i=1,2,…,n) Ib 是组间的差距指数,ε(fi)是相互作用项。ε(fi)是各个组之间收入分布的重叠程度。 特别地,当各个组之间收入分布完全不重叠时,ε(fi)=0。 式(12)地意义在于形式化地表述了对总体基尼系数进行分解的思路和框架,但由于没
E
C
A B O 图一 X
为了用指数来更好的反映社会收入分配的平等状况,1912 年,意大利经济学家基尼根 据洛伦茨曲线计算出一个反映收入分配平等程度的指标,称为基尼系数(G) 。在上图中, 基尼系数定义为: G= SA SA+B 式(1)
当 A 为 0 时,基尼系数为 0,表示收入分配绝对平等;当 B 为 0 时,基尼系数为 1,表 示收入分配绝对不平等。基尼系数在 0~1 之间,系数越大,表示越不均等,系数越小,表 示越均等。
n
i
……
y1+y2+……yn-1 y1+y2+……yn y1+y2+……yn y1+y2+……yn 加总最后一列,得到
6
发展经济学论文
n- ∑ ∑yi=(n-1)yn+(n-2)yn-1+……y2
n i n SA=1 (2n-2 ∑ ∑yi+2∑yi)- n+1 2n 2n =1 (y1+2y2+· · ·+nyn)- n+1 n 2n
发展经济学论文
基尼系数的计算方法及数学推导
2001 金融三班 袁源
摘要:本文归纳了基尼系数的四种计算方法:直接计算法、拟合曲线法、分组计算法和分解 法,并进行了数学推导和证明。在此基础上,文章比较了各种算法优缺点,分析了误 差可能产生的环节。 关键词:洛伦茨曲线 基尼系数
一、洛伦茨曲线和基尼系数
1905 年,统计学家洛伦茨提出了洛伦茨曲线,如图一。将社会总人口按收入由低到高 的顺序平均分为 10 个等级组,每个等级组均占 10%的人口,再计算每个组的收入占总收入 的比重。然后以人口累计百分比为横轴,以收入累计百分比为纵轴,绘出一条反映居民收入 分配差距状况的曲线,即为洛伦茨曲线。 Y
附录一: 证明:G=△/2u=2SA nn 第一步,分解 ∑∑ Yj-Yi∣ j=1 i=1∣ 设将收入按从低到高排列 Y1、Y2、……Yn,则上式可以分解为矩阵 A: Y2 …… Yn-1 Yn Y1 Y1 Y2 0 Y2-Y1 Y2-Y1 0 …… …… Yn-1-Y1 Yn-1-Y2 Yn-Y1 Yn-Y2
2
发展经济学论文
Y
E
C
A P O 图二 假设分为 n 组,每组的收入为 Yi,则每个部分 P 的面积为:
i-1 i n
∑Yi
i-1 n i
式(8)
加总得到: = SA+B-SB G= SA SA+B SA+B =1-2lim ∑ 1 k→∞ 2n
n
∑ Yi+∑ Yi
式(9)
∑Yi 这是精确计算基尼系数的表达式,当分点 n 个数有限时,定义: y = Yi
i
∑Yi 得到近似表达式: G=2SA= 2 (y1+2y2+· · ·+nyn)-( n+1 ) n n 式(11)
n
式(10)
(证明过程见附录二) 分组计算法不依赖于洛伦茨曲线的函数形式,但在以直代曲的环节会出现误差,增加 分点的个数可以减少这种误差。 4、分解法 上述的计算方法的最终目的都在于求出基尼系数的值,而分解法则是在求出上述值的 基础上,力图研究基尼系数的构成因素,除了得出总的基尼系数的信息之外,在计算过程中 还能够获得分解部分内部的基尼系数值。 另外, 分解法求出基尼系数的过程一般都依赖于已 有部分的基尼系数的值,从这个意义上说,分解法并不是独立计算基尼系数的方法,它更重 要的意义在于对基尼系数的分解,即定义的各个不同基尼系数值之间的相互关系。 伦敦经济学院收入分配方法论专家 Cowell 教授提出,基尼系数在不同人群组之间无法 完全分解于尽。 总体基尼系数除了包括各个组内差距之外, 还应包括组间差距和相互作用项。 公式为: G = ∑WiGi+Ib+ε(fi)
n