基尼系数的计算与分解方法比较分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

算出 G 的数值。例如,设这一函数式为幂函数: I = a Pb ,根据样本的数据,用回归法可以
求出 a = m, b = n ,则洛伦茨曲线的函数式为: I = mPn 。
ò SB =
1
mPndp =
m
0
n+ 1
(6)
2m G = 1- 2SB = 1- n + 1
(7)
面对一个具体的国家或地区,人们很难得知相应的洛伦兹曲线是何种函数。在使用该 计算方法时,人们往往假设洛伦兹曲线为一种可导可积的函数,这就形成了产生误差的一个 主要环节。另外,用回归法求洛伦茨曲线函数的表达式,也是产生误差的一个环节。因此, 在使用回归曲线法时,为避免更大的误差,一要注意设定洛伦茨曲线的函数关系式的准确性; 二是在求曲线表达式时,一般要求样本数量要足够多(熊俊,2003)。
3、等分法
等分法要求样本人口(家户)必须等分,样本按收入比重单调非递减顺序排列。假设 全部样本等分为 k 组,第 i 组的收入为 Yi,则收入比重为:
yi =
Yi
k
å Yi
i= 1
(i=1,2,…,k)
且: y1£ y2 £ ... £ yk , y1 + y2 + ...+ yk = 1
从图 1 知,扇形 OEC 的面积为:
用S表示按人口的分组数pI和wI分别表示第I组的人口比重和收入比重(I = 1 ,2…,S)用mI 表示各组的平均收入,且mI按由小到大的顺序排列。GA ,GB ,GO的计算公式分别如下:
s
s
∑ ∑ GB = 1− 2BI = 1− pI (2QI − wI )
I =1
I =1
(11)
I
∑ 其中: QI = wk k =1
éê1 êë2
p2w2 +
ù
p2
w1
ú+ úû
... +
éê1 êë2
pi wi +
pi (w1 +
w2 +
... +
ù
wi-
1
)ú+ úû
...
+
éê1 êë2
pnwn +
pn (w1 +
w2 + ...+
ù
wn-
1
)ú úû
1 = 2 [ p1(2w1 - w1) + p2 (2w1 + 2w2 - w2 ) + ...
为从 1 到 I 的累积收入比重。
s
∑ GA = wI pIGI I =1
(12)
(12)式中,wI,pI的含义同上GI为第I个分组的基尼系数其计算公式与公式(11)一致,这 里只对某个特定的分组计算。共有s个分组的基尼系数。
GO=G-GA-GB (13) 对样本数据进行按人口分组的基尼系数计算,可以考察分组之间和组内人均收入差异状 况,还可以考察组与组之间人均收入交叉重叠的程度。例如运用分组基尼系数计算,可以考 察地区之间和城乡之间的收入差异程度。
E 100%
收 入 份 额 累 计
O
C
L
A 洛伦兹曲线
人口份额累计
B D
100%
100% 收 入 的 百 分 比
(Wi)
P
0
完全平等线 A
洛伦兹曲线
q2
B
q1
O2
Wn
W3
W2 W1 100%
Leabharlann Baidu
P1 P2 P3 人口的百分比(pi) Pn
图1
图2
算公式以及具体含义的差异,对正确理解各种计算和分解方法,估价各种计算、分解方法的
n
n
∑ ∑ Gf = 1− 2Bfi = 1− pi (2Qfi − wfi )
i =1
i =1
对于所有的 f, f=1,2,…,F。
(14)
i
∑ 其中: Qfi = wfk k =1
为f收入从 1 到i的累积收入比重,pi是第i个样本人口在总人口中的比重,wfi=pimfi/uf是 第i个样本的f收入在总的f收入来源中的比重。在Cf的计算时,样本仍按人均收入mi由小到大 排列;在Gf的计算时样本则按分来源的人均收入mfi由小到大排列。尽管Gf和Cf只能在(0 ,1) 区间取值,但是Cf的取值却可能在(-Gf,Gf)之间。
组越多,误差越小。所以,可通过适当选择分组数k来控制误差的范围 [2]。
-3-
http://www.paper.edu.cn
4、人口分组法
Yao(1999)介绍了一种较直观简便的计算基尼系数的方法 [3]。假定样本人口可以分成n
组,设wi、mi和pi分别代表第i组的人均收入份额、平均人均收入和人口频数(i=1 .2…n),对
n
pi (2Qi -
i= 1
wi ).......(9)
i
n
n
å å å 其中:Qi = wk , pi = 1, wi = 1
k=1
i= 1
i= 1
Qi为从 1 到i的累计收入比重,SB为洛伦茨曲线右下方的面积。这样根据式(9)计算基 尼系数只要已知样本的两个变量:一个是收入变量,一个是人口变量。
当样本容量 n 很大时,式(2)的运算量非常大,这使得直接计算法在相当长的时期里,不
真正具有可操作性,但在计算机技术高度发达的今天,快速准确地算出 G 的值己完全不成
问题。由于直接计算法不存在产生误差的可能性,即只要不存在来源于样本数据方面的误差,
用该方法算出的基尼系数值是完全真实准确的,这也是这种计算方法独具的优点。
对于基尼系数,人们一般习惯于借助洛伦兹曲线直观地给以形式化的表述。基尼系数 的计算通常是通过计算洛伦茨曲线图中洛伦茨曲线与对角线之间的面积以及对角线右下方
的直角三角形面积,将这两块面积相除而求得。即: G = SA
(1)
S A+ B
其中,G表示基尼系数,SA表示洛伦兹曲线L和直线OC围成的面积(如图 1),SA+B表示
全部样本按人均收入(mi)由小到大排序后,即: m1 £ m2 £ ... £ mn 。
如图 2,当分组数(n)足够多的时候,pi将趋近于无穷小,由积分定义可得:
S » S + S p1q1q2 p2
D q1q2o2
p1q1o2 p2 ,公式推导如下(陈传波等,2001):
SB =
1 2
p1w1 +
1.按人口分组的基尼系数分解法
如果总样本可以分为有限个人口组,用 G 代表整个样本的基尼系数,则 G 可以分解为 三个部分,即组内差异部分、组间差异部分、组间重叠部分。用公式表示:
-4-
http://www.paper.edu.cn
G=GA+GB+GO (10) 其中:GA表示基尼系数(G)的组内差异构成部分,GB表示基尼系数的组间差异构成部分, GO表示基尼系数的组间重叠构成部分。 如果各分组内人口的收入完全相等,则组内差异GA = 0;如果所有分组的人均收入完全 相等则组间差异GB=0;如果低收入组中最高收入个人的收入水平低于较高收入组内最低收 入水平,则组间重叠部分GO=0。同理还可以在每个分组内再分小组进行基尼系数的计算, 这样基尼系数就进行了两层分解。
1基金项目:陕西省教育厅专项科研计划项目(05JK057)资助,西安建筑科技大学人文社科基金(RW0514) 资助。
作者简介:赵光华(1966-),男,西安建筑科技大学信控学院,副研究员,硕士导师,经济管理专业博士 研究生,从事区域经济学研究。
-1-
http://www.paper.edu.cn
I
http://www.paper.edu.cn
基尼系数的计算与分解方法比较分析1
赵光华
(西安建筑科技大学,陕西 西安 710055)
摘 要:基尼系数的计算方法,比较有代表性的方法有直接计算法、回归曲线法、等分法和 人口分组法等;基尼系数分解方法有人口分组分解法和收入来源分组分解法。本文在归纳这 四种计算方法、两种分解方法的基础上,对它们进行比较分析,重点是比较各种方法在计算 过程中,产生误差的环节及其可控制性。最后给出选择基尼系数计算方法的参考顺序,并分 析了两种分解方法的特点。 关键词:基尼系数;计算方法;分解方法;比较分析
2、回归曲线法
回归曲线法是一种利用洛伦兹曲线函数关系式算基尼系数的方法。在图 1 中,洛伦兹
曲线 L 与折线 ODC 所围成的面积记为比,由于 SA+ B =
SDODC =
1 ,因此: 2
-2-
http://www.paper.edu.cn
G=
SA = S A+ B
2SA = 1-
2S B
(5)
通过设定洛伦茨曲线的函数关系式,用回归的方法得出具体的函数式,最后求积分计
(1 + 2k
1) 2
则,G =
2SA =
2 k
( y1
+
2 y2
+
... +
kyk ) -
(
k
+ k
1)K(8)
这种计算方法不依赖于洛伦兹曲线的函数关系式,因而也就不受回归曲线法中的那两 个条件限制,进而使该方法总是具有可操作性。但我们还可以看到,在求扇形OEC的面积时, 是用k个梯形的面积累计而成,这种用线段代替弧线的做法,容易造成对SA的明显低估,由 式(8)知,对基尼系数的低估更会扩大一倍。与直接计算法相比,这是个缺点。不过,分
D ODC的面积。虽然式(l)是个极为简明的数学表达式,但它并不具有实际的可操作性。
许多经济学家和统计学家都不断致力于寻求具有可操作性的计算和分解方法。目前在基尼系 数的计算和分解上存在许多公式和算法,在己有的研究成果中,有四种估算方法是较有代表 性的,它们分别是直接计算法、回归曲线法、等分法和人口分组法;基尼系数的分解方法大 致有两种:按人口分组分解法、按收入来源分组分解法。研究这些方法的运算条件、计
+ pi (2w1 + 2w2 + ...+ 2wi - wi ) + ...+ pn (2w1 + 2w2 + ...+ 2wn - wn )]
2SB = p1(2w1 - w1) + p2 (2w1 + 2w2 - w2 ) + ...
+ pi (2w1 + 2w2 + ...+ 2wi - wi ) + ...+ pn (2w1 + 2w2 + ...+ 2wn - wn )
1
2
i
n
å å å å = p1(2 wk - w1) + p2 (2 wk - w2 ) + ...+ pi (2 wk - wi ) + ...+ pn (2 wk - wn )
k=1
k=1
k=1
k=1
n
å = pi (2Qi - wi )
i= 1
å G =
SA S A+ B
= 1-
2SB = 1-
基尼于 1912 年给出了无替换的基尼平均差计算公式:
nn
å å xj - xi
D = j= 1 i= 1
, 0 £ D £ 2u
n(n - 1)
(3)
式中 D 是基尼平均差,同时基尼规定:
G = D ,0£ G£ 1 2u
(4)
式(4)所度量的即是基尼系数,同(2)式相同。这种估算方法可以无条件地使用。
准确性以及合理选择基尼系数的计算、分解方法都具有一定的实际意义 [1]。
二、基尼系数计算方法的比较分析
1、直接计算法
这是一种最为直接的计算方法,这种算法并不依赖于洛伦茨曲线,计算公式为:
å å 1
nn
G = 2n(n - 1)u j=1 i=1 x j - xi
(2)
(2)式中, x j - xi 是任何一对收入样本差的绝对值,n 为样本容量,u 是收入均值。
人口分组法依赖于样本分组数量(n)足够大,pi趋近于无穷小,化曲线L近似为n个小 的直线段,SB由n个近似的三角形与长方形组合而求得,这样难免出现误差,样本分组数量 越多,误差越小,反之,误差越大。
三、基尼系数的分解方法分析
基尼系数的分解方法有两种:一是按人口分类,考察不同人口组的收入差异程度;二是 按收入来源分类,考察不同收入来源对总基尼系数的贡献度,以此分析影响收入差异程度的 主要收入种类(陈风波等,2002)。
一、引言
基尼系数是意大利经济学家基尼(Gini)1922 年根据洛伦茨曲线的性质所提出的判断 收入分配差异程度的定量指标。它的经济含义是:在全部居民收入中用于不平均分配的百分 比。基尼系数作为一个从总体上衡量一定范围(一国或地区)内居民收入分配不均等程度的 相对量统计指标,其值域仅为[0,1]。在估计收入差异分析的众多方法中,基尼系数法受到了 研究人员的重视,被较多地采用。
2.按收入来源分组的基尼系数分解法
如果第i个农户的人均收入mi(i=1,2,…n)分为F个收入来源,那么基尼系数也可以分解成F 个部分。这就使得我们可以考察不同收入来源下的收入差异及各收入来源对收入差异的贡献 大小。
设Gf为f收入来源的基尼系数(f=1,2,...F)Cf为f收入来源的集中率,uf和u分别为f收入来源 的平均收入和样本总收入,wf=uf/u为f收入来源在样本总收入中的比重,那么Gf和Cf均可以 由下式求得:
1+ 2
SA =
1 ( y1 + k2
y2 + ...+
yk ) +
1 ( y2 + k2
y3 + ...+
yk ) + ...+
1· k
yk 2
=
1 k
( y1
+
2 y2
+
... +
kyk ) -
1 2k
( y1 +
y2 +
... +
yk )
所以,SA =
1 k
(
y1
+
y2 + ...+ kyk ) -
相关文档
最新文档