基尼系数计算问题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、基尼系数计算问题
基尼系数是由意大利罗马大学教授基尼(Corrado Gini, 1884-1965)根据洛伦茨曲线(Lorenz Curve)提出的对社会收入不公平等度的一种度量。通常认为一个国家(或地区)的基尼系数大于0.4时,表明其社会很不稳定,隐藏着动荡的危险。据某些报道称目前中国基尼系数已接近0.4。
要弄清楚基尼系数的定义,首先要明白洛伦兹曲线的含义。见下图:
洛伦兹曲线是美国统计学家洛伦兹提出的用来描述社会收入分配状况的一种曲线,它由累积的一定人口数占总人口中的百分比与这部分人口所获得的收入占总收入中的百分比状况来表示(如上图)。图中的45°对角线称为绝对平均分配线,由横轴和纵轴组成的折线称为绝对不平等线。实际收入分配曲线(即洛伦兹曲线),则是介于两者之间的一条向下弯曲的曲线,该曲线向下弯曲的程度越大,表示社会收入分配不均的程度就越严重;反之,则表示社会收入分配就越接近于平均。
后来,意大利统计学家基尼根据洛伦兹曲线提出了判断收入分配不平均程度的指标,被称为基尼系数。所谓基尼系数是由图1中的45°对角线与洛伦兹曲线之间的面积A ,与对角线与折线之间的面积A+B (等于0.5)之比来测度的。即:
()/212G A A B A B =+=⋅=-⋅
基尼系数越大,收入分配越不平均;反之,收入分配越接近平均。 尽管洛伦兹曲线可根据收入分配的统计数据加以描绘,但至今却未能找到一种有效的方法,能够精确地得出洛伦兹曲线的函数方程并由此求出精确的基尼系数。目前常被使用的方法主要以下两种:
⑴直接计算或分组统计计算。即根据已知的某一人群收入具体数据(或分组统计数据),按几何图形分块近似逼近计算的方法。基尼系数计算.xls
利用这种方法不能得到洛伦兹曲线的表达式,只能用来计算基尼系数,但由于在计算分块面积时用直线近似地代替曲线,所估计的基尼系数要小于实际值,尤其在数据点较少时,误差较大。
⑵分组拟合计算。即选择适当的函数()L x 来拟合洛伦兹曲线(严格地说,洛伦兹曲线是离散点集,但当人口总数足够多时,还是可以用连续、可导的函数来近似描述。),这里x 为按收入等级分组的累计人口数占总人口比例,0100%x ≤≤。然后根据定义用定积分来计算基尼系数。
()()()1
0/1/12G A A B B A B L x dx =+=-+=-⋅⋅⎰ 根据前人的研究成果,()L x 可用如下带参数的关系式近似表达: ()()1L x x c x x β
α=-⋅⋅-,式中参数满足
0c >;01α<<;01β<<
可以证明,以上函数关系式满足洛伦兹曲线的四项特征:
⑴洛伦兹曲线在特殊点的函数值,即
()00L =,表示
0%的人口其收入为0; ()11L =,表示100%的人口其收入为100%。
⑵洛伦兹曲线位于绝对平均分配线的下方,绝对不平等线的上方,即: 当01x ≤≤时,()0L x x ≤≤
⑶洛伦兹曲线是单调递增的,即:当01x ≤≤时,/0dL dx >。 证明如下:
()()()()11111111111011dL c x x x x dx
c x x x x x L x x x L
x L
x L
x x x ββααβααβαβαβαββ--⎡⎤=-⋅⋅⋅--⋅⋅-⎣⎦⎛⎫=-⋅⋅-⋅- ⎪-⎝⎭
⎛⎫=--⋅- ⎪-⎝⎭
---=-⋅+⋅>⋅>--
⑷洛伦兹曲线是下凹的,当01x ≤≤时,22/0d L dx >。
证明如下:
()()()()()()()()()()()()212121211211211111111111110d L
c x x x x dx c x x x x c x x x x c x x x x ββααββααββααββαααααββαββαααββαββ------------⎡⎤=⋅-⋅-⋅⋅-+⋅⋅⋅-⎣
⎦⎡⎤+⋅⋅⋅⋅--⋅-⋅⋅-⎣⎦
⎡⎤=⋅⋅-⋅⋅-+⋅⋅⋅-⎣⎦
⎡⎤+⋅⋅⋅⋅-+⋅-⋅⋅->⎣⎦
接下来的首要问题就是:如何根据已知的收入分组统计数据来拟合洛伦
兹曲线函数()L x ,实质就是求出参数c 、α、β的值。
将()()1L x x c x x β
α=-⋅⋅-改写成对数形式
()()ln ln ln ln 1x L c x x αβ-=+⋅+⋅- 然后就可根据已知数据用“线性回归”方法拟合出参数c 、α、β的值。 例题:根据国家统计局的抽样调查,我国在1999年城镇人口的分组收入情况数据如下表显示,试拟合对应的洛伦兹曲线并计算基尼系数。
利用Maple 软件的拟合命令,可求出拟合洛伦兹函数的相关参数:
注意:尽管在以上拟合洛伦兹曲线中得到的参数 1.04α≈不符合原先的约定要求01α<<,但通过图形观测发现拟合曲线确实满足以下特征条件:
()00L =,()11L =,()0L x x ≤≤,/0dL dx >,22/0d L dx > 所以我们认为得到的拟合函数是有效的。
得到洛伦兹曲线的拟合函数后,剩下来的问题就是如何根据定义求解基尼系数()1
012G L x dx =-⋅⋅⎰了,由于该式含有广义积分,手工计算非常不便。
通常可借助数学软件计算。
对于以上例题,利用Maple 软件的数值积分命令,可求出基尼系数。
即基尼系数()10120.3497G L x dx =-⋅⋅≈⎰
如不拟合洛伦兹曲线,而是采用分组统计计算法,结果如下表显示。
这也映证了采用分组统计计算法得出的基尼系数估值小于实际值。