简易基尼系数计算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
推介一个简便易用的基尼系数计算公式
张建华 山西农业大学经贸学院
近年来,我国经济生活中,在国民经济整体快速发展的同时,不同行业、不同地区、不同个人之间的社会收入分配差距明显拉大,引起了社会各界人士的广泛关注,基尼系数也随之成为当前我国经济生活中最流行的经济学语词之一。
但是,对于如何计算基尼系数,目前国内经济学教科书鲜有介绍。
就笔者手头所有的十几种经济学教科书来讲,绝大多数都只限于介绍定义,而没有具体计算公式。
只有臧日宏编者《经济学》(中国农业大学出版社2002年7月第1版)和王健、修长柏主编《西方经济学》(中国农业大学出版社2004年10月第1版)这两种教科书给出了基尼系数的计算公式,但该公式推导过程相当复杂,理解记忆比较困难,实际计算烦琐。
为此,笔者经反复思索,找到了一种简便易用的计算方法,并于笔者所著《经济学——入门与创新》(中国农业出版社2005年8月第1版)一书中作了简要介绍,但该书作为教科书,发行量不大,难于为一般读者所了解。
考虑到这一问题的重大理论意义和实际应用价值,笔者决定还是借助网络来广而告之。
(一)洛伦茨曲线与基尼系数的基本概念
洛伦茨曲线(Lorenz curve)是奥地利统计学家洛伦茨(Max Otto Lorenz,1903-?)提出来的一个用以衡量社会收入分配公平程度的统计分析工具。
现以一个假想的例子,说明其基本做法:
(1)将一定地区(如一个国家、一个省、一个县等)内的全部调查人口按收入由低到高顺序排队,并按人数相等的原则平均分为若干组。
一般比较常见的是,将全部调查人口分为5组,每组人口占总人口的20%。
(2)分别计算每一组人口总收入占全部人口总收入的百分比。
假定经过调查计算,每组人口收入占全部人口总收入的比重依次分别为4%、6%、11%、17%、62%。
(3)按收入由低到高的顺序,计算从第1组直到第i组的累计人口总收入占全部人口总收入的百分比。
仍以上述假定数据为例,计算结果:累计到第1组人口总收入占全部人口总收入的比重为4%,累计到第2组人口总收入占全部人口总收入的比重为10%,累计到第3组人口总收入占全部人口总收入的比重为21%,累计到第4组人口总收入占全部人口总收入的比重为38%。
(4)以各组累计人口百分比为横轴,累计收入百分比为纵轴,作出表示直到每一组的累计人口总收入占全部人口总收入的百分比随累计人口百分比变化而变化的曲线,这就是洛伦茨曲线。
(因作图不便,故略)
通过上述步骤得到的洛伦茨曲线通常是一条向右下方凸出的弯曲的曲线。
一般地,洛伦茨曲线弯曲程度越大,表示收入分配不公平程度越大。
将洛伦茨曲线的终点与坐标原点连接起来,得到一条直线,表示全部收入完全平均地分配在所有人口中间,没有任何分配差距,被称为“绝对公平线”(Curve of absolute equality)。
从洛伦茨曲线的终点向横轴作一垂线,与横轴相交,然后再沿横轴回到坐标原点,这样得到一条折线,称为“绝对不公
平线”(Curve of absolute inequality),它表示全部收入集中在1个人手中,其他人毫无收入。
一般实际的洛伦茨曲线总是处于绝对公平线与绝对不公平线之间。
上述洛伦茨曲线,只能粗略地大概地反映社会收入分配不平等程度。
为了能够定量地精确反映社会收入分配不平等程度,意大利统计学家基尼(Corrado Gini,1884-1965)在洛伦茨曲线的基础上,进一步提出了基尼系数(Ginicoefficient)的概念,其含义是指实际洛伦茨曲线与绝对公平线所包围的面积A占绝对公平线与绝对不公平线之间的面积A+B 的比重。
用公式表示:
G= A/(A+B)
因为实际的洛伦茨曲线总是落在绝对公平线与绝对不公平线之间,因此,基尼系数总是介于0和1之间,并随洛伦茨曲线弯曲程度的增大而逐渐增大,表示社会收入分配不平等程度加剧。
当洛伦茨曲线与绝对公平线重合时,基尼系数为0,表示社会收入分配绝对平均;当洛伦茨曲线与绝对不公平线重合时,基尼系数为1,表示社会收入分配绝对不平均。
(二)关于既有基尼系数计算公式的商榷
目前,国内经济学教科书绝大多数都没有介绍基尼系数的具体计算公式。
在笔者手头所有的十几种经济学教科书中,只有臧日宏编著《经济学》和王健、修长柏主编《西方经济学》介绍了基尼系数的具体计算公式。
据臧日宏编著《经济学》第201至202页,基尼系数的计算公式如下:
G=1+ΣYiPi-2Σ(ΣPi)′Yi
上式中,G代表基尼系数,Yi代表第i组人口总收入占全部人口总收入的比例,Pi代表第i组人口数占全部人口总数的比重,(ΣPi)′表示累计到第i组的人口总数占全部人口总数的比重。
臧日宏《经济学》只介绍了这一基尼系数计算公式及其计算步骤,而未介绍推导过程。
经笔者个人分析,其推导过程大致如下:(因作图不便,只好用语言描述,稍懂经济学常识的读者,应该不难根据这里的语言描述,自行作图推导)
为了计算基尼系数G,首先需要计算A的面积。
由于实际洛伦茨曲线是一条弯曲的线,无法直接计算A的面积,只能采用某种方法近似计算。
按上述臧日宏书中介绍的方法: 首先以累计到第i组的人口比重(ΣPi)′为长度,以第i组人口总收入占全部人口总收入的比重Yi为宽,计算出相应的一个个小矩形的面积,并加总,即Σ(ΣPi)′Yi。
然后减去以全部人口数占全部人口数的比重即100%为底,以全部人口总收入占全部人口总收入的比重即100%为高,计算的三角形面积,即减去1/2。
再减去以每组人口数占全部人口数的比重Pi为底,以每组人口总收入占全部人口总收入的比重Yi为高,计算的一个个小三角形的面积之和,即1/2 ΣPiYi.
这样就近似地得到了A的面积。
很容易知道A+B的面积,就是以全部人口数占全部人口数的比重即100%为底,以全部人口总收入占全部人口总收入的比重即100%为高,计算的三角形面积,即1/2。
将上述推导出来的A和A+B的面积代入基尼系数的定义式,即可得到基尼系数的计算公式: G=2Σ(ΣPi)′Yi -1-ΣYiPi
=-[1+ΣYiPi-2Σ(ΣPi)′Yi]
照此推导结果,除符号与臧日宏书中所述相反外,其它均相同。
(三)推介一个新的简便易用的基尼系数计算公式
鉴于上述基尼系数计算公式理论推导的复杂,理解记忆的困难,实际应用的烦琐,笔者作了独立探索和简化。
结果如下:
首先计算A+B的面积,结果为1/2。
其次计算B的面积。
由于洛伦茨曲线是一条不规则的曲线,无法直接计算B的面积,因此采用近似梯形的面积来代替。
假定全部人口平均分为n组,以累计到第i组人口总收入占全部人口总收入的比重Wi为下底,以累计到第i-1组人口总收入占全部人口总收入的比重Wi-1为上底,以每组人口占全部人口的比例即1/n为高,计算一个个小梯形的面积,并加总,即得到近似B的面积:
B = Σ[ 1/2 ×1/n ×(Wi-1 + Wi)]
其中,i从1到n-1 (此处应为i从1到n,博主订正)
最后,再将上述推导结果代入基尼系数定义式,进行推导
化简整理,即得一个简便易学易用的基尼系数计算公式:
其中Wi表示从第1组累计到第i组的人口总收入占全部人口总收入的百分比,
(四)应用举例
为了帮助读者确切地掌握上述公式的使用方法,现以本文前述假想数据为例,作一示范。
G=1-1/5 [ 2 (4% + 10% + 21% +38% ) + 1 ] =0.508
若使用前述臧日宏《经济学》书中介绍的公式计算,则为:
G=1+(20%×4%+20%×6%+20%×11%+20%×17%+20%×62%)-2(20%×4%+40%×6%+60%×11%+80%×17%+100%×62%)=-0.508
取其绝对值,与使用本文推介的简便公式计算结果完全一样。
但两种方法在理论推导思路的简捷,公式本身的易学易记易用方面,熟优熟劣,显而易见。