ecel计算基尼系数法简单实用
基尼系数算法攻略~~~(呕心沥血版)

以WPS版为例
(一)洛伦兹曲线画法
1、排序
2、计算各省人均GDP占全国的比重:=B2/SUM($B$2:B32)
注:红色字符表示固定B2,可以自行输入,也可以按Fn+F4得到。
3、累加:=SUM($C$2:C2),并设置单元格格式为百分比形式。
4、在E列输入1-31,在F列输入=1/31*E2,设置单元格格式为分数形式。
5、在第二行插入新的单元行。
在D,F列分别输入0%,0。
然后用D作图。
此图为洛伦兹曲线。
(分类X轴标志为F列,系列一名称为洛伦兹曲线)
6、插入G列,内容等同F列。
用G列画图,此图为绝对公平曲线。
(分类X轴标志为F列,系列二名称为绝对公平曲线)
7、双击横轴,将图中勾去掉。
此时,图经过原点。
(二)基尼系数的计算
8、在H列输入=G2-D2,此列的含义为绝对平均线和洛伦兹曲线的距离。
9、在I列输入=((D2+D3)*(1/31)*(1/2));
10、累加面积
11、计算基尼系数
哎呀妈呀,终于做完了。
excel计算基尼系数法,简单实用教学内容

e x c e l计算基尼系数法,简单实用收入差距基尼系数的EXCEL算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了著名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人图1手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的面积A+B 叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
收入差距基尼系数的EXCEL算法

收入差距基尼系数的EXCEL 算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz ,1903- )1907年(或说1905年)提出的了著名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH 表示人口(按收入由低到高分组)的累积百分比,纵轴OM 表示收入的累积百分比,弧线OL 为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL 。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL 。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL ,也不是45度线OL ,而是像图中这样向横轴突出的弧线OL ,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的面积A+B 叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积图1分、协方差等概念的运用,不易理解和操作,令人望而却步。
gini系数公式

一、基尼指数的概念
基尼指数(Gini不纯度)表示在样本集合中一个随机选中的样本被分错的概率。
注意:Gini指数越小表示集合中被选中的样本被参错的概率越小,也就是说集合的纯度越高,反之,集合越不纯。
当集合中所有样本为一个类时,基尼指数为0.
二、基尼系数的计算公式
基尼指数的计算公式为:
三、计算示例
我们分别来计算一下决策树中各个节点基尼系数:
以下excel表格记录了Gini系数的计算过程。
我们可以看到,GoodBloodCircle的基尼系数是最小的,也就是最不容易犯错误,因此我们应该把这个节点作为决策树的根节点。
在机器学习中,CART分类树算法使用基尼系数来代替信息增益比,基尼系数代表了模型的不纯度,基尼系数越小,不纯度越低,特征越好。
这和信息增益(比)相反。
excel计算基尼系数法,简单实用

收入差距基尼系数的EXCEL算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家).洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了著名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL,OHL与45度线之间的面积A+B叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
excel计算基尼系数法,简单实用

收入差距基尼系数的EXCEL算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家).洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了著名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口百分图1比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL,OHL与45度线之间的面积A+B叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
excel算基尼系数

第一种情况:已知N个人的收入,计算其基尼系数G。 设这N个人收入从低到高排列后,得到的收入为Qi(i=1, 2,……,N)。且记
则有:
上面推导中需要说明的是:根据前面有关概念和说明我们 知道,图1中直角三角形OAB的两个直角边长都是1,于是 S1+S2等 于 0 . 5 。 S2实 际 上 就 是 N 个 直 角 梯 形 ( 第 一 个 为 三 角 形)面积之和,其中第i个梯形的“上底”就是Vi-1,“下底” 42
43
为了彻底破除人们在计算基尼系数方面的技术障碍和困 难,本文将对基尼系数的计算进行一番探索,在指出常用基尼 系数计算公式不足的同时,直接根据基尼系数的有关定义,对 两种情况下的基尼系数计算,进行严格的数学推导证明,取得 两条新的基尼系数实用计算公式;然后再根据这两条实用计算 公式,充分利用EXCEL中单元格的计算功能,建立起全新、科 学、简易的基尼系数计算方法,可使一般人不用专门计算程序 也能轻轻松松地计算出基尼系数。
三、EXCEL下基尼系数计算的新方法
有了上面的公式3和公式4,现在我们可以讨论EXCEL下 基尼系数计算的新方法。为了更加具体、直观地介绍EXCEL下 基尼系数计算的新方法,下面将采用实例的形式,并分两种情 况进行。
1.已知EXCEL表中有一列个人收入数据,求其基尼系数。 为了节省本文篇幅,这里只举一个18人的例子,人数很 多操作步骤也完全一样。设在EXCEL表的A3到A20单元中有 18个人的收入数据,它们已按从小到大排列,具体见表1。 表1
隔处的“折线段”一般都在K线的下方,不可能在K线的上 方,这就使得公式4中的S1往往要比实际上的S1小,结果公式 4计算出的G也就往往要比实际上的基尼系数小一些。这点也 说明了,用分组方法计算基尼系数往往会出现低估的情况,分 组越粗,得到的基尼系数就越小。这个问题,在我们的实际工 作中也遇到过。如同样的住户调查数据,由于在计算时采用不 同的分组方法,如十分法或五分法,则得到的基尼系数往往是 不一样的,结果给关于基尼系数的统计分析带来了困惑。人们 之所以比较多地采用十分法和五分法计算基尼系数,我想其中 一个主要原因就是想简化基尼系数的计算,避开对成百上千住 户调查数据进行直接计算的麻烦。现在好了,我们没有必要回 避对住户调查数据的直接计算,因为,有了公式3和下面将要 介绍的方法,我们可以不费吹灰之力就能将它们搞定,还能还 基尼系数以本来面目。
收入差距基尼系数的EXCEL算法

收入差距基尼系数的EXCEL 算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz ,1903- )1907年(或说1905年)提出的了著名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH 表示人口(按收入由低到高分组)的累积百分比,纵轴OM 表示收入的累积百分比,弧线OL 为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL 。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL 。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL ,也不是45度线OL ,而是像图中这样向横轴突出的弧线OL ,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的面积A+B 叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积图1分、协方差等概念的运用,不易理解和操作,令人望而却步。
dagum基尼系数计算excel计算步骤

在经济学和社会学领域中,基尼系数被广泛用于衡量收入分配的不平等程度。
而在实际运用中,通常会使用Excel等电子表格软件进行计算。
本文将介绍如何使用Excel计算基尼系数,包括数据准备、计算步骤和结果解读。
二、数据准备1. 数据收集:首先需要收集相关的收入数据,可以是个人收入、家庭收入或国家/地区的总体收入数据;2. 数据整理:将收集到的数据整理成一张表格,一般包括两列,分别是收入数据和对应的个体数量(或家庭数量)。
三、计算步骤1. 排序数据:将数据按照收入从小到大的顺序进行排序;2. 计算累积收入比例:新增一列用来计算累积收入比例,其中第一个数据为个体数量(或家庭数量)的比例,第二个数据为第一个个体的收入与总收入的比例,第三个数据为前两个个体的收入比例之和,以此类推;3. 计算Lorentz曲线的面积:在Excel中使用“面积图”功能可以比较容易绘制出Lorentz曲线,然后根据面积计算出Lorentz曲线下4. 计算基尼系数:基尼系数即Lorentz曲线下的面积与45°对角线下的面积之比。
四、结果解读基尼系数的取值范围是0到1之间,数值越大表示收入不平等程度越高。
一般来说,基尼系数小于0.2表示收入分配比较平均;0.2到0.3表示收入分配较为合理;0.3到0.4表示收入分配有一定程度的不平等;大于0.4表示收入不平等程度较高。
五、注意事项1. 在计算基尼系数时,需要确保数据的准确性和完整性,避免因为数据缺失或错误导致计算结果的偏差;2. 正确理解基尼系数的含义,不同国家或地区的经济发展水平、社会制度等因素都会对基尼系数的解读产生影响,需要综合考量。
结语本文介绍了使用Excel计算基尼系数的详细步骤,同时也提醒了读者在实际操作中需要注意的事项。
希望读者能够通过本文的指导,准确计算基尼系数,并且正确解读其含义,在实践中更好地应用和分析收入分配的不平等问题。
六、数据准备(补充)在整理数据时,需要特别注意数据的准确性和全面性。
EXCEL计算基尼系数法简单实用

E X C E L计算基尼系数法简单实用集团标准化办公室:[VV986T-J682P28-JP266L8-68PNN]收入差距基尼系数的EXCEL算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家).洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了着名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人图1手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的面积A+B 叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
excel计算基尼系数法,简单实用

收入差距基尼系数的EXCEL算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了着名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口百分图1比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL,OHL与45度线之间的面积A+B叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
excel计算基尼系数法,简单实用

收入差距基尼系数的EXCEL 算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz ,1903- )1907年(或说1905年)提出的了着名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH 表示人口(按收入由低到高分组)的累积百分比,纵轴OM 表示收入的累积百分比,弧线OL 为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL 。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL 。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL ,也不是45度线OL ,而是像图中这样向横轴突出的弧线OL ,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的面积A+B 叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
EXCEL计算基尼系数法简单实用

L —-nnnlnpnrgilum n u s B H s n g p n x m一三三三._=IB lH u tn e q m m H B g i n H H S H B yeg g计算基尼系]法简单实用集团标准化办公室:[VV986T-J682P28-JP266L8-68PNN]收入差距基尼系数的EXCEL算法一.理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家).洛伦兹(Max Otto Lorenz, 1903- ) 1907年(或说1903年)提出的了着名的洛伦兹曲线。
它先将一国人口按收入山低到高排队,然后考虑收入最低的任意白分比人口所得到的收入口分比。
将这样的人口累计白分比和收入累讣白•分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴0H表示人口(按收入III低到高分组)的累积口分比,纵轴0M表示收入的累积口分比,弧线0L为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口白分比均等于其收入白分比,从而人口累计百分比等于收入累计•白分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OLo一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等, 而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线0L,而是像图中这样向横轴突出的弧线0L,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL, OHL与45度线之间的面积A+B叫做“完全不平等面积”。
excel计算基尼系数法-简单实用

收入差距基尼系数的EXCEL 算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz ,1903- )1907年(或说1905年)提出的了著名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH 表示人口(按收入由低到高分组)的累积百分比,纵轴OM 表示收入的累积百分比,弧线OL 为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL 。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL 。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL ,也不是45度线OL ,而是像图中这样向横轴突出的弧线OL ,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的面积A+B 叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
excel计算基尼系数法,简单实用

excel计算基尼系数法,简单实⽤收⼊差距基尼系数的EXCEL 算法⼀、理论背景为了研究国民收⼊在国民之间的分配问题,美国统计学家(或说奥地利统计学家)M.O.洛伦兹(Max Otto Lorenz ,1903-)1907年(或说1905年)提出的了著名的洛伦兹曲线。
它先将⼀国⼈⼝按收⼊由低到⾼排队,然后考虑收⼊最低的任意百分⽐⼈⼝所得到的收⼊百分⽐。
将这样的⼈⼝累计百分⽐和收⼊累计百分⽐的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线⽤以⽐较和分析⼀个国家在不同时代或者不同国家在同⼀时代的财富不平等,该曲线作为⼀个总结收⼊和财富分配信息的便利的图形⽅法得到⼴泛应⽤。
图1中横轴OH 表⽰⼈⼝(按收⼊由低到⾼分组)的累积百分⽐,纵轴OM 表⽰收⼊的累积百分⽐,弧线OL 为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
⼀般来讲,它反映了收⼊分配的不平等程度。
弯曲程度越⼤,收⼊分配越不平等,反之亦然。
特别是,如果所有收⼊都集中在1⼈⼿中,⽽其余⼈⼝均⼀⽆所获时,收⼊分配达到完全不平等,洛伦兹曲线成为折线OHL 。
另⼀⽅⾯,若任⼀⼈⼝百分⽐均等于其收⼊百分⽐,从⽽⼈⼝累计百分⽐等于收⼊累计百分⽐,则收⼊分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL 。
⼀般来说,⼀个国家的收⼊分配,既不是完全不平等,也不是完全平等,⽽是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL ,也不是45度线OL ,⽽是像图中这样向横轴突出的弧线OL ,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等⾯积”,当收⼊分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的⾯积A+B 叫做“完全不平等⾯积”。
不平等⾯积与完全不平等⾯积之⽐,成为基尼系数,是衡量⼀国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会⼤于1,也不会⼩于零。
⼆、计算原理⽹上有很多⽂章对基尼系数的计算⽅法有着深⼊的探讨,但都公式复杂吓⼈,涉及到积图1分、协⽅差等概念的运⽤,不易理解和操作,令⼈望⽽却步。
excel计算基尼系数法,简单实用

收入差距基尼系数的EXCEL算法一、理论背景为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家).洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了著名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收入由低到高分组)的累积百分比,纵轴OM表示收入的累积百分比,弧线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要意义。
一般来讲,它反映了收入分配的不平等程度。
弯曲程度越大,收入分配越不平等,反之亦然。
特别是,如果所有收入都集中在1人手中,而其余人口均一无所获时,收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百图1分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL,OHL与45度线之间的面积A+B叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
E X C E L计算基尼系数法
简单实用
The latest revision on November 22, 2020
收入差距基尼系数的EXCEL算法
一、理论背景
为了研究国民收入在国民之间的分配问题,美国统计学家(或说奥地利统计学家).洛伦兹(Max Otto Lorenz,1903- )1907年(或说1905年)提出的了着名的洛伦兹曲线。
它先将一国人口按收入由低到高排队,然后考虑收入最低的任意百分比人口所得到的收入百分比。
将这样的人口累计百分比和收入累计百分比的对应关系描绘在图形上,即得到洛伦兹曲线。
洛伦兹曲线用以比较和分析一个国家在不同时代或者不同国家在同一时代的财富不平等,该曲线作为一个总结收入和财富分配信息的便利的图形方法得到广泛应用。
图1中横轴OH表示人口(按收
入由低到高分组)的累积百分比,
纵轴OM表示收入的累积百分比,弧
线OL为洛伦兹曲线。
洛伦兹曲线的弯曲程度有重要
意义。
一般来讲,它反映了收入分
配的不平等程度。
弯曲程度越大,
收入分配越不平等,反之亦然。
特
别是,如果所有收入都集中在1人
图1
手中,而其余人口均一无所获时,
收入分配达到完全不平等,洛伦兹曲线成为折线OHL。
另一方面,若任一人口百分比均等于其收入百分比,从而人口累计百分比等于收入累计百分比,则收入分配是完全平等的,洛伦兹曲线成为通过原点的45度线OL。
一般来说,一个国家的收入分配,既不是完全不平等,也不是完全平等,而是介于两者之间。
相应的洛伦兹曲线,既不是折线OHL,也不是45度线OL,而是像图中这样向横轴突出的弧线OL,尽管突出的程度有所不同。
将洛伦兹曲线与45度线之间的部分A 叫做“不平等面积”,当收入分配达到完全不平等时,洛伦兹曲线成为折线OHL ,OHL 与45度线之间的面积A+B 叫做“完全不平等面积”。
不平等面积与完全不平等面积之比,成为基尼系数,是衡量一国贫富差距的标准。
基尼系数G=A/(A+B)。
显然,基尼系数不会大于1,也不会小于零。
二、计算原理
网上有很多文章对基尼系数的计算方法有着深入的探讨,但都公式复杂吓人,涉及到积分、协方差等概念的运用,不易理解和操作,令人望而却步。
本文提出的是样本区间微分面积离散累积法,完全通俗易懂,在EXCEL 中只利用四则运算就能得出非常精确的结果。
以图2为例:
——条件1:ODGF 围成一个长方
形,其中D 在OH 轴的40%位置(表示
累计人数占总人数的40%),F 在OM
轴的10%位置(表示累计收入占总收
入的10%),G 为洛伦兹曲线上的一个
点,代表着累计40%的人群的累计收
入占总收入的10%,G 的坐标为
(40%,10%)
——条件2:OPRK 围成一个长方
形,其中P 在OH 轴的60%位置(表示
累计人数占总人数的60%),K 在OM 轴的30%位置(表示累计收入占总收入的30%),R 为洛伦兹曲线上的一个点,代表着累计60%的人群的累计收入占总收入的30%,R 的坐标为(60%,30%)
——微分面积计算:根据上述条件,直角梯形DPGR 的面积S=(DG+PR )×DP ÷2,则具体面积为:(10%+30%)×(60%-40%)÷2=
——面积B 计算:将每个直角梯形的面积累加,即为面积B 的值
——面积A 计算:将直角三角形OHL 的面积(即1×1÷2=)减去面积B ——基尼系数计算:面积A ÷直角三角形OHL 的面积
三、测算步骤
D F K P
R
图2
1、将已知样本数据(工资收入数值)在EXCEL表中按照从小到大自动排序,形成第一列数据,字段名称“工资排序”
2、第二列数据字段名称设为“人数累计”,即从1开始逐个向下累加,每次累加1人
3、第三列数据字段名称设为“工资累计”,使用EXCEL公式表示:
本单元格数据=上单元格数据+同行的“工资排序”单元格数据
4、第四列数据字段名称设为“人数百分比”,用同行的“人数累计”单元格数据除以人员总数
5、第五列数据字段名称设为“工资百分比”,用同行的“工资累计”单元格数据除以工资总数
6、第六列数据字段名称设为“梯形面积”,按照前述的计算原理编辑公式即可
通过以上步骤,最后将“梯形面积”字段的数值累加,即为前文所述的B 面积,用直角三角形面积减去B面积即得A面积,则基尼系数可得。
四、小结
通过以上样本区间微分面积离散累积法所获取的基尼系数,应该说是与理论完全一致的;特别是在样本数量足够多的情况下,甚至可以用线段长度代替梯形面积进行计算(读者可自行证明)。
由于计算中没有涉及到任何四则运算之外的概念,且最大限度运用了EXCEL表间公式的功能,使问题的解决简单而高效,充分体现了“复杂问题简单化”的思想,值得借鉴。
另外,在上有一篇山西农业大学经贸学院张建华先生在2006年前发表的《推介一个简便易用的基尼系数计算公式》,理论分析更加透澈。
本文与该文章的思路方法完全一致,看来“英雄所见略同”,特向张建华先生表示敬意。
董凌云
2009年5月12日
附1:基尼系数计算的EXCEL模板
附2:基尼系数的经济含义
基尼系数指在全部居民收入中,用于进行不平均分配的那部分收入占总收入的百分比。
基尼系数最大为“1”,最小等于“0”。
前者表示居民之间的收入分配绝对不平均,即100%的收入被一个单位的人全部占有了;而后者则表示居民之间的收入分配绝对平均,即人与人之间收入完全平等,没有任何差异。
但这两种情况只是在理论上的绝对化形式,在实际生活中一般不会出现。
因此,基尼系数的实际数值只能介于0~1之间。
经济学家们通常用基尼指数来表现一个国家和地区的财富分配状况。
这个指数在零和一之间,数值越低,表明财富在社会成员之间的分配越均匀;反之亦然。
按照联合国有关组织规定,基尼系数:
——低于:表示收入绝对平均;
———:表示比较平均;
———:表示相对合理;
———:表示收入差距较大;
——以上:表示收入差距悬殊。
通常把作为收入分配差距的“警戒线”。
一般发达国家的基尼指数在到之间,美国偏高,为。
中国大陆和香港的基尼系数都超出。
据最新资料,2007年中国国的基尼系数已经达到以上。