泰尔指数公式及计算方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.泰尔指数
泰尔指数(Theil index )或者泰尔熵标准(Theil ’s entropy measure)泰是由泰尔(Theil,1967)利用信息理论中的熵概念来计算收入不平等而得名。
熵在信息论中被称为平均信息量。在信息理论中,假定某事件E 将以某概率p 发生,而后收到一条确定消息证实该事件E 的发生,则此消息所包含的信息量用公式可以表示为:
1h()ln()p p
= 设某完备事件组由各自发生概率依次为12(,,,)n p p p 由n 个事件12(,,,)n E E E 构成,则有
11n i i p
==∑,
熵或者期望信息量等于各事件的信息量与其相应概率乘积的总和:
1111()()log()log()n n
n i i i i i i i i i H x p h p p p p p ======-∑∑∑(6-4) 将信息理论中的熵指数概念用于收入差距的测度时,可将收入差距的测度解释为将人口份额转化为收入份额(类似于洛伦兹曲线中将人口累计百分比信息转化为收入累计百分比)的消息所包含的信息量。而泰尔指数只是熵指数中的一个应用最广泛的特例。泰尔指数的表达式为:
11log()n i i i y y T n y y
==∑ (6-5) 式中T 为收入差距程度的测度泰尔指数,
i y 与y 分别代表第i 个体的收入和所有个体的平均收入。
2.泰尔指数分解法
泰尔指数作为收入不平等程度的测度指标具备良好的可分解性质,即将样本
分为多个群组时,泰尔指数可以分别衡量组内差距与组间差距对总差距的贡献。假设包含n 个个体的样本被分为K 个群组,每组分别为(1,2,,)k g k
K =,第
k 组k g 中的个体数目为k n ,则有1
K k k n n ==∑,i y 与k y 分别表示某个体i 的收
入份额与某群组k 的收入总份额,记b T 与w T 分别为群组间差距和群组内差距,则可将泰尔指数分解如下:
1
1log (log )1k K K
k i i k b w k k k k i g k k k y y y y T T T y y n n y n ==∈=+=+∑∑∑ (6-6)
在上式中群组间差距b T 与群组内差距w T 分别有如下表达式: 1log
K k b k k k y T y n n
==∑ (6-7)
1(log )1k K i i k w k k i g k k y y y T y y n =∈=∑∑ (6-8) 另外,值得注意的是群组内差距项分别由各群组的组内差距之和构成,各群组的组内差距的计算公式与样本总体的计算公式并无二致,只是将样本容量控制在第k 组的个体数目k n 。