泰尔指数公式及计算方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.泰尔指数
泰尔指数(Theil index )或者泰尔熵标准(Theil’s entropy measure)泰
是由泰尔(Theil,1967)利用信息理论中的熵概念来计算收入不平等而得名。
熵在信息论中被称为平均信息量。在信息理论中,假定某事件E 将以某概
率p 发生,而后收到一条确定消息证实该事件E 的发生,则此消息所包含的信息量用公式可以表示为:
1
h()ln()
p p
=设某完备事件组由各自发生概率依次为由个事件
12(,,,)n p p p n 构成,则有
12(,,,)n E E E ,
1
1n
i
i p
==∑熵或者期望信息量等于各事件的信息量与其相应概率乘积的总和:
(6-4)
111
1
()()log(log()n n
n
i i i i i i i i i H x p h p p p p p ======-∑∑∑将信息理论中的熵指数概念用于收入差距的测度时,可将收入差距的测度
解释为将人口份额转化为收入份额(类似于洛伦兹曲线中将人口累计百分比信
息转化为收入累计百分比)的消息所包含的信息量。而泰尔指数只是熵指数中的一个应用最广泛的特例。泰尔指数的表达式为:
(6-5)
11log(n i
i i y y T n y y
==∑式中为收入差距程度的测度泰尔指数,
T 与分别代表第个体的收入和所有个体的平均收入。
i y y i 2.泰尔指数分解法
泰尔指数作为收入不平等程度的测度指标具备良好的可分解性质,即将样
本分为多个群组时,泰尔指数可以分别衡量组内差距与组间差距对总差距的贡献。假设包含个个体的样本被分为K 个群组,每组分别为
n ,第组中的个体数目为,则有,与
(1,2,,)k g k K = k k g k n 1
K
k k n n ==∑i y 分别表示某个体的收入份额与某群组的收入总份额,记与分别为
k y i k b T w T 群组间差距和群组内差距,则可将泰尔指数分解如下:
(6-6)1
1
log
(log )1k
K
K
k
i i k
b w k k k k i g k k k
y y y y T T T y y n n
y n ==∈=+=+∑∑∑
在上式中群组间差距与群组内差距分别有如下表达式:
b T w T
(6-7)1
log
K
k
b k k k y T y n n
==∑
(6-8)
1(log 1k K
i i k
w k k i g k
k y y y T y y n =∈=∑∑另外,值得注意的是群组内差距项分别由各群组的组内差距之和构成,各
群组的组内差距的计算公式与样本总体的计算公式并无二致,只是将样本容量
控制在第组的个体数目。
k k n