泰尔指数不同计算公式的比较
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
量可为地域变量 ( 如 不 同 国பைடு நூலகம்家、 不 同 省 市、 城 市 或 农
村) 、性别、民族、教育程度、不同收入组等ꎮ 当把数据
组的比重相同ꎮ
1 泰尔指数的定义
在分组数据中ꎬ广义不公平指标的定义 [4] 为:
不平等指标族基于“ 熵” 的概念ꎮ 在热力学中ꎬ熵
是混乱或无序的测量ꎬ当应用到收入分布中ꎬ熵意味着
∑
Q
i =1
(6)
i
文献[5 - 10] 用泰尔 L 指数分析了卫生资源相关
的公平性ꎮ
当 α = 1 时ꎬE′(1) 称为泰尔指数ꎬ也称为泰尔 T
指数:
(3)
当收入 y i 为 0 时无定义ꎮ 此时一种方法是把 0 收
入用任意小的数值代替ꎬ此时 E(1) 的极大值近似于
ln( n) ꎮ
由于泰尔指数的取值并不在 0 ~ 1 范围内ꎬ不利于
的分解ꎬ分析不公平是来自于地州( 组间) ꎬ还是来自
于县( 市) ( 组内) ꎮ 泰尔指数的分解:
Q
= ∑ Q i ln i + ∑ Q i TI i
Pi
i =1
i =1
k
TI 总 = TI 组间 + TI 组内
k
(8)
其中 P i 为第 i 个地州人口占全省人口的比重ꎬQ i
为第 i 个地州的卫生服务利用指标占全省总卫生服务
不同组收入(也可是健康或卫生服务利用) 所占比重ꎮ
1
(1)
∑ ( yyi ) α - 1
n( α2 - α) i
其中 y i 为第 i 个个体的收入ꎮ y为平均收入ꎮ
E(0) = -
yi
yi
E(1)
1
=
(
) ln(
)
∑
maxE(1)
n( lnn) i
y
y
分组后ꎬ公平性意味着各组人口比重和分析变量在各
∑
n i
y
文献[2 - 3] 用此指数分析居民收入差距ꎮ
当 α = 1 时ꎬE(1) 称为泰尔指数:
yi
yi
1
TI = E(1) = ∑ (
) ln(
)
n i
y
y
E′( α) =
1
Qi α
∑
(
) -1
( α2 - α) i =1
Pi
k
[
]
(5)
式中 P i 为不同组中人口数占总人口数的比重ꎻQi 为
人口的比重ꎮ 则上式为:
k
q
TI 个体 =∑ Q 县l TI l个体
l =1
q
=∑ (
l =1
q
=∑ (
l =1
n 县l y
县l
)(
) TI
n
y
l
个体
县l
n 县l y
y 县lt
y 县lt
1
县l
)(
)∑(
)(
) ln(
)
n
y t =1 n 县l y 县l
y 县l
n
n
q
县l
y 县lt
方 法
E( α) =
RE(1) =
△
(2)
E′(α)测量了组间收入比重和人口比重的符合程度ꎮ
α 取 值 不 同ꎬ 得 到 的 指 标 也 不 同ꎮ 当 α = 0 时ꎬ
E′(0) 称为泰尔第二测度( Theil’ s second measure) ꎬ也
称为泰尔 L 指数:
E′(0) =
P
k
P i ln i
对泰尔 T 指数和泰尔 L 指数进行了比较ꎮ
相对泰尔指数的取值范围在 0 ~ 1 之间ꎮ
(4)
公式(3) 和(4) 是基于个体水平来计算指数的ꎬ如
果所有个体都有相同的收入ꎬ即绝对公平时ꎬ个体水平
和均值相同ꎬ此时泰尔指数为 0ꎮ
(2) 分组数据泰尔指数的定义
实际应用中很多时候得到的是分组数据ꎮ 分组变
△通信作者:何利平ꎬE ̄mail:lipinghe2@ 126 com
类似ꎮ
(1) 分组数据泰尔指数的分解
如果要研究全省卫生服务利用的公平性ꎬ调查了
125
Chinese Journal of Health StatisticsꎬFeb. 2020ꎬVol. 37ꎬNo. 1
全省 k 个地州共 N 个县( 市) 的数据ꎬ可通过泰尔指数
利用指标的比重ꎮ 再把每一个地州按县分组ꎬ每一个
地州用(7) 式计算得到的泰尔指数即为 TI i ꎬ用 Q i 作为
权重ꎬ计算 TI i 的加权和即为 TI 组内 ꎮ
如果记 Q 县 ij 为第 i 个地州的第 j 个县( 市) 卫生服
务利用指标占第 i 个地州卫生服务利用指标的比重ꎻ
P 县 ij 为第 i 个地州的第 j 个县( 市) 人口占第 i 个地州
1
=
y 县lt ln(
)
∑
∑
ny l =1 t =1
y 县l
(14)
其中 TI l个体 为第 l 个县的个体间的泰尔指数ꎻq 为
全省的县的个数ꎻQ 县 l 为第 l 个县( 市) 卫生服务利用
指标占全省卫生服务利用指标的比重ꎻn 县 l 为第 l 个县
124
中国卫生统计 2020 年 2 月第 37 卷第 1 期
泰尔指数不同计算公式的比较 ∗
昆明医科大学公共卫生学院(650500) 喻 箴 李晓梅 母凤婷 孟 琼 吴 騻 何利平
泰尔指数( Theil index) 来源于物理学ꎬ又称泰尔
熵标准ꎬ是由经济学家 Theil 利用信息理论中熵的概
念于 1976 年提出的评价公平性的指标ꎮ 泰尔指数最
初用于评价收入公平性ꎬ近年来在卫生服务公平性研
究中应用也较广泛ꎮ 不论是收入公平性评价还是卫生
服务利用公平性评价ꎬ不同文献中泰尔指数的计算公
式不同ꎬ甚至有的文献没有给出计算公式ꎮ 不同的计
算公式让人混淆ꎬ且得到的指标可比性差ꎮ 本文给出
了泰尔指数的定义ꎬ对不同的计算公式进行了介绍ꎬ并
异的数值度量ꎬ泰尔 T 指数和泰尔 L 指数均可被分解
值的比值:
为对总的不公平测量的组间贡献和组内贡献ꎮ 下面以
泰尔 T 指 数 分 解 为 例 介 绍ꎬ 泰 尔 L 指 数 分 解 与 之
∗ 基金项目:国家自然科学基金(81160364) ꎻ耶鲁大学合作课题( 云南
省女性健康公平性和卫生服务利用公平性研究)
TI = E′(1) =
k
Q
Q i ln i
∑
P
i =1
i
(7)
文献[11 - 13] 用泰尔 T 指数进行公平性评价ꎮ
如果要了解不公平主要是来自于组间还是组内ꎬ
可对泰尔指数进行分解ꎮ
2 泰尔指数的分解
作为卫生服务利用分布结构和人口分布结构的差
比较ꎮ 相对泰尔指数( RE) 定义为泰尔指数与其最大
和完全公平的偏离ꎮ
(1) 未分组数据泰尔指数的定义
广义不公平指标的定义为
[1]
:
[
]
α 取 值 不 同ꎬ 得 到 的 指 标 也 不 同ꎮ 当 α = 0 时ꎬ
E(0) 称为泰尔零阶指数ꎬ 也称为对数偏差均值指数
( mean logarithmic deviationꎬMLD) :
yi
1
ln(
)