疾病空间聚集性研究方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
∀ ∀I
K h = L h = K h
i j
h
d ij /N =
N /A - h
A 2 N ∀ i
∀I
j
h
d ij ,
式中 , A 为研究区域的面积 , N 为总病例数, Ih 为指示 函数 , 如果 d ij < h, 则 Ih = 1 , 否则 Ih = 0 。 期望值为
h ttp : //w w w . jb jc. o rg DO : I 10. 378 4 /.j is s n. 1 00 3- 99 61. 2 010. 05. 017
[ 13]
i
k , 0# mi k # k
将统计的 T k 值和通过 M CM C 模拟的完全随机 分布模式下的 T k 值相比较 , T k 越大, 空间聚集性越 强 。 k 值由研究者确定, 大小选择是很重要的。 2 1 5 全 局 空 间 自 相 关 分 析 法 ( g lo bal spa tial auto co rre la tio n) 用 于分 析区 域数 据 的统 计 指标 (如发病率、 患病率、 死亡率等 ) 的空间自相关性 , 如 空间自相关性强 , 表示高值 周围聚集着高 值, 低值 周围聚 集着 低 值。 主要 有 全 局 M oran ! s I 、 全局 G eary ! s C、 全局 G e tis! s G ( d) 三种方法 , 其中全局 M oran! s是应用较广的用来衡量空间自相关性的指 标 , 全局 G e tis O rd G 能够区分不同类型的局部聚集 模式 (热点区和冷点区 ) 。 2 1 6 T ango 最 大 超 额 事 件检 验 法 ( m ax i m ized ex cess events tes, t M EET ) 超额事件检验 ( excess ev ents te s,t EET ) 法是计算超额事件的加权和, 对位 置较近的区域给予高的权重 , 较远的区域给予低的 权重, 计算公式为 : EET 式 中, w ij d ij, w ij d ij, = e =
[ 3] [ 2]
( 1)全局空间聚集性研究方法 , 研究疾病 在整个空 间区域有无聚集性及其聚集程度如何 ; ( 2) 局部空 间聚集性研究方法 , 研究聚集性发生在空间哪些位 置; ( 3) 焦点空间聚集性研究方法, 研究某一固定位 置是否发生了疾病聚集 , 例如核电站、 垃圾处 理场 等场所周围是否发生了某些疾病的聚集 2 1 全局空间聚集性研究方法 2 1 1 样方分析 法 ( quadra t ana ly sis)
文献标识码: A 文章编号 : 1003 - 9961( 2010) 05- 0394- 04
研究方法和焦点聚集性 研究方法 , 本文对其进行综述。
中图分类号 : R 181 3+ 4
App roaches to study d isease cluster ing in space LU Bu la i* , W ANG Jin feng, ZENG G uang. * Chinese C en ter fo r D isea se Co ntro l and P reven tion, Chinese F ield Ep ide m io lo gy T ra ining P ro g ram, Beijing 100050, Ch ina Correspond ing au thor: ZENG G uang, Em ai:l Z eng 4605 @ v ip. sina . com Abstrac t : T he study o f d isease c lustering in space is an i m po rtant com ponent o f spatial epidem io lo gy. T he study m e thods inc lude g loba l d isease c lustering study , lo cal d isease c lustering study and fo cused disea se c luste ring study, w h ich are rev iew ed in th is article . K ey word s : spatial epidem io lo gy ; disease cluster ing; spa tia l ana ly sis
394
疾病监测 2010年 5月 30日第 25卷第 5 期 D isease Su rve illan ce , M ay 30, 2010 , V ol 25, N o 5
综
述
疾病空间聚集性研究方法
陆步来 , 王劲峰 , 曾光
摘要 : 关键词 :
1 2 1
疾病空间聚集性研究是空间流行病学的一项重要内容 , 其研究方法分为全局聚 集性研究方 法、 局 部聚集性 空间流行病学 ; 疾病聚 集性 ; 空间分析
[ 4, 5]
。
。为更好地 理解和掌握
疾病的空间聚集性研究方法及其核心思想 , 本文对
该法是 基
于空间密度的 方法 , 用规 则网 格覆盖 整个 研究 区 域, 计算每个网格中 的病例数, 然后将病例的 空间 分布与完全随机分布 (一般用 Po isson 分布 ) 相比较 来判断是否存在疾病的空间聚集
[ 18] [ 17]
, ci 为区域 i的病例数 , ni 为区域 i
的期望病例数。 是疾病空间聚集尺度的测量, 需要 人为设定。 大的 值对大尺度的空间聚集性比较敏 感 , 小的 值对小尺度的空间聚集性比较敏感。 为克 服人为选择 的影响, T ango 又提出了最大超额事 件检验 , 计算公式为: MEET (DE ) = 0m in P [ EET (DE, # # U 式中, eet DE, ) > eet(DE, ) | H 0, ] 为 EET DE, 在 条件下的观察
疾病监测 2010 年 5月 30 日第 25卷第 5期 D isease Surveillance, M ay 30 , 2010, V ol 25 , No 5
395
h , 当疾病在空间呈聚集状态时, K h >
2
h。 为
2
方法是建立圆形活动窗口, 圆心 处 于不 断 变 化中 , 对于某个具体的位置, 圆的半径从零逐渐增大到某 个上限值 ( 一般让圆内的人口数不超过 50% 的总人 口数 ) 。根据数据类型选 择二项分布或 Po isson 分 布模型, 计算每次变动后窗口内和窗口外的统计指 标 (如发病率等 ) 的差异, 采用 M CM C 方 法检验似 然比。似然比最大的圆是最有 可能存在聚集 的位 置
, 该类数据容易获得。
2 空间聚集性研究方法 疾病的空间 聚集 性研 究方 法可 分为 三大 类 :
作者单位 : 1. 中国疾病预防控制中心中国现场流行病学培训项目 , 北 京 100050 ; 2. 中国科学院地理科学与资源研究所 作者简介 : 陆步来 , 男 , 流行病与卫生统计学博士生 , 主要从事云南不 明原因猝死和空间流行病学研究工作 通信作者 : 曾光 , Em ai: l Zeng4605@ vip . s ina. com 收稿日期 : 2009 - 11- 15
n1 i
。该方法使用较普遍 , 有免费的软件 SaT Scan
[ 12]
实现其功能
。
∀m
2 2 2 B esag N ew e ll法 主要用于罕见病的研究 , 首先定义一个固定的病例数 k, 然后以发 生病例的 每个区域为中心, 按距离的远近收集邻近区域的病 例, 计算累积病例数不少于 k 所需的区域数。所需 区域数越少的位置 , 越有可能存在聚集的位置 2 2 3
疾病空间聚集性是指某些区域疾 病发生的危 险性显著高于其 他区域, 形 成的原因多种 多样, 如 [ 1] 传染性致病因子的存在、 潜在危险因素 的存在 。 随着中国传染病网络直报系统的建立和完善、 地理 信息系统和空间统计学的发展, 使用空间聚集性方 法来探测当地是否存在疾病的暴发以 及在何地发 生暴发的研究越来越多 其进行简短综述。 1 空间数据类型 疾病的空间数据类型主要分为 两种: ( 1) 点数 据 : 是 指 病 例 在 空 间 上 的 确 切 位 置, 如 用 GPS ( g loba l po sitioning sy stem ) 测得的每个病例的居住 位置、 工作场所等, 相对而言该类数据难获取 ; ( 2) 区域数据: 又称计数数据 , 指某一区域 上疾病病例 事件 (点数据 )的集合 , 如根据行政区划统计的病例 数
[ 10]
、 Duczm al A ssun o 的模拟退火 。
、 T ango T akahashi的 可变 形状空 间扫 描统 计
[ 19 ]
量 (软件 F lex Scan) 2 2 5
局 部 空 间 自 相 关 分 析 法 ( local spatia l
autoco rre lation) 和全 局空间自 相关相对 应, 局 部 空间自相关方法有局部 M oran! s Ii、局部 G eary ! s C i、 局部 G etis ! s G i d 三种方法。 2 3 焦点空间聚集性研究方法 2 3 1 S tone 检验法 将区域按重心离污染点源的 距离进行排序 , 无效假设为相对危险度在整个区域
[ 14, 15]
。
任意 形 状 空 间 扫 描 统 计 量 法 ( arb itrarily 以上介绍的三种局部
∀ ∀w
i j
ij
d ij,
ห้องสมุดไป่ตู้
ci - n i
cj - nj
为 权 重 函 数,
2 - 4d2 ij /
一 种 形 式是
空间聚集性研究方法均假设聚集形状是圆形的 ( 或 [ 16] 椭圆形 ) , 实际情况并非完全如此, 如疾病呈线形 聚集在高压线、 河流、 道路等周围。近几年来 用于 尝试任意形状聚集性 的研究方法有 Pat il T a illie 的 U L S 扫描统计量 法
[ 6]
。
2 1 2 最近邻分析法 ( nearest neighbo r ana ly sis) 基于空间距离的方法, 将离得最近的病例点对的平 均距离与随机分布模式下的最邻近距离进行比较 , [ 7] 用其比值 ( NN I)来判断疾病的空间聚集性 。 2 1 3 R ipley ! sK 函数法 以每个病例所在的点 为圆心, 某个距离为 半径画圆, 统计圆内平均 病例 数, 再除 以全 部研 究区域 内的 疾病 密度。计算 公 式为 :
[ 11]
方便比较, 构 造 L h 统 计量, 如 L h 为 较高的正 [ 8] 值 , 表示疾病在相应的空间步长 h 上呈聚集趋势 。 2 1 4 C uzick Edw ards法 为克服样方、 最近邻、
R ip le y ! s K 等法需 要假定人口空间分布均衡的限 制 , 再从非该病的同一人群中选择一组对照, 用 n1 表示病例数, n2 表示对照数, 则在空间共有 n 1 + n2 个点。 对于每一个病例 , 统计离此病例最近的 k 个点 中病例的数量, 用 m i k 表示。 Tk =
[ 3, 4, 7] [ 9]
。
聚 集 评 价 排 列 组 合 法 ( cluster eva luation
perm utat io n procedure , CEPP) 主要思想是为每个 区域创建一个圆形窗口, 窗口内的人口数为预先固 定的常数 R, 根据病例数的不同来判断疾病可能的 聚集位置。 假如 i区域的人口数为 p i , 病例数为 O i, 如果 p i < R, 则重心离 i区域的重心最近的区域 (用 j 表示 ) 包括进来, 如果 O i + O j # R, 则完全包括, 如 果 O i + O j > R, 则只包括一部分 O j 的人口数, 包括 的病例数根据人口数的比例来计算。 对于 O i + O j < R 的情况, 继续吸收重心离 i 区域的重心次近的区 域, 如此反复, 直到人口数达到 R 为止。 最终结果是 每个区域的圆形窗口内的人口数为 R, 病例数不同 , 用 C iR 表 示。 CEPP 的统计 量是最 大 C iR 值, 根 据 M CM C 模拟方法来评价它的显著性 2 2 4 shaped spa tial scan sta tistic)