传染病疫情的预警方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• Hulth A, Andersson Y, Hedlund KO, Andersson M. Eye-opening approach to norovirus surveillance. Emerging Infectious Diseases, 2010;16(8):1319-21.
• Hutwagner L, Browne T, Seeman GM, Fleischauer AT. Comparing aberration detection methods with simulated data. Emerging Infectious Diseases, 2005;11(2):314-6.
yt k
在移动平均的计算中使用了n个观测值
21
指数加权移动平均控制图 (EWMA)
• EWMA给予早期数据更小的比重 • 对于观测值 y1, y2,…, EWMA的统计量是
st 1 st1 yt
• 0<λ<1是比重参数,s0=0
– λ增大,越早期数据的影响越小 – 通常λ设置为0.1-0.5
• 在一些监控设置中,每年的情况或会有所 变化,因为我们更偏向于用近期数据来设 定过程均值和标准差
• 随着预期监测的持续,过程均值和标准差 可以持续地更新
27
移动基线控制图 - 1
• 比较当前值(紫色)和参考限值
28
移动基线控制图 - 2
• 更新参考限值并和当前值(蓝色)比较
29
移动基线控制图 - 3
11
演示流感数据迂回法 - 1
• 使用历史数据来估计一年中不同时间的预 期值以及参考限值(点线)
12
演示流感数据迂回法 - 2
• 在高峰期前,监测数据应该在参考限值以 内
13
演示流感数据迂回法 - 3
• 但当(冬季)流感高峰期来临,监测数据 会迅速超过参考限值
14
迂回法例子 – Hulth et al., EID, 2010
• 也有其它版本的规则 • 有时我们偏好只用第一个规则,同时设定
一个不太严格的临界值
20
移动平均控制图
• 在基本控制图中,我们寻找一系列观测值中的 异值或异常的形态
• 另一种方法是研究连续的近期观测值的形态 • 对于观测值 y1, y2,…, 移动平均控制图的统计量
是
mt
1 n
n1 k 0
– 只对探测到爆发有效?
8
第二部分 探测异常的统计方法
9
• 迂回法 • 控制图 • CUSUM • 移动基线法 • 时间序列法 • 参考文献
10
迂回法
• 在迂回法中,我们对历史数据拟合一条正 玄曲线包括参考(比如95%)限值
• 通常拟合过程中会剔除过去的爆发(疫情) 数据
• 如果当前值超过上限就产生异常 • 使用示例:警示进入流感高峰期
传染病疫情的预警方法
1
概览
• 讨论为何需要探测流感爆发 • 描述和讨论生成警示的不同方法
探测未来的流感爆发
• 公共卫生监测是持续而系统性地收集、分 析和解释健康数据,这对公共卫生政策的 计划、实施和评估非常重要,并且同时可 以将这些数据及时地发布给有需要的人群 (Thacker S. 1994)。
37
回顾第二部分
• 当季节性比较明了时,可以使用迂回法 • 在很多情况下,控制图可以提供满意的结
果 • 在某些情况下,CUSUM和EWMA可以表现得
更好 • 通常时间序列法可能表现得最好,
– 但是需要许多资源的投入和维护
38
第三部分 态势感知
39
态势感知的目标
• “在需要提示信息的情况下监测疾病的趋 势或者其它社区卫生的标记”(Buehler et al., 2008)
• 参数k用来忽略某些轻微偏差
– 最简化的情况下k设置为0 – 典型的选择是k=0.5,也就是忽略任何距离均值
小于标准差一半的偏差
24
演示上CUSUM - 1
• 标准化观测值的累积和(但不小于0)
25
演示上CUSUM - 2
• 收集下一个数值后(蓝色),将其加入 CUSUM
26
移动基线
• 在基本控制图中,我们预先设定了过程均 值和标准差(可能来自历史数据)
• 或者我们可以大幅提高临界值以致永远探 测不到异常,那么特异性=1但是敏感性=0
6
定义的局限性
• 前面我们将敏感性定义为在每个爆发周监 测到异常的概率
• 但是对一次爆发只警示一次足够吗?或者 我们需要每周都警示吗?
• 对于任何爆发,难道一个只在第一周就警 示的系统不比一个只在最后一周才警示的 系统更好?
15
控制图
• 在最基本的控制图中( 休哈特图),我们 将当前值和一些已知的基准线和参考限值 比较
– 控制限值可以基于历史或近期数据
• 然后我们可以根据预先设定的异常定义, 继续随着时间推移监测数据
• 异常的基本定义是一个超过上限的单一值 • (一个异常之后我们重设控制图)
16
演示控制图 - 1
• 比较当前值(紫色)和参考限值
行热线、柜台药品销售、旷工/旷课情况)
41
监测数据的互动传播
Cheng et al. 2011
42
由多重渠道整合信息
• 使用多变量模型 拟合多重流感监 测数据,红色柱 体表明高/增加活 跃度
• 目前从62所参与 学校收集学生缺 课数据
• 指定流感诊所的 就诊情况只在流 感大流行期间发 布数据
(Lau et al. 2012)
44
参考文献(2)
• Kleinman KP, Abrams AM. Assessing surveillance using sensitivity, specicity and timeliness. Statistical Methods in Medical Research, 2006;15(5):445-64.
– 我们应当包含对时间性的衡量(Kleinman et al., 2006)
7
另一种定义 (Hutwagner et al., 2005)
• 敏感性 = 所有爆发中至少发出一次警示的几 率
• 特异性 = 所有非爆发中不发出任何警示的几 率(定义不变)
• 时间性 = 从爆发开始到发出警示的平均时间 (比如:周数)
• 在近期基准值和当前值之间预留缓冲区
– 否则正在进行的爆发可能会影响临界值
• 对于小的数值使用泊松分布代替正态分布 • 同时监控多方位的信息
32
时间序列法
• 前面描述的控制图法没有明确考虑到两个 重要因素:
– 数据的序列相关性(假设随后的数据是独立的) – 季节性影响(尽管使用历史数据可以帮助一些)
• Cheng CK, Ip DK, Cowling BJ, Ho LM, Leung GM, Lau EH. Digital dashboard design using multiple data streams for disease surveillance with inuenza surveillance as an example. Journal of Medical Internet Research, 2011;13(4):e85.
• Lau EH, Cheng CK, Ip DK, Cowling BJ. Situational awareness of inuenza activity based on multiple streams of surveillance data using multivariate dynamic linear model. PLOSONE, 2012;7(2):e38346.
• 这次当前值(红色)产生了异常
30
比较CUSUM和基本控制图
• 基本控制图可以快速探测到大量超出基线 的情况
– 有效探测大型的以及/或者密集的疾病爆发
• CUSUMs可以更好地探测比较小型的疾病增 长
– 有效探测小型的以及/或者缓慢长期的疾病爆发 – …一系列的微小正增长可以迅速增加
31
控制图的更多延伸
– 不要停止产生疫情警报 – 在流感季节开始后的情形如何? – 跟进当前和预测未来的趋势 – 进行干预措施的实时评估
40
态势感知的内容
• 传播性和严重性的评估
– 决定各种控制措施必要性和时间 – 开始计划疫苗推广
• 信息来源
– 例行监测系统(比如定点流感症状监测) – 新的监测系统(比如在线查询、英国流感大流
• 尽早探测到爆发可以帮助疾病的预防和控 制。
3
异常
• 假设我们知道在某个特定时间/地点的预期 病例数目
• 异常被定义为实际病例数“显著”超出了 预期标准
• 并非所有的异常都是由真正的爆发导致
– (需要进一步的调查研究)
• 并非所有的爆发都会导致异常
– 受试者工作特征(ROC)曲线下的面积作为总 评方式
22
累积和控制图
• 此方法计算连续观测值的总和(CUSUM)并将 CUSUM和一个固定的临界值比较
• 必须源自文库标准化所有观测值(减去参考均值 然后除以参考标准差)
23
累积和控制图
• 在时间t的上CUSUM公式是
Ct
max
0,
Ct
1
yt
k
• y值t是和在标时准间差t的观测值,μ和σ分别是过程均
36
不同国家的方法描述
国家 美国
西班牙 希腊
方法 控制图 控制图
CUSUM
CUSUM CUSUM,(迂回法)
参考文献
Xing et al. 2011
Burkom et al. 2004 Bellazzini et al. 2011 Schrell et al. 2013
Spanos et al. 2012
• 专门的时间序列模型可以考虑这些因素
33
时间序列法
• 专门的的时间序列法用来分析时间序列数 据
– Box-Jenkins的ARIMA模型 – 状态空间模型
• 这些先进的方法可以考虑历史季节性、过 去的爆发、以及近期的水平波动
• 当超出参考限值时产生异常 • 或者在时间序列估值后使用控制图
34
动态线性模型
•
基于观测值 量 θ1, θ2,…
y1,
y2,…的模型中假设一系列的隐变
• 可以估算θ1, θ2,…
• 这种指定隐变量的方法可以假设观测值是独立
的
35
时间序列法的缺陷
• 时间序列法是最复杂的途径,应当优于简 单的方法
• 但是这种方法需要最多的资源,需要专家 初期和持续的投入
• 对于很多症状的基本监测,控制图或者历 史局限值已经足够
4
敏感性和特异性
异常 非异常
爆发 a c
非爆发 b d
敏感性 = a/(a+c) = 真正类率 特异性 = d/(b+d) = 真负类率
5
敏感性和特异性
• 很明显,我们需要高敏感性和高特异性
– 但是其中一个增高会导致另一个减低
• 例如,我们可以通过降低异常的临界值来 增加敏感性(这样可以探测到更小型的爆 发),但这也会导致更多的误报
• Burkom HS, Elbert Y, Feldman A, Lin J. Role of data aggregation in biosurveillance detection strategies with applications from ESSENCE. Morbidity and Mortality Weekly Report, 2004;53:S67-71.
43
参考文献
• Bellazzini MA, Minor KD. ED syndromic surveillance for novel H1N1 spring 2009. American Journal of Emergency Medicine, 2011;29(1):70-4.
• Buehler JW, Sonricker A, Paladini M, Soper P, Mostashari F. Syndromic Surveillance Practice in the United States: Findings from a Survey of State, Territorial, and Selected Local Health Departments Advances in Disease Surveillance, 2008;6(3).
17
演示控制图 - 2
• 下个星期,比较新的值(蓝色)和参 考限值
18
演示控制图 - 3
• 这次当前值(红色)产生了异常
19
控制图中的异常
• 通常来说,控制图中的异常发生于:
– 当前值超过上限的3σ – 三个连续值中的两个超过上限2σ – 五个连续值中的四个超过上限1σ – 八个连续值超过均值
• Hutwagner L, Browne T, Seeman GM, Fleischauer AT. Comparing aberration detection methods with simulated data. Emerging Infectious Diseases, 2005;11(2):314-6.
yt k
在移动平均的计算中使用了n个观测值
21
指数加权移动平均控制图 (EWMA)
• EWMA给予早期数据更小的比重 • 对于观测值 y1, y2,…, EWMA的统计量是
st 1 st1 yt
• 0<λ<1是比重参数,s0=0
– λ增大,越早期数据的影响越小 – 通常λ设置为0.1-0.5
• 在一些监控设置中,每年的情况或会有所 变化,因为我们更偏向于用近期数据来设 定过程均值和标准差
• 随着预期监测的持续,过程均值和标准差 可以持续地更新
27
移动基线控制图 - 1
• 比较当前值(紫色)和参考限值
28
移动基线控制图 - 2
• 更新参考限值并和当前值(蓝色)比较
29
移动基线控制图 - 3
11
演示流感数据迂回法 - 1
• 使用历史数据来估计一年中不同时间的预 期值以及参考限值(点线)
12
演示流感数据迂回法 - 2
• 在高峰期前,监测数据应该在参考限值以 内
13
演示流感数据迂回法 - 3
• 但当(冬季)流感高峰期来临,监测数据 会迅速超过参考限值
14
迂回法例子 – Hulth et al., EID, 2010
• 也有其它版本的规则 • 有时我们偏好只用第一个规则,同时设定
一个不太严格的临界值
20
移动平均控制图
• 在基本控制图中,我们寻找一系列观测值中的 异值或异常的形态
• 另一种方法是研究连续的近期观测值的形态 • 对于观测值 y1, y2,…, 移动平均控制图的统计量
是
mt
1 n
n1 k 0
– 只对探测到爆发有效?
8
第二部分 探测异常的统计方法
9
• 迂回法 • 控制图 • CUSUM • 移动基线法 • 时间序列法 • 参考文献
10
迂回法
• 在迂回法中,我们对历史数据拟合一条正 玄曲线包括参考(比如95%)限值
• 通常拟合过程中会剔除过去的爆发(疫情) 数据
• 如果当前值超过上限就产生异常 • 使用示例:警示进入流感高峰期
传染病疫情的预警方法
1
概览
• 讨论为何需要探测流感爆发 • 描述和讨论生成警示的不同方法
探测未来的流感爆发
• 公共卫生监测是持续而系统性地收集、分 析和解释健康数据,这对公共卫生政策的 计划、实施和评估非常重要,并且同时可 以将这些数据及时地发布给有需要的人群 (Thacker S. 1994)。
37
回顾第二部分
• 当季节性比较明了时,可以使用迂回法 • 在很多情况下,控制图可以提供满意的结
果 • 在某些情况下,CUSUM和EWMA可以表现得
更好 • 通常时间序列法可能表现得最好,
– 但是需要许多资源的投入和维护
38
第三部分 态势感知
39
态势感知的目标
• “在需要提示信息的情况下监测疾病的趋 势或者其它社区卫生的标记”(Buehler et al., 2008)
• 参数k用来忽略某些轻微偏差
– 最简化的情况下k设置为0 – 典型的选择是k=0.5,也就是忽略任何距离均值
小于标准差一半的偏差
24
演示上CUSUM - 1
• 标准化观测值的累积和(但不小于0)
25
演示上CUSUM - 2
• 收集下一个数值后(蓝色),将其加入 CUSUM
26
移动基线
• 在基本控制图中,我们预先设定了过程均 值和标准差(可能来自历史数据)
• 或者我们可以大幅提高临界值以致永远探 测不到异常,那么特异性=1但是敏感性=0
6
定义的局限性
• 前面我们将敏感性定义为在每个爆发周监 测到异常的概率
• 但是对一次爆发只警示一次足够吗?或者 我们需要每周都警示吗?
• 对于任何爆发,难道一个只在第一周就警 示的系统不比一个只在最后一周才警示的 系统更好?
15
控制图
• 在最基本的控制图中( 休哈特图),我们 将当前值和一些已知的基准线和参考限值 比较
– 控制限值可以基于历史或近期数据
• 然后我们可以根据预先设定的异常定义, 继续随着时间推移监测数据
• 异常的基本定义是一个超过上限的单一值 • (一个异常之后我们重设控制图)
16
演示控制图 - 1
• 比较当前值(紫色)和参考限值
行热线、柜台药品销售、旷工/旷课情况)
41
监测数据的互动传播
Cheng et al. 2011
42
由多重渠道整合信息
• 使用多变量模型 拟合多重流感监 测数据,红色柱 体表明高/增加活 跃度
• 目前从62所参与 学校收集学生缺 课数据
• 指定流感诊所的 就诊情况只在流 感大流行期间发 布数据
(Lau et al. 2012)
44
参考文献(2)
• Kleinman KP, Abrams AM. Assessing surveillance using sensitivity, specicity and timeliness. Statistical Methods in Medical Research, 2006;15(5):445-64.
– 我们应当包含对时间性的衡量(Kleinman et al., 2006)
7
另一种定义 (Hutwagner et al., 2005)
• 敏感性 = 所有爆发中至少发出一次警示的几 率
• 特异性 = 所有非爆发中不发出任何警示的几 率(定义不变)
• 时间性 = 从爆发开始到发出警示的平均时间 (比如:周数)
• 在近期基准值和当前值之间预留缓冲区
– 否则正在进行的爆发可能会影响临界值
• 对于小的数值使用泊松分布代替正态分布 • 同时监控多方位的信息
32
时间序列法
• 前面描述的控制图法没有明确考虑到两个 重要因素:
– 数据的序列相关性(假设随后的数据是独立的) – 季节性影响(尽管使用历史数据可以帮助一些)
• Cheng CK, Ip DK, Cowling BJ, Ho LM, Leung GM, Lau EH. Digital dashboard design using multiple data streams for disease surveillance with inuenza surveillance as an example. Journal of Medical Internet Research, 2011;13(4):e85.
• Lau EH, Cheng CK, Ip DK, Cowling BJ. Situational awareness of inuenza activity based on multiple streams of surveillance data using multivariate dynamic linear model. PLOSONE, 2012;7(2):e38346.
• 这次当前值(红色)产生了异常
30
比较CUSUM和基本控制图
• 基本控制图可以快速探测到大量超出基线 的情况
– 有效探测大型的以及/或者密集的疾病爆发
• CUSUMs可以更好地探测比较小型的疾病增 长
– 有效探测小型的以及/或者缓慢长期的疾病爆发 – …一系列的微小正增长可以迅速增加
31
控制图的更多延伸
– 不要停止产生疫情警报 – 在流感季节开始后的情形如何? – 跟进当前和预测未来的趋势 – 进行干预措施的实时评估
40
态势感知的内容
• 传播性和严重性的评估
– 决定各种控制措施必要性和时间 – 开始计划疫苗推广
• 信息来源
– 例行监测系统(比如定点流感症状监测) – 新的监测系统(比如在线查询、英国流感大流
• 尽早探测到爆发可以帮助疾病的预防和控 制。
3
异常
• 假设我们知道在某个特定时间/地点的预期 病例数目
• 异常被定义为实际病例数“显著”超出了 预期标准
• 并非所有的异常都是由真正的爆发导致
– (需要进一步的调查研究)
• 并非所有的爆发都会导致异常
– 受试者工作特征(ROC)曲线下的面积作为总 评方式
22
累积和控制图
• 此方法计算连续观测值的总和(CUSUM)并将 CUSUM和一个固定的临界值比较
• 必须源自文库标准化所有观测值(减去参考均值 然后除以参考标准差)
23
累积和控制图
• 在时间t的上CUSUM公式是
Ct
max
0,
Ct
1
yt
k
• y值t是和在标时准间差t的观测值,μ和σ分别是过程均
36
不同国家的方法描述
国家 美国
西班牙 希腊
方法 控制图 控制图
CUSUM
CUSUM CUSUM,(迂回法)
参考文献
Xing et al. 2011
Burkom et al. 2004 Bellazzini et al. 2011 Schrell et al. 2013
Spanos et al. 2012
• 专门的时间序列模型可以考虑这些因素
33
时间序列法
• 专门的的时间序列法用来分析时间序列数 据
– Box-Jenkins的ARIMA模型 – 状态空间模型
• 这些先进的方法可以考虑历史季节性、过 去的爆发、以及近期的水平波动
• 当超出参考限值时产生异常 • 或者在时间序列估值后使用控制图
34
动态线性模型
•
基于观测值 量 θ1, θ2,…
y1,
y2,…的模型中假设一系列的隐变
• 可以估算θ1, θ2,…
• 这种指定隐变量的方法可以假设观测值是独立
的
35
时间序列法的缺陷
• 时间序列法是最复杂的途径,应当优于简 单的方法
• 但是这种方法需要最多的资源,需要专家 初期和持续的投入
• 对于很多症状的基本监测,控制图或者历 史局限值已经足够
4
敏感性和特异性
异常 非异常
爆发 a c
非爆发 b d
敏感性 = a/(a+c) = 真正类率 特异性 = d/(b+d) = 真负类率
5
敏感性和特异性
• 很明显,我们需要高敏感性和高特异性
– 但是其中一个增高会导致另一个减低
• 例如,我们可以通过降低异常的临界值来 增加敏感性(这样可以探测到更小型的爆 发),但这也会导致更多的误报
• Burkom HS, Elbert Y, Feldman A, Lin J. Role of data aggregation in biosurveillance detection strategies with applications from ESSENCE. Morbidity and Mortality Weekly Report, 2004;53:S67-71.
43
参考文献
• Bellazzini MA, Minor KD. ED syndromic surveillance for novel H1N1 spring 2009. American Journal of Emergency Medicine, 2011;29(1):70-4.
• Buehler JW, Sonricker A, Paladini M, Soper P, Mostashari F. Syndromic Surveillance Practice in the United States: Findings from a Survey of State, Territorial, and Selected Local Health Departments Advances in Disease Surveillance, 2008;6(3).
17
演示控制图 - 2
• 下个星期,比较新的值(蓝色)和参 考限值
18
演示控制图 - 3
• 这次当前值(红色)产生了异常
19
控制图中的异常
• 通常来说,控制图中的异常发生于:
– 当前值超过上限的3σ – 三个连续值中的两个超过上限2σ – 五个连续值中的四个超过上限1σ – 八个连续值超过均值