传染病疫情的预警方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 在近期基准值和当前值之间预留缓冲区
– 否则正在进行的爆发可能会影响临界值
• 对于小的数值使用泊松分布代替正态分布 • 同时监控多方位的信息
32
时间序列法
• 前面描述的控制图法没有明确考虑到两个 重要因素:
– 数据的序列相关性(假设随后的数据是独立的) – 季节性影响(尽管使用历史数据可以帮助一些)
• 此方法计算连续观测值的总和(CUSUM)并将 CUSUM和一个固定的临界值比较
• 必须先标准化所有观测值(减去参考均值 然后除以参考标准差)
23
累积和控制图
ቤተ መጻሕፍቲ ባይዱ
• 在时间t的上CUSUM公式是
Ct
max
0,
Ct
1
yt
k
• y值t是和在标时准间差t的观测值,μ和σ分别是过程均
• 参数k用来忽略某些轻微偏差
4
敏感性和特异性
异常 非异常
爆发 a c
非爆发 b d
敏感性 = a/(a+c) = 真正类率 特异性 = d/(b+d) = 真负类率
5
敏感性和特异性
• 很明显,我们需要高敏感性和高特异性
– 但是其中一个增高会导致另一个减低
• 例如,我们可以通过降低异常的临界值来 增加敏感性(这样可以探测到更小型的爆 发),但这也会导致更多的误报
• 这次当前值(红色)产生了异常
30
比较CUSUM和基本控制图
• 基本控制图可以快速探测到大量超出基线 的情况
– 有效探测大型的以及/或者密集的疾病爆发
• CUSUMs可以更好地探测比较小型的疾病增 长
– 有效探测小型的以及/或者缓慢长期的疾病爆发 – …一系列的微小正增长可以迅速增加
31
控制图的更多延伸
• 在一些监控设置中,每年的情况或会有所 变化,因为我们更偏向于用近期数据来设 定过程均值和标准差
• 随着预期监测的持续,过程均值和标准差 可以持续地更新
27
移动基线控制图 - 1
• 比较当前值(紫色)和参考限值
28
移动基线控制图 - 2
• 更新参考限值并和当前值(蓝色)比较
29
移动基线控制图 - 3
• 尽早探测到爆发可以帮助疾病的预防和控 制。
3
异常
• 假设我们知道在某个特定时间/地点的预期 病例数目
• 异常被定义为实际病例数“显著”超出了 预期标准
• 并非所有的异常都是由真正的爆发导致
– (需要进一步的调查研究)
• 并非所有的爆发都会导致异常
– 受试者工作特征(ROC)曲线下的面积作为总 评方式
• 也有其它版本的规则 • 有时我们偏好只用第一个规则,同时设定
一个不太严格的临界值
20
移动平均控制图
• 在基本控制图中,我们寻找一系列观测值中的 异值或异常的形态
• 另一种方法是研究连续的近期观测值的形态 • 对于观测值 y1, y2,…, 移动平均控制图的统计量
是
mt
1 n
n1 k 0
yt k
15
控制图
• 在最基本的控制图中( 休哈特图),我们 将当前值和一些已知的基准线和参考限值 比较
– 控制限值可以基于历史或近期数据
• 然后我们可以根据预先设定的异常定义, 继续随着时间推移监测数据
• 异常的基本定义是一个超过上限的单一值 • (一个异常之后我们重设控制图)
16
演示控制图 - 1
• 比较当前值(紫色)和参考限值
传染病疫情的预警方法
1
概览
• 讨论为何需要探测流感爆发 • 描述和讨论生成警示的不同方法
探测未来的流感爆发
• 公共卫生监测是持续而系统性地收集、分 析和解释健康数据,这对公共卫生政策的 计划、实施和评估非常重要,并且同时可 以将这些数据及时地发布给有需要的人群 (Thacker S. 1994)。
– 我们应当包含对时间性的衡量(Kleinman et al., 2006)
7
另一种定义 (Hutwagner et al., 2005)
• 敏感性 = 所有爆发中至少发出一次警示的几 率
• 特异性 = 所有非爆发中不发出任何警示的几 率(定义不变)
• 时间性 = 从爆发开始到发出警示的平均时间 (比如:周数)
– 最简化的情况下k设置为0 – 典型的选择是k=0.5,也就是忽略任何距离均值
小于标准差一半的偏差
24
演示上CUSUM - 1
• 标准化观测值的累积和(但不小于0)
25
演示上CUSUM - 2
• 收集下一个数值后(蓝色),将其加入 CUSUM
26
移动基线
• 在基本控制图中,我们预先设定了过程均 值和标准差(可能来自历史数据)
17
演示控制图 - 2
• 下个星期,比较新的值(蓝色)和参 考限值
18
演示控制图 - 3
• 这次当前值(红色)产生了异常
19
控制图中的异常
• 通常来说,控制图中的异常发生于:
– 当前值超过上限的3σ – 三个连续值中的两个超过上限2σ – 五个连续值中的四个超过上限1σ – 八个连续值超过均值
– 只对探测到爆发有效?
8
第二部分 探测异常的统计方法
9
• 迂回法 • 控制图 • CUSUM • 移动基线法 • 时间序列法 • 参考文献
10
迂回法
• 在迂回法中,我们对历史数据拟合一条正 玄曲线包括参考(比如95%)限值
• 通常拟合过程中会剔除过去的爆发(疫情) 数据
• 如果当前值超过上限就产生异常 • 使用示例:警示进入流感高峰期
在移动平均的计算中使用了n个观测值
21
指数加权移动平均控制图 (EWMA)
• EWMA给予早期数据更小的比重 • 对于观测值 y1, y2,…, EWMA的统计量是
st 1 st1 yt
• 0<λ<1是比重参数,s0=0
– λ增大,越早期数据的影响越小 – 通常λ设置为0.1-0.5
22
累积和控制图
11
演示流感数据迂回法 - 1
• 使用历史数据来估计一年中不同时间的预 期值以及参考限值(点线)
12
演示流感数据迂回法 - 2
• 在高峰期前,监测数据应该在参考限值以 内
13
演示流感数据迂回法 - 3
• 但当(冬季)流感高峰期来临,监测数据 会迅速超过参考限值
14
迂回法例子 – Hulth et al., EID, 2010
• 或者我们可以大幅提高临界值以致永远探 测不到异常,那么特异性=1但是敏感性=0
6
定义的局限性
• 前面我们将敏感性定义为在每个爆发周监 测到异常的概率
• 但是对一次爆发只警示一次足够吗?或者 我们需要每周都警示吗?
• 对于任何爆发,难道一个只在第一周就警 示的系统不比一个只在最后一周才警示的 系统更好?
– 否则正在进行的爆发可能会影响临界值
• 对于小的数值使用泊松分布代替正态分布 • 同时监控多方位的信息
32
时间序列法
• 前面描述的控制图法没有明确考虑到两个 重要因素:
– 数据的序列相关性(假设随后的数据是独立的) – 季节性影响(尽管使用历史数据可以帮助一些)
• 此方法计算连续观测值的总和(CUSUM)并将 CUSUM和一个固定的临界值比较
• 必须先标准化所有观测值(减去参考均值 然后除以参考标准差)
23
累积和控制图
ቤተ መጻሕፍቲ ባይዱ
• 在时间t的上CUSUM公式是
Ct
max
0,
Ct
1
yt
k
• y值t是和在标时准间差t的观测值,μ和σ分别是过程均
• 参数k用来忽略某些轻微偏差
4
敏感性和特异性
异常 非异常
爆发 a c
非爆发 b d
敏感性 = a/(a+c) = 真正类率 特异性 = d/(b+d) = 真负类率
5
敏感性和特异性
• 很明显,我们需要高敏感性和高特异性
– 但是其中一个增高会导致另一个减低
• 例如,我们可以通过降低异常的临界值来 增加敏感性(这样可以探测到更小型的爆 发),但这也会导致更多的误报
• 这次当前值(红色)产生了异常
30
比较CUSUM和基本控制图
• 基本控制图可以快速探测到大量超出基线 的情况
– 有效探测大型的以及/或者密集的疾病爆发
• CUSUMs可以更好地探测比较小型的疾病增 长
– 有效探测小型的以及/或者缓慢长期的疾病爆发 – …一系列的微小正增长可以迅速增加
31
控制图的更多延伸
• 在一些监控设置中,每年的情况或会有所 变化,因为我们更偏向于用近期数据来设 定过程均值和标准差
• 随着预期监测的持续,过程均值和标准差 可以持续地更新
27
移动基线控制图 - 1
• 比较当前值(紫色)和参考限值
28
移动基线控制图 - 2
• 更新参考限值并和当前值(蓝色)比较
29
移动基线控制图 - 3
• 尽早探测到爆发可以帮助疾病的预防和控 制。
3
异常
• 假设我们知道在某个特定时间/地点的预期 病例数目
• 异常被定义为实际病例数“显著”超出了 预期标准
• 并非所有的异常都是由真正的爆发导致
– (需要进一步的调查研究)
• 并非所有的爆发都会导致异常
– 受试者工作特征(ROC)曲线下的面积作为总 评方式
• 也有其它版本的规则 • 有时我们偏好只用第一个规则,同时设定
一个不太严格的临界值
20
移动平均控制图
• 在基本控制图中,我们寻找一系列观测值中的 异值或异常的形态
• 另一种方法是研究连续的近期观测值的形态 • 对于观测值 y1, y2,…, 移动平均控制图的统计量
是
mt
1 n
n1 k 0
yt k
15
控制图
• 在最基本的控制图中( 休哈特图),我们 将当前值和一些已知的基准线和参考限值 比较
– 控制限值可以基于历史或近期数据
• 然后我们可以根据预先设定的异常定义, 继续随着时间推移监测数据
• 异常的基本定义是一个超过上限的单一值 • (一个异常之后我们重设控制图)
16
演示控制图 - 1
• 比较当前值(紫色)和参考限值
传染病疫情的预警方法
1
概览
• 讨论为何需要探测流感爆发 • 描述和讨论生成警示的不同方法
探测未来的流感爆发
• 公共卫生监测是持续而系统性地收集、分 析和解释健康数据,这对公共卫生政策的 计划、实施和评估非常重要,并且同时可 以将这些数据及时地发布给有需要的人群 (Thacker S. 1994)。
– 我们应当包含对时间性的衡量(Kleinman et al., 2006)
7
另一种定义 (Hutwagner et al., 2005)
• 敏感性 = 所有爆发中至少发出一次警示的几 率
• 特异性 = 所有非爆发中不发出任何警示的几 率(定义不变)
• 时间性 = 从爆发开始到发出警示的平均时间 (比如:周数)
– 最简化的情况下k设置为0 – 典型的选择是k=0.5,也就是忽略任何距离均值
小于标准差一半的偏差
24
演示上CUSUM - 1
• 标准化观测值的累积和(但不小于0)
25
演示上CUSUM - 2
• 收集下一个数值后(蓝色),将其加入 CUSUM
26
移动基线
• 在基本控制图中,我们预先设定了过程均 值和标准差(可能来自历史数据)
17
演示控制图 - 2
• 下个星期,比较新的值(蓝色)和参 考限值
18
演示控制图 - 3
• 这次当前值(红色)产生了异常
19
控制图中的异常
• 通常来说,控制图中的异常发生于:
– 当前值超过上限的3σ – 三个连续值中的两个超过上限2σ – 五个连续值中的四个超过上限1σ – 八个连续值超过均值
– 只对探测到爆发有效?
8
第二部分 探测异常的统计方法
9
• 迂回法 • 控制图 • CUSUM • 移动基线法 • 时间序列法 • 参考文献
10
迂回法
• 在迂回法中,我们对历史数据拟合一条正 玄曲线包括参考(比如95%)限值
• 通常拟合过程中会剔除过去的爆发(疫情) 数据
• 如果当前值超过上限就产生异常 • 使用示例:警示进入流感高峰期
在移动平均的计算中使用了n个观测值
21
指数加权移动平均控制图 (EWMA)
• EWMA给予早期数据更小的比重 • 对于观测值 y1, y2,…, EWMA的统计量是
st 1 st1 yt
• 0<λ<1是比重参数,s0=0
– λ增大,越早期数据的影响越小 – 通常λ设置为0.1-0.5
22
累积和控制图
11
演示流感数据迂回法 - 1
• 使用历史数据来估计一年中不同时间的预 期值以及参考限值(点线)
12
演示流感数据迂回法 - 2
• 在高峰期前,监测数据应该在参考限值以 内
13
演示流感数据迂回法 - 3
• 但当(冬季)流感高峰期来临,监测数据 会迅速超过参考限值
14
迂回法例子 – Hulth et al., EID, 2010
• 或者我们可以大幅提高临界值以致永远探 测不到异常,那么特异性=1但是敏感性=0
6
定义的局限性
• 前面我们将敏感性定义为在每个爆发周监 测到异常的概率
• 但是对一次爆发只警示一次足够吗?或者 我们需要每周都警示吗?
• 对于任何爆发,难道一个只在第一周就警 示的系统不比一个只在最后一周才警示的 系统更好?