时空扫描统计量-空间统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
时空扫描统计量-空间统计
1.1时空扫描统计量
空间自相关分析具有一定的局限性,其没有纳入时间因素故而不能判断地理空间上聚集区域随时间变化的趋势。而时空扫描很好的解决了这一难题,不仅能够揭示地理空间上聚集区域随时间变化的规律,同时还能得出聚集区域的相对危险度,更加精确的对空间聚集区域位置进行了定位。
图错误!文档中没有指定样式的文字。-1 时空扫描原理示意图时空聚集性分析同时考虑了时间和空间两个因素,主要采用移动窗口法(moving windows),如图错误!文档中没有指定样式的文字。-1所示,在地理空间上创建扫描窗口(圆柱体),圆柱体的底面对应研究的地理区域,圆柱体的高对应扫描时间间隔,圆柱体的半径对应扫描的风险人口。扫描窗口的大小和位置在地理空间上不断的变化,其过程为:随机选取地理空间上任一地理位置作为扫描窗口的底面中心,相应的地理区域(扫描窗口的底面积)不断变化,对应时间间隔(扫描窗口的高)也不断变化,直到达到预先规定的上限为止。然后对每一个扫描窗口,根据实际属性值(如发病数)和人口数可计算出预期属性值(发病数),然后利用扫描窗口内外的实际值和预期值构造对数似然比(log likelihood ratio, LLR)检验统计量,最终选取LLR值最大的窗口为高聚集窗口。
针对每个扫描窗口,在泊松分布假设前提下,有:
Z
Z G G m u n m ⎛⎫
= ⎪⎝⎭
(式 错误!文档中没有指定样式的文字。-1) 其中Z u 表示随机假设下时空窗口Z 中的理论事件数;Z m 表示时空窗口Z 中的总案例数;G m 表示研究区域内的总案例数;G n 表示研究时空范围内的总事件数。
接下来,根据窗口内外的理论与实际事件数构造对数似然比(log likelihood ratio LLR)统计量来描述窗口内事件异常聚集的程度,表达为:
0nG nZ
nZ
G Z Z Z G Z Z nG
G G n n n u u u L LLR L n u -⎛⎫
⎛⎫-
⎪ ⎪-⎝⎭⎝⎭==⎛⎫
⎪⎝⎭
(式 错误!文档中没有指定样式的文字。-2)
其中Z n 表示时空窗口Z 中的是事件数,G n 是研究区域总事件数,Z u 是时空窗口Z 中的理论事件数,G u 是研究区域总的理论事件数,G Z u u =∑。LLR 是单调递减的,P 值是根据蒙特卡罗假设检验得出。当LLR 取最大值且P <0.05时,可以认为该区域存在聚集特征。
【案例4-4】
使用广东某疾病数据(Guangdong_case_popu.xls ,包含病例和人口数据)和地理坐标数据(Guangdong_geo.xls )数据,以广东省区县地理位置为基本单元、40%风险人口为半径、月为时间间隔,运用SaTscan 软件对广东省某疾病进行回顾性时空扫描统计,计算RR 值和时空聚类的LLR 值。部分数据分别展示如表 错误!文档中没有指定样式的文字。-1~表 错误!文档中没有指定样式的文字。-2所示:
表 错误!文档中没有指定样式的文字。-1 广东某疾病数据(部分数据)
quxian case popu time 440103 6 793026 Jan-09 440103 1 793026 Feb-09 440103 36 793026 Mar-09 440103 208 793026 Apr-09 440103 180 793026 May-09 440103
222
793026
Jun-09
440103 142 793026 Jul-09
440103 62 793026 Aug-09
440103 85 793026 Sep-09
440103 95 793026 Oct-09
表错误!文档中没有指定样式的文字。-2 广东地理坐标数据(部分数据)
quxian lon lat
440781 112.71 22.03
440785 112.28 22.24
440981 110.97 22.03
440983 111.12 22.43
441223 112.43 23.67
441224 112.17 23.97
441225 111.71 23.56
441226 111.98 23.27
441402 116.12 24.28
441421 116.19 24.36
注意:数据集中的行需要按地点-时间的顺序规范排列。如果某地某个时间段没有发生事件,则不能略去相应的行,而要将该行对应的事件数记为0。
步骤1:打开文件
打开SaTScan,单击【File】->【New Session】,弹出对话框,如图错误!文档中没有指定样式的文字。-2所示,图中显示有三个界面,分别为:Input、Analysis、Output。
图错误!文档中没有指定样式的文字。-2 时空扫描界面
步骤2:Input界面
在Input界面中,有多个文件选项,分别为:Case File、Population File、Coordinate File。
(1)Case File,操作步骤如图错误!文档中没有指定样式的文字。-3(a~e)所示:
a
注:这里应该注意,SaTScan同OpenGeoDa一样,都不能识别中文路径,因此所有操作都应该在英文路径下,否则就会出错。