发病时间频数表在暴露时间估计中的作用探讨
暴露人年数计算范文
暴露人年数(Person-Year of Exposure,PYE)是一种常用的生物统计学方法,用于衡量人群中个体在其中一种特定暴露因素下的总体经历时间。
它广泛应用于流行病学研究、环境健康研究和职业暴露评估等领域。
本文将简要介绍暴露人年数的计算方法和其在研究中的应用。
一、暴露人年数的计算方法PYE=∑(Ti×Ni)其中,PYE表示暴露人年数,Ti表示每个个体的暴露时间,Ni表示该暴露时间内存在的个体数。
可以计算各个暴露组别的暴露人年数,进而进行不同组别之间暴露风险的比较和研究。
二、暴露人年数的应用1.流行病学研究在人群流行病学研究中,暴露人年数被用于评估其中一种特定暴露因素与疾病发生的相关性。
通过对疾病和非疾病个体进行暴露时间的统计和对比,可以得出不同暴露水平下疾病风险的差异。
这种方法可以帮助研究人员了解暴露因素对疾病发生的潜在作用。
2.职业健康评估在职业健康评估中,暴露人年数常被用于评估工作环境中的职业病暴露风险。
通过对职业人群的工作历史和不同工作环境的暴露水平进行统计和比较,可以量化职业暴露对人群健康的影响。
这种方法有助于评估职业病的发病率和疾病负担,并为制定相应的预防措施提供科学依据。
3.环境健康研究在环境健康研究中,暴露人年数可用于评估环境污染对人群健康的影响。
通过统计不同地区或不同人群的暴露时间和污染物浓度,可以估计不同人群所受到的环境污染程度,从而帮助研究人员了解环境污染与健康状况之间的关系,并为环境保护和健康政策的制定提供科学依据。
三、暴露人年数的局限性暴露人年数的计算方法在一定程度上考虑了个体暴露时间的变异性,但也存在一些局限性。
首先,暴露时间的测量误差、个体间差异和变化趋势可能会影响暴露人年数的计算精度。
其次,该方法仅关注了个体的暴露时间,未能考虑暴露强度和剂量等因素的影响。
最后,由于数据收集和统计的复杂性,暴露人年数计算方法可能受到研究设计和数据可用性的限制。
总结:暴露人年数是一种重要的生物统计学方法,广泛应用于流行病学研究、环境健康研究和职业暴露评估等领域。
流行病学研究中的队列研究设计与分析
流行病学研究中的队列研究设计与分析在流行病学研究中,队列研究是一种常用的研究设计和分析方法。
队列研究是一种观察性研究,旨在探究暴露因素与疾病发生之间的关系。
本文将详细介绍队列研究的设计和分析原理,以及其在流行病学研究中的应用。
一、队列研究的设计队列研究可以根据研究对象的选择分为两类:前向队列研究和后向队列研究。
前向队列研究,也称为前瞻性队列研究或追踪研究,研究对象在研究开始时没有发生疾病,研究者根据暴露情况将研究对象分为暴露组和非暴露组,随后对其进行长期的观察,记录暴露因素与疾病的发生情况。
而后向队列研究,也称为回顾性队列研究或历史队列研究,研究对象在研究开始时已经发生疾病,研究者通过回顾相关数据来判断暴露因素与疾病的关系。
队列研究的优点在于可以确定因果关系,能够观察到疾病发生前的暴露因素情况,能够计算相对危险度,并且可以进行长期的追踪观察。
但是,队列研究也存在一些局限性,如研究周期长、费用高、可能存在记忆偏倚等。
二、队列研究的分析在队列研究中,研究者通常需要进行一系列的数据收集和分析操作。
下面将介绍队列研究中常见的一些分析方法。
1. 累积发生率(cumulative incidence rate)累积发生率是指在一段时间内,某种疾病在暴露组和非暴露组中的发生率。
研究者可以计算出两组的累积发生率,并比较差异。
2. 风险比(relative risk)风险比是队列研究中常用的一种相对危险度指标,用来比较暴露组和非暴露组在患病风险上的差异。
研究者可以通过计算相对风险比来评估暴露因素对疾病的影响程度。
3. 生存分析(survival analysis)生存分析是一种常用的队列研究的时间性质分析方法,用于研究通过时间来评估事件的发生概率。
生存分析可以帮助研究者估计一段时间内某种事件(如疾病发生)的发生率,并进行统计学检验。
4. 卡方检验(chi-square test)卡方检验是队列研究中常用的一种假设检验方法,用于比较观察频数与期望频数之间的差异。
发病时间频数表在暴露时间估计中的作用探讨
态分布 ( P=00 9 。结论 : .0 ) 发病 时问频数 表的选择应综合考虑频数表 的分布特点和平均潜伏期与暴露时间 的估计值 。
关键词 发 病 时 间 ; 露 时 间 ; 均 潜 伏 期 ; 数 分 布 暴 平 频 R 1 12 /9 . 8 . 1 15 1 文 献标 识 码 A 文章 编 号 10 0 8 (0 9 0 0 8 0 0 4— 18 20 )3— 2 8— 3 中 图分 类 号
ln e t h s o t s o v r g n u a in p r d a d e tma e x o u e tmewee 3 7 9 h a d 3 5 h, e p c ie y i o rf q e c a l s o r o g s a e c n r t fa e a e i c b to e o n si td e p s r i r . 2 n . r s e tv l ,n f u r u n y t e .F u p a i e b
fe u n y t b e a d e tma e au fa e a e i c a in p ro n x o u e t h u d b o sd r d o ea lwh n s lc i g s i b e fe u n y r q e c a l n si td v l e o v r g n ub t e d a d e p s r i s o l e c n i e e v r e e e t u t l r q e c o i me l n a
f q ec alsw r apoi t ylgom lds b t n ad teohrw snt( :0 0 9 . n lso Dir uin caatr t f r unyt e ee p rx e onr a ir ui n h te a o P e b ma l t i o . 0 ) Co cu in: s b t h ce sco t i o r i i
时间序列模型在传染病发病率预测中的应用_吴家兵
时间序列模型在传染病发病率预测中的应用吴家兵1,2 叶临湘1 尤尔科2 本文运用时间序列分析中被广泛应用的ARIMA 模型对东风汽车公司1986~2002年的法定传染病月发病率进行拟合,并探讨使用此模型进行发病率预测的可行性,为传染病监测和防治提供帮助。
资料与方法11资料 东风汽车公司疾病控制所1986年~2003年逐月法定传染病发病数及年度人口数。
21方法 用SPSS1115进行数据处理与分析。
ARIMA 模型建模过程按4个阶段进行。
①序列平稳化:ARIMA 的应用需要时间序列符合平稳性的要求。
②模型的识别:主要是根据ACF 图和PACF 图的特征,提出几种可能的模型作进一步分析。
③模型参数估计和模型诊断:对提出的模型进行参数估计和诊断,如模型不恰当,则回到第二阶段,重新选定模型。
④预测应用:1986~2002年的数据用于建立模型,2003年的数据用于验证模型的预测效果。
建模步骤11序列的平稳化 原序列数据的变异较大,对数据采取自然对数变换,以减小变异。
对经自然对数转换后的序列作自相关图,发现存在以12个时间单位为一个周期的季节性。
根据上述特点,先作一次一般差分,再进行一次季节差分,分别消除趋势和季节的影响。
经分析此时序列已消除了趋势(回归系数=01106,t =01228,P =01820),也没有明显的周期性,符合ARIMA 模型的平稳性的要求。
21模型识别与参数估计 根据差分变换的次数及自相关图,可以判断模型为ARIMA (0,1,1)×(0,1,1)12。
31模型的统计学检验 SPSS 输出结果显示模型所有参数有统计学意义,参数间无明显相关性(r =0103084);对残差序列作自相关图,显示残差序列为白噪声,说明所选模型是恰当的。
模型数学表达:(1-B )(1-B12)Zt =(1-01706B )(1-01818B12)at ,其中Z 为月发病率的自然对数,B 为后移算子,a为随机干扰。
预防医学考试题(含参考答案)
预防医学考试题(含参考答案)一、单选题(共100题,每题1分,共100分)1、健康管理的首要步骤是A、收集健康信息B、疾病风险预测C、健康改善计划的制订D、健康改善计划的实施E、疾病危险性评价正确答案:A2、原生环境是指()。
A、人为作用所形成的优美环境B、天然形成的环境条件,受到人为作用的严重影响C、天然形成的环境条件,没有人为作用影响D、天然形成的环境,但受到工业“三废”的污染E、天然形成的环境条件,受到动物活动的影响正确答案:C3、下列关于氟中毒的论述中错误的是A、氟骨症随年龄增加而增加B、氟斑牙多见于乳牙C、发病与性别无关D、氟骨症多发病于10岁以后E、患氟斑牙不一定伴氟骨症正确答案:B4、男性人口数/女性人口数,这一指标为A、相对比B、不是相对数C、构成比D、动态数列E、率正确答案:A5、美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验,最终肯定了索尔克疫苗的效果。
问此结论是针对()而言A、180万儿童B、每个儿童C、所有使用索尔克疫苗的儿童D、所有儿童E、180万儿童中随机化的1/4正确答案:C6、定量资料,配对t检验的无效假设(双侧检验)为()A、μ=μ0B、μ1=μ2C、μ1≠μ2D、μd≠0E、μd=0正确答案:E7、队列研究的性质是:A、现况研究B、干预性研究C、回顾性研究D、前瞻性研究E、描述性研究正确答案:D8、现况调查结果常用的指标为A、死亡率B、罹患率C、发病率D、病死率E、患病率正确答案:E9、假设检验中的第二类错误是指()A、拒绝了实际上成立的H1B、不拒绝实际上成立的H0C、拒绝H0时所犯的错误D、拒绝了实际上成立的H0E、不拒绝实际上不成立的H0正确答案:E10、下列哪组传染病采用甲类传染病的预防、控制措施A、人感染高致病性禽流感、麻风病、传染性非典型肺炎B、艾滋病、肺炭疽、传染性非典型肺炎C、传染性非典型肺炎、艾滋病和麻风病D、艾滋病、肺炭疸、麻风病E、传染性非典型肺炎、肺炭疽和人感染高致病性禽流感正确答案:E11、以下属于主动免疫的是A、注射疫苗B、注射抗体C、注射细胞因子D、服用乙胺嘧啶预防拒疾E、注射免疫血清球蛋白制剂正确答案:A12、有效氯是指含氯化合物分子团中氯的价数()A、>+1价B、>一3价C、>一2价D、>一l价E、<一1价正确答案:D13、标准误越大,则表示此次抽样得到的样本均数()。
流行病学的常用指标
疾病死亡频率测量指标:
死亡率(mortality rate)
病死率(fatality rate)
生存率(survival rate)
死亡率(mortality rate):是某人群在一定期间(一般为一年)的死亡人数与该人群同期人口数之比。表示在一定时期内,死于某病(或死于所有原因)的频率。
患病率(prevalence rate):也称现患率。指某特定时间内总人口中某病新旧病例所占比例。 可按观察时间的不同分为期间患病率和时点患病率。
某一时点一定人群中现患某病新旧病例数
时点患病率=------------------------------------- ×K
该时点人口数
某观察期间一定人群中现患某病新旧病例数
计算时,须将原发病例从分子及分母中去除。对那些在同一家庭中来自家庭外感染或短于最短潜伏期、或长于最长潜伏期者均不应计入原发病例。
续发率可以用于比较传染病传染力的强弱,用于分析传染病流行因素,包括不同条件对传染病传播的影响(如年龄、性别、家庭中儿童数、家庭人口数、经济条件等)及评价卫生防疫措施的效果(如对免疫接种、隔离、消毒等措施的评价)。
DALY是一个定量的计算因各种疾病造成的早死与残疾对健康寿命年损失的综合指标。是将由于早死(实际死亡年数与低死亡人群中该年龄的预期寿命之差)造成的损失和因伤残造成的健康损失二者结合起来加以测算的。
流行病学是从宏观的高度和群体的角度来认识疾病和健康状况的分布及其机制,研究制定防治对策及评价其效果。DALY的出现是疾病经济负担研究的划时代变化,在1980年以前,DALY的概念还没有提出,疾病负担的评价指标主要是发病率、死亡率等传统指标。随着医学模式的转变,传统的指标越来越不适应现代医学模式的要求,1988年,为了量化失去健康生命的全部损失,哈佛大学和世界卫生组织的专家进行了DALY的研究,并成功地应用于GDB的分析。DALY是目前应用最多的、最具代表性的疾病经济负担评价和测量指标。
预防医学模拟练习题及参考答案
预防医学模拟练习题及参考答案一、单选题(共143题,每题1分,共143分)1.t分布与正态分布的关系是A、均以0为中心,左右对称B、总体均数增大时,分布曲线的中心位置均向右移动C、曲线下两端5%面积对应的分位点均是正负1.96D、随样本含量的增大,t分布逼近标准正态分布E、标准差用于计算可信区间,标准误用于计算参考值范围正确答案:D2.对计数资料进行统计描述的主要指标是A、平均数B、相对数C、标准差D、变异系数E、中位数正确答案:B3.天然土壤中存在的致病菌为()A、破伤风杆菌及肉毒杆菌等B、金黄色葡萄球菌C、肠道致病菌D、大肠杆菌E、噬菌体正确答案:A4.描述某地某地210名健康成人发汞含量的分布,宜绘制A、直方图B、百分条图C、条图D、线图E、统计地图正确答案:A5.原生环境是指()。
A、天然形成的环境条件,受到人为作用的严重影响B、人为作用所形成的优美环境C、天然形成的环境条件,没有人为作用影响D、天然形成的环境条件,受到动物活动的影响E、天然形成的环境,但受到工业“三废”的污染正确答案:C6.四格表中四个格子基本数字是()A、两对理论数B、两个样本率的分子和分母C、两对实测数和理论数D、两个构成比的分子和分母E、两对实测阳性绝对数和阴性绝对数正确答案:E7.了解人群中某病的发病率归因于暴露部分作用的大小,最适宜的指标是A、ORB、RRC、ARD、PARE、SPMR正确答案:D8.某男,67岁,已发生过卒中,但仍然抽烟,医生劝其戒烟以预防再发卒中。
这属于A、第一级预防B、第二级预防C、第三级预防D、原生级预防E、以上都不是正确答案:A9.在两样本率比较的假设检验中,无效假设(H0)的正确表达应为()A、μ1≠μ2B、μ1=μ2C、π1=π2D、π1≠π2E、B=正确答案:C10.传染病的流行过程“三环节”指的是A、患者、传播途径、易感人群B、病因、宿主、环境C、传染源、传播途径、易感人群D、生理因素、心理因素、社会因素E、病原携带者、传播途径、易感人群正确答案:C11.回顾性队列研究是指:A、从现在开始观察,追踪到将来某个时点B、以过去某个时点为研究起点,追踪观察到现在的结果C、以过去某个时点为研究起点,追踪观察到将来某个时点D、以现在的结果为研究起点,追逆到过去的暴露史E、以上都不是正确答案:B12.欲比较两组资料阳性反应率,在样本量足够大的情况下,应采用()A、确切概率法B、独立四格表卡方检验C、校正配对卡方检验D、校正四格表卡方检验E、配对卡方检验正确答案:B13.以下不属于健康的生活方式的是A、有规律地锻炼B、坚持刷牙C、不吸烟D、只吃喜欢吃的食物E、饭前便后洗手正确答案:D14.在某些情况下,用病例对照研究方法估计暴露和疾病的联系可能比队列研究方法更好,其原因是:A、病例对照研究分析方法简单B、有些疾病发病率很低C、队列研究设计复杂D、病例对照研究偏倚容易控制E、病例对照研究的研究对象容易获得正确答案:B15.若频数表的集中位置偏向数值较小一侧,其分布类型是()A、正态分布B、t分布C、对称分布D、负偏态分布E、正偏态分布正确答案:E16.在正态曲线下,大于μ-2.58σ包含的面积为()A、0.05%B、1%C、99%D、99.5%E、0.5%正确答案:D17.计算某血清血凝抑制抗体滴度的平均水平,宜用()A、均数B、几何均数C、中位数D、四分位数E、相对数正确答案:B18.说明两个有关联的同类指标的比即为A、频数B、构成比C、率D、相对比E、频率正确答案:D19.李某在某市开了一家饭店,饭店的碗筷每次用后都进行消毒,这种对餐具的消毒属于A、终末消毒B、预防性消毒C、化学消毒D、疫源地消毒E、随时消毒正确答案:B20.假设在一项研究饮酒与肝癌发生的关系的病例对照研究中,如果对照组过多选用酒精过敏者,计算OR值时,很有可能的结果是:已知过敏的情况所以对照组的比值会降低暴露因素会降低A、应以RR来代替ORB、OR值被高估C、不能计算OR值D、OR值被低估E、OR值不会发生变化正确答案:B21.t<t0.05,ν,统计上可认为A、两总体均数,差别无统计学意义B、两总体均数,差别有统计学意义C、两样本均数,差别无统计学意义D、两样本均数,差别有统计学意义E、两样本,差别无统计学意义正确答案:A22.对于社区40岁以上的成年男性,下列首先应采取的措施是A、定期筛出血脂异常者,给予适当预防干预B、进行心电图运动试验C、对有高危行为的目标人群,给其降脂药物D、工作场所健康促进规划E、社区长跑比赛正确答案:A23.下列因素中导致全球每年死亡人数最多的因素为A、吸烟B、艾滋病C、疟疾D、结核E、自杀正确答案:A24.现况调查的设计原则是:A、将研究对象分为实验组和对照组B、多选自愿者为研究对象C、可按暴露与非暴露设计分组调查D、从目标人群中抽取一个样本进行调查E、可将调查对象分为病例组与对照组正确答案:D25.根据频数表所画的直方图,如果其峰向数据小的一侧偏移的分布称为A、正偏态分布B、负偏态分布C、正态分布D、二项分布E、以上都不是正确答案:A26.描述一组对称(或正态)分布资料的离散趋势时,最适宜选择的指标是()A、极差B、标准差C、均数D、变异系数E、标准误正确答案:B27.比较老年性慢性支气管炎病人与健康人的尿中17酮类固醇排出量(mg/24h)病人组2.905.415.484.604.035.105.924.974.244.362.722.372.097.10健康组5.188.493.146.463.726.644.015.604.577.714.99要分析该资料,应采用B、两样本均数的t检验C、两样本均数的u检验D、χ2检验E、配对设计u检验正确答案:B28.男性人口数/女性人口数,这一指标为A、不是相对数B、构成比C、动态数列D、相对比E、率正确答案:D29.世界卫生组织建议每人每日食盐量不应超过A、6克B、9克C、7克D、8克E、10克正确答案:A30.SO2是大气中主要污染物,其主要来源A、汽油B、煤C、柴油D、石油E、天然气正确答案:B31.测定尿铅含量有甲乙两种方法。
狂犬病潜伏期及其影响因素的分析_孙建伟
, 其长短及其影响因素成了
人们最为关注的问题 。 本研究通过狂犬病例个案调 查信息 , 对狂犬病潜伏期及其影响因素进行了研究 。 1 材料与方法 1. 1 材料 对 2004 -2009 年河南省报告的狂犬病
通讯作者 : 许汴利 ; Em ail : x ubl @hn cdc . con . cn 作者单位 : 河南省疾病预防控制中心 , 郑州 450016
156
中 国人 兽共 患病 学 报
表 3 不同暴露因素与状态下的平均潜伏期
2011 , 27( 2)
不同暴露因素 头面颈部 躯干 手臂 手部 下肢膝以上 下肢膝以下 男 女 咬伤 抓伤 未出血 出血 栓养 有主放养 无主流浪 不详 正常 可疑 发病 不详 撩惹 嘻逗偶然 无故突然 不详
病例数 36 2 68 188 32 142 311 157 447 21 30 438 45 246 138 39 179 172 47 70 120 70 237 41
中 国 人兽 共 患 学 报
154
文章编号 : 1002 -2694( 2011 ) 02 -0154-04 Chinese Journal of Z oonoses
2011 , 27 ( 2)
狂犬病潜伏期及其影响因素的分析
孙建伟 , 许汴利
摘 要 : 目的 分析并探 讨狂犬病潜伏期及 影响因素 。 方法 收 集并整理 2004 - 2009 年河南省 468 份狂犬病个案调 查 资料 , 对病例潜伏期及其可能影响因素通过 SPSS15 . 0 统计软件进行统计描述 、单因素和 多因素分析 , 并建立影 响因素的回 归 模型方程 。 结果 狂犬病潜伏期呈正偏态分布 , 其偏度为 5 . 047 , 峰度 为 31 . 099 。 狂犬 病潜伏期最短为 4d , 最长为 2 , 465d , 平 均潜伏期( 中位数) 为 60d 。 单因素秩和检 验显示年龄 、暴露方式 、暴露程 度 、暴露部 位 、伤 口处理 、伤口 处理地 点 、伤 口是否 冲 洗 、是否消毒 、是否接种疫苗 、肇事动物管理 、动物伤人原因 11 个因素有统 计学意义 。 多因素 Cox 回归分 析显示暴 露部位 、年 龄 2 个因素有统计学意义 。 结论 狂犬病潜伏期呈正偏态分布 。 狂犬病例暴露部位 、年龄是影响潜伏期的重要因素 。 关键词 : 狂犬病 ;潜伏期 ; 影响因素 中图分类号 : R181 . 2 文献标识码 : C
疾病控制中级流行病统计真题回忆2006-2020
疾病控制中级流⾏病统计真题回忆2006-2020流⾏病+统计真题回忆:1、罹患率的定义:主要⽤于急性传染病发病指标2、统计学中⼩概率事件是指(p≤0.05)3、对照组公认药:标准对照2、如果线性回归检验p《0.05:差异显著性,有统计学意义1、多阶段整群抽样录⼊数据后下⼀步做什么?我选的加权数据26、某医院某种病⼈占住院病⼈的百分⽐:构成⽐21、续发率、发病率、患病率的概念和应⽤23、下列属于⼀级预防的是:戒烟戒酒22、年龄与疾病之间的关联⽐其他因素的作⽤都强。
22、慢病总体率不知的情况下,⽤样本率*****代替总体率*取值(0.5)22、以下表⽰疾病频度的统计指标是AA、每千⼈患慢性病者⼈数及患病次数B、每千⼈患有2种及以上疾患者数C、门诊医疗费⽤D、2周每千⼈因病卧床⼈数及天数E、2周每千⼈因病休⼯(学)⼈数及天数以下哪个不能反应⾎清学试验有效性的参数是?灵敏度、特异度、阳性预测值、似然⽐、(RR 值)研究农村井⽔氟元素选择其他集中供⽔的地区作为对照属于:社区实验(备选答案有:现场实验、临床试验、社区实验等)81、普查;不要考虑调查对象和样本⼤⼩15、机械抽样⼜叫:整群抽样10、5岁以下⼉童死亡率的分母是年内活产数,婴⼉死亡率的分母是同年活产数2、评价居民健康状况的是(预期寿命)4、完全随机设计⽅差分析中的组间均⽅是(E)的统计量A.表⽰抽样误差⼤⼩B.表⽰N个数据的离散程度C.表⽰随机因素的效应⼤⼩D.表⽰某处理因素的效应作⽤⼤⼩E.表⽰某处理因素的效应和随机误差两者综合影响的结果5、流⾏病学模型(3题)6、分⼦流⾏病学和⾎清流⾏病学的研究对象(2题)7、糖尿病的流⾏的⽅式8、价格曲线和供给曲线9、OR=1.5,喝酒和前列腺炎的关系是?暂不能确定两者的关系10、流⾏病学的模式:传染病的模式是什么疫情控制最有价值的模式是什么最全⾯的模式是什么11、近10年间发病率趋势⽤普通线图12、⾝⾼和体重关系⽤散点图13、r等于0.5表⽰正相关14、完全寿命表是指( 以1岁为⼀个年龄组)简略寿命表是指( 以5岁为⼀个年龄组)15、不属于学校卫⽣任务的是?对传染病的暴发流⾏进⾏监测寿命表的主要指标不包括DA.死亡概率B.尚存⼈数C.死亡⼈数D.年龄别死亡率E.期望寿命32. 概率抽样和⾮概率抽样:⽴意抽样、滚雪球抽样170、变异程度⽤:变异系数33. 匹配的定义及分类:个体匹配和频数匹配35. 实验流⾏病学和描述流⾏病学的差别:是否有⼲预措施36. 前瞻性队列研究和回顾性队列研究的区别:观察终点是否已发⽣38. 队列研究的研究对象选择:具有暴露因素的未患病⼈群39. 把⾮暴露在误认为暴露组:错分偏倚41. 评价预防措施的效果指标:保护率和效果指数44. 分⼦流⾏病学的⽣物标志:DNA/RNA/蛋⽩质46. 描述体质指数频数分布,宜绘制直⽅图;反映体重和肺活量的关系,宜绘制散点图;快餐店的频数分布,宜绘制直⽅图;47. 描述集中趋势的指标:算术平均数、⼏何均数、中位数53. 绘制频数分布表的⽬的是判断分布类型和趋势54. 随机抽样的⽬的是减少样本的偏性55. 随机区组⽅差分析的总变异分解:SS 总=SS 处理+SS 区组+SS 误差56. 变量转换:平⽅根的变换适⽤于泊松分布资料57. 标准化和相对数的定义60. 残差平⽅和的定义:⽆法⽤ X 的影响来解释的 Y 变异61. 统计表的设计存在问题62. 实验设计⽅法的分类和定义:随机对照、配对设计、随机区组63. 寿命表:nqx,尚存⼈年数64、分⼦流⾏病学的⽣物标志:DNA/RNA/蛋⽩质65、有⼀个病因分数为90%的,其意义是:暴露⼈群中发病或死亡90%归因于暴露因素66、观察法的优点有实施简便易⾏,过程排除⼲扰,信息直观可靠67、Poisson分布是⼀种特殊的⼆项分布,其特点是:样本例数很⼤⽽发⽣概率很⼩68、离散趋势的指标有:极差、四分位数间距、变异系数69、⽐较两组资料的均数,进⾏t检验的前提条件有:两总体⽅差相等70、对于⼀组服从双变量正态分布的资料,经直线相关分析得相关系数=1,则有:SS总=SS回(备选答案有:SS总=SS回、SS总=SS残、SS残=SS回、SS总>SS回、不能确定SS总和SS回的关系)71、对平均预期寿命影响最⼤的原始数据是:婴⼉死亡资料(备选答案有:婴⼉死亡资料、新⽣⼉死亡资料、⽼年⼈死亡资料、0-10岁组死亡资料、青年死亡资料)72、把t检验做成秩和检验则:增加第⼆类错误73、某病最短潜伏期与最长潜伏期之间,密切接触者中的发病⼈数除以接触原发病例的易感⼈数,得到的是该病的:续发率。
时间序列分析在流感疫情预测预警中的应用研究
时间序列分析在流感疫情预测预警中的应用研究南京医科大学朱猛、湛蓝、丁克琴目录摘要...............................................................................................错误!未定义书签。
一、问题提出.................................................................................错误!未定义书签。
二、研究背景.................................................................................错误!未定义书签。
1、时间序列模型背景............................................................错误!未定义书签。
2、ARIMA模型简介.............................................................错误!未定义书签。
3、时间序列在传染病发病预测中的应用............................错误!未定义书签。
三、江苏省流感样病例监测数据的ARIMA............................................................错误!未定义书签。
(一)若干基本概念 (6)(二)江苏省流感样病例监测数据的ARIMA模型..............................................错误!未定义书签。
1、流感监测数据分析 (7)2、数据的平稳化 (7)3、模型的识别、定阶与参数估计 (9)4、模型诊断检验 (10)5、模型的预测 (11)6、基于流感样病例百分比序列的建模 (12)四、结论与建议 (12)参考文献 (13)附录:流感监测的背景 (14)摘 要时间序列分析是概率统计学中一个重要分支,利用时间序列模型进行分析、预测已被广泛运用于医学、经济学等多领域,并取得良好的效果。
流行病学常用指标
研究生存时间的统计学方法,包括描述性分析和推断性分析。
计算方法
直接法
从初始观察开始,逐一记录每个个体发生事件或失访的时间,直 至研究结束。
间接法
利用全死因的死亡率,减去其他死因的死亡率,得到特定事件的 死亡率。
寿命表法
根据不同年龄组的死亡率计算预期寿命,绘制生存曲线。
应用场景
临床研究
评估新药或治疗方法的疗效,比较不同治疗方案的效果。
YLD(Years of Life with Disability)
总结词
YLD用于衡量疾病或伤害导致残疾所损失的预期寿命年数,是评估疾病负担的重要指标 之一。
详细描述
YLD的计算考虑了残疾程度和持续时间,反映了疾病对个体生活质量和社会生产力的影 响。YLD的减少通常意味着疾病负担的减轻和公共卫生干预措施的有效性。
种族
不同种族的死亡率也有所不同,可能与遗 传、环境和生活方式等因素有关。
04
病死率
定义
01
02
03
病死率
指一定时期内,某病患者 中因该病而死亡的病例所 占的比例。
计算公式
病死率 = (某时期死亡病 例数 / 同时期患该病的总 病例数)× 100%。
意义
反映疾病对人类生命威胁 的程度,为评价疾病负担 提供依据。
THANKS
谢谢您的观看
定义
01
影响因素
02
人口学特征:年龄、性别、种族、职业等。
03 暴露因素:生活习惯、环境因素、遗传因素等。
定义
医疗保健因素
医疗水平、预防保健措施等。
病程与病死率
疾病潜伏期、病例发现早晚、诊断标准等。
计算方法
时间范围
暴露人年的三种计算方法
暴露人年计算方法在流行病学研究中,暴露人年(exposure person-years)是一个重要的指标,用于衡量研究人群中暴露于某种因素的总时间。
以下是三种主要的暴露人年计算方法:直接法、寿命表法和间接法。
1. 直接法直接法是最常用的暴露人年计算方法之一。
在此方法中,每个研究对象在研究期间内的暴露时间被直接记录下来,然后根据研究设计(如队列研究、病例对照研究)进行适当的权重调整。
具体计算步骤如下:1.1. 记录每个研究对象在研究期间的暴露状态(如吸烟、饮酒等)。
1.2. 根据研究设计确定每个暴露状态的时间权重(如病例对照研究中的病例和对照时间,队列研究中的观察时间和随访时间)。
1.3. 将所有研究对象的暴露时间和时间权重相乘,得到每个暴露状态的暴露人年数。
1.4. 将所有暴露状态的暴露人年数相加,得到总的暴露人年数。
2. 寿命表法寿命表法是一种计算暴露人年的间接方法,适用于在研究期间内发生结局事件的人群。
该方法基于假设:在研究期间内,研究对象暴露于危险因素的时间越长,发生结局事件的风险就越高。
具体计算步骤如下:2.1. 编制寿命表,列出每个时间单位内发生结局事件的人数和未发生结局事件的人数。
2.2. 根据寿命表计算每个时间单位的累积发病率和累积生存率。
2.3. 根据累积发病率和累积生存率计算每个时间单位的危险性函数(hazard function),即发生结局事件的风险。
2.4. 将每个时间单位的危险性函数乘以该时间单位的总人数,得到每个时间单位的暴露人年数。
2.5. 将所有时间单位的暴露人年数相加,得到总的暴露人年数。
3. 间接法间接法是一种基于发病率的暴露人年计算方法,适用于在研究期间内没有发生结局事件的人群。
该方法假设研究对象在研究期间内的暴露时间和未暴露时间具有相同的生存概率。
具体计算步骤如下:3.1. 根据直接法或寿命表法计算每个暴露状态的暴露人年数和总暴露人年数。
3.2. 根据总暴露人年数和每个暴露状态的暴露人年数计算每个暴露状态的发病率。
时间序列模型在传染病发病率预测中的应用_吴家兵
时间序列模型在传染病发病率预测中的应用吴家兵1,2 叶临湘1 尤尔科2 本文运用时间序列分析中被广泛应用的ARIMA 模型对东风汽车公司1986~2002年的法定传染病月发病率进行拟合,并探讨使用此模型进行发病率预测的可行性,为传染病监测和防治提供帮助。
资料与方法11资料 东风汽车公司疾病控制所1986年~2003年逐月法定传染病发病数及年度人口数。
21方法 用SPSS1115进行数据处理与分析。
ARIMA 模型建模过程按4个阶段进行。
①序列平稳化:ARIMA 的应用需要时间序列符合平稳性的要求。
②模型的识别:主要是根据ACF 图和PACF 图的特征,提出几种可能的模型作进一步分析。
③模型参数估计和模型诊断:对提出的模型进行参数估计和诊断,如模型不恰当,则回到第二阶段,重新选定模型。
④预测应用:1986~2002年的数据用于建立模型,2003年的数据用于验证模型的预测效果。
建模步骤11序列的平稳化 原序列数据的变异较大,对数据采取自然对数变换,以减小变异。
对经自然对数转换后的序列作自相关图,发现存在以12个时间单位为一个周期的季节性。
根据上述特点,先作一次一般差分,再进行一次季节差分,分别消除趋势和季节的影响。
经分析此时序列已消除了趋势(回归系数=01106,t =01228,P =01820),也没有明显的周期性,符合ARIMA 模型的平稳性的要求。
21模型识别与参数估计 根据差分变换的次数及自相关图,可以判断模型为ARIMA (0,1,1)×(0,1,1)12。
31模型的统计学检验 SPSS 输出结果显示模型所有参数有统计学意义,参数间无明显相关性(r =0103084);对残差序列作自相关图,显示残差序列为白噪声,说明所选模型是恰当的。
模型数学表达:(1-B )(1-B12)Zt =(1-01706B )(1-01818B12)at ,其中Z 为月发病率的自然对数,B 为后移算子,a为随机干扰。
医疗保健大数据分析中的时间序列预测方法综述
医疗保健大数据分析中的时间序列预测方法综述随着大数据时代的到来,医疗保健领域积累了大量的数据,并且这些数据的数量与日俱增。
这些数据中蕴含着医疗保健领域的宝贵信息,而通过对这些数据进行分析和预测,可以帮助决策者做出更加准确和有效的决策。
在医疗保健大数据分析中,时间序列预测方法被广泛应用于预测未来的趋势和变化。
本文将综述一些常用的时间序列预测方法在医疗保健大数据分析中的应用。
首先,我们介绍一下时间序列的基本概念。
时间序列是指一系列按照时间顺序排列的数据点的集合。
在医疗保健领域中,时间序列数据可以是患者的就诊记录、疾病的发病率、药物的使用量等。
通过对这些时间序列数据进行预测,可以为医疗保健决策提供有益的信息。
在医疗保健大数据分析中,常用的时间序列预测方法包括自回归移动平均模型(ARMA)、自回归整合移动平均模型(ARIMA)、指数平滑法和灰度预测法等。
这些方法均基于时间序列数据的有序性和趋势性,并以此为基础进行数据的分析和预测。
自回归移动平均模型(ARMA)是一种常用的时间序列预测方法。
ARMA模型基于时间序列的自相关性和移动平均性质,通过建立自相关系数和移动平均系数的模型,对时间序列数据进行预测。
ARMA模型能够较好地捕捉时间序列的自相关性和移动平均性质,适用于长期的趋势预测和周期性变化的预测。
自回归整合移动平均模型(ARIMA)是ARMA模型的扩展。
ARIMA模型考虑到时间序列数据的非平稳性,通过对数据进行差分,将非平稳的时间序列转化为平稳的时间序列。
然后再基于ARMA模型对平稳的时间序列进行预测。
ARIMA模型适用于具有明显趋势和季节性的时间序列数据的预测。
指数平滑法是另一种常用的时间序列预测方法。
它基于时间序列数据的递推式,通过对历史数据进行加权平均,来预测未来的趋势和变化。
指数平滑法适用于具有平稳性和趋势性的时间序列数据的预测。
灰度预测法是一种适用于小样本、缺乏数据的时间序列预测方法。
这种方法通过对序列的关联系数进行简化处理,将复杂的时间序列问题转化为求解微分方程的问题。
流行病学重点总结
流⾏病学重点总结《流⾏病学》重点总结1.发病指标发病率(incidence rate)指⼀定时期内,特定⼈群中某病新病例新发⽣的频率。
常⽤来描述疾病的分布、探讨发病因素、提出病因假设和评价防制措施效果。
罹患率(attack rate)与发病率同样是测量新发病例的频率指标。
⼀般⽤于衡量⼩范围内、短时间内的发病频率,观察时间通常以⽉、周、⽇或⼀个流⾏期为单位,多⽤于描述⾷物中毒、职业中毒及传染病的暴发流⾏。
患病率(prevalence rate)亦称现患率或流⾏率,指在特定时间内,⼀定⼈群中某病新旧病例数总数所占的⽐例。
计算公式:患病率=发病率×病程。
感染率(infection rate)指在受检查的⼈群中,某病现有感染⼈数所占⽐率,通常⽤百分率(%)表⽰。
续发率( secondary attack rate,SAR)也称⼆代发病率,指在⼀定观察期内,某种传染病在家庭易感接触者中的⼆代病例的百分率。
⾃原发病例出现后,在该病的最短⾄最长潜伏期之间发⽣的病例称为续发病例,即⼆代病例。
计算公式:继发率=易感接触者中的续发病例数/易感接触者总数×100%。
计算续发率要掌握的资料有:原发病的发病时间、接触者中易感者⼈数、观察期内的⼆代病例数。
2.死亡指标死亡率(mortality rate)指某⼈群在⼀定时期内,死于所有原因的⼈数在该⼈群中所占的⽐例。
是测量⼈群死亡危险最常⽤的指标,其分⼦为死亡⼈数,分母为该⼈群年平均⼈⼝数。
死于所有原因的死亡率是⼀种未经过调整的死亡率,所以通常被称为粗死亡率(crude death rate),是衡量⼈群因病伤死亡危险⼤⼩的指标,是⼀个国家或地区⽂化、卫⽣⽔平的综合反映。
按疾病的种类、年龄、性别、职业、种族等分类计算的死亡率称为死亡专率(specific death rate),常⽤于探讨疾病的病因和评价防制措施。
病死率(fatality rate)表⽰在⼀定期间内,患某病的全部病⼈中因该病⽽死亡的⽐例。
临床观察中事件发生时间类疗效评价指标相关问题的探讨
临床观察中事件发生时间类疗效评价指标相关问题的探讨事件发生时间是临床观察中常见的疗效评价指标,用来衡量干预措施在某方面发挥作用的快慢。
这类指标与其他疗效评价指标相比,在研究设计、原始资料填写、数据核查和统计分析方面,都有着不同之处。
事件发生时间的获得方式有2种,可以由研究者进行临床观察时直接填写,也可以由统计人员在临床观察结束后通过计算得到。
填写原始资料和数据核查时,要注意事件发生时间与访视点以及相关联指标的逻辑关系。
进行统计分析时,应注意对未观察到事件发生时间的病例的处理。
认清这些不同之处,才能使事件发生时间客观、真实地体现干预措施的作用和效果,才能使临床观察结果科学、客观、可靠。
标签:事件发生时间;疗效评价指标;临床观察在临床观察中,疗效评价指标可以是定量指标,也可以是定性指标,还有一类是事件发生时间(time-to-event)指标,如起效时间、消失时间等。
这类指标用来衡量干预措施在某方面发挥作用的快慢。
例如,适应症为上呼吸道感染的药物退热的快慢,或者适应症为复发性阿弗他溃疡的药物促进溃疡愈合的快慢等。
当需要观察事件发生时间时,从研究设计、原始资料(研究病历、病例报告表)填写,数据核查到统计分析,都有与其他疗效评价指标不同之处,笔者通过对多个项目的探讨,提出以下建议供同行参考。
1 研究设计方面事件发生时间的获得方式有2种:一是由研究者进行临床观察时直接填写;二是由统计人员在临床观察结束后通过计算得到。
事件发生时间均可采用第1种方式获得,采用这种方式时,应该发放患者日志卡让受试者填写,避免复诊时回忆产生较大偏差。
另外,要对受试者做好培训,交代受试者及时、准确地记录事件发生时间,待复诊时,受试者将患者日志卡交给研究者,研究者依据日志卡的记录,将事件发生时间填写至研究病历或病例报告表。
以某适应症为复发性阿弗他溃疡的药物的临床试验为例,该临床试验的疗效评价指标之一为溃疡愈合时间(以d为单位),访视点为入组、3 d和6 d。
流行病学研究探索疾病的时间分布
流行病学研究探索疾病的时间分布流行病学是一门研究疾病在人群中的发生和传播规律的学科,其中重要的研究方法之一就是时间分布分析。
时间分布分析可以揭示疾病在特定时间段内的发生情况,以及可能的季节性或周期性变化。
本文将探讨流行病学研究探索疾病的时间分布的方法和意义。
一、时间分布分析的方法时间分布分析通常基于大量的流行病学数据,如发病报告、医院就诊记录等。
通过统计这些数据中的时间信息,可以构建疾病的时间分布图,反映疾病在不同时间段内的发生情况。
常见的时间分布分析方法包括以下几种:1. 季节变化分析:疾病的发生可能会有明显的季节性变化,例如流感在冬季流行较为普遍。
通过对疾病在不同季节的发生情况进行比较,可以确定疾病的季节性规律。
2. 节假日效应分析:某些疾病在特定节假日前后的发生率可能会有所增加或减少。
例如,消化系统疾病在春节期间往往会出现明显的上升。
节假日效应分析可以帮助我们理解疾病发生的可能原因和机制。
3. 周期性分析:疾病的发生有时可能会呈现明显的周期性变化,常见的周期包括每年、每月、每周等。
通过对疾病的周期性变化进行分析,可以揭示其背后可能存在的环境因素、行为方式等因素。
二、时间分布分析的意义时间分布分析在流行病学研究中具有重要的意义,主要体现在以下几个方面:1. 发现疫情的季节和周期规律:通过时间分布分析,可以确定某些疾病的发生规律,为预防控制工作提供科学依据。
例如,流感的季节性高发可以引导公共卫生部门做好疫苗供应和宣传工作。
2. 帮助确定疾病的暴发和流行高峰:疾病的爆发和流行高峰往往对公共卫生工作提出重要挑战,时间分布分析可以帮助我们及时捕捉到这些变化,并采取相应的预防和控制措施。
3. 探索疾病爆发的原因:时间分布分析对于疾病爆发的原因研究也具有重要意义。
当某一时间段内某一地区的疾病发生率异常升高时,可以结合环境因素和个体行为等数据,进一步分析疾病爆发的原因。
4. 辅助制定公共卫生政策:基于时间分布分析的研究结果,可以为制定公共卫生政策提供依据。
时间间隔在医学研究中的应用
时间间隔在医学研究中的应用时间间隔在医学研究中具有广泛的应用。
在临床试验、疾病进展评估、药物作用机制研究等方面,时间间隔都起着至关重要的作用。
本文将详细介绍时间间隔在医学研究中的应用。
首先,时间间隔在临床试验中起着关键的作用。
在临床试验中,研究者需要定期收集患者的数据,包括症状、体征、实验室指标等。
这些数据可以帮助研究者评估患者的病情进展,并确定是否需要调整治疗方案。
此外,研究者还需要定期收集患者的生命体征数据,如心率、血压、呼吸频率等。
这些数据可以帮助研究者评估药物治疗的安全性和有效性。
其次,时间间隔在疾病进展评估中也有着重要的应用。
在疾病进展评估中,研究者需要定期收集患者的数据,以评估患者的病情进展。
这些数据可以帮助研究者确定疾病进展的速度,并制定相应的治疗策略。
此外,研究者还需要定期收集患者的生命体征数据,以评估药物治疗的安全性和有效性。
第三,时间间隔在药物作用机制研究中也有着重要的应用。
在药物作用机制研究中,研究者需要定期收集患者的数据,以评估药物治疗的效果。
这些数据可以帮助研究者确定药物治疗的作用机制,并制定相应的治疗策略。
此外,研究者还需要定期收集患者的生命体征数据,以评估药物治疗的安全性和有效性。
最后,时间间隔在医学研究中的应用还有很多其他方面。
例如,在感染性疾病研究中,研究者需要定期收集患者的数据,以评估患者的病情进展。
这些数据可以帮助研究者确定疾病进展的速度,并制定相应的治疗策略。
此外,研究者还需要定期收集患者的生命体征数据,以评估药物治疗的安全性和有效性。
总之,时间间隔在医学研究中的应用非常广泛。
在临床试验、疾病进展评估、药物作用机制研究等方面,时间间隔都起着至关重要的作用。
因此,在医学研究中,我们应该充分考虑时间间隔的影响,以便更好地评估患者的病情进展和治疗效果。
疾病发病情况的时间序列分析
某市恶性疾病的时间序列分析摘要:本文对某市1990~2007年间某恶性疾病的发病情况进行统计,运用时间序列分析,建立ARIMA模型对该病发病情况进行研究,并对未来几年的发病情况做出了预测。
关键字:时间序列ARIMA,拖尾截尾时间序列分析的简介时间序列分析(Time series analysis)是一种动态数据处理的统计方法。
该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。
时间序列是把反映现象发展水平的统计指标数值,按照时间先后顺序排列起来所形成的一组统计数字序列。
时间序列又称动态数列或时间数列。
时间序列分析就是利用这组数列,应用数理统计方法加以处理,以预测未来事物的发展。
时间序列分析是定量预测方法之一,它的基本原理:一是承认事物发展的延续性。
应用过去数据,就能推测事物的发展趋势。
二是考虑到事物发展的随机性。
任何事物发展都可能受偶然因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。
该方法简单易行,便于掌握,但准确性差,一般只适用于短期预测。
时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化。
时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。
时间序列分析常用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等方面。
时间序列分析主要用途:①系统描述。
根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述。
②系统分析。
当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理。
③预测未来。
一般用ARMA模型拟合时间序列,预测该时间序列未来值。
④决策和控制。
根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到过程要偏离目标时便可进行必要的控制。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
#论著#发病时间频数表在暴露时间估计中的作用探讨许汝福,李亚斐,熊鸿燕,许斌(第三军医大学军事预防医学院军队流行病学教研室,重庆400038)摘要目的:探讨疾病暴发调查中发病时间频数表对暴露时间估计的影响。
方法:应用一起食物中毒教学实习资料的数据,分别以不同的起点和组距编制5个发病时间频数表,计算平均潜伏期和估计暴露时间,并对频数表的对数正态性进行检验。
结果:5个频数表的中位数发病时间比较一致,1个频数表的平均潜伏期出现负值,4个频数表的平均潜伏期相差最高达3.729h,估计暴露时间相差最高达3.5h;4个频数表服从或近似对数正态分布,1个频数表明显不服从对数正态分布(P=0.009)。
结论:发病时间频数表的选择应综合考虑频数表的分布特点和平均潜伏期与暴露时间的估计值。
关键词发病时间;暴露时间;平均潜伏期;频数分布中图分类号R181.21/195.1文献标识码A文章编号1004-0188(2009)03-0288-03Invest i ga ti on of role of frequen cy tab le abou t on set tim e i n e stimat i ng expos u re timeX U Ru-fu,L I Ya-fe,i X IONG H ong-yan,X U B i n Depart m ent ofM ilit ary E pide m iol ogy,M ilit ary P reventi veM ed ical Co ll ege,Th i rd M ilit ary M ed i calUn i versit y,C hongq i ng,400038,C h i na.Ab stract Ob jec ti ve:To explore t h e rol e of f requency t able abou t onset ti m e i n es ti m ati ng expos u re ti m e.M ethod s:F i ve frequen cy tab l es abou t on s et ti m e w ere s ummariz ed accord i ng to d i ff eren t i n itiati on ti m e and grouping i nterva l by us i ng a teac h i ng dat a of ali m en tary tox i cosis exa mp le.A verage i ncubati on peri od and exposure ti m e w ere es ti m ated and l ogarit hm d i s tri buti on w ere tested separatel y accord i ng t o t hese five tab l es.R esults:The m ed i an of onset ti m ew ere qu i te s i m ilar i n five frequency t ables.A verage i n cubati on peri od w as negative val u e i n a tab l e.The longest phas e contrast of average i ncubati on period and esti m at ed exposure ti m ew ere3.729h and3.5h,respecti vel y,i n fou r frequency tables.Four frequ ency tab l es w ere approxi m atel y l ognor m al d istri buti on and t h e ot h er w as not(P=0.009).Conclusion:D i stri bu tion charact eristic of frequ ency tab l e and esti m ated val u e of average i n cubati on peri od and exposure ti m e s hould be cons i dered overallwh en sel ecti ng su i tab le frequ ency tal e to esti m ate expos u re ti m e.K ey w ords:onset ti m e;expos u re ti m e;average i ncubati on peri od;frequen cy d i stribu ti on疾病暴发调查中常常需要估计危险因素的暴露时间,以便寻找可疑危险因素,查明病因。
暴露时间的估计一般根据病例的发病时间,先编制发病时间的频数表,绘制发病时间分布曲线(流行曲线),计算平均潜伏期。
在教学实习资料分析中,我们发现编制频数表时,取不同的起点和组距,其平均潜伏期和暴露时间差异较大,有的结果较难解释。
1资料与方法1.1资料来源某年7月9日21时起至10日止,某单位159人中,出现腹泻、腹痛、里急后重不明显的病人71例,其中57例的发病时间见表1,最早的为7月9日21B00,最晚的为7月10日15B40112。
为了查明病因,找出危险因素,需要估计暴露时间。
表1某单位57例腹泻、腹痛病人的发病时间9日21B0022B0022B0023B0023B0010日0B300B300B300B301B001B001B001B001B001B001B001B302B00 2B002B002B002B002B002B002B002B202B302B303B003B003B00 3B304B004B004B004B004B004B004B005B005B005B005B005B00 5B005B305B305B305B406B006B307B007B008B0010B0010B0015B401.2方法根据患者的发病时间,分别以20B00、20B30、21B00为起点,组距取1h和2h,编制5个患者发病时间频数表,计算平均潜伏期和估计暴露时间,并对频数表的对数正态性进行检验。
平均潜伏期和估计暴露时间用公式(1)、(2)推算12,32,用频数表各组段的组中值取自然对数或常用对数,计算偏度系数和峰度系数作正态性检验142。
平均潜伏期=(m0-m1)(m2-m0)(m0-m1)-(m2-m0)(1)估计暴露时间=m0-平均潜伏期(2)g1=n E f(x-x)3(n-1)(n-2)[f(x-x)2/(n-1)]3/2(3)g2=n(n+1)E f(x-x)4(n-1)(n-2)(n-3)[E f(x-x)2/(n-1)]2-3(n-1)2(n-2)(n-3)(4)u1=g1s g1s g1=6n(n-1)(n-2)(n+1)(n+3)(5)u2=g2s g2s g2=24n(n-1)2(n-3)(n-2)(n+3)(n+5)(6)式中m0、m1、m2分别为发生50%、16%和84%病人数的发病时间,g1和g2分别为频数表的偏度系数和峰度系数,u1、u2分别为偏度系数和峰度系数的正态性检验统计量,x和f分别为频数表各组段的组中值和频数,x为各频数表的平均数,n为样本数(n=E f)。
2结果2.1平均潜伏期和暴露时间患者发病时间的5个频数表(频数表A、B、C、D、E)的50%、16%和84%病人数的发病时间、平均潜伏期和估计暴露时间见表2。
50%病人数的发病时间(中位数发病时间)大致都在10日3B00~3B30,但估计的平均潜伏期和估计暴露时间不一致。
频数表A的平均潜伏期出现负值(-12.988h),频数表B、C、D、E的平均潜伏期分别为5.199h、5.373h、6.878h和8.928h,相差最高达3.729h,估计暴露时间分别为7月9日21B40、21B40、20B10和18B10,相差最高达3.5h。
用原始数据直接计算的平均潜伏期为8.208h,估计暴露时间为18B50。
经流行病学调查,实际暴露时间为18B10(该单位晚餐就餐时间)112。
频数表E的估计暴露时间为18B10,说明危险因素很可能与晚餐有关。
频数表B、C、D的估计暴露时间分别为21B40、21B40和20B10,说明危险因素很可能是餐后的其他因素。
从以上暴露时间的估计结果来看,频数表E与实际情况一致,估计最准确;频数表D的估计暴露时间与实际情况相差2.0h,频数表B和频数表C的估计暴露时间与实际情况相差3.5h,频数表A平均潜伏期出现负值。
文献1给出的参考答案是以21B00为起点、组距2h的频数表112。
表2各频数表的估计暴露时间频数表A频数表B频数表C频数表D频数表E原始数据频数表的起点(h B m)20B0020B3021B0020B3021B00频数表的组距(h)2221116%发病时间(h)24.68724.89225.01324.87525.01525.009 50%发病时间(h)27.53326.88527.09127.00027.12527.083 84%发病时间(h)29.86830.11530.48030.07629.88829.860平均潜伏期(h)-12.9885.1995.3736.8788.9288.208估计暴露时间(h B m)21B4021B4020B1018B1018B50估计暴露时间-实际暴露时间(h)3.53.52.00.00.72.2正态性检验为了正确评价各个频数表的结果,按照潜伏期较短疾病的点源暴发流行曲线一般呈对数正态分布的特点。
将频数表各组段的组中值取自然对数,对各频数表做正态性检验,结果见表3。
5个频数表的偏度系数的检验统计量u1在1.339~ 1.662之间,均为对数对称分布(P>0.05)。
频数表C 的峰度系数检验为对数正态峰(峰度系数的检验统计量u2=1.956,P=0.051),其余频数表为对数非正态峰,其中频数表B明显为对数非正态峰(P=0.009),而频数表A、D、E的峰度系数的检验统计量略大于1.960(2.008~2.124),比较接近对数正态峰。
结合偏度系数和峰度系数,频数表C为服从对数正态分布,其余频数表不服从对数正态分布,但频数表A、D 和E比较接近对数正态分布。
原始数据直接取自然对数做正态性检验,结果不服从对数正态分布(u1= 1.709,P=0.087,u2=2.509,P=0.012)。