样本量计算(Epiinfo2002流行病学分析软件的应用讲座补充资料)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

应用Epi info2002流行病学分析软件
进行样本量的计算
(“Epi info2002流行病学分析软件应用讲座”补充资料,主讲人:李海闽) (一)关于Epi info2002计算样本量涉及的几个概念
1、把握度
又称检验效能(power of test),是用数量描述的事物现象之间如果确定有一个真正的差别存在,能被显著性检验所检出的概率。

数理统计学用β表示II型错误的概率,1-β称为把握度。

做研究设计时,如果要求检出差别显著性的把握度越大,则要求样本含量也越多。

2、置信水平
置信水平(confidence level)是置信度的互补概率。

例如95%置信度,其置信水平为0.05;99%置信度,其置信水平为0.01。

一般情况α取0.05,则置信度为95%(1-α=0.95)。

3假设检验的两类错误
由于假设检验是根据有限的样本信息对总体作推断,不论做出哪一种推断结论,都有可能发生错误。

这就是假设检验的两类错误。

如果实际情况与H0不一致,检验结论为拒绝H0,接受H1, ;或者实际情况与H0一致,检验结论为接受H0;这两种推断结论都是正确的。

如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0,导致推断结论错误。

这样的错误称为第I类错误。

如果实际情况与H0不一致,也仅仅是抽样的原因使得统计量的观察值落到接受域,不能拒绝原本错误的H0,则导致了另一种推断错误。

这样的错误称为第II类错误。

表6-3 归纳了假设检验中两种实际情况和不同检验结论的关系。

犯第 I 类错误的概率用α来控制,其大小与检验水准相同。

根据研究者的需要。

常取为0.05 或0.01 等。

当α取为0.05 时,其意义是:如果原假设H0 成立,按照同样的方法在原假设H0 规定的总体中重复抽样,那么在每100 次检验结论中平均可以有5 次拒绝H0 (犯第I类错误)。

犯第II类错误的概率用β来控制。

因为H0 不成立时检验统计量的精确分布往往难以确定,所以在多数情况下准确估计β的数值比较困难。

β的意义是:如果H0 并不成立,即所研究的总体与H0有实质差异(例如μ1≠μ2) ,按照同样的方法在总体中重复抽样,那么在每 100 次检验结论中平均可以有 100 β次接受H0(犯第II类错误)。

从图6-3 可以看出,对于某一具体的检验来说,当样本容量n一定时,α越小β越大;α越大β越小。

在实际应用中,往往通过α去控制β。

在样本量确定时,如果要减小β,就把α取大一些。

更祥细的内容请阅读《卫生统计学(第五版)》第六章,第四节至第五节。

(二)关于Epi info2002软件“工具”计算样本量
1、点击软件“工具”栏,“常用流行病学计算”
图例:打开“常用流行病学计算“
2、选择相应调查设计
用上下左右移动键,移动光标至 样本量和把握度(sample size & power) 并回车,出现下级菜单,分别为人口调查( population survey ) ,队列研究和横断面调查(cohort or cross sectional )和非匹配的病例对照研究(unmatched
case-control )移动光标可以进入相应调查设计。

3、人口调查样本量的计算
移动光标至population survey并回车可估算人口调查的样本量,依次填入目标人群数量,实际率和容许与实际率的误差范围,就可按[F4]键计算样本量。

结果中包含不同置信度的样本例数。

例如,某调查项目,目标人群(Size of population from which the sample will be selected)为1000000,研究因素的实际率为(Expected frequency of the factor under study (err toward 50%))5%,容许与实际率的误差范围(Worst acceptable result)为2%,现需要计算实际需要调查多少人。

计算过程如下图:
图例:定制计算人口调查样本量的参数
在整个过程中,我们都可以通过回车反复修改人口等三个参数,以达到我们的目的。

图例:人口样本量计算结果
按[F4]键计算样本量。

窗口显示结果中包含了人口规模(Population Size)、期望率(Expected Frequency)、容许率(Worst Acceptable)、不同置信度(Confidence level的样本量(Sample Size)。

4、队列研究和横断面样本量的计算
移动光标至 cohort or cross Sectional 并回车可估算队列研究和横断面调查的样本量,依次填入:
1、置信度(Confidence level or 1-α);
2、把握度((Power or 1-β);
3、非暴露与暴露两组的比例((Number of Unexposed : Number of Exposed);
4、非暴露组的暴露期望频率(Expected frequency of disease in unexposed group);
5、RR 值(Rise ratio(RR)or relative risk);
6、OR 值(Odds ratio(OR));
7、暴露组的暴露期望频率(Percent disease among exposed)。

参数5-7只要填入其中1个,系统就会自动计算另外2个。

按回车鍵,再按[F4] 键计
算样本量。

结果中包含不同置信度和把握度的样本例数。

同样的,在整个过程中,我们都可以通过回车反复修改上述几个参数,以达到我们的目的。

例如:用队列研究观察放射线暴露与白血病的关系。

已知一般人群白血病发病率为0.0001 ,有放射线暴露的人白血病发病率为0.001 。

如果研究者将α定为0.05 (双侧检验),β=0.1,其样本大小计算如下:
1、录入上述参数1-7:
图例:定制计算队例研究或横断面调查的样本量参数
按回车键,按击F4计算样本量:
图例:队例研究样本量计算结果
以上窗口分别显示了:不同的置信度(Conf)、把握度(Powe)、非暴露(Unex)与暴露(Exp)两组的比例、暴露组的暴露期望频率(disease in exposed)、RR 值(Rise ratio)、OR 值(Odds ratio)以及在以上参数水平下各样本量(Sample Size)即:非暴露(Unexp)与暴露(Exposed)组及合计(Total)的样本量。

在整个过程中,我们都可以根据需要,通过反复修改上述参数,按F4重新计算。

Change values for inputs as desired,then press F4 to recalculate 。

5、非匹配的病例对照样本量的计算
移动光标至 unmatched case-control并回车
移动光标至 cohort or cross Sectional 并回车可估算队列研究和横断面调查的样本量,依次填入:
1、置信度(Confidence level or 1-α);
2、把握度((Power or 1-β);
3、非病例(对照)组与病例两组的比例(#NOT ILL/#ILL);
4、非病例(对照)组的期望发病率(或期望暴露率)(Expected frequency of exposure in NOT ILL group);
5、OR 值(Odds ratio(OR));
6、病例组的的期望发病率(或期望暴露率)(Percent exposure among ILL group)。

参数5-6只要填入其中1个,系统就会自动计算另外1个。

按回车鍵,再按[F4] 键计算样本量。

同样,在整个过程中,我们都可以通过回车反复修改上个参数,以达到我们的目的。

例如:
拟进行一项病例对照研究,研究吸烟与肺癌的关系。

预期吸烟者的相对危险度为 2.0 ,人群吸烟率约为20%,设α=0.05(双侧,β=0.10 ,估计样本含量。

1、设置参数1-6
图例:定制计算病例对照研究的样本量参数
按回车键,再按F4键计算样本量:
图例:病例对照研究样本量计算结果
以上窗口分别显示了:不同的置信度(Conf)、把握度(Powe)、非病例或对照(Not ILL)与病例(ILL)两组的比例、病例组的期望发病(暴露)率(Exposure in ILL)、OR 值(Odds Ratio)以及在以上参数水平下各组样本量即:非病例或对照(Not ILL)与病例(ILL)组及合计(Total)的样本量。

同样,在整个过程中,我们都可以根据需要,通过反复修改上述参数,按F4重
新计算。

Change values for inputs as desired,then press F4 to recalculate 。

相关文档
最新文档