样本含量的估计(流行病学应用)
样本量计算(Epiinfo2002流行病学分析软件的应用讲座补充资料)
应用Epi info2002流行病学分析软件进行样本量的计算(“Epi info2002流行病学分析软件应用讲座”补充资料,主讲人:李海闽) (一)关于Epi info2002计算样本量涉及的几个概念1、把握度又称检验效能(power of test),是用数量描述的事物现象之间如果确定有一个真正的差别存在,能被显著性检验所检出的概率。
数理统计学用β表示II型错误的概率,1-β称为把握度。
做研究设计时,如果要求检出差别显著性的把握度越大,则要求样本含量也越多。
2、置信水平置信水平(confidence level)是置信度的互补概率。
例如95%置信度,其置信水平为0.05;99%置信度,其置信水平为0.01。
一般情况α取0.05,则置信度为95%(1-α=0.95)。
3假设检验的两类错误由于假设检验是根据有限的样本信息对总体作推断,不论做出哪一种推断结论,都有可能发生错误。
这就是假设检验的两类错误。
如果实际情况与H0不一致,检验结论为拒绝H0,接受H1, ;或者实际情况与H0一致,检验结论为接受H0;这两种推断结论都是正确的。
如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0,导致推断结论错误。
这样的错误称为第I类错误。
如果实际情况与H0不一致,也仅仅是抽样的原因使得统计量的观察值落到接受域,不能拒绝原本错误的H0,则导致了另一种推断错误。
这样的错误称为第II类错误。
表6-3 归纳了假设检验中两种实际情况和不同检验结论的关系。
犯第 I 类错误的概率用α来控制,其大小与检验水准相同。
根据研究者的需要。
常取为0.05 或0.01 等。
当α取为0.05 时,其意义是:如果原假设H0 成立,按照同样的方法在原假设H0 规定的总体中重复抽样,那么在每100 次检验结论中平均可以有5 次拒绝H0 (犯第I类错误)。
犯第II类错误的概率用β来控制。
因为H0 不成立时检验统计量的精确分布往往难以确定,所以在多数情况下准确估计β的数值比较困难。
常用流行病学研究方法
医学
哲学
流行病学 研究方法
数学
预防医学第5版
20世纪中期开始,为适应多病因论的需求,在统计学的 帮助下,流行病学群体研究方法又有了突飞猛进的发展。 混杂因子、效应修饰因子的处理技术不断完善,解决了 在多个病因存在的条件下生物现象的或然性问题及巧合 现象,因果判断的能力进一步加强。 如今,流行病学的群体研究方法已被医学各领域广泛应 用,成为医学各学科不可或缺的研究方法。
预防医学第5版
二、现况研究
(一)现况研究的概念:
现况研究是在某一人群中,应用普查或抽样 调查的方法收集特定时间内、特定人群中疾 病、健康状况及有关因素的资料,并对资料 的分布状况、疾病与因素的关系研究所获得的资料是在某一时间横断面上收集的,故又称横 断面研究(cross sectional study)。
预防医学第5版
二、现况研究
(三)现况研究的种类:
1.普查:
普查(census)就是对总体中所有个体均进行 调查。现况研究中普查的含义为:在特定时间
对特定范围内人群中的每一成员进行的调查。
普查分为以了解人群中某病的患病率、健康状况等为目的的普查和以 早期发现病人为目的的筛检(screening)。 工作目的是早发现早诊断病人,使其得到及时治疗时,必须采用普查。
预防医学第5版
一、概述
(二)描述性资料的来源: 现况研究
专门设计的调查研究 生态学研究 个案调查 爆发调查
死亡报告 出生登记 常规记录资料 出生缺陷监测 药物不良反应监测 疾病监测等资料
预防医学第5版
一、概述
(三)描述流行病学的用途: 描述流行病学可以回答所描述的事件存在于什么时间、什么
地点和哪些人群中,数量是多少。对这些问题的回答可以: 为病因研究提供线索。 掌握疾病和病因的分布状况,为疾病防制工作提供依据。 用来评价防制策略和措施的效果。
流行病学方法—筛查试验
➢
由金标准证实未患研究疾病的非病例组:代表未患研究疾病的全体,与
病例组有好的可比性。
(三)确定样本含量:
公式如下:
=
2 ×(1−)
2
式中:α为一类错误的概率;
μ α为α对应的u值;
δ为容许误差;
P为灵敏度或特异度的估计值。
(四)确定截断值:
即确定试验阳性与阴性的界值
确定方法
✓
ҧ ± 2s
N
灵敏度:筛检试验阳性者占受检
病人总数的百分比,是指将实际
有病的人正确地判断为患者的能
力。
假阴性率:又称漏诊率,是指实
际有病者而被判定为非病者的百
分比。
特异度:是指将实际无病的人正
确地判断为非患者的能力。
假阳性率:又称误诊率,是指实
际无病者而被判定为有病的百分
比。
约登指数:又称正确指数,是灵敏度和特异度之和减去1。约登
✓
百分位数法
✓
基于防治实际确定
(一)评价指标
真实性(validity):有效性,准确性(accuracy)。是指筛检试验测量值与
实际情况的符合程度,是正确地判定有病与无病的能力。
表11-8 评价资料整理表
金标准
试验
患者
非患者
合计
阳性
a真阳性
b假阳性
a+b
阴性
c假阴性
d真阴性
c+d
合计
a+c
b+d
度均高
便于判断筛检
效果
有早期可识别
的症状体征
有确诊条件和
治疗方法
疾病自然史
考虑经费
临床研究中样本量的估计方法
(完整版)第18章样本含量的估计
无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。
抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。
这就是样本含量估计(estimation of sample size)。
本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。
第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。
因此,尽量减小抽样误差是提高统计推断精度的必然要求。
在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。
同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。
但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。
比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。
由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。
同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。
(完整版)第18章样本含量的估计
第十八章样本含量估计无论是调查研究还是实验性研究,医学研究大都是抽样研究,最终目的在于利用实际观测得到的样本信息推断未知的总体特征,即统计推断。
抽样研究设计时需要回答一个非常关键的问题:样本中包含多少个研究对象(人、动物、生物学材料等)才能既满足统计学要求,完成有效的统计推断,又照顾研究的可行性、伦理学等实际问题,从而最大限度控制研究成本和研究风险,提高研究效率。
这就是样本含量估计(estimation of sample size)。
本章将从统计推断的目的出发,介绍样本含量估计意义及常用的计算公式,并在此基础上介绍检验效能的估计(power analysis)。
第一节样本含量估计的意义及方法一、样本含量估计的意义由于抽样研究中抽样误差不可避免,样本统计量与其所对应的总体参数间总是存在一定差异。
因此,尽量减小抽样误差是提高统计推断精度的必然要求。
在总体变异性确定的条件下,样本中所含的研究对象数越多,抽样误差必然越小,样本统计量的稳定性肯定越高,总体参数的估计精度越好,假设检验中的检验效能(power=1- )亦会越高,从而避免出现假阴性的结论。
同时在实验性研究中,只有在研究对象数量足够大时才能使随机分组更加有效,从而保证组间均衡性。
但在实际研究中,除了要考虑抽样误差外,还需考虑研究的可行性、结论的时效性、医学伦理以及非随机误差的影响等实际问题,并非研究对象数越多越好。
比如在改良肩周炎贴膏临床试验中,如果片面地追求大样本,研究中所需的人力、物力、财力等物质支持必然增大,研究的可行性下降。
由于需纳入更多病例,可能会延长产品研发周期,影响新药投产上市;若增加医院或临床实验中心参与该研究,又增加了组织协调的工作量和工作难度。
同时增加各种混杂、偏倚发生的机会,比如由于肩周炎发病、预后与季节、气候密切相关,临床病例接收时间太长,组内病例同质性差;测量仪器增多导致测量误差增大,观察疗效的医院、医生增多,研究结果的一致性降低等现实问题,使得试验结果难于分析或者难以合理解释,影响研究结论的科学性。
样本含量估计及等效性检验
取α=0.05,β=0.1,将各组的 i的估计值: 2.79、4.01、3.84,及 i :0.26、0.27、1.11代 入公式,计算 i / k = (2.79+4.01+3.84) /3 = 3.55,查表α=0.05,β=0.1,ν1= 3 - 1 = 2,ν2= ∞,查表得 = 2.52 ,代入公式:
2 2 n i / k / i /( k 1) i 1 i 1
2 k k
将有关数据代入公式:
(0.26 0.27 1.11 ) 3 2.52 [ ] 2 2 2 ((2.79 3.55) (4.01 3.55) (3.84 3.55) ) / 2) 7
n
2 12.65 (2 sin
1
0.548 2 sin
1
0.149)
2
33
注:本公式采用三角函数的弧度计算
完全随机设计 多个率样本比较样本含量的估计 公式(二)
n 1641.6 (sin
1
max
1 2 sin min )
注意本公式采用三角函数的角度计算
将数据代入公式(二)
2.等效检验条件: (1).必须Λ>δ(δ为两样本率差 值); (2).应先作一般u检验,当P>α 时,再进行等效检验。
三、计数资料两样本率比较:
两样本率比较的等效性检验 可用u检验。
计数资料的等效性检验(公式):
u=(Λ-|P1-P2|)/Sp
SP = uc=(Λ-|P1-P2|-(1/n1-1/n2)/2)/Sp (此式为校正公式)
式中Λ为等效差值, P1、 P2 为两样本率,Sp为两 样本率合并标准误。
样本含量的计算
15
计算机模拟举例1
• 假设: • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=50 • -显著性水平为双侧0.05 • -检验方法=卡方检验
7
按试验类型
• 估计总体 • 样本与总体比较 • 配对资料 • 两样本比较 • 多样本比较
主要变量的性质
• 分类变量 • 数值变量
• 一般情况下,分类变量所需要的样本量多于数值变 量
9
按结局指标
•计数 定性 指标 死亡与存活, 阳性与阴性, 正常与异常
•计量 定量 指标 血压、血糖、血清酶
•结局指标有多个时,估计样本含量时需要选择其中 最重要的结局指标,或按照所需样本量最多的指标,
当k=1时两组样本含量相等,
24
• 例4:某一项研究吲达帕胺治疗原发性高血压的治疗, 经预试验得治疗前后舒压差值 mmHg 资料如下 与安慰 剂比较,两药治疗前后差异均有统计学差异 ,当 α=0.05,β=0.10时需要治疗多少例可以认为吲达帕胺 有效
z z n
211/k
2
2
s s 2(2k2 )/1 ( 1/k)
p(p1p22p)/2
本设计至少需要观察235例
30
2.2.4 两样本率比较
• 例8:某医师研究某药对产后宫缩痛、外阴创伤痛 效果,预试验旧药镇痛率为55%,新药镇痛率为75%, 当α=0.05,β=0.1时需要观察多少例能说明新药镇 痛效果优于旧药
N zz2 p1e 1p/ ck2p(1p)p
医学研究中样本量的估计
n
(u
u )2
2
(3)样本均数与总体均数比 较的样本量估计
COMPUTE n=((1.96 + 1.282) *3/ 1.5 ) **2. EXECUTE.
樱桃.gif
n=43
(4)完全随机设计两样本含量相 等时均数比较的样本量估计
例题4:某药厂对新研发的降压中成药与标准降压药的疗效比较。已知
2 2
) )
(11)两样本相关系数比较的样本量估计
COMPUTE n=8 * ((1.645 + 1.282) / (LN(((1 + 0.90)*(1-0.80)) /((1 0.90)*(1+0.80))))) ** 2 + 3.
EXECUTE.
樱桃.gif
(12)不配对病例-对照研究设计 (病例数与对照数相等时的样本含量)
EXECUTE.
(8)完全随机设计两样本率比较的样本含 量估计(当两样本量相等时)
例题8:拟研究新研制的抗菌药物对某感染性疾病的治疗效果。经预 试验,试验药有效率为80%,对照药有效率为60%。问正式临床试验每组需 要观察多少病例(假设采用双侧检验)?
单侧:n1 n2 u2
樱桃.gif
2
2 p(1 p) u2 p1 (1 p1 ) p2 (1 p2 )
n
(t
t
)sd
2
(6)配对设计两样本均数比 较的样本量估计
COMPUTE n=((1.96 + 1.645) * 25 / 15) ** 2. EXECUTE.
樱桃.gif
n=37
(7)完全随机设计多样本均数 比较的样本量估计
例题7:某中医院应用中西医结合治疗肺气虚、脾气虚、肾气虚慢性阻 塞性肺疾病(COPD)患者,并与单纯西药为对照组,观察中西医结合治疗 COPD患者不同中医证型的肺功能改善效果,根据查阅相关资料,肺气虚的 FVC(L)为2.44±0.32;脾气虚为樱2桃..g4if0±0.36;肾气虚为2.31±0.29;对 照组为2.51±0.32。问该项临床研究估计需要观察多少病例数?
8.《流行病学》(第9版)教学大纲(适用临床医学等专业)
《流行病学》教学大纲epidemiology一、课程说明课程编码 NN101412 课程总学时20(理论总学时20/实践总学0时)周学时(理论学时2/实践学时0)学分2课程性质限制性选修课适用专业临床医学、临床医学(专升本)、全科医学、眼视光(七年制)、眼视光学(专升本)专业1.教学内容与学时安排表2.课程教学目的与要求:流行病学是预防医学中的一门主导课程,也是医学各学科的方法学基础。
随着临床流行病学和循证医学等兴起,使得流行病学也日益成为临床医学重要的基础性学科。
本课程的教学目的主要是培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为临床专业学生学习预防医学及培养防治结合型人才奠定流行病学理论基础,也为今后在临床实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。
本课程教学要求是根据教学大纲的要求,重点讲解基本理论和基本知识,同时注意传授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。
内容精练,条理清楚,合理使用教学设备和教具。
并根据本章节的特点,结合课时安排规定学生必要的自学内容。
3、本门课程与其它课程关系:临床医学各学科中,凡涉及专业问题的调查设计、资料的获取和数据资料的分析及其解释,都要以流行病学方法为基础。
流行病学应用广泛,涉及面宽,几乎涉及社会科学、自然科学和医学科学的各主要学科。
流行病学是伴随卫生统计学、微生物学和免疫学以及传染病学发展起来。
现在除基础医学和临床医学外,流行病学与社会医学、心理学及一系列预防医学学科,包括卫生管理学也建立了密切的联系。
在非传染病研究上与病理学、生化学、遗传学、分子生物学、临床医学相应各科及预防医学有关学科关系密切。
研究健康流行病学与生理学、生化学、医学心理学、社会医学等有关。
4、推荐教材及参考书:1.李立民主编.《流行病学》(第四版).北京:人民卫生出版社,19992.曾光主编.现代流行病学方法与应用.北京:北京医科大学中国协和医科大学联合出版,19943.谭红专主编.现代流行病学.北京:人民卫生出版社,20014.赵忠堂主编.流行病学研究方法与应用.北京:科学出版社,20005.林果为,沈福民主编.现代临床流行病学.上海:上海医科大学出版社,20006.王家良主编.临床流行病学.北京:人民卫生出版社,20007.MacMahon B, Trichopoulos D. Epidemiology-Principles and Methods, Second edition.Boston, New York, Toronto and London: Little, Brown and Company,19968.施侣元主编,《流行病学》,人民卫生出版社,20039.谭红专主编,《现代流行病学》,人民卫生出版社,200810.叶临湘主编,《现场流行病学》,人民卫生出版社,200911. 王建华主编,《流行病学》,人民卫生出版社, 200812.王建华主编,《流行病学》,人民卫生出版社, 201313.沈洪兵主编,《流行病学》,人民卫生出版社, 20185、课程考核方法与要求:本课程考核方法采用期末闭卷考试方式进行。
流行病学名词解释
流行病学名词解释流行病学(Epidemiology)是研究疾病及健康有关状态在人群中发生、发展的原因和分布的规律,以及制定预防、控制和消灭这些疾病及促进健康的对策与措施,并评价其效果的科学。
疾病分布(distribution of disease):通过观察疾病在人群中的发生、发展和消退,描述疾病不同时间、不同地区和不同人群中的频率与分布的现象。
发病率 (incidence rate):是一定时期内,特定人群中发生某病新发病例的频率。
新发病例数:指观察时间内新发生的某病的病人数暴露人口数:必须符合两个条件:必须是观察时间内观察地区内的人群,必须有患所要观察的疾病的可能罹患率 (attack rate):量新发病例频率的指标,通常指在某一局限范围内,短时间内的发病率患病率 (prevalence rate):又称现患率或流行率,指某特定时间内总人口中某病新旧病例所占的比例。
时点患病率(point prevalence):指群体中个体在某时点为病例的概率期间患病率(period prevalence): 是群体中个体在给定期间内任一时点为病例的概率。
死亡率 (mortality rate):指某人群在一定时期内总死亡人数与该人群同期平均人口数之比。
死亡专率按不同特征,如年龄、性别、职业、民族、种族、婚姻状况、病因等分别计算的死亡率。
分母必须是与分子相对应的人口病死率(fatality rate):指一定时间内,患某病的病人中因该病而死亡者的比值存活率(survival rate)散发 (sporadic):指某病发病人数不多,病例间无明显的相互传播关系,或在一定地区的发病率呈历年一般水平。
适用于范围较大的地区。
流行 (epidemic):指某地区某病发病率显著超过历年的散发发病率水平。
大流行 (pandemic):指某疾病的发病蔓延迅速,涉及地域广,人口比例大,在短时间内可以越过省界国界甚至洲界形成世界性流行。
分析流行病学方法
例 号
病 例
四个 对照 平均
病例
对照
病例 对照 病例 对照 病例 对照
1
25
32
有
2/4
否
0/4
有
1/4
有
0/4
2
30
30
有
3/4
否
0/4
有
1/4
有
0/4
3
22
31
有
1/4
有
0/4
否
1/4
有
0/4
4
33
30
有
3/4
有
0/4
有
0/4
有
0/4
5
22
27
有
3/4
否
1/4
否
1/4
否
0/4
6
21
29
有
3/4
有
2.成组匹配(frequency matching)
01
亦称群体匹配、频数匹 配,即要求某种或某些 因素(匹配因素)在对 照组与病例组总的分布 相同。
02
如病例组中男性的比例 为50%,则选择对照中, 男性的比例也为50%。
01
如果所研究的是罕见病,或所 能获得的合格病例数很少,则 采用个体匹配的设计方法;
2.对照的来源
自然人群:从产生病例的自然人
A
群中选择,或选取病例的邻居、
亲属、同事或配偶作为对照等。
B
医院对照:选取与病例同一医院 的其他疾病患者
(三)样本含量的估计
所允许犯假阳性错误 的概率α;
所希望达到的检验把 握度(1-β);
病例组的暴露率 (P1 )和对照组暴 露(P0 );
抽样及样本含量估计
11 0.358031 7 0.297145 6 0.251854 3 0.009253
样本估计和总体参数
对于简单随机抽样,可以用样本均数来估计总 体均数
简单随机抽样的特点
优点: (1)比较容易理解和掌握;(2)抽样框不需要其他辅
以95%的可信度,估计有效成分含量的均值在真值的 10%范围内,需要多大的样本?
222=277.56≈278 22/(2.25*10%)2=54.38≈55
简单随机抽样样本量估计是其他概率抽样方法样本 量估计的基础
其他概率抽样样本量估计可以用简单随机抽样样本 量乘以设计效应deff
如多阶段抽样deff范围约在1.3~3之间
简单随机抽样样本量估计(总体参数 为均数)
2
2
u n
/2 2
2: 总 体 的 方 差 , 根 据 预 试 验 估 计
= x
当用相对容许误差 ( 与 总 体 均 数 相 差 不 超 过 真 值 的 (% ) ) 表 示 时 , 则 =
举例:抽样调查时估计总体均数时
以α=0.05,估计有效成分含量的均值在真值的± 0.10范 围内,需要调查多少样本?
抽样框中应该有抽样单元名称和地理位置的信息,以便 研究人员能找到被选中的单元.
好的抽样框不仅与目标总体保持一致,而且还尽可能的 提供与研究的目标量有关的辅助信息。
年龄、性别等
举例:
居委会住户名单
抽样的类型
概率抽样 按一定的概率以随机原则抽取样本 概率抽样中抽样框是关键 抽中的概率已知 当用样本对总体目标进行估计时,要考虑到该样本被抽中 的概率 “概率抽样”不等于“等概率抽样”
样本含量的估算(共55页)
2
75
简 历
返回总目录
返回章目录
结束 第14页
统计学讲座 样本含量的估算
5、两样本率的检验
公式(5)为:
( z (1 )( Q Q ) z (1 ) / Q (1 ) / Q c 1 1 1 2 2 2 N c 1 2
1 1 1 2 2
(5)
式中:
c Q11 Q2 2
返回总目录 返回章目录 结束 第15页
简 历
统计学讲座 样本含量的估算
【例5】两样本率的检验
【例5】研究针炙配合心理疗法治疗失眠的效果。预试验中, 针炙和心理联合治疗的有效率为94%,单纯应用针炙治疗的 有效率为85%。若取双侧α=0.05,则z0.05=1.96,β取单侧 0.10,Z0.1=1.282,则检验功效为0.9。若联合治疗的样本 含量占60%(Q1),单纯治疗的样本含量占40%(Q2),则两 组样本含量各为多少? 计算:
简 历
返回总目录
返回章目录
结束 第5页
统计学讲座 样本含量的估算
(二)样本含量估算的方法
样本含量估算的公式:往往是通过假设检验的公式反推而得到。 1、单样本均数的检验或配对样本均数的检验:公式为
( z z ) N
2
(1)
单侧或双侧检验:取决于α的取值。如双侧,单侧。
2
(1.96 0.904(1 0.904)(0.601 0.401 ) 1.282 0.94(1 0.94) / 0.60 0.85(1 0.85) / 0.40 0.94 0.85 495
2
联合治疗组:n1=0.60×495=297 单纯组:n2=0.40×495=198
流行病学复习资料
流行病学复习资料一、绪论1、流行病学:流行病学是研究人群中疾病与健康状况的分布及其影响因素,并研究防治疾病及促进健康的策略和措施的科学。
2、流行病学研究的三个层次:疾病、伤害和健康。
疾病包括:传染病、寄生虫病和非传染病等一切疾病。
伤害包括意外、残疾、弱智和身心伤害。
健康状态包括身体生理生化的各种功能状态、疾病前状态和长寿。
◆流行病学研究的任务和三个范畴:(1)“揭示现象”,由描述性流行病学来完成。
仅提供深入讨论原因的基础,但可对现象作初步分析。
(2)“找出原因”需借助分析流行病学的工作来完成,来检验或验证所提出的疾病线索。
(3)以找到原因为基础而“提供措施”,并进一步确证措施的有效性,这要用人群流行病学实验,即实验流行病学的工作来完成。
◆流行病学研究的三种基本方法:观察法、数理法、实验法。
◆流行病学的原理:①疾病与健康在人群中分布的原理,其中包括疾病的流行现象②疾病的发展过程,其中涵盖了机体的感染过程和疾病的流行过程③人与环境的关系,即疾病的生态学④病因推断原则⑤疾病防治的原则和策略⑥疾病防治的原则和策略,其中包括:疾病的三级预防,疾病发展的数学模型等。
◆流行病学的实际应用:①疾病预防和健康促进②疾病的监测③疾病病因和危险因素的研究④疾病的自然史⑤疾病预防的效果3、流行病学的特征:(1)群体特征(2)以分布为起点的特征(3)对比的特征(4)概率论和数理统计的特征(5)社会医学的特征(6)预防为主的特征二、疾病的分布1、疾病测量指标:◆发病指标:①发病率:表示在一定期间内(1年),一定人群中某病新病例出现的例数。
发病率=(一定期间内某人群中某病新病例例数/同期人口暴露数)×K(K=100%,1000‰,或10000/万)②罹患率:指在某一局限范围,短时间内的发病率。
它可以根据暴露来精确地测量发病几率③患病率:指某特定时间内的总人口中,患有某病(包括新旧病例)者所占的比例,也称现患率。
分为期间患病率和时点患病率(常用)。
临床医学科研常用流行病学研究方法
随机分组
研究对象 总体
研究对象 样 本
随机 化分 组
合格的研 究对象
施予
实 组
验干预
措施
对照组
有效 无效 有效
无效
剔除标淮 不符合本试验入选标淮者;观察期间同时接受其他化痰药物治疗者;不能坚持按计划完成试验或出现 明显不良反应而中断治疗者,后者不参加疗效统计但列入不良反应统计。
例 赖诺普利治疗原发性高血压的临床疗效观察
120例轻、中度原发性高血压患者进入随机双盲对 照试验,试验药赖诺普利与对照药依那普利各60例。
急性心肌梗死早期门冬氨酸钾镁治疗多中心随机对照试验
资料与方法 患者选择 入选标准:(1)发病24 h内的急性心肌梗死,包括Q波性和非Q波性心肌梗
死;(2)有或无心律失常和心力衰竭等并发症。 排除标准 (1)收缩压< 80 mm Hg ,二度二型房室传导阻滞,三度房
室传导阻滞,严重窦性心动过缓(心率< 50次/ min),若24 h以内恢 复者仍可入选;(2)血钾>55mmol/L;(3)肾功能不全(血肌酸> 20mg/dl。
04 前瞻性研究(追踪随访研究结果) 单击添加文本具体内容
四、研究对象的选择
纳入标准 研究对象具有代表性,在所选病人的年龄、性别、病型、病情方面要符合研究目的的要求; 所选研究对象对处理因素的反应较强烈,以利于实验容易取得预期的结果。在临床上,尽可
能选择新发病例作为研究对象,一些老病例及重症病人对药物的疗效反应可能较差; 在医学研究中,研究对象应是自愿参加试验并签署知情同意书者,以减少伦理道德问题。
医学科研设计样本含量估计
N
(z
z
)
2
两个样本均数比较
N
2
(z
z
)
2
第6版 流行病学电子版
人民卫生出版社
Sample size
• Two sample randomized parallel design
• 2-sided test • α = 0.05, 1-β = 90% • σ = 2hr • δ = 1 hr
暴露人群发病率P1 =1/千人
2
2 pq z p0q0 p1q1
p1 p0 2
显著性检验 α=0.05
(1.96 2 0.00055 0.99945 1.28 0.0001 0.9999 0.001 0.999)2
N
(0.001 0.0001)2
把握度(1-β=0.90)
影响样本含量估计的因素 —估计样本含量的先提条件
实验允许的第一类错误的概率[α] 提出所期望的检验效能 [1-β] 对实验精度的要求,即容许误差 [δ] 观察指标的变异程度,即标准差[σ]
参数获得途径 预试验 文献检索 专家意见
第6版 流行病学电子版
人民卫生出版社
单个样本均数和配对检验
第6版 流行病学电子版
c
2
人民卫生出版社
多个样本均数比较
k
S
2 i
k
N 2
i 1
k
( X i X )2 (k 1)
i 1
X i 和 S i 分别为第 i 个样本的均数和标准差的初估值,
k
X X i k , k 为组数。 值由 值表查得。 i 1
常用流行病学研究方法
(一)概述1.流行病学方法分类流行病学研究方法总体分为观察法:包括描述流行病学和分析流行病学;实验法,也称实验流行病学;数理法,也称理论流行病学。
2.流行病学研究设计的基本内容(1)查阅有关文献提出研究目的。
(2)根据研究Et的确定研究内容。
(3)结合具体条件选择研究方法。
(4)按照研究方法确定研究对象(要区别目标人群、源人群、研究对象之间的关系)。
(5)根据研究内容设计调查表格。
(6)控制研究过程,保证研究质量。
(7)理顺分析思路得出正确结论。
(二)描述流行病学1.描述流行病学概念描述流行病学(descriptive epidemiology)又称描述性研究。
它是将专门调查或常规记录所获得的资料,按照不同地区、不同时间和不同人群特征分组,以展示该人群中疾病或健康状况分布特点的一种观察性研究。
专门调查有:现况研究、生态学研究、个案调查以及暴发调查;常规记录有:死亡报告、出生登记、出生缺陷监测、药物不良反应监测和疾病监测等。
描述流行病学可以;①为病因研究提供线索;②掌握疾病和病因的分布状况,为疾病防制工作提供依据;③用来评价防制策略和措施的效果。
2.现况研究又称横断面研究或患病率研究,是描述性研究中应用最为广泛的一种方法。
它是在某一人群中。
应用普查或抽样调查的方法收集特定时间内、特定人群中疾病、健康状况及有关因素的资料,并对资料的分布状况、疾病与因素的关系加以描述。
所获得的描述性资料室在某一时点或一个短暂时间内收集到的,客观地反映了某时点人群健康、疾病的分布及其相关因素,因此现况调查的数据是一个人群的现状,是时间断面的数据。
现况调查的因素与结果是同时存在的,因此不能进行因果关系的推论。
对于慢性病,尤其是病程长的疾病最适合做现况调查。
根据研究目的,现况研究可以采用普查也可以采用抽样调查。
(1)普查(census):在特定时间对特定范围内人群中的每一成员进行的调查。
普查分为以了解人群中某病的患病率、健康状况等为目的的普查和以早期发现患者为目的的筛检。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
流行病学与卫生统计学教研室 戴江红
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例,随机分为2组 • 中药组(消瘤散剂)30例 • 西药组(米非司酮)30例 • 分别治疗6个月 –中药组有效率60% –西药组有效率50% –P>0.05
以率的变化作为终点指标计算样本量
α水平相 应的标准 正态差
N
[Z
2 p (1 p ) Z
p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05,β水平为0.05 ( 1-β=0.95) • Zα/2=1.96,Zβ=1.64 • p1=50%,p2=60% [1.96(2×0.55×0.45)1/2+1.64(0.5×0.5+0.6×0.4)1/2]2 N= =639例 (0.5 - 0.6) 2
计量资料 对照组血清胆固醇水平为215mg/dl,合理膳食可以使干 预组较对照组降低15mg/dl,已知从其他资料获得胆固醇标 准差为25mg/dl,规定=0.05(双侧),=0.05,计算各组 样本数?
N
2( Z a Z ) 2 2 d2
σ=25, d=15, Zα=1.96,Zβ=1.64 N=72 每组需要72例
N
[Z
2 p (1 p ) Z
p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05,β水平为0.1 • Zα/2=1.96,Zβ=1.28 • p1=50%,p2=80% [1.96(2×0.65×0.35)1/2+1.28(0.5×0.5+0.8×0.2)1/2]2 N= (0.5 - 0.8) 2 =50例
(p1+p2)/2
对照组 发生率
N
[ Z 2 p (1 p ) Z
p1 (1 p1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
为1-β水平相应 的标准正态差
试验组发生率
N:为计算所得一个组的样本大小
样本含量的确定与以下因素有关:
• 设计的类型 • 主要变量的性质 • 临床上认为有意义的差值 • 显著性水平α • 把握度1-β
病例分析(3)
• 实验室检查 – 尿: 潜血+ 白细胞胆红素葡萄糖++++ 酮体+ • 实验室检查 – 血液: 葡萄糖+++ 尿素氮++ 碳酸氢盐正常
病例分析(4)
• 女孩可能:І型糖尿病 • 她的父母向护理专家进行咨询 糖尿病的知识 胰岛素的自我给药 饮食控制 葡萄糖监测
N
[ Z 2 p (1 p ) Z
p1 (1 p1 ) p 2 (1 p 2 ) ]2
( p1 p 2 ) 2
• Zα/2=2.58,Zβ=1.64 p1=50%,p2=80% N =111例 如果随访过程可能10~20%的脱失 则最少每组应保证:111/0.90=124人 111/0.80=139人
N
[Z
2 p (1 p ) Z
p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05,β水平为0.1 ( 1-β=0.9 ) • Zα/2=1.96,Zβ=1.28 • p1=50%,p2=70%
[1.96(2×0.6×0.4)1/2+1.28(0.5×0.5+0.7×0.3)1/2]2 N= =124例 (0.5 - 0.7) 2
样本含量的确定与以下因素有关:
• 设计的类型(流行病学) • 观察性研究 • 实验性研究
样本含量的确定与以下因素有关:
• 主要变量的性质 • 分类变量 • 数值变量 • 计数资料所需的样本含量要大些 • 计量资料所需的样本含量可少些
样本含量的确定与以下因素有关:
• 临床上认为有意义的差值 • 对照组的发生率 • 实验组的发生率
练习: 用旧药治疗慢性肾炎的有效率为30%,现试验新药 疗效,新药的有效率必须达到50%才认为有推广价 值,问每组各需要多少例患者? 设α=0.05,β=0.10
查表:Zα/2=1.96,Zβ=1.28
计算:N=?
N
[ Z 2 p(1 p) Z p1 (1 p1 ) p2 (1 p2 ) ]2 ( p1 p2 )
病例分析(1)
• 一名活泼的13岁中学生向她的父母抱怨说: – 一周来总是口渴、尿频和疲劳
• 一家人去拜见他们的家庭儿科医生
– 女孩每天要喝3升以上的水 – 24小时排尿8次,至少有一次夜尿 – 学习成绩有所下降
病例分析(2)
• 临床查体 无发热 脉搏80次/分(有些偏高) 血压正常 呼吸次数正常 女孩体重比3个月前减轻了1kg 其他未发现异常
N
[Z
2 p (1 p ) Z
p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.05,β水平为0.1( 1-β=0.9 ) • Zα/2=1.96,Zβ=1.28 • p1=50%,p2=60% [1.96(2×0.55×0.45)1/2+1.28(0.5×0.5+0.6×0.4)1/2]2 N= (0.5 - 0.6) 2 =518例
*双侧检验时Zβ与单侧检验时相同
流行病学研究中的第Ⅰ类和第Ⅱ类错误
人群 样本 有差别 有差别 1﹣β 把握度 β(第Ⅱ类错误) 假阴性 无差别 α(第Ⅰ类错误) 假阳性 1-α
无差别
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例,随机分为2组 • 中药组(消瘤散剂)30例 • 西药组(米非司酮)30例 • 分别治疗6个月 –中药组有效率60% –西药组有效率50% –P>0.05
2
练习: 用旧药治疗慢性肾炎的有效率为30%,现试验新药 疗效,新药的有效率必须达到50%才认为有推广价 值,问每组各需要多少例患者? 设α=0.05,β=0.10
查表:Zα/2=1.96,Zβ=1.28
计算:N=124
中药治疗子宫肌瘤的疗效研究
• 确诊为子宫肌瘤的患者60例,随机分为2 组 • 中药组(消瘤散剂)30例 • 西药组(米非司酮)30例
• 比较瘤体缩小
以定量指标的变化作为终点指标计算样本量
为1-β水平相应 的标准正态差
估计的标 准差
N
2( Z a Z ) 2 2 d2
两组连续变 量均值之差
α水平相应的 标准正态差
公式适用于N≥30时
n1 n
2
( z 2
/ 2
z
)
2
【例】为研究某地正常成年男、女末稍血液的红细胞的 差别,据文献报道,男性红细胞均数为465万/mm3 ,女 性红细胞均数为422万/mm3,标准差为52万/mm3,取双 侧α=0.05,把握度(1-β)=0.9,问要抽查多少人才能 发现男女间红细胞的差别?
样本含量(sample size)
• 为了保证研究结论的可靠性,确定的实验研究 或调查研究所需要的最低观察对象的数量。 • 样本含量少,指标不稳定,精密度和准确度 差;检验功效低。研究结论不可靠。 • 样本含量过多,造成人财物的不必要浪费。混 杂因素多,影响数据质量。
N
[Z
2 p (1 p ) Z
N
[Z
2 p (1 p ) Z
Hale Waihona Puke p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.01,β水平为0.05 ( 1-β=0.95) • Zα/2=2.58,Zβ=1.64 • p1=50%,p2=60% [2.58(2×0.55×0.45)1/2+1.64(0.5×0.5+0.6×0.4)1/2]2 N= =878例 (0.5 - 0.6) 2
N
[Z
2 p (1 p ) Z
p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• Zα/2=2.58,Zβ=1.64 p1=50%,p2=80% [2.58(2×0.65×0.35)1/2+1.64(0.5×0.5+0.8×0.2)1/2]2 N= (0.5 - 0.8) 2 =111例 估计随访过程可能10~20%的脱失,则最少每组应 保证多少人?
结局+ 实验组 (干预措施)
随 机 分 组
结局- 随访观察 结局+ 对照组 (对照措施) 结局-
病人群体
样本
临床试验原理示意图
可能比较的结局指标
• 生存率 • 生存质量 • 不良反应 • 并发症:如由于糖尿病所致的血管问题的危险 • 测量糖化血红蛋白,一种监测长期血糖水平的指示剂 • 在特定时间点上的血糖水平
p 1 (1 p 1 ) p 2 (1 p 2 ) ] 2
( p1 p 2 ) 2
• 规定α水平为0.01,β水平为0.05 • Zα/2=2.58,Zβ=1.64 • p1=50%,p2=80% [2.58(2×0.65×0.35)1/2+1.64(0.5×0.5+0.8×0.2)1/2]2 N= =111例 (0.5 - 0.8) 2
以率的变化作为终点指标计算样本量
α水平相 应的标准 正态差
(p1+p2)/2