样本含量的计算
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
N
z
z 2 1 1 / k p(1 pe pc 2
p)
p
pe k pc 1 k
N=111.4≈112(k=0.75)
两样本率较为复杂的一个公式
• 样本量相同时
α水平相应
的标准正 态差
对照组 发生率
N
[z
2P(1
P
)
z
Pc(1 Pc) Pe(1 Pe)]2
(Pc Pe)2
为1p-β水平相应
19
2.1 数值变量资料的样本含量估计
z 2.1.1总体均数的估计 n
2
2
2
• 详解:σ为总体标准差,一般用样本标准差表示;
δ为容许误差,即样本均数与总体均数间的容许差
值;α取双侧,Z值可以查表。
单侧α 双侧α/2 β 1-β Z值
0.40 0.80 0.40 0.60 0.2532
0.30 0.60 0.30 0.70 0.5243
• 当目标事件发生率为0.2-0.8(0.3-0.7)时,用下列公式
N
z2 p 1 2
p
• P为总体率,δ为允许误差,即允许样本率和总体率的最大
容许误差为多少。
• 例5:某口腔医院研究青少年龋齿发病情况,拟了 解某市青少年龋齿患病情况,期望误差在平均患龋 齿率30%的1/6范围内,当α=0.05,问需要抽样调 查多少人?
差异性检验样本量计算
N
z
z 2 1 1 / k p(1 pe pc 2
p)
z z n
22
d
2
源自文库
优效性性检验
优效性检验旨在证明:
-药疗效-B药疗效≥Δ -在统计学上,若P≤0. 05,可认为A药优 于B药。 -Za一般用单侧检验,用于比较新药和安慰 剂
优效性检验样本量计算
N
z
z z 21 1 / k 2
n
2
s s 2 ( 2 k 2) /(11/ k)
e
c
吲达帕胺 安慰剂
均数
x 17.1( e) x 9.9( c)
标准差
s 8.175( e) s 3( c)
设k=0.7 n=20 kn=14
2.2 二分类资料的样本含量估计
• 2.2.1 估计总体率(抽样)
被认为有价值
• 要达到临床有意义的差别,需要更大的样本量
一类错误α
• 一般取0.05 • Ⅰ型(或假阳性)错误的概率 • 有单侧检验还是双侧检验之分
把握度1-β
• 一般取0.8、0.9、0.95 • 即组间确有差别,则在100次试验中能发现 • 此差别的平均概率 • 检验效能不宜低于0.75 • β一般取单侧Z值
• 结局指标有多个时,估计样本含量时需要选择其中 最重要的结局指标。或按照所需样本量最多的指标 。
10
分类计算
• 数值变量资料的样本含量估计 • 无序分类资料的样本含量估计 • 有序分类资料的样本含量估计 • 等效性检验的样本含量估计 • 非劣效性检验的样本含量估计 • 其他设计的样本含量估计(诊断性试验,多元回归,
等效性检验
等效性检验样本量计算
N
z
z 2 1 1 / k p(1 p )
z 2 1 1 / k p(1 pe pc 2
p)
n
z z 2 2
d
( )2
等效性检验
等效性检验旨在证明:
-Δ≤ A药疗效-B药疗效≥Δ -在统计学上,若P≤0. 025,可认为A药相 等于B药。 -用于比较新药和标准药物
- -Δ≤ A药疗效-B药疗效≥Δ
-在统计学上,若P≤0. 025,可认为A药相等于B药。
1P
• 例6:某医师研究药物对产后宫缩、外阴创伤的镇 痛效果,若新药比公认稳定有效的老药物(镇痛率 55%)高于20%,可说明新药优于标准药物,需治疗 多少例数?(设α=0.05,β=0.20)
• 查表z0.05=1.6449, z0.02=0.8417
答案:38.3≈39
28
2.2.3 配对资料 甲法
0.20 0.40 0.20 0.80 0.8417
0.10 0.20 0.10 0.90 1.2816
0.05 0.10 0.05 0.95 1.6449
0.025 0.05 0.025 0.975 1.960
0.01 0.02 0.01 0.99 2.3263
0.005 0.01 0.005 0.995 2.5758
第八讲 医学研究样本含 量的计算方法
2
一、为什么要计算样本量?
• 理论上,验证某一干预措施与对照之间的差异,样 本量越大,试验结果越接近于真实值,即结果越可 靠。
• 大样本试验还有助于探讨亚组疗效,发现罕见结局 。
• 临床试验报告中有无预先的样本量估计是评价试验 质量的重要依据之一。
3
为什么要计算样本量?(续)
的标准正态差
试验组发生率
N:为计算所得一个组的样本大小
2.3 观察性研究样本量
• 2.3.1 横截面调查的样本量考虑
• 定量资料的样本量计算 • 定性资料的样本量计算
z n
2
2
2
n
z2p
1
p
2
2.3.2 病例对照样本量计算
n z
2
2pq z p0q0 p1q1
p1 p0 2
• 由少到多:安慰剂对照优效试验 非劣效性试验 等效性试验 阳性对照优效试验。
差异性检验
差异性检验旨在证明:
-A药疗效≠B药疗效 -在统计学上,如果P≤0. 05,则认为A药
疗效不等于B药
设λA为A药生存率, λA为B药生存率,λA- λB= λ,可计算λ的95%CI可信区间
设λA为A药生存率, λA为B药生存率,λA- λB= λ,可 计算λ的95%CI可信区间
• 设z0.05=1.96, z0.1=1.2816
N
z
2P z
2( p 1
P
)(p 2
P )/
P
p1 p2
p ( p1 p2 2 p) / 2
本设计至少需要观察235例
30
2.2.4 两样本率比较
• 例8:某医师研究某药对产后宫缩痛、外阴创伤痛 效果,预试验旧药镇痛率为55%,新药镇痛率为75% ,当α=0.05,β=0.1时需要观察多少例能说明新 药镇痛效果优于旧药?
三、临床试验的样本量考虑
• 差异性检验 优效性检验 等效性检验 非劣效性检验
38
按假设检验类型
• 优效性检验:反应试验药效果优于对照药物(安慰 剂,阳性药)的试验,常用单侧检验;
• 等效性检验:确认2种或多种治疗的效果差别大小 在临床上并无重要意义,试验药与阳性药在疗效上 相当,常用双侧检验;
• 非劣效性检验:显示试验药的疗效在临床上不劣于 阳性对照药,常用单侧检验。
2.1.4 两均数比较
z z 21 1 / k 2
n
2
解析:①式中整体方差σ2可用样本方差S2估计,
s s s 2 ( 2 k 2) /(11/ k)
e
c
②差值 xe xc
③试验组样本量为n,对照组样本含量为kn,
当k=1时两组样本含量相等。
24
• 例4:某一项研究吲达帕胺治疗原发性高血压的治疗, 经预试验得治疗前后舒张压差值(mmHg)资料如下( 与安慰剂比较,两药治疗前后差异均有统计学差异) ,当α=0.05,β=0.10时需要治疗多少例可以认为吲 达帕胺有效?
16
计算机模拟举例2
• 假设: • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=100 • -显著性水平为双侧0.05 • -检验方法=卡方检验
• 结果:1次试验(100次)中未能显示出统计学差异
99次试验显示有显著性差异 1次试验成功率为99%-power
• 试验样本量过小,无论试验结果是否存在差异,均 不能排除因机遇(随机误差)造成的假阳性或假阴 性错误。
• 样本量过少:结果不稳定,检验效能过低,结论缺 乏充分依据。
• 样本量过大:增加临床研究难度,造成人力、无力 、时间和经济上的浪费,伦理问题,一些临床意义 不大的微弱疗效最终也可能会出现统计学上的显著 差异。
17
样本量与统计学差异
• 比较90%和80%的事件发生率,是否有统计学差异? • 不仅看率,例数也起关键作用
有效率(A VS B)
9 vs. 8 45 vs.40 90 vs. 80
每组N
10 50 100
p值
0.53 0.16 0.048
18
二、公式计算及练习
• 可满足多种设计的要求,目前应用广泛。
乙法
+
-
+
P
P1-P
P1
-
P2-P
P2
1
N
z
2P
z
2( p 1
P )(p 2
P )/
P
p1 p2
• p1,p2分别为甲、乙两法阳性率, • p为甲、乙两法一致性阳性率,
• p ( p1 p2 2 p) / 2
29
• 例7:某医师观察甲药是否比乙药治疗过敏性鼻炎 更有效,采用配对双盲设计,预试验甲药有效率为 60%,乙药有效率为50%,两药一致性阳性率为43% ,试估算两药疗效差别有统计学意义时样本含量。
15
计算机模拟举例1
• 假设: • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=50 • -显著性水平为双侧0.05 • -检验方法=卡方检验
• 结果:16次试验(100次)中未能显示出统计学差异
84次试验显示有统计学差异 1次试验成功率为84%-power
20
• 例1:某医院拟用抽样调查评价本地区健康成人白细 胞数的水平,要求误差不超过0.2*109/L。根据文献 报告,健康成人的白细胞数的标准差约1.5*109/L。 问需要调查多少人(双侧α=0.05)
z n
2
2
2
n=(1.96)2(1.5)2/(0.2)2=216.1≈217
21
2.1.2 样本均数与总体均数比较
n 2 pq(z z )2 /( p1 p0)2
2.3.3 队列研究样本量计算
n
z
2
2pq
z
p0q0 p1q1
p1 p0 2
n 2 pq(z z )2 /( p1 p0)2
医学研究样本量总结
• 无论是病例对照、队列研究还是实验性研究,当结局是二 分类时,公式都相似。
n
z
• 配对设计 • 随机化设计
7
按试验类型
• 估计总体 • 样本与总体比较 • 配对资料 • 两样本比较 • 多样本比较
主要变量的性质
• 分类变量 • 数值变量
• 一般情况下,分类变量所需要的样本量多于数值变 量
9
按结局指标
• 计数(定性)指标 死亡与存活, 阳性与阴性, 正常与异常
• 计量(定量)指标 血压、血糖、血清酶
例2:某院普查市区2-6岁幼儿体
格发育情况,其中体重未达标的
幼儿,血红蛋白平均为100g/L,
z z 标准差25g/L。现欲使用抗贫血药
22
物,如果治疗前后血红蛋白预计 n
2
上升10g/L。设单侧α=0.05,
β=0.1时,试问应治疗多少人,
可以认为该药是有效的?
n=(1.6449+1.2816)2(25)2/(10)2=53.5
2
2pq
z
p0q0 p1q1
p1 p0 2
n
z
z
2 1
1/
k p(1
p)
pe pc 2
医学研究样本量总结
• 上述情况均为单因素的研究,如果多因素,需要考 虑回归方程对样本量的要求(1/10)
• 生存分析,包括logRANK检验,COX回归对样本量要 求更为复杂,甚至难以用公式表达,可直接借助软 件进行计算。
• z0.05=1.96 • P=0.3
• Δ=0.3/6=0.05
N
z2 p 1 2
p
n=(1.96)2(0.30)(1-0.30)/(0.05)2=322.7
27
2.2.2 样本率与总体率比较
• 当目标事件发生率为0.2-0.8(0.3-0.7)时,用下列公式
N
(z
z )2 P 2
4
定义
样本含量估算就是在保证科研 结论具有一定可靠性条件下, 确定的最少观察例数。
样本含量的确定有关因素
• 设计的类型 • 主要变量的性质 • 医学研究认为有意义的差值 • 一类错误α值(检验水准) • 二类错误β值(把握度、检验效能1-β) • 失访率
设计的类型
• 观察性研究 • 实验性研究
22
2.1.3 配对资料
z z n
22
d
2
例3:某医师拟用新药治疗矽肺患者,预实验尿矽 排出量平均比治疗前增加15mg/L,标准差为 25mg/L,问需要观察多少患者可以认为该药有效 (单侧α=0.05,β=0.10)
n=(1.6449+1.2816)2(25)2/(15)2=23.8
23
多因素分析,重复测量,生存分析等)
医学研究认为有意义的差值
• 有些情况下,只要有差异(和零值有差别)即可 • 临床上,很多情况下,需要更大的具有临床意义的
差别
➢平均舒张压的差值≥5mmHg ➢如一种新疗法治疗儿童白血病比旧疗法治愈率提高5%,则
认为可取 ➢如治疗头痛,新药和阿斯匹林比较可能要有30%的差别才会