样本含量计算

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

n=(1.6449+1.2816)2(25)2/(15)2=23.8
22
2.1.4 两均数比较
z z 21 1 / k 2
n
2
解析：①式中整体方差σ2可用样本方差S2估计，
s s s 2 ( 2 k 2) /(11/ k)
e
c
②差值 xe xc
③试验组样本量为n，对照组样本含量为kn，
10 50 100
p值
0.53 0.16 0.048
17
二、公式计算及练习
• 可满足多种设计的要求，目前应用广泛。
18
2.1 数值变量资料的样本含量估计
z 2.1.1总体均数的估计 n
2
2
2
• 详解：σ为总体标准差，一般用样本标准差表示；
δ为容许误差，即样本均数与总体均数间的容许差
值；α取双侧，Z值可以查表。
单侧α 双侧α/2 β 1-β Z值
0.40 0.80 0.40 0.60 0.2532
0.30 0.60 0.30 0.70 0.5243
0.20 0.40 0.20 0.80 0.8417
0.10 0.20 0.10 0.90 1.2816
0.05 0.10 0.05 0.95 1.6449
0.025 0.05 0.025 0.975 1.960
• 结果：16次试验（100次）中未能显示出统计学差异
84次试验显示有统计学差异 1次试验成功率为84%-power
15
计算机模拟举例2
• 假设： • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=100 • -显著性水平为双侧0.05 • -检验方法=卡方检验
0.01 0.02 0.01 0.99 2.3263
0.005 0.01 0.005 0.995 2.5758
19
• 例1：某医院拟用抽样调查评价本地区健康成人白细胞数的水平，要求误差不超过0.2*109/L。根据文献报告，健康成人的白细胞数的标准差约1.5*109/L。问需要调查多少人（双侧α=0.05）
• 结果：1次试验（100次）中未能显示出统计学差异
99次试验显示有显著性差异 1次试验成功率为99%-power
16
样本量与统计学差异
• 比较90%和80%的事件发生率，是否有统计学差异？ • 不仅看率，例数也起关键作用
有效率（A VS B）
9 vs. 8 45 vs.40 90 vs. 80
每组N
z n
2
2
2
n=(1.96)2(1.5)2/(0.2)2=216.1≈217
20
2.1.2 样本均数与总体均数比较
例2：某院普查市区2-6岁幼儿体
格发育情况，其中体重未达标的
幼儿，血红蛋白平均为100g/L，
z z 标准差25g/L。现欲使用抗贫血药
22
物，如果治疗前后血红蛋白预计 n
• 设计的类型 • 主要变量的性质 • 医学研究认为有意义的差值 • 一类错误α值（检验水准） • 二类错误β值（把握度、检验效能1-β） • 失访率
设计的类型
• 观察性研究 • 实验性研究
• 配对设计 • 随机化设计
6
按试验类型
• 估计总体 • 样本与总体比较 • 配对资料 • 两样本比较 • 多样本比较
差别
➢平均舒张压的差值≥5mmHg ➢如一种新疗法治疗儿童白血病比旧疗法治愈率提高5%，则
认为可取 ➢如治疗头痛，新药和阿斯匹林比较可能要有30%的差别才会
被认为有价值
• 要达到临床有意义的差别，需要更大的样本量
一类错误α
• 一般取0.05 • Ⅰ型(或假阳性)错误的概率 • 有单侧检验还是双侧检验之分
主要变量的性质
• 分类变量 • 数值变量
• 一般情况下，分类变量所需要的样本量多于数值变量
8
按结局指标
• 计数（定性）指标死亡与存活，阳性与阴性，正常与异常
• 计量（定量）指标血压、血糖、血清酶
• 结局指标有多个时，估计样本含量时需要选择其中最重要的结局指标。或按照所需样本量最多的指标。
9
分类计算
• 数值变量资料的样本含量估计 • 无序分类资料的样本含量估计 • 有序分类资料的样本含量估计 • 等效性检验的样本含量估计 • 非劣效性检验的样本含量估计 • 其他设计的样本含量估计（诊断性试验，多元回归，
多因素分析，重复测量，生存分析等）
医学研究认为有意义的差值
• 有些情况下，只要有差异（和零值有差别）即可 • 临床上，很多情况下，需要更大的具有临床意义的
2
上升10g/L。设单百度文库α=0.05，
β=0.1时，试问应治疗多少人，
可以认为该药是有效的？
n=(1.6449+1.2816)2(25)2/(10)2=53.5
21
2.1.3 配对资料
z z n
22
d
2
例3：某医师拟用新药治疗矽肺患者，预实验尿矽排出量平均比治疗前增加15mg/L，标准差为 25mg/L，问需要观察多少患者可以认为该药有效（单侧α=0.05，β=0.10）
1
一、为什么要计算样本量？
• 理论上，验证某一干预措施与对照之间的差异，样本量越大，试验结果越接近于真实值，即结果越可靠。
• 大样本试验还有助于探讨亚组疗效，发现罕见结局。
• 临床试验报告中有无预先的样本量估计是评价试验质量的重要依据之一。
2
为什么要计算样本量？(续)
• 试验样本量过小，无论试验结果是否存在差异，均不能排除因机遇（随机误差）造成的假阳性或假阴性错误。
把握度1-β
• 一般取0.8、0.9、0.95 • 即组间确有差别，则在100次试验中能发现 • 此差别的平均概率 • 检验效能不宜低于0.75 • β一般取单侧Z值
14
计算机模拟举例1
• 假设： • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=50 • -显著性水平为双侧0.05 • -检验方法=卡方检验
当k=1时两组样本含量相等。
23
• 例4：某一项研究吲达帕胺治疗原发性高血压的治疗，经预试验得治疗前后舒张压差值（mmHg）资料如下（与安慰剂比较，两药治疗前后差异均有统计学差异），当α=0.05，β=0.10时需要治疗多少例可以认为吲达帕胺有效？
• 样本量过少：结果不稳定，检验效能过低，结论缺乏充分依据。
• 样本量过大：增加临床研究难度，造成人力、无力、时间和经济上的浪费，伦理问题，一些临床意义不大的微弱疗效最终也可能会出现统计学上的显著差异。
3
定义
样本含量估算就是在保证科研结论具有一定可靠性条件下，确定的最少观察例数。
样本含量的确定有关因素