样本含量的估计PPT课件

合集下载

生物统计第三节 样本含量的估计与检验效能1

生物统计第三节 样本含量的估计与检验效能1

δ为允许误差 (x m,) 可根据调查要求的准确性确定;
1-a为置信度。
上一张 下一张 主 页 退 出
在首次计算时,可先用df =∞时 (当置信度 为95%时,zα= z0.05=1.96;置信度为99%时, zα = z0.01=2.58)值代入,若算得n<30,再用df=n-1 的za代入计算,直到n稳定为止。
即至少需要调查1025只鸡,才能以95%的 置信度使调查所得的样本百分数与总体百分数 相差不超过0.03。
此 外 , 当 样 本 百 分 数 接 近 0% 或 100% 时 , 分布呈偏态,应对x作 sin 1 x 转换。此时估算 公式为:
n [57.3z / sin 1( / 1 )]2 (9-23)
式中:n为每组试验的动物头数; p为合并百分数,由样本百分数计算, q 1 p;
为预期达到差异显著的百分数差值;
ua为自由度等于∞、两尾概率为a的临界u值: u0.05=1.96, u0.01=2.58;
1-a 为置信度。
上一张 下一张 主 页 退 出
【例9.13】 两种痢疾菌苗对鸡白痢病的免疫 效果,初步试验表明,甲菌苗有效率为22/50 = 44%,乙菌苗有效率为28/50 = 56%,今欲 以95%的置信度在样本的百分数差值达到10% 时检验出两种菌苗免疫效果有显著差异,问试 验时每组至少需接种多少只鸡?
已知 π=0.08,α=0.05,Z0.05/2=1.96,δ=0.02 代入公式(6.2)得
n
1.96 0.02
2
0.08
(1
0.08)
707
即需调查707人。 如果采用单侧z0.05=1.645,则n= 498
总体百分数如果事先未知,可先从总体中 调查一个样本估计。或令z=0.5进行估算。

第十八章样本含量的估算

第十八章样本含量的估算
(2.33 1.645) 25 n(1) 2 49.38 50 20
2
n1=50, 1 49
n(2)
t0.05,49 1.677 t0.01,49 2.405
2
(2.405 1.677) 25 2 52.07 53 20
2
(t t ) s 或 n
2
在此基础上,用已求得的样本数n1 再进行 评估。即用=n1 - 1 的tα 和tβ 值再求出n2,再 用v = n2 - 1 的tα 和tβ 值求出n3,直至前后两次 求得的结果趋于稳定为止,
【例8】 正常成年男子脉搏的平均数为 72次/分,标准差为6.0次/分。有某镇静药,服 药后的脉搏数要求降至小于或等于69次/分可认 为有镇静作用,要求=0.05(单侧), =0.10,1- =0.90,问需要试验多少例? u0.05=1.645,u0.10=1.282, =3,=6
三、样本含量的估算
3.样本率和总体率比较时的n估算
u +u n=(1- 0) 0
2
此公式适合大样本的研究。式中π0 为 已知的总体率, δ =π1 - π0,其中π1 为预期试 验结果的总体率。
【例10】用传统的方法治疗运动负胫骨结节骨 骺损伤的有效率约为85%,现采用小钢针做胫 骨结节骨骺穿刺,加上场应理疗的治疗方法, 估计有效率为95%,选定α = 0. 05, β = 0. 1 时至 少观察多少病例?
≠0的指标,必须达到n例观察数才能 满足研究的精度要求。
单、双侧检验

双侧检验所需样本含量n多于单 侧检验。Ⅰ类误差有单、双侧概率 之分,Ⅱ类误差只取单侧概率。
单侧界值小于双侧界值。

样本含量估计ppt课件

样本含量估计ppt课件
白细胞数的水平,要求误差不超过0.2*109/L。 根据文献报告,健康成人的白细胞数的标准差约 1.5*109/L。问需要调查多少人? ❖ (双侧α=0.05)
26
确定样本量的方法---查表法
σ=1.5 δ=0.2 σ/δ =1.5/0.2=7.5
公式计算法:uα/2=1.96 n=(1.96)2(1.5)2/(0.2)2=216.1≈217
δ


总总



体体



标率





差7检验水准(Fra bibliotek值)即假设检验第一类错误出现的概率,也称假阳性率,,即检验水 准或显著性。α越小,所需的样本量越大,反之就要越小。α水平由 研究者根据具体情况决定,通常α取0.05或0.01。 ❖ 另外还应明确是单侧或双侧检验。
用统计学检验时,当研究结果高于和低于效应指标的界限均有 意义时,应该选择双侧检验,所需样本量就大;当研究结果仅高于 或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的U界值通过查标准 正态分布的分位数表可得。
地区性研究:平均样本人数500-1000人; 全国性研究:1500-2500人 描述性研究:样本最少占总体的10%,如果总体较小,则最
少占总体20% 相关性研究:受试者至少30人以上
6
确定样本量的方法---计算法和查表法
❖ 样本含量估计常用的两种方法。
❖ 需要提前确定以下参数:
TEXT
α
1-β
σ和π
u u 211/ k 2
n

2
试验组样本量为n,对照组样本含量为kn, 当两组样本含量相等时,k=1。

样本含量估计

样本含量估计
对照组治疗前后十二指肠愈合率P0=90%。
2024/4/18
试验组-对照组= δ
最终所需样本量
1 =0 =113例
总样本量N=226例
15
三、常见研究设计类型的样本含量的估计
两组平行设计、定量、非劣效
某研究者欲评价试验药物A缓解癌症患者癌因性疲乏症状的有效性。以药物B为阳性
药物,设计了一项随机、双盲双模拟、平行对照、多中心临床试验。

0

0
δ
非劣效性试验:确定非劣效界值-δ !
H0:T-C ≤ - δ ;H1:T-C> - δ ;α=0.025(单侧)
由临床专家与统计学专家商量,最终由临床研究者确定。
2024/4/18
7
二、估计样本含量需要考虑的因素——研究设计
目的
假设检验
设计类型:
平行设计
交叉设计
实验设计
-14d
N1=13例;N2=13例
✓ I类错误:α=0.05
✓ II类错误:β=0.20
N1=17例;N2=17例
✓ 脱失率:20%
✓ 统计分布: 正态分布
✓ 效应量: 文献发现,服用标准药的受试者平均心率为μ1=93 次/分,标准差为σ= 9 次/分,同
2024/4/18
17
一个受试者相邻两次测量值之间相关系数均为ρ=0.7。两组受试者服药后平均心率
病例数
常见ADR概率(%) 一般ADR概率(%)罕见ADR概率(%)
假定总发生率为5%
假定总发生率为1% 假定总发生率为0.1%
100
99.41
63.40
9.52
100+300
>99.99

《样本量估计》PPT课件

《样本量估计》PPT课件
为总体患病率。
单样本与已知总体检验时样本量的估 计及SAS程序
单样本与已知总体检验的样本量估计公式 类似。其估计公式为:
N (u u )2 1
式中:δ为容许的误差 2,即允许样本率和已
知总体率()的最大容许误差为多少。为
已知总体患病率。
两样本率比较样本量估计及SAS程序
式 式为中N:为N观察u的 对u子 数d , 2 σ为两样本差值标
准差估计值,δ为容许误差。
本章小节
在科学研究方法中,现在越来越强调样本 量的估算。确定适当的样本含量,可节约 资源,并防止因为样本含量过少引起的检 验效能偏低,出现了非真实的阴性结果, 这是当前医学研究中值得注意的问题。确 定样本含量的主要用途是保证科研设计有 适当的样本含量,而且可考察当前的样本 含量是否能够保证足够大的检验效能。
配对分类资料多用 2 检验进行处理的,资 料的样本含量估计公式为
N


u
2 c u
2
c







a
b
b


a
c c
c



2
抽样调查总体参数估计时的样本量估 计及SAS程序
抽样调查估计总体均数的样本含量公式为:
概述
医学研究没有绝对的样本量标准,不同的 研究方法、研究目的,研究要求和研究资 料决定了样本量。一般而言,样本越大, 结果的估计越精确。但样本过大或过小均 可影响研究的可行性。因此,科学地确定 样本量可增加研究的可靠性,得到可信的 研究结果。
样本量估算的影响因素
在科学研究方法中,现在越来越强调样本 量的估算。确定适当的样本含量,可节约 资源,并防止因为样本含量过少引起的检 验效能偏低,出现了非真实的阴性结果, 这是当前医学研究中值得注意的问题。确 定样本含量的主要用途是保证科研设计有 适当的样本含量,而且可考察当前的样本 含量是否能够保证足够大的检验效能。

卫生统计学课件:第17章 队列研究的样本含量估算与统计分析

卫生统计学课件:第17章 队列研究的样本含量估算与统计分析
6
暴露人群的选择
1) 在一次普查的基础上,确定暴露人群。 2) 查阅档案资料。可以从职业档案、户口
登记、医疗病历等文件资料中获得暴露人 群及暴露水平的线索。 3) 一定地理区域内的居民或种族。
7
健康工人效应:
在职业人群队列研究中,由于工作的 需要,职业工人的健康状况要比一般人群 的健康状况好,这种职业工人与一般人群 的不可比性,可能造成比较结果的偏倚。
校正 区间发病 区间不发 累积不发 累积发病
数 概率 病概率 病概率 概率
(/105) (/105) (/105) (/105)
36389 36127 35824 35464 34960
13.74 8.30 5.58 5.64 5.72
99986.26 99986.26 99991.70 99977.96 99994.42 99972.38 99994.36 99966.74 99994.28 99961.02
优点:是由因及果的分析性研究设计,不容易受混杂 因素影响,在论证病因关系时结论更可靠。 缺点:较多的对象和较长的时间;费用高昂;工作量 大;易发生失访,导致偏倚。
样本含量的估算 队列研究的统计描述
队列研究中的暴露组与非暴露组的对比
37
2
h1
Th2
34
三、剂量-反应关系(趋势卡方)
表17-9 剂量-反应关系分析表
暴露因素水平
E0
E1

EK
取值
X0
X1

XK
出现结局事件的人数
d0
d1

dK
观察人年数
T0
T1

TK
合计
D T
2
T 2 (T

抽样方法与样本量估计ppt课件

抽样方法与样本量估计ppt课件

x
Nn
n
率的标准 ) :误 Sp(( 1N n)有 p(n 1 1 p 限 ) 总 无 限 体 总 体 p(1n p)
ppt课件完整
31
4 . 1
例1 欲调查某农村小学学生的蛔虫感染率,该校有学生2000人,若取样本例数 100人,试作单纯随机抽样设计。
解:先将全校学生编号:0,1,2,3,…,1999;再用附表17随机数字表,任意 指定某行某列,比如第5行第9列,由此处开始,向右依次抄录随机数字100组,每 组4个数字,凡后面出现与前面相同的数字弃去,如得0873,3732,0405,6930, 1609,0588,…。凡首字≥8者减8,≥6者减6,≥4减4,≥2减2,依次得873,1732, 405,930,1609,588,…。
ppt课件完整
5
抽样调查的特点
特点1:抽取的样本作为一个“代表团”来代表总体。而不是随意 挑选的个别单位代表总体。
特点2:调查样本一般按随机的原则抽取,在总体中每个单位被抽 取的机会相等。因此被抽中的单位在总体中是均匀分布的,不致出 现倾向性误差,代表性强。
特点3:所抽取的调查样本数量是根据误差的要求并经过科学的计 算确定,在调查样本的数量上有可靠保证。
ppt课件完整
18
滚雪球抽样
通常是先选出一组最初的调查对象,通常是随机选出的, 在访谈之后,要求这些被访者推荐一些属于目标总体的其他 人,根据这些推选出后面的被访者。与随机的方式相比,被 推举的人将具备与推荐人更为翔实的人口及心理特征。 优点是:主要目的是估计总体中非常稀少的某些特征。 缺点是:这种方式非常耗时。
ppt课件完整
10
对抽样误差认识与使用的误区
一些研究者甚至部分官员不愿意或不习惯接受数据的误差 范围,一谈到误差,惟恐别人说数据不准,将数据误差绝对。 由于对数据误差的认识存在着误区,在如何使用数据上也存在 着误区。抽样调查的数据拿来就用,不谈抽样误差和调查误差, 认为调查数据就是总体的真值。在进行工作政绩考核或进行地 区间的数据对比时,调查指标数据的高低变成了地区之间排队、 政绩评比的依据,忽视了对数据误差的评估。现有的调查数据 不仅没有正确地使用,反而还带来地区之间数据高低的相互攀 比,同时也影响了以后抽样调查的数据质量。

医学统计学-实验设计PPT课件

医学统计学-实验设计PPT课件

例:某中药治疗十二指肠溃疡疗效观察
纳入标准:①年龄在18~70岁之间;②入选 前3~5天内经胃镜检查证实为活动期十二指 肠溃疡,溃疡长径在0.4cm~2cm之间,溃 疡数不超过2个;③入组前48小时内停服一切 抗溃疡药物。
排除标准:①复合性溃疡或溃疡数超过2个 ; ②有溃疡严重并发症 (出血、穿孔、癌变 等 )史;③有胃、十二指肠手术史;④孕妇或 哺乳期妇女;⑤心、肝、肾功能异常者;⑥正 在服用非类固醇抗炎药或皮质激素类药物。
正常妇女的子宫内膜细胞组:为同期本院门 诊正常育龄妇女共15例,于放置宫内节育器 前行细管吸宫法获取子宫内膜,术后病理组 织检查证实无病理改变。
一、临床试验的定义、特点与要求
临床试验(clinical trial):指对人类对象进行的 任何意在发现或证实一种试验用药品的临床、 药理学和(或)其他药效学作用;和(或) 确定一种试验用药品的任何不良反应;和 (或)研究一种试验用药品的吸收、分布、 代谢和排泄,以确定药物的安全性和(或) 有效性的研究。
直接影响研究的质量—科学性。
实验研究的特点
处理因素是研究者根据研究目的人为设置的, 是在研究者完全或部分控制的“非自然条件 下”进行的研究。
受试对象接受何种处理与水平是由随机分配 而定的。
证据的可靠性强
二、实验设计的三要素
受试对象(subject) 实验因素(处理因素,treatment) 实验效应(effect)
SARS疫苗I期临床试验
每一个受试者接种疫苗后,要做两个小时 的留院查看,随后定期接受随访和相关的 血、尿、胸片以及血清抗体的检查。
我国人用禽流感疫苗I期临床研究
中国人用禽流感疫苗由北京科兴生物制品 公司和中国疾病预防控制中心共同研制。

样本含量的计算

样本含量的计算

编辑ppt
20
•例1:某医院拟用抽样调查评价本地区健康成人白细 胞数的水平,要求误差不超过0.2*109/L。根据文献 报告,健康成人的白细胞数的标准差约1.5*109/L。 问需要调查多少人(双侧α=0.05)
z n
2
2
2
n=(1.96)2(1.5)2/(0.2)2=216.1≈217
编辑ppt
编辑ppt
16
计算机模拟举例2
• 假设: • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=100 • -显著性水平为双侧0.05 • -检验方法=卡方检验
• 结果:1次试验(100次)中未能显示出统计学差异
99次试验显示有显著性差异 1次试验成功率为99%-power
2pqz p0q0 p1q1 p1 p0 2
nz
z211/kp(1p) pe pc2
编辑ppt
36
医学研究样本量总结
• 上述情况均为单因素的研究,如果多因素,需要考 虑回归方程对样本量的要求(1/10)
• 生存分析,包括logRANK检验,COX回归对样本 量要求更为复杂,甚至难以用公式表达,可直接借 助软件进行计算。
•计量(定量)指标 血压、血糖、血清酶
•结局指标有多个时,估计样本含量时需要选择其 中最重要的结局指标。或按照所需样本量最多的 指标。
分类计算
编辑ppt
10
• 数值变量资料的样本含量估计 • 无序分类资料的样本含量估计 • 有序分类资料的样本含量估计 • 等效性检验的样本含量估计 • 非劣效性检验的样本含量估计 • 其他设计的样本含量估计(诊断性试验,多元回归,
编辑ppt
29
• 例7:某医师观察甲药是否比乙药治疗过敏性鼻炎 更有效,采用配对双盲设计,预试验甲药有效率为 60%,乙药有效率为50%,两药一致性阳性率为43% ,试估算两药疗效差别有统计学意义时样本含量。

医学研究中样本量的估计

医学研究中样本量的估计

n
(u
u )2
2
(3)样本均数与总体均数比 较的样本量估计
COMPUTE n=((1.96 + 1.282) *3/ 1.5 ) **2. EXECUTE.
樱桃.gif
n=43
(4)完全随机设计两样本含量相 等时均数比较的样本量估计
例题4:某药厂对新研发的降压中成药与标准降压药的疗效比较。已知
2 2
) )
(11)两样本相关系数比较的样本量估计
COMPUTE n=8 * ((1.645 + 1.282) / (LN(((1 + 0.90)*(1-0.80)) /((1 0.90)*(1+0.80))))) ** 2 + 3.
EXECUTE.
樱桃.gif
(12)不配对病例-对照研究设计 (病例数与对照数相等时的样本含量)
EXECUTE.
(8)完全随机设计两样本率比较的样本含 量估计(当两样本量相等时)
例题8:拟研究新研制的抗菌药物对某感染性疾病的治疗效果。经预 试验,试验药有效率为80%,对照药有效率为60%。问正式临床试验每组需 要观察多少病例(假设采用双侧检验)?
单侧:n1 n2 u2
樱桃.gif
2
2 p(1 p) u2 p1 (1 p1 ) p2 (1 p2 )
n
(t
t
)sd
2
(6)配对设计两样本均数比 较的样本量估计
COMPUTE n=((1.96 + 1.645) * 25 / 15) ** 2. EXECUTE.
樱桃.gif
n=37
(7)完全随机设计多样本均数 比较的样本量估计
例题7:某中医院应用中西医结合治疗肺气虚、脾气虚、肾气虚慢性阻 塞性肺疾病(COPD)患者,并与单纯西药为对照组,观察中西医结合治疗 COPD患者不同中医证型的肺功能改善效果,根据查阅相关资料,肺气虚的 FVC(L)为2.44±0.32;脾气虚为樱2桃..g4if0±0.36;肾气虚为2.31±0.29;对 照组为2.51±0.32。问该项临床研究估计需要观察多少病例数?

样本含量估计讲解

样本含量估计讲解
第 十 七 章
流行病与统计教研室
2019/6/9
1
第一节 样本含量估计的意义及应具备的条件
– 【例17-1】已知糖尿病患病率一般为2%~3%, 现拟采用单纯随机抽样方法从某社区抽取随机 样本,以了解该社区人群中糖尿病患病率。该 社区人口为3000人,希望误差不超过1%,取 a=0.05,需调查多少人?
• 二、其它概率抽样方法的样本含量估计
– (一) 分层抽样所需样本含量估计 – (二) 整群抽样所需样本含量估计
2019/6/9
7
单纯随机抽样的样本含量估计
• 估计总体均数的样本含量

公式:
n


ta,v s

2
• 式中,S 为总体标准差的估计值
为容许误差
ta,v 需要查t界值表,可先用标准正态分 布算初中步的的z自a 代由入度,v,算可出查一表个得初t步a,估v ,计以的此n,带再入计公
则 1 0
2019/6/9
29
– 【例 17-6】 已知健康妇女血清胆固醇平均水平 为4.4mmol/L,现欲研究服用类固醇类避孕药 对血清胆固醇水平的影响(双侧,即不知升高 还是降低)。改变值≤0.2 mmol/L时作为无改变, 改变值≥1.0mmol/L时作为有改变,
S 0.85 0.05 0.10 ,问需研究多少人?
p2 0.1449 m 4180 4970 2 4575
p 1060720 4180 4970 0.1945 K 55
2019/6/9
25
k0
1.962
41822
0.2536 0.19452 49702 0.1449 2 1 45752 0.12

样本含量估计

样本含量估计
式,可算得第二次估计的n,如此迭代,直到稳
定为止。
2020/3/22
8
若是从有限总体抽样,尚需进一步校正
nc
n 1 n
N
2020/3/22
9
– 【例17-2】 某研究者拟用抽样方法了解冠心病 患者血清胆固醇的平均水平,希望误差不超过 0.2mmlo/L,根据文献,冠心病患者血清胆固 醇标准差约为0.94mmol/L,如取a=0.05,则需 调查多少人?
2020/3/22
18
• 分层抽样所需样本含量估计
– 按比例分配
• 是按各层观察单位数 N i占总体观察单位数N的 比例抽取样本,使各层样本含量ni 与总样本含 量n 之比等于各层观察单位数 N i 与总体观察单 位数N 之比,可按下式计算:
ni n
Ni N
Wi
ni
n
Ni N
Ni
n N
2020/3/22
2
88
– 因此,本研究应调查88例冠心病患者。
2020/3/22
11
第二节 调查设计常用样本含量估计方法
• 一、单纯随机抽样的样本含量估计
– (一) 估计总体均数的样本含量 – (二) 估计总体率的样本含量
• 二、其它概率抽样方法的样本含量估计
– (一) 分层抽样所需样本含量估计 – (二) 整群抽样所需样本含量估计
19
2020/3/22
20
– 最优分配
• 是按总体各层观察单位数 N i 的多少和标准差 i
(或各层率 i )大小来分配各层的观察单位数
ni n
Ni i Ni i
(均数的抽样)
ni n
Ni i 1 i Ni i 1 i
• 允许误差 =0.2

病例对照研究 (2)ppt课件

病例对照研究 (2)ppt课件
27
(2)对照的来源:
必须来自产生病例的源人群中: 若病例为从社区中诊断的所有病例,对照可以
从社区一般人群中选择1个样本;
若病例产生于一般人群的1个样本中诊断的全部 病例,则对照可以采自一般人群或其样本中的1 个亚人群中的非病例;
若病例采自某个医院诊断的全部病例,则对照 产生于病例同一医院的其他患者的样本。
30
(3)匹配和分层:
匹配的条件或变量应该是与疾病无直接关系的 因素,如果匹配变量中包括了疾病的危险因素 或病因,就不能正确分析该因素与疾病的关系。
匹配条件或变量不宜太多,否则将给对照的选 择带来困难。
匹配比例一般可为1∶1,1∶2,1∶3,最多不 宜超过1∶4。
31
分层是指先按欲控制的混杂因素的不同组别将总 体分层,然后从各层中按预定的比例随机抽样。
物,设RR=2.6, 0.05(双侧), 0.10 ,估计样本含量。
按式16-3和16-4计算:
p RR/(1 RR) 2.6 /(1 2.6) 0.722
m 1.96 / 2 1.282
2
0.2722(1 0.722)
/
(0.722
1/
2)2

32
p1 0.20 2.6 /1 0.20(2.6 1) 0.394
q1 1 0.394 0.606 q0 1 p0 1 0.20 0.80
M 淮32 / (0.20 0.606 +0.394? 0.80) 74
38
(2) 1∶R 匹配设计:依照如下公式计算:
N z (11/ r) p(1 p) z p1(1 p1) / r p0(1 p0) 2 /( p1 p0)2

样本含量的估算(共55页)

样本含量的估算(共55页)

2
75
简 历
返回总目录
返回章目录
结束 第14页
统计学讲座 样本含量的估算
5、两样本率的检验
公式(5)为:
( z (1 )( Q Q ) z (1 ) / Q (1 ) / Q c 1 1 1 2 2 2 N c 1 2
1 1 1 2 2
(5)
式中:
c Q11 Q2 2
返回总目录 返回章目录 结束 第15页
简 历
统计学讲座 样本含量的估算
【例5】两样本率的检验
【例5】研究针炙配合心理疗法治疗失眠的效果。预试验中, 针炙和心理联合治疗的有效率为94%,单纯应用针炙治疗的 有效率为85%。若取双侧α=0.05,则z0.05=1.96,β取单侧 0.10,Z0.1=1.282,则检验功效为0.9。若联合治疗的样本 含量占60%(Q1),单纯治疗的样本含量占40%(Q2),则两 组样本含量各为多少? 计算:
简 历
返回总目录
返回章目录
结束 第5页
统计学讲座 样本含量的估算
(二)样本含量估算的方法
样本含量估算的公式:往往是通过假设检验的公式反推而得到。 1、单样本均数的检验或配对样本均数的检验:公式为
( z z ) N
2
(1)
单侧或双侧检验:取决于α的取值。如双侧,单侧。
2
(1.96 0.904(1 0.904)(0.601 0.401 ) 1.282 0.94(1 0.94) / 0.60 0.85(1 0.85) / 0.40 0.94 0.85 495
2
联合治疗组:n1=0.60×495=297 单纯组:n2=0.40×495=198

样本含量的估计与检验效能课件共40页文档

样本含量的估计与检验效能课件共40页文档

H0
H0
μ0
-x
H1
1-β 1
β1
μ00+d1 1
-x
μ0
-x
H1
1-β 2
β2
μ00+d2 2 -x
检验效能的影响因素小结
(1) 小 z大 小1 大
(2) n大 z 大 小 1 大 (3) 大 z 小 z 大 小 1 大 (4) 大 z 大 小 1 大
注意这里 z 为单侧临界值;实际上还可以采用双侧临界值 z 2
样本含量的估计与检验效能课件
6、法律的基础有两个,而且只有两个……公平和实用。——伯克 7、有两种和平的暴力,那就是法律和礼节。——歌德
8、法律就是秩序,有好的法律才有好的秩序。——亚里士多德 9、上帝把法律和公平凑合在一起,可是人类却把它拆开。——查·科尔顿 10、一切法律都是无用的,因为好人用不着它们,而坏人又不会因为它们而变得规矩起来。——德谟耶克斯
n(1.96 1.128)21.2215
即需15例患者参加试验。
如果采用单侧,则需观察12人。
五、两样本率比较
n1
n2
2
z
p1
z
代入公式(6.12)得
n 1.961000 2 384.16 385 即需要从该社区随机抽取 385 人。 100
如果采用单侧 z0.05=645,则 n=271
一、抽样调查
2.率的抽样(总体率π置信区间估计)
n
z / 2
2
p (1p )
(6.13)
【例 6.8】从参考文献得知高血压得患病率为 8%,研究者拟研究
四、配对计量资料比较
n
(z /2
z
)d
2

样本含量估计及等效性检验PPT.

样本含量估计及等效性检验PPT.

例3、某项研究,观察某中药 治疗某病患者,以血沉作为疗效
指标,临床前该中药可使病人血 沉平均下降3.3mm/h ,标准差为 1.94 mm/h,西药可使病人血沉 平均下降4.9 mm/h,标准差为 2.97 mm/h,为了进一步观察该 中药的疗效,拟申请一项课题, 问估计需观察多少病例数?
取α=0.05,β=0.1 检验效能power = 1 - 0.1 = 0.90, 双侧检验,uα= u0.05=1.96, uβ= 1.282,δ= 4.9 - 3.3 = 1.6,取 较大的标准差σ=2.97 ,代入公式:
取α=0.05,β=0.1,将各组的 i 的估计值:
2.79、4.01、3.84,及 i :0.26、0.27、1.11代
入公式,计算 i /k = (2.79+4.01+3.84)
/∞3,= 查3.5表5,得查表α==20.5.025,,代β=入0公.1,式ν1=: 3 - 1 = 2,ν2=
为什么要进行等效性检验?
在临床试验中,当两组疗效差异 无显著性意义时,尚不能认为两组 疗效等效,此时还需考虑该项显著 性检验的检验效能是否足够大?对 判断其组间疗效是否相等或相近, 可进行等效性检验。
二、等效性检验的步骤:
1、必须规定一个有临床意义且比较 合理的等价差值(注:选择的不 同,等价检验的结果也不同,一般 由本专业的专家结合成本效应来估 计,一般 值为对照组样本率的 20%,对计量资料,当 难确定时, 可用标准差的1 /2-1/5, 也可用 标准均数的1/10)。
两样本率比较所需的样本含量
检 验 水 α = 0.05(双侧)
检 验 效 能 1-β = 0.9000
第一总体率(估计值)π1 = 0.15 第二总体率(估计值)π2 = 0.45 每组所需样本例数 n = 47
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

n1
1.960.52 0.1
9
6.0
4
n2 1.98409.10.5298.50 n3 1.98404.10.5298.45
(二)估计总体率(或比例)时所需 的样本大小
n z2/2p1 p
2
p z / 2
p(1 p) n
例18-2:某城市欲调查10岁以上儿童参加夏令
营的比例,在预调查中这个比例是80%,要求正式
的样本统计量与总体参数间或样本统计量间的 差值,容许误差既可以用绝对误差来表示,也 可用相对误差来表示,容许误差值越小,所需 样本量越大。
4.总体标准差σ或总体率π,常根据预试验以及前 人的研究结果或统计理论进行估计,σ愈大或π愈
远离0.5,所需样本量越大。
.
7
第二节 参数估计中样本含量的估计
(一)估计总体均数时所需的样本大小
2t,
t,
2
Nt,t,2Fra bibliotekQ 11Q 21
样本分配比或抽样比: Q11 Q21 1
.
17
例18-6. 据文献报道:用磷酸咯定肌肉注射治疗 间日疟,观察疟虫消失时间,2mg/kg肌注组,平均 消失时间为48.5小时;4mg/kg肌注组,平均消失时 间为43.3小时。两组平均时间的标准差估计为13小 时。欲得出两计量的疟原虫消失时间不同的结论在
.
2
大样本得到的结论要比小样本得到的结论 更为精确和可靠,但大样本意味着研究者要付 出更多的时间、精力、人力和财力,有时还会 导致浪费,样本例数太少,就容易把偶然性或 巧合的现象当作必然的规律性现象,也不能正 确地估计实验误差,
.
3
克服两种倾向:
1、片面追求增大样本
样本含量过大,不仅会增加实际工作中的困难,对 质量的严格控制也不易做到,还会造成人力、物力和 时间上的不必要的浪费。此外,样本含量过大还可能 引入更多的混杂因素,对研究结果造成不良影响。
358
4 10000 0.10 0.90 0.30 3000.00 0.05
54
5 30000 0.30 0.70 0.46 13747.73 0.25
246
合计 150000
55863.75 1.00
1000
第三节 假设检验中样本含量的估计方法
(一)样本均数与总体均数比较
n
t/2,
t,
2
例18-5.某药物研究所研究某新药治疗高血压的疗 效,若规定要求用药后舒张压下降1.6kpa,才说明该 药有实际疗效。预试验结果:治疗后比治疗前舒张
一、单纯随机抽样的样本含量估计
n t S 2
nc
1
n n
N
( x t/2S/ n ..,.. t/2S/ n)
式中S 为样本标准差,δ为容许误差, x
α一般取双侧 0.05,
.
8
例18-1. 拟用放射免疫法检测某人群(5000人)血液 归流脑特异免疫球蛋白含量,根据文献报道,其样 本标准差约为0.5mg/L²,允许误差为0.1mg/L,试 按单纯随机抽样估计样本例数。
调查得的样本率与未知实体率相差不超过10%的可
能性不大于0.05。如果用简单随机抽样,需要多少
调查对象?
1.9620.810.8
n
61.47
0.12.
10
二、分层随机抽样的样本含量的估计
按比例分配:
最优分配:
ni n.
Ni .i Ni .i
n Ni. i.(1i)
Ni. i.(1i)
ni
n.
Ni N
piq i
Ni piq i
Ni piq i
Ni piqi
ni
n
Ni Ni
piqi piq i
1 35000 0.04 0.96 0.20 6858.57 0.12
123
2 25000 0.40 0.60 0.49 12247.45 0.22
219
3 50000 0.20 0.80 0.40 20000.00 0.36
.
4
2、忽视应当保证足够的样本含量
样本例数过少,所得指标不够稳定,抽样误差大, 结论的可靠性差,用于推断总体的精度差,检验效能 低,导致总体中存在的差异未能检验出来,出现假阴 性(false negative)结果,这是当前医学研究中值得注意 的问题。
.
5
二、样本含量估计的影响因素
1.第一类错误概率大小(或置信度1-),越小,
(均数的抽样) (率的抽样 )
.
11
例18-3. 欲在15万人口的居民中调查某病患病率。 居民区分5层,样本总含量确定为1000人,根据按比 例分配和最优分配分层抽样(以三年前各层患病率 的数据作为参考),问各层分别应抽取多少人?
.
12

1 2 3 4 5 合计
表 18-1 按比例分配抽样各层应抽取的人数
人口数(Ni) 抽样比例(Ni/N) 样本含量(ni)
35000
0.233
233
25000
0.167
167
50000
0.333
333
10000
0.067
67
30000
0.200
200
150000(N)
1.000
1000(n)
表 18-2 按最优分配抽样各层应抽取的人数
层 人口数 三年前 qi=1-pi (Ni) 患病率 pi
α=0.05,β=0.2的条件下至少需要观察多少例。
.
18
n12 1.9 60 5..8 24 1 2 3 29.1 84
压差值的标准差为3.0kpa。当α=0.05,检验效能1β=0.8时,试估计需要多少病人进行临床试验?
.
15
n1
1.6
40 5.8 1.6
4 2 322.7 14
n2
1.7
20 0.8 1.6
59 322.3
8
n3
1.7
10 4.8 1.6
5 3 822.2 36
(二)两样本均数比较时
n1
n2
第十八章 样本含量的估计
.
1
第一节 样本含量估计的意义以及影响因素
一、样本含量估计的意义 样本含量(sample size),又称样本容量、
样本大小,是指在实验研究和调查研究中,每个样 本所包含的观察对象的数量。
它体现研究设计中重复性原则,其意义在于 估计研究中的误差,且抽样误差的大小与样本量有 关。足够的样本量也是实验研究中保证组间均衡性 的基础。
所需要的样本含量越大,根据研究问题的性质和
研究目的决定I型错误的概率值,通常情况下,取 0.05,可取单侧或双侧。
2.第二类错误概率大小,越小,检验效能1-越大,
所需样本量也越大,一般要求检验效能不低于0.80。
一般只取单侧。在参数估计的样本量估计中不涉 及,在假设检验的样本量估计中涉及。
.
6
3.容许误差δ,是指研究者要求的或客观实际存在
相关文档
最新文档