临床医学研究对象样本量的估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床医学研究对象样本量的估计
临床医学研究对象样本量的估计
宁夏医学杂志副主编蒋兴国
临床医学研究没有绝对的样本量标准,不同的研究⽅法、研究⽬的,研究要求和研究资料决定了样本量。
⼀般⽽⾔,样本越⼩,结果的估计越精确。
但样本过⼤或过⼩均可影响研究的可⾏性。
因此,科学地确定样本量可增加研究的可靠性,得到可信的研究结果。
1.估计样本量的决定因素[1]
1.1 资料性质
计量资料如果设计均衡,误差控制得好,样本可以⼩于30例; 计数资料即使误差控制严格,设计均衡, 样本需要⼤⼀些,需要30-100例。
1.2 研究事件的发⽣率
研究事件预期结局出现的结局(疾病或死亡),疾病发⽣率越⾼,所需的样本量越⼩,反之就要越⼤。
1.3 研究因素的有效率
有效率越⾼,即实验组和对照组⽐较数值差异越⼤,样本量就可以越⼩,⼩样本就可以达到统计学的显著性,反之就要越⼤。
1.4 显著性⽔平
即假设检验第⼀类(α)错误出现的概率。
为假阳性错误出现的概率。
α越⼩,所需的样本量越⼤,反之就要越⼩。
α⽔平由研究者具情决定,通常α取0.05或0.01。
1.5 检验效能
检验效能⼜称把握度,为1-β,即假设检验第⼆类错误出现的概率,为假阴性错误出现的概率。
即在特定的α⽔准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能⼒,β越⼩,
检验效能越⾼,所需的样本量越⼤,反之就要越⼩。
β⽔平由研究者具情决定,通常取β为0.2,0.1或0.05。
即1-β=0.8,0.1或
0.95,也就是说把握度为80%,90%或95%。
1.6 容许的误差(δ)
如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最⼤的误差为多少。
容许误差越⼩,需要样本量越⼤。
⼀般取总体均数(1-α)可信限的⼀半。
1.7 总体标准差(s)
⼀般因未知⽽⽤样本标准差s代替。
1.8 双侧检验与单侧检验
采⽤统计学检验时,当研究结果⾼于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就⼤; 当研究结果仅⾼于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就⼩。
当进⾏双侧检验或单侧检验时,其α或β的U a界值通过查标准正态分布的分位数表即可得到。
表1 标准正态分布的分位数表
2. 样本量的估算⽅法
由于对变量或资料采⽤的检验⽅法不同,具体设计⽅案的样本量计算⽅法各异,只有通过查阅资料,借鉴他⼈的经验或进⾏预实验确定估计样本量决定因素的参数,便可进⾏估算。
2.1 现况研究
现况研究包括普查和抽样调查两类。
抽样调查是从总体中随机抽取⼀定数量的观察单位组成样本,然后⽤样本信息来推断总体特征,在设计中要考虑样本含量问题。
2.1.1 ⾸先确定样本量的估算的参数
容许的误差(δ):如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最⼤的误差为多少;在率的调查中,确定样本的率(p)和总体率(P)的最⼤容许误差为多少。
显著性⽔平(容许误差的概率α):⼀般取0.05或0.01。
总体标准差(s):根据以往的资料或⼩规模预调查的结果进⾏估计。
2.1.2 计量资料
2.1.2.1 对总体平均数m做估计调查的样本估计
公式: n=(Uασ/δ)(式2.1.2.1)
式中:n为所需样本⼤⼩;Ua为双侧检验中,a时U的界值,当a=0.05时, U0.05=1.96,a=0.01时,U0.01=2.58;s为总体标准差;δ为容许的误差。
例1:某学校有学⽣3500⼈,⽤单纯随机抽样调查学⽣的⽩细胞⽔平,根据预查标准差为950个/ mm ,允许误差
不超过100个/mm ,应调查多少⼈?
N=3500 d=100个/mm s=950个/mm
a=0.05(双侧) Ua=1.96
n=(1.96×950/100) ≈347
2.1.2.2对样本均数与总体均数的差别做显著性检验时,所需样本的估计。
单侧检验⽤:n=[(U2α+ U2β)s/δ]
(式2.1.2.2-1)
双侧检验⽤:n=[(Uα+ U2β)s/δ]
(式2.1.2.2-2)
式中:α与β分别为第⼀类错误及第⼆类错误出现的概率,Uα、 U2α、U2β分别为α、2α、2β检验⽔准的t值。
2.1.3 计数资料
2.1.
3.1 对总体率π做估计调查的样本⼤⼩
公式: n=(Uα/δ) /P(1-P)(式2.1.3.1)
式中:δ为容许的误差:即允许样本率(p)和总体率(P)的最⼤容许误差为多少。
P为样本率。
例2:对某地HBsAg阳性率进⾏调查,希望所得的样本率(p)和总体率(P)之差不超过2%,基于⼩规模预调查样本率P=14%,应调查多少⼈? (规定a=0.05)
已知:δ=0.02, P=0.14,a=0.05 , Ua=1.96
n=(1.96/0.02)2/×0.14(1-0.14) =1156
需调查约1160⼈.
2.1.
3.2 对样本率与总体率的差别做显著性检验时,所需样本的估计。
单侧检验⽤:n=(U2α+ U2β/δ2)(式2.1.3.2-1)
双侧检验⽤:n=(Uα+ U2β/δ)(式2.1.3.2-2)
式中:α与β分别为第⼀类错误及第⼆类错误出现的概率,Uα、 U2α、U2β分别为α、2α、2β检验⽔准的t值。
2.1.
3.3对样本均数与总体均数的差别做显著性检验时,所需样本的估计。
单侧检验⽤:n=[(U2α+ U2β)s/δ] P(1-P)
式2.1.3.3-1)
双侧检验⽤:n=[(Uα+ U2β)s/δ] P(1-P)
(2.1.3.3-2)
式中: Uα、 U2α、U2β分别为α、2α、2β检验⽔准的U值。
2.2 病例对照研究的样本量估计
选择患有特定疾病的⼈群作为病例组,和未患这种疾病的⼈群作为对照组,调查两组⼈群过去暴露于某种(些)可能危险因素的⽐例,判断暴露危险因素是否与疾病有关联及其关联程度⼤⼩的⼀种观察性研究。
2.2.1设置估算样本量的相关值
①⼈群中研究因素的暴露率(对照组在⽬标⼈群中估计的暴露率);
②⽐值⽐ (odds ratio,OR) 估计出的各研究因素的相对危险度或暴露的⽐值⽐(即RR或OR)
③α值,检验的显著性⽔平,通常取α=0.01或0.05;
④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。
根据以上有关参数查表或代公式计算
公式为:
n=(U +U ) /(p1-p0)2(式2.2.2)
p1=p0×OR/1-p0+OR×P0
=1/2(p1+p0) =1-
q1=1-p1 q0=1-p0
式中:
U U 分别为a与β检验⽔准的U值。
p0与P1分别为对照组及病例组⼈群估计的暴露率;
OR为主要暴露因⼦的相对危险度或暴露的⽐值⽐(RR或OR)。
q0=1-P0, q1=1-P1;
为两组暴露史⽐例的平均值,
既 =(P1+P2)/2, Q1=1-P1;
例:拟⽤病例对照研究法调查孕妇暴露于某因⼦与婴⼉先天性⼼脏病的关系。
估计孕妇有30%暴露于此因⼦。
现要求在暴露造成相对危险度为2时,即能在95%的显著性⽔平以90%的把握度查出,病例组和对照组各需多少例?
p0=0.3 OR=2,设α=0.05, β=0.10,
⽤双侧检验Uα=1.96 Uβ =1.282
p1=(0.3×2)/[1+0.3(2-1)]=0.46
q0=1-0.3=0.7 =1/2(0.3+0.46)=0.38
q1=1-0.46=0.54 =1-0.38=0.62
n=(1.96 +1.282 )2/(0.46-0.3)2≈192 ,即病例组与对照组各需192⼈.
2.3实验研究的样本量计算
2.3.1 计量资料: 计量资料指⾝⾼、体重、⾎压、⾎脂和胆固醇等数值变量。
估计公式为:
n=2(Uα+Uβ)2δ2/ d2 (2-3-1)
n为计算所得⼀个组的样本⼈数,如果两组的⼈数相等,则全部试验所需的样本⼤⼩为2n;
Uα为显著性⽔平相应的标准正态差;
Uβ为β相应的标准正态差;
δ为估计的标准差,δ2=(δ12+δ22)/2;
d为两组数值变量均值之差,
例题:某新药治疗⾼⾎压,将研究对象随机分为治疗组和对照组。
假设:a=0.05, β=0.10,⾎压的标准差分别为9.7与12.3mmHg,检测两组的⾎压差为2.6mmHg。
查表:zα=1.96,
zβ=1.282(双侧检验),需要多⼤样本。
2.3.2 计数资料:即⾮连续变量资料,如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。
当现场试验的评价指标是⾮连续变量时,按下式计算样本⼤⼩:
n=[U +U ] /(P -P ) (2.3.2)
P :对照组发⽣率
P :实验组发⽣率
:(P + P )/2
U 、U 和n所⽰意义同上。
例:假设对照组发病率40%,通过⼲预措施发病率下降到30%。
α⽔平为5%,1-β为90%,本研究为双侧检验,问⼆组要观察多少
⼈?
=(0.4+0.3)/2=0.35
代⼊公式(16-8):
n=[1.96 +1.282 ] /(0.4-0.3)
≈476
即各组需476⼈。
2.4 诊断试验的样本量估计
2.4.1 设置估算样本量的相关值
①灵敏度60%;
②特异度60%;
③α值,检验的显著性⽔平,通常取α=0.01或0.05;
④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。
2.4.2 计算公式
公式: n=(Uα/δ) /P(1-P)(式2.4.2)
式中:
Uα为显著性⽔平相应的U值,通常取α=0.01或0.05;
δ为容许的误差:即允许样本率(p)和总体率(P)的最⼤容许误差为多少。
P为诊断试验的灵敏度或特异度;
例:预计所评价的诊断试验的灵敏度为90%,特异度85%;
δ=0.025,规定a=0.05,病例组和对照组应调查多少⼈? ()
已知:δ=0.02, a=0.05 , Ua=1.96
n=(1.96/0.025)2/×0.85(1-0.85) =783
n=(1.96/0.025)2/×0.90(1-0.90) =553
对照组需783⼈, 病例组需553⼈。
参考⽂献
天⼩胖给⼤家简单介绍⼀下最常见的power-based sample size calculation,不外乎两种最常见的情况,⼀是连续性变量的⽐较和分类变量的⽐较。
1. 连续性变量:
假如你想⽐较治疗组与对照组某个变量的均值,那么每组需要的样本量是:
N=f(α,β)*2*S2/δ2
f(α,β):根据α和β计算所得,最常⽤的为:
当α=0.05, β=0.2时,f(α,β)=7.9
当α=0.05, β=0.1时,f(α,β)=10.5
δ为你认为的有意义的两组最⼩能检测出的差异值,通常根据⽂献以及临床实践来确定
S 为标准差,需要根据以前的研究来确定
⾎压的例⼦:
假设标准差为20mmHg,有90%的把握度在0.05显著⽔平上能检验出治疗组和对照组10mmHg的差异,则需要的样本量为每组:
N=f(α,β)*2*S2/δ2=10.5*2*202/102=84
以下是关于这类样本量计算的描述,供⼤家写⽅案时参考:
英⽂:
The total target sample size will be … subjects (…subjects per treatment). With this sample size, a difference of …between (active arm) and (control arm) in (primary endpoint) can be detected with (X) % power assuming a stan dard deviation of … and significance level of ….
中⽂:
假设标准差为xx,则需xx例受试者(每组xx)有90%的把握度在xx显著⽔平上检验出治疗组和对
照组xx的差异。
当然在最后的样本量确定时,还要考虑⼀定的失访率。
总结⼀下,在这个两均数⽐较的样本量的计算中,你需要知道的什么?
标准差和差异!
Remember!
⼀、参数估计的意义
⼀组调查或实验数据,如果是计量资料可求得平均数,标准差等统计指标,如果是计数资料则求百分率藉以概括说明这群观察数据的特征,故称特征值。
由于样本特征值是通过统计求得的,所以⼜
称为统计量以区别于总体特征值。
总体特征值⼀般称为参数(总体量)。
我们进⾏科研所要探索的是总体特征值即总体参数,⽽我们得到的却是样本统计量,⽤样本统计量估计或推论总体参数的过程叫参数估计。
本章第⼀节例6.1通过检查110个健康成⼈的尿紫质算得阳性率为10%,这是样本率,可⽤它来估计总体率,说明健康成⼈的尿紫质阳性率⽔平,这样的估计叫“点估计”。
但由于存在抽样误差,不同样本(如再检查110⼈)可能得到不同的估计值。
因此我们常
⽤“区间估计”总体率(或总体均数)⼤概在那⼀个范围内,这个范围就叫可信区间。
区间⼩的⼀端叫下限,⼤的⼀端叫上限。
常⽤的有95%可信区间与99%可信区间。
根据同⼀资料所作95%可信区间⽐99%可信区间窄些(上、下限较靠近),但估计错误的概率后者为1%,前者为5%,进⾏总体参数的区间估计时可根据研究⽬的与标准误的⼤
⼩选⽤95%、或99%。
⼆、总体均数的估计
为了说明常⽤的总体均数之区间估计法,我们不妨回顾⼀下上节所叙的t分布。
由求t的基本公式
我们看到X与µ的距离等于t(SX),⼜根据X集中分布在µ周围的特点,若取t的5%界即
t0.05,(或1%界)乘以SX作为X与µ的距离范围,就可⽤式(6.6)或式(6.7)求出区间来估计总体均数µ所在医`学教`育⽹搜`集整理范围,估错的概率仅有5%或1%,因此称95%或99%可信区间。
下⾯⽤实例说明其求法。
95%可信区间X-t0.05,νSX<µ99%可信区间X-t0.05,νSX<µ
例6.2上⾯抽样实验中第1号样本的均数为488.6,标准差为61.65,例数10,⾃由度ν=10-1=9,
试求95%与99%可信区间。
1.求标准误
95%可信区间488.6-2.262(19.50)<µ<488.6+2.262(19.50),即有95%的把握估计µ是在444.49~532.71区间内99%可信区间488.6-3.250(19.50)<µ<488.6+3.250(19.50),可有99%的把握
估计µ是在425.22~551.98区间内这⾥两个可信区间都包含µ=500在内,所以这次估计是估计对了。
抽样实验共抽了100个样本,除1号样本外其余99个样本均数也对µ作了区间估计,这些95%可信区间列在表6.4中。
我们看到,只有5个95%可信区间(右上⾓标有星号)不包含总体均数µ=500在内,
它们是:
平时我们并不重复抽取许多样本来⼀次次估计总体均数⽽仅是⼀次,⾄于算出的均数会类似⼀百
个样本均数中的那⼀个就很难说了。
如果不遇到类似上列那些均数过⼤或过⼩的样本,求出可信区间
后总体均数真是在该区间内,那么便是⼀次成功的估计:但是极少数情况下我们也会遇到极端的样本,以⾄总体均数并不在我们提出的区间内。
不过,我们具体所作的这次估计到底属于前种情况还是后⼀种,这是⽆法知道的,因为我们不知道µ是多少(若已知µ便不必估计它了)。
然⽽象后种情况那样作出错估的概率终究很⼩,只5%或1%,所以⽤这样的⽅法估计总体均数还是可⾏的。
三、总体率的估计
上⾯已经提到,计数资料可以计算相对数(率)。
我们若由样本统计量P估计总体参数π,同样
要考虑率的抽样误差,据数理统计研究结果,样本率的分布也近似正态分布,尤其当π⽐较靠近50%且样本较⼤时。
于是对样本,百分率的可信区间可利⽤正态分布规律估计,公式是:
95%可信区间P-1.96Sp<π
99%可信区间P-2.58Sp<π
(按正态分布,双侧尾部⾯积α=0.05时的u值为1.96,α=0.01时的u值为2.58,故⽤这两式求可
信区间时不必查表找临界u值,记住这两数即可。
)
例6.3某医院收治200例急性菌痢患者,其中粪便细菌培养阳性者共80例,试估计菌痢细菌培养
的总体阳性率95%与99%可信区间。
1.求阳性率P=80/200×100%=40%(或0.40)
2.
3.求可信区间
95%可信区间40%-1.96(3.46%)<π<40%+1.96(3.46%),即估计π在33.22%~46.78%之间99%可信区间40%-
2.58(
3.46%)<π<40%+2.58(3.46%),即估计π在31.07%~48.93%之间
如果是⼩样本的百分率,求可信区间可通过查表获得,附表4是n为10、15、20、30时查95%与99%可信区间的⼀个简表。
此外,统计学专著中还有更详细的表可查。