临床医学研究对象样本量的估计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床医学研究对象样本量的估计
宁夏医学杂志副主编蒋兴国
临床医学研究没有绝对的样本量标准,不同的研究方法、研究目的,研究要求和研究资料决定了样本量。
一般而言,样本越小,结果的估计越精确。
但样本过大或过小均可影响研究的可行性。
因此,科学地确定样本量可增加研究的可靠性,得到可信的研究结果。
1.估计样本量的决定因素[1]
1.1 资料性质
计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。
1.2 研究事件的发生率
研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。
1.3 研究因素的有效率
有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。
1.4 显著性水平
即假设检验第一类(α)错误出现的概率。
为假阳性错误出现的概率。
α越小,所需的样本量越大,反之就要越小。
α水平由研究者具情决定,通常α取0.05或0.01。
1.5 检验效能
检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。
即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。
检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。
β水平由研究者具情决定,通常取β为0.2,0.1或0.05。
即1-
β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。
1.6 容许的误差(δ)
如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。
容许误差越小,需要样本量越大。
一般取总体均数(1-α)可信限的一半。
1.7 总体标准差(s)
一般因未知而用样本标准差s代替。
1.8 双侧检验与单侧检验
采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。
当进行双侧检验或单侧检验时,其α或β的U a界值通过查标准正态分布的分位数表即可得到。
表1 标准正态分布的分位数表
2. 样本量的估算方法
由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。
2.1 现况研究
现况研究包括普查和抽样调查两类。
抽样调查是从总体中随机抽取一定数量的观察单位组成样本,然后用样本信息来推断总体特征,在设计中要考虑样本含量问题。
2.1.1 首先确定样本量的估算的参数
容许的误差(δ):如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少;在率的调查中,确定样本的率(p)和总体率(P)的最大容许误差为多少。
显著性水平(容许误差的概率α):一般取0.05或0.01。
总体标准差(s):根据以往的资料或小规模预调查的结果进行估计。
2.1.2 计量资料
2.1.2.1 对总体平均数m做估计调查的样本估计
公式: n=(Uασ/δ)(式2.1.2.1)
式中:n为所需样本大小;Ua为双侧检验中,a时U的界值,当a=0.05时, U0.05=1.96,a=0.01时,U0.01=2.58;s为总体标准差;δ为容许的误差。
例1:某学校有学生3500人,用单纯随机抽样调查学生的白细胞水平,根据预查标准差为950个/ mm ,允许误差不超过100个/mm ,应调查多少人?
N=3500 d=100个/mm s=950个/mm
a=0.05(双侧) Ua=1.96
n=(1.96×950/100) ≈347
2.1.2.2对样本均数与总体均数的差别做显著性检验时,所需样本的估计。
单侧检验用:n=[(U2α+ U2β)s/δ]
(式2.1.2.2-1)
双侧检验用:n=[(Uα+ U2β)s/δ]
(式2.1.2.2-2)
式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、 U2α、U2β分别为α、2α、2β检验水准的t值。
2.1.3 计数资料
2.1.
3.1 对总体率π做估计调查的样本大小
公式: n=(Uα/δ) /P(1-P)(式2.1.3.1)
式中:δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。
P为样本率。
例2:对某地HBsAg阳性率进行调查,希望所得的样本率(p)和总体率(P)之差不超过2%,基于小规模预调查样本率P=14%,应调查多少人? (规定a=0.05)
已知:δ=0.02, P=0.14,a=0.05 , Ua=1.96
n=(1.96/0.02)2/×0.14(1-0.14) =1156
需调查约1160人.
2.1.
3.2 对样本率与总体率的差别做显著性检验时,所需样本的估计。
单侧检验用:n=(U2α+ U2β/δ2)(式2.1.3.2-1)
双侧检验用:n=(Uα+ U2β/δ )(式2.1.3.2-2)
式中:α与β分别为第一类错误及第二类错误出现的概率,Uα、 U2α、U2β分别为α、2α、2β检验水准的t值。
2.1.
3.3对样本均数与总体均数的差别做显著性检验时,所需样本的估计。
单侧检验用:n=[(U2α+ U2β)s/δ] P(1-P)
式2.1.3.3-1)
双侧检验用:n=[(Uα+ U2β)s/δ] P(1-P)
(2.1.3.3-2)
式中: Uα、 U2α、U2β分别为α、2α、2β检验水准的U值。
2.2 病例对照研究的样本量估计
选择患有特定疾病的人群作为病例组,和未患这种疾病的人群作为对照组,调查两组人群过去暴露于某种(些)可能危险因素的比例,判断暴露危险因素是否与疾病有关联及其关联程度大小的一种观察性研究。
2.2.1设置估算样本量的相关值
①人群中研究因素的暴露率(对照组在目标人群中估计的暴露率);
②比值比 (odds ratio,OR) 估计出的各研究因素的相对危险度或暴露的比值比(即RR或OR)
③α值,检验的显著性水平,通常取α=0.01或0.05;
④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。
根据以上有关参数查表或代公式计算
公式为:
n=(U +U ) /(p1-p0)2(式2.2.2)
p1=p0×OR/1-p0+OR×P0
=1/2(p1+p0) =1-
q1=1-p1 q0=1-p0
式中:
U U 分别为a与β检验水准的U值。
p0与P1分别为对照组及病例组人群估计的暴露率;
OR为主要暴露因子的相对危险度或暴露的比值比(RR或OR)。
q0=1-P0, q1=1-P1;
为两组暴露史比例的平均值,
既 =(P1+P2)/2, Q1=1-P1;
例:拟用病例对照研究法调查孕妇暴露于某因子与婴儿先天性心脏病的关系。
估计孕妇有30%暴露于此因子。
现要求在暴露造成相对危险度为2时,即能在95%的显著性水平以90%的把握度查出,病例组和对照组各需多少例?
p0=0.3 OR=2,设α=0.05, β=0.10,
用双侧检验Uα=1.96 Uβ =1.282
p1=(0.3×2)/[1+0.3(2-1)]=0.46
q0=1-0.3=0.7 =1/2(0.3+0.46)=0.38
q1=1-0.46=0.54 =1-0.38=0.62
n=(1.96 +1.282 )2/(0.46-0.3)2≈192 ,即病例组与对照组各需192人.
2.3实验研究的样本量计算
2.3.1 计量资料: 计量资料指身高、体重、血压、血脂和胆固醇等数值变量。
估计公式为:
n=2(Uα+Uβ)2δ2/ d2 (2-3-1)
n为计算所得一个组的样本人数,如果两组的人数相等,则全部试验所需的样本大小为2n;
Uα为显著性水平相应的标准正态差;
Uβ为β相应的标准正态差;
δ为估计的标准差,δ2=(δ12+δ22)/2;
d为两组数值变量均值之差,
例题:某新药治疗高血压,将研究对象随机分为治疗组和对照组。
假设:a=0.05, β=0.10,血压的标准差分别为9.7与12.3mmHg,检测两组的血压差为2.6mmHg。
查表:zα=1.96,
zβ=1.282(双侧检验),需要多大样本。
2.3.2 计数资料:即非连续变量资料,如发病率、感染率、阳性率、死亡率、病死率、治愈率、有效率等。
当现场试验的评价指标是非连续变量时,按下式计算样本大小:
n=[U +U ] /(P -P ) (2.3.2)
P :对照组发生率
P :实验组发生率
:(P + P )/2
U 、U 和n所示意义同上。
例:假设对照组发病率40%,通过干预措施发病率下降到30%。
α水平为5%,1-β为90%,本研究为双侧检验,问二组要观察多少人?
=(0.4+0.3)/2=0.35
代入公式(16-8):
n=[1.96 +1.282 ] /(0.4-0.3)
≈476
即各组需476人。
2.4 诊断试验的样本量估计
2.4.1 设置估算样本量的相关值
①灵敏度60%;
②特异度60%;
③α值,检验的显著性水平,通常取α=0.01或0.05;
④期望的把握度(1-β),通常区β=0.10或0.20;即把握度为90%或80%。
2.4.2 计算公式
公式: n=(Uα/δ) /P(1-P)(式2.4.2)
式中:
Uα为显著性水平相应的U值,通常取α=0.01或0.05;
δ为容许的误差:即允许样本率(p)和总体率(P)的最大容许误差为多少。
P为诊断试验的灵敏度或特异度;
例:预计所评价的诊断试验的灵敏度为90%,特异度85%;
δ=0.025,规定a=0.05,病例组和对照组应调查多少人? ()
已知:δ=0.02, a=0.05 , Ua=1.96
n=(1.96/0.025)2/×0.85(1-0.85) =783
n=(1.96/0.025)2/×0.90(1-0.90) =553
对照组需783人, 病例组需553人。
参考文献
天小胖给大家简单介绍一下最常见的power-based sample size calculation,不外乎两种最常见的情况,一是连续性变量的比较和分类变量的比较。
1. 连续性变量:
假如你想比较治疗组与对照组某个变量的均值,那么每组需要的样本量是:
N=f(α,β)*2*S2/δ2
f(α,β):根据α和β计算所得,最常用的为:
当α=0.05, β=0.2时,f(α,β)=7.9
当α=0.05, β=0.1时,f(α,β)=10.5
δ为你认为的有意义的两组最小能检测出的差异值,通常根据文献以及临床实践来确定
S 为标准差,需要根据以前的研究来确定
血压的例子:
假设标准差为20mmHg,有90%的把握度在0.05显著水平上能检验出治疗组和对照组10mmHg的差异,则需要的样本量为每组:
N=f(α,β)*2*S2/δ2=10.5*2*202/102=84
以下是关于这类样本量计算的描述,供大家写方案时参考:
英文:
The total target sample size will be … subjects (…subjects per treatment). With this sample size, a difference of …between (active arm) and (control arm) in (primary endpoint) can be detected with (X) % power assuming a stan dard deviation of … and significance level of ….
中文:
假设标准差为xx,则需xx例受试者(每组xx)有90%的把握度在xx显著水平上检验出治疗组和对
照组xx的差异。
当然在最后的样本量确定时,还要考虑一定的失访率。
总结一下,在这个两均数比较的样本量的计算中,你需要知道的什么?
标准差和差异!
Remember!
一、参数估计的意义
一组调查或实验数据,如果是计量资料可求得平均数,标准差等统计指标,如果是计数资料则求百分率藉以概括说明这群观察数据的特征,故称特征值。
由于样本特征值是通过统计求得的,所以又
称为统计量以区别于总体特征值。
总体特征值一般称为参数(总体量)。
我们进行科研所要探索的是总体特征值即总体参数,而我们得到的却是样本统计量,用样本统计量估计或推论总体参数的过程叫参数估计。
本章第一节例6.1通过检查110个健康成人的尿紫质算得阳性率为10%,这是样本率,可用它来估计总体率,说明健康成人的尿紫质阳性率水平,这样的估计叫“点估计”。
但由于存在抽样误差,不同样本(如再检查110人)可能得到不同的估计值。
因此我们常用“区间估计”总体率(或总体均数)大概在那一个范围内,这个范围就叫可信区间。
区间小的一端叫下限,大的一端叫上限。
常用的有95%可信区间与99%可信区间。
根据同一资料所作95%可信区间比99%可信区间窄些(上、下限较靠近),但估计错误的概率后者为1%,前者为5%,进行总体参数的区间估计时可根据研究目的与标准误的大
小选用95%、或99%。
二、总体均数的估计
为了说明常用的总体均数之区间估计法,我们不妨回顾一下上节所叙的t分布。
由求t的基本公式
我们看到X与μ的距离等于t(SX),又根据X集中分布在μ周围的特点,若取t的5%界即
t0.05,(或1%界)乘以SX作为X与μ的距离范围,就可用式(6.6)或式(6.7)求出区间来估计总体均数μ所在医`学教`育网搜`集整理范围,估错的概率仅有5%或1%,因此称95%或99%可信区间。
下面用实例说明其求法。
95%可信区间X-t0.05,νSX<μ99%可信区间X-t0.05,νSX<μ
例6.2上面抽样实验中第1号样本的均数为488.6,标准差为61.65,例数10,自由度ν=10-1=9,
试求95%与99%可信区间。
1.求标准误
95%可信区间488.6-2.262(19.50)<μ<488.6+2.262(19.50),即有95%的把握估计μ是在444.49~532.71区间内99%可信区间488.6-3.250(19.50)<μ<488.6+3.250(19.50),可有99%的把握
估计μ是在425.22~551.98区间内这里两个可信区间都包含μ=500在内,所以这次估计是估计对了。
抽样实验共抽了100个样本,除1号样本外其余99个样本均数也对μ作了区间估计,这些95%可信区间列在表6.4中。
我们看到,只有5个95%可信区间(右上角标有星号)不包含总体均数μ=500在内,
它们是:
平时我们并不重复抽取许多样本来一次次估计总体均数而仅是一次,至于算出的均数会类似一百
个样本均数中的那一个就很难说了。
如果不遇到类似上列那些均数过大或过小的样本,求出可信区间
后总体均数真是在该区间内,那么便是一次成功的估计:但是极少数情况下我们也会遇到极端的样本,以至总体均数并不在我们提出的区间内。
不过,我们具体所作的这次估计到底属于前种情况还是后一种,这是无法知道的,因为我们不知道μ是多少(若已知μ便不必估计它了)。
然而象后种情况那样作出错估的概率终究很小,只5%或1%,所以用这样的方法估计总体均数还是可行的。
三、总体率的估计
上面已经提到,计数资料可以计算相对数(率)。
我们若由样本统计量P估计总体参数π,同样
要考虑率的抽样误差,据数理统计研究结果,样本率的分布也近似正态分布,尤其当π比较靠近50%且样本较大时。
于是对样本,百分率的可信区间可利用正态分布规律估计,公式是:
95%可信区间P-1.96Sp<π
99%可信区间P-2.58Sp<π
(按正态分布,双侧尾部面积α=0.05时的u值为1.96,α=0.01时的u值为2.58,故用这两式求可
信区间时不必查表找临界u值,记住这两数即可。
)
例6.3某医院收治200例急性菌痢患者,其中粪便细菌培养阳性者共80例,试估计菌痢细菌培养
的总体阳性率95%与99%可信区间。
1.求阳性率P=80/200×100%=40%(或0.40)
2.
3.求可信区间
95%可信区间40%-1.96(3.46%)<π<40%+1.96(3.46%),即估计π在33.22%~46.78%之间99%可信区间40%-2.58(3.46%)<π<40%+2.58(3.46%),即估计π在31.07%~48.93%之间
如果是小样本的百分率,求可信区间可通过查表获得,附表4是n为10、15、20、30时查95%与99%可信区间的一个简表。
此外,统计学专著中还有更详细的表可查。