临床试验样本量的估算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床试验样本量的估算
样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。
因此样本量估计有些时候不是想做就能做的。
SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。
但是中国的国情?有多少厂家愿意多做?
建议方案里这么写:
从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。
或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。
假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。
非劣性试验(α=0.05,β=0.2)时:
计数资料:
平均有效率(P)等效标准(δ)
N=
公式:N=12.365×P(1-P)/δ2
计量资料:
共同标准差(S)等效标准(δ)
N=
公式:N=12.365× (S/δ)2
等效性试验(α=0.05,β=0.2)时:
计数资料:
平均有效率(P)等效标准(δ)
N=
公式:N=17.127×P(1-P)/δ2
计量资料:
共同标准差(S)等效标准(δ)
N=
公式:N=17.127× (S/δ)2
上述公式的说明:
1) 该公式源于郑青山教授发表的文献。
2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数;
3) P 是平均有效率,
4) S 是估计的共同标准差,
5) δ 是等效标准。
6) 通常都规定α=0.05,β=0.2(把握度80%)
上述计算的例数若少于国家规定的例数,按规定为准;多于国家规定的则以计算值为准。
具体规定的最小样本量如下:
II期,试验组100例;III期,试验组300例;随机对照临床验证(如3类化药)试验组100例。
IV期,2000例。
疫苗和避孕药与上述要求不同。
例1:某新药拟进行II 期临床试验,与阳性药按1:1 的比例安排例数,考察新药临床治愈率不差于阳性药。
根据以往的疗效和统计学的一般要求,取α=0.05,β=0.2,等效标准δ=0.15,平均有效率P=0.80,每组需要多少病例?
由公式计算得,N=12.365×0.8(1-0.8)/0.152=88(例)
以上88 例低于我国最低例数(100 例)的规定,故新药至少取100 例进行试验。
如上例作等效性分析,则得,
N=17.127×0.8(1-0.8)/0.152=122(例)。
例2:某利尿新药拟进行II 期临床试验,与阳性药按1:1 的比例安排例数,考察24h 新药利尿量不差于阳性药。
根据以往的疗效和统计学的一般要求,取α=0.05,β=0.2,等效标准δ=60 ml,已知两组共同标准差S=180 ml,每组需要多少病例?
由公式得,N=12.365× (180/60)2=111 例。
故本次试验新药和阳性药的例数均不少于111 例。
如上例作等效性分析,则得,N=17.127×
(180/60)2=154(例)。
[s:11]
临床试验研究中,无论是实验组还是对照组都需要有一定数量的受试对象。
这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的。
仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题。
必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来,并且可以对抽样误差做出客观地估计。
一般说来重复观测次数越多,抽样误差越小,观测结果的可信度越高。
一定数量的重复还可起到部分抵消混杂因素影响的作用,增强组间的可比性。
但重复观测次数越多(即样本含量越大)试验所要消耗的人力、物力、财力和时间越多,可能会使试验研究成为不可能。
而且,样本含量过大还会增加控制试验观测条件的难度,有可能引入非随机误差,给观测结果带来偏性(bias)。
所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本含量。
由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量相等来估计。
但在个别情况下,也可能要求各组样本含量按一定比例来估计。
1 与样本含量估计有关的几个统计学参数
在估计样本含量之前,首先要对以下几个统计学参数加以确定或
作出估计。
1.1 规定有专业意义的差值δ,即所比较的两总体参数值相差多大以上才有专业意义。
δ是根据试验目的人为规定的,但必须有一定专业依据。
习惯上把δ称为分辨力或区分度。
δ值越小表示对二个总体参数差别的区分度越强,因而所需样本含量也越大。
1.2 确定作统计推断时允许犯Ⅰ类错误(“弃真”的错误)的概率α,即当对比的双方总体参数值没有差到δ。
但根据抽样观测结果错误地得出二者有差别的推断结论的可能性,α确定的越小,所需样本含量越大。
在确定α时还要注意明确是单侧检验的α,还是双侧检验的α。
在同样大小的α条件下;双侧检验要比单侧检验需要更大的样本含量。
1.3 提出所期望的检验效能power,用1-β表示。
β为允许犯Ⅱ类错误(“取伪”的错误)的概率。
检验效能就是推断结论不犯Ⅱ类错误的概率1-β称把握度。
即当对比双方总体参数值间差值确实达到δ以上时,根据抽样观测结果在规定的α水准上能正确地作出有差别的推断结论的可能性。
在科研设计中常把1-β定为0.90或0.80。
一般来说1-β不宜低于0.75,否则可能出现非真实的阴性推断结论。
1.4 给出总体标准差σ或总体率π的估计值。
它们分别反映计量数据和计数数据的变异程度。
一般是根据前人经验或文献报道作出估计。
如果没有前人经验或文献报道作为依据,可通过预实验取得样本的标准差s或样本率P分别作为σ和π的估计值。
σ的估计值越大,π的估计值越接近0.5,所需样本含量越大。
在对以上统计学参数作出规定或估计的前提下,就可以根据不同的推断内容选用相应的公式计算出所需样本含量。
由于在同样的要求和条件下完全随机设计(成组设计)所需样本含量最大,故一般都要按完全随机设计作出样本含量的估计。
2 常用的估计样本含量的方法
2.1 两样本均数比较时样本含量估计方法
(1)两样本例数要求相等时可按下列公式估算每组需观察的例数n。
n=2*[(α+β)σ/δ]^2 (公式1)
式中δ为要求的区分度,σ为总体标准差或其估计值s,α、β分别是对应于α和β的u值,可由t界值表,自由度υ=∞-行查出来,α有单侧、双侧之分,β只取单侧值。
例1,某医师研究一种降低高血脂患者胆固醇药物的临床疗效,以安慰剂作对照。
事前规定试验组与对照组相比,平均多降低0.5 mmol/L以上,才有推广应用价值。
而且由有关文献中查到高血脂患者胆固醇值的标准差为0.8 mmol/L,若要求犯Ⅰ类错误的的概率不超过5%,犯Ⅱ类错误的概率不超过10%,且要两组例数相等则每组各需观察多少例?
本例δ=0.5 mmol/L,σ=0.8 mmol/L,α=0.05,β=0.10,1-β=0.90,查t界值表自由度为∞一行得单侧t0.05=1.645,t0.1=1.282,代入公式(1)
n=2*[(1.645+1.282)×0.8/0.5]^2=44
故要达到上述要求,两组至少各需观察44例。
(2)两样本例数要求呈一定比例(n2/n1=c)时,可按下列公式求出n1,再按比例求出n2=c*n1。
n1=[(α+β)σ/δ]^2*(1+C)/C (公式2)
例2 对例1资料如一切要求都维持不变,但要求试验组与对照组的例数呈2∶1比例(即C=2),问两组各需观察多少例?
n1=[(1.645+1.282)×0.8/0.5]^2×(1+2)/2 =33(例)(对照组所需例数)
n2=2×33=66(例)(试验组所需例数。
)
两组共需观察99例多于两组例数相等时达到同样要求时两组所需观察的总例数2×44=88。
2.2 配对设计计量资料样本含量(对子数)估计方法
配对设计包括异体配对、自身配对、自身前后配对及交叉设计的自身对照,均可按下列公式进行样本含量估计。
n=[(α+β)σd/δ]^2 (公式3)
式中δ、α、β的含义同前,σd为每对差值的总体标准差或其估计值sd。
例 3 某医院采用自身前后配对设计方案研究某治疗矽肺药物能否有效地增加矽肺患者的尿矽排出量。
事前规定服药后尿矽排出量平均增加35.6 mmol/L以上方能认为有效,根据预试验得到矽肺患者服药后尿矽排出量增加值的标准差sd=89.0 mmol/L,现在要求推断时犯Ⅰ类错误的概率控制在0.05以下(单侧),犯Ⅱ类错误的概率控制在
0.1以下,问需观察多少例矽肺病人?
本例δ=35.6 mmol/L,sd=89.0 mmol/L,α=0.05,β=0.10。
1-β=0.90,单侧t0.05=1.645,t0.1=1.282,代入公式(3)得到。
n=[(1.645+1.282)×89/35.6]^2=54(例)
故可认为如该药确实能达到平均增加尿矽排出量在35.6 mmol/L 以上,则只需观察54例病人就能有90%的把握,按照α=0.05的检验水准得出该药有增加矽肺病人尿矽作用的正确结论。
2.3 样本均数与总体均数比较时样本含量估计方法
可按下式估算所需样本含量n。
n=[(α+β)σ/δ]^2 (公式4)
例4已知血吸虫病人血红蛋白平均含量为90g/L,标准差为25g/L,现欲观察呋喃丙胺治疗后能否使血红蛋白增加,事先规定血红蛋白增加10g/L以上才能认为有效,推断结论犯Ⅰ类错误的概率α(双侧)不得超过0.05,犯Ⅱ类错误的概率β不得超过0.10,问需观察多少例病人?
本例δ=10g/L,σ=25g/L,0.05=1.96(双侧),0.10=1.282代入公式(4)得:
n=[(1.960+1.282)×25/10]^2=66(例)
故如果呋喃丙胺确实能使血吸虫病人血红蛋白平均含量增加10g/L以上,则只需观察66例就可以有90%的把握在α=0.05检验水准上得出有增加血吸虫病人血红蛋白平均含量的结论。