新药临床非劣及等效性试验中的例数估计和等效标准
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
此文发表于:中国新药杂志2003;12(5): 368-371
新药临床非劣及等效性试验中的例数估计和等效标准
郑青山1,孙瑞元1,陈志扬2
(1安徽省药物临床评价中心、皖南医学院弋矶山医院,芜湖 241001;
2华中科技大学同济医学院,武汉 430030)
[摘要] 本文根据新药临床研究的要求和特点,提出临床非劣及等效性试验例数估计的简算法和查表法,并探讨确定等效标准(δ)的几种方法,可供例数估算时参考。
[关键词] 临床试验;非劣性试验;等效性试验;样本含量;等效标准
Sample size estimation and equivalence margin in noninferiority and equivalence trials
ZHENG Qing-shan1, SUN Rui-yuan1, CHEN Zhi-yang2
(1 Anhui Provincial Center for Drug Clinical Evaluation & Yijishan Hospital of Wannan Medical College, Wuhu 241001,China; 2 Tongji Medical College, Huazhong University of Science and Technology, Wuhan 430030,China)
[Abstract] Based on the character and requirements of new drug clinical trials, a simple algorithm for estimating sample size and some methods for determination of equivalence margin (δ) in noninferiority and equivalence clinical trials were provided in this paper.
[Key words] noninferiority trial; equivalence trial; sample size; equivalence margin
临床试验中作两药等效判别,不能依据“显著性检验P>0.05”,而应采用“非劣或等效性试验(noninferiority or equivalence trials) 的P<0.05” [1-3]。
实施时尚存在α、β的确定,单、双侧的选择,等效标准(δ)的规定,以及等效或非劣性试验所估算的例数是否会远远大于显著性检验所估算的例数等。
本文就此作一探讨,并提出例数估算的实用简捷算法。
1 例数估计的简捷算法
1.1 例数估算公式一般统计书籍列出例数估算公式时,α及β是可以任意选择的,还有单、双侧的区别,常使临床医师难以选择。
对于计数资料(率),其例数估算公式为:
非劣性试验:N=2×( Uα+Uβ)2×P (1-P)/δ2=C1×P(1-P)/δ2(式1)
等效性试验:N=2× (Uα+Uβ/2)2×P(1-P)/δ2=C2×P(1-P)/δ2 (式2)
对于计量资料(均数) ,其例数估算公式为:
非劣性试验:N=2× (Uα+Uβ)2× (S/δ)2=C1× (S/δ)2(式3)
等效性试验:N=2× (Uα+Uβ/2)2× (S/δ)2=C2× (S/δ)2(式4)
其中δ是等效标准(界值),Uα、Uβ为单侧标准正态离差界值,N为样本含量,P是平均有效率,S是估计的共同标准差,C1和C2为系数项。
注意:等效性试验实际是高方向及低方向的两个单侧检验,因此在估算例数时,应采用Uβ/2,而不是用Uα/2[4]。
1.2例数简算公式式1-4计算要查出Uα、Uβ、Uβ/2等值,使用不够方便。
其实在临床试验中通常用α=0.05,β=0.2 (把握度=80%),非劣性试验为单侧检验,等效性试验为两个单侧检验。
在此情况下,只要求出以上系数(C1和C2),例数估算公式可简化为:
非劣性试验(α=0.05,β=0.2)时:
计数资料:N=12.365×P(1-P)/δ2 (式5)
计量资料:N=12.365× (S/δ)2(式6)等效性试验(α=0.05,β=0.2)时:
计数资料:N=17.127×P(1-P)/δ2(式7)
计量资料:N=17.127× (S/δ)2 (式8)其中N 是每组的估算例数N1=N2,N1和N2分别为试验药和参比药的例数;P是平均有效率,S是估计的共同标准差,δ是等效标准。
式5-8为β=0.2的计算结果。
如β=0.1时,上式算得的非劣性试验例数再乘以1.385,而等效性试验所得例数再乘以1.264即可。
当两组例数不等时,如N1=k×N2,先按式5-8算得N,再按下式计算:N1≈N (1+k) /2,N2≈
N×(1+k)/2k =N1/k。
如新药与阳性药按1:2进行试验(II期临床试验通常为1:1),则k=2, 如按式
4-8算得N=88(见下文例1),新药例数N1= 88×(1+2)/2 =132例,阳性药例数N2=132/2=66例。
1.3 举例以下就计数资料和计量资料的例数估计各举一例。
例1:某新药拟进行II期临床试验,与阳性药按1:1的比例安排例数,考察新药临床治愈率不差于阳性药。
根据以往的疗效和统计学的一般要求,取α=0.05,β=0.2,等效标准δ=0.15,平均有效率P=0.80,每组需要多少病例?
由式5得,N=12.365×0.8(1-0.8)/0.152=88(例)
以上88例低于我国最低例数(100例)的规定,故新药至少取100例进行试验。
如上例作等效性分析,则由式7得,N=17.127×0.8(1-0.8)/0.152=122(例)。
例2:某利尿新药拟进行II期临床试验,与阳性药按1:1的比例安排例数,考察24h新药利尿量不差于阳性药。
根据以往的疗效和统计学的一般要求,取α=0.05,β=0.2,等效标准δ=60 ml,已知两组共同标准差S=180 ml,每组需要多少病例?
由式6得,N=12.365× (180/60)2=111例。
故本次试验新药和阳性药的例数均不少于111例。
如上例作等效性分析,则由式8得,N=17.127×(180/60)2=154(例)。
1.4 讨论
1. 新药研究的目的往往在于不劣于老药,故非劣性试验更为多用,故式5和式6(β=0.2)为基本公式,其系数1
2.365的可记忆成12个月和365天。
与非劣性试验相比,等效性试验例数(β=0.1或β=2)增加约1.3(1.264-1.385)倍。
2. 用式3-4计算计量资料(均数)时,统计学上要求按自由度对Uα、Uβ进行逐次校正。
实际上II(III)期临床新药+对照药最低例数一般不少于100+100 (300+100),自由度高达198(398)。
用式3-4计算的例数只比逐次校正计算者多1%(0.775%),也即100+100例时只多1例(300+100时也只多1例)基本上可略而不计。
2 例数估算的实用简表
2.1 计数资料例数估算表表1根据临床实际应用,确定α=0.05,β=0.2,P为估计的共同有效率,δ为等效标准。
根据例1中预设的参数,可根据表1直接查出N=88例。
表 1 计数资料(有效率)例数估算表(α=0.05,β=0.2)
平均有效率δ(非劣性试验)δ(等效性试验)
(P)0.10.150.20.10.150.2
0.95 592615813620
0.90 11149281546939
0.85 15870392189755
0.80 198884927412269
0.75 2321035832114380
0.70 2601156536016090
0.65 2811257039017397
0.60 29713274411183103
0.55 30613677424188106
0.50 30913777428190107
0.45 30613677424188106
0.40 29713274411183103
0.35 2811257039017397
0.30 2601156536016090
0.25 2321035832114380
0.20 198884927412269
0.15 15870392189755
0.10 11149281546939
0.05 592615813620
注:表中等效性试验所需例数恒为非劣性试验所需例数的1.385倍
2.2 计量资料例数估算表表2中S为估计的共同标准差,δ为等效标准。
根据例2中预设的参数,可根据表2直接查出N=111例。
表 2 计量资料(均数)例数估算表(α=0.05,β=0.2)
S/δ非劣性试验等效性试验S/δ非劣性试验等效性试验
2.04969
3.6 160 222
2.15576
3.7 169 235
2.26083
3.8 179 247
2.36591
3.9 188 261
2.47199 4.0 198 274
2.577107 4.1 208 288
2.684116 4.2 218 302
2.790125 4.3 229 317
2.897134 4.4 239 332
2.9104144 4.5 250 347
3.0111154
4.6 262 362
3.1119165
4.7 273 378
3.2127175
4.8 285 395
3.3135187
4.9 297 411
3.4143198 5.0 309 428
3.5151210 6.0 445 617
注:表中等效性试验所需例数恒为非劣性试验所需例数的1.385倍
3 等效标准的确定
3.1 等效标准 也称等效界值(δ)。
等效性试验为两个单侧的检验:
高方向为:t H =
e S T )R (−+δ=e H S T
R −
低方向为:t L =e S )R (-T δ−=e
L
S R -T
均数差值的S e )1
1(2)1()1(2
121222121n n n n n s n s +−+−+−=
率差值的S e =)1
1(
)P (1P 2
1c c n n +−,其中P c =(p 1+p 2)/(n 1+n 2) 其中T 是试验组药效(均数或率p 1),R 是参比组药效(均数或率p 2),R H 是等效高限,R L 是等效低限(也是非劣性标准),S e 为共同标准误。
注意:以上计算t H 和t L 时,分子不是绝对值,故可正可负。
如为负值,肯定P >0.05。
因此,非劣性试验仅是等效性试验的低方向检验,即试验组(T)不低于参比组(R)低限(R L =R-δ),且有统计意义(P<0.05),即可判定“判定试验组不劣于参比组”。
等效性试验的等效标准用±δ。
但有时高低标准δ不同,要规定高方向的标准(δH )及低方向标准(δL ),试验组的均数或率(T)不超过参比组高限(R H =R+δH ),且有统计学意义(P <0.05);同时试验组(T)又不低于参比组低限(R L =R-δL ),且有统计学意义(P <0.05)时,才能判定为两组等效。
3.2 计数资料的等效标准 非劣性试验δ一般可规定为0.1-0.15(10%-15%)。
参看表1可见:
取0.1 (10%)时估计例数为每组59-309例,与我国III 期临床试验的最低例数相近。
取0.15 (15%)时估计例数为每组29-137例,与我国II 期临床试验的最低例数相近。
取0.2 (20%)时估计例数为每组15-77例,低于我国II 期临床试验的最低例数。
可见非劣性试验的例数增加并不太多,而等效性试验还应增加约38.5%。
我国规定最低例数是为了安全性评价的需要。
因此即使估算例数少于最低例数,临床试验的例数也不得少于该最低例数。
可见用20%作为δ只需15-77例,是不妥的。
临床医师也许会有这样的疑问:“如参比组有效率是80%,取-15%为非劣标准,即试验组有效率不低于65%(65%=80%-15%)时,就可判定试验组疗效不劣于参比组,这一标准是否过宽?”实际上非劣或等效性试验是要求试验组有效率与65%有统计学意义(P <0.05)的差异,没有100-137例的例数,是不容易达到的。
并不是只要试验组有效率是65%就可以判定为非劣或等效。
3.3 计量资料的等效标准 δ可按以下方式规定,δ越小,所需例数越多。
1. 根据临床实践经验,通过临床专家及统计专家会议规定每种临床指标的等效标准(δ)。
如血压舒张压降低值在5 mmHg (0.67 Pa),白细胞升高值在150/mm 3,胆固醇变化值用0.52 mmol/L 。
2. 根据各临床指标的正常范围进行估算:一般可取: δ= (正常范围高值-正常范围低值)×10%
如血压(舒张压)正常范围为60-90 mmHg ,δ=(90-60) ×10%=3 mmHg 。
3. 根据已知共同标准差(S)进行估算:一般δ取S 的1/3作为初定值是合适的: δ= S/3
如血压(舒张压)共同标准差为9 mmHg ,δ=9/3=3 mmHg 。
应当指出,δ取S 的1/3时,S/δ之比值为3。
根据例数估算公式,α =0.05,β =0.2条件下,非劣性试验例数为111例,等效性试验例数
为154例。
4. 根据已知均数进行估算:由于临床指标的标准差一般是均数的10%-20%。
简单一些,也可由均数进行初步估算。
即δ取估计均数(M)的4%:
δ= M×4%
如血压(舒张压)正常均数为80 mmHg,δ=80×4%=3.2 mmHg。
但因注意:有些生化指标(如血钙)个体差异很小,可取δ=M×2%;有些指标个体差异很大,如每日尿量可取δ=M×10%;生物利用度的AUC可取δ=M×20%,由于采用双交叉设计,其例数估算另有公式。
5. 根据既往临床试验中,阳性对照药与安慰剂既有统计意义又有临床意义的药效差值(∆)进行估算:δ应小于∆,δ一般可取∆的30%到50%(推荐30%):
δ= ∆×30%
如血压(舒张压)∆为10 mmHg,δ=10×30%=3 mmHg。
计量资料的上述5 种方法中,第1种方法权威性最大;其他方法较为简便,也相当实用,可供专家正式确定标准时参考。
附:公式5-8的证明
1. 己知α=0.05时,Uα=1.645,β=0.2时,Uβ=0.842,Uβ/2=1.282,故式1-4中的系数为:
C1=2×( Uα+ Uβ) 2=2× (1.645+0.842)2=12.365
C2=2× (Uα+ Uβ/2)2=2× (1.645+1.282)2=17.127
2. 在式1-4中,β=0.2 的系数与β=0.1 的系数是一常数,即17.127 / 12.365 =1.385
3. 计数资料(均数)的估算例数在自由度为无穷大(f=∞)及自由度f为N1+N2-2 时的比较:
N=100 时,f=100+100-2=198,Uα=1.652,Uβ=0.843,系数C2=C100=12.460
N=300 时,f=300-100-2=398,Uα=1.649,Uβ=0.842,系数C2=C300=12.412
N为无穷大时,f=∞,Uα=1.645,Uβ=0.842,系数C2=C∞=12.364
(C100 -C∞)/ C∞ =0.00775,也即100 例中只多0.775例(不到1例);(C300 -C∞)/ C∞ =0.00339,也即300 例中只多1.017例(约1例)。
[作者简介]郑青山(1964-),男,博士,教授,主要从事生物统计学和数学药理学研究。
联系电话:(0553)5738350, Email:zhengqs@。
孙瑞元(1930-),男,教授,主要从事数学药理学和生物统计学研究,联系电话:(0553)5738350。
[参考文献]
1.郑青山,孙瑞元,陈志扬. 临床两组药物等效的判别方法及其辨析. 中国临床药理学与治疗学,
2002,7(6): 559-561
2.闫宇翔,王洪源,王仁安. 新药临床等效性分析方法及其评价. 中国临床药理学与治疗学, 2002,
8(2): 219-222
3.刘玉秀,姚晨,陈峰,等. 临床非劣性/等效性评价的统计学方法. 中国临床药理学与治疗学,
2000,5(4): 344-348
4.Jones B, Jarvis P, Lewis JA, et al. Trials to assess equivalence: the importance of rigorous methods.
BMJ, 1996,313:36-9。