从临床试验实例看优效、等效和非劣效试验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从临床试验实例看优效、等效和非劣效试验结合一些临床试验的例子对优效、等效和非劣效试验再做一点阐述,权当加深理解吧。
让我们先看一个简单的例子(J Am Acad Dermatol 2003;48:535-41) :
为了证实地氯雷他定对慢性荨麻疹的疗效和安全性,研究者设计了一项地氯雷他定对比安慰剂治疗慢性荨麻疹的随机对照双盲试验。本试验选择的主要终点是与基线相比搔痒评分的变化。假设标准差为1.0 分,每组需要100 例病人在0.05 的显著性水平上有90%的把握能检验出两组0.5 分或更多的差别。最后结果地氯雷他定与基线相比搔痒评分的变化为1.05 ,安慰剂组为0.52 ,
p<0.001. 结论地氯雷他定可以有效治疗慢性荨麻疹。
以上这个例子就是一个最经典的优效性试验的例子,即通过安慰剂对照试验显示试验药物优于安慰剂,从而证实试验药物的疗效。这种安慰对照的优效性试验在临床试验的发展进程中起到了鼻祖的作用,以前对于某种疾病还没有治疗药物的时候,一种新药物的出现,往往会选择安慰剂对照来证实疗效,当然随着越来越多标准药物的出现,以及出于伦理等方面的考虑,现在安慰剂对照的试验也开始变少,但它在药物研发中的地位是决不能抹杀的。
随着医学的发展,现在各个疾病基本上都有自己有效的治疗药物,这时我们推出一种新药,往往在选择对照时,不得不选择那些已有的有效治疗药物,所以相比较安慰剂对照试验,阳性对照试验越来越多,而阳性对照试验最理想的情况是,你的药物优于阳性对照药物,这和上文中提及的安慰剂对照试验一样,是证实你的药物的疗效的最好的也是最有力的方法。这种阳性对照的优效性试验在现在我们的临床试
验中发挥了很重要的作用,怎么说呢,一种新药的出现,如果它有突破性的进展,最大的证明就是你的疗效优于现在这种疾病的标准治疗药物,而此时阳性
对照的优效性试验就是你证明你疗效的最理想的选择。
给大家介绍一个药物研发历史上一个很著名的阳性对照优效性试验的例子-EVIDENCE 研究。
2003 年3 月8 日,美国FDA 正式批准瑞士雪兰诺公司的Rebif (干扰素beta-1a ) 治疗复发性多发性硬化。此次FDA 批准Rebif 上市,打破了另外一种干扰素类药物Avonex 的市场专有状态,Avonex 在1996 年被批准用于多发
性硬化的治疗。那么FDA 为什么批准呢,其中最重要的依据就是一项Rebif 与Avonex 直接比较的研究-EVIDENCE 研究,而Rebif 的批准则说明了如果有另外一种药物比原有药物更有效或者更安全的话,那么就可以打破原有药物的市场专有状态。
那么现在我们来看一下EVIDENCE 的研究设计和结果吧。EVIDENCE 研究是一项比较Rebif 与Avonex 两种药物治疗复发性多发性硬化效果的大规模的研究,在
美国、加拿大以及欧洲的多个中心进行。677 名复发性多发性硬化病人被随机分配到Rebif 和Avonex
组,其中Rebif 组339 例,Avonex 组338 例。主要疗效终点为治疗24周后的无复发率。研究者把本试验设计为优效性试验,即证明Rebif 优于Avonex ,而在进行样本量计算时,则假定Rebif 组和Avonex 组治疗24 周后的无复发率分别为65%和50%。研究结果显示,治疗24周后,Rebif组和Avo nex组无复发率分别为74.9 %和63.3 % ,p= 0.0005 ,而在其他的次要终点方面,Rebif 组也显著优于Avonex 组。最后研究结果证明,Rebif 在治疗复发性多发性硬化方面比Avonex 更有效。
关于阳性对照的试验,能作出优效来当然是最理想的结果,但研究者在设计这种试验时,往往会遇到一个难题,一是对照药物的选择,另一个就是你有没有把握作出优效来,如果你设计成优效试验,结果作出来确实优势,当然是皆大欢喜,但如果作不出来,两种药物没有统计学差异呢,这时对结果的解释和结论的得出往往就会变得比较复杂,最重要的一点是你不能因为两者没有统计学差异而得出两种药物疗效相当或者非劣效之类的结论,而造成结果无统计学差异的原因则有很多,并不是一句两种药物疗效相等所能解释的。首先让我们来看两个例子:
研究1:随机、双盲、对照试验
(1)比较两种溶栓药:SK 和rt-PA
(2)主要终点:30 天死亡率(两分类变
量)
(3)SK: 10370例病人rt-PA: 10348 例病人
(4)SK: 7.4%rt-PA: 6.3%
(5)卡方检验:p=0.0028
研究2:随机、双盲、对照试验
(1)比较两种溶栓药:A 和B
(2)主要终点:30 天死亡率(两分类变量)(3 )A: 1000 例病人B: 1000 例病人
(4)A: 7.4% B: 6.3%
(5)卡方检验:p=0.37
从研究1和研究2,我们能得出什么结论?
研究1:差异有统计学意义,SK 的疗效优于rt-PA
研究2:差异无统计学意义,能否得出A 和B 的疗效相同?从上边的例子,我们可以看出,同样的30 天死亡率,结果却大不相同。这里就涉及到一个对p 值的正确认识的问题,这种问题在设计为优效性的试验中尤为常见。当
p>0.05 时,统计上说是无统计学意义,它的含义是根据当前数据,尚不足以认为两组间疗效差异具有统计学意义。
换句话说,p>0.05 是一个不是结论的结论,从统计学上说它是结论,表示无统计学意义;从临床上说,它不是结论,既不能说两药有差别,也不能说两药无差别,可能例数过少或误差过大,增大例数或减少误差就可能达到p<0.05 。就如上面的例子,当每组样本量从1000 增加到10000 时,同样的30 天死亡率的比较就能达到p<0.05 。因此,我们必须在这里强调的一点就是,不能仅仅从p>0.05 就得出两药疗效相等的结论。
在优效性试验中,还会涉及到一个统计学差异与临床差异的问题。统计学差异很好理解,就是两组的差别有统计学意义,这个一般是由我们的p值或95%可信区间来判断的,而临床差异呢,就是从临床角度考虑两组的差别是具有临床意义的,举个例子来说,两种降压药