从临床试验实例看优效、等效和非劣效试验[1]

合集下载

实用文库汇编之非劣效、等效性、优效性

实用文库汇编之非劣效、等效性、优效性

**实用文库汇编之非劣效、等效和优效性检验及其适用范围摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。

关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0: A药的疗效-B药的疗效=0备择假设H1:A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。

目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。

传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。

另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。

因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。

临床试验中的非劣效性、优效性和等效性检验

临床试验中的非劣效性、优效性和等效性检验

临床试验中的非劣效性、优效性和等效性检验来源:医药魔方在评价临床试验的疗效时,常用的假设检验有非劣效性试验(non-inferiority trial)、等效性试验(equivalence trial)和优效性试验(superiority trial)。

非劣效性试验是检验一种药物是否不劣于另一种药物的试验,多用于有客观疗效指标的临床研究中,如抗菌药物的临床终点、心血管治疗中的不良事件、肿瘤治疗中的死亡或进展等。

非劣效性试验的原假设为试验药(T)总体疗效比对照药(C)总体疗效要差,且差值是-(非劣效性界值)或更小的负值;而备择假设为试验药总体疗效要比对照药好,或者虽然比对照药差,但其差值比-大。

拒绝了原假设即可得出试验药比对照药非劣效的结论。

等效性试验是检验一种药物是否与另一种药物疗效“相等”的试验(实际为相差不超过一个指定的界值)。

例如研究仿制药与原药的疗效是否“相等”、小剂量来替代大剂量的疗效是否“相等”、短疗程药物来替代长疗程药物的疗效是否“相等”。

其原假设为总体参数间差别超过或等于一个研究者规定的等效性界值,而备择假设为总体参数间差别小于研究者规定的等效性界值。

为了说明“等效”,需要同时进行两次非劣效检验,分别推断。

仅当既说明试验药非劣效于对照药,又说明对照药非劣效于试验药时,才能得出两药“等效”的结论。

优效性试验是检验一种药物是否优于另一种药物的试验,一般对于以安慰剂作为对照的试验常用优效性试验。

优效性试验的原假设为试验药(T)总体疗效等于对照药(C)的总体疗效,或试验药劣于对照药;而备择假设为试验药总体疗效优于对照药。

拒绝了原假设即可得出试验药比对照药优效的结论。

优效性、等效性和非劣效性试验示意图以上三种试验都是临床研究常见的研究假设,其中以非劣效性试验应用最为广泛。

在临床研究的具体应用中,研究者要明确三种试验的不同之处,并结合自身的研究设计和研究目的来选择正确的试验方法以及相对应的统计分析技术,以期得到合理的统计推断与研究结论。

优效性等效性非劣性研究的区别

优效性等效性非劣性研究的区别

优效性等效性非劣性研究的区别This model paper was revised by the Standardization Office on December 10, 2020我们进行临床试验的目的是检验药物(治疗)的效果,而效果往往是需要一个参照药物(治疗)的。

在临床试验中,研究参与人员往往对优效、等效、非劣效这三个概念不是很清晰,甚至对混用,尤其是在根据统计分析结果来推导结论时。

优效性研究假设如下:H0 (无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<优效标准H1 (备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>优效标准当拒绝H0时,统计结论是可以认为研究药物疗效优于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效优于对照药物。

非劣效性研究假设如下:H0 (无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<非劣效标准H1 (备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>非劣效标准当拒绝H0时,统计结论是可以认为研究药物疗效不劣于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效不劣于对照药物。

等效性研究假设如下:H0 (无效假设,Null Hypothesis): |研究药物疗效-对照药物疗效|>等效标准H1 (备择假设,Alternative Hypothesis): |研究药物疗效-对照药物疗效|<=等效标准当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物等效。

而我们做的比较多是非等效研究,即当等效标准为0时,与等效性研究假设相反的研究。

假设如下:H0(无效假设,Null Hypothesis): |研究药物疗效-对照药物疗效|<=等效标准=0H1 (备择假设,Alternative Hypothesis): |研究药物疗效-对照药物疗效|>等效标准=0当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物不等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物不等效(但不是等效)。

非劣效、等效和优效性检验及其适用范围

非劣效、等效和优效性检验及其适用范围

发布日期20061120栏目化药药物评价>>临床安全性和有效性评价标题非劣效、等效和优效性检验及其适用范围作者黄钦部门正文内容审评四部审评八室黄钦摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围.关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0:A药的疗效—B药的疗效=0备择假设H1:A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。

目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。

传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1: μ1-μ2〉0(或μ1—μ2〈0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。

另一方面,对于传统检验的结论,如P〉0.05,表示两药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的.因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。

对临床试验统计学假设检验中非劣效_等效和优效性设计的认识

对临床试验统计学假设检验中非劣效_等效和优效性设计的认识

药政管理对临床试验统计学假设检验中非劣效、等效和优效性设计的认识Considerations on the statistical hypothesis of noninferiority,equi valence and superiority design i n clinical tri al黄钦,赵明(国家食品药品监督管理局药品审评中心,北京100038)HUANG Q i n,Z HAO M i n g(C enter for Drug Evaluation,State Food and D rug Adm inistration,Beijing 100038,China)收稿日期:2006-09-12修回日期:2006-12-14作者简介:黄钦(1969-),男,博士,主管药师,主要从事药品审评工作通讯作者:黄钦Te:l(010)-68585566E-ma il:huangq@ 摘要:在对国内药物注册临床试验报告的审评中,常遇到以传统显著性检验代替非劣效、等效和优效性检验的错误,就它们的区别及适用范围,本文对判断界值的确定、样本含量、推断结论及审评中的主要关注点进行了阐释。

关键词:非劣效检验;等效性检验;优效性检验;显著性检验中图分类号:R954文献标识码:C文章编号:1001-6821(2007)01-0063-05药品临床试验设计要求随机、盲法和对照药物比较,以判断和区别其实际的疗效。

我国药品研发,以仿制国外已上市药品为主;基于临床认识和伦理学因素,临床研究也多选择针对目标适应症的已有治疗药物为对照,即所谓的阳性对照药。

目前,已公认的传统假设检验(又称显著性检验)在临床试验中用于判断药物的疗效是不合理的,它不能准确区分2药疗效差异的方向性和体现差异大小所揭示的临床实际意义。

因此,国际上根据研究目的不同,普遍用非劣效、等效或优效性假设检验。

1显著性检验无效假设H0:A药疗效-B药疗效=0备择假设H1:A药疗效X B药疗效结论:如P>0.05,按A=0.05的检验水准,不能拒绝H0假设;如P[0.05,则接受H1假设。

非劣效、等效和优效性检验及其适用范围---精品管理资料

非劣效、等效和优效性检验及其适用范围---精品管理资料

发布日期20061120栏目化药药物评价>〉临床安全性和有效性评价标题非劣效、等效和优效性检验及其适用范围作者黄钦部门正文内容审评四部审评八室黄钦摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。

关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0: A药的疗效—B药的疗效=0备择假设H1: A药的疗效≠B药的疗效结论:如P〉0。

05,按α=0。

05的检验水准不能拒绝H0假设,如P≤0。

05,则接受H1假设。

目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。

传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1—μ2=0,H1:μ1-μ2〉0(或μ1—μ2〈0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。

另一方面,对于传统检验的结论,如P〉0。

05,表示两药疗效的差别无统计学意义, 不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。

优效性等效性非劣性研究的区别

优效性等效性非劣性研究的区别

优效性等效性非劣性研究的区别标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]我们进行临床试验的目的是检验药物(治疗)的效果,而效果往往是需要一个参照药物(治疗)的。

在临床试验中,研究参与人员往往对优效、等效、非劣效这三个概念不是很清晰,甚至对混用,尤其是在根据统计分析结果来推导结论时。

优效性研究假设如下:H0 (无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<优效标准H1 (备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>优效标准当拒绝H0时,统计结论是可以认为研究药物疗效优于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效优于对照药物。

非劣效性研究假设如下:H0 (无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<非劣效标准H1 (备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>非劣效标准当拒绝H0时,统计结论是可以认为研究药物疗效不劣于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效不劣于对照药物。

等效性研究假设如下:H0 (无效假设,Null Hypothesis): |研究药物疗效-对照药物疗效|>等效标准H1 (备择假设,Alternative Hypothesis): |研究药物疗效-对照药物疗效|<=等效标准当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物等效。

而我们做的比较多是非等效研究,即当等效标准为0时,与等效性研究假设相反的研究。

假设如下:H0(无效假设,Null Hypothesis): |研究药物疗效-对照药物疗效|<=等效标准=0H1 (备择假设,Alternative Hypothesis): |研究药物疗效-对照药物疗效|>等效标准=0当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物不等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物不等效(但不是等效)。

差异性优效性等效性和非劣效性检验的区别

差异性优效性等效性和非劣效性检验的区别

差异性、优效性、等效性和非劣效性检验的区别在临床研究工作中,我想大部分临床研究者都听说过优效性、等效性和非劣 效性检验等,有很多人也很明白,但也有人尚不太清楚它们之间的区别, 本期我 们将和大家一起来讨论这一问题。

1什么是差异性检验?差异性检验,大家天天都在用,其实大家的论文里大部分用的都是差异性检 验。

比如独立样本t 检验,两个可选的假设分别是 A=B 和心B 。

这就是差异性 检验,或者叫不等的检验,意思就是 A 和B 两组有差异、不相等。

什么意思呢? 就是检验A-B=0这一公式成立与否。

比如同一批病人,我们随机分成 A 和B 组,然后检验A 组和B 组患者血红蛋 白水平的高低,这就是差异性检验。

即 A 组和B 组之间有差异,什么叫有差异, 就是两组间的差异不等于00跟上述内容相反的是,当我们将A 组和B 组之间的差异跟一个既定的值(△) 比较时,就产生了一系列的检验,如优效性、等效性和非劣效性检验。

下面这个图可以先看一下:2、什么是优效性、等效性和非劣效性检验?差畀性检验上述三种检验在临床药物试验中应用最多,当我们研制一种新药物的时候我们总是盼着新药的疗效比较好,或者跟旧药差不多。

我想没有人会盼着研制的新药的疗效差于旧的药物,那么还研制它干嘛啊。

基于上述三种情况,就提出了三个用于新药临床试验的检验思路,分别是优效性、等效性和非劣效性检验。

下面分别说明,先假设一个例子,某研究者要研究A 药与B药的关系,他能够接受的差值是2.1 优效性检验研究目的:A药的效果好于B药。

研究假设:(1)无效假设:A-B< A ;(2)备择假设:A-B>4。

备注:用来证实新药A的效果好于旧药B,来判断新药A上市的情况。

它是一个单侧的检验。

2.2 等效性检验研究目的:A药的效果等于B药。

研究假设:(1)无效假设:A-B W - △或A-B> A ; (2)备择假设:-Av A-B v A。

备注:常用于同一活性成分的药物之间的疗效比较,证实的是A药和B药的疗效相当。

戏说临床试验中的非劣效性、优效性和等效性检验_奥咨达统计部_范安_180914

戏说临床试验中的非劣效性、优效性和等效性检验_奥咨达统计部_范安_180914

戏说临床试验中的非劣效性、优效性和等效性检验药物/医疗器械临床试验中,根据试验目的不同,需采用不同检验来验证假设。

实际应用中,大家常听说非劣效、优效、等效等名词,傻傻分不清楚。

本文将从实例角度,对三者戏说漫道,以作区分,望行业内小白也能知其一二,此心甚慰!奥家有两位千金,小彤和小依,均貌美如花。

小彤稍年长,已到了谈婚论嫁的年纪,追求者甚众。

小彤也是精挑细选,终于觅得一位如意郎君,小伙长的贼精神,英俊帅气,高大威猛,身高足有一米八。

小依也到了如花似玉的年纪,看到姐姐幸福美满,十分羡慕,也希望找一个自己满意的男友。

那么问题来了,什么样条件的男友,小依才会认为满意呢?这里首先涉及到临床试验中选取主要评价指标的问题。

用帅来评价可以吗?所谓萝卜青菜,各有所爱,帅这个东西,太主观了,每个人对帅都有自己的定义,人们常说一朵鲜花插牛粪,那是外人的眼光来评价,鲜花自己可能觉得赏心悦目。

因此太主观的指标不太好量化,还是换个标准吧。

这也就是为什么临床试验中,问统计专家该采用什么主要指标评价产品性能的时候,他们总建议采用客观性评价指标(可测量可量化),而不推荐使用主观性指标。

那么该采用什么指标呢?身高(高优指标,越高越好的指标)!这也是众多女生比较喜爱的主要择偶标准之一,客观且好量化。

那好,就采用它来作为小依择男友的评价标准吧。

问题接着来了,到底多高,才是小依对男友满意的身高呢?小依听取了众多闺蜜的意见,大致分成了三类,转换成统计术语如下:(1)非劣效:可以比姐夫矮一点,但是不能矮太多。

多少不算矮太多呢?以姐姐小彤男友的身高作为阳性对照,小依认为,5厘米(非劣效界值)是她可以忍受的差距。

根据这条标准,小依找的男朋友可以比1.80m高,但最低不能低于1.75m(图1),这就是大家常说的非劣效的概念,很明显,这是个单侧的比较。

图1 非劣效图示(2)优效:比姐夫高。

也就是说,小依将来找的男朋友,一定要高于1.80m。

1)假如小依只要男友高于姐夫就好,那么将来男友的身高-姐夫的身高>0cm(优效界值1)即可(图2);2)假如小依对未来男友的身高很有信心,认为肯定可以超过1.85m,那么1.85m-1.80m=5cm(优效界值2),将来男友的身高,只有高于1.85m,才算合格(图3)。

非劣效、等效性、优效性之欧阳术创编

非劣效、等效性、优效性之欧阳术创编

非劣效、等效和优效性检验及其适用范围摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。

关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设 H0: A药的疗效-B药的疗效=0备择假设 H1: A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。

目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。

传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。

另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。

因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。

优效性、等效性、非劣性研究的区别

优效性、等效性、非劣性研究的区别

我们进行临床试验的目的是检验药物(治疗)的效果,而效果往往是需要一个参照药物(治疗)的。

在临床试验中,研究参与人员往往对优效、等效、非劣效这三个概念不是很清晰,甚至对混用,尤其是在根据统计分析结果来推导结论时。

优效性研究假设如下:H0(无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<优效标准H1(备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>优效标准当拒绝H0时,统计结论是可以认为研究药物疗效优于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效优于对照药物。

非劣效性研究假设如下:H0(无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<非劣效标准H1(备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>非劣效标准当拒绝H0时,统计结论是可以认为研究药物疗效不劣于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效不劣于对照药物。

等效性研究假设如下:H0(无效假设,Null Hypothesis):|研究药物疗效-对照药物疗效|>等效标准H1(备择假设,Alternative Hypothesis):|研究药物疗效-对照药物疗效|<=等效标准当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物等效。

而我们做的比较多是非等效研究,即当等效标准为0时,与等效性研究假设相反的研究。

假设如下:H0(无效假设,Null Hypothesis):|研究药物疗效-对照药物疗效|<=等效标准=0H1(备择假设,Alternative Hypothesis):|研究药物疗效-对照药物疗效|>等效标准=0当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物不等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物不等效(但不是等效)。

最新非劣效、等效性、优效性

最新非劣效、等效性、优效性

非劣效、等效和优效性检验及其适用范围摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。

关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0: A药的疗效-B药的疗效=0备择假设H1:A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。

目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。

传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。

另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。

因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。

临床试验中的非劣效性试验设计与分析

临床试验中的非劣效性试验设计与分析

临床试验中的非劣效性试验设计与分析临床试验是评估新药物、新治疗方法或新诊断工具疗效与安全性的重要手段。

在传统的临床试验中,通常采用的是非劣效性试验设计与分析方法,以确定新治疗方法是否不劣于标准治疗或对照组。

一、非劣效性试验设计非劣效性试验是一种特殊的临床试验设计,与传统的优劣效性试验有所不同。

在传统的优劣效性试验中,目标是证明新治疗方法是否优于对照组,而在非劣效性试验中,目标是证明新治疗方法对效果的损失是可以接受的,即新治疗方法不劣于标准治疗或对照组。

在非劣效性试验设计中,需要确定两个重要的参数:非劣效性边界和样本大小。

非劣效性边界是一个预先确定的差异值,表示新治疗方法与标准治疗或对照组之间所允许的最大差异。

样本大小的确定则需要根据研究的目的、预计效应大小和统计学方法来进行。

通常,为了保证试验的统计学功效,需要选择足够大的样本大小。

二、非劣效性试验分析在非劣效性试验中,需要进行合适的统计学分析来评估新治疗方法与标准治疗或对照组之间的差异。

常见的分析方法包括置信区间法和假设检验法。

1. 置信区间法:置信区间法是常用的非劣效性试验分析方法之一。

通过计算相应的置信区间,可以判断新治疗方法与标准治疗或对照组之间的差异是否超过了预先设定的非劣效性边界。

如果置信区间完全位于非劣效性边界的左侧,则可以推断新治疗方法不劣于标准治疗或对照组。

2. 假设检验法:假设检验法是另一种常用的非劣效性试验分析方法。

通过设定适当的零假设和备择假设,进行统计检验来判断新治疗方法与标准治疗或对照组之间的差异是否超过了预先设定的非劣效性边界。

如果零假设被拒绝,即新治疗方法与标准治疗或对照组之间存在显著差异,那么可以推断新治疗方法不劣于标准治疗或对照组。

三、实施非劣效性试验的注意事项在进行非劣效性试验时,需要注意以下几个关键问题:1. 非劣效性边界的选择:选择合适的非劣效性边界是非常重要的,它决定了新治疗方法与标准治疗或对照组之间差异的允许范围。

非劣效等效性优效性

非劣效等效性优效性

非劣效等效性优效性标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]非劣效、等效和优效性检验及其适用范围??摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显着性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。

关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0:A药的疗效-B药的疗效=0备择假设H1:A药的疗效≠B药的疗效结论:如P>,按α=的检验水准不能拒绝H0假设,如P≤,则接受H1假设。

目前已经公认这种传统的假设检验(又称显着性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。

传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。

另一方面,对于传统检验的结论,如P>,表示两药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

从临床试验实例看优效、等效和非劣效试验-结合一些临床试验的例子对优效、等效和非劣效试验再做一点阐述,权当加深理解吧。

让我们先看一个简单的例子(J Am Acad Dermatol 2003;48:535-41):为了证实地氯雷他定对慢性荨麻疹的疗效和安全性,研究者设计了一项地氯雷他定对比安慰剂治疗慢性荨麻疹的随机对照双盲试验。

本试验选择的主要终点是与基线相比搔痒评分的变化。

假设标准差为 1.0分,每组需要100例病人在0.05的显著性水平上有90%的把握能检验出两组0.5分或更多的差别。

最后结果地氯雷他定与基线相比搔痒评分的变化为 1.05,安慰剂组为0.52,p<0.001. 结论地氯雷他定可以有效治疗慢性荨麻疹。

以上这个例子就是一个最经典的优效性试验的例子,即通过安慰剂对照试验显示试验药物优于安慰剂,从而证实试验药物的疗效。

这种安慰对照的优效性试验在临床试验的发展进程中起到了鼻祖的作用,以前对于某种疾病还没有治疗药物的时候,一种新药物的出现,往往会选择安慰剂对照来证实疗效,当然随着越来越多标准药物的出现,以及出于伦理等方面的考虑,现在安慰剂对照的试验也开始变少,但它在药物研发中的地位是决不能抹杀的。

随着医学的发展,现在各个疾病基本上都有自己有效的治疗药物,这时我们推出一种新药,往往在选择对照时,不得不选择那些已有的有效治疗药物,所以相比较安慰剂对照试验,阳性对照试验越来越多,而阳性对照试验最理想的情况是,你的药物优于阳性对照药物,这和上文中提及的安慰剂对照试验一样,是证实你的药物的疗效的最好的也是最有力的方法。

这种阳性对照的优效性试验在现在我们的临床试验中发挥了很重要的作用,怎么说呢,一种新药的出现,如果它有突破性的进展,最大的证明就是你的疗效优于现在这种疾病的标准治疗药物,而此时阳性对照的优效性试验就是你证明你疗效的最理想的选择。

给大家介绍一个药物研发历史上一个很著名的阳性对照优效性试验的例子-EVIDENCE研究。

2003年3月8日,美国FDA正式批准瑞士雪兰诺公司的Rebif(干扰素beta-1a)治疗复发性多发性硬化。

此次FDA批准Rebif上市,打破了另外一种干扰素类药物Avonex的市场专有状态,Avonex在1996年被批准用于多发性硬化的治疗。

那么FDA为什么批准呢,其中最重要的依据就是一项Rebif与Avonex直接比较的研究-EVIDENCE研究,而Rebif的批准则说明了如果有另外一种药物比原有药物更有效或者更安全的话,那么就可以打破原有药物的市场专有状态。

那么现在我们来看一下EVIDENCE的研究设计和结果吧。

EVIDENCE研究是一项比较Rebif与Avonex两种药物治疗复发性多发性硬化效果的大规模的研究,在美国、加拿大以及欧洲的多个中心进行。

677名复发性多发性硬化病人被随机分配到Rebif和Avonex组,其中Rebif组339例,Avonex组338例。

主要疗效终点为治疗24周后的无复发率。

研究者把本试验设计为优效性试验,即证明Rebif 优于Avonex,而在进行样本量计算时,则假定Rebif组和Avonex组治疗24周后的无复发率分别为65%和50%。

研究结果显示,治疗24周后,Rebif组和Avonex组无复发率分别为74.9%和63.3%,p= 0.0005,而在其他的次要终点方面,Rebif组也显著优于Avonex组。

最后研究结果证明,Rebif在治疗复发性多发性硬化方面比Avonex 更有效。

关于阳性对照的试验,能作出优效来当然是最理想的结果,但研究者在设计这种试验时,往往会遇到一个难题,一是对照药物的选择,另一个就是你有没有把握作出优效来,如果你设计成优效试验,结果作出来确实优势,当然是皆大欢喜,但如果作不出来,两种药物没有统计学差异呢,这时对结果的解释和结论的得出往往就会变得比较复杂,最重要的一点是你不能因为两者没有统计学差异而得出两种药物疗效相当或者非劣效之类的结论,而造成结果无统计学差异的原因则有很多,并不是一句两种药物疗效相等所能解释的。

首先让我们来看两个例子:研究1:随机、双盲、对照试验(1)比较两种溶栓药:SK和rt-PA(2)主要终点:30天死亡率(两分类变量)(3)SK: 10370 例病人rt-PA: 10348例病人(4)SK: 7.4% rt-PA: 6.3%(5)卡方检验:p=0.0028研究2:随机、双盲、对照试验(1)比较两种溶栓药:A和B(2)主要终点:30天死亡率(两分类变量)(3)A: 1000 例病人B: 1000例病人(4)A: 7.4% B: 6.3%(5)卡方检验:p=0.37从研究1和研究2,我们能得出什么结论?研究1:差异有统计学意义,SK的疗效优于rt-PA研究2:差异无统计学意义,能否得出A和B的疗效相同?从上边的例子,我们可以看出,同样的30天死亡率,结果却大不相同。

这里就涉及到一个对p值的正确认识的问题,这种问题在设计为优效性的试验中尤为常见。

当p>0.05时,统计上说是无统计学意义,它的含义是根据当前数据,尚不足以认为两组间疗效差异具有统计学意义。

换句话说,p>0.05是一个不是结论的结论,从统计学上说它是结论,表示无统计学意义;从临床上说,它不是结论,既不能说两药有差别,也不能说两药无差别,可能例数过少或误差过大,增大例数或减少误差就可能达到p<0.05。

就如上面的例子,当每组样本量从1000增加到10000时,同样的30天死亡率的比较就能达到p<0.05。

因此,我们必须在这里强调的一点就是,不能仅仅从p>0.05就得出两药疗效相等的结论。

在优效性试验中,还会涉及到一个统计学差异与临床差异的问题。

统计学差异很好理解,就是两组的差别有统计学意义,这个一般是由我们的p值或95%可信区间来判断的,而临床差异呢,就是从临床角度考虑两组的差别是具有临床意义的,举个例子来说,两种降压药降压差别在3mmHg以上才具有临床意义。

在考察差异的临床试验中,两组差异无外乎会出现下列4种结果:(1)统计学和临床都有意义(2)统计学和临床都无意义(3)统计学有意义,临床无意义(4)统计学无意义,临床有意义上边的四种情况中,出现第一种和第二种,那么结论比较明确。

然而,当统计学和临床不一致时,即出现上边的第三和第四种情况时,则需要进行具体分析:(1)当出现第三种情况时,即统计学有意义,临床无意义;这时我们不能以统计学上的意义来取代临床上的意义,为什么呢?很简单,不管真实差异多么小,当样本量足够大时,总会检验出两组具有统计学差异。

例如,上边提及的降压药,如果两组实际差别也就是1mmHg,只要你的样本量足够大,上万,上十万,总能检验出统计学差异来,但这种差异无临床意义,如果是一种新药,那么这种药物本身也就失去了批准上市的意义。

因此,这里小胖要特别提到的就是,考虑到这一点,当计算优效性试验的样本量时,你假设的两组差异必须在临床上是有意义的。

(2)当出现第四种情况时,即统计学无意义,临床有意义;为什么会出现这种情况呢?很好理解,如果两组真实差异确实很大,但样本量太小,也会出现差异无统计学意义的结果。

比如我们在上篇博文中提及的那个例子的研究2中,A组和B组30天死亡率分别为7.4%和6.3%,两者的差异是具有临床意义的,但由于样本量不够,差异无统计学意义;而当样本量增大时,同样的情况到了研究1中两组的差异就具有统计学意义了。

首先,给大家说一个非劣效试验的例子-Moxatag注册临床试验2008年1月24日,Middlebrook制药有限公司宣布FDA已批准其开发的阿莫西林(amoxacillin)775mg缓释片Moxatag,用于每日一次口服治疗12岁及以上青少年和成人的继发于酿脓链球菌感染的咽炎和(或)扁桃体炎,而Moxatag则成为在美获得批准的第一个每日一次用阿莫西林缓释制剂。

而这次FDA批准的主要依据则正是一项随机双盲平行对照的非劣效试验。

在这项试验中,对Moxatag每日一次和penicillin每日四次进行了比较,主要终点为细菌清除率。

本试验设计为非劣效试验,即Moxatag在细菌清除率方面不劣于penicillin,非劣效界值为10%,即Moxatag在细菌清除率方面与penicillin相差不会超过10%。

研究结果显示,Moxatag和penicillin的细菌清除率分别为85%和83.4%。

两者相差的95%可信区间为(-5.1,8.2)。

其95%可信区间的下限-5.1是大于非劣效界值-10的,因此可以证实非劣效性。

另外本研究在其他次要终点方面也显示出了非劣效性。

在本试验证实了Moxatag和penicillin在疗效和安全性相当的基础上,与penicillin每日四次相比,Moxatag每日一次便成为了它的主要优势,医生们有了第一种可以每日一次使用治疗青少年和成人咽炎和(或)扁桃体炎的阿莫西林药物,这也就大大增加了服用的方便性,从而也提高了病人的依从性,这种每日一次的优势也最终促使FDA 批准了此药物。

以上这个例子就是一个经典的非劣效试验,在证实疗效相当的基础上,通过自己药物的其他优势比如服用的方便性等来获得批准。

非劣效试验的目的在于证明试验组的疗效是否在在某个界值上不劣于对照组。

当你设计非劣效试验时,既然你在疗效上没有什么特别的优势,那么你在别的方面就应该有自己的优势,比如说更便宜、更少的侵害、副作用更少、服用更方便等,这一点很重要,你必须找到一个你自己的优势,这个优势足以说服临床医生和药监部门,就小胖个人体会而言,这是你设计非劣效试验的理论基础和前提。

让我们结合几个实例,来看一下非劣效试验设计时这方面的考虑:1.更便宜:Righini M, Le Gal G, Aujesky D, et al. Diagnosis of pulmonary embolism by multidetector CT alone or combined with venous ultrasonography of the leg: a randomised non-inferiority trial. Lancet 2008; 371: 1343-1352这是一项比较多层CT或多层CT联合静脉超声诊断肺动脉栓塞的研究。

在研究设计时,研究者参考了以往的一些相关研究发现多层CT 作为一种单独诊断的方法是安全有效的,而在多层CT的基础上联合静脉超声的附加价值不大。

如果能证明单独的多层CT不差于多层CT 联合静脉超声,那么病人就会因为省略掉静脉超声而大大节省成本以及时间。

因此,研究者设计了此项非劣效研究。

2.更少的侵害:Clinical Outcomes of Surgical Therapy Study Group. A comparison of laparoscopically assisted and open colectomy for co lon cancer. N Engl J Med. 2004 May 13;350(20):2050-9这是一项比较腹腔镜辅助和开放性结肠切除术的研究。

相关文档
最新文档