非劣效性、等效性临床试验

合集下载

实用文库汇编之非劣效、等效性、优效性

**实用文库汇编之非劣效、等效和优效性检验及其适用范围摘要：在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况，下文探讨了二者的区别及适用范围。

关键词：非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究，以判断和区别其实际的疗效如何，审评中我们常见到的错误是采用如下传统的假设检验：无效假设H0: A药的疗效-B药的疗效＝0备择假设H1：A药的疗效≠B药的疗效结论：如P>0.05,按α＝0.05的检验水准不能拒绝H0假设，如P≤0.05，则接受H1假设。

目前已经公认这种传统的假设检验（又称显著性检验）用于临床试验判断药物的疗效是不合理的，它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义，因此国际普遍采用非劣效、等效或优效性假设检验。

传统的假设检验之所以不合理，在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等，是纯粹的统计学意义，而未体现实际的临床意义，虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义，而未将实际临床意义包含进来考虑。

另一方面，对于传统检验的结论，如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝H0假设，说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论，并不是当然的接受H0假设，并非认为H0假设必然成立而两药疗效的总体均数一定相等，此时有可能两药疗效的总体均数确实相似，也有可能是检验效能（把握度）不够，尚需更大样本量进行检验；如P≤0.05，两药疗效的差别有统计学意义,也就是说，两药疗效的总体均数确实不相等，但这种统计学意义的差异不一定具有实际的临床意义，也可能其临床意义却是优效、等效或非劣效的。

因此，临床试验的统计学家们提出了区间假设检验的方法，提出以临床意义的差异Δ来进行假设检验，这就是非劣效、等效和优效性检验的概念和方法。

临床试验中的非劣效性、优效性和等效性检验

临床试验中的非劣效性、优效性和等效性检验来源：医药魔方在评价临床试验的疗效时，常用的假设检验有非劣效性试验（non-inferiority trial）、等效性试验（equivalence trial）和优效性试验（superiority trial）。

非劣效性试验是检验一种药物是否不劣于另一种药物的试验，多用于有客观疗效指标的临床研究中，如抗菌药物的临床终点、心血管治疗中的不良事件、肿瘤治疗中的死亡或进展等。

非劣效性试验的原假设为试验药(T)总体疗效比对照药(C)总体疗效要差，且差值是-（非劣效性界值）或更小的负值；而备择假设为试验药总体疗效要比对照药好，或者虽然比对照药差，但其差值比-大。

拒绝了原假设即可得出试验药比对照药非劣效的结论。

等效性试验是检验一种药物是否与另一种药物疗效“相等”的试验（实际为相差不超过一个指定的界值）。

例如研究仿制药与原药的疗效是否“相等”、小剂量来替代大剂量的疗效是否“相等”、短疗程药物来替代长疗程药物的疗效是否“相等”。

其原假设为总体参数间差别超过或等于一个研究者规定的等效性界值，而备择假设为总体参数间差别小于研究者规定的等效性界值。

为了说明“等效”，需要同时进行两次非劣效检验，分别推断。

仅当既说明试验药非劣效于对照药，又说明对照药非劣效于试验药时，才能得出两药“等效”的结论。

优效性试验是检验一种药物是否优于另一种药物的试验，一般对于以安慰剂作为对照的试验常用优效性试验。

优效性试验的原假设为试验药(T)总体疗效等于对照药(C)的总体疗效，或试验药劣于对照药；而备择假设为试验药总体疗效优于对照药。

拒绝了原假设即可得出试验药比对照药优效的结论。

优效性、等效性和非劣效性试验示意图以上三种试验都是临床研究常见的研究假设，其中以非劣效性试验应用最为广泛。

在临床研究的具体应用中，研究者要明确三种试验的不同之处，并结合自身的研究设计和研究目的来选择正确的试验方法以及相对应的统计分析技术，以期得到合理的统计推断与研究结论。

非劣效、等效性、优效性

非劣效、等效和优效性检验及其适用范围摘要：在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况，下文探讨了二者的区别及适用范围。

关键词：非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究，以判断和区别其实际的疗效如何，审评中我们常见到的错误是采用如下传统的假设检验：无效假设H0: A药的疗效-B药的疗效＝0备择假设H1 ： A 药的疗效≠B 药的疗效H0假设，如结论：如P>0.05, 按α＝0.05的检验水准不能拒绝P≤0.05 ，则接受 H1 假设。

传统的假设检验之所以不合理，在于两个方面, 一方面它所推断的是两个总体均数在统计学是否不相等，是纯粹的统计学意义，而未体现实际的临床意义，虽然有单双侧之分, 如单侧为H0:μ1- μ2=0,H1: μ1- μ2>0( 或μ1- μ2<0), 但它检验的依然是样本所代表的总体均数的统计学含义，而未将实际临床意义包含进来考虑。

另一方面，对于传统检验的结论，如 P>0.05, 表示两药疗效的差别无统计学意义 , 不拒绝 H0 假设，说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论，并不是当然的接受 H0 假设，并非认为 H0 假设必然成立而两药疗效的总体均数一定相等，此时有可能两药疗效的总体均数确实相似，也有可能是检验效能（把握度）不够，尚需更大样本量进行检验；如 P≤0.05 ，两药疗效的差别有统计学意义 , 也就是说，两药疗效的总体均数确实不相等，但这种统计学意义的差异不一定具有实际的临床意义，也可能其临床意义却是优效、等效或非劣效的。

差异性、优效性、等效性和非劣效性检验的区别

差异性、优效性、等效性和非劣效性检验的区别在临床研究工作中，我想大部分临床研究者都听说过优效性、等效性和非劣效性检验等，有很多人也很明白，但也有人尚不太清楚它们之间的区别，本期我们将和大家一起来讨论这一问题。

1、什么是差异性检验？差异性检验，大家天天都在用，其实大家的论文里大部分用的都是差异性检验。

比如独立样本t检验，两个可选的假设分别是A=B和A≠B。

这就是差异性检验，或者叫不等的检验，意思就是A和B两组有差异、不相等。

什么意思呢？就是检验A-B=0这一公式成立与否。

比如同一批病人，我们随机分成A和B组，然后检验A组和B组患者血红蛋白水平的高低，这就是差异性检验。

即A组和B组之间有差异，什么叫有差异，就是两组间的差异不等于0。

跟上述内容相反的是，当我们将A组和B组之间的差异跟一个既定的值（Δ）比较时，就产生了一系列的检验，如优效性、等效性和非劣效性检验。

下面这个图可以先看一下：2、什么是优效性、等效性和非劣效性检验？上述三种检验在临床药物试验中应用最多，当我们研制一种新药物的时候我们总是盼着新药的疗效比较好，或者跟旧药差不多。

我想没有人会盼着研制的新药的疗效差于旧的药物，那么还研制它干嘛啊。

基于上述三种情况，就提出了三个用于新药临床试验的检验思路，分别是优效性、等效性和非劣效性检验。

下面分别说明，先假设一个例子，某研究者要研究A药与B药的关系，他能够接受的差值是Δ。

2.1 优效性检验研究目的：A药的效果好于B药。

研究假设：（1）无效假设：A-B≤Δ；（2）备择假设：A-B＞Δ。

备注：用来证实新药A的效果好于旧药B，来判断新药A上市的情况。

它是一个单侧的检验。

2.2 等效性检验研究目的：A药的效果等于B药。

研究假设：（1）无效假设：A-B≤-Δ或A-B≥Δ；（2）备择假设：-Δ＜A-B＜Δ。

备注：常用于同一活性成分的药物之间的疗效比较，证实的是A药和B药的疗效相当。

它可以是单侧也可以是双侧的检验。

非劣效等效和优效性检验及其适用范围

非劣效等效和优效性检验及其适用范围发布日期20061120栏目标题作者部门正文内容化药药物评价>> 临床安全性和有效性评价非劣效、等效和优效性检验及其适用范围黄钦审评四部审评八室黄钦摘要：在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况，下文探讨了二者的区别及适用范围。

关键词：非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究，以判断和区别其实际的疗效如何，审评中我们常见到的错误是采用如下传统的假设检验：无效假设H0: A药的疗效-B药的疗效=0备择假设H1 : A药的疗效MB药的疗效结论：如P>0.05,按a= 0.05的检验水准不能拒绝H0假设，如P< 0.05，则接受H1假设。

传统的假设检验之所以不合理，在于两个方面，一方面它所推断的是两个总体均数在统计学是否不相等，是纯粹的统计学意义，而未体现实际的临床意义，虽然有单双侧之分，如单侧为H0: 口1- 口2=0,H1:2>0（或口1 口2<0）但它检验的依然是样本所代表的总体均数的统计学含义，而未将实际临床意义包含进来考虑。

另一方面，对于传统检验的结论，如P>0.05,表示两药疗效的差别无统计学意义，不拒绝H0假设，说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论，并不是当然的接受H0假设，并非认为H0假设必然成立而两药疗效的总体均数一定相等，此时有可能两药疗效的总体均数确实相似，也有可能是检验效能（把握度）不够，尚需更大样本量进行检验；如P< 0.05,两药疗效的差别有统计学意义，也就是说，两药疗效的总体均数确实不相等，但这种统计学意义的差异不一定具有实际的临床意义，也可能其临床意义却是优效、等效或非劣效的。

从临床试验实例看优效、等效和非劣效试验

从临床试验实例看优效、等效和非劣效试验-结合一些临床试验的例子对优效、等效和非劣效试验再做一点阐述，权当加深理解吧。

让我们先看一个简单的例子(J Am Acad Dermatol 2003;48:535-41)：为了证实地氯雷他定对慢性荨麻疹的疗效和安全性，研究者设计了一项地氯雷他定对比安慰剂治疗慢性荨麻疹的随机对照双盲试验。

本试验选择的主要终点是与基线相比搔痒评分的变化。

假设标准差为1.0分，每组需要100例病人在0.05的显著性水平上有90％的把握能检验出两组0.5分或更多的差别。

最后结果地氯雷他定与基线相比搔痒评分的变化为1.05，安慰剂组为0.52，p<0.001. 结论地氯雷他定可以有效治疗慢性荨麻疹。

以上这个例子就是一个最经典的优效性试验的例子，即通过安慰剂对照试验显示试验药物优于安慰剂，从而证实试验药物的疗效。

这种安慰对照的优效性试验在临床试验的发展进程中起到了鼻祖的作用，以前对于某种疾病还没有治疗药物的时候，一种新药物的出现，往往会选择安慰剂对照来证实疗效，当然随着越来越多标准药物的出现，以及出于伦理等方面的考虑，现在安慰剂对照的试验也开始变少，但它在药物研发中的地位是决不能抹杀的。

随着医学的发展，现在各个疾病基本上都有自己有效的治疗药物，这时我们推出一种新药，往往在选择对照时，不得不选择那些已有的有效治疗药物，所以相比较安慰剂对照试验，阳性对照试验越来越多，而阳性对照试验最理想的情况是，你的药物优于阳性对照药物，这和上文中提及的安慰剂对照试验一样，是证实你的药物的疗效的最好的也是最有力的方法。

这种阳性对照的优效性试验在现在我们的临床试验中发挥了很重要的作用，怎么说呢，一种新药的出现，如果它有突破性的进展，最大的证明就是你的疗效优于现在这种疾病的标准治疗药物，而此时阳性对照的优效性试验就是你证明你疗效的最理想的选择。

给大家介绍一个药物研发历史上一个很著名的阳性对照优效性试验的例子－EVIDENCE研究。

差异性、优效性、等效性和非劣效性检验的区别

1、什么是差异性检验？差异性检验，大家天天都在用，其实大家的论文里大部分用的都是差异性检验。

比如独立样本t检验，两个可选的假设分别是A=B和A≠B。

这就是差异性检验，或者叫不等的检验，意思就是A和B两组有差异、不相等。

什么意思呢？就是检验A-B=0这一公式成立与否。

比如同一批病人，我们随机分成A和B组，然后检验A组和B组患者血红蛋白水平的高低，这就是差异性检验。

即A组和B组之间有差异，什么叫有差异，就是两组间的差异不等于0。

跟上述内容相反的是，当我们将A组和B组之间的差异跟一个既定的值（Δ）比较时，就产生了一系列的检验，如优效性、等效性和非劣效性检验。

我想没有人会盼着研制的新药的疗效差于旧的药物，那么还研制它干嘛啊。

基于上述三种情况，就提出了三个用于新药临床试验的检验思路，分别是优效性、等效性和非劣效性检验。

下面分别说明，先假设一个例子，某研究者要研究A药与B药的关系，他能够接受的差值是Δ。

2.1 优效性检验研究目的：A药的效果好于B药。

研究假设：（1）无效假设：A-B≤Δ；（2）备择假设：A-B＞Δ。

备注：用来证实新药A的效果好于旧药B，来判断新药A上市的情况。

它是一个单侧的检验。

2.2 等效性检验研究目的：A药的效果等于B药。

研究假设：（1）无效假设：A-B≤-Δ或A-B≥Δ；（2）备择假设：-Δ＜A-B ＜Δ。

备注：常用于同一活性成分的药物之间的疗效比较，证实的是A药和B药的疗效相当。

它可以是单侧也可以是双侧的检验。

临床非劣效性与等效性评价的统计学方法二

临床非劣效性与等效性评价的统计学方法二第一步:非劣效性评价单侧假设检验:z=（2+3)/1．03３=4．84>1.6４５（z０。

95），Ｐ＜0．05单侧95％可信区间下限：CL=2-１．645×1。

03３=0.301〉—3两种方法均显示，在抗高血压效果方面新药AII拮抗剂与标准药ＡCＥ抑制剂相比具有非劣效性.第二步：优效性评价单侧假设检验:ｚ=2/1.０33=１.936〉1。

6４5,Ｐ<０．05单侧95％可信区间下限：ＣL=０．30１〉0结果表明，新药AIＩ拮抗剂比标准药ACＥ抑制剂的抗高血压效果具有统计学意义优效性。

ＩCHE9指导原则中的建议［1]更保守些，若按α取0.025的标准判断，非劣效性评价的z＝4.８4〉１.９６(ｚ０.9７5）,P＜0.025,可下非劣效性结论。

但是，因优效性评价的z＝1。

9３6<1．96，Ｐ〉0．025，尚不能认为具有统计学优效性，更达不到临床意义上的优效性。

有一种情况值得注意，即求得的可信区间的下限大于－δ，但上限却比0小,管理当局比如美国的FDA可能仍然把试验药看作和标准药不等效，甚至比标准药还差，尽管非劣效性的标准已经达到了。

这一额外增加的标准之严格,似乎并不是从统计学意义上考虑的。

事实上，这对很高效地完成试验而出现了窄小的ＣＩ可能是不公正的。

４非劣效性/等效性试验样本含量估计及检验效能对服从正态分布的数据（定量指标)和服从二项分布的数据（率指标）分别介绍.4.1定量指标4．1．1非劣效性试验按照单侧的检验水准α，要求允许的二类误差概率不超过β,在T＝Ｓ的条件下,非劣效性试验每组需要的样本含量为:n=2［(Z1－α+z1-β)（s／δ）］2检验效能为:１-β＝Ф［δ(2s２／n)-１/２—ｚ1-α］式中s为两组的合并标准差.n为每组的样本含量。

Ф［x］代表标准正态分布下x左侧的概率Pr［X≤x］。

例3：上例继续。

若按非劣效性设计试验，假定,α=0.05,β=0。

非劣效、等效性、优效性

关键词：非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究，以判断和区别其实际的疗效如何，审评中我们常见到的错误是采用如下传统的假设检验：无效假设 H0: A药的疗效-B药的疗效＝0备择假设 H1： A药的疗效≠B药的疗效结论：如P>0.05,按α＝0.05的检验水准不能拒绝H0假设，如P≤0.05，则接受H1假设。

传统的假设检验之所以不合理，在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等，是纯粹的统计学意义，而未体现实际的临床意义，虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1: μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义，而未将实际临床意义包含进来考虑。

因此，临床试验的统计学家们提出了区间假设检验的方法，提出以临床意义的差异Δ来进行假设检验，这就是非劣效、等效和优效性检验的概念和方法。

非劣效等效性优效性

非劣效、等效和优效性检验及其适用范围摘要：在对国内临床研究报告的审评中我们经常遇到以传统的显着性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围;关键词：非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验：无效假设H0:A药的疗效-B药的疗效＝0备择假设H1：A药的疗效≠B药的疗效结论：如P>,按α＝的检验水准不能拒绝H0假设,如P≤,则接受H1假设;目前已经公认这种传统的假设检验又称显着性检验用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验;传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0或μ1-μ2<0,但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑;另一方面,对于传统检验的结论,如P>,表示两药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能把握度不够,尚需更大样本量进行检验；如P≤,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的;因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法;非劣效性试验指主要研究目的是显示对试验药的反应在临床意义上不差于非劣于对照药的试验ICH－E9的定义;如果治疗差异A药的疗效-B药的疗效>0,则试验药的疗效较好；治疗差异<0,则对照药疗效较好；如果我们允许A药疗效比B药疗效低一定范围,仍然认为两药疗效相当,即确定Δ表示临床意义上判断疗效不差所允许的最大差异值,则如果治疗差异>-Δ,便是试验药非劣效于对照药,此处的Δ称为非劣效试验的判断界值margin;非劣效试验的假设检验是无效假设H0:A药的疗效-B药的疗效≤-Δ备择假设H1：A药的疗效-B药的疗效>-Δ结论：如P>,按单侧α＝的检验水准不能拒绝H0假设,即无法判断A药不差于B药；如P≤,则接受H1假设,可以认为A药不差于B药;等效性试验指主要研究目的是要显示两种或多种处理的反应间差异的大小在临床上并无重要性的试验,通常通过显示真正的差异在临床上可以接受的等效的上下界值之间来证实ICH －E9的定义;等效性试验的假设检验是无效假设H0:A药的疗效-B药的疗效≤-Δ,或A药的疗效-B药的疗效≥Δ备择假设H1：-Δ<A药的疗效-B药的疗效<Δ结论：如P1>或P2>,按2α＝的检验水准不能拒绝H0假设,即无法判断A药等效于B药；如P1≤且P2≤,则接受H1假设,可以认为A药等效于B药;优效性试验指主要研究目的是显示所研究的药物的反应优于对比制剂阳性或安慰剂对照的试验ICH－E9的定义;优效性试验的假设检验是无效假设H0:A药的疗效-B药的疗效≤Δ备择假设H1：A药的疗效-B药的疗效>Δ结论：如P>,按单侧α＝的检验水准不能拒绝H0假设,即无法判断A药优于B药；如P≤,则接受H1假设,可以认为A药优于B药;实际应用中,更多采用的是可信区间法检验,它是分析时最直接的方法,而且比假设检验提供更多的信息;非劣效性试验中我们仅关注一个方向的可能差异,因此试验药与对照药的疗效差异的单侧％或双侧95％可信区间应当完全在-Δ值的右侧,即其单侧％或双侧95％可信区间的下限应该大于设定的判断界值-Δ,即单侧％CIA-B的下限>-Δ或双侧95%CIA-B下限>－Δ,类似道理,等效性试验中等效的结果应该是其95％可信区间范围包括在-Δ与Δ之间,即-Δ<95%CIA-B<Δ,而优效性试验的结果则应该是其单侧％或双侧95％可信区间的下限大于Δ值,即单侧%CIA-B下限>Δ或双侧95%CIA-B下限>Δ;二、非劣效、等效和优效检验的适用范围对于一个新研发的试验药,通常具有某方面的优势,如给药方便、耐受性较好,毒性较低或价格便宜等等,一般需要与安慰剂进行优效性试验以比较其真正的疗效和安全性,来判断其上市的利益风险;如果当前已有曾经优效性试验证实的有效药物的话,还常常与其进行比较,并判定待验证药物的疗效至少不差于非劣于已有有效药物作为其上市的最低标准;而等效性试验的应用多见于对同一活性成分的生物等效性以及血浆无法测定时的临床等效验证; 非劣效性试验通常用于与已上市的有效药物或标准治疗方案进行比较以求能提供一个新的治疗选择,少数情况下当安慰剂对照不被允许或违反伦理时,用以间接证明试验药优于安慰剂;我国的研发情况是自主创新药品较少,而仿制国外已上市药品占多数,对于国内尚未上市的药品,无论是创新药还是仿制药,如选安慰剂为对照则应证实其优效性,如选国内已上市的同一治疗领域的药物作为阳性对照药,则应至少验证其具有非劣效性;与已上市药物相同活性成分的药品应进行生物等效性或临床等效性验证;。

从临床试验实例看优效等效和非劣效试验

从临床试验实例看优效、等效与非劣效试验-结合一些临床试验的例子对优效、等效与非劣效试验再做一点阐述，权当加深理解吧。

让我们先看一个简单的例子(J Am Acad Dermatol 2003;48:535-41)：为了证实地氯雷他定对慢性荨麻疹的疗效与安全性，研究者设计了一项地氯雷他定对比安慰剂治疗慢性荨麻疹的随机对照双盲试验。

本试验选择的主要终点是与基线相比搔痒评分的变化。

假设标准差为 1.0分，每组需要100例病人在0.05的显著性水平上有90％的把握能检验出两组0.5分或更多的差别。

最后结果地氯雷他定与基线相比搔痒评分的变化为 1.05，安慰剂组为0.52，p<0.001. 结论地氯雷他定可以有效治疗慢性荨麻疹。

以上这个例子就是一个最经典的优效性试验的例子，即通过安慰剂对照试验显示试验药物优于安慰剂，从而证实试验药物的疗效。

随着医学的发展，现在各个疾病基本上都有自己有效的治疗药物，这时我们推出一种新药，往往在选择对照时，不得不选择那些已有的有效治疗药物，所以相比较安慰剂对照试验，阳性对照试验越来越多，而阳性对照试验最理想的情况是，你的药物优于阳性对照药物，这与上文中提及的安慰剂对照试验一样，是证实你的药物的疗效的最好的也是最有力的方法。

给大家介绍一个药物研发历史上一个很著名的阳性对照优效性试验的例子－EVIDENCE研究。

优效性、等效性、非劣性研究的区别

我们进行临床试验的目的是检验药物（治疗）的效果，而效果往往是需要一个参照药物（治疗）的。

在临床试验中，研究参与人员往往对优效、等效、非劣效这三个概念不是很清晰，甚至对混用，尤其是在根据统计分析结果来推导结论时。

优效性研究假设如下：H0（无效假设，Null Hypothesis）：研究药物疗效—对照药物疗效<优效标准H1（备择假设，Alternative Hypothesis）：研究药物疗效—对照药物疗效=>优效标准当拒绝H0时，统计结论是可以认为研究药物疗效优于对照药物；当不能拒绝H0时，统计结论是不可以认为研究药物疗效优于对照药物。

非劣效性研究假设如下：H0（无效假设，Null Hypothesis）：研究药物疗效—对照药物疗效<非劣效标准H1（备择假设，Alternative Hypothesis）：研究药物疗效—对照药物疗效=>非劣效标准当拒绝H0时，统计结论是可以认为研究药物疗效不劣于对照药物；当不能拒绝H0时，统计结论是不可以认为研究药物疗效不劣于对照药物。

等效性研究假设如下：H0（无效假设，Null Hypothesis）：|研究药物疗效-对照药物疗效|>等效标准H1（备择假设，Alternative Hypothesis）：|研究药物疗效-对照药物疗效|<=等效标准当拒绝H0时，统计结论是可以认为研究药物疗效与对照药物等效；当不能拒绝H0时，统计结论是不可以认为研究药物疗效与对照药物等效。

而我们做的比较多是非等效研究，即当等效标准为0时，与等效性研究假设相反的研究。

假设如下：H0（无效假设，Null Hypothesis）：|研究药物疗效-对照药物疗效|<=等效标准=0H1（备择假设，Alternative Hypothesis）：|研究药物疗效-对照药物疗效|>等效标准=0当拒绝H0时，统计结论是可以认为研究药物疗效与对照药物不等效；当不能拒绝H0时，统计结论是不可以认为研究药物疗效与对照药物不等效（但不是等效）。

非劣效等效性优效性

非劣效等效性优效性标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]非劣效、等效和优效性检验及其适用范围？？摘要：在对国内临床研究报告的审评中我们经常遇到以传统的显着性检验代替非劣效等设计的检验的情况，下文探讨了二者的区别及适用范围。

关键词：非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究，以判断和区别其实际的疗效如何，审评中我们常见到的错误是采用如下传统的假设检验：无效假设H0:A药的疗效-B药的疗效＝0备择假设H1：A药的疗效≠B药的疗效结论：如P>,按α＝的检验水准不能拒绝H0假设，如P≤，则接受H1假设。

目前已经公认这种传统的假设检验（又称显着性检验）用于临床试验判断药物的疗效是不合理的，它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义，因此国际普遍采用非劣效、等效或优效性假设检验。

另一方面，对于传统检验的结论，如P>,表示两药疗效的差别无统计学意义,不拒绝H0假设，说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论，并不是当然的接受H0假设，并非认为H0假设必然成立而两药疗效的总体均数一定相等，此时有可能两药疗效的总体均数确实相似，也有可能是检验效能（把握度）不够，尚需更大样本量进行检验；如P≤，两药疗效的差别有统计学意义,也就是说，两药疗效的总体均数确实不相等，但这种统计学意义的差异不一定具有实际的临床意义，也可能其临床意义却是优效、等效或非劣效的。

非劣效、等效性、优效性

关键词：非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究，以判断和区别其实际的疗效如何，审评中我们常见到的错误是采用如下传统的假设检验：无效假设 H0: A药的疗效-B药的疗效＝0备择假设 H1： A药的疗效≠B药的疗效结论：如P>0.05,按α＝0.05的检验水准不能拒绝H0假设，如P≤0.05，则接受H1假设。

传统的假设检验之所以不合理，在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等，是纯粹的统计学意义，而未体现实际的临床意义，虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1: μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义，而未将实际临床意义包含进来考虑。

因此，临床试验的统计学家们提出了区间假设检验的方法，提出以临床意义的差异Δ来进行假设检验，这就是非劣效、等效和优效性检验的概念和方法。

从临床试验实例看优效、等效和非劣效试验

从临床试验实例看优效、等效和非劣效试验-结合一些临床试验的例子对优效、等效和非劣效试验再做一点阐述，权当加深理解吧。

本试验选择的主要终点是与基线相比搔痒评分的变化。

假设标准差为1.0分，每组需要100例病人在0.05的显著性水平上有90％的把握能检验出两组0.5分或更多的差别。

最后结果地氯雷他定与基线相比搔痒评分的变化为1.05，安慰剂组为0.52，p<0.001. 结论地氯雷他定可以有效治疗慢性荨麻疹。

以上这个例子就是一个最经典的优效性试验的例子，即通过安慰剂对照试验显示试验药物优于安慰剂，从而证实试验药物的疗效。

给大家介绍一个药物研发历史上一个很著名的阳性对照优效性试验的例子－EVIDENCE研究。

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

优效性试验（superiority）—显示优效性的设计通过安慰剂对照试验显示优于安慰剂或优于阳性药，或由剂量反应关系证实疗效是最可信的。

此类试验称为优效性试验。

非劣效性（non-inferiority）—试验/等效性(equivalence)试验—显示非劣效性或等效性的设计，以阳性药物为对照，试验的目标是显示试验药物的疗效与某种已知的阳性药物“不差”或“相当”，分别称为非劣效性试验和等效性试验稳定性假设（constancy assumption）—指阳性对照药物在既往研究（对安慰剂）中的效应量在当前的非劣效性或等效性试验保持不变。

检测灵敏度（assay sensitivity）—分辨某种治疗与较差的治疗或无效的治疗之间差别的能力，对优效性试验、非劣效性试验与等效性试验具有不同的意义。

优效性试验如果是成功的，即试验显示出试验药与安慰剂之间的差别，则检验灵敏度自然成立；对非劣效性和等效性试验而言，如果阳性药没有检测灵敏度，一个无效的试验药可能会因为非劣效性而错误地确认其疗效。

{无效药如何得出非劣效性}一、非劣效性/等效性试验中的样本含量估计（一）决定非劣效性/等效性试验样本含量估计的要素1. 非劣效性（non-inferiority）/等效性(equivalence)界值从临床意义上确认药物的疗效，需要事先确认评价的界值。

在优效性试验中，界值指试验药和对照药之间相差的临床上认可的最小值。

在非劣效性试验中指临床上可接受的最大值。

对非劣效性和等效性试验，它必须小于阳性对照药与安慰剂比较时的效应差值（如果已知，可取去1/3或1/2）。

界值的确定需要由主要研究者从临床意义上和统计学专业人员才统计学意义上共同商定，而不是单独依赖于主要研究者或统计学专业人员。

优效性试验和非劣效性试验仅用一个界值，用δ0表示；而等效性试验要用劣侧和优侧两个界值，分别用δ01和δ02表示，理论上两侧界值可以取不等距，但实际上有一般取等距。

界值确定必须在实验设计阶段完成，并在试验方案中阐明，如有修订，必须在揭盲之前进行并阐述理由，一旦揭盲，不得修改。

这一点很重要，若不遵守，则很容易陷入“数字游戏”的危险。

根据既往经验，对有些临床定量指标具有专业意义上的变化量，{血压实验组—血压对照组}可根据粗略的界值参考标准，例如血压可取为0.67kPa(5mmHg)，胆固醇可取为0.52mmol/L(20mg/dl),白细胞可取为0.5x109/L(500个/mm3)。

非劣效性/等效性试验经常是对变化量间的比较，相应的界值（指变化量之间的差值）应更小{血压变化值实验组—血压变化值对照值}，例如血压变化值的等效界值可取为0.4kPa(3mmHg)，胆固醇变化值的等效界值可取为0.26mmol/L(10mg/dl),白细胞变化值的等效界值可取为0.2x109/L （200个/mm3)。

当难以确定时，可酌取1/5~1/2个标准差或参比组均数的1/10~1/5等。

{变化值的标准差和变化值的标准误？还是指标的标准差、标准误？} 对两组率而言，建议取15%以下的值，通常最大不超过对照组样本率的1/5。

当然，界值也不能过小。

例12--1 为了显示一种新药血管紧张素Ⅱ拮抗剂（AⅡ）治疗轻中度原发性高血压的降压效果不差于标准药血管紧张素转换酶抑制剂（ACE），主要终点指标用仰卧舒张压（）的下降幅度，{变化量} 应如何考虑制定非劣性界值的问题？资料表明，，既往ACE与安慰剂的对照试验显示最小的药物效应差值Δ为 1.34kPa（10mmHg），基于临床考虑，认为用δ0=0.40kPa(约为Δ的1/3)作为非劣效性试验的界值是合理的{有文献表明不可取}，即只要AⅡ的平均降压不比ACE的平均降压值小0.40kPa 或更多，则可认为AⅡ与ACE相比为非劣效。

当然，若适当放宽控制非劣效的标准时，δ0的取值可稍微大些，例如δ0=0.670kpa(约为Δ的1/2)。

2.Ⅰ、Ⅱ型错误概率Ⅰ型错误概率用α表示，指事实为劣效/不等效时拒绝了劣效/不等效的概率；Ⅱ型错误概率用表示,指当事实为非劣效/等效是接受了劣效/不等效的概率。

检验功效power=1—β。

一般准则是，α取0.05或0.10，β取0.05、0.10或0.20。

新药注册研究中，α取0.05或0.10，β取0.20或0.10可被认可。

3. 变异度反映两组总的变异程度，一般用方差（或标准差）表示。

两组定量指标均数比较，其方差可通过两组样本方差估计，或用标准治疗组方差，或以既往研究结果作为估计值。

两组率指标比较其方差可通过两组样本率估计，或根据既往知识取值；若难以获知事先信息。

可用50%作为总体率，估算最大样本含量。

4. 终点指标类型及效应测量最常见的终点指标和二分类指标。

从非劣效性/等效性对比判定考虑，还需考虑效应指标差值或比值的选择问题，一般使用差值。

对两组比较以δ表示两组总体参数或比值。

在实际进行非劣效性/等效性设计时往往不能获知δ的大小，通常令δ=0 (两组为差值时)或δ=1（两组为比值时）。

5.比较类型设计非劣性试验是为了显示试验治疗按照一个事先制定的界值δ0不差于标准治疗，该类型试验关心的问题是单侧的，但对试验治疗可能优于的程度未加限制。

而等效性试验关心的问题则是双侧的，希望阐明两种治疗的效应在两个方向上差别不大，即分别按照界值δ01和δ02揭示出试验治疗既不比标准治疗差，也不优于标准治疗。

从假设检验的角度考虑，双侧等效性不同于大家熟知的通常意义上的双侧检验情形（图12-2a）。

后者涉及的无效假设是δ取单个数值δ0，备选假设取两个方向上的不同于δ0的任何值，因此其备选假设是“双侧”的。

然而，在双侧等效性情况下（图12-2b），无效假设（δ≤δ01或δ≥δ02）是双侧的。

这种比较类型的不同将体现在样本含量估计中。

6.两组的例数分配比例两组比较去相等的样本含量时总样本含量最少，且可在同等总样本含量下达到最高的统计效能，当然，实际工作中也可按需要进行两组不等的样本含量估算。

试验中有时尚需结合具体情况进行适当调整，例如考虑最多的是依从性和失访问题。

（1）依从性（compliance）临床试验的困难之一就是患者不遵从指定的治疗。

从保守的角度考虑，假定不依从的患者没有从治疗中收益，则样本含量调整计算式为：2)1(m adj p n n -=式中，p m : 不依从的比例，表12-2列举了不同的不依从比例的调整因子大小。

表12-2 不同的依从比例下的调整因子大小不依从比例 0.05 0.10 0.20 0.30 0.50调整因子=1/(1—m P )2 1.11 1.23 1.56 2.04 4.00（2）失访（loss to follow-up ）泛指分析时未能获得终点结果。

假定失访率为l, 则样本含量调整公式为：l n n -=1它假定所有患者的失访都发生在随机化时（？？），可见该结果偏于保守。

（二）非劣效性/等效性试验样本含量的估计方法非劣效性试验两组总样本含量计算通用公式为）（）（）（k k N -+-+=111][20δδμμσβα式中，N ：两组总样本含量；2σ：方差；αμ，βμ：对应于α和β的标准正态离差；k 和（k —1）：各组在总样本中所占的比例；δ：对照组减试验组的总体真实差值；δ0：临床上可以接受的界值。

对非劣效性/等效性试验，常设定δ=0。

方差2σ须事先给定。

对于率指标，若两组总体率相同且已知为π，则2σ=π（1—π）；若两组总体率不同，则π可取两总体率的平均数。

实际应用中常难以获得总体信息，可以预实验结果代替。

设T 代表试验组，P 代表阳性对照组，根据预实验结果对方差进行估计，定量指标和二分类率指标的计算公式分别为2)1()1(222-+-+-=p T p p T T n n n S n S S)1(2C c P p S -=式中，C P ：为两组预实验样本的合并率，P T P P T T C n n p n p n P ++=。

对等效性试验，假定两端界值等距，即δ02=﹣δ01=δ0，计算总体样本含量将单侧βμ替换为双侧2/βμ即可。

例12-2 例12-3由上例计算结果不难理解，若试验目的主要在于确认新药不比标准药差。

而不关心新药是否比标准药好，采用非劣效性试验更节省样本含量。

二、非劣效性/等效性试验中的统计推断（一）判定非劣效性/等效性的假设检验方法我们平时所做的觉得多数假设检验其零假设为两总体参数相等，其统计推断往往仅限于两者的差别是否有统计学意义。

若P＞α, 意味着统计上“不能拒绝零假设”，但并非说明零假设成立，更没有理由说两组相等；若P≤α，虽然可“拒绝零假设”，但也只能推断两者在统计上有差别，而不能评价差别的大小。

为能对非劣效性/等效性进行推断，需要建立有别于传统的检验假设，并据此进行统计推断。

1. 检验假设的构建无效假设和备选假设分别用H0和H a表示。

以α作为总的检验水准。

设T为试验组参数，P为阳性对照组参数，表12-3列举几种不同情形的检验假设。

（此时不能在称无效假设为零假设了）表12-3 不同试验类型的检验假设试验类型无效假设备选假设检验水准非劣效性试验H0：T—P ≤﹣δ0 H a：T—P ＞α等效性试验H01：T—P ≤﹣δ0 H a1：T—P＞﹣δ0 α／2H02：T—P ≥δ0 H a2：T—P＜δ0 α／2 统计优效性试验H0：T—P ≤0H a：T—P ＞0 α临床优效性试验H0：T—P ≤δ0 H a：T—P ＞δ0α假设检验的意义：①非劣效试验H0：试验药劣于对照药，其差值大于或等于﹣δ0H a：试验药非劣于对照药②等效性试验 H 01：试验药劣于对照药，其差值大于或等于﹣δ0 H a1：试验药非劣于对照药H 02：试验药优于对照药，其差值大于或等于δ0 H a2：试验药非优于对照药③优效性试验 H 0：两药疗效相等或试验药劣于对照药，其差值大于或等于0或者δ0H a ：试验药优于对照药2. 检验统计量和推断结论（1）非劣效性试验由非劣效性试验的检验假设可见只需进行一次单侧检验即可做出推断结论。

若P ≤α，则拒绝H 0，可推论T 非劣效于P ；若P ＞α，则还不能下非劣效的结论。

这里的α含义是，当T 比P 疗效差，其效应值实际上超过δ0时，错误地下T 非劣效于P 的结论的概率。

1）定量指标均数的非劣效性检验用单侧t 检验，统计量计算PT X X P T S X X t ----=)()(δ 自由度？式中，P T X X S -：两组均数差值的标准误)11](2)1()1([22PT P T P P T T X X n n n n n S n S S P T +-+-+-=-。

2）率指标率的非劣效性检验用单侧u 检验，统计量计算P T P P P T S P P u --+=)(0δ式中，P T P P S -：两组率差值的标准误)11)(1(P T c c P P n n p p S P T +-=-（2）等效性试验对等效性的推断需要采用双向单侧检验，即在两个方向上同时进行两次单侧检验（two one-sided tests)。

非劣效性、等效性临床试验

实用文库汇编之非劣效、等效性、优效性

临床试验中的非劣效性、优效性和等效性检验

非劣效、等效性、优效性

差异性、优效性、等效性和非劣效性检验的区别

非劣效等效和优效性检验及其适用范围

从临床试验实例看优效、等效和非劣效试验

差异性、优效性、等效性和非劣效性检验的区别

临床非劣效性与等效性评价的统计学方法二

非劣效、等效性、优效性

非劣效等效性优效性

从临床试验实例看优效等效和非劣效试验

优效性、等效性、非劣性研究的区别

最新非劣效、等效性、优效性

非劣效等效性优效性

非劣效、等效性、优效性

从临床试验实例看优效、等效和非劣效试验