非劣效、等效性、优效性
医学统计学:临床试验设计1
非劣效性试验:临床认为一种药物的疗效不比另外一种药物
的疗效差,是指两种药物的疗效差πT -πC不超过一个允许的
范围 - Δ < πT -πC ;
单侧检验
单侧检验
优效性和非劣效性试验仅用一个界值,而等效性试验要用到
劣侧和优侧两个界值。
33
2019-06-19
34
2019-06-19
优效性试验
等效性试验(equivalence trial)
非劣效性试验(non-inferiority trial )
2019-06-19
2019-06-19
29
传统的假设检验——差异性检验
大部分无效假设是两组或多组的总体参数相等,备择假设为
两组或多组的总体参数不等,称之为差异性检验(testing f
达到临界值(Δ);
等效性试验:临床上认为一种药物的疗效与另外一种药物的
疗效是等效的,并不是两种药物疗效相等,而是指两种药物
的疗效差πT -πC不超过一个允许的范围 - Δ < πT -πC <
or difference)。其推断统计仅限于两组或多组的差异有无
统计学意义。
30
临床试验中,还有
优效性试验(superiority trial)
等效性试验(equivalence trial)
非劣效性试验(non-inferiority trial )
若P>α,意味着统计上“不能拒绝无效假设”,并非说明无效
临床试验必须得到所在医疗单位伦理委员会的批准,如果是
新药或新的医疗器械的临床试验,还需要得到药品监督管理
部门的批准,同时还要得到每一位受试者或其亲属、监护人
优效性等效性非劣性研究的区别
优效性等效性非劣性研究的区别This model paper was revised by the Standardization Office on December 10, 2020我们进行临床试验的目的是检验药物(治疗)的效果,而效果往往是需要一个参照药物(治疗)的。
在临床试验中,研究参与人员往往对优效、等效、非劣效这三个概念不是很清晰,甚至对混用,尤其是在根据统计分析结果来推导结论时。
优效性研究假设如下:H0 (无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<优效标准H1 (备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>优效标准当拒绝H0时,统计结论是可以认为研究药物疗效优于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效优于对照药物。
非劣效性研究假设如下:H0 (无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<非劣效标准H1 (备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>非劣效标准当拒绝H0时,统计结论是可以认为研究药物疗效不劣于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效不劣于对照药物。
等效性研究假设如下:H0 (无效假设,Null Hypothesis): |研究药物疗效-对照药物疗效|>等效标准H1 (备择假设,Alternative Hypothesis): |研究药物疗效-对照药物疗效|<=等效标准当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物等效。
而我们做的比较多是非等效研究,即当等效标准为0时,与等效性研究假设相反的研究。
假设如下:H0(无效假设,Null Hypothesis): |研究药物疗效-对照药物疗效|<=等效标准=0H1 (备择假设,Alternative Hypothesis): |研究药物疗效-对照药物疗效|>等效标准=0当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物不等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物不等效(但不是等效)。
非劣效等效性优效性修订稿
非劣效等效性优效性集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-非劣效、等效和优效性检验及其适用范围摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显着性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0:A药的疗效-B药的疗效=0 备择假设H1:A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。
目前已经公认这种传统的假设检验(又称显着性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
优效性等效性非劣性研究的区别
优效性等效性非劣性研究的区别标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]我们进行临床试验的目的是检验药物(治疗)的效果,而效果往往是需要一个参照药物(治疗)的。
在临床试验中,研究参与人员往往对优效、等效、非劣效这三个概念不是很清晰,甚至对混用,尤其是在根据统计分析结果来推导结论时。
优效性研究假设如下:H0 (无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<优效标准H1 (备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>优效标准当拒绝H0时,统计结论是可以认为研究药物疗效优于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效优于对照药物。
非劣效性研究假设如下:H0 (无效假设,Null Hypothesis):研究药物疗效—对照药物疗效<非劣效标准H1 (备择假设,Alternative Hypothesis):研究药物疗效—对照药物疗效=>非劣效标准当拒绝H0时,统计结论是可以认为研究药物疗效不劣于对照药物;当不能拒绝H0时,统计结论是不可以认为研究药物疗效不劣于对照药物。
等效性研究假设如下:H0 (无效假设,Null Hypothesis): |研究药物疗效-对照药物疗效|>等效标准H1 (备择假设,Alternative Hypothesis): |研究药物疗效-对照药物疗效|<=等效标准当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物等效。
而我们做的比较多是非等效研究,即当等效标准为0时,与等效性研究假设相反的研究。
假设如下:H0(无效假设,Null Hypothesis): |研究药物疗效-对照药物疗效|<=等效标准=0H1 (备择假设,Alternative Hypothesis): |研究药物疗效-对照药物疗效|>等效标准=0当拒绝H0时,统计结论是可以认为研究药物疗效与对照药物不等效;当不能拒绝H0时,统计结论是不可以认为研究药物疗效与对照药物不等效(但不是等效)。
差异性优效性等效性和非劣效性检验的区别
差异性、优效性、等效性和非劣效性检验的区别在临床研究工作中,我想大部分临床研究者都听说过优效性、等效性和非劣 效性检验等,有很多人也很明白,但也有人尚不太清楚它们之间的区别, 本期我 们将和大家一起来讨论这一问题。
1什么是差异性检验?差异性检验,大家天天都在用,其实大家的论文里大部分用的都是差异性检 验。
比如独立样本t 检验,两个可选的假设分别是 A=B 和心B 。
这就是差异性 检验,或者叫不等的检验,意思就是 A 和B 两组有差异、不相等。
什么意思呢? 就是检验A-B=0这一公式成立与否。
比如同一批病人,我们随机分成 A 和B 组,然后检验A 组和B 组患者血红蛋 白水平的高低,这就是差异性检验。
即 A 组和B 组之间有差异,什么叫有差异, 就是两组间的差异不等于00跟上述内容相反的是,当我们将A 组和B 组之间的差异跟一个既定的值(△) 比较时,就产生了一系列的检验,如优效性、等效性和非劣效性检验。
下面这个图可以先看一下:2、什么是优效性、等效性和非劣效性检验?差畀性检验上述三种检验在临床药物试验中应用最多,当我们研制一种新药物的时候我们总是盼着新药的疗效比较好,或者跟旧药差不多。
我想没有人会盼着研制的新药的疗效差于旧的药物,那么还研制它干嘛啊。
基于上述三种情况,就提出了三个用于新药临床试验的检验思路,分别是优效性、等效性和非劣效性检验。
下面分别说明,先假设一个例子,某研究者要研究A 药与B药的关系,他能够接受的差值是2.1 优效性检验研究目的:A药的效果好于B药。
研究假设:(1)无效假设:A-B< A ;(2)备择假设:A-B>4。
备注:用来证实新药A的效果好于旧药B,来判断新药A上市的情况。
它是一个单侧的检验。
2.2 等效性检验研究目的:A药的效果等于B药。
研究假设:(1)无效假设:A-B W - △或A-B> A ; (2)备择假设:-Av A-B v A。
备注:常用于同一活性成分的药物之间的疗效比较,证实的是A药和B药的疗效相当。
差异性、优效性、等效性和非劣效性检验的区别
差异性、优效性、等效性和非劣效性检验的区别在临床研究工作中,我想大部分临床研究者都听说过优效性、等效性和非劣效性检验等,有很多人也很明白,但也有人尚不太清楚它们之间的区别,本期我们将和大家一起来讨论这一问题。
1、什么是差异性检验?差异性检验,大家天天都在用,其实大家的论文里大部分用的都是差异性检验。
比如独立样本t检验,两个可选的假设分别是A=B和A≠B。
这就是差异性检验,或者叫不等的检验,意思就是A和B两组有差异、不相等。
什么意思呢?就是检验A-B=0这一公式成立与否。
比如同一批病人,我们随机分成A和B组,然后检验A组和B组患者血红蛋白水平的高低,这就是差异性检验。
即A组和B组之间有差异,什么叫有差异,就是两组间的差异不等于0。
跟上述内容相反的是,当我们将A组和B组之间的差异跟一个既定的值(Δ)比较时,就产生了一系列的检验,如优效性、等效性和非劣效性检验。
下面这个图可以先看一下:2、什么是优效性、等效性和非劣效性检验?上述三种检验在临床药物试验中应用最多,当我们研制一种新药物的时候我们总是盼着新药的疗效比较好,或者跟旧药差不多。
我想没有人会盼着研制的新药的疗效差于旧的药物,那么还研制它干嘛啊。
基于上述三种情况,就提出了三个用于新药临床试验的检验思路,分别是优效性、等效性和非劣效性检验。
下面分别说明,先假设一个例子,某研究者要研究A药与B药的关系,他能够接受的差值是Δ。
2.1 优效性检验研究目的:A药的效果好于B药。
研究假设:(1)无效假设:A-B≤Δ;(2)备择假设:A-B>Δ。
备注:用来证实新药A的效果好于旧药B,来判断新药A上市的情况。
它是一个单侧的检验。
2.2 等效性检验研究目的:A药的效果等于B药。
研究假设:(1)无效假设:A-B≤-Δ或A-B≥Δ;(2)备择假设:-Δ<A-B <Δ。
备注:常用于同一活性成分的药物之间的疗效比较,证实的是A药和B药的疗效相当。
它可以是单侧也可以是双侧的检验。
劣效、等效和优效性 检验 及其适用 范围
劣效、等效和优效性检验及其适用范围劣效、等效和优效性检验及其适用范围劣效、等效和优效性检验及其适用范围审评四部审评八室黄钦摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验: 无效假设H0:A药的疗效-B药的疗效=0备择假设H1:A药的疗效?B药的疗效结论:如P0.05,按α=0.05的检验水准不能拒绝H0假设,如P?0.05,则接受H1假设。
目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ20(或μ1-μ20),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P0.05,表示两药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有把握度)不够,尚需更大样本量进行检验;如P?0.05,两药疗可能是检验效能( 效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
临床非劣效性与等效性评价的统计学方法二
临床非劣效性与等效性评价的统计学方法二第一步:非劣效性评价单侧假设检验:z=(2+3)/1.033=4.84>1.645(z0。
95),P<0.05单侧95%可信区间下限:CL=2-1.645×1。
033=0.301〉—3两种方法均显示,在抗高血压效果方面新药AII拮抗剂与标准药ACE抑制剂相比具有非劣效性.第二步:优效性评价单侧假设检验:z=2/1.033=1.936〉1。
645,P<0.05单侧95%可信区间下限:CL=0.301〉0结果表明,新药AII拮抗剂比标准药ACE抑制剂的抗高血压效果具有统计学意义优效性。
ICHE9指导原则中的建议[1]更保守些,若按α取0.025的标准判断,非劣效性评价的z=4.84〉1.96(z0.975),P<0.025,可下非劣效性结论。
但是,因优效性评价的z=1。
936<1.96,P〉0.025,尚不能认为具有统计学优效性,更达不到临床意义上的优效性。
有一种情况值得注意,即求得的可信区间的下限大于-δ,但上限却比0小,管理当局比如美国的FDA可能仍然把试验药看作和标准药不等效,甚至比标准药还差,尽管非劣效性的标准已经达到了。
这一额外增加的标准之严格,似乎并不是从统计学意义上考虑的。
事实上,这对很高效地完成试验而出现了窄小的CI可能是不公正的。
4非劣效性/等效性试验样本含量估计及检验效能对服从正态分布的数据(定量指标)和服从二项分布的数据(率指标)分别介绍.4.1定量指标4.1.1非劣效性试验按照单侧的检验水准α,要求允许的二类误差概率不超过β,在T=S的条件下,非劣效性试验每组需要的样本含量为:n=2[(Z1-α+z1-β)(s/δ)]2检验效能为:1-β=Ф[δ(2s2/n)-1/2—z1-α]式中s为两组的合并标准差.n为每组的样本含量。
Ф[x]代表标准正态分布下x左侧的概率Pr[X≤x]。
例3:上例继续。
若按非劣效性设计试验,假定,α=0.05,β=0。
戏说临床试验中的非劣效性、优效性和等效性检验_奥咨达统计部_范安_180914
戏说临床试验中的非劣效性、优效性和等效性检验药物/医疗器械临床试验中,根据试验目的不同,需采用不同检验来验证假设。
实际应用中,大家常听说非劣效、优效、等效等名词,傻傻分不清楚。
本文将从实例角度,对三者戏说漫道,以作区分,望行业内小白也能知其一二,此心甚慰!奥家有两位千金,小彤和小依,均貌美如花。
小彤稍年长,已到了谈婚论嫁的年纪,追求者甚众。
小彤也是精挑细选,终于觅得一位如意郎君,小伙长的贼精神,英俊帅气,高大威猛,身高足有一米八。
小依也到了如花似玉的年纪,看到姐姐幸福美满,十分羡慕,也希望找一个自己满意的男友。
那么问题来了,什么样条件的男友,小依才会认为满意呢?这里首先涉及到临床试验中选取主要评价指标的问题。
用帅来评价可以吗?所谓萝卜青菜,各有所爱,帅这个东西,太主观了,每个人对帅都有自己的定义,人们常说一朵鲜花插牛粪,那是外人的眼光来评价,鲜花自己可能觉得赏心悦目。
因此太主观的指标不太好量化,还是换个标准吧。
这也就是为什么临床试验中,问统计专家该采用什么主要指标评价产品性能的时候,他们总建议采用客观性评价指标(可测量可量化),而不推荐使用主观性指标。
那么该采用什么指标呢?身高(高优指标,越高越好的指标)!这也是众多女生比较喜爱的主要择偶标准之一,客观且好量化。
那好,就采用它来作为小依择男友的评价标准吧。
问题接着来了,到底多高,才是小依对男友满意的身高呢?小依听取了众多闺蜜的意见,大致分成了三类,转换成统计术语如下:(1)非劣效:可以比姐夫矮一点,但是不能矮太多。
多少不算矮太多呢?以姐姐小彤男友的身高作为阳性对照,小依认为,5厘米(非劣效界值)是她可以忍受的差距。
根据这条标准,小依找的男朋友可以比1.80m高,但最低不能低于1.75m(图1),这就是大家常说的非劣效的概念,很明显,这是个单侧的比较。
图1 非劣效图示(2)优效:比姐夫高。
也就是说,小依将来找的男朋友,一定要高于1.80m。
1)假如小依只要男友高于姐夫就好,那么将来男友的身高-姐夫的身高>0cm(优效界值1)即可(图2);2)假如小依对未来男友的身高很有信心,认为肯定可以超过1.85m,那么1.85m-1.80m=5cm(优效界值2),将来男友的身高,只有高于1.85m,才算合格(图3)。
非劣效临床试验的统计学考虑
非劣效临床试验的统计学考虑在医学研究和药物开发领域,临床试验是至关重要的环节,用于评估新疗法或新设备的有效性和安全性。
其中,非劣效临床试验旨在验证新疗法或新设备与现有标准疗法或设备的比较效果,本文将详细介绍非劣效临床试验中的统计学考虑。
非劣效临床试验是指通过比较新疗法或新设备与现有标准疗法或设备的疗效,来评估新疗法或新设备是否非劣于现有疗法或设备。
非劣效临床试验通常采用双盲、随机、对照的设计,以消除偏倚和增加试验的可靠性。
在非劣效临床试验中,统计学原理是试验设计和数据分析的基础。
通过运用随机化和对照原则,能够减少偏倚、提高试验的内部效度和外部效度,并最终得出可靠的结果。
在非劣效临床试验中,样本的选取是至关重要的。
通常,研究人员会根据研究目的、研究假设、研究人群和研究资源等因素来制定样本的选取原则。
在确定样本的选取原则后,研究人员需要选择适当的试验组和对照组。
试验组为接受新疗法或新设备的患者,对照组为接受现有标准疗法或设备的患者。
在选择试验组和对照组时,研究人员需要考虑匹配和随机化的原则,以减少偏倚对试验结果的影响。
研究人员还需要评估试验结果的置信区间。
置信区间是用于描述试验结果不确定性的指标,通常是指从样本统计量加减一定比例的抽样误差所得到的一个范围。
在非劣效临床试验中,置信区间的评估对于判断新疗法或新设备的非劣效性具有重要意义。
在非劣效临床试验中,常用的统计学方法包括但不限于以下几种:意向性分析:这是非劣效临床试验中最重要的统计学方法之一。
它按照患者的原始分组进行统计分析,从而能够充分利用所有收集到的数据。
随机化分组和盲法:这些技术有助于减少偏倚,提高试验的内部效度和外部效度。
参数估计和假设检验:这些技术用于描述和解释试验结果,以及推断新疗法或新设备是否非劣于现有疗法或设备。
结论与启示非劣效临床试验在评估新疗法或新设备的疗效方面具有重要意义。
通过运用统计学原理和方法对试验结果进行分析,研究人员可以得出可靠的结论,从而为临床医生和患者提供更多有效的治疗选择。
劣效、等效和优效性 检验 及其适用 范围
劣效、等效和优效性检验及其适用范围劣效、等效和优效性检验及其适用范围劣效、等效和优效性检验及其适用范围审评四部审评八室黄钦摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验: 无效假设H0:A药的疗效-B药的疗效=0备择假设H1:A药的疗效?B药的疗效结论:如P0.05,按α=0.05的检验水准不能拒绝H0假设,如P?0.05,则接受H1假设。
目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ20(或μ1-μ20),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P0.05,表示两药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有把握度)不够,尚需更大样本量进行检验;如P?0.05,两药疗可能是检验效能( 效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
最新非劣效、等效性、优效性
非劣效、等效和优效性检验及其适用范围摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0: A药的疗效-B药的疗效=0备择假设H1:A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。
目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。
非劣效等效性优效性
非劣效等效性优效性标准化管理处编码[BBX968T-XBB8968-NNJ668-MM9N]非劣效、等效和优效性检验及其适用范围??摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显着性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设H0:A药的疗效-B药的疗效=0备择假设H1:A药的疗效≠B药的疗效结论:如P>,按α=的检验水准不能拒绝H0假设,如P≤,则接受H1假设。
目前已经公认这种传统的假设检验(又称显着性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1:μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P>,表示两药疗效的差别无统计学意义,不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
医疗器械临床试验常用的设计类型
医疗器械临床试验常用的设计类型
医疗器械临床试验设计的统计学设计类型主要包括配对设计(Paired design)、平行组设计 (parallel group design)、交叉设计(crossover design)。
配对设计是指对同一受试者分别采用试验器械和对照器械进行检测,所得数据为针对于同一受试者的成对数据,这样有效控制了非试验因素对试验结果的影响,非常有效地提高了试验效率。
配对试验常用于对人体生物学指标进行客观测量的而无治疗作用的器械,如心电记录仪。
平行组设计又称为随机对照试验,是最常用的临床试验设计类型。
可为试验器械设置一个或多个对照器械。
阳性对照一般采用已经上市并且临床使用安全有效同类器械作为对照,阴性对照一般采用安慰剂方法,但必须符合伦理学要求。
平行组设计常用于具有临床治疗作用的器械。
交叉设计是按事先设计好的试验次序,在各个时期对受试者逐一实施各种处理,以比较各处理组间的差异。
交叉设计是将自身比较和组间比较设计思路综合应用的一种设计方法,可以控制个体间的差异,同时减少受试者人数。
最简单的交叉设计是2´2形式。
另外临床试验根据比较目的不同又可分为优效性(superiority)检验、等效性(equivalence)检验、非劣效性(non-inferiority)检验。
优效性检验的目的是显示试验器械治疗效果优于对照药,包括:试验器械是否优于安慰剂;试验器械是否优于阳性对照器械等。
等效性检验的目的是确认两种或多种器械治疗的效果差别大小在临床上并无重要意义,即试验器械与阳性对照器械在治疗上相当。
非劣效性检
验的目的是显示试验器械治疗效果在临床上不劣于阳性对照器械。
非劣效、等效性、优效性
非劣效、等效和优效性检验及其适用范围摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验一、传统检验和区间检验药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:无效假设 H0: A药的疗效-B药的疗效=0备择假设 H1: A药的疗效≠B药的疗效结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。
目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1: μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非劣效、等效性、优效性
非劣效、等效和优效性检验及其适用范围
摘要:在对国内临床研究报告的审评中我们经常遇到以传统的显著性检验代替非劣效等设计的检验的情况,下文探讨了二者的区别及适用范围。
关键词:非劣效试验等效性试验优效性试验
一、传统检验和区间检验
药品的临床试验一般要求设计为随机、盲法和对照药物比较的研究,以判断和区别其实际的疗效如何,审评中我们常见到的错误是采用如下传统的假设检验:
无效假设H0: A药的疗效-B药的疗效=0
备择假设H1:A药的疗效≠B药的疗效
结论:如P>0.05,按α=0.05的检验水准不能拒绝H0假设,如P≤0.05,则接受H1假设。
目前已经公认这种传统的假设检验(又称显著性检验)用于临床试验判断药物的疗效是不合理的,它不能准确区分两药疗效差异的方向性和体现差异大小所揭示的临床实际意义,因此国际普遍采用非劣效、等效或优效性假设检验。
传统的假设检验之所以不合理,在于两个方面,一方面它所推断的是两个总体均数在统计学是否不相等,是纯粹的统计学意义,而
未体现实际的临床意义,虽然有单双侧之分,如单侧为H0:μ1-μ2=0,H1: μ1-μ2>0(或μ1-μ2<0),但它检验的依然是样本所代表的总体均数的统计学含义,而未将实际临床意义包含进来考虑。
另一方面,对于传统检验的结论,如P>0.05,表示两药疗效的差别无统计学意义, 不拒绝H0假设,说明现有数据尚无法对两药疗效的总体均数是否不等的判断下结论,并不是当然的接受H0假设,并非认为H0假设必然成立而两药疗效的总体均数一定相等,此时有可能两药疗效的总体均数确实相似,也有可能是检验效能(把握度)不够,尚需更大样本量进行检验;如P≤0.05,两药疗效的差别有统计学意义,也就是说,两药疗效的总体均数确实不相等,但这种统计学意义的差异不一定具有实际的临床意义,也可能其临床意义却是优效、等效或非劣效的。
因此,临床试验的统计学家们提出了区间假设检验的方法,提出以临床意义的差异Δ来进行假设检验,这就是非劣效、等效和优效性检验的概念和方法。
非劣效性试验指主要研究目的是显示对试验药的反应在临床意义上不差于(非劣于)对照药的试验(ICH-E9的定义) 。
如果治疗差异(A药的疗效-B药的疗效)>0,则试验药的疗效较好;治疗差异<0,则对照药疗效较好;如果我们允许A药疗效比B药疗效低一定范围,仍然认为两药疗效相当,即确定Δ表示临床意义上判断疗效不差所允许的最大差异值,则如果治疗差异>-Δ,便是试验药非劣效于对照药,此处的Δ称为非劣效试验的判断界值
(margin)。
非劣效试验的假设检验是
无效假设H0: A药的疗效-B药的疗效≤-Δ
备择假设H1:A药的疗效-B药的疗效>-Δ
结论:如P>0.025,按单侧α=0.025的检验水准不能拒绝H0假设,即无法判断A药不差于B药;如P≤0.025,则接受H1假设,可以认为A药不差于B药。
等效性试验指主要研究目的是要显示两种或多种处理的反应间差异的大小在临床上并无重要性的试验,通常通过显示真正的差异在临床上可以接受的等效的上下界值之间来证实(ICH-E9的定义) 。
等效性试验的假设检验是
无效假设H0: A药的疗效-B药的疗效≤-Δ,或A药的疗效-B药的疗效≥Δ
备择假设H1:-Δ< A药的疗效-B药的疗效<Δ
结论:如P1>0.025 或P2>0.025,按2α=0.05的检验水准不能拒绝H0假设,即无法判断A药等效于B药;如P1≤0.025且P2≤0.025,则接受H1假设,可以认为A药等效于B药。
优效性试验指主要研究目的是显示所研究的药物的反应优于对比制剂(阳性或安慰剂对照)的试验(ICH-E9的定义)。
优效性试验的假设检验是
无效假设H0: A药的疗效-B药的疗效≤Δ
备择假设H1:A药的疗效-B药的疗效>Δ
结论:如P>0.025,按单侧α=0.025的检验水准不能拒绝H0假设,即无法判断A药优于B药;如P≤0.025,则接受H1假设,可以认为A药优于B药。
实际应用中,更多采用的是可信区间法检验,它是分析时最直接的方法,而且比假设检验提供更多的信息。
非劣效性试验中我们仅关注一个方向的可能差异,因此试验药与对照药的疗效差异的单侧97.5%(或双侧95%)可信区间应当完全在-Δ值的右侧,即其单侧97.5%(或双侧95%)可信区间的下限应该大于设定的判断界值-Δ,即[单侧97.5%CI (A-B)的下限] >-Δ(或[双侧95% CI (A-B)下限] >-Δ),类似道理,等效性试验中等效的结果应该是其95%可信区间范围包括在-Δ与Δ之间,即-Δ< [95% CI (A-B)] < Δ,而优效性试验的结果则应该是其单侧97.5%(或双侧95%)可信区间的下限大于Δ值,即[单侧97.5% CI (A-B)下限] >Δ(或[双侧95% CI (A-B)下限] >Δ)。
二、非劣效、等效和优效检验的适用范围
对于一个新研发的试验药,通常具有某方面的优势,如给药方便、耐受性较好,毒性较低或价格便宜等等,一般需要与安慰剂进行优效性试验以比较其真正的疗效和安全性,来判断其上市的利益风险。
如果当前已有曾经优效性试验证实的有效药物的话,还常常与其进行比较,并判定待验证药物的疗效至少不差于(非劣于)已有有效药物作为其上市的最低标准。
而等效性试验的应用多见于对同一活性
成分的生物等效性以及血浆无法测定时的临床等效验证。
非劣效性试验通常用于与已上市的有效药物或标准治疗方案进行比较以求能提供一个新的治疗选择,少数情况下当安慰剂对照不被允许或违反伦理时,用以间接证明试验药优于安慰剂。
我国的研发情况是自主创新药品较少,而仿制国外已上市药品占多数,对于国内尚未上市的药品,无论是创新药还是仿制药,如选安慰剂为对照则应证实其优效性,如选国内已上市的同一治疗领域的药物作为阳性对照药,则应至少验证其具有非劣效性。
与已上市药物相同活性成分的药品应进行生物等效性或临床等效性验证。