EMEA发布的非劣效性界值选择的指导原则

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

EMEA发布的《非劣效性界值选择的指导原则》

审评四部审评八室黄钦审校

伦敦，2005年7月27日索引：EMEA/CPMP/EWP/2158/99

人用药品委员会（CHMP）

生效日期 2006年1月

前言

1.背景

2.一般考虑

3.证明疗效

3.1 三个组的试验：试验产品、参照品和安慰剂

3.2 两个组的试验：试验产品和对照产品

3.3 不能肯定优于安慰剂的情况

4.确定与活性对照药相比可接受的疗效

5. 难以证明有合理非劣效性界值的情况

5.1使用显著性水平升高的优效性

5.2在另一方面有优势的产品

6.结论

前言

许多将一种试验产品与一种活性对照药物进行比较的临床试验被设计为非劣效性试验。目前“非劣效性”这一术语已得到普遍认可，但如果从字面上来理解可能会产生误导。非劣效性试验的目的往往声明为了证实试验产品不亚于对照药物。但只有优效性试验才能证实这一点。事实上非劣效性试验的目的是为了证实试验产品不如对照产品的程度，不超过事先指定的一个较小的量。这个量被称为非劣效性界值（non-inferiority margin），或称为Δ。

在许多情况下，可能进行非劣效性试验而不做优效性试验，或者除了做优效性试验，另外再做劣效性试验。这些情况包括：

l 在某些情况下不可能进行生物等效性研究时（例如缓释产品或局部用制剂），根据基本上相似的情况提出的申请；

l 与标准治疗相比安全性方面可能有优势的产品需要与标准治疗进行疗效比较，以便进行风险-受益评价；

l 需要直接与活性对照进行比较以协助风险受益评价的情况；

l 与活性对照相比疗效没有显著降低可以接受的情况；

l 不能用安慰剂组，要用活性对照试验以证实试验产品疗效的某些疾病。

在以上最后4种情况下，如果能显示优于参照产品则不一定要做非劣效性试验。

为证实非劣效性，推荐的方法是在方案中事先指定一个非劣效性的界值。研究完成后，计算出两种药物真正差异的双侧95%可信区间（或单侧97.5%可信区间）。这一区间应当完全在非劣效性界值（non-inferiority margin）的有利一侧。Δ的选择在临床上和统计学方面一定要合理。一定要根据特定的临床情况而具体制定，没有适用于各种情况的统一规则。但某些原则可作为一般指导。

以下法规性的指南可供参考用于选择非劣效性或等效性界值。这些指南要与本指南结合起来看。

l ICH指南E9的注释（临床试验的统计学原理）（ICH Note for Guidance E9 (Statistical Principles for Clinical Trials）；

l ICH指南E10的注释（对照组的选择）（ICH Note for Guidance E10 (Choice of Control Group）；

l CPMP优效性和非劣效性转换的考虑要点（CPMP Points to Consider on Switching Between Superiority and Non-inferiority）

这些文件中，有关如何选择非劣效性界值的讨论有限。但它们确实就非劣效性研究的设计和操作作了详细的讨论。这些问题极为重要，如果试验的开展没有达到足够高的标准，那么Δ的选择就毫无意义。

本文件讨论两种类型的非劣效性试验：2个组的试验即试验产品和对照品；3个组的试验，即试验产品、活性对照药和安慰剂。

试验产品的表现有许多方面需要考虑。这些大致与疗效和安全性有关，但这些方面的每一项都可以针对每个产品细分为许多关注点。一项临床试验或临床计划可能是为了显示某些变量的非劣效性，而其他一些变量可能需要证明优效性。这份文件中“非劣效性”和“优效性”用于指单个终点而不是整个产品的特点。

始终假定治疗效果可以测定，并且测量值可以区分期望的（正面）与不期望的（负面）作用。再进一步假定所测变量的正面数值越大，则正面作用越大。

文件中多数使用不同治疗之间的绝对差值作为例子来描述这一概念。这些讨论也适用于考虑相对效果的研究，只需进行少量修改即可。例如在一项考虑相对效果的试验中，点估计值为1反映治疗之间无差异，估计值为0则表示有差异。

尽管安全性参数也可定义非劣效性界值，但本文件中提到的方法均使用疗效参数进行描述，因此，对疗效终点的许多讨论不适用于安全性试验，特别是整个第3节。

1.背景

非劣效性试验的结果通常以双侧95%可信区间进行评价，这个区间显示的是试验产品（试验：T）和活性对照药（参照：R）之间真正差异的可信范围。结果中有2个方面应当引起特别注意。一个是差异的点估计值，即所观察到的试验产品和参照产品之间的差异。另一个是可信区间的下限。点估计值表示真正差异的最佳估计值，因此如果它是正数，并且这是所获得的所有证据，那么试验产品很可能优于参照产品，反之亦然。另一方面，可信区间的下限表示较低的限度，其含义通常是根据所列数据可以排除的试验品不如参照产品的程度。事实上这不是一个真正的低限，劣效性的幅度可能更大。但一般认为真正差异比这一限度所提示的差异更不好的机率在一定认可水平非常小。

如果T和R效果相等，那么无论样本量大小，差异的点估计值应当有50%的机率为正数，有50%的机会为负数。因此单纯点估计值不足以作为相对疗效的指标。在真正相等的情况下，差异的可信区间的下限随样本量的增加会逐渐接近于0，因此理论上可以通过足够大的样本来排除任何所期望程度的非劣效性。但如果治疗真正等效时，就不可能设计一个研究来排除所有程度的非劣效，因为这需要规模无穷大的实验。

因此从一开始就要明确，如果T不可能不如R，那么就不能用非劣效性试验开发与对照药疗效相等的产品。

2.一般考虑

l 非劣效性界值的选择要根据统计学推理和临床判断综合考虑。

l 试验药、参照药和安慰剂的三组试验可以在本试验内部对非劣效性界值进行一定程度的验证，因此这是推荐的试验设计；应当尽可能采用。

l 正确选择界值应当确保试验药物临床上有意义的作用大于0。选择界值的这个方面在第3节讨论。

l 通常非劣效性试验的主要焦点是试验产品和参照产品的相对疗效，而不单纯是要证明试验产品有效。在这些情况下，正确选择界值，除了证明产品有效之外，还要证明试验产品不会比参照品差很多，因此得到比较严谨的界值。选择界值的这个方面在第4节讨论。