CCTS非劣效临床试验的统计学考虑-中国卫生统计,2012,29(2):270-274

合集下载

【干货分享】CCTS:临床试验统计分析计划及统计分析报告

【干货分享】CCTS:临床试验统计分析计划及统计分析报告

【干货分享】CCTS:临床试验统计分析计划及统计分析报告中国临床试验生物统计学组(CCTS)成员(按姓名拼音排序):陈峰、陈平雁、陈启光、贺佳、黄钦、金丕焕、李康、李宁、李卫、李晓松、凌莉、刘玉秀、苏炳华、孙高、王武保、王彤、魏朝晖、夏结来、姚晨、易东、尹平、于浩、张罗漫、赵耐青。

统计分析计划统计分析计划(statistical analysis plan,SAP)是对临床试验的统计学考虑及拟对数据进行统计分析的清晰描述。

统计分析计划可以是独立的文件,其内容涵盖试验中所涉及的所有统计学考虑,且具有技术性和可操作性,包括了设计的类型、比较的类型、随机化与盲法、主要指标和次要指标的定义与测量、检验假设、数据集的定义、疗效及安全性评价和统计分析的详细计划。

另外,临床试验方案中也包括统计分析计划或统计学考虑部分,其内容是独立的统计分析计划的主要部分。

统计分析报告统计分析报告(statistical analysis report,SAR)是依据统计分析计划,对试验数据进行统计分析后形成的报告,是临床试验结果的重要呈现手段’是撰写临床研究报告(clinical study report,CSR)的关键依据。

针对统计分析计划和统计分析报告所涉及的内涵,中国临床试验生物统计学工作小组(CCTS)经过充分讨论,形成如下共识。

一、意义为了有效地控制分析偏倚,保证试验结论的科学性,应在试验设计阶段计划最终的统计分析策略,数据锁定前应确定统计分析计划,数据锁定后按计划进行统计分析。

统计分析报告是提供给主要研究者撰写临床试验总结报告的关键文件,是科学、完整、准确、合理地撰写临床试验报告的依据。

本文主要针对药物临床试验的要求进行阐述,相关内容也可以作为医疗器械等临床试验的参考。

二、统计分析计划的制定时间试验方案中的统计分析计划应与试验方案同时完成,是统计分析的核心内容。

作为独立文件的统计分析计划初稿应形成于试验方案和病例报告表确定之后,是方案中的统计分析计划的扩展,在临床试验进行过程中以及数据盲态审核时,可以进行修改、补充和完善,不同时点的统计分析计划应标注版本,正式文件在数据锁定之前完成并予以确认。

非劣效性、等效性临床试验(优选内容)

非劣效性、等效性临床试验(优选内容)

优效性试验(superiority)—显示优效性的设计通过安慰剂对照试验显示优于安慰剂或优于阳性药,或由剂量反应关系证实疗效是最可信的。

此类试验称为优效性试验。

非劣效性(non-inferiority)—试验/等效性(equivalence)试验—显示非劣效性或等效性的设计,以阳性药物为对照,试验的目标是显示试验药物的疗效与某种已知的阳性药物“不差”或“相当”,分别称为非劣效性试验和等效性试验稳定性假设(constancy assumption)—指阳性对照药物在既往研究(对安慰剂)中的效应量在当前的非劣效性或等效性试验保持不变。

检测灵敏度(assay sensitivity)—分辨某种治疗与较差的治疗或无效的治疗之间差别的能力,对优效性试验、非劣效性试验与等效性试验具有不同的意义。

优效性试验如果是成功的,即试验显示出试验药与安慰剂之间的差别,则检验灵敏度自然成立;对非劣效性和等效性试验而言,如果阳性药没有检测灵敏度,一个无效的试验药可能会因为非劣效性而错误地确认其疗效。

{无效药如何得出非劣效性}一、非劣效性/等效性试验中的样本含量估计(一)决定非劣效性/等效性试验样本含量估计的要素1. 非劣效性(non-inferiority)/等效性(equivalence)界值从临床意义上确认药物的疗效,需要事先确认评价的界值。

在优效性试验中,界值指试验药和对照药之间相差的临床上认可的最小值。

在非劣效性试验中指临床上可接受的最大值。

对非劣效性和等效性试验,它必须小于阳性对照药与安慰剂比较时的效应差值(如果已知,可取去1/3或1/2)。

界值的确定需要由主要研究者从临床意义上和统计学专业人员才统计学意义上共同商定,而不是单独依赖于主要研究者或统计学专业人员。

优效性试验和非劣效性试验仅用一个界值,用δ0表示;而等效性试验要用劣侧和优侧两个界值,分别用δ01和δ02表示,理论上两侧界值可以取不等距,但实际上有一般取等距。

新药临床非劣及等效性试验中的例数估计和等效标准

新药临床非劣及等效性试验中的例数估计和等效标准

此文发表于:中国新药杂志2003;12(5): 368-371新药临床非劣及等效性试验中的例数估计和等效标准郑青山1,孙瑞元1,陈志扬2(1安徽省药物临床评价中心、皖南医学院弋矶山医院,芜湖 241001;2华中科技大学同济医学院,武汉 430030)[摘要] 本文根据新药临床研究的要求和特点,提出临床非劣及等效性试验例数估计的简算法和查表法,并探讨确定等效标准(δ)的几种方法,可供例数估算时参考。

[关键词] 临床试验;非劣性试验;等效性试验;样本含量;等效标准Sample size estimation and equivalence margin in noninferiority and equivalence trialsZHENG Qing-shan1, SUN Rui-yuan1, CHEN Zhi-yang2(1 Anhui Provincial Center for Drug Clinical Evaluation & Yijishan Hospital of Wannan Medical College, Wuhu 241001,China; 2 Tongji Medical College, Huazhong University of Science and Technology, Wuhan 430030,China)[Abstract] Based on the character and requirements of new drug clinical trials, a simple algorithm for estimating sample size and some methods for determination of equivalence margin (δ) in noninferiority and equivalence clinical trials were provided in this paper.[Key words] noninferiority trial; equivalence trial; sample size; equivalence margin临床试验中作两药等效判别,不能依据“显著性检验P>0.05”,而应采用“非劣或等效性试验(noninferiority or equivalence trials) 的P<0.05” [1-3]。

Bootstrap法与H-L法中位数差值区间检验在非劣效试验中的模拟比较研究

Bootstrap法与H-L法中位数差值区间检验在非劣效试验中的模拟比较研究

Bootstrap 法与H-L 法中位数差值区间检验在非劣效试验中的模拟比较研究**基金项目:四川养老与老年健康协同创新中心项目(YLZBZ1818);成都医学院教育教学改革研究项目(JG201944)△通信作者:陈卫中,E-mail : wejone@ 126. com成都医学院公共卫生学院(610500)毛昂曾子倩魏敏陈晓芳陈卫中△【提 要】目的 比较Bootstrap 法和Hodges-Lehmann 法(H-L 法)在中位数差值非劣效性检验中的特点,为相关研 究中统计学方法的选择提供依据。

方法以某临床试验中试验组与对照组咽痛消失时间的比较为基础,通过计算机模拟 生成单组样本量分别为20、30、50、100、200各500个两独立样本,分别服从参数为90h(试验组)、100 h(对照组)的Poisson 分布。

针对每个样本采用基于正态近似和百分位数的Bootstrap 法、H-L 法求得中位数差值的置信区间,并通过置信区间 下限与非劣性界值进行比较,得岀三种方法的检验效能。

结果 三种方法均随着样本量增加,检验效能增加。

在样本量为20时,H-L 法与正态近似法检验效能相当(25% vs. 24% ),且都高于百分位数法(19% )。

在样本量为30,50,100时,H-L 法检 验效能高于正态近似法与百分位数法,且正态近似法高于百分位数法。

在样本量为200时,三种方法的检验效能相当,均在 95%以上。

结论 整体来看,H-L 法获得的区间最窄且最稳定,检验效能最高,尤其在样本量不大时建议选择H-L 法。

【关键词】非参数检验非劣效性试验中位数差值的置信区间检验Bootstrap Hodges-Lehmann 【中图分类号】R195.1 【文献标识码】A DOI 10. 3969/j.issn. 1002 -3674. 2020.06.012非劣效性试验(non-inferiority trials )被广泛应用 于药物临床试验研究。

COMPARZ研究再解读:非劣效研究中的几个统计学问题

COMPARZ研究再解读:非劣效研究中的几个统计学问题

COMPARZ研究再解读:非劣效研究中的几个统计学问题在晚期肾癌治疗领域,靶向药物已成为一线的主要治疗选择,作为指南推荐的两种一线治疗药物,培唑帕尼和舒尼替尼的疗效和安全性是否存在差异?大型随机对照研究——COMPARZ研究,采用非劣效设计,头对头比较了两类药物的疗效和安全性,给临床治疗提供了参考依据。

因此,对COMPARZ研究结果的解读,也直接影响到临床对两类药物的疗效和安全性的评估。

非劣效研究设计知多少?非劣效研究的设计在于证明干预组不劣于对照组,即为证实新干预措施劣于对照组的程度,不超过预先设定的基于主要研究终点的一个较小量,这个量被称为非劣效性界值(non-inferiority margin)或称为Δ。

Δ是非劣效研究设计成败的关键,如果Δ过大,超过临床普遍接受的范围,即使研究结果为阳性,也很难被广泛接受;如果Δ过小,则所需样本量非常大,研究可能无法进行。

因此,Δ的选择需经过临床专家和统计学家共同讨论确定。

以COMPARZ研究为例,由于标准治疗组舒尼替尼在干扰素对照的临床研究中,主要研究终点PFS的HR为0.42,经过临床专家和统计学专家的共同讨论,最终将COMPARZ的非劣效界值确定为0.25,一个理由是,综合考虑样本量对临床研究的可行性的影响,以及临床认可的中位PFS缩短时间2个月是极限接受水平。

另外一个理由是,通过两步法确保试验组疗效有足够把握优于安慰剂或干扰素治疗,1.25的界值足够保证证明试验组是相对安慰剂、干扰素治疗优效的药物。

在非劣效研究中,要求存在一个已被证实有效的或已广泛使用的标准治疗。

人群入组要求和主要研究终点方面,应与证实标准治疗疗效的关键III期临床保持一致,必须避免任何可能影响干预组和标准治疗组疗效差异的行为,得出错误的非劣效结论。

如COMPARZ研究中,标准治疗组舒尼替尼一线治疗中显著延长晚期肾透明细胞癌患者的无进展生存期(PFS),则新药培唑帕尼,在研究设计中必须入组未接受治疗的晚期肾透明细胞癌患者,主要研究终点设为PFS。

非劣效临床试验的统计学考虑

非劣效临床试验的统计学考虑
非劣 效 临床 试 验的应 用 范围
非劣 效 临床试验 的 目的是 通过 与 阳性 对 照的 比较
评 价试验 药物 的有效 性 和安全 性 。 良好设 计 的非 劣效 试 验获 得 的临 床 研 究 数据 可 以推 断 出 : 1 拒 绝 试 验 () 药 物 的疗 效劣 于 阳性 对 照药 物 疗 效 的假 设 , 即试 验 药 物 的疗效 非 劣 于 阳性 对 照 ; ( ) 或 2 尚不 能 拒 绝 试 验 药 物 的疗 效劣 于 阳性 对 照药物 的疗效 。 非 劣效 的结论 有 两层 含 义 : 验 药 的疗 效 优 于安 试 慰剂( 间接推 论试 验药 物 的有效 性 ) 试验 药 的 疗效 若 ;
计 2 1 0 2年 4月第 2 9卷第 2期

C T C S专 家 共识 ・
・ ‘ ◆ ” ◆ …・ ◆ ・ ◆ ◆ ◆ ◆ ’◆ ◆ ◆ ◆ ’・ ◆ ◆ ・ …◆ ・ ・ ◆ …・ ◆ …・ ・ ” ・ ◆ ・ ・ ◆ ¨
定 困难 。基 于此 , 临床 试 验 中 提 出 了采 用 阳性 对 照 的 非 劣效 ( o — fr ry NI 试 验 设 计 , 类 设 计 中 阳 n ni e o t , ) n ii 此 性对 照 的选择 , 劣效 界 值 的 确定 , 本 量 的估 计 , 非 样 统 计 推断 方法 等方 面均涉 及 到统计学 问题 。





非 劣 效 临 床 试 验 的 统 计 学 考 虑
C T 工作小组 夏 结 来 CS 执 笔
鉴 于非劣 效 临床试 验 在 国 内开展 地 比较 广 泛 , 但 在研 究设 计和评 价 方 面 尚未 形 成相 对 统 一 的认 识 , 为 此 中 国临床试 验生 物统 计 学 工 作 小组 ( C S , 充 C T )经 分讨 论 , 2 1 于 0 1年 1 0月 3 日于南 京汤 山 召开工 作 会 0

临床非劣效性与等效性评价的统计学方法

临床非劣效性与等效性评价的统计学方法

临床非劣效性与等效性评价的统计学方法以安慰剂作为对照的随机双盲临床试验一直被视为药物开发中的金标准,它在确认新的试验药物的疗效优于安慰剂方面发挥着重要的作用。

然而,如果有现成的疗效肯定的药物,仍用安慰剂对照做临床试验,会面临伦理上的困难。

随着愈来愈多可供应用的有效药物的出现,疗效有突破的新药愈来愈少,因而药物临床研究的目的发生了转变。

在阳性对照试验中,更多的情形是探求新药与标准的有效药物相比其疗效是否不差或疗效相等(严格地说,疗效相等应该是既不比标准药差,也不比标准药好),而并不一定要知道新药是否优于标准药,由此而提出了非劣效性/等效性试验(noninfer_iority/equivalencetrials)[1]。

非劣效性/等效性试验与通常意义下的优效性试验(superioritytrials)在设计和统计分析上是有区别的。

近年来,尽管对设计和分析该类试验已给予强调,但遗憾的是,许多非劣效性/等效性临床试验的评价缺少针对性,仍仿照安慰剂对照试验的方式进行,因而导致了非劣效性/等效性试验的样本含量估计、无效假设和备选假设确定、统计学分析和结论推断等方面的不够合理,难以达到设想的目的[2]。

本文拟主要介绍有关非劣效性/等效性试验中涉及的统计学分析方面的一些具体问题,至于在设计时还必须考虑的有关对照的选定等问题可参考文献[2]及ICH文件E10:“临床试验对照的选择”[3]。

1非劣效性/等效性界值从临床上讲,一种新药的药效不比标准对照药差,到底临床上可接受的最大允许的范围是多少呢?或者说,新药比对照药最低到多大程度才能算“非劣效(noninferiority)”呢?类似地,新药和对照药的疗效相比,最低不能低于多少以及最高不能超过多少才可认为是“等效(equivalence)”呢?这就涉及到临床非劣效性/等效性界值(nonferiority/equivalencemargin)的问题。

为叙述方便,我们统一用δ表示界值,并以-δ表示劣侧界值,以δ表示优侧界值。

非劣效临床试验的统计学考虑

非劣效临床试验的统计学考虑

非劣效临床试验的统计学考虑在医学研究和药物开发领域,临床试验是至关重要的环节,用于评估新疗法或新设备的有效性和安全性。

其中,非劣效临床试验旨在验证新疗法或新设备与现有标准疗法或设备的比较效果,本文将详细介绍非劣效临床试验中的统计学考虑。

非劣效临床试验是指通过比较新疗法或新设备与现有标准疗法或设备的疗效,来评估新疗法或新设备是否非劣于现有疗法或设备。

非劣效临床试验通常采用双盲、随机、对照的设计,以消除偏倚和增加试验的可靠性。

在非劣效临床试验中,统计学原理是试验设计和数据分析的基础。

通过运用随机化和对照原则,能够减少偏倚、提高试验的内部效度和外部效度,并最终得出可靠的结果。

在非劣效临床试验中,样本的选取是至关重要的。

通常,研究人员会根据研究目的、研究假设、研究人群和研究资源等因素来制定样本的选取原则。

在确定样本的选取原则后,研究人员需要选择适当的试验组和对照组。

试验组为接受新疗法或新设备的患者,对照组为接受现有标准疗法或设备的患者。

在选择试验组和对照组时,研究人员需要考虑匹配和随机化的原则,以减少偏倚对试验结果的影响。

研究人员还需要评估试验结果的置信区间。

置信区间是用于描述试验结果不确定性的指标,通常是指从样本统计量加减一定比例的抽样误差所得到的一个范围。

在非劣效临床试验中,置信区间的评估对于判断新疗法或新设备的非劣效性具有重要意义。

在非劣效临床试验中,常用的统计学方法包括但不限于以下几种:意向性分析:这是非劣效临床试验中最重要的统计学方法之一。

它按照患者的原始分组进行统计分析,从而能够充分利用所有收集到的数据。

随机化分组和盲法:这些技术有助于减少偏倚,提高试验的内部效度和外部效度。

参数估计和假设检验:这些技术用于描述和解释试验结果,以及推断新疗法或新设备是否非劣于现有疗法或设备。

结论与启示非劣效临床试验在评估新疗法或新设备的疗效方面具有重要意义。

通过运用统计学原理和方法对试验结果进行分析,研究人员可以得出可靠的结论,从而为临床医生和患者提供更多有效的治疗选择。

临床试验中样本量确定的统计学考虑_陈平雁

临床试验中样本量确定的统计学考虑_陈平雁

1 - β = probt t1 - α + 1) - 2, -2,

rn A δ2 ( r + 1 ) σ2 ( 8)
)
生存分析的样本量估计虽然有其特殊之处 , 但上 述原理同样适用。以基于指数分布假设的生存分析数 据为例, 令病例入组时间 ( accrual period ) 为 AT, 试验 up peri时间全长 ( total time ) 为 TT, 随访时间 ( followod) 为 TTAT。假设第 i 组第 j 个病人生存时间 t ij 服从 风险率 ( hazard rate ) 为 λ i 的指数分布, 第 i 组的失访 率服从风险率为 η i 的指数分布, 入组时间 z ij 服从在 AT 处截 断 的 指 数 分 布, 其概率 密 度 函 数 为 g ( z) =
· 728·
Chinese Journal of Health Statistics, Aug. 2015 , Vol. 32 , No. 4
临床试验的样本量通常依据对主要指标做出相应 III 期临床试验中主要指 的假定后进行估计的。在 II、 标一般是有效性评价指标, 上市后的 IV 期临床试验主 要指标可以是有效性评价指标, 也可以是安全性评价 或兼而有之。 如果样本量估计应同时依据主要 指标, 有效性指标和主要安全性指标, 在设计时应针对有效 性和安全性分别提出统计假设, 逐一计算样本量, 最终 样本量取其中最大者。主要指标应在研究方案中明确 定义, 通常需根据专业知识确定, 应是专业领域具有共 识的或认可程度较高的指标, 一般源于某一标准或指 南, 或源于专业领域公开发表的权威论著或专家共识 等。主要指标不宜太多, 一般只有一个。 当主要指标 有多个时, 样本量估计要考虑假设检验的多重性问题 。 在定义主要指标过程中, 不仅要说明指标的含义, 其测量时点、 测量手段以及计算方法都应注明。 指标 的类型要明确, 这一点非常重要, 因为样本量估计和数 据分析都需要依此进行。例如, 某些指标可以有定量、 定性( 如有效和无效 ) 、 等级 ( 如痊愈、 显效、 有效、 无 效) 、 生存时间等不同类型。 对应于指标的不同类型, 样本量估计方法亦不相同。 所以, 方案中对主要指标 的定义要具体到指标类型上。 3. 效应量 效应量是样本量估计所需的最重要参数之一 , 根 据不同的指标类型, 常见的效应量有: 均数的组间差值 HR ) 、 OR , 或标准化差值, 率的组间差值或比值( RR 、 或 相关系数、 回归系数等。 效应量参数的确定主要基于下述三种途径 : ( 1 ) 本项目的任何既往研究结果。即源于同一项 目的预试验、 探索性试验( I 期或 II 期临床试验) 、 单中 心试验的结果等作为确定参数的依据 。由于此类研究 结果属于内部证据, 因此是首选途径。 ( 2 ) 基于他人的研究结果。当本项目的先前研究 无法提供确切的参数数据, 或尚未开展研究时, 参数的 确定可以以公开发表的研究结果作为依据 。由于此类 研究结果属外部证据, 因此是次选途径。 若公开发表 最好是经 meta 分析所得合 的同类研究报道不止一个, 并效应量作为样本量估计的参数 。 ( 3 ) 基于本试验的预期结果。如果本试验没有任 何之前的研究结果可以借鉴 ( 无论是自己的还是他人 或以往的研究数据不能得到本试验设计所需的 的) , 参数( 如本试验采用交叉设计, 而以往研究数据均来 ) , 自两平行组设计的研究 可以用预期的形式进行预 设, 通常以广义效应量表达。 若对试验药物或器械有 充足信心, 则预期效应量较大( 如设为 0. 8 ) , 此时所需 样本量较小。若对试验药物或器械信心不足, 则预期 效应量较小 ( 如设为 0. 2 ) , 此时所需样本量较大。 若 对试验药物或器械的信心尚可, 则预期效应量为中等

临床试验中的非劣效性试验设计与分析

临床试验中的非劣效性试验设计与分析

临床试验中的非劣效性试验设计与分析临床试验是评估新药物、新治疗方法或新诊断工具疗效与安全性的重要手段。

在传统的临床试验中,通常采用的是非劣效性试验设计与分析方法,以确定新治疗方法是否不劣于标准治疗或对照组。

一、非劣效性试验设计非劣效性试验是一种特殊的临床试验设计,与传统的优劣效性试验有所不同。

在传统的优劣效性试验中,目标是证明新治疗方法是否优于对照组,而在非劣效性试验中,目标是证明新治疗方法对效果的损失是可以接受的,即新治疗方法不劣于标准治疗或对照组。

在非劣效性试验设计中,需要确定两个重要的参数:非劣效性边界和样本大小。

非劣效性边界是一个预先确定的差异值,表示新治疗方法与标准治疗或对照组之间所允许的最大差异。

样本大小的确定则需要根据研究的目的、预计效应大小和统计学方法来进行。

通常,为了保证试验的统计学功效,需要选择足够大的样本大小。

二、非劣效性试验分析在非劣效性试验中,需要进行合适的统计学分析来评估新治疗方法与标准治疗或对照组之间的差异。

常见的分析方法包括置信区间法和假设检验法。

1. 置信区间法:置信区间法是常用的非劣效性试验分析方法之一。

通过计算相应的置信区间,可以判断新治疗方法与标准治疗或对照组之间的差异是否超过了预先设定的非劣效性边界。

如果置信区间完全位于非劣效性边界的左侧,则可以推断新治疗方法不劣于标准治疗或对照组。

2. 假设检验法:假设检验法是另一种常用的非劣效性试验分析方法。

通过设定适当的零假设和备择假设,进行统计检验来判断新治疗方法与标准治疗或对照组之间的差异是否超过了预先设定的非劣效性边界。

如果零假设被拒绝,即新治疗方法与标准治疗或对照组之间存在显著差异,那么可以推断新治疗方法不劣于标准治疗或对照组。

三、实施非劣效性试验的注意事项在进行非劣效性试验时,需要注意以下几个关键问题:1. 非劣效性边界的选择:选择合适的非劣效性边界是非常重要的,它决定了新治疗方法与标准治疗或对照组之间差异的允许范围。

认识非劣效试验设计

认识非劣效试验设计

310中国循环杂志 2013年8月 第28卷 第4期(总第182期)Chinese Circulation Journal,August,2013,Vol. 28 No.4(Serial No.182)作者单位:100037 北京市,中国医学科学院 北京协和医学院 心血管病研究所 阜外心血管病医院 心血管疾病国家重点实验室作者简介:黄耀华 统计师 主要从事生物统计学研究 Email: huangyaohua@ 通讯作者:李卫 Email:liwei@ 中图分类号:R54 文献标识码:C 文章编号:1000-3614(2013)04-0310-01 doi:10.3969/j.issn.1000-3614.2013.04.021认识非劣效试验设计黄耀华,王杨,李卫·学习园地·关键词 非劣效试验众所周知,证明一种药物(医疗器械/治疗手段)的疗效优于另一种药物(医疗器械/治疗手段)的疗效的优效性试验(Superiority Design)设计是经典的研究设计方法,通过采用任意一种对照,来显示研究药物优于对照药(对照药可以是安慰剂,或者说无治疗、研究药物的低剂量或其他阳性药)。

优效性试验设计相对简单,易于操作,能证实研究药物的绝对疗效,结果更具有可靠性。

但随着医学的快速发展,在已有非常有效的治疗手段的基础上,进一步证明某种新手段疗效显著优于现有疗法通常是非常难的,特别是当技术上没有大的突破时。

同时,对于某些疾病,出于伦理学考虑,并不总能进行安慰剂对照的优效性试验设计,需要选择阳性药物或标准治疗来做对照[1]。

因此,目前国际上通常采用一种变通的试验设计方法——非劣效试验设计(N o n -I n f e r i o r i t y D e s i g n ),即:证明某一新药(医疗器械)疗效不差于已知的有效药物。

现在已经有越来越多的新药和医疗器械都是通过非劣效试验设计完成了临床试验并通过药品/器械审批部门的审批上市的,比如促成达比加群酯获得多国新药注册的重要依据的临床试验R E -L Y 研究和经导管主动脉瓣替换(T A V R )的P A R T N E R 研究等。

非劣效临床试验的统计学考虑

非劣效临床试验的统计学考虑

非劣效临床试验的统计学考虑
CCTS工作小组;夏结来
【期刊名称】《中国卫生统计》
【年(卷),期】2012(029)002
【摘要】为推动我国临床试验生物统计学的理论和方法研究,指导和规范临床试验中生物统计学的正确应用,进一步促进我国临床试验生物统计学的研究与国际接轨,中国卫生信息学会统计理论与方法专业委员会特成立了专题学术讨论工作小组———中国临床试验生物统计学组(China Clinical Trial Statistics Work-ing Group,简称CCTS)。

本刊从本期起连续刊登的临床试验统计学专家共识(CCTS专家共识)是CCTS成员当前对某问题形成的一致的学术见解,希望推动我国临床试验生物统计学的发展。

【总页数】5页(P270-274)
【作者】CCTS工作小组;夏结来
【作者单位】;第四军医大学卫生统计学教研室,710032
【正文语种】中文
【相关文献】
1.非参数模型在以等级资料为终点的非劣效性临床试验中的应用及SAS实现
2.临床试验研究统计学设计方法简述--优效性设计,等效性设计以及非劣效性设计
3.新型膝关节假体应用于人工膝关节置换的安全性和有效性:前瞻性、随机、阳性平行对照、非劣效性临床试验
4.新型膝关节假体应用于人工膝关节置换的安全性和有
效性:前瞻性、随机、阳性平行对照、非劣效性临床试验5.SIMPLIFY-1:莫洛替尼对比芦可替尼的非劣效性临床试验
因版权原因,仅展示原文概要,查看原文内容请购买。

临床试验中采用非劣效设计应该关注的问题

临床试验中采用非劣效设计应该关注的问题

临床试验中采用非劣效设计应该关注的问题临床试验中采用非劣效设计应该关注的问题非劣效性设计在国内新药临床研究中被普遍应用,本文就非劣效性试验的适应条件、设计中需要关注的问题进行了阐述,提出非劣效性设计并不是能够普遍应用的临床试验设计方法的观点。

临床试验是探索和确证研究药物在特定适应症人群安全有效性的重要研究方法,根据其研究目的主要有两种类型的设计,一种为优效性设计,一种为非劣效性设计。

(编者按:应该还有一类:等效性设计)优效性设计的临床试验的目的是要评估研究药物的有效性和或安全性,采用任意一种对照,通过显示研究药物优于对照药(安慰剂或者说无治疗、研究药物的低剂量、阳性药)来证明研究药物的疗效。

非劣效性设计的临床试验目的是要评估两种治疗药物的相对疗效、安全性、效益/风险关系,采用阳性药作为对照,通过显示研究药物与已知的有效药物疗效(即阳性药)不低于一个事先确定的量(即界值)而证明其有效,阳性药的已知疗效即为研究药物的疗效。

一、非劣效试验的适应条件众所周知,优效性临床试验相对于非劣效临床试验而言,试验的设计、实施以及结果的分析都相对简单和易于操作,是新药疗效探索和确证性试验中最为普遍应用的设计。

然而在有些情况下,非劣效性设计可能是需要的。

第一种情况是,上市药物的疗效很好,新研究的药物的疗效要超过标准治疗药物的可能性较小,如新的抗生素类药物,其临床研究通常采用非劣效设计。

第二种情况,与上市药物比较,预计其疗效相当,但研究药物可能具有其他特点,如更好的安全性;或者除主要的治疗作用外,在其他作用方面给患者带来益处,如降低LDL-C的降脂药,同时能升高HDL,具有更为全面的调脂作用;更方便或者依从性更好;其他特点。

第三种情况是,出于伦理的考虑,对于危及生命的适应症人群,市场已经有确切的安全有效的药物或者治疗手段,安慰剂的对照试验不被接受,需要选择阳性药或者标准治疗手段来确证研究药物的疗效不劣于前者,同时研究药物又具备其他的给患者带来益处的特点。

非劣效性检验的统计学分析_李雪迎

非劣效性检验的统计学分析_李雪迎

参考文献[1]中华医学会心血管病学分会,中华心血管病杂志编辑委员会.中国心力衰竭诊断和治疗指南2014.中华心血管病杂志,2014,42:98-122.[2]Alahdab MT,Mansour IN,Napan S,et al.Six minute walk test predicts long-term all-cause mortality and heart failurerehospitalization in African-American patients hospitalized withacute decompensated heart failure.J Card Fail,2009,15:130-135.[3]Maisel AS,Peacock WF,Shah KS,et al.Acoustic cardiography S3detection use in problematic subgroups and B-type natriureticpeptide“gray zone”:secondary results from the Heart failure andAudicor technology forRapid Diagnosis and Initial TreatmentMultinational Investigation.Am J Emerg Med,2011,29:924-931.[4]McMurray JJ,Adamopoulos S,Anker SD,et al.ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure2012:The Task Force for the Diagnosis and Treatment of Acuteand Chronic Heart Failure2012of the European Society ofCardiology.Developed in collaboration with the Heart FailureAssociation(HFA)of the ESC.Eur Heart J,2012,33:1787-1847.[5]Kelder JC,Cowie MR,McDonagh TA,et al.Quantifying the added value of BNP in suspected heart failure in general practice:an individual patient data meta-analysis.Heart,2011,97:959-963.(收稿日期:2015-05-05)·医学统计学知识·非劣效性检验的统计学分析李雪迎在临床研究中,经常碰到要验证新的治疗方法与已有的标准治疗方法具有相近的治疗效果。

非劣效-等效性界值在中药临床再评价中的应用研

非劣效-等效性界值在中药临床再评价中的应用研

非劣效-等效性界值在中药临床再评价中的应用研非劣效/等效性界值在中药临床再评价中的应用研目的:探讨非劣效/等效性界值在中药临床再评价临床试验中的作用。

方法:(1)通过理论研究和临床试验,探讨目前中药临床再评价的目的、意义及方法。

(2)对非劣效/等效性界值在中药临床再评价临床试验中的作用、确定原则及应用方法进行分析研究。

结果:(1)目前中药临床再评价存在的不足之处:试验样本量较小,试验缺乏随机对照,统计学检验存在误差,评价标准不规范,临床定位不清,新的方法技术在中药临床再评价中的应用太少,中药数据库不完善,中药重点剂型再评价未引起足够重视。

(2)目前从文献检索的结果来看,几乎所有的非劣效/等效性临床试验都没有规定非劣效/等效性界值的取值,造成了其结论只具有统计学意义,未考虑临床意义。

(3)为了临床试验结果更为可信,具有实际临床意义,必须在试验设计的时候,考虑到非劣效/等效性界值的取值。

(4)根据设计方案所确定的非劣效性界值为0.1,按证候疗效进行非劣效性检验,FAS(u=5.597,P=0.000)和PP(u=6.388,P=0.000),试验组证候疗效非劣效于对照组;对贫血有效率进行非劣效性检验,FAS(u=4.993,P=0.000)和PP(u=5.317,P=0.000),试验组贫血有效率非劣效于对照组:对月经不调有效率进行非劣效性检验,FAS(u=3.979,P=0.000)和PP(u=4.888,P=0.000),试验组月经不调有效率非劣效于对照组。

结论: (1)中药临床再评价的方法中最重要的是前瞻性多中心随机对照临床试验。

(2)基于显著性检验得到的的药物疗效统计学结果未考虑临床意义。

(3)非劣效/等效性界值的应用是统计学结果是否具有临床实际意义的关键。

(4)非劣效/等效性界值的具体取值,需要慎重的确定,必须在制定试验方案时予以提前确定。

(5)非劣效/等效性界值的最终确定,必须紧密结合试验病证的临床特征,由相关学科临床专家和统计学家共同认可。

非劣效性设计样本量估算--计数指标

非劣效性设计样本量估算--计数指标

非劣效性设计样本量估算--计数指标
李雪迎
【期刊名称】《中国介入心脏病学杂志》
【年(卷),期】2016(0)6
【摘要】非劣效性设计适用于,验证试验组的临床干预效果不比对照组差的研究设计。

在以现有的标准治疗作为对照的研究中,我们常常能够要证明的是试验措施得干预效果不比对照组差。

在这种情况下所采用的统计学设计方法为非劣效性检验。

在针对样本量估算的如下描述中:以T代表试验组;以C代表对照组,其研究假设可以表述为:
【总页数】1页(P346-346)
【作者】李雪迎
【作者单位】100034 北京,北京大学第一医院医学统计室
【正文语种】中文
【相关文献】
1.对基于均差作推断的成组设计非劣效性试验功效分析及样本量估计公式正确性的探讨 [J], 周诗国;柳伟伟;陶丽新;胡良平
2.优效性设计样本量估算--记量指标 [J], 李雪迎
3.优效性设计样本量估算--计数指标 [J], 李雪迎
4.非劣效性设计样本量估算——计量指标 [J], 李雪迎
5.等效性设计样本量估算——计数指标 [J], 李雪迎
因版权原因,仅展示原文概要,查看原文内容请购买。

临床试验中的统计学要求

临床试验中的统计学要求

临床试验中的统计学要求临床试验中的统计学要求临床试验是以病人为研究对象,比较临床治疗干预措施和对照措施的效果及其临床价值的前瞻性研究。

临床试验以人为研究对象,与动物实验不同。

在临床试验中,研究者不能完全支配病人的行为,只能要求病人避免采用某些干扰试验的治疗或行为,因此必须考虑病人的依从性问题。

临床试验还必须考虑医学伦理学问题,当新药已被证实对病人弊大于利,尽管试验仍未完成,也要中止。

当已经存在经医学验证对试验疾病有效的药物时,使用安慰剂对照是不适当的。

当病人出现紧急情况需要额外治疗措施时,也必须给予。

因此临床试验要面对比动物实验更多的问题,在设计上有着更严格的特殊要求。

新药的临床试验分为Ⅰ、Ⅱ、Ⅲ、Ⅳ期:Ⅰ期临床试验是初步的临床药理学及人体安全性评价试验,观察人体对于新药的耐受程度和药物代谢动力学,为制定给药方案提供依据;Ⅱ期临床试验是随机盲法对照临床试验,对新药有效性及安全性作出初步评价,推荐临床给药剂量;Ⅲ期临床试验是扩大的多中心临床试验,遵循随机对照原则,进一步评价有效性和安全性;Ⅳ期临床试验是新药上市后的监测,在广泛使用条件下考察疗效和不良反应,尤其是罕见不良反应。

本节主要讨论II期和III期临床试验的统计学要求。

例11.1 临床观察发现急性心肌梗塞后,梗塞区膨出和左心室重构常导致左心室增大和心功能不全。

为研究急性心肌梗塞后长期使用卡托普利治疗对心脏的保护作用,需设计一个药物疗效评价的临床试验,在设计中要考虑以下问题。

1.观察变量的选择(1)主要变量和次要变量主要变量(primary variable)又称目标变量(target variable),即能够为临床试验目的提供可信证据的变量。

临床试验的主要变量一般只有一个,必要时可有多个。

主要变量应易于量化、客观性强、被相关研究领域所公认。

次要变量(secondary variable)是指与试验主要目的有关的附加的变量,也可以是与试验次要目的有关的变量。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Chinese Journal of Health Statistics, Apr 2012 , Vol. 29 , No. 2
· 271·
1. 阳性对照有效性的既有证据( historical evidence HESDE ) 阳性对照效应来 of sensitivity to drug effects, 源于文献报道的有良好试验设计的试验结果 , 这些历 史试验已明确显示本次非劣效试验中采用的阳性对照 及其类似的药物优于安慰剂, 且随时间迁移, 药效灵敏 度基本维持稳定。根据这些试验结果可以可靠地估计 出阳性对照的效应大小。阳性对照的效应大小是非劣 既不能用 效试验的关键设计参数( 确定非劣效界值 ) , 历史研究中最好的疗效作为其效应大小的估计 , 也不 能仅用 meta 分析的点估计作为效应大小的估计 , 效应 大小估计时要充分考虑历史研究间的变异 。 对于缓解症状和 / 或以主观疗效指标为主要评价 终点的药物, 难以得到阳性对照有效性的既有证据。 虽然阳性对照有缓解症状的效果, 即使是设计良好的 试验, 往往也难以重现该药物在缓解特定症状方面优 于安慰剂的结论。由于本次非劣效试验中难以确定阳 性药物是否有效, 基于此试验得出的非劣效结论就不 能确证试验药物的有效性。这是缓解症状的药物不能 采用非劣效试验的主要原因。 2. 阳性对照药物效应的稳定性( constancy assumption, CA) 阳性对照效应的估计来源于历史研究, 虽 然考虑了历史研究间的变异, 但仍有历史局限性, 受到
鉴于非劣效临床试验在国内开展地比较广泛 , 但 , 在研究设计和评价方面尚未形成相对统一的认识 为 此中国临床试验生物统计学工作小组 ( CCTS) , 经充分 讨论, 于 2011 年 10 月 30 日于南京汤山召开工作会 议, 形成如下共识。 非劣效临床试验的意义 检定或评价试验药物( T) 的有效性一般采用优效 性试验设计, 多采用安慰剂 ( P ) 对照、 空白对照、 剂量 组间对照或阳性药物对照( C ) , 其中, 安慰剂对照是最 直接和高效的对照方式。但在某些临床实践中直接采 用安慰剂对照存在伦理学风险, 如已有治疗某适应症 且可预知由于延误治疗可能导致受试者 的有效药物, 死亡、 病情进展、 残疾或不可逆的医学损伤发生, 则不 宜单纯采用安慰剂对照。剂量组间对照也存在类似的 但通过 问题。虽然采用阳性对照避免了伦理学风险, 临床试验评价试验药物优于公认的阳性对照往往有一 定困难。基于此, 临床试验中提出了采用阳性对照的 inferiority, NI) 试验设计, 非劣效( non此类设计中阳性 对照的选择, 非劣效界值的确定, 样本量的估计, 统计 推断方法等方面均涉及到统计学问题 。 非劣效临床试验的应用范围 非劣效临床试验设计要求阳性对照药物应具有较 稳定的有效性, 否则不能采用非劣效设计。 非劣效试 验一般用于有客观疗效指标的临床研究中 ( 如抗菌药 物的临床终点、 心血管治疗中的主要不良心血管事件 、 2 型糖尿病降糖治疗中 肿瘤治疗中死亡或进展事件、 的糖化血红蛋白等 ) 。 鉴于缓解症状和 / 或以主观疗 效指标为主要评价终点的临床试验 ( 如治疗抑郁、 过 、 、 ) 敏性鼻炎 咽炎 疼痛的 药 物 等 疗 效 评 价 受 试 验 质
1. 夏结来: 第四军医大学卫生统计学教研室 ( 710032 ) , Email: xiajielai @ fmmu. edu. cn
檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾殧
非劣效临床试验的统计学考虑
CCTS 工作小组
夏结来
执笔
测量方法、 受试人群的影响较大, 难以确定在本次 量、 试验样本中阳性对照是否仍然保持原有的效应 , 此类 药物的临床试验不宜采用非劣效设计。 在下列条件 下, 应不采用非劣效临床试验设计: 1 ) 药物疗效过小导致非劣效试验设计样本量超 出可行范围; 2 ) 药物疗效的研究间差异过大导致阳性对照药 不具备稳定的有效性; 3 ) 没有历史数据支持非劣效界值的确定 ; 4 ) 医疗实践的变化使得历史研究中观测到的阳 性对照药物疗效不再适用。 非劣效临床试验的目的 非劣效临床试验的目的是通过与阳性对照的比较 评价试验药物的有效性和安全性 。良好设计的非劣效 试验获得的临床研究数据可以推断出: ( 1 ) 拒绝试验 药物的疗效劣于阳性对照药物疗效的假设 , 即试验药 物的疗效非劣于阳性对照; 或 ( 2 ) 尚不能拒绝试验药 物的疗效劣于阳性对照药物的疗效 。 非劣效的结论有两层含义: 试验药的疗效优于安 慰剂( 间接推论试验药物的有效性 ) ; 试验药的疗效若 是比阳性对照药物的疗效差, 其差值也是在临床可接 。 受的范围内 多数成功的非劣效临床试验能够提供试验药物有 效性的证据, 但是能在非劣效试验中确证试验药物与 阳性对照药物疗效“相等 ” 或“相似 ” 却并不常见。 只 有在试验药物疗效的估计值优于阳性对照药物并且 C - T 的 95% CI 上限接近显示优效的情况下, 才能推断 试验药物与阳性对照药物疗效的相似性 。 非劣效临床试验的应用条件 采用阳性对照的非劣效临床试验要保证试验的检 定灵敏度( assay sensitivity) , 试验设计必须考虑以下三 个方面:
差值( 率差, 均数差) H 0 : C - T≥Δ, Δ >0 H1 : C - T < Δ H 0 : T - C ≥Δ, Δ >0 H1 : T - C < Δ
2. 非劣效界值的确定 一般根据阳性 非劣效界值的确定是设计的关键, 对照药物与安慰剂相比较的效应的既有证据来确定 , 采用 M eta 分析给出其可信区间估计。 如果历史试验 可信区间的构建可采用固定效应模型 , 间同质性较好, 否则采用随机效应模型以考虑试验间的变异对阳性对 照效应估计的影响。一般构建双侧 95% CI。 对于高优指标, 构建 ( C - P ) 区间估计后, 取区间 记为 M ( 如此可以认 下限作为阳性对照的疗效估计, 为本次非劣效试验中的阳性对照的疗效有 97. 5 % 以 上的可能大于 M ) 。 在非劣效试验设计中, 可接受最大非劣效界值 M 1 的确定要考虑既有证据的稳定性。 如果存在差异, 需 要在确定 M 1 时根据差异进行调整。 若取 M 1 < M , 令 Δ = M1 , 如果拒绝 H 0 , 则可间接 推论出试验药疗效优于安慰剂, 即 C - T < ΔT - P > C - P - Δ 0 ( 对于率比或风险比, 相当于将率做对数 推论过程是一样的) 。 变换后做差值运算, 0 < f < 1, 若取 M 2 = ( 1 - f ) M 1 , 令 Δ = M2 , 如果拒 绝 H0 , 则可推论出试验药非劣效于阳性对照, 且至少 保持了阳性对照疗效 M 的 f 倍, 譬如取 f = 0. 5 , 则至少 50% , 保持了阳性对照疗效的 即 C - T < ΔT - P > C - P - ( 1 - f ) M 1 T - P f ( C - P) 对于低优指标, 构建 ( P - C ) 区间估计后, 仍取区 间下限作为阳性对照的疗效估计 , 记为 M 。 若取 M 1 < M , 令 Δ = M1 , 如果拒绝 H 0 , 则可间接
· 270·
中国卫生统计 2012 年 4 月第 29 卷第 2 期
·CCTS 专家共识·
檾檾檾檾檾檾檾檾殧 檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾殧 [ 编者按] 为推动我国临床试验生物统计学的理论和方法研究 , 指导和规范临床试验中生物统计学的 进一步促进我国临床试验生物统计学的研究与国际接轨 , 中国卫生信息学会统计理论与方法专业 正确应用, 檾檾檾檾檾檾檾檾殧
同样 , 在优效性试验 中 被 公 认 为 保 守 的 ITT 原 则 在 尤其是当脱落 非劣效试验中则不一定仍 是 保 守 的 , 率较高且采用的 疗 效 填 补 方 法 不 当 ( 如 LOCF ) 时 。 因此 , 在试验设计和实施阶 段 都 应 该 提 高 试 验 质 量 只有高质量的临床试 验 才 能 保 证 非 劣 效 临 床 要求 , 试验的检定灵敏度 , 否则可 能 陷 入 证 明 谎 言 是 真 理 的陷阱 。 非劣效界值的确定 1. 非劣效临床试验的检验假设 为便于表述, 称数值越大表明疗效越好的指标为 高优指标, 称数值越小表明疗效越好的指标为低优指 。 , 标 例如 有效率是高优指标, 死亡率是低优指标。记 非劣效界值 Δ > 0 。
表1指标类型 高优指标 低来自指标 检验水准非劣效临床试验的检验假设
HR, OR) 比值( RR, H 0 : ln( C / T) ≥Δ, Δ >0 H 1 : ln( C / T) < Δ H 0 : ln( T / C ) ≥Δ, Δ >0 H 1 : ln( T / C ) < Δ α = 0. 025
· 272·
中国卫生统计 2012 年 4 月第 29 卷第 2 期
推论出试验药疗效优于安慰剂, 即 T - C < ΔP - T > P - C - Δ0 0 < f < 1, 若取 M 2 = ( 1 - f ) M 1 , 令 Δ = M2 , 如果拒 绝 H0 , 则可推论出试验药非劣效于阳性对照, 且至少 譬如取 f = 0. 5 , 则至少 保持了阳性对照疗效 M 的 f 倍, 保持了阳性对照疗效的 50% , 即 T - C < ΔP - T > P - C - ( 1 - f ) M 1 P - T f ( P - C) 以上非劣效界值确定方法称作两步法, 有 M2 < M 1 ≤M 。如果历史试验数据较少, 例如仅有一个可借 鉴的历史试验, 或历史试验设计有缺陷、 质量较差, 取 M 1 << M ( 即疗效折扣 discounting ) 以确保试验的鉴定 灵敏度。M 1 是阳性对照扣去了安慰剂效应的相对疗 效的保守估计, 一般借助 meta 分析法并考虑历史试验 M 2 是非劣效界值, 间的变异后确定, 其确定要结合临 床具体情况, 在考虑保留阳性对照疗效的适当比例 f 后确定。f 愈接近 1 , 样本量越大。临床试验中一般取 0. 5 ≤f≤0. 8 , 例如在心血管病药物的非劣效试验中常 取 f = 0. 5 。在抗菌药物临床试验中, 由于阳性对照药 的疗效公认且较高, 非劣效设计时, 以率作为主要指标 时直接取 M 2 = 10% ~ 15% 。 例如, 根据历史试验数据经 meta 分析后, 阳性对 95% CI 为 ( 23% , 照较 安 慰 剂 的 有 效 率 增 加 30% , 42% ) , 酌取 M 1 = 22 % < 23 % , 取 f = 0. 5 , 得 M2 = M1 ( 1 - 0. 5 ) = 11 % 。若 P < 0. 025 , 则拒绝 H 0 , 认为试验 药物的有效率非劣效于阳性对照, 且保留了阳性对照 有效率的 50% 以上。 又如, 阳性对照较安慰剂的死亡风险减少 25% ( 低优指标) , 或说安慰剂 / 阳性对照 = P / C = 1 /0. 75 = 1. 33 , 根据临床专家意见酌取 M 1 = 1. 25 < 1. 33 , 取f= 0. 5 , 则 M 2 = exp ( ( 1 - f ) ln ( M 1 ) ) = exp ( 1 ln ( M 1 ) ) 2
相关文档
最新文档