非劣效临床试验的统计学考虑_CCTS工作小组
Bootstrap法与H-L法中位数差值区间检验在非劣效试验中的模拟比较研究
Bootstrap 法与H-L 法中位数差值区间检验在非劣效试验中的模拟比较研究**基金项目:四川养老与老年健康协同创新中心项目(YLZBZ1818);成都医学院教育教学改革研究项目(JG201944)△通信作者:陈卫中,E-mail : wejone@ 126. com成都医学院公共卫生学院(610500)毛昂曾子倩魏敏陈晓芳陈卫中△【提 要】目的 比较Bootstrap 法和Hodges-Lehmann 法(H-L 法)在中位数差值非劣效性检验中的特点,为相关研 究中统计学方法的选择提供依据。
方法以某临床试验中试验组与对照组咽痛消失时间的比较为基础,通过计算机模拟 生成单组样本量分别为20、30、50、100、200各500个两独立样本,分别服从参数为90h(试验组)、100 h(对照组)的Poisson 分布。
针对每个样本采用基于正态近似和百分位数的Bootstrap 法、H-L 法求得中位数差值的置信区间,并通过置信区间 下限与非劣性界值进行比较,得岀三种方法的检验效能。
结果 三种方法均随着样本量增加,检验效能增加。
在样本量为20时,H-L 法与正态近似法检验效能相当(25% vs. 24% ),且都高于百分位数法(19% )。
在样本量为30,50,100时,H-L 法检 验效能高于正态近似法与百分位数法,且正态近似法高于百分位数法。
在样本量为200时,三种方法的检验效能相当,均在 95%以上。
结论 整体来看,H-L 法获得的区间最窄且最稳定,检验效能最高,尤其在样本量不大时建议选择H-L 法。
【关键词】非参数检验非劣效性试验中位数差值的置信区间检验Bootstrap Hodges-Lehmann 【中图分类号】R195.1 【文献标识码】A DOI 10. 3969/j.issn. 1002 -3674. 2020.06.012非劣效性试验(non-inferiority trials )被广泛应用 于药物临床试验研究。
对临床试验统计学假设检验中非劣效_等效和优效性设计的认识
药政管理对临床试验统计学假设检验中非劣效、等效和优效性设计的认识Considerations on the statistical hypothesis of noninferiority,equi valence and superiority design i n clinical tri al黄钦,赵明(国家食品药品监督管理局药品审评中心,北京100038)HUANG Q i n,Z HAO M i n g(C enter for Drug Evaluation,State Food and D rug Adm inistration,Beijing 100038,China)收稿日期:2006-09-12修回日期:2006-12-14作者简介:黄钦(1969-),男,博士,主管药师,主要从事药品审评工作通讯作者:黄钦Te:l(010)-68585566E-ma il:huangq@ 摘要:在对国内药物注册临床试验报告的审评中,常遇到以传统显著性检验代替非劣效、等效和优效性检验的错误,就它们的区别及适用范围,本文对判断界值的确定、样本含量、推断结论及审评中的主要关注点进行了阐释。
关键词:非劣效检验;等效性检验;优效性检验;显著性检验中图分类号:R954文献标识码:C文章编号:1001-6821(2007)01-0063-05药品临床试验设计要求随机、盲法和对照药物比较,以判断和区别其实际的疗效。
我国药品研发,以仿制国外已上市药品为主;基于临床认识和伦理学因素,临床研究也多选择针对目标适应症的已有治疗药物为对照,即所谓的阳性对照药。
目前,已公认的传统假设检验(又称显著性检验)在临床试验中用于判断药物的疗效是不合理的,它不能准确区分2药疗效差异的方向性和体现差异大小所揭示的临床实际意义。
因此,国际上根据研究目的不同,普遍用非劣效、等效或优效性假设检验。
1显著性检验无效假设H0:A药疗效-B药疗效=0备择假设H1:A药疗效X B药疗效结论:如P>0.05,按A=0.05的检验水准,不能拒绝H0假设;如P[0.05,则接受H1假设。
CCTS非劣效临床试验的统计学考虑-中国卫生统计,2012,29(2):270-274
Chinese Journal of Health Statistics, Apr 2012 , Vol. 29 , No. 2
· 271·
1. 阳性对照有效性的既有证据( historical evidence HESDE ) 阳性对照效应来 of sensitivity to drug effects, 源于文献报道的有良好试验设计的试验结果 , 这些历 史试验已明确显示本次非劣效试验中采用的阳性对照 及其类似的药物优于安慰剂, 且随时间迁移, 药效灵敏 度基本维持稳定。根据这些试验结果可以可靠地估计 出阳性对照的效应大小。阳性对照的效应大小是非劣 既不能用 效试验的关键设计参数( 确定非劣效界值 ) , 历史研究中最好的疗效作为其效应大小的估计 , 也不 能仅用 meta 分析的点估计作为效应大小的估计 , 效应 大小估计时要充分考虑历史研究间的变异 。 对于缓解症状和 / 或以主观疗效指标为主要评价 终点的药物, 难以得到阳性对照有效性的既有证据。 虽然阳性对照有缓解症状的效果, 即使是设计良好的 试验, 往往也难以重现该药物在缓解特定症状方面优 于安慰剂的结论。由于本次非劣效试验中难以确定阳 性药物是否有效, 基于此试验得出的非劣效结论就不 能确证试验药物的有效性。这是缓解症状的药物不能 采用非劣效试验的主要原因。 2. 阳性对照药物效应的稳定性( constancy assumption, CA) 阳性对照效应的估计来源于历史研究, 虽 然考虑了历史研究间的变异, 但仍有历史局限性, 受到
鉴于非劣效临床试验在国内开展地比较广泛 , 但 , 在研究设计和评价方面尚未形成相对统一的认识 为 此中国临床试验生物统计学工作小组 ( CCTS) , 经充分 讨论, 于 2011 年 10 月 30 日于南京汤山召开工作会 议, 形成如下共识。 非劣效临床试验的意义 检定或评价试验药物( T) 的有效性一般采用优效 性试验设计, 多采用安慰剂 ( P ) 对照、 空白对照、 剂量 组间对照或阳性药物对照( C ) , 其中, 安慰剂对照是最 直接和高效的对照方式。但在某些临床实践中直接采 用安慰剂对照存在伦理学风险, 如已有治疗某适应症 且可预知由于延误治疗可能导致受试者 的有效药物, 死亡、 病情进展、 残疾或不可逆的医学损伤发生, 则不 宜单纯采用安慰剂对照。剂量组间对照也存在类似的 但通过 问题。虽然采用阳性对照避免了伦理学风险, 临床试验评价试验药物优于公认的阳性对照往往有一 定困难。基于此, 临床试验中提出了采用阳性对照的 inferiority, NI) 试验设计, 非劣效( non此类设计中阳性 对照的选择, 非劣效界值的确定, 样本量的估计, 统计 推断方法等方面均涉及到统计学问题 。 非劣效临床试验的应用范围 非劣效临床试验设计要求阳性对照药物应具有较 稳定的有效性, 否则不能采用非劣效设计。 非劣效试 验一般用于有客观疗效指标的临床研究中 ( 如抗菌药 物的临床终点、 心血管治疗中的主要不良心血管事件 、 2 型糖尿病降糖治疗中 肿瘤治疗中死亡或进展事件、 的糖化血红蛋白等 ) 。 鉴于缓解症状和 / 或以主观疗 效指标为主要评价终点的临床试验 ( 如治疗抑郁、 过 、 、 ) 敏性鼻炎 咽炎 疼痛的 药 物 等 疗 效 评 价 受 试 验 质
临床非劣效性与等效性评价的统计学方法
临床非劣效性与等效性评价的统计学方法以安慰剂作为对照的随机双盲临床试验一直被视为药物开发中的金标准,它在确认新的试验药物的疗效优于安慰剂方面发挥着重要的作用。
然而,如果有现成的疗效肯定的药物,仍用安慰剂对照做临床试验,会面临伦理上的困难。
随着愈来愈多可供应用的有效药物的出现,疗效有突破的新药愈来愈少,因而药物临床研究的目的发生了转变。
在阳性对照试验中,更多的情形是探求新药与标准的有效药物相比其疗效是否不差或疗效相等(严格地说,疗效相等应该是既不比标准药差,也不比标准药好),而并不一定要知道新药是否优于标准药,由此而提出了非劣效性/等效性试验(noninfer_iority/equivalencetrials)[1]。
非劣效性/等效性试验与通常意义下的优效性试验(superioritytrials)在设计和统计分析上是有区别的。
近年来,尽管对设计和分析该类试验已给予强调,但遗憾的是,许多非劣效性/等效性临床试验的评价缺少针对性,仍仿照安慰剂对照试验的方式进行,因而导致了非劣效性/等效性试验的样本含量估计、无效假设和备选假设确定、统计学分析和结论推断等方面的不够合理,难以达到设想的目的[2]。
本文拟主要介绍有关非劣效性/等效性试验中涉及的统计学分析方面的一些具体问题,至于在设计时还必须考虑的有关对照的选定等问题可参考文献[2]及ICH文件E10:“临床试验对照的选择”[3]。
1非劣效性/等效性界值从临床上讲,一种新药的药效不比标准对照药差,到底临床上可接受的最大允许的范围是多少呢?或者说,新药比对照药最低到多大程度才能算“非劣效(noninferiority)”呢?类似地,新药和对照药的疗效相比,最低不能低于多少以及最高不能超过多少才可认为是“等效(eq uivalence)”呢?这就涉及到临床非劣效性/等效性界值(nonferiority/equivalencemargin)的问题。
为叙述方便,我们统一用δ表示界值,并以-δ表示劣侧界值,以δ表示优侧界值。
非劣效性检验的统计学分析_李雪迎
参考文献[1]中华医学会心血管病学分会,中华心血管病杂志编辑委员会.中国心力衰竭诊断和治疗指南2014.中华心血管病杂志,2014,42:98-122.[2]Alahdab MT,Mansour IN,Napan S,et al.Six minute walk test predicts long-term all-cause mortality and heart failurerehospitalization in African-American patients hospitalized withacute decompensated heart failure.J Card Fail,2009,15:130-135.[3]Maisel AS,Peacock WF,Shah KS,et al.Acoustic cardiography S3detection use in problematic subgroups and B-type natriureticpeptide“gray zone”:secondary results from the Heart failure andAudicor technology forRapid Diagnosis and Initial TreatmentMultinational Investigation.Am J Emerg Med,2011,29:924-931.[4]McMurray JJ,Adamopoulos S,Anker SD,et al.ESC Guidelines for the diagnosis and treatment of acute and chronic heart failure2012:The Task Force for the Diagnosis and Treatment of Acuteand Chronic Heart Failure2012of the European Society ofCardiology.Developed in collaboration with the Heart FailureAssociation(HFA)of the ESC.Eur Heart J,2012,33:1787-1847.[5]Kelder JC,Cowie MR,McDonagh TA,et al.Quantifying the added value of BNP in suspected heart failure in general practice:an individual patient data meta-analysis.Heart,2011,97:959-963.(收稿日期:2015-05-05)·医学统计学知识·非劣效性检验的统计学分析李雪迎在临床研究中,经常碰到要验证新的治疗方法与已有的标准治疗方法具有相近的治疗效果。
COMPARZ研究再解读:非劣效研究中的几个统计学问题
COMPARZ研究再解读:非劣效研究中的几个统计学问题在晚期肾癌治疗领域,靶向药物已成为一线的主要治疗选择,作为指南推荐的两种一线治疗药物,培唑帕尼和舒尼替尼的疗效和安全性是否存在差异?大型随机对照研究——COMPARZ研究,采用非劣效设计,头对头比较了两类药物的疗效和安全性,给临床治疗提供了参考依据。
因此,对COMPARZ研究结果的解读,也直接影响到临床对两类药物的疗效和安全性的评估。
非劣效研究设计知多少?非劣效研究的设计在于证明干预组不劣于对照组,即为证实新干预措施劣于对照组的程度,不超过预先设定的基于主要研究终点的一个较小量,这个量被称为非劣效性界值(non-inferiority margin)或称为Δ。
Δ是非劣效研究设计成败的关键,如果Δ过大,超过临床普遍接受的范围,即使研究结果为阳性,也很难被广泛接受;如果Δ过小,则所需样本量非常大,研究可能无法进行。
因此,Δ的选择需经过临床专家和统计学家共同讨论确定。
以COMPARZ研究为例,由于标准治疗组舒尼替尼在干扰素对照的临床研究中,主要研究终点PFS的HR为0.42,经过临床专家和统计学专家的共同讨论,最终将COMPARZ的非劣效界值确定为0.25,一个理由是,综合考虑样本量对临床研究的可行性的影响,以及临床认可的中位PFS缩短时间2个月是极限接受水平。
另外一个理由是,通过两步法确保试验组疗效有足够把握优于安慰剂或干扰素治疗,1.25的界值足够保证证明试验组是相对安慰剂、干扰素治疗优效的药物。
在非劣效研究中,要求存在一个已被证实有效的或已广泛使用的标准治疗。
人群入组要求和主要研究终点方面,应与证实标准治疗疗效的关键III期临床保持一致,必须避免任何可能影响干预组和标准治疗组疗效差异的行为,得出错误的非劣效结论。
如COMPARZ研究中,标准治疗组舒尼替尼一线治疗中显著延长晚期肾透明细胞癌患者的无进展生存期(PFS),则新药培唑帕尼,在研究设计中必须入组未接受治疗的晚期肾透明细胞癌患者,主要研究终点设为PFS。
非劣效临床试验的统计学考虑
非劣 效 临床试验 的 目的是 通过 与 阳性 对 照的 比较
评 价试验 药物 的有效 性 和安全 性 。 良好设 计 的非 劣效 试 验获 得 的临 床 研 究 数据 可 以推 断 出 : 1 拒 绝 试 验 () 药 物 的疗 效劣 于 阳性 对 照药 物 疗 效 的假 设 , 即试 验 药 物 的疗效 非 劣 于 阳性 对 照 ; ( ) 或 2 尚不 能 拒 绝 试 验 药 物 的疗 效劣 于 阳性 对 照药物 的疗效 。 非 劣效 的结论 有 两层 含 义 : 验 药 的疗 效 优 于安 试 慰剂( 间接推 论试 验药 物 的有效 性 ) 试验 药 的 疗效 若 ;
计 2 1 0 2年 4月第 2 9卷第 2期
・
C T C S专 家 共识 ・
・ ‘ ◆ ” ◆ …・ ◆ ・ ◆ ◆ ◆ ◆ ’◆ ◆ ◆ ◆ ’・ ◆ ◆ ・ …◆ ・ ・ ◆ …・ ◆ …・ ・ ” ・ ◆ ・ ・ ◆ ¨
定 困难 。基 于此 , 临床 试 验 中 提 出 了采 用 阳性 对 照 的 非 劣效 ( o — fr ry NI 试 验 设 计 , 类 设 计 中 阳 n ni e o t , ) n ii 此 性对 照 的选择 , 劣效 界 值 的 确定 , 本 量 的估 计 , 非 样 统 计 推断 方法 等方 面均涉 及 到统计学 问题 。
,
—
i
・
◆
非 劣 效 临 床 试 验 的 统 计 学 考 虑
C T 工作小组 夏 结 来 CS 执 笔
鉴 于非劣 效 临床试 验 在 国 内开展 地 比较 广 泛 , 但 在研 究设 计和评 价 方 面 尚未 形 成相 对 统 一 的认 识 , 为 此 中 国临床试 验生 物统 计 学 工 作 小组 ( C S , 充 C T )经 分讨 论 , 2 1 于 0 1年 1 0月 3 日于南 京汤 山 召开工 作 会 0
非劣效临床试验的统计学考虑_CCTS工作小组
鉴于非劣效临床试验在国内开展地比较广泛 , 但 , 在研究设计和评价方面尚未形成相对统一的认识 为 此中国临床试验生物统计学工作小组 ( CCTS) , 经充分 讨论, 于 2011 年 10 月 30 日于南京汤山召开工作会 议, 形成如下共识。 非劣效临床试验的意义 检定或评价试验药物( T) 的有效性一般采用优效 性试验设计, 多采用安慰剂 ( P ) 对照、 空白对照、 剂量 组间对照或阳性药物对照( C ) , 其中, 安慰剂对照是最 直接和高效的对照方式。但在某些临床实践中直接采 用安慰剂对照存在伦理学风险, 如已有治疗某适应症 且可预知由于延误治疗可能导致受试者 的有效药物, 死亡、 病情进展、 残疾或不可逆的医学损伤发生, 则不 宜单纯采用安慰剂对照。剂量组间对照也存在类似的 但通过 问题。虽然采用阳性对照避免了伦理学风险, 临床试验评价试验药物优于公认的阳性对照往往有一 定困难。基于此, 临床试验中提出了采用阳性对照的 inferiority, NI) 试验设计, 非劣效( non此类设计中阳性 对照的选择, 非劣效界值的确定, 样本量的估计, 统计 推断方法等方面均涉及到统计学问题 。 非劣效临床试验的应用范围 非劣效临床试验设计要求阳性对照药物应具有较 稳定的有效性, 否则不能采用非劣效设计。 非劣效试 验一般用于有客观疗效指标的临床研究中 ( 如抗菌药 物的临床终点、 心血管治疗中的主要不良心血管事件 、 2 型糖尿病降糖治疗中 肿瘤治疗中死亡或进展事件、 的糖化血红蛋白等 ) 。 鉴于缓解症状和 / 或以主观疗 效指标为主要评价终点的临床试验 ( 如治疗抑郁、 过 、 、 ) 敏性鼻炎 咽炎 疼痛的 药 物 等 疗 效 评 价 受 试 验 质
· 270·
中国卫生统计 2012 年 4 月第 29 卷第 2 期
非劣效临床试验的统计学考虑
非劣效临床试验的统计学考虑在医学研究和药物开发领域,临床试验是至关重要的环节,用于评估新疗法或新设备的有效性和安全性。
其中,非劣效临床试验旨在验证新疗法或新设备与现有标准疗法或设备的比较效果,本文将详细介绍非劣效临床试验中的统计学考虑。
非劣效临床试验是指通过比较新疗法或新设备与现有标准疗法或设备的疗效,来评估新疗法或新设备是否非劣于现有疗法或设备。
非劣效临床试验通常采用双盲、随机、对照的设计,以消除偏倚和增加试验的可靠性。
在非劣效临床试验中,统计学原理是试验设计和数据分析的基础。
通过运用随机化和对照原则,能够减少偏倚、提高试验的内部效度和外部效度,并最终得出可靠的结果。
在非劣效临床试验中,样本的选取是至关重要的。
通常,研究人员会根据研究目的、研究假设、研究人群和研究资源等因素来制定样本的选取原则。
在确定样本的选取原则后,研究人员需要选择适当的试验组和对照组。
试验组为接受新疗法或新设备的患者,对照组为接受现有标准疗法或设备的患者。
在选择试验组和对照组时,研究人员需要考虑匹配和随机化的原则,以减少偏倚对试验结果的影响。
研究人员还需要评估试验结果的置信区间。
置信区间是用于描述试验结果不确定性的指标,通常是指从样本统计量加减一定比例的抽样误差所得到的一个范围。
在非劣效临床试验中,置信区间的评估对于判断新疗法或新设备的非劣效性具有重要意义。
在非劣效临床试验中,常用的统计学方法包括但不限于以下几种:意向性分析:这是非劣效临床试验中最重要的统计学方法之一。
它按照患者的原始分组进行统计分析,从而能够充分利用所有收集到的数据。
随机化分组和盲法:这些技术有助于减少偏倚,提高试验的内部效度和外部效度。
参数估计和假设检验:这些技术用于描述和解释试验结果,以及推断新疗法或新设备是否非劣于现有疗法或设备。
结论与启示非劣效临床试验在评估新疗法或新设备的疗效方面具有重要意义。
通过运用统计学原理和方法对试验结果进行分析,研究人员可以得出可靠的结论,从而为临床医生和患者提供更多有效的治疗选择。
临床试验中样本量确定的统计学考虑_陈平雁
1 - β = probt t1 - α + 1) - 2, -2,
槡
rn A δ2 ( r + 1 ) σ2 ( 8)
)
生存分析的样本量估计虽然有其特殊之处 , 但上 述原理同样适用。以基于指数分布假设的生存分析数 据为例, 令病例入组时间 ( accrual period ) 为 AT, 试验 up peri时间全长 ( total time ) 为 TT, 随访时间 ( followod) 为 TTAT。假设第 i 组第 j 个病人生存时间 t ij 服从 风险率 ( hazard rate ) 为 λ i 的指数分布, 第 i 组的失访 率服从风险率为 η i 的指数分布, 入组时间 z ij 服从在 AT 处截 断 的 指 数 分 布, 其概率 密 度 函 数 为 g ( z) =
· 728·
Chinese Journal of Health Statistics, Aug. 2015 , Vol. 32 , No. 4
临床试验的样本量通常依据对主要指标做出相应 III 期临床试验中主要指 的假定后进行估计的。在 II、 标一般是有效性评价指标, 上市后的 IV 期临床试验主 要指标可以是有效性评价指标, 也可以是安全性评价 或兼而有之。 如果样本量估计应同时依据主要 指标, 有效性指标和主要安全性指标, 在设计时应针对有效 性和安全性分别提出统计假设, 逐一计算样本量, 最终 样本量取其中最大者。主要指标应在研究方案中明确 定义, 通常需根据专业知识确定, 应是专业领域具有共 识的或认可程度较高的指标, 一般源于某一标准或指 南, 或源于专业领域公开发表的权威论著或专家共识 等。主要指标不宜太多, 一般只有一个。 当主要指标 有多个时, 样本量估计要考虑假设检验的多重性问题 。 在定义主要指标过程中, 不仅要说明指标的含义, 其测量时点、 测量手段以及计算方法都应注明。 指标 的类型要明确, 这一点非常重要, 因为样本量估计和数 据分析都需要依此进行。例如, 某些指标可以有定量、 定性( 如有效和无效 ) 、 等级 ( 如痊愈、 显效、 有效、 无 效) 、 生存时间等不同类型。 对应于指标的不同类型, 样本量估计方法亦不相同。 所以, 方案中对主要指标 的定义要具体到指标类型上。 3. 效应量 效应量是样本量估计所需的最重要参数之一 , 根 据不同的指标类型, 常见的效应量有: 均数的组间差值 HR ) 、 OR , 或标准化差值, 率的组间差值或比值( RR 、 或 相关系数、 回归系数等。 效应量参数的确定主要基于下述三种途径 : ( 1 ) 本项目的任何既往研究结果。即源于同一项 目的预试验、 探索性试验( I 期或 II 期临床试验) 、 单中 心试验的结果等作为确定参数的依据 。由于此类研究 结果属于内部证据, 因此是首选途径。 ( 2 ) 基于他人的研究结果。当本项目的先前研究 无法提供确切的参数数据, 或尚未开展研究时, 参数的 确定可以以公开发表的研究结果作为依据 。由于此类 研究结果属外部证据, 因此是次选途径。 若公开发表 最好是经 meta 分析所得合 的同类研究报道不止一个, 并效应量作为样本量估计的参数 。 ( 3 ) 基于本试验的预期结果。如果本试验没有任 何之前的研究结果可以借鉴 ( 无论是自己的还是他人 或以往的研究数据不能得到本试验设计所需的 的) , 参数( 如本试验采用交叉设计, 而以往研究数据均来 ) , 自两平行组设计的研究 可以用预期的形式进行预 设, 通常以广义效应量表达。 若对试验药物或器械有 充足信心, 则预期效应量较大( 如设为 0. 8 ) , 此时所需 样本量较小。若对试验药物或器械信心不足, 则预期 效应量较小 ( 如设为 0. 2 ) , 此时所需样本量较大。 若 对试验药物或器械的信心尚可, 则预期效应量为中等
【干货分享】CCTS:临床试验统计分析计划及统计分析报告
【干货分享】CCTS:临床试验统计分析计划及统计分析报告中国临床试验生物统计学组(CCTS)成员(按姓名拼音排序):陈峰、陈平雁、陈启光、贺佳、黄钦、金丕焕、李康、李宁、李卫、李晓松、凌莉、刘玉秀、苏炳华、孙高、王武保、王彤、魏朝晖、夏结来、姚晨、易东、尹平、于浩、张罗漫、赵耐青。
统计分析计划统计分析计划(statistical analysis plan,SAP)是对临床试验的统计学考虑及拟对数据进行统计分析的清晰描述。
统计分析计划可以是独立的文件,其内容涵盖试验中所涉及的所有统计学考虑,且具有技术性和可操作性,包括了设计的类型、比较的类型、随机化与盲法、主要指标和次要指标的定义与测量、检验假设、数据集的定义、疗效及安全性评价和统计分析的详细计划。
另外,临床试验方案中也包括统计分析计划或统计学考虑部分,其内容是独立的统计分析计划的主要部分。
统计分析报告统计分析报告(statistical analysis report,SAR)是依据统计分析计划,对试验数据进行统计分析后形成的报告,是临床试验结果的重要呈现手段’是撰写临床研究报告(clinical study report,CSR)的关键依据。
针对统计分析计划和统计分析报告所涉及的内涵,中国临床试验生物统计学工作小组(CCTS)经过充分讨论,形成如下共识。
一、意义为了有效地控制分析偏倚,保证试验结论的科学性,应在试验设计阶段计划最终的统计分析策略,数据锁定前应确定统计分析计划,数据锁定后按计划进行统计分析。
统计分析报告是提供给主要研究者撰写临床试验总结报告的关键文件,是科学、完整、准确、合理地撰写临床试验报告的依据。
本文主要针对药物临床试验的要求进行阐述,相关内容也可以作为医疗器械等临床试验的参考。
二、统计分析计划的制定时间试验方案中的统计分析计划应与试验方案同时完成,是统计分析的核心内容。
作为独立文件的统计分析计划初稿应形成于试验方案和病例报告表确定之后,是方案中的统计分析计划的扩展,在临床试验进行过程中以及数据盲态审核时,可以进行修改、补充和完善,不同时点的统计分析计划应标注版本,正式文件在数据锁定之前完成并予以确认。
临床试验生物统计的认识和实践2021推选
Pharmaceuticals for Human Use) 符合方案集(Per Protocol Set)
对生物统计工作人员的要求 杨树勤,郭祖超主编.中国医学百科全书,医学统计学分册.上海:上海科学技术出版社,1982,4
;以后每两年举行一次会议。
更多学者进出国门,回国报告了国外 临床试验的做法和有关的临床试验法 规,也推动了国内的临床试验的正规 化。在国家卫生部药品审评部门,国 家药监局,临床试验的研究医师,生 物统计学家和申办者一起的推动下, 初步确立了生物统计在临床试验中的 地位。
临床试验(Clinical Trial)的定义
临床试验是有人体受试者(包括病人或健 康志愿者)参加的一个有计划的医学研究 , 在这个研究中,研究者能够,而且必须 能够控制处理方法(或干预方法),研究 者还可能要求控制(或降低)导致研究结 果产生变异的因素,以排除评价研究结果 时产生的偏倚。所以临床试验是在研究者 可控的,合适安排条件下开展的一系列观 察研究。
药品(包括中药,化学药品,治疗用生物制品和预防 用生物制品)注册.是指国家食品药品监督管理局根 据药品注册申请人的申请,依照法定程序,对拟 上市销售药品的安全性、有效性、质量可控性等 进行审查,并决定是否同意其申请的审批过程。
用于药品注册目的必须完成的临床试验称为药物 注册临床试验.
国际上临床试验有关生物统计的要求
ICH发布的一系列文件,其中有: E3 : 临床试验报告的结构与内容
E3 Structure and Content of Clinical Study Reports E6 : 临床试验管理规范指南
统计学家学习过的算法语言,有ALGOL60, FORTRAN, BASIC, PASCAL等语言;学习各种统计软件包,有 SAS软件包,BMDP,SPSS,GLM和Splus等等软件包;学 习过的各种多元统计分析方法,有多元回归,逐步回归, Logistic回归,Cox回归,判别分析,逐步判别分析,聚 类分析,主成分分析,典型相关分析,蒙特卡罗方法, Boots trap方法等等。
非劣效研究是与非
➢REFLECT的NI =1.08,相当于保留索拉非尼合并效力的60%(Meta分析-原文)
➢SHARP研究:NI界值= δ + (1- δ)* HR(P/S)
若保留索拉60%效力,NI界值=1.06
➢AP HR研究 (东方人群)
若保留索拉60%效力,NI界值=1.03
第一步:查找索拉非尼与安慰剂比较的随机对照试验RCT 第二步确定M1:安慰剂与阳性药95%CI下限(索拉非尼最小功效) 第三步确定M2:下限值*(50%-60%)=索拉最小功效的50-60%
非劣效研究常见统计学问题解析 III期临床研究统计学解析 REFLECT研究引发思考
REFLECT研究:仑伐替尼非劣效于索拉非尼
在既往未接受全身治疗的不可切除HCC患者中开展的随机、开放、非劣效性研究:预设NI值为1.08。 REFLECT研究符合非劣效标准:仑伐中位OS13.6月,索拉12.3月(HR=0.92; 95%CI: 0.79-1.06<1.08)
• 提高患者生存质量 • 更少的药物毒性(更好的安全性) • 价格更便宜 • 更易管理,服药时间更方便,服药次数更少......
设计(PICOST)
✓P=大(非等量) ✓I=试验药物 ✓C=阳性药物 ✓O=PFS ✓S=III 非劣效/等效
统计(双95%置信区间法)
✓等效于阳性对照 ✓非劣效于阳性对照
主要研究终点: ➢ OS 次要研究终点: ➢ PFS* ➢ TTP* ➢ ORR* ➢ 生活质量 ➢ PK 仑伐替尼暴露参
数
*由研究者基于mRECIST进行肿瘤评
估
结果
总人群
仑伐替尼 (N=478)
索拉非尼 (N=476)
(PD)为Ⅱ/Ⅲ期试验制定合适的剂量和方案提供依据
非劣效性研究
非劣效性研究非劣效性研究(non-inferiority study)是一种药物临床试验设计,旨在证明待研究药物的疗效不次于一个已经获得批准的标准药物。
在药物研发领域,常常会有一些现有的治疗方法已经被证明有效并获得了批准。
而在开发新药时,为了确定待研究药物的疗效,在进行临床试验时可能不适合使用安慰剂对照(placebo control)的方式。
这时,研究者可以采用非劣效性研究设计,通过比较待研究药物与标准药物的疗效差异,来证明待研究药物不会比标准药物差。
非劣效性研究的目标是要证明待研究药物的疗效不低于标准药物的一个既定非劣效边界(non-inferiority margin)。
非劣效边界是一个事先确定的临床可接受的最大差异范围,超过该范围则认为待研究药物疗效较差。
研究者需要根据疾病的特点、临床需求和数据分析能力等因素来设定非劣效边界。
为了能够检验非劣效性,研究者需要来自两组患者的数据:一个接受待研究药物治疗的实验组(experimental group)和一个接受标准药物治疗的对照组(control group)。
两组患者应具有相似的特征,比如疾病严重程度、年龄、性别等等。
然后,研究者根据两组患者的治疗结果,使用适当的统计方法来比较两组之间的疗效差异。
对于非劣效性研究而言,一个重要的指标是非劣效性界(non-inferiority bound)。
非劣效性界是一个预先设定的边界,如果待研究药物与标准药物的疗效差异小于该边界,则认为待研究药物具有非劣效性。
待研究药物的疗效差异通常通过置信区间(confidence interval)来表示,如果待研究药物的疗效差异的下限超过了非劣效性界,则认为待研究药物具有非劣效性。
需要注意的是,非劣效性研究并不表示待研究药物与标准药物的疗效相等,只是证明待研究药物的疗效不低于标准药物。
此外,非劣效性研究设计也有一些限制和争议,比如样本量计算、非劣效边界的设定以及如何解释结果等方面。
非劣性_等效性试验的样本含量估计及统计推断_刘玉秀
虑, 经讨论认为用 = 0. 40kP a( 约为 的 1/ 3) 作为
非劣性试验的界值是合理的, 即如果 AII 的平均降
压最多比 ACEI 的平均 降压不超过 0. 40kP a, 则可
认为 AII 与 ACEI 相比为非劣效。当然, 若适当放
宽控制非劣效的标准时, 的取值可稍微大些, 例如
= 0. 67kPa( 约为 的 1/ 2) 。
200311非劣性等效性试验的样本含量估计及统计推断南京军区南京总医院信息科南京210002解放军总医院医学统计教研室北京100853南通医学院医学统计教研室南通226001东南大学医学院流行病学与生物统计系南京210009上海第二医科大学生物统计教研室上海200025摘要就近年应用逐渐增多的非劣性等效性试验中涉及的一些关键统计学问题进行详细介绍其中包括设计过程中的非劣性等效性界值的确定样本含量的估计方法和统计推断过程中的检验假设建立检验统计量计算以及可信区间计算方法
最大不应超过对照组样本率的 1/ 5。 不能过小, 否
则, 所需的样本含量可能会太大而不切实际。
例 1: 为了显示一种新药血 管紧张素 阻断剂
( AII ant agonist ) 治疗轻中度原发性高血压的降压效
果是否不低于标准药血管紧张素转换酶抑制剂( A
CEI) , 请按照非劣性试验的要求制定非劣界值 。
[ Key words] clinical trial; noninf eriorit y; equivalence; superiorit y; noninferiority / equivalence margin; sample size; hypothesis t est ing; confidence int erval
非劣效临床试验样本量计算
非劣效临床试验样本量计算非劣效临床试验(Non-inferiority clinical trial)是指在对比两种治疗方案时,试验者预先设定了一定的非劣效边界(non-inferiority margin),试验的目的是证明新的治疗方案与对照方案之间的差异小于这个非劣效边界,从而能够判断新的治疗方案的有效性。
样本量计算通常依赖于以下几个因素:1. 非劣效边界(non-inferiority margin):非劣效边界的设定应该根据临床经验和先前的研究结果来确定。
非劣效边界越小,要求的样本量越大。
因此,在样本量计算中非劣效边界的选择非常重要。
2. 预计的事件率(event rate):试验中需要估计两种治疗方案的事件发生率,即对照方案的事件发生率和新方案的事件发生率。
这可以根据先前的研究结果或者临床经验来估计。
3. 验证所需的统计功效(statistical power):试验者需要设定试验的统计功效,即试验能够检测到非劣效边界之内的差异的概率。
通常情况下,统计功效的设定为80%或90%。
4. 显著性水平(significance level):显著性水平是指试验中拒绝原假设的概率。
常用的显著性水平是0.05根据上述因素,样本量计算可以使用统计学方法,如Z检验、F检验或卡方检验。
在非劣效非劣效临床试验中,样本量计算通常使用Z检验。
样本量计算的公式可以如下表示:n=[(Z1-α/2+Z1-β)×(p1×(1-p1)+p2×(1-p2))]/(p2-p1)²其中n为总样本量,Z1-α/2为1-α/2分位数的Z值,Z1-β为1-β分位数的Z值,p1为对照方案的事件率,p2为新方案的事件率。
通过样本量计算,试验者可以得到所需的总样本量,从而招募足够的患者参与试验。
然而,样本量计算只是试验设计的一部分,还有其他的因素也需要考虑,如试验的可行性、临床实际情况等。
总之,非劣效临床试验样本量计算是一个重要的步骤,它可以帮助试验者确定所需的总样本量,从而保证试验结果的可靠性和准确性。
非劣效临床试验的统计学考虑
非劣效临床试验的统计学考虑
CCTS工作小组;夏结来
【期刊名称】《中国卫生统计》
【年(卷),期】2012(029)002
【摘要】为推动我国临床试验生物统计学的理论和方法研究,指导和规范临床试验中生物统计学的正确应用,进一步促进我国临床试验生物统计学的研究与国际接轨,中国卫生信息学会统计理论与方法专业委员会特成立了专题学术讨论工作小组———中国临床试验生物统计学组(China Clinical Trial Statistics Work-ing Group,简称CCTS)。
本刊从本期起连续刊登的临床试验统计学专家共识(CCTS专家共识)是CCTS成员当前对某问题形成的一致的学术见解,希望推动我国临床试验生物统计学的发展。
【总页数】5页(P270-274)
【作者】CCTS工作小组;夏结来
【作者单位】;第四军医大学卫生统计学教研室,710032
【正文语种】中文
【相关文献】
1.非参数模型在以等级资料为终点的非劣效性临床试验中的应用及SAS实现
2.临床试验研究统计学设计方法简述--优效性设计,等效性设计以及非劣效性设计
3.新型膝关节假体应用于人工膝关节置换的安全性和有效性:前瞻性、随机、阳性平行对照、非劣效性临床试验
4.新型膝关节假体应用于人工膝关节置换的安全性和有
效性:前瞻性、随机、阳性平行对照、非劣效性临床试验5.SIMPLIFY-1:莫洛替尼对比芦可替尼的非劣效性临床试验
因版权原因,仅展示原文概要,查看原文内容请购买。
临床试验中采用非劣效设计应该关注的问题
临床试验中采用非劣效设计应该关注的问题临床试验中采用非劣效设计应该关注的问题非劣效性设计在国内新药临床研究中被普遍应用,本文就非劣效性试验的适应条件、设计中需要关注的问题进行了阐述,提出非劣效性设计并不是能够普遍应用的临床试验设计方法的观点。
临床试验是探索和确证研究药物在特定适应症人群安全有效性的重要研究方法,根据其研究目的主要有两种类型的设计,一种为优效性设计,一种为非劣效性设计。
(编者按:应该还有一类:等效性设计)优效性设计的临床试验的目的是要评估研究药物的有效性和或安全性,采用任意一种对照,通过显示研究药物优于对照药(安慰剂或者说无治疗、研究药物的低剂量、阳性药)来证明研究药物的疗效。
非劣效性设计的临床试验目的是要评估两种治疗药物的相对疗效、安全性、效益/风险关系,采用阳性药作为对照,通过显示研究药物与已知的有效药物疗效(即阳性药)不低于一个事先确定的量(即界值)而证明其有效,阳性药的已知疗效即为研究药物的疗效。
一、非劣效试验的适应条件众所周知,优效性临床试验相对于非劣效临床试验而言,试验的设计、实施以及结果的分析都相对简单和易于操作,是新药疗效探索和确证性试验中最为普遍应用的设计。
然而在有些情况下,非劣效性设计可能是需要的。
第一种情况是,上市药物的疗效很好,新研究的药物的疗效要超过标准治疗药物的可能性较小,如新的抗生素类药物,其临床研究通常采用非劣效设计。
第二种情况,与上市药物比较,预计其疗效相当,但研究药物可能具有其他特点,如更好的安全性;或者除主要的治疗作用外,在其他作用方面给患者带来益处,如降低LDL-C的降脂药,同时能升高HDL,具有更为全面的调脂作用;更方便或者依从性更好;其他特点。
第三种情况是,出于伦理的考虑,对于危及生命的适应症人群,市场已经有确切的安全有效的药物或者治疗手段,安慰剂的对照试验不被接受,需要选择阳性药或者标准治疗手段来确证研究药物的疗效不劣于前者,同时研究药物又具备其他的给患者带来益处的特点。
临床试验中样本量确定的统计学考虑_陈平雁
· 727·
· 专家共识 ·
临床试验中样本量确定的统计学考虑
CCTze determination ) , 又称样本 量估计( sample size estimation ) , 是指为满足统计的准 确性和可靠性 ( I 类错误的控制和检验效能的保证 ) 计 算出所需的样本量, 它是临床试验设计中一个极为重 要的环节, 直接关系到研究结论的可靠性、 可重复性, 以及研究效率的高低。 样本量估计也是一个成本效 果和检验效能的权衡过程。 ICH E9 ( 1998 ) 指出, 临 床试验的样本量必须足够大, 以可靠地回答研究假设 ; 所提出的相关问题 同时又不至于太大而造成浪费。 样本量的估计方法应该在研究方案中详细阐述 , 包括 计算样本量所依据的参数, 如方差、 均数、 反应率、 阳性 事件发生率、 差值等。本文适用于确证性试验。 样本量估计需考虑的主要因素 在确定临床研究的目的之后, 首先考虑试验设计, 包括对照的选择 ( 如 标 准 对 照、 阳 性 对 照、 安慰剂对 照、 剂量对照等) 、 比较类型 ( 如优效性试验、 非劣效性 试验、 等效性试验 ) 、 设计类型 ( 如平行设计、 交叉设 计、 析因设计、 成组序贯设计等 ) 、 主要指标 ( 定量、 定 生存时间 ) 等; 其次考虑统计分析方法, 并提出效 性、 应量( effect size ) 的假定; 然后根据试验特点定义统计 特征, 如统计分布、 检验水准( significant level ) 、 检验效 能( power) 、 单双侧和分配比例等; 再应用正确的样本 试验中的 量估计方法计算出样本量; 最后根据协变量、 脱落率、 剔除率和依从性等具体情况进行适当调整 。 1. 研究目的与试验设计 ( 1 ) 研究目的 就临床试验而言, 在确证性研究中研究目的主要 体现在有效性评价和安全性评价两个方面 。样本量估 计常用于有效性评价。 ( 2 ) 比较类型及其检验假设 临床试验常用的比较类型有优效性试验 ( superiority trial) 、 等效性试验( 包括生物等效性试验) ( equivalence trial ) 、 inferiority trial ) 等。 非 劣 效 性 试 验 ( non下面以两组效应量为均数的正向指标比较为例 , 设定
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾殧
非劣效临床试验的统计学考虑
CCTS 工作小组
夏结来执笔Fra bibliotek测量方法、 受试人群的影响较大, 难以确定在本次 量、 试验样本中阳性对照是否仍然保持原有的效应 , 此类 药物的临床试验不宜采用非劣效设计。 在下列条件 下, 应不采用非劣效临床试验设计: 1 ) 药物疗效过小导致非劣效试验设计样本量超 出可行范围; 2 ) 药物疗效的研究间差异过大导致阳性对照药 不具备稳定的有效性; 3 ) 没有历史数据支持非劣效界值的确定 ; 4 ) 医疗实践的变化使得历史研究中观测到的阳 性对照药物疗效不再适用。 非劣效临床试验的目的 非劣效临床试验的目的是通过与阳性对照的比较 评价试验药物的有效性和安全性 。良好设计的非劣效 试验获得的临床研究数据可以推断出: ( 1 ) 拒绝试验 药物的疗效劣于阳性对照药物疗效的假设 , 即试验药 物的疗效非劣于阳性对照; 或 ( 2 ) 尚不能拒绝试验药 物的疗效劣于阳性对照药物的疗效 。 非劣效的结论有两层含义: 试验药的疗效优于安 慰剂( 间接推论试验药物的有效性 ) ; 试验药的疗效若 是比阳性对照药物的疗效差, 其差值也是在临床可接 。 受的范围内 多数成功的非劣效临床试验能够提供试验药物有 效性的证据, 但是能在非劣效试验中确证试验药物与 阳性对照药物疗效“相等 ” 或“相似 ” 却并不常见。 只 有在试验药物疗效的估计值优于阳性对照药物并且 C - T 的 95% CI 上限接近显示优效的情况下, 才能推断 试验药物与阳性对照药物疗效的相似性 。 非劣效临床试验的应用条件 采用阳性对照的非劣效临床试验要保证试验的检 定灵敏度( assay sensitivity) , 试验设计必须考虑以下三 个方面:
— —中国临床试验生物统计学组( China Clinical Trial Statistics Work委员会特成立了专题学术讨论工作小组 — ing Group, 简称 CCTS) 。本刊从本期起连续刊登的临床试验统计学专家共识 ( CCTS 专家共识) 是 CCTS 成员 当前对某问题形成的一致的学术见解 , 希望推动我国临床试验生物统计学的发展 。
表1
指标类型 高优指标 低优指标 检验水准
非劣效临床试验的检验假设
HR, OR) 比值( RR, H 0 : ln( C / T) ≥Δ, Δ >0 H 1 : ln( C / T) < Δ H 0 : ln( T / C ) ≥Δ, Δ >0 H 1 : ln( T / C ) < Δ α = 0. 025
Chinese Journal of Health Statistics, Apr 2012 , Vol. 29 , No. 2
· 271·
1. 阳性对照有效性的既有证据( historical evidence HESDE ) 阳性对照效应来 of sensitivity to drug effects, 源于文献报道的有良好试验设计的试验结果 , 这些历 史试验已明确显示本次非劣效试验中采用的阳性对照 及其类似的药物优于安慰剂, 且随时间迁移, 药效灵敏 度基本维持稳定。根据这些试验结果可以可靠地估计 出阳性对照的效应大小。阳性对照的效应大小是非劣 既不能用 效试验的关键设计参数( 确定非劣效界值 ) , 历史研究中最好的疗效作为其效应大小的估计 , 也不 能仅用 meta 分析的点估计作为效应大小的估计 , 效应 大小估计时要充分考虑历史研究间的变异 。 对于缓解症状和 / 或以主观疗效指标为主要评价 终点的药物, 难以得到阳性对照有效性的既有证据。 虽然阳性对照有缓解症状的效果, 即使是设计良好的 试验, 往往也难以重现该药物在缓解特定症状方面优 于安慰剂的结论。由于本次非劣效试验中难以确定阳 性药物是否有效, 基于此试验得出的非劣效结论就不 能确证试验药物的有效性。这是缓解症状的药物不能 采用非劣效试验的主要原因。 2. 阳性对照药物效应的稳定性( constancy assumption, CA) 阳性对照效应的估计来源于历史研究, 虽 然考虑了历史研究间的变异, 但仍有历史局限性, 受到
· 270·
中国卫生统计 2012 年 4 月第 29 卷第 2 期
·CCTS 专家共识·
檾檾檾檾檾檾檾檾殧 檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾殧 [ 编者按] 为推动我国临床试验生物统计学的理论和方法研究 , 指导和规范临床试验中生物统计学的 进一步促进我国临床试验生物统计学的研究与国际接轨 , 中国卫生信息学会统计理论与方法专业 正确应用, 檾檾檾檾檾檾檾檾殧
很多因素诸如当时的受试人群、 合并治疗方法、 疗效指 标的定义与判定、 阳性对照的剂量、 耐药性以及统计分 析方法等的影响。因此, 采用非劣效试验设计时要尽 可能地确保本次临床试验在以上提及的诸多因素方面 与历史研究一致。 然而与历史研究的可比性只有等到试验结束后才 能得到充分评价, 如果证实了本次试验与历史试验间 存有明显异质性, 则应在揭盲前对阳性对照效应的估 、 计值进行适当 保守的调整。如果随着年代的迁移, 所 治疗的疾病的定义、 诊断标准及其治疗方法已经发生 变化, 则不能采用非劣效试验设计。 另外, 疗效的一致性与效应大小的度量方法有关 。 以事件发生率为例, 率比 RR 或风险比 HR 较率差相 对稳定, 尤其是当发生率随年代的迁移降低时 , 最好用 率比或风险比来估计效应大小。 3 . 良好的试验质量 ( good quality study , GQS ) 试验质量是 非 劣 效 临 床 试 验 具 有 鉴 定 灵 敏 度 的 基 础 。 各种临床试验质量上 的 缺 陷 , 包括违背方案入 组、 依从 性 差 、 合 并 影 响 疗 效 评 价 的 药 物、 测量偏 差、 分组错误 、 受试者脱落率高等都有可能导致试 验组与对照组效应差异 的 减 小 。 在 优 效 性 试 验 中 , 这些试验质量上的缺陷不 利 于 优 效 性 结 论 的 成 立 , 但在非劣效试验中却有利 于 非 劣 效 结 论 的 成 立 , 并 , 且试验质量 越 差 越 易 于 得 出 错 误 的 非 劣 效 结 论 。 当然这种质量低劣的试验 是 不 具 有 检 定 灵 敏 度 的 。
差值( 率差, 均数差) H 0 : C - T≥Δ, Δ >0 H1 : C - T < Δ H 0 : T - C ≥Δ, Δ >0 H1 : T - C < Δ
2. 非劣效界值的确定 一般根据阳性 非劣效界值的确定是设计的关键, 对照药物与安慰剂相比较的效应的既有证据来确定 , 采用 M eta 分析给出其可信区间估计。 如果历史试验 可信区间的构建可采用固定效应模型 , 间同质性较好, 否则采用随机效应模型以考虑试验间的变异对阳性对 照效应估计的影响。一般构建双侧 95% CI。 对于高优指标, 构建 ( C - P ) 区间估计后, 取区间 记为 M ( 如此可以认 下限作为阳性对照的疗效估计, 为本次非劣效试验中的阳性对照的疗效有 97. 5 % 以 上的可能大于 M ) 。 在非劣效试验设计中, 可接受最大非劣效界值 M 1 的确定要考虑既有证据的稳定性。 如果存在差异, 需 要在确定 M 1 时根据差异进行调整。 若取 M 1 < M , 令 Δ = M1 , 如果拒绝 H 0 , 则可间接 推论出试验药疗效优于安慰剂, 即 C - T < ΔT - P > C - P - Δ 0 ( 对于率比或风险比, 相当于将率做对数 推论过程是一样的) 。 变换后做差值运算, 0 < f < 1, 若取 M 2 = ( 1 - f ) M 1 , 令 Δ = M2 , 如果拒 绝 H0 , 则可推论出试验药非劣效于阳性对照, 且至少 保持了阳性对照疗效 M 的 f 倍, 譬如取 f = 0. 5 , 则至少 50% , 保持了阳性对照疗效的 即 C - T < ΔT - P > C - P - ( 1 - f ) M 1 T - P f ( C - P) 对于低优指标, 构建 ( P - C ) 区间估计后, 仍取区 间下限作为阳性对照的疗效估计 , 记为 M 。 若取 M 1 < M , 令 Δ = M1 , 如果拒绝 H 0 , 则可间接
鉴于非劣效临床试验在国内开展地比较广泛 , 但 , 在研究设计和评价方面尚未形成相对统一的认识 为 此中国临床试验生物统计学工作小组 ( CCTS) , 经充分 讨论, 于 2011 年 10 月 30 日于南京汤山召开工作会 议, 形成如下共识。 非劣效临床试验的意义 检定或评价试验药物( T) 的有效性一般采用优效 性试验设计, 多采用安慰剂 ( P ) 对照、 空白对照、 剂量 组间对照或阳性药物对照( C ) , 其中, 安慰剂对照是最 直接和高效的对照方式。但在某些临床实践中直接采 用安慰剂对照存在伦理学风险, 如已有治疗某适应症 且可预知由于延误治疗可能导致受试者 的有效药物, 死亡、 病情进展、 残疾或不可逆的医学损伤发生, 则不 宜单纯采用安慰剂对照。剂量组间对照也存在类似的 但通过 问题。虽然采用阳性对照避免了伦理学风险, 临床试验评价试验药物优于公认的阳性对照往往有一 定困难。基于此, 临床试验中提出了采用阳性对照的 inferiority, NI) 试验设计, 非劣效( non此类设计中阳性 对照的选择, 非劣效界值的确定, 样本量的估计, 统计 推断方法等方面均涉及到统计学问题 。 非劣效临床试验的应用范围 非劣效临床试验设计要求阳性对照药物应具有较 稳定的有效性, 否则不能采用非劣效设计。 非劣效试 验一般用于有客观疗效指标的临床研究中 ( 如抗菌药 物的临床终点、 心血管治疗中的主要不良心血管事件 、 2 型糖尿病降糖治疗中 肿瘤治疗中死亡或进展事件、 的糖化血红蛋白等 ) 。 鉴于缓解症状和 / 或以主观疗 效指标为主要评价终点的临床试验 ( 如治疗抑郁、 过 、 、 ) 敏性鼻炎 咽炎 疼痛的 药 物 等 疗 效 评 价 受 试 验 质