CCTS非劣效临床试验的统计学考虑-中国卫生统计,2012,29(2):270-274

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

鉴于非劣效临床试验在国内开展地比较广泛 , 但 , 在研究设计和评价方面尚未形成相对统一的认识 为 此中国临床试验生物统计学工作小组 ( CCTS) , 经充分 讨论, 于 2011 年 10 月 30 日于南京汤山召开工作会 议, 形成如下共识。 非劣效临床试验的意义 检定或评价试验药物( T) 的有效性一般采用优效 性试验设计, 多采用安慰剂 ( P ) 对照、 空白对照、 剂量 组间对照或阳性药物对照( C ) , 其中, 安慰剂对照是最 直接和高效的对照方式。但在某些临床实践中直接采 用安慰剂对照存在伦理学风险, 如已有治疗某适应症 且可预知由于延误治疗可能导致受试者 的有效药物, 死亡、 病情进展、 残疾或不可逆的医学损伤发生, 则不 宜单纯采用安慰剂对照。剂量组间对照也存在类似的 但通过 问题。虽然采用阳性对照避免了伦理学风险, 临床试验评价试验药物优于公认的阳性对照往往有一 定困难。基于此, 临床试验中提出了采用阳性对照的 inferiority, NI) 试验设计, 非劣效( non此类设计中阳性 对照的选择, 非劣效界值的确定, 样本量的估计, 统计 推断方法等方面均涉及到统计学问题 。 非劣效临床试验的应用范围 非劣效临床试验设计要求阳性对照药物应具有较 稳定的有效性, 否则不能采用非劣效设计。 非劣效试 验一般用于有客观疗效指标的临床研究中 ( 如抗菌药 物的临床终点、 心血管治疗中的主要不良心血管事件 、 2 型糖尿病降糖治疗中 肿瘤治疗中死亡或进展事件、 的糖化血红蛋白等 ) 。 鉴于缓解症状和 / 或以主观疗 效指标为主要评价终点的临床试验 ( 如治疗抑郁、 过 、 、 ) 敏性鼻炎 咽炎 疼痛的 药 物 等 疗 效 评 价 受 试 验 质
很多因素诸如当时的受试人群、 合并治疗方法、 疗效指 标的定义与判定、 阳性对照的剂量、 耐药性以及统计分 析方法等的影响。因此, 采用非劣效试验设计时要尽 可能地确保本次临床试验在以上提及的诸多因素方面 与历史研究一致。 然而与历史研究的可比性只有等到试验结束后才 能得到充分评价, 如果证实了本次试验与历史试验间 存有明显异质性, 则应在揭盲前对阳性对照效应的估 、 计值进行适当 保守的调整。如果随着年代的迁移, 所 治疗的疾病的定义、 诊断标准及其治疗方法已经发生 变化, 则不能采用非劣效试验设计。 另外, 疗效的一致性与效应大小的度量方法有关 。 以事件发生率为例, 率比 RR 或风险比 HR 较率差相 对稳定, 尤其是当发生率随年代的迁移降低时 , 最好用 率比或风险比来估计效应大小。 3 . 良好的试验质量 ( good quality study , GQS ) 试验质量是 非 劣 效 临 床 试 验 具 有 鉴 定 灵 敏 度 的 基 础 。 各种临床试验质量上 的 缺 陷 , 包括违背方案入 组、 依从 性 差 、 合 并 影 响 疗 效 评 价 的 药 物、 测量偏 差、 分组错误 、 受试者脱落率高等都有可能导致试 验组与对照组效应差异 的 减 小 。 在 优 效 性 试 验 中 , 这些试验质量上的缺陷不 利 于 优 效 性 结 论 的 成 立 , 但在非劣效试验中却有利 于 非 劣 效 结 论 的 成 立 , 并 , 且试验质量 越 差 越 易 于 得 出 错 误 的 非 劣 效 结 论 。 当然这种质量低劣的试验 是 不 具 有 检 定 灵 敏 度 的 。
差值( 率差, 均数差) H 0 : C - T≥Δ, Δ >0 H1 : C - T < Δ H 0 : T - C ≥Δ, Δ >0 H1 : T - C < Δ
2. 非劣效界值的确定 一般根据阳性 非劣效界值的确定是设计的关键, 对照药物与安慰剂相比较的效应的既有证据来确定 , 采用 M eta 分析给出其可信区间估计。 如果历史试验 可信区间的构建可采用固定效应模型 , 间同质性较好, 否则采用随机效应模型以考虑试验间的变异对阳性对 照效应估计的影响。一般构建双侧 95% CI。 对于高优指标, 构建 ( C - P ) 区间估计后, 取区间 记为 M ( 如此可以认 下限作为阳性对照的疗效估计, 为本次非劣效试验中的阳性对照的疗效有 97. 5 % 以 上的可能大于 M ) 。 在非劣效试验设计中, 可接受最大非劣效界值 M 1 的确定要考虑既有证据的稳定性。 如果存在差异, 需 要在确定 M 1 时根据差异进行调整。 若取 M 1 < M , 令 Δ = M1 , 如果拒绝 H 0 , 则可间接 推论出试验药疗效优于安慰剂, 即 C - T < ΔT - P > C - P - Δ 0 ( 对于率比或风险比, 相当于将率做对数 推论过程是一样的) 。 变换后做差值运算, 0 < f < 1, 若取 M 2 = ( 1 - f ) M 1 , 令 Δ = M2 , 如果拒 绝 H0 , 则可推论出试验药非劣效于阳性对照, 且至少 保持了阳性对照疗效 M 的 f 倍, 譬如取 f = 0. 5 , 则至少 50% , 保持了阳性对照疗效的 即 C - T < ΔT - P > C - P - ( 1 - f ) M 1 T - P f ( C - P) 对于低优指标, 构建 ( P - C ) 区间估计后, 仍取区 间下限作为阳性对照的疗效估计 , 记为 M 。 若取 M 1 < M , 令 Δ = M1 , 如果拒绝 H 0 , 则可间接
同样 , 在优效性试验 中 被 公 认 为 保 守 的 ITT 原 则 在 尤其是当脱落 非劣效试验中则不一定仍 是 保 守 的 , 率较高且采用的 疗 效 填 补 方 法 不 当 ( 如 LOCF ) 时 。 因此 , 在试验设计和实施阶 段 都 应 该 提 高 试 验 质 量 只有高质量的临床试 验 才 能 保 证 非 劣 效 临 床 要求 , 试验的检定灵敏度 , 否则可 能 陷 入 证 明 谎 言 是 真 理 的陷阱 。 非劣效界值的确定 1. 非劣效临床试验的检验假设 为便于表述, 称数值越大表明疗效越好的指标为 高优指标, 称数值越小表明疗效越好的指标为低优指 。 , 标 例如 有效率是高优指标, 死亡率是低优指标。记 非劣效界值 Δ > 0 。
表1
指标类型 高优指标 低优指标 检验水准
Βιβλιοθήκη Baidu
非劣效临床试验的检验假设
HR, OR) 比值( RR, H 0 : ln( C / T) ≥Δ, Δ >0 H 1 : ln( C / T) < Δ H 0 : ln( T / C ) ≥Δ, Δ >0 H 1 : ln( T / C ) < Δ α = 0. 025
Chinese Journal of Health Statistics, Apr 2012 , Vol. 29 , No. 2
· 271·
1. 阳性对照有效性的既有证据( historical evidence HESDE ) 阳性对照效应来 of sensitivity to drug effects, 源于文献报道的有良好试验设计的试验结果 , 这些历 史试验已明确显示本次非劣效试验中采用的阳性对照 及其类似的药物优于安慰剂, 且随时间迁移, 药效灵敏 度基本维持稳定。根据这些试验结果可以可靠地估计 出阳性对照的效应大小。阳性对照的效应大小是非劣 既不能用 效试验的关键设计参数( 确定非劣效界值 ) , 历史研究中最好的疗效作为其效应大小的估计 , 也不 能仅用 meta 分析的点估计作为效应大小的估计 , 效应 大小估计时要充分考虑历史研究间的变异 。 对于缓解症状和 / 或以主观疗效指标为主要评价 终点的药物, 难以得到阳性对照有效性的既有证据。 虽然阳性对照有缓解症状的效果, 即使是设计良好的 试验, 往往也难以重现该药物在缓解特定症状方面优 于安慰剂的结论。由于本次非劣效试验中难以确定阳 性药物是否有效, 基于此试验得出的非劣效结论就不 能确证试验药物的有效性。这是缓解症状的药物不能 采用非劣效试验的主要原因。 2. 阳性对照药物效应的稳定性( constancy assumption, CA) 阳性对照效应的估计来源于历史研究, 虽 然考虑了历史研究间的变异, 但仍有历史局限性, 受到
1. 夏结来: 第四军医大学卫生统计学教研室 ( 710032 ) , Email: xiajielai @ fmmu. edu. cn
檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾殧
非劣效临床试验的统计学考虑
CCTS 工作小组
夏结来
执笔
测量方法、 受试人群的影响较大, 难以确定在本次 量、 试验样本中阳性对照是否仍然保持原有的效应 , 此类 药物的临床试验不宜采用非劣效设计。 在下列条件 下, 应不采用非劣效临床试验设计: 1 ) 药物疗效过小导致非劣效试验设计样本量超 出可行范围; 2 ) 药物疗效的研究间差异过大导致阳性对照药 不具备稳定的有效性; 3 ) 没有历史数据支持非劣效界值的确定 ; 4 ) 医疗实践的变化使得历史研究中观测到的阳 性对照药物疗效不再适用。 非劣效临床试验的目的 非劣效临床试验的目的是通过与阳性对照的比较 评价试验药物的有效性和安全性 。良好设计的非劣效 试验获得的临床研究数据可以推断出: ( 1 ) 拒绝试验 药物的疗效劣于阳性对照药物疗效的假设 , 即试验药 物的疗效非劣于阳性对照; 或 ( 2 ) 尚不能拒绝试验药 物的疗效劣于阳性对照药物的疗效 。 非劣效的结论有两层含义: 试验药的疗效优于安 慰剂( 间接推论试验药物的有效性 ) ; 试验药的疗效若 是比阳性对照药物的疗效差, 其差值也是在临床可接 。 受的范围内 多数成功的非劣效临床试验能够提供试验药物有 效性的证据, 但是能在非劣效试验中确证试验药物与 阳性对照药物疗效“相等 ” 或“相似 ” 却并不常见。 只 有在试验药物疗效的估计值优于阳性对照药物并且 C - T 的 95% CI 上限接近显示优效的情况下, 才能推断 试验药物与阳性对照药物疗效的相似性 。 非劣效临床试验的应用条件 采用阳性对照的非劣效临床试验要保证试验的检 定灵敏度( assay sensitivity) , 试验设计必须考虑以下三 个方面:
· 270·
中国卫生统计 2012 年 4 月第 29 卷第 2 期
·CCTS 专家共识·
檾檾檾檾檾檾檾檾殧 檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾檾殧 [ 编者按] 为推动我国临床试验生物统计学的理论和方法研究 , 指导和规范临床试验中生物统计学的 进一步促进我国临床试验生物统计学的研究与国际接轨 , 中国卫生信息学会统计理论与方法专业 正确应用, 檾檾檾檾檾檾檾檾殧
· 272·
中国卫生统计 2012 年 4 月第 29 卷第 2 期
推论出试验药疗效优于安慰剂, 即 T - C < ΔP - T > P - C - Δ0 0 < f < 1, 若取 M 2 = ( 1 - f ) M 1 , 令 Δ = M2 , 如果拒 绝 H0 , 则可推论出试验药非劣效于阳性对照, 且至少 譬如取 f = 0. 5 , 则至少 保持了阳性对照疗效 M 的 f 倍, 保持了阳性对照疗效的 50% , 即 T - C < ΔP - T > P - C - ( 1 - f ) M 1 P - T f ( P - C) 以上非劣效界值确定方法称作两步法, 有 M2 < M 1 ≤M 。如果历史试验数据较少, 例如仅有一个可借 鉴的历史试验, 或历史试验设计有缺陷、 质量较差, 取 M 1 << M ( 即疗效折扣 discounting ) 以确保试验的鉴定 灵敏度。M 1 是阳性对照扣去了安慰剂效应的相对疗 效的保守估计, 一般借助 meta 分析法并考虑历史试验 M 2 是非劣效界值, 间的变异后确定, 其确定要结合临 床具体情况, 在考虑保留阳性对照疗效的适当比例 f 后确定。f 愈接近 1 , 样本量越大。临床试验中一般取 0. 5 ≤f≤0. 8 , 例如在心血管病药物的非劣效试验中常 取 f = 0. 5 。在抗菌药物临床试验中, 由于阳性对照药 的疗效公认且较高, 非劣效设计时, 以率作为主要指标 时直接取 M 2 = 10% ~ 15% 。 例如, 根据历史试验数据经 meta 分析后, 阳性对 95% CI 为 ( 23% , 照较 安 慰 剂 的 有 效 率 增 加 30% , 42% ) , 酌取 M 1 = 22 % < 23 % , 取 f = 0. 5 , 得 M2 = M1 ( 1 - 0. 5 ) = 11 % 。若 P < 0. 025 , 则拒绝 H 0 , 认为试验 药物的有效率非劣效于阳性对照, 且保留了阳性对照 有效率的 50% 以上。 又如, 阳性对照较安慰剂的死亡风险减少 25% ( 低优指标) , 或说安慰剂 / 阳性对照 = P / C = 1 /0. 75 = 1. 33 , 根据临床专家意见酌取 M 1 = 1. 25 < 1. 33 , 取f= 0. 5 , 则 M 2 = exp ( ( 1 - f ) ln ( M 1 ) ) = exp ( 1 ln ( M 1 ) ) 2
— —中国临床试验生物统计学组( China Clinical Trial Statistics Work委员会特成立了专题学术讨论工作小组 — ing Group, 简称 CCTS) 。本刊从本期起连续刊登的临床试验统计学专家共识 ( CCTS 专家共识) 是 CCTS 成员 当前对某问题形成的一致的学术见解 , 希望推动我国临床试验生物统计学的发展 。
相关文档
最新文档