非劣效性、等效性临床试验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
优效性试验(superiority)—显示优效性的设计通过安慰剂对照试验显示优于安慰剂或优于阳性药,或由剂量反应关系证实疗效是最可信的。此类试验称为优效性试验。
非劣效性(non-inferiority)—试验/等效性(equivalence)试验—显示非劣效性或等效性的设计,以阳性药物为对照,试验的目标是显示试验药物的疗效与某种已知的阳性药物“不差”或“相当”,分别称为非劣效性试验和等效性试验
稳定性假设(constancy assumption)—指阳性对照药物在既往研究(对安慰剂)中的效应量在当前的非劣效性或等效性试验保持不变。
检测灵敏度(assay sensitivity)—分辨某种治疗与较差的治疗或无效的治疗之间差别的能力,对优效性试验、非劣效性试验与等效性试验具有不同的意义。优效性试验如果是成功的,即试验显示出试验药与安慰剂之间的差别,则检验灵敏度自然成立;对非劣效性和等效性试验而言,如果阳性药没有检测灵敏度,一个无效的试验药可能会因为非劣效性而错误地确认其疗效。{无效药如何得出非劣效性}
一、非劣效性/等效性试验中的样本含量估计
(一)决定非劣效性/等效性试验样本含量估计的要素
1. 非劣效性(non-inferiority)/等效性(equivalence)界值从临床意义上确认药物的疗效,需要事先确认评价的界值。在优效性试
验中,界值指试验药和对照药之间相差的临床上认可的最小值。在非劣效性试验中指临床上可接受的最大值。对非劣效性和等效性试验,它必须小于阳性对照药与安慰剂比较时的效应差值(如果已知,可取去1/3或1/2)。界值的确定需要由主要研究者从临床意义上和统计学专业人员才统计学意义上共同商定,而不是单独依赖于主要研究者或统计学专业人员。优效性试验和非劣效性试验仅用一个界值,用δ
δ01和δ02 0表示;而等效性试验要用劣侧和优侧两个界值,分别用
表示,理论上两侧界值可以取不等距,但实际上有一般取等距。界值确定必须在实验设计阶段完成,并在试验方案中阐明,如有修订,必须在揭盲之前进行并阐述理由,一旦揭盲,不得修改。这一点很重要,若不遵守,则很容易陷入“数字游戏”的危险。
根据既往经验,对有些临床定量指标具有专业意义上的变化量,{血压实验组—血压对照组}可根据粗略的界值参考标准,例如血压可取为0.67kPa(5mmHg),胆固醇可取为0.52mmol/L(20mg/dl),白细胞可取为0.5x109/L(500个/mm3)。非劣效性/等效性试验经常是对变化量间的比较,相应的界值(指变化量之间的差值)应更小{血压变化值实验组—血压变化值对照值},例如血压变化值的等效界值可取为0.4kPa(3mmHg),胆固醇变化值的等效界值可取为0.26mmol/L(10mg/dl),白细胞变化值的等效界值可取为0.2x109/L (200个/mm3)。当难以确定时,可酌取1/5~1/2个标准差或参比组均数的1/10~1/5等。{变化值的标准差和变化值的标准误?还是指标的标准差、标准误?} 对两组率而言,建议取15%以下的值,通常最大不超过对照组样本率
的1/5。当然,界值也不能过小。
例12--1 为了显示一种新药血管紧张素Ⅱ拮抗剂(AⅡ)治疗轻中度原发性高血压的降压效果不差于标准药血管紧张素转换酶抑制剂(ACE),主要终点指标用仰卧舒张压()的下降幅度,{变化量} 应如何考虑制定非劣性界值的问题?
资料表明,,既往ACE与安慰剂的对照试验显示最小的药物效应差值Δ为1.34kPa(10mmHg),基于临床考虑,认为用δ0=0.40kPa(约为Δ的1/3)作为非劣效性试验的界值是合理的{有文献表明不可取},即只要AⅡ的平均降压不比ACE的平均降压值小0.40kPa或更多,则可认为AⅡ与ACE相比为非劣效。当然,若适当放宽控制非劣效的标准时,δ0的取值可稍微大些,例如δ0=0.670kpa(约为Δ的1/2)。
2.Ⅰ、Ⅱ型错误概率Ⅰ型错误概率用α表示,指事实为劣效/不等效时拒绝了劣效/不等效的概率;Ⅱ型错误概率用表示,指当事实为非劣效/等效是接受了劣效/不等效的概率。检验功效power=1—β。一般准则是,α取0.05或0.10,β取0.05、0.10或0.20。新药注册研究中,α取0.05或0.10,β取0.20或0.10可被认可。
3. 变异度反映两组总的变异程度,一般用方差(或标准差)表示。两组定量指标均数比较,其方差可通过两组样本方差估计,或用标准治疗组方差,或以既往研究结果作为估计值。两组率指标比较其方差可通过两组样本率估计,或根据既往知识取值;若难以获知事先信息。可用50%作为总体率,估算最大样本含量。
4. 终点指标类型及效应测量最常见的终点指标和二分类指
标。从非劣效性/等效性对比判定考虑,还需考虑效应指标差值或比值的选择问题,一般使用差值。对两组比较以δ表示两组总体参数或比值。在实际进行非劣效性/等效性设计时往往不能获知δ的大小,通常令δ=0 (两组为差值时)或δ=1(两组为比值时)。
5.比较类型设计非劣性试验是为了显示试验治疗按照一个事先制定的界值δ0不差于标准治疗,该类型试验关心的问题是单侧的,但对试验治疗可能优于的程度未加限制。而等效性试验关心的问题则是双侧的,希望阐明两种治疗的效应在两个方向上差别不大,即分别按照界值δ01和δ02揭示出试验治疗既不比标准治疗差,也不优于标准治疗。
从假设检验的角度考虑,双侧等效性不同于大家熟知的通常意义上的双侧检验情形(图12-2a)。后者涉及的无效假设是δ取单个数值δ0,备选假设取两个方向上的不同于δ0的任何值,因此其备选假设是“双侧”的。然而,在双侧等效性情况下(图12-2b),无效假设(δ≤δ01或δ≥δ02)是双侧的。这种比较类型的不同将体现在样本含量估计中。
6.两组的例数分配比例两组比较去相等的样本含量时总样本含量最少,且可在同等总样本含量下达到最高的统计效能,当然,实际工作中也可按需要进行两组不等的样本含量估算。试验中有时尚需结合具体情况进行适当调整,例如考虑最多的是依从性和失访问题。
(1)依从性(compliance)临床试验的困难之一就是患者不遵从指定的治疗。从保守的角度考虑,假定不依从的患者没有从治疗中