临床试验数据分析要点(GCP)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临床试验数据分析要点
5.3.1分析对象的数据集
5.3.1.1全样本分析(Fullanalysisset)
计划治疗原则(intention-to-treat)是指主要分析应当包括所有进入随机化的遵循这一原则需要对所有随机受试
者完成随访得到试验结果。由于各种理由,这在实际上是难以达到的,因此,全样本分析是尽可能接近于包括所有随
机受试者,在分析中保留最初的随机化对于防止偏差和提供安全的统计检验基础很重要。在许多场合,它提供的对治
疗效果的估算很可能反映了以后的实际观察结果。
从分析中剔除已随机受试者的情况不多:包括不符合重要入选标准,一次也没有用药,随机化后没有任何数据。
从分析中剔除不符合入选条件受试者必须不致引起偏差:入选标准的测定是在随机化之后;违反合格标准的检测是完
全客观的;所有受试者都受到同样的合格性调查;各组实行同样的入选标准,凡违反者均被排除。
5.3.1.2遵循研究设计对象(PerProtocolSet)
"PerProtocol"对象组,有时称之为"有效病例"、"有效样本"或"可评价受试者样本;定义为全部分析样本中较好
遵循设计书的一个受试者亚组:
·完成预先说明的确定治疗方案暴露。
·得到主要变量的测定数据。
·没有违反包括入选标准在内的重要试验设计。
从"有效受试者"组中剔除受试者的精确理由应当在揭盲前就充分限定并有文件记载。
为得到"有效受试者"而排除对象的原因和其他一些违反研究设计的问题,包括对象分配错误、试验中使用了试
验方案规定不能用的药物、依从性差、出组和数据缺失等,应当在不同治疗组之间对其类型、发生频率和发生时间进
行评价。
5.3.1.3不同的分析(受试者)组的作用
在验证性试验中,通常进行全样本和"有效受试者"两种分析。这样可以对两者之间的任何差别进行明白的讨论和
解释。有时候可能需要计划进一步探究结论对于选择分析受试者组的敏感程度。两种分析得到基本一致的结论时,治
疗结果的可信度增加。但是要记住,需要?quot;有效受试者"中排除相当数量受试者会对试验的总有效性留下疑点。
在优越性(Superioritytrial,证明新药比标准对照药物优越)试验、等效性试验或不差于(non-inferioritytrial,确证新产品与对照药物相当)试验中,这两种分析有不同的作用。在优越性试验中,全样本分析用于主要的分析可以
避免"有效受试者"分析对疗效的过于乐观的估算;全样本分析所包括的不依从受试者一般会缩小所估算的治疗作用。
但是,在等效性或不差于试验中使用全样本分析通常是不谨慎的,对其意义应当非常仔细考虑。
5.3.2缺失值和线外值(包括异常值)
缺失值代表临床试验中一个潜在的偏差来源。因此,在实施临床试验时应当尽最大努力符合试验方案对于数据收
集和数据管理的要求。对于缺失值并没有通用的处理办法,但只要处理方法合理,特别是如果处理缺失值方法在试验
方案中预先写明,则不会影响试验的有效性。当缺失值数目较大时,要考虑分析结果对于处理缺失值方法的敏感程度。
线外值(包括异常值)的统计学定义在某种程度上带有随意性。除了统计学判断之外加上医学判断以鉴别一个线外值
(包括异常值)是最可信的方法。同样,处理线外值(包括异常值)的程序应当在方案中列出,且不可事先就有利于
某一个治疗组。
5.3.3数据的类型、显著性检验和可信限
在临床试验中,对每个受试者可收集3种数据:所接受的治疗、对治疗的反应(Re-sponse)和进入试验时影响
预后因子的基线值。接受同样治疗的受试者构成统计分疗组。对治疗的反应基本上有3类。
①定性反应。根据预定的评价标准将受试者分为若干类别,如高血压治疗的"有效"。"无效";淋巴细胞瘤化疗
的"完全缓解"、"部分缓解"、"无变化"。
②定量反应。当存在一种可靠测定方法时,受试者的治疗结果最好采用实际数值,如舒张压。但最好同时记录
其基线值,以便评价治疗前后的变化量值。
③到某事件发生的时间。如使用避孕药受试者从开始治疗到意外妊娠的时间。
5.3.3.1数据的描述性统计
专业资料整理
专业资料整理 在开始分析之前,有必要先看一下各组受试者的每个变量观察值的分布频度,以对变量有一个感性了解;从最大
值和最小值也可以发现可能的错误和超范围的值;决定某些变量是否需要作某种转换某种特定分布作统计分 析。
①定性数据需要记录各治疗组的受试者总数和在每个反应类别的受试者数,然后转化为比率或百分率或直方图、 圆图等表示。采用c2检验、Fisher 精确检验比较所观察到的组间率的差异的程度。 ②定量数据计算每个治疗组的平均反应(均数、几何均数)和变化程度(标准差)。以均值、标准差、直方图、 累积频数分布图表示。在受试者数较小时,可以用图表显示每个受试者反应。组间比较采用t 检验、F 检验等。 当样本值频数图呈偏态分布时,用均值描述定量反应不合适,可采用中位数、四分位数来描述数据的定量水平。组间 比较可采用非参数方法。 5.3.3.2显著性检验 显著性检验的真正含义是应用概率理论计算如果两个治疗实际上同样有到所观测到的治疗差异的概率。其 目的是评价一个治疗真正优于另一个治疗的证据有多强。这种证据的强度用概率,即P 值来定量。因此P 值越小, 治疗差异由于偶然发生的可能性越小。在实践中,人们常用P <0.05.P <0.01、P <0.001表示显著性检验的结 果,这些水平的选择是完全随意的,并没有数学或临床的理由。 在解释显著性检验时要注意以下几点:一个小的P 值如P <0.05并不是一种治疗优越的绝对证明,每20个真 正阴性试验会出现一个假阳性结果;P >0.05也并不证明两治疗同样有效,差异可能实际上存在,只是现有数据不 足以证明它存在。统计显著性并不等同于临床重要性,一个10万人的试验中,1%的反应率差异在5%水平是显著的, 但在一个20人的试验中40%的差异在统计上也是不显著的。因此,临床的意义必须用差异的大小,即可信限来评价。 双侧检验和单侧检验:假设治疗差异可以发生在任时,为双侧检验。双侧检验的零假设为μa=μb ;备择 假设为μa1μ。b 如果在试验之前就确定治疗A 不可能差于治疗B ,为单侧检验。其零假设为μa=μb ;备择假设为μa ≥μ。b 此时显著性检验评价A 好于B 或A 相当于B 的证据。若结果是A 比B 差,便归于机遇,因为A 不可能差于B 。结果 是单侧检验的P 值为双侧检验。也就是说单侧检验比双侧绝零假设。采用单侧检的
依据。如果试验设计中决定用单侧检验,在结果表示时要注件计算的都是双侧检验的P 值。 5.3.3.3可信限的估算 显著性检验只告诉我们一个治疗比另一个好的证据的强度,并没有告诉我们好多少。因此,显著性检验并不是分 析的终结,还应运用统计估算方法,如可信限估算治疗改善的量。计算可信限时应分析变量的统计分布;标 准误和可信限的计算方写明。记住必须提供治疗效应大小的统计估算、显著性水平和可信区间。100(1-α)% 可信区间,正态分布估算值可表示为{估算值+N α/2×SE},估算值+(N1-α/2×S )E};差值如呈t 分布时,可表示为 {x1-x2-(t1-α/2×SEd )if ,fx1-x2+(t1-α/2×S i f E f d )}等。 5.3.4对象的基线水平的组间比较 对治疗组的疗效评价只有当各组受试者的基线特征具有可比是有效的。通常,随机化可以提供充分的可比 性。但是,随机化并不能绝对保证可比性。有时候组间的基线水平可能会有差异。这种差异对治疗比较的影响应当采 用其他程序消除。 5.3.5调节显著性和可信限水平 许多情况都可能产生多重性:例如多个终点/主要变量(如血压记录卧位或坐位的收缩压和舒张压;心肌梗死预 防试验中的各种原因死亡率和心肌梗死发病率),治疗的多重及不同时间点的多次测定和中期分析等。存在多重性分析数据时可能有必要对五类行控制和调节。首先,最好能避免或减少多重性的产生,如从多个主要变量中鉴 别出关键的主要变量(如血压记录取卧位舒张压为主要则采用一个综合标"曲积"。多重比较的常用统计方法有Bonferroni 方法、Holm 法和Hochberg 方法。 Bonferroni 方法是一个保守的方法,对于成对比较,它调节P 值以控制总的I 类误差率。Hochberg 方法比另两种方 法更有效,它只需控制最大的P 值小于显著性水平。多个终点的α调节用Bonferroni 方法和Hochberg 方法。 5.3.6亚组、相互作用和协变量 除了治疗以外,主要变量常与其他影响系统相关。主要变量可能与协变量如年龄和性别有关;或在受试者亚组之 间可能存在差异,如多中心试验中