临床试验样本量共30页文档
临床试验样本量的估算[精品文档]
临床试验样本量的估算样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。
因此样本量估计有些时候不是想做就能做的。
SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。
但是中国的国情?有多少厂家愿意多做?建议方案里这么写:从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。
或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。
假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。
非劣性试验(α=0.05,β=0.2)时:计数资料:平均有效率(P)等效标准(δ)N=公式:N=12.365×P(1-P)/δ2计量资料:共同标准差(S)等效标准(δ)N=公式:N=12.365× (S/δ)2等效性试验(α=0.05,β=0.2)时:计数资料:平均有效率(P)等效标准(δ)N=公式:N=17.127×P(1-P)/δ2计量资料:共同标准差(S)等效标准(δ)N=公式:N=17.127× (S/δ)2上述公式的说明:1) 该公式源于郑青山教授发表的文献。
2) N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数;3) P 是平均有效率,4) S 是估计的共同标准差,5) δ 是等效标准。
临床试验样本量的估算精编版
临床试验样本量的估算精编版临床试验样本量的估算是为了确保试验结果具有统计学意义和准确性而进行的,它直接关系到试验结果的可靠性和推广的可行性。
样本量的估算一般包括研究目的、研究设计、效应值、暴露率、有效α and β 水平以及研究变量等因素的考虑。
首先,研究目的是估算样本量的基础。
不同的研究目的需要不同的样本量。
例如,如果研究目的是描述性研究,那么样本量的估算就应该考虑到对总体特征参数的精确度要求,并按照这个要求选择样本量。
而如果研究目的是比较性研究,则需要估算出有效比较的样本量。
其次,研究设计也是影响样本量估算的重要因素。
常见的研究设计包括前瞻性队列研究、回顾性队列研究、前瞻性对照研究、回顾性对照研究等。
不同的研究设计需要不同的样本量估算方法。
一般而言,前瞻性研究需要相对较少的样本量,而回顾性研究需要相对较多的样本量。
此外,效应值也是影响样本量估算的重要因素。
效应值是指待研究变量之间的差异或相关关系的大小。
一般来说,如果关注的效应值较大,需要的样本量较小,反之则需要较大的样本量。
暴露率和有效α and β 水平也是样本量估算的重要考虑因素。
暴露率是指研究中具有待研究变量的人群的占比,它直接关系到样本量的多少。
一般而言,暴露率越高,需要的样本量越少。
有效α and β 水平是指接受两种处理的个体之间差异的显著性水平和检测到这种差异的能力,通常被设置为0.05和0.20,它们也会影响样本量的估算。
最后,研究变量的数量和类型也需要考虑。
当研究的变量较多时,往往需要更大的样本量来保证统计分析的有效性和可靠性。
总结起来,样本量的估算需要考虑研究目的、研究设计、效应值、暴露率、有效α和β水平以及研究变量等因素。
根据这些因素,可以选择合适的样本量估算方法,并计算出适当的样本量,以保证试验结果的准确性和可靠性。
临床试验的样本量计算与优化
临床试验的样本量计算与优化临床试验作为一种规范化的科研手段,已被广泛应用于医疗领域。
试验的成功与否往往决定了一种治疗方法是否有效,因此临床试验的设计需要考虑多种因素,其中样本量计算是至关重要的一环。
本文将从样本量的定义、计算方法、常见错误以及如何优化样本量等方面进行探讨。
一、什么是样本量?样本量指的是在一次临床试验中所需要的参与人数,也就是实验的受试者数。
样本量大小的决定关系到试验的可信度和可重复性。
如果样本量太小,那么得出的结论可能不够准确,无法反映出总体的情况;而如果样本量太大,则会造成资源的浪费和时间的延长,降低试验的效率。
二、样本量计算的方法在进行样本量计算之前,需要了解以下几个基本概念:1、显著性水平(α)指的是拒绝原假设的概率。
在临床试验中通常将显著性水平设为0.05或0.01,表示要能够接受拒绝原假设的概率不高于5%或1%。
2、检验功效(1-β)指的是接受备择假设的概率,也就是判断实验结果和总体真实效应差异不小于设定的最小差异的能力。
在临床试验中通常将检验功效设为0.80-0.90。
3、标准差(σ)指的是样本的变异程度。
在实验设计过程中,需要尽量降低标准差的影响,以提高试验的效率和可靠性。
4、效应量(δ)指的是介入治疗与对照组的效应差异。
通常将效应量设为临床上具有意义的最小效应量(即最小临床显著差异),比如在肿瘤治疗中,将效应量定义为治疗后病情进展的延缓程度、生存期延长等。
了解了以上概念后,我们就可以通过以下公式计算样本量:n = (Z1-α/2 + Z1-β)^2 × σ^2 / δ^2其中,n表示样本量,Z1-α/2和Z1-β分别是正态分布分位数,可以通过查表获得。
σ和δ分别是标准差和效应量,这两个参数需要根据实验设计的具体情况确定。
三、常见错误及优化策略在实践中,样本量计算常常存在一些误区或者不足之处,下面就是一些常见的问题及对应的优化策略:1、忽视标准差的影响标准差是样本量计算中极其重要的一个因素,它越小,样本量就需要越大;反之亦然。
临床试验中的样本量计算与统计分析
临床试验中的样本量计算与统计分析在临床试验中,样本量计算和统计分析是至关重要的步骤。
正确的样本量计算和合理的统计分析可以提高试验结果的可靠性和准确性,有助于作出科学的结论和决策。
本文将介绍临床试验中样本量计算和统计分析的方法与原则。
一、样本量计算在进行临床试验之前,研究者需要首先确定所需的样本量。
样本量的大小直接影响到试验结果的可靠性和统计分析的准确性。
合理的样本量计算可以提高试验的统计功效,避免对实验性干预或治疗效果的误判。
样本量计算需要考虑以下几个因素:1. 效应大小:试验中所关心的效应大小,即干预措施对结果的影响程度。
效应越大,所需的样本量越小。
2. 显著水平:研究者设置的判断差异是否显著的临界值,通常取α=0.05。
显著水平越高,所需的样本量越大。
3. 统计功效:即在试验中观察到预期效应的可能性。
通常设置为1-β=0.8,表示有80%的概率发现真实效应。
统计功效越高,所需的样本量越大。
4. 效应的变异性:试验个体之间效应的异质性程度。
效应的变异性越大,所需的样本量越大。
二、统计分析完成临床试验后,研究者需要进行统计分析,对试验结果进行解释和推断。
合理的统计分析可以准确评估干预措施的效果,并进行科学性的结论和推广。
常用的统计分析方法包括:1. 描述性统计分析:对试验样本的基本特征进行汇总和描述,例如均值、标准差、频数等。
2. 探索性数据分析:通过图表和分布等方式探索样本数据,寻找数据的规律和趋势。
3. 参数估计和假设检验:通过点估计和区间估计对总体参数进行估计,并利用假设检验对实验组和对照组之间差异的显著性进行判断。
4. 方差分析:用于比较三个或三个以上组别间的差异。
5. 相关分析:评估两个或多个变量之间的相关程度。
6. 生存分析:对生存时间或事件数据进行分析,评估干预措施对生存时间的影响。
根据试验设计和问题的需要,研究者可以选择合适的统计分析方法。
在进行统计分析时,需要注意以下几个方面:1. 数据的可靠性和完整性:尽可能提高数据的质量和完整性,减少因缺失数据而引起的偏差。
-临床试验样本量的估算
临床试验样本量的估算样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小(计数资料的率差、计量资料的均数差值),方差(计量资料)或合并的率(计数资料各组的合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差。
因此样本量估计有些时候不是想做就能做的。
SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显著来。
但是中国的国情?有多少厂家愿意多做?建议方案里这么写:从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。
或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为65.0%和42.9%,则每个治疗组中能接受评价的病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组。
假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例。
非劣性试验(α=0.05,β=0.2)时:计数资料:平均有效率(P)等效标准(δ)N=公式:N=12.365×P(1-P)/δ2计量资料:共同标准差(S)等效标准(δ)N=公式:N=12.365× (S/δ)2等效性试验(α=0.05,β=0.2)时:计数资料:平均有效率(P)等效标准(δ)N=公式:N=17.127×P(1-P)/δ2计量资料:共同标准差(S)等效标准(δ)N=公式:N=17.127× (S/δ)2上述公式的说明:1)该公式源于郑青山教授发表的文献。
2)N是每组的估算例数N1=N2,N1和N2分别为试验药和参比药的例数;3)P是平均有效率,4)S是估计的共同标准差,5)δ是等效标准。
临床试验常用样本量的计算方法
临床试验常用样本量的计算方法
临床试验的样本量计算主要涉及到以下几个方法:
1. 根据研究目标和假设:根据试验的目标、研究假设、预计的效应大小和统计显著水平,使用统计方法计算所需的样本量。
常用的统计方法有t检验、卡方检验、方差分析等。
2. 根据统计效应和统计效力:根据已有的研究结果或假设,估计所需的统计效应大小和统计效力(通常选择80%或90%),然后使用相应的统计方法计算样本量。
3. 根据追踪率或失访率:考虑随访率和失访率对样本量的影响。
通常会根据研究经验或类似研究的结果,估计追踪率和失访率,并据此调整样本量。
4. 根据样本量估计的误差:根据研究目标和统计学原理,估计所能接受的误差范围,然后使用统计方法计算所需的样本量。
需要注意的是,样本量计算是一项复杂的工作,需要考虑多个因素,并可能涉及到统计学知识和软件工具的应用。
在实际应用中,可能还需要考虑研究可行性、资源限制和伦理要求等因素。
因此,建议在进行样本量计算时寻求专业统计学家或研究方法学专家的帮助。
样本含量的计算讲课文档
设计的类型
• 观察性研究 • 实验性研究
• 配对设计
• 随机化设计
第6页,共58页。
按试验类型
• 估计总体
• 样本与总体比较
• 配对资料 • 两样本比较
• 多样本比较
7
第7页,共58页。
主要变量的性质
• 分类变量 • 数值变量
• 一般情况下,分类变量所需要的样本量多于数值变量
第8页,共58页。
N
z2 p 1 2
p
• P为总体率,δ为允许误差,即允许样本率和总体率的最大
容许误差为多少。
第25页,共58页。
• 例5:某口腔医院研究青少年龋齿发病情况,拟了解某市 青少年龋齿患病情况,期望误差在平均患龋齿率30%的 1/6范围内,当α=0.05,问需要抽样调查多少人?
• z0.05=1.96 • P=0.3 • Δ=0.3/6=0.05
(Pc Pe)2
为1p-β水平相应
的标准正态差
试验组发生率
N:为计算所得一个组的样本大小
第31页,共58页。
2.3 观察性研究样本量
• 横截面调查的样本量考虑 • 定量资料的样本量计算 • 定性资料的样本量计算
z n
2
2
2
n
z2p
1
p
2
第32页,共58页。
病例对照样本量计算
n z
2
• 结果:16次试验(100次)中未能显示出统计学差异
84次试验显示有统计学差异 1次试验成功率为84%-power
第15页,共58页。
16
计算机模拟举例2 • 假设: • -试验组死亡率为20% • -对照组死亡率为50% • -试验组和对照组的样本量均为n=100 • -显著性水平为双侧0.05 • -检验方法=卡方检验
《临床试验样本量》课件
2 控制中心方差
针对不同中心单独进行样 本量计算,以控制中心方 差对结果的影响。
3 考虑中心间相关性
考虑中心间的相关性来进 行样本量计算,提高数据 的统类型Ⅰ错误
减少错误地拒绝了测试双方相等的假设的可能性。
控制类型Ⅱ错误
减少接受了测试双方不相等的假设的可能性。
常见的样本量计算软件
临床试验中的随机化
随机化原则
既可以确保样本的代表性,又可 以降低潜在的混杂偏倚。
分层随机化
在设定特定因素为分层因素的基 础上进行随机,增加随机后各组 之间的可比性。
随机序列生成
对随机化序列进行加密和控制, 保证分组不被感知。
多中心临床试验的样本量计算
1 合理分配样本
按照各中心的实际情况进 行样本量的分配,以避免 样本浪费或不足。
通过现有资料或专家经验来估计控制和干预组之间的效应量。
3
选择统计功效
确定所需统计功效和显著性水平。
4
使用统计方法
根据试验设计和目标选择适当的统计方法进行样本量计算。
样本量计算的方法
参数统计法
基于某些分布假设进行样本量计算,例如t检验、方 差分析、卡方检验等。
非参数统计法
不需要对总体分布进行假设的方法,例如非参数特 征检验、匹配分析等。
样本量计算的实践问题探讨
样本量的设定往往存在不确定性和变异性,而实验过程中还可能出现一系列 不可控因素,因此需要结合实际情况,进行不断优化和改进。
样本量计算的未来发展趋势
随着生物技术、医疗技术等领域的快速发展,未来的样本量计算可能会更加关注大数据、精准医疗、多中心试 验等新领域,探索更多适应不同场景和疾病类型的样本量计算方法。
交叉设计
临床试验样本量的估算
临床试验样本量(d e)估算样本量(de)估计涉及诸多参数(de)确定,最难得到(de)就是预期(de)或者已知(de)效应大小(计数资料(de)率差、计量资料(de)均数差值),方差(计量资料)或合并(de)率(计数资料各组(de)合并率),一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差.因此样本量估计有些时候不是想做就能做(de).SFDA(de)规定主要是从安全性(de)角度出发,保证能发现多少(de)不良反应率;统计(de)计算主要是从power出发,保证有多少把握能做出显着来.但是中国(de)国情有多少厂家愿意多做建议方案里这么写:从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例.或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组(de)有效率分别为%和%,则每个治疗组中能接受评价(de)病人样本数必须达到114例(总共228例),这样才能在单侧显着性水平为5%、检验功效为90%(de)情况下证明试验组疗效优于对照组.假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人(de)总样本例数为250例.非劣性试验(α=,β=)时:计数资料:平均有效率(P)等效标准(δ)N=公式:N=×P(1-P)/δ2计量资料:共同标准差(S)等效标准(δ)N=公式:N=× (S/δ)2等效性试验(α=,β=)时:计数资料:平均有效率(P)等效标准(δ)N=公式:N=×P(1-P)/δ2计量资料:共同标准差(S)等效标准(δ)N=公式:N=× (S/δ)2上述公式(de)说明:1) 该公式源于郑青山教授发表(de)文献.2) N 是每组(de)估算例数N1=N2,N1 和N2 分别为试验药和参比药(de)例数;3) P 是平均有效率,4) S 是估计(de)共同标准差,5) δ 是等效标准.6) 通常都规定α=,β=(把握度80%)上述计算(de)例数若少于国家规定(de)例数,按规定为准;多于国家规定(de)则以计算值为准.具体规定(de)最小样本量如下:II期,试验组100例;III期,试验组300例;随机对照临床验证(如3类化药)试验组100例.IV期,2000例.疫苗和避孕药与上述要求不同.例1:某新药拟进行II 期临床试验,与阳性药按1:1 (de)比例安排例数,考察新药临床治愈率不差于阳性药.根据以往(de)疗效和统计学(de)一般要求,取α=,β=,等效标准δ=,平均有效率P=,每组需要多少病例由公式计算得,N=×/=88(例)以上88 例低于我国最低例数(100 例)(de)规定,故新药至少取100 例进行试验.如上例作等效性分析,则得,N=×/=122(例).例2:某利尿新药拟进行II 期临床试验,与阳性药按1:1 (de)比例安排例数,考察24h 新药利尿量不差于阳性药.根据以往(de)疗效和统计学(de)一般要求,取α=,β=,等效标准δ=60 ml,已知两组共同标准差S=180 ml,每组需要多少病例由公式得,N=× (180/60)2=111 例.故本次试验新药和阳性药(de)例数均不少于111 例.如上例作等效性分析,则得,N=×(180/60)2=154(例). [s:11]临床试验研究中,无论是实验组还是对照组都需要有一定数量(de)受试对象.这是因为同一种实验处理在不同(de)受试对象身上表现出(de)实验效应是存在着变异(de).仅凭一次实验观测结果或单个受试者所表现出来(de)实验效应说明不了什么问题.必须通过一定数量(de)重复观测才能把研究总体真实(de)客观规律性显示出来,并且可以对抽样误差做出客观地估计.一般说来重复观测次数越多,抽样误差越小,观测结果(de)可信度越高.一定数量(de)重复还可起到部分抵消混杂因素影响(de)作用,增强组间(de)可比性.但重复观测次数越多(即样本含量越大)试验所要消耗(de)人力、物力、财力和时间越多,可能会使试验研究成为不可能.而且,样本含量过大还会增加控制试验观测条件(de)难度,有可能引入非随机误差,给观测结果带来偏性(bias).所以在实验设计中落实重复原则(de)一个重要问题就是如何科学合理确定样本含量.由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量相等来估计.但在个别情况下,也可能要求各组样本含量按一定比例来估计.1 与样本含量估计有关(de)几个统计学参数在估计样本含量之前,首先要对以下几个统计学参数加以确定或作出估计.规定有专业意义(de)差值δ,即所比较(de)两总体参数值相差多大以上才有专业意义.δ是根据试验目(de)人为规定(de),但必须有一定专业依据.习惯上把δ称为分辨力或区分度.δ值越小表示对二个总体参数差别(de)区分度越强,因而所需样本含量也越大.确定作统计推断时允许犯Ⅰ类错误(“弃真”(de)错误)(de)概率α,即当对比(de)双方总体参数值没有差到δ.但根据抽样观测结果错误地得出二者有差别(de)推断结论(de)可能性,α确定(de)越小,所需样本含量越大.在确定α时还要注意明确是单侧检验(de)α,还是双侧检验(de)α.在同样大小(de)α条件下;双侧检验要比单侧检验需要更大(de)样本含量.提出所期望(de)检验效能power,用1-β表示.β为允许犯Ⅱ类错误(“取伪”(de)错误)(de)概率.检验效能就是推断结论不犯Ⅱ类错误(de)概率1-β称把握度.即当对比双方总体参数值间差值确实达到δ以上时,根据抽样观测结果在规定(de)α水准上能正确地作出有差别(de)推断结论(de)可能性.在科研设计中常把1-β定为或.一般来说1-β不宜低于,否则可能出现非真实(de)阴性推断结论.给出总体标准差σ或总体率π(de)估计值.它们分别反映计量数据和计数数据(de)变异程度.一般是根据前人经验或文献报道作出估计.如果没有前人经验或文献报道作为依据,可通过预实验取得样本(de)标准差s或样本率P分别作为σ和π(de)估计值.σ(de)估计值越大,π(de)估计值越接近,所需样本含量越大.在对以上统计学参数作出规定或估计(de)前提下,就可以根据不同(de)推断内容选用相应(de)公式计算出所需样本含量.由于在同样(de)要求和条件下完全随机设计(成组设计)所需样本含量最大,故一般都要按完全随机设计作出样本含量(de)估计.2 常用(de)估计样本含量(de)方法两样本均数比较时样本含量估计方法(1)两样本例数要求相等时可按下列公式估算每组需观察(de)例数n.n=2[(α+β)σ/δ]^2 (公式1)式中δ为要求(de)区分度,σ为总体标准差或其估计值s,α、β分别是对应于α和β(de)u值,可由t界值表,自由度υ=∞-行查出来,α有单侧、双侧之分,β只取单侧值.例1,某医师研究一种降低高血脂患者胆固醇药物(de)临床疗效,以安慰剂作对照.事前规定试验组与对照组相比,平均多降低 mmol/L以上,才有推广应用价值.而且由有关文献中查到高血脂患者胆固醇值(de)标准差为 mmol/L,若要求犯Ⅰ类错误(de)(de)概率不超过5%,犯Ⅱ类错误(de)概率不超过10%,且要两组例数相等则每组各需观察多少例本例δ= mmol/L,σ= mmol/L,α=,β=,1-β=,查t界值表自由度为∞一行得单侧=,=,代入公式(1)n=2[+×]^2=44故要达到上述要求,两组至少各需观察44例.(2)两样本例数要求呈一定比例(n2/n1=c)时,可按下列公式求出n1,再按比例求出n2=cn1.n1=[(α+β)σ/δ]^2(1+C)/C (公式2)例2 对例1资料如一切要求都维持不变,但要求试验组与对照组(de)例数呈2∶1比例(即C=2),问两组各需观察多少例n1=[+×]^2×(1+2)/2 =33(例)(对照组所需例数)n2=2×33=66(例)(试验组所需例数.)两组共需观察99例多于两组例数相等时达到同样要求时两组所需观察(de)总例数2×44=88.配对设计计量资料样本含量(对子数)估计方法配对设计包括异体配对、自身配对、自身前后配对及交叉设计(de)自身对照,均可按下列公式进行样本含量估计.n=[(α+β)σd/δ]^2 (公式3)式中δ、α、β(de)含义同前,σd为每对差值(de)总体标准差或其估计值sd.例3 某医院采用自身前后配对设计方案研究某治疗矽肺药物能否有效地增加矽肺患者(de)尿矽排出量.事前规定服药后尿矽排出量平均增加 mmol/L以上方能认为有效,根据预试验得到矽肺患者服药后尿矽排出量增加值(de)标准差 sd=mmol/L,现在要求推断时犯Ⅰ类错误(de)概率控制在以下(单侧),犯Ⅱ类错误(de)概率控制在以下,问需观察多少例矽肺病人本例δ= mmol/L, sd= mmol/L,α=,β=.1-β=,单侧=,=,代入公式(3)得到.n=[+×89/]^2=54(例)故可认为如该药确实能达到平均增加尿矽排出量在 mmol/L以上,则只需观察54例病人就能有90%(de)把握,按照α=(de)检验水准得出该药有增加矽肺病人尿矽作用(de)正确结论.样本均数与总体均数比较时样本含量估计方法可按下式估算所需样本含量n.n=[(α+β)σ/δ]^2 (公式4)例4已知血吸虫病人血红蛋白平均含量为90g/L,标准差为25g/L,现欲观察呋喃丙胺治疗后能否使血红蛋白增加,事先规定血红蛋白增加10g/L以上才能认为有效,推断结论犯Ⅰ类错误(de)概率α(双侧)不得超过,犯Ⅱ类错误(de)概率β不得超过,问需观察多少例病人本例δ=10g/L,σ=25g/L,=(双侧),=代入公式(4)得:n=[+×25/10]^2=66(例)故如果呋喃丙胺确实能使血吸虫病人血红蛋白平均含量增加10g/L以上,则只需观察66例就可以有90%(de)把握在α=检验水准上得出有增加血吸虫病人血红蛋白平均含量(de)结论.。
ep标准 临床样本量
ep标准临床样本量伦理审查(EP)是确保临床试验过程中受试者权益得到保障的重要环节。
在临床试验中,伦理委员会对研究方案进行审查,以确保研究符合道德和法律要求。
EP标准在临床试验中具有重要地位,临床样本量则是评估试验效果的关键指标。
本文将探讨EP标准在临床试验中的应用,以及临床样本量对试验结果的影响。
一、EP标准在临床试验中的应用1.保护受试者权益伦理审查的核心目的是保护受试者的权益。
在临床试验中,研究者在开展研究前需向伦理委员会提交研究方案,包括试验目的、受试者招募标准、风险与获益评估等。
伦理委员会对研究方案进行审查,确保研究遵循道德原则,降低受试者风险。
2.确保试验质量伦理审查还关注临床试验的质量和真实性问题。
伦理委员会对研究设计、数据收集与分析等方面进行评估,确保试验结果具有可靠性和准确性。
此外,伦理委员会还关注研究过程中的数据安全和隐私保护问题。
3.合规性审查伦理委员会还需审查研究是否符合相关法律法规和政策要求。
这包括国家有关部门发布的临床试验管理法规、国际公认的伦理原则(如赫尔辛基宣言)等。
合规性审查有助于确保临床试验的合法性,降低研究风险。
二、临床样本量对试验结果的影响1.样本量与统计学意义临床样本量是衡量临床试验规模的重要指标。
足够的样本量有助于提高统计学检验的准确性,降低假阴性或假阳性的风险。
在试验设计阶段,研究者需根据研究目的、检验效能和容许误差等因素,确定合适的样本量。
2.试验结果的可靠性临床样本量对试验结果的可靠性具有重要影响。
较大的样本量有助于减少随机误差,提高试验结果的稳定性。
此外,足够的样本量还有助于发现亚组差异,为后续的精准医学研究提供依据。
3.伦理考量在临床试验中,临床样本量的选择需兼顾伦理考量。
过大的样本量可能增加受试者的负担,甚至可能导致道德风险。
因此,在确定临床样本量时,伦理委员会需综合考虑研究目的、受试者权益和研究风险等因素。
总结EP标准在临床试验中具有重要意义,临床样本量对试验结果具有显著影响。
临床试验方案样本与范本
XXXXXXXXXXXXXXX临床试验方案试验器械:XXXXXXXXXXXXXXX试验目的:XXXXXXXXXXXXXXX临床疗效及安全性评价试验类别:临床验证产品标准:检验报告:申办单位:XXXXXXX科技发展有限公司研究单位:XXXXXXX普通外科试验负责人:主要研究者:试验日期:2006年6月~2006年12月联系人:联系电话:一、临床试验的背景:对于外伤开放性伤口,一般XXXXXX的促愈,都是通过一些物质与体液接触发生反应,但切口一般在第三天,可能会有体液渗出,特别有些伤口基本闭合,但持续有无菌性炎症,XXXXXXXXXXX,此时只好采用一些物理治疗手段。
本类产品对闭合性软组织损伤的治疗已使用多年,效果确定。
本类产品是XXXXXXXXXXXXXXX,贴在损伤部位,对局部达到消炎止痛的效果。
二、产品的机理、特点与试验范围:1、机理:XXXXXXXXXXXXXXX2、特点:本产品是纯物理治疗,无化学反应;另外,它的电流强度很小,几乎感觉不到,对肌体无任何刺激。
3、试验范围:本次试验范围是针对颈部和腹部手术后的切口。
三、产品的适应症或功能:本产品的适用范围是针对手术切口,有抑制炎症反应,促进愈合,并有一定的镇痛效果。
四、临床试验的目的:目的:评价XXXXXXXXXXXXXXX对手术切口的临床疗效和安全性。
五、总体设计及项目内容:本临床试验采用随机、开放、空白对照试验设计。
将手术后病人随机分成试验与对照两组,分别采用XXXXXXXXXXXXXXX和XXXXXXXXX,评价XXXXXXXXXXXXXXX的临床疗效和安全性。
1、随机分组:本试验采用分段均衡随机法,产生随机数码表,随机分配病人进入试验组或对照组。
随机数码表见附件1。
2、对照:本试验采用空白对照,即普通敷料对照组。
3、手术切口的选择:由于身体各部位血供和手术切口部位等多种因素可能会影响伤口愈合程度和时间,因此,在进行本临床试验时,因颈部和腹部手术切口的大小,深度等方面差异较小,因此选择颈部和腹部手术切口。
临床试验样本量的估算
临床试验样本量的估算样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小计数资料的率差、计量资料的均数差值,方差计量资料或合并的率计数资料各组的合并率,一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差;因此样本量估计有些时候不是想做就能做的;SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显着来;但是中国的国情有多少厂家愿意多做建议方案里这么写:从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例;或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为%和%,则每个治疗组中能接受评价的病人样本数必须达到114例总共228例,这样才能在单侧显着性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组;假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例;非劣性试验α=,β=时:计数资料:平均有效率P 等效标准δN=公式:N=×P1-P/δ2计量资料:共同标准差S 等效标准δN=公式:N=× S/δ2等效性试验α=,β=时:计数资料:平均有效率P 等效标准δN=公式:N=×P1-P/δ2计量资料:共同标准差S 等效标准δN=公式:N=× S/δ2上述公式的说明:1 该公式源于郑青山教授发表的文献;2 N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数;3 P 是平均有效率,4 S 是估计的共同标准差,5 δ 是等效标准;6 通常都规定α=,β=把握度80%上述计算的例数若少于国家规定的例数,按规定为准;多于国家规定的则以计算值为准;具体规定的最小样本量如下:II期,试验组100例;III期,试验组300例;随机对照临床验证如3类化药试验组100例;IV期,2000例;疫苗和避孕药与上述要求不同;例1:某新药拟进行II 期临床试验,与阳性药按1:1 的比例安排例数,考察新药临床治愈率不差于阳性药;根据以往的疗效和统计学的一般要求,取α=,β=,等效标准δ=,平均有效率P=,每组需要多少病例由公式计算得,N=×/=88例以上88 例低于我国最低例数100 例的规定,故新药至少取100 例进行试验;如上例作等效性分析,则得,N=×/=122例;例2:某利尿新药拟进行II 期临床试验,与阳性药按1:1 的比例安排例数,考察24h 新药利尿量不差于阳性药;根据以往的疗效和统计学的一般要求,取α=,β=,等效标准δ=60 ml,已知两组共同标准差S=180 ml,每组需要多少病例由公式得,N=× 180/602=111 例;故本次试验新药和阳性药的例数均不少于111 例;如上例作等效性分析,则得,N=×180/602=154例; s:11临床试验研究中,无论是实验组还是对照组都需要有一定数量的受试对象;这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的;仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题;必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来,并且可以对抽样误差做出客观地估计;一般说来重复观测次数越多,抽样误差越小,观测结果的可信度越高;一定数量的重复还可起到部分抵消混杂因素影响的作用,增强组间的可比性;但重复观测次数越多即样本含量越大试验所要消耗的人力、物力、财力和时间越多,可能会使试验研究成为不可能;而且,样本含量过大还会增加控制试验观测条件的难度,有可能引入非随机误差,给观测结果带来偏性bias;所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本含量;由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量相等来估计;但在个别情况下,也可能要求各组样本含量按一定比例来估计;1 与样本含量估计有关的几个统计学参数在估计样本含量之前,首先要对以下几个统计学参数加以确定或作出估计;规定有专业意义的差值δ,即所比较的两总体参数值相差多大以上才有专业意义;δ是根据试验目的人为规定的,但必须有一定专业依据;习惯上把δ称为分辨力或区分度;δ值越小表示对二个总体参数差别的区分度越强,因而所需样本含量也越大;确定作统计推断时允许犯Ⅰ类错误“弃真”的错误的概率α,即当对比的双方总体参数值没有差到δ;但根据抽样观测结果错误地得出二者有差别的推断结论的可能性,α确定的越小,所需样本含量越大;在确定α时还要注意明确是单侧检验的α,还是双侧检验的α;在同样大小的α条件下;双侧检验要比单侧检验需要更大的样本含量;提出所期望的检验效能power,用1-β表示;β为允许犯Ⅱ类错误“取伪”的错误的概率;检验效能就是推断结论不犯Ⅱ类错误的概率1-β称把握度;即当对比双方总体参数值间差值确实达到δ以上时,根据抽样观测结果在规定的α水准上能正确地作出有差别的推断结论的可能性;在科研设计中常把1-β定为或;一般来说1-β不宜低于,否则可能出现非真实的阴性推断结论;给出总体标准差σ或总体率π的估计值;它们分别反映计量数据和计数数据的变异程度;一般是根据前人经验或文献报道作出估计;如果没有前人经验或文献报道作为依据,可通过预实验取得样本的标准差s或样本率P 分别作为σ和π的估计值;σ的估计值越大,π的估计值越接近,所需样本含量越大;在对以上统计学参数作出规定或估计的前提下,就可以根据不同的推断内容选用相应的公式计算出所需样本含量;由于在同样的要求和条件下完全随机设计成组设计所需样本含量最大,故一般都要按完全随机设计作出样本含量的估计;2 常用的估计样本含量的方法两样本均数比较时样本含量估计方法1两样本例数要求相等时可按下列公式估算每组需观察的例数n;n=2α+βσ/δ^2 公式1式中δ为要求的区分度,σ为总体标准差或其估计值s,α、β分别是对应于α和β的u值,可由t界值表,自由度υ=∞-行查出来,α有单侧、双侧之分,β只取单侧值;例1,某医师研究一种降低高血脂患者胆固醇药物的临床疗效,以安慰剂作对照;事前规定试验组与对照组相比,平均多降低 mmol/L以上,才有推广应用价值;而且由有关文献中查到高血脂患者胆固醇值的标准差为 mmol/L,若要求犯Ⅰ类错误的的概率不超过5%,犯Ⅱ类错误的概率不超过10%,且要两组例数相等则每组各需观察多少例本例δ= mmol/L,σ= mmol/L,α=,β=,1-β=,查t界值表自由度为∞一行得单侧=,=,代入公式1n=2+×^2=44故要达到上述要求,两组至少各需观察44例;2两样本例数要求呈一定比例n2/n1=c时,可按下列公式求出n1,再按比例求出n2=cn1;n1=α+βσ/δ^21+C/C 公式2例2 对例1资料如一切要求都维持不变,但要求试验组与对照组的例数呈2∶1比例即C=2,问两组各需观察多少例n1=+×^2×1+2/2 =33例对照组所需例数n2=2×33=66例试验组所需例数;两组共需观察99例多于两组例数相等时达到同样要求时两组所需观察的总例数2×44=88;配对设计计量资料样本含量对子数估计方法配对设计包括异体配对、自身配对、自身前后配对及交叉设计的自身对照,均可按下列公式进行样本含量估计;n=α+βσd/δ^2 公式3式中δ、α、β的含义同前,σd为每对差值的总体标准差或其估计值sd;例 3 某医院采用自身前后配对设计方案研究某治疗矽肺药物能否有效地增加矽肺患者的尿矽排出量;事前规定服药后尿矽排出量平均增加mmol/L以上方能认为有效,根据预试验得到矽肺患者服药后尿矽排出量增加值的标准差 sd= mmol/L,现在要求推断时犯Ⅰ类错误的概率控制在以下单侧,犯Ⅱ类错误的概率控制在以下,问需观察多少例矽肺病人本例δ= mmol/L, sd= mmol/L,α=,β=;1-β=,单侧=,=,代入公式3得到;n=+×89/^2=54例故可认为如该药确实能达到平均增加尿矽排出量在 mmol/L以上,则只需观察54例病人就能有90%的把握,按照α=的检验水准得出该药有增加矽肺病人尿矽作用的正确结论;样本均数与总体均数比较时样本含量估计方法可按下式估算所需样本含量n;n=α+βσ/δ^2 公式4例4已知血吸虫病人血红蛋白平均含量为90g/L,标准差为25g/L,现欲观察呋喃丙胺治疗后能否使血红蛋白增加,事先规定血红蛋白增加10g/L以上才能认为有效,推断结论犯Ⅰ类错误的概率α双侧不得超过,犯Ⅱ类错误的概率β不得超过,问需观察多少例病人本例δ=10g/L,σ=25g/L,=双侧,=代入公式4得:n=+×25/10^2=66例故如果呋喃丙胺确实能使血吸虫病人血红蛋白平均含量增加10g/L以上,则只需观察66例就可以有90%的把握在α=检验水准上得出有增加血吸虫病人血红蛋白平均含量的结论;。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
非劣性检验概念举例
例如:对照药在人群的有效率为2 对于试验药而言,较高的期望试验药的人群有效
率1高于对照药的有效率2,如果试验药的有效 率低于对照药,但略微低一些,如:试验药的人 群有效率与对照药有效率相差小于5%还是可以被 临床能接受的,则:将上述观点用非劣性假设检 验表示:
16
非劣性设计的背景简述
一般情况: 设:对照药的有效率-C药的有效率=δ>0 H0:试验药的有效率对照药的有效率- δ H1:试验药的有效率>对照药的有效率- δ 如果P<,则拒绝H0,认为H1成立。 H1:试验药的有效率>对照药的有效率- δ =对照药的有效率-(对照药的有效率-C药的有效率) = C药的有效率。即:试验药的有效率大于C药。
5
优效设计的样本量估计举例
例:为了雷替曲赛治疗局部晚期或转移复发 性结直肠癌患者的有效性,试验组:雷替曲 赛+奥沙利铂,对照组:亚叶酸钙+5-氟脲嘧 啶+奥沙利铂。从相关文献表明:试验组的有 效率(CR+PR)为29%,对照组的有效率为 18%,估计样本量时,取=0.05,分别取 Power=0.80,0.85,0.90,由于文献的结果有 一定的抽样误差,考虑试验组和对照组的有 效率波动2%,计算上述各种组合的样本量。
从另一个角度考虑:只有两个药的总体有效 率差异超出一定的范围,两个药的优劣性 在临床实践中才有意义,并称为容许误差, 由此产生了非劣性检验的问题。
9
非劣性检验简介
非劣性统计的检验假设:
H 0 :1 2 H 1 :1 2
H0的意义为对照药的总体有效率2高于试验药的总 体(有>效0)率。1,并且差异超出临床可以接受范围意义
7
样本量估计举例
不同参数取值的样本量估计
试验组方案 对照组方案
Power
有效率
有效率
0.75 0.80 0.85 0.90
27%
16%
191 216 246 288
27%
18%
296 335 382 448
27%
20%
506 573 655 766
29%
16%
140 159 181 212
29%
18%
17
非劣性检验样本量估计实践
背景简述
在临床试验中,采用随机分组,把受试对 象分为试验组和对照组,评价试验药和对
照药的疗效,评价指标为有效和无效,其 观察结果可以简单归结如下形式:
组别
有效
无效
合计
试验组
a
b
n1
对照组
c
d
n2
1
差异性检验
对于差异性检验:(试验药有效率1,对照药有效率2)
H0:1 2 H1:1 2
0.05
检验统计量 U
203 230 263 308
29%
20%
314 355 406 475
31%
16%
108 122 139 163
31%
18%
149 168 193 225
31%
20%
215 243 278 325
8
非劣性设计的背景简述
在上述的差异性检验中,存在一个问题:当 样本量足够大时,即使两个总体有效率相差 很小,也有较大可能出现拒绝H0,但如此小 的差异可能没有临床意义。
非劣性检验P<0.025等价于对应于1-2的95%可信 区间的下限满足下列不等式:
P 1P 21.96
P 1(1P 1)P 2(1P 2)
n1
n2
13
非劣性检验的样本量估计
两组样本量相同的情况下
n(ZZ)2(P (1 (1 P )12 )P2(1P2))
并且可以用P1-P2进行估计,要求 0
6
优效设计的样本量估计举例
先计算=0.05,power=0.9,试验组方案的有效 率为P1=29%,对照组方案的有效率为P2=18%, 则每组样本量为
n(Z0.05/2Z0.9)2(P1P1(1P2)P 21)P2(1P2)
(1.961.282)2(0.29(10.29)0.18(10.18))308 (0.290.18)2
其中 可以取 P1 P2 或差异更小的值 ,可以理
解为 最小的分辨能力,亦称为difference,检验效 能Power=1-,为第一类错误的概率。
4
优效设计的样本量估计
样本量n与,和有关, 分辨能力的意义为:
当实际的两个率的差 1 2 ||时,
则按照估计的n,进行随机抽样和统计检 验,拒绝H0的概率Power大于或等于预 定值1-,反之Power下降,即:出现不 拒绝H0的机会增加。
14
非劣性设计的背景简述
非劣性设计的另一用途: 已知对照药(B药)的有效率优于某一个药
(如:安慰剂),记为C药:两个药的有效率 差异为B -C =δ>0,临床试验的目的只是想 证实试验药(A药)优于C药,但由于伦理 等原因,不能直接用C药作为对照,则可以 以B药为对照,用非劣性设计,选择特殊的 非劣性界值δ,通过非劣性检验,间接证实A 药优于C药。
P1 P2
PC
(1
PC
)
1 n1
1 n2
2
差异性检验
其中 P1na1,P2nc2,PCna1 nc2,
故当 |U |1.96 时,可以拒绝H0。
可以证明:U2
2 Pearson
检验统计量。
3
优效设计的样本量估计
每组样本量相同的情况下,样本量估计为
n(Z /2Z )2P 1(1 2P 1)P 2(1P 2)2H0:ຫໍສະໝຸດ 2-5% H1: 1>2-5%
11
非劣性检验简介
由于非劣性检验为单侧检验,临床试验往往取 0.025(如美国FDA要求),检验统计量为
U
P1P2
P1(1P1)P2(1P2)
n1
n2
0
1-2
的95%CI为:P1P21.96
P1(1P1)P2(1P2)
n1
n2
12
非劣性检验简介
如果U>1.96(P<0.025),则拒绝H0,可以认为试验 药非劣于对照药。
15
非劣性设计的背景简述
举例说明基本思想:例如对照药的有效率B 为60%,C药的对照药的有效率C只有40%, 如果我们只要证实:试验药的有效率A与对 照药的有效率之差A-B=δ<20%,则:试验药 的有效率A-C药有效率C
=(A- B)+(B- C )= (A- B)+20%>0 即:证实试验药的有效率高于C药