临床试验中样本量确定的统计学考虑_陈平雁

合集下载

临床试验中样本量确定的统计学考虑

临床试验中样本量确定的统计学考虑

临床试验中样本量确定的统计学考虑在临床试验的设计中,样本量的确定是一个至关重要的步骤。

合理确定样本量可以保证研究结果的可靠性和准确性,从而对临床决策和治疗指导起到重要的支撑作用。

样本量的确定需要考虑到统计学的原理和相关方法,以下将介绍在临床试验中样本量确定的一些统计学考虑。

首先,样本量的大小与效应大小有关。

效应大小指的是所研究的治疗或干预措施对于所关心的结局变量的影响程度。

一般来说,效应越大,样本量可以相对较小;效应越小,则需要较大的样本量。

根据已有的研究或临床经验,可以估计所研究的治疗或干预效果的大小,进而确定合适的样本量。

其次,样本量的大小与α(显著性水平)和β(1-统计功效)有关。

显著性水平α用于决定是否拒绝零假设,通常设定为0.05或0.01。

统计功效β则表示正确地接受备择假设(即发现差异)的概率,一般设置在0.8或0.9。

样本量的大小与α和β呈反向关系,α设定越小,β设定越大,需要的样本量就越大;反之亦然。

通常,α和β的选择需要根据研究目的、研究设计和可接受的错误率来确定。

另外,样本量的大小还与所使用的统计方法和假设检验类型有关。

对于不同类型的假设检验(如配对t检验、独立样本t检验、非参数检验等),样本量的计算方法也会有所不同。

此外,还需要考虑到所使用的统计方法对数据的要求以及研究设计的复杂性。

对于复杂的研究设计,如多组间比较、多个变量的分析等,可能需要更大的样本量来保证结果的可靠性。

此外,还需考虑到样本量的可行性和可获取性。

临床试验的样本量计算是基于研究目的、效应大小和统计学的原理来确定的,但同时也需要考虑到资源限制和实际操作的可行性。

例如,如果所研究的疾病罕见或病例数量较少,可能需要更长的研究周期或扩大研究范围来满足样本量的要求。

在样本量计算中,需要进行合理的权衡,以保证研究的可行性和有效性。

对于临床试验中样本量的确定,还需充分考虑到临床意义和实际需求。

样本量的大小并不是越大越好,过大的样本量会浪费资源并增加研究的时间和成本。

临床试验中样本量确定的统计学考虑

临床试验中样本量确定的统计学考虑

临床试验中样本量确定的统计学考虑临床试验中样本量确定的统计学考虑在进行临床试验时,确定合适的样本量是非常重要的。

样本量的确定在统计学中有一定的原则和方法,它影响着试验结果的可靠性和有效性。

本文将介绍一些临床试验中样本量确定的统计学考虑。

1. 研究目的和假设检验在确定样本量之前,首先需要明确研究的目的和所要检验的假设。

研究目的可以是探索性的或者是为了验证某些假设的有效性。

假设检验则是用来检验研究者想要证明或者推翻的某种假设。

根据研究目的和假设不同,确定样本量的方法也有所差异。

2. 效应大小和显著性水平确定样本量还需要考虑效应大小和显著性水平。

效应大小指的是预计的实验组和对照组之间存在的差异程度。

显著性水平是研究者希望设置的拒绝原假设的概率,一般为0.05或0.01。

较大的效应大小和较小的显著性水平通常需要较大的样本量。

3. 统计分析方法和假设检验的类型在确定样本量时,还需要考虑所选用的统计分析方法和假设检验的类型。

不同的分析方法和假设检验需要不同的样本量。

例如,对于均值比较的类型,可使用t检验进行分析,而对于比例比较的类型,则可使用卡方检验进行分析。

4. 可接受的错误率确定样本量还需要考虑研究者对错误率的容忍程度。

错误率包括类型I错误(拒绝了真实的零假设)和类型II错误(接受了错误的零假设)。

通常,类型I错误的容忍程度为0.05或0.01,而类型II错误的容忍程度为0.2或0.1。

5. 统计学计算方法确定样本量需要进行统计学计算。

一般来说,可以使用统计学软件或者在线计算工具进行样本量计算。

统计学计算方法和公式是根据研究目的、假设检验和效应大小等因素来确定的。

根据输入的参数,计算结果会给出建议的样本量大小。

6. 其他因素的考虑除了以上提到的因素,还有一些其他因素也需要考虑。

样本的可用性和实际可招募到的人数是决定样本量大小的重要因素之一。

此外,伦理考虑和研究成本也需要在确定样本量时加以考虑。

总结起来,确定临床试验中的样本量需要充分考虑研究目的、假设检验、效应大小、显著性水平、统计分析方法、可接受的错误率等因素。

临床研究中的样本量估算:临床试验

临床研究中的样本量估算:临床试验

临床研究中的样本量估算:临床试验在临床研究领域,样本量估算无疑是临床试验设计中至关重要的一环。

它不仅关系到研究结果的可靠性和有效性,还直接影响到研究的成本、时间和可行性。

通俗来讲,样本量估算就是要回答“我们需要多少研究对象才能得出有意义的结论”这个关键问题。

为什么样本量估算如此重要呢?想象一下,如果样本量过小,就好像只从大海中舀了一小杯水来判断海水的成分,结果很可能因为随机性太大而不准确,甚至得出错误的结论。

相反,如果样本量过大,虽然能增加结果的可靠性,但会造成资源的浪费,研究时间延长,成本大幅增加。

所以,找到一个恰到好处的样本量,是每个临床试验设计者都必须面对的挑战。

那么,如何进行样本量估算呢?这可不是拍脑袋就能决定的,而是需要综合考虑多个因素。

首先要考虑的是研究的主要目的和假设。

比如,是要比较两种治疗方法的疗效差异,还是要评估某种药物的安全性?不同的研究目的和假设会对样本量产生不同的要求。

假设我们要比较一种新药物和传统药物治疗某种疾病的效果。

我们的假设是新药物的疗效优于传统药物。

为了能够有足够的把握检测出这种差异,我们需要根据预期的疗效差异大小来确定样本量。

如果预期的差异很小,那么就需要更多的样本才能检测到这种细微的差别;如果预期的差异较大,相对来说所需的样本量就会少一些。

其次,效应大小也是一个关键因素。

效应大小反映了研究中所关注的变量之间的差异程度。

比如,在药物疗效研究中,效应大小可以是新药物和传统药物在治愈率、症状改善程度等方面的差异。

一般来说,效应大小越大,所需的样本量就越小;效应大小越小,所需的样本量就越大。

再者,检验水准和检验效能也不能忽视。

检验水准通常设定为005,它表示在假设检验中,当原假设为真时,错误地拒绝原假设的概率。

而检验效能则是在给定的效应大小和样本量的情况下,正确拒绝原假设的概率,一般要求检验效能不低于 80%。

简单来说,检验水准和检验效能就像是天平的两端,我们需要在它们之间找到一个平衡,以确定合适的样本量。

样本量估计及其在nQuery和SAS软件上的实现——相关分析

样本量估计及其在nQuery和SAS软件上的实现——相关分析

样本量估计及其在nQuery和SAS软件上的实现——相关分

周立志;姚阿玲;陈平雁
【期刊名称】《中国卫生统计》
【年(卷),期】2013(030)004
【总页数】4页(P617-619,622)
【作者】周立志;姚阿玲;陈平雁
【作者单位】南方医科大学公共卫生与热带医学学院生物统计学系;南方医科大学公共卫生与热带医学学院生物统计学系;南方医科大学公共卫生与热带医学学院生物统计学系
【正文语种】中文
【相关文献】
1.样本量估计及其在nQuery和SAS软件上的实现——均数比较(九) [J], 王岩;钱若远;陈平雁
2.样本量估计及其在nQuery和SAS软件上的实现——均数比较(十一) [J],
3.样本量估计及其在nQuery和SAS软件上的实现——均数比较(十) [J],
4.样本量估计及其在nQuery和SAS软件上的实现
——相关分析(二) [J], 钱晨坚;吴研鹏;段重阳;陈平雁
5.诊断试验样本量估计及其在nQuery和SAS软件上的实现 [J], 吴研鹏;钱晨坚;陈平雁;段重阳
因版权原因,仅展示原文概要,查看原文内容请购买。

临床试验中的样本规模和统计功效计算

临床试验中的样本规模和统计功效计算

临床试验中的样本规模和统计功效计算在进行临床试验时,确定合适的样本规模和进行统计功效计算是至关重要的步骤。

本文将介绍临床试验中样本规模的确定方法以及统计功效计算的原理,以帮助研究人员更好地设计和进行临床试验。

一、样本规模的确定方法确定适当的样本规模对于临床试验的可靠性和有效性至关重要。

样本规模的确定通常需要考虑以下几个因素:1. 研究目的:在确定样本规模之前,研究人员需要明确研究的目的是什么。

不同的研究目的可能需要不同的样本规模。

2. 效应大小:效应大小是指接受干预或治疗后,两组之间的差异有多大。

通常通过进行文献回顾或者先前的研究来估计效应大小。

3. 显著水平和统计功效:显著水平是研究人员在进行假设检验时所希望的错误接受概率的值,通常设置为0.05或0.01。

统计功效是指在给定的显著水平下,研究可以检测到效应的能力。

4. 统计方法和假设检验:研究人员在确定样本规模时需要考虑使用的统计方法和假设检验的类型。

通过以上因素的综合考虑,可以使用统计学方法来计算所需的样本规模。

常用的方法包括:基于效应大小的样本规模计算、基于给定统计功效的样本规模计算以及其他经验公式等。

二、统计功效计算的原理统计功效计算是指在给定样本规模、显著水平和效应大小的情况下,通过统计学方法计算出试验的统计功效。

统计功效是指在给定显著水平下,检测到真实效应的概率。

统计功效计算通常依赖于以下几个要素:1. 显著水平:显著水平是用来控制犯第一类错误的概率,通常设置为0.05或0.01。

2. 效应大小:效应大小是指接受干预或治疗后,两组之间的差异有多大。

根据已有的研究或者文献回顾,可以估计效应大小。

3. 样本规模:样本规模是进行统计功效计算的重要参数。

样本规模的大小将直接影响统计功效的计算结果。

4. 统计方法和假设检验:统计功效计算需要明确所使用的统计方法和假设检验的类型。

在进行统计功效计算时,可以使用统计软件(如R、SPSS等)或进行手工计算,根据已确定的显著水平、效应大小和样本规模等参数,得到相应的统计功效值。

《解放军护理杂志》对文稿抄袭剽窃、重复发表等问题处理的声明

《解放军护理杂志》对文稿抄袭剽窃、重复发表等问题处理的声明

归分析结果显示:婚姻状况㊁职务是护士非注意盲视的主要预测因素,且婚姻状况的影响力更大㊂原因可能在于已婚护士往往要兼顾工作家庭各项事宜,长期统筹工作关系㊁夫妻关系㊁亲子关系及社会关系,相比而言未婚护士生活较为单一,其责任心㊁全面权衡和兼顾能力比已婚护士更差;高职称护士往往经历更多综合培训㊁业务考评㊁职称晋升考核,相比而言低职称护士职业发展经历较少,其临床经验㊁观察和决策等能力与高职称护士相比有所欠缺㊂因此,护理管理者应充分关注婚姻状况㊁职称在护士非注意盲视现象中的预测性,将婚姻状况欠佳㊁职称较低的护士纳入关注的重中之重,生活上予以关心,力所能力地帮助护士获得最大限度的工作家庭平衡感,同时帮助低职称护士认识非注意盲视这一特殊现象并进行针对性的通用能力培训和考核,建立以能力评职称㊁据职称练能力的良性职称循环机制,充分调动家庭㊁职称的正向激励作,提升护士工作效能㊂4㊀小结护士非注意盲视现状不容乐观,护理管理者应正视现状㊁重点把握预测因素并根据影响因素采取针对性干预方案,预防非注意盲视的发生,减少非注意盲视对患者安全和护理质量的影响㊂然而,本研究只对190例护士进行了调查分析,后期可扩展研究中心㊁加大样本量㊁行进一步实证和干预研究㊂ʌ参考文献ɔ[1]MA C K A,R O C K I.I n a t t e n t i o n a lb l i n d n e s s[M].C a m b r i d g e,E n g l a n d:M I TP r e s s,1998.[2]J O N E SA,J O H N S T O N E MJ.在重症监护㊁急诊及围手术期情境下,非注意盲视与病情恶化患者的抢救失败:4例病案报告[J].中国护理管理,2017,17(07):1008.[3]陈平雁.临床试验中样本量确定的统计学考虑[J].中国卫生统计.2015,32(4):727-733.[4]R I C H A R D SA,H A N N O N E M,V I T K O V I T C H M.D i s t r a c t e db y d i s t r ac t o r s:e y em o v e m e n t s i nad y n a m i c i n a t te n t i o n a l b l i n d-n e s s t a s k[J].C o n s c i o u sC o g n,2012,21,170-176.[5]A L-MO T E R IM O,S YMMO N S M,C O O P E RS,e t a l.I n a t t e n-t i o n a l b l i n d n e s s a n d p a t t e r n-m a t c h i n g f a i l u r e:t h e c a s eo f f a i l u r e t o r e c o g n i z e c l i n i c a l c u e s[J].A p p l E r g o n,2018,73:174-182.[6]房慧聪,杨林腾,刘怡涛.认知负荷与期望水平对非注意盲视的影响[J].应用心理学,2017,23(4):327-335.[7]李玲娣,丁秀娟,张立清,等.低年资护士护理不良事件原因分析及对策[J].齐鲁护理杂志,2013,19(20):130-131. [8]朱长云,孙洪祥.临床护士工作家庭平衡与工作效能感相关性调查[J].齐鲁护理杂志,2017,23(05):36-38.[9]全国护理事业发展规划(2016-2020年)[J].中国护理管理, 2017,17(01):1-5.[10]刘克英,朱晓华,王丛英.三级甲等医院编内与编外护士付出-获得不平衡现状的调查[J].解放军护理杂志,2014,31(03):5-8.[11]关丽丽,李晓飞,宋舒,等.不同工作年限护士能力的调查研究[J].护理研究,2014,28(28):3496-3499.(本文编辑:陈晓英)ʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏʏ‘解放军护理杂志“对文稿抄袭剽窃㊁重复发表等问题处理的声明㊀㊀近年来,护理学科发展迅猛,论文产出量逐年增多㊂尽管绝大部分作者都是本着严谨和自律的学术态度从事护理科研,撰写护理论文,但仍有个别作者存在着形形色色的学术失范或学术不端行为,其中抄袭剽窃㊁重复发表的问题尤其严重㊂为了维护‘解放军护理杂志“的声誉和广大读者㊁作者的权益,遏止学术腐败,倡导优良学术风气,促进护理学科的健康发展,本刊就文稿抄袭剽窃㊁重复发表等问题的处理做出如下声明: (1)本声明中所涉及的文稿指2篇文稿在文字的表达和讨论的叙述上可能存在某些不同之处,但文稿的主题㊁结构㊁主要数据和图表是相同或高度一致的㊂所指文稿不包括重要会议的纪要㊁疾病的诊断标准和防治指南㊁有关组织达成的共识性文件等㊂(2)凡来稿接到编辑部稿件回执3个月内未接到录用通知者,则表明稿件仍在处理中,作者欲投他刊,应事先与本刊联系,以免重复发表㊂(3)抄袭剽窃㊁重复发表等行为一经核实,将择期在杂志显要位置刊出其作者单位㊁姓名及撤消论文的通告;该文稿第一作者所撰写的所有文稿3年内不得在本刊发表;编辑部将就此事件向作者所在单位进行通报,以示惩戒㊂本刊编辑部㊃07㊃解放军护理杂志㊀2019年9月,36(9)。

20190925 临床试验数据监查委员会指导原则(征求意见稿)起草说明

20190925 临床试验数据监查委员会指导原则(征求意见稿)起草说明

《临床试验数据监查委员会指导原则》起草说明一、背景和目的近年来,随着国内新药临床试验的不断发展,数据监查委员会(Data Monitoring Committee,DMC)在试验中的使用逐渐增多。

DMC 是一个独立的具有相关专业知识和经验的专家组,负责定期审阅来自一项或多项正在开展的临床试验的累积数据,旨在保证临床试验中受试者的安全性、继续试验的合理性及科学价值。

本指导原则主要阐述DMC在临床试验中的职责、任务和组成,以及DMC运行过程中的操作规范和统计学考虑,并强调DMC的独立性以及对利益冲突的规避原则,旨在为临床试验提供DMC建立与实施的指导性建议,以确保DMC的规范运作和顺利实施。

二、起草过程本指导原则的起草小组基于药审中心与南方医科大学战略合作建立的三方学术协调委员会,由学术界、制药工业界和监管机构代表共同组成,保证了本指南高效、高质量完成。

本指导原则自2019年3月正式启动,分别于2019年3月和5月召开两次专家研讨会,历时6个月最终形成该征求意见稿,并将其翻译成英文。

起草过程中参考了国际上其他监管机构如美国FDA、欧盟EMA等制定的相关指南,并体现了当前适应性临床试验的发展对DMC带来的机遇与挑战等考量。

参与制订本指导原则的专家名单见附录,在此一并致谢。

三、指导原则架构本指导原则分为七个部分,内容如下:第一部分为“引言”,阐述了制定该指导原则的目的。

第二部分为“DMC的职责和任务”,指出临床试验设立DMC主要有安全性监查、有效性监查、试验质量监查等方面的职能。

DMC可以在非盲状态下利用临床试验过程中收集的有效性和安全性数据,依照预先制定的方案执行风险-获益评估,为申办方提供建议。

第三部分为“DMC的建立”,阐述了DMC成员的组成,强调在确定DMC成员时应注意DMC成员的独立性以及应规避的利益冲突。

第四部分为“DMC操作规范”,详细阐述了DMC章程的制定、DMC 会议、DMC提出的建议以及会议记录。

临床试验样本量的估算

临床试验样本量的估算

临床试验样本量的估算样本量的估计涉及诸多参数的确定,最难得到的就是预期的或者已知的效应大小计数资料的率差、计量资料的均数差值,方差计量资料或合并的率计数资料各组的合并率,一般需通过预试验或者查阅历史资料和文献获得,不过很多时候很难得到或者可靠性较差;因此样本量估计有些时候不是想做就能做的;SFDA的规定主要是从安全性的角度出发,保证能发现多少的不良反应率;统计的计算主要是从power出发,保证有多少把握能做出显着来;但是中国的国情有多少厂家愿意多做建议方案里这么写:从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例;或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组和对照组的有效率分别为%和%,则每个治疗组中能接受评价的病人样本数必须达到114例总共228例,这样才能在单侧显着性水平为5%、检验功效为90%的情况下证明试验组疗效优于对照组;假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人的总样本例数为250例;非劣性试验α=,β=时:计数资料:平均有效率P 等效标准δN=公式:N=×P1-P/δ2计量资料:共同标准差S 等效标准δN=公式:N=× S/δ2等效性试验α=,β=时:计数资料:平均有效率P 等效标准δN=公式:N=×P1-P/δ2计量资料:共同标准差S 等效标准δN=公式:N=× S/δ2上述公式的说明:1 该公式源于郑青山教授发表的文献;2 N 是每组的估算例数N1=N2,N1 和N2 分别为试验药和参比药的例数;3 P 是平均有效率,4 S 是估计的共同标准差,5 δ 是等效标准;6 通常都规定α=,β=把握度80%上述计算的例数若少于国家规定的例数,按规定为准;多于国家规定的则以计算值为准;具体规定的最小样本量如下:II期,试验组100例;III期,试验组300例;随机对照临床验证如3类化药试验组100例;IV期,2000例;疫苗和避孕药与上述要求不同;例1:某新药拟进行II 期临床试验,与阳性药按1:1 的比例安排例数,考察新药临床治愈率不差于阳性药;根据以往的疗效和统计学的一般要求,取α=,β=,等效标准δ=,平均有效率P=,每组需要多少病例由公式计算得,N=×/=88例以上88 例低于我国最低例数100 例的规定,故新药至少取100 例进行试验;如上例作等效性分析,则得,N=×/=122例;例2:某利尿新药拟进行II 期临床试验,与阳性药按1:1 的比例安排例数,考察24h 新药利尿量不差于阳性药;根据以往的疗效和统计学的一般要求,取α=,β=,等效标准δ=60 ml,已知两组共同标准差S=180 ml,每组需要多少病例由公式得,N=× 180/602=111 例;故本次试验新药和阳性药的例数均不少于111 例;如上例作等效性分析,则得,N=×180/602=154例; s:11临床试验研究中,无论是实验组还是对照组都需要有一定数量的受试对象;这是因为同一种实验处理在不同的受试对象身上表现出的实验效应是存在着变异的;仅凭一次实验观测结果或单个受试者所表现出来的实验效应说明不了什么问题;必须通过一定数量的重复观测才能把研究总体真实的客观规律性显示出来,并且可以对抽样误差做出客观地估计;一般说来重复观测次数越多,抽样误差越小,观测结果的可信度越高;一定数量的重复还可起到部分抵消混杂因素影响的作用,增强组间的可比性;但重复观测次数越多即样本含量越大试验所要消耗的人力、物力、财力和时间越多,可能会使试验研究成为不可能;而且,样本含量过大还会增加控制试验观测条件的难度,有可能引入非随机误差,给观测结果带来偏性bias;所以在实验设计中落实重复原则的一个重要问题就是如何科学合理确定样本含量;由于在各对比组例数相等时进行统计推断效能最高,因此多数情况下都是按各组样本含量相等来估计;但在个别情况下,也可能要求各组样本含量按一定比例来估计;1 与样本含量估计有关的几个统计学参数在估计样本含量之前,首先要对以下几个统计学参数加以确定或作出估计;规定有专业意义的差值δ,即所比较的两总体参数值相差多大以上才有专业意义;δ是根据试验目的人为规定的,但必须有一定专业依据;习惯上把δ称为分辨力或区分度;δ值越小表示对二个总体参数差别的区分度越强,因而所需样本含量也越大;确定作统计推断时允许犯Ⅰ类错误“弃真”的错误的概率α,即当对比的双方总体参数值没有差到δ;但根据抽样观测结果错误地得出二者有差别的推断结论的可能性,α确定的越小,所需样本含量越大;在确定α时还要注意明确是单侧检验的α,还是双侧检验的α;在同样大小的α条件下;双侧检验要比单侧检验需要更大的样本含量;提出所期望的检验效能power,用1-β表示;β为允许犯Ⅱ类错误“取伪”的错误的概率;检验效能就是推断结论不犯Ⅱ类错误的概率1-β称把握度;即当对比双方总体参数值间差值确实达到δ以上时,根据抽样观测结果在规定的α水准上能正确地作出有差别的推断结论的可能性;在科研设计中常把1-β定为或;一般来说1-β不宜低于,否则可能出现非真实的阴性推断结论;给出总体标准差σ或总体率π的估计值;它们分别反映计量数据和计数数据的变异程度;一般是根据前人经验或文献报道作出估计;如果没有前人经验或文献报道作为依据,可通过预实验取得样本的标准差s或样本率P 分别作为σ和π的估计值;σ的估计值越大,π的估计值越接近,所需样本含量越大;在对以上统计学参数作出规定或估计的前提下,就可以根据不同的推断内容选用相应的公式计算出所需样本含量;由于在同样的要求和条件下完全随机设计成组设计所需样本含量最大,故一般都要按完全随机设计作出样本含量的估计;2 常用的估计样本含量的方法两样本均数比较时样本含量估计方法1两样本例数要求相等时可按下列公式估算每组需观察的例数n;n=2α+βσ/δ^2 公式1式中δ为要求的区分度,σ为总体标准差或其估计值s,α、β分别是对应于α和β的u值,可由t界值表,自由度υ=∞-行查出来,α有单侧、双侧之分,β只取单侧值;例1,某医师研究一种降低高血脂患者胆固醇药物的临床疗效,以安慰剂作对照;事前规定试验组与对照组相比,平均多降低 mmol/L以上,才有推广应用价值;而且由有关文献中查到高血脂患者胆固醇值的标准差为 mmol/L,若要求犯Ⅰ类错误的的概率不超过5%,犯Ⅱ类错误的概率不超过10%,且要两组例数相等则每组各需观察多少例本例δ= mmol/L,σ= mmol/L,α=,β=,1-β=,查t界值表自由度为∞一行得单侧=,=,代入公式1n=2+×^2=44故要达到上述要求,两组至少各需观察44例;2两样本例数要求呈一定比例n2/n1=c时,可按下列公式求出n1,再按比例求出n2=cn1;n1=α+βσ/δ^21+C/C 公式2例2 对例1资料如一切要求都维持不变,但要求试验组与对照组的例数呈2∶1比例即C=2,问两组各需观察多少例n1=+×^2×1+2/2 =33例对照组所需例数n2=2×33=66例试验组所需例数;两组共需观察99例多于两组例数相等时达到同样要求时两组所需观察的总例数2×44=88;配对设计计量资料样本含量对子数估计方法配对设计包括异体配对、自身配对、自身前后配对及交叉设计的自身对照,均可按下列公式进行样本含量估计;n=α+βσd/δ^2 公式3式中δ、α、β的含义同前,σd为每对差值的总体标准差或其估计值sd;例 3 某医院采用自身前后配对设计方案研究某治疗矽肺药物能否有效地增加矽肺患者的尿矽排出量;事前规定服药后尿矽排出量平均增加mmol/L以上方能认为有效,根据预试验得到矽肺患者服药后尿矽排出量增加值的标准差 sd= mmol/L,现在要求推断时犯Ⅰ类错误的概率控制在以下单侧,犯Ⅱ类错误的概率控制在以下,问需观察多少例矽肺病人本例δ= mmol/L, sd= mmol/L,α=,β=;1-β=,单侧=,=,代入公式3得到;n=+×89/^2=54例故可认为如该药确实能达到平均增加尿矽排出量在 mmol/L以上,则只需观察54例病人就能有90%的把握,按照α=的检验水准得出该药有增加矽肺病人尿矽作用的正确结论;样本均数与总体均数比较时样本含量估计方法可按下式估算所需样本含量n;n=α+βσ/δ^2 公式4例4已知血吸虫病人血红蛋白平均含量为90g/L,标准差为25g/L,现欲观察呋喃丙胺治疗后能否使血红蛋白增加,事先规定血红蛋白增加10g/L以上才能认为有效,推断结论犯Ⅰ类错误的概率α双侧不得超过,犯Ⅱ类错误的概率β不得超过,问需观察多少例病人本例δ=10g/L,σ=25g/L,=双侧,=代入公式4得:n=+×25/10^2=66例故如果呋喃丙胺确实能使血吸虫病人血红蛋白平均含量增加10g/L以上,则只需观察66例就可以有90%的把握在α=检验水准上得出有增加血吸虫病人血红蛋白平均含量的结论;。

临床研究中的样本量估算_1_临床试验

临床研究中的样本量估算_1_临床试验

临床研究中的样本量估算_1_临床试验临床研究中的样本量估算一、引言在临床研究设计的过程中,样本量估算是非常重要的一部分。

样本量的大小直接影响到研究结果的可信度和推广性,因此合理的样本量估算对于研究的有效性和准确性至关重要。

本文将介绍在临床试验中进行样本量估算的一般原则和方法。

二、样本量估算的原则1.研究目的和假设:在进行样本量估算之前,需要明确研究的目的和科学假设。

例如,研究目的是评价一种新药物的疗效,科学假设是该新药物相对于对照药物在治疗效果上具有显著差异。

2.效果大小和显著水平:样本量估算需要考虑研究的主要效果大小和研究结果的显著性水平。

主要效果大小通常由预期的效应量来衡量,显著性水平通常设定为0.05.3.统计方法和假设检验:样本量估算需要选择适当的统计方法和假设检验方法。

常用的统计方法包括t检验、χ2检验和生存分析等,根据研究设计和数据类型选择合适的方法。

4.统计功效和样本比例:根据效果大小、显著水平和统计方法,可以计算出研究的统计功效。

统计功效通常设定为80%或90%,根据研究的要求合理选择。

三、样本量估算的方法1.固定效应模型:适用于研究目的明确,效果大小可预期的情况。

根据预期的效应大小、显著水平和统计功效,可以计算出所需的最小样本量。

2.结果模拟法:适用于研究目的不明确,效果大小不确定的情况。

通过模拟多个样本量和效果大小的组合,评估不同样本量下的统计功效和效果大小的关系,从而选择合理的样本量范围。

3.临床合理性法:适用于研究目的和效果大小无法准确估计的情况。

根据研究领域的临床经验和专家意见,结合已有的临床试验结果,进行样本量估算。

四、样本量估算的考虑因素1.预计的失访率和样本无效率:由于各种原因,研究中可能存在部分受试者失访或数据无效的情况。

在样本量估算中需要考虑到这些因素的影响,增加适当的样本量。

2.子组分析和交互效应:如果研究中存在多个子组或交互效应的检验,需要进行适当的样本量调整,以保证对这些效应进行准确的评估。

临床试验样本量的估算

临床试验样本量的估算

临床试验样本量的估算临床试验的样本量估算是研究计划中非常重要的一个环节。

样本量的大小会直接影响到试验结果的可靠性和推广性。

本文将介绍一些常用的方法和考虑因素,来进行临床试验样本量的估算。

一、统计学方法1.样本量估算的原则样本量估算的基本原则是保证试验结果的统计学意义和实际应用的可行性,同时控制样本量的大小。

在样本量估算时需要考虑的主要因素包括:研究目的、效应大小、α水平、β水平、检验类型和预估结果的方差。

2.效应大小效应大小(Effect Size)指的是一种观察、试验或实验中的两组之间的差异,并且是研究中最重要的指标之一、效应大小的选择需要基于研究目标和研究领域的实际情况。

常用的效应大小指标包括:风险比、比值比、均值差异等。

3.α水平和β水平α水平和β水平是两种错误假设的概率。

α水平(Type I错误)是拒绝了一个真假设。

通常是将p值设置在0.05以下。

β水平(TypeII错误)是接受了一个错误的假设。

常见的β值是0.2、0.1、0.05和0.01、α和β的选择需要根据实际情况和研究目的进行权衡。

4.检验类型根据研究目的和数据类型的不同,可以选择不同的检验类型。

常见的检验类型包括:t检验、方差分析、卡方检验等。

不同的检验类型需要不同的样本量估算方法。

5.预估结果的方差预估结果的方差是样本量估算的另一个重要因素。

方差的预估可以通过先前的研究结果或者基于临床经验来估算。

二、样本量估算方法1.均值差异的样本量估算方法均值差异的样本量估算方法适用于需要比较两个或多个组之间平均值差异的研究。

常用的方法有:Z检验样本量估算、t检验样本量估算和方差分析样本量估算。

2.分类变量的样本量估算方法分类变量的样本量估算方法适用于比较不同组之间的比率、风险比、比值比等。

常用的方法有:卡方检验样本量估算和Fishers精确检验样本量估算等。

3.生存分析的样本量估算方法生存分析的样本量估算方法适用于评估治疗或干预措施对患者生存时间或复发时间的影响。

临床研究中的样本容量与统计功效分析

临床研究中的样本容量与统计功效分析

临床研究中的样本容量与统计功效分析临床研究是医学领域中非常重要的一项工作,它涉及到医学实践中的各种方面,包括医疗技术、药物治疗、疾病预防等。

在进行临床研究时,我们需要考虑到样本容量和统计功效分析,以确保研究结果的可靠性和有效性。

一、样本容量的确定样本容量是指参与研究的样本数量,它对研究结果的准确性有重要影响。

样本容量的确定需要考虑以下几个因素:1. 效应大小:效应大小是指所研究的变量在不同组别之间的差异。

当效应大小较大时,所需的样本容量较小;反之,当效应大小较小时,所需的样本容量较大。

2. 显著水平和置信度:显著水平是指确定统计效果时所接受的错误概率,常用的显著水平为0.05。

置信度是指在样本中查得的统计量与真实值之间的可信程度,常用的置信度为95%。

3. 预期效应:预期效应是指研究者对所研究变量之间差异程度的预期。

可以根据实际情况和已有文献来确定预期效应的大小。

4. 统计分析方法和假设检验:不同的统计分析方法和假设检验所需的样本容量也不同。

研究者需要根据具体情况选择适合的统计分析方法,并确定相应的样本容量。

二、统计功效分析的重要性统计功效分析是评估研究设计的敏感性和效果的重要方法。

统计功效分析可以帮助研究者判断是否需要更多的样本以增加研究的可靠性和准确性。

1. 在研究设计之前进行统计功效分析可以帮助研究者估计所需的样本容量,从而避免因样本容量不足而导致研究结果的不准确。

在进行临床试验时,样本容量的确定是非常关键的,样本容量不足可能会导致研究结果的失真。

2. 统计功效分析可以帮助研究者评估研究的效果和可行性。

通过对统计功效分析的结果进行解读,研究者可以判断研究方向的合理性和实施的可行性,从而避免在无效的研究方向上浪费时间和资源。

3. 统计功效分析还可以帮助研究者设计更合理和科学的实验方案,提高研究的效率和成功率。

通过对统计功效分析的结果进行充分的分析和解读,研究者可以得出更准确的结论和推断。

三、样本容量与统计功效分析方法在临床研究中,常用的样本容量与统计功效分析方法包括假设检验、置信区间、效应量和统计功效。

样本量估计及其在nQuerynTerim-南方医科大学生物统计系

样本量估计及其在nQuerynTerim-南方医科大学生物统计系

Hwang-Shih-DeCani
南方医科大学 公共卫生与热带医学学院 生物统计学系 2012 级硕士 南方医科大学 公共卫生与热带医学学院 生物统计学系 △ 通讯作者
1 2
6.1 两个均数的比较 方法: 根据 Reboussin et al [1992] [3]提出的算法,可由预设的分析时间点数 目、每个时间点的信息量τ、消耗函数、一类错误、检验效能和检验边数积分迭 代求出漂移参数θ,其基本求解思想如下[4]: 首先需根据一类错误和消耗函数计算出每个时间点对应的边界值。 记相邻两 次的信息量 k k k 1 , k 2,..., K ,假定检验统计量有如下关系:
ybk bk 1 k k ,则在第 k 个时间点停止试验的概率密度函数为
f k ( x)
f k ( x)
yak

g (( x u) /
k
) k 1 f k 1 (u )du
) k 1 f k 1 (u )du
(6-4)

ybk
g (( x u ) /
Z k k Z k 1 k 1 ~ N (0, k ), k 2,..., K
(6-1)
当 k=1 时,检验统计量为 Z1 ~ N (0,1) ,其概率密度函数为 f1 ( z1 ) ( z1 ) 。当 k>1 时, Z k 的概率密度函数为
f k ( zk 1 , zk )
/*-------- sigma1: Group 1 Standard deviation, must be larger than 0 ----------------------------*/ /*-------- sigma2: Group 2 Standard deviation, must be larger than 0 ----------------------------*/ /*-------- Ratio : The ratio of group sample size -----------------------------------------------*/ /*-------- alpha : Type-one error ---------------------------------------------------------------*/ /*-------- power : Desired power ----------------------------------------------------------------*/ /*-------- t /*-------- t2 /*-------- iuse : Time scale information,must be in (0,1) --------------------------------------*/ : Calendar time scale information ----------------------------------------------*/ : spending function with 1 2 3 4 5 /*-------- asf /*-------- phi ------------------*/ /*-------- ztrun : critical value ---------------------------------------------------------------*/ /*-----------------------------------------------------------------------------------------------*/ if sigma1<=0 || sigma2<=0 then do; Print "Error:Standard deviation must be larger than 0"; stop; end; if Ratio<=0 then do; Print "Error:The ratio of group sample size must be larger than 0"; stop; end; load module=bounds; load module=cprob; load module=drift; run bounds(lbnd,ubnd,epr,dpr,spend,t,t2,iuse,asf,alpha,phi,ztrun); nominalp=2*(1-probnorm(lbnd)); boundry=t(ubnd//lbnd); O'Brien-Fleming Pocock Power Family: alpha * t^phi Hwang-Shih-DeCani Family User-specified spending function -----------------------------------------*/

医学统计学方法在医疗器械临床试验中的应用

医学统计学方法在医疗器械临床试验中的应用

医学统计学方法在医疗器械临床试验中的应用在现代医学领域中,临床试验是评估医疗器械疗效与安全性的重要手段之一。

而医学统计学方法的应用则可以帮助我们更加准确、客观地分析和解释试验结果,为临床医生及决策者提供科学依据。

本文将探讨医学统计学方法在医疗器械临床试验中的应用。

一、样本量计算在进行任何临床试验前,首先需要确定合适的样本量。

样本量计算是基于统计学原理,可以帮助研究者确定试验需要纳入的患者数量。

合理的样本量可以提高试验的统计能力,减少结果的偏差和误差。

样本量计算需要考虑多种因素,如预期效应大小、试验设计、统计检验的假设和显著性水平等。

通过合理的样本量计算,可以减少试验结果的偏差,提高试验的可信度和可解释性。

二、随机化与对照组设计在医疗器械临床试验中,随机化和对照组设计是常用的研究方法。

随机化可以将研究对象随机分配到不同的处理组中,减少由于个体差异而引起的偏倚。

对照组设计则可以在试验组和对照组之间进行比较,评估新器械的疗效和安全性。

医学统计学方法在随机化和对照组设计中具有重要作用。

通过合理的随机化方法和对照组选择,可以在试验开始前减少潜在的偏倚。

同时,统计学方法可以对试验组和对照组之间的数据进行比较,判断其差异是否具有统计学意义,从而得出客观、科学的结论。

三、数据收集与分析在医疗器械临床试验中,数据的收集和分析是至关重要的步骤。

准确、全面地收集试验数据可以提高结果的可靠性和可解释性。

而数据的分析则可以帮助我们从众多指标中筛选出与器械效应相关的变量,进行更加深入的统计推断。

医学统计学方法可以针对不同类型的数据进行分析,包括计量数据和分类数据等。

常见的统计分析方法包括描述性统计、参数检验、方差分析、生存分析等。

通过这些方法的应用,可以对试验数据进行多角度的分析,发现结果的内在规律和特点。

四、结果与解释医学统计学方法在试验结果的解释中发挥着重要作用。

根据试验的设计和数据分析结果,我们可以判断器械的疗效、副作用和安全性等方面的指标。

样本量估计及其在nQuery和SAS软件上的实现——相关分析(二)

样本量估计及其在nQuery和SAS软件上的实现——相关分析(二)

);
/ *如有错误,跳出循环* /
data a;
if( error = 1 ) then stop;
r0 — &r0 ; r1 — &r1 ; alpha — &alpha; m — &m; power
power = 0; n = 2;
—&power/100;
do while (power < &power);
,r0 = / *已知总体的Cronbach a系数* / ,r1 = / *预期总体的Cronbach a系数* / , k = / * 量表条目数* / , power = / * 检验效能( % ) * /
); data a; r0 = &r0 ; r1 = &r1 ; alpha = &alpha; k = &k; side = &side ; power = &power/100 ; / * 输出错误信息* /
・476・
-专题研究-
中国卫生统计2021年6月第38卷第3期
样本量估计及其在nQuery和SAS软件上的实现* ——相关分析(二)
南方医科大学公共卫生学院生物统计学系(510515)钱晨坚吴研鹏段重阳陈平雁△
【 中图分类号】 C81
【 文献标识码】 A
DOI 10. 3969/j. issn. 1002 - 3674. 2021.03.043
/ * r0 > r1* /
・477・
if( r0 > r1) then power = 100 * (PROBF (c * f2,
n -1,( k-1) * (n-1))); if( power > = &power) then leave; else n = n + 1 ; end; power = round( power,0. 01 ) ; run; / * 结果输出 * /

临床试验中样本量确定的统计学考虑_陈平雁

临床试验中样本量确定的统计学考虑_陈平雁
中国卫生统计 2015 年 8 月第 32 卷第 4 期
· 727·
· 专家共识 ·
临床试验中样本量确定的统计学考虑
CCTze determination ) , 又称样本 量估计( sample size estimation ) , 是指为满足统计的准 确性和可靠性 ( I 类错误的控制和检验效能的保证 ) 计 算出所需的样本量, 它是临床试验设计中一个极为重 要的环节, 直接关系到研究结论的可靠性、 可重复性, 以及研究效率的高低。 样本量估计也是一个成本效 果和检验效能的权衡过程。 ICH E9 ( 1998 ) 指出, 临 床试验的样本量必须足够大, 以可靠地回答研究假设 ; 所提出的相关问题 同时又不至于太大而造成浪费。 样本量的估计方法应该在研究方案中详细阐述 , 包括 计算样本量所依据的参数, 如方差、 均数、 反应率、 阳性 事件发生率、 差值等。本文适用于确证性试验。 样本量估计需考虑的主要因素 在确定临床研究的目的之后, 首先考虑试验设计, 包括对照的选择 ( 如 标 准 对 照、 阳 性 对 照、 安慰剂对 照、 剂量对照等) 、 比较类型 ( 如优效性试验、 非劣效性 试验、 等效性试验 ) 、 设计类型 ( 如平行设计、 交叉设 计、 析因设计、 成组序贯设计等 ) 、 主要指标 ( 定量、 定 生存时间 ) 等; 其次考虑统计分析方法, 并提出效 性、 应量( effect size ) 的假定; 然后根据试验特点定义统计 特征, 如统计分布、 检验水准( significant level ) 、 检验效 能( power) 、 单双侧和分配比例等; 再应用正确的样本 试验中的 量估计方法计算出样本量; 最后根据协变量、 脱落率、 剔除率和依从性等具体情况进行适当调整 。 1. 研究目的与试验设计 ( 1 ) 研究目的 就临床试验而言, 在确证性研究中研究目的主要 体现在有效性评价和安全性评价两个方面 。样本量估 计常用于有效性评价。 ( 2 ) 比较类型及其检验假设 临床试验常用的比较类型有优效性试验 ( superiority trial) 、 等效性试验( 包括生物等效性试验) ( equivalence trial ) 、 inferiority trial ) 等。 非 劣 效 性 试 验 ( non下面以两组效应量为均数的正向指标比较为例 , 设定

《药物临床试验设计与实施丛书:临床试验统计学》札记

《药物临床试验设计与实施丛书:临床试验统计学》札记

《药物临床试验设计与实施丛书:临床试验统计学》阅读札记目录一、内容概要 (2)二、基础概念与知识 (2)1. 临床试验统计学概述 (4)1.1 定义与重要性 (5)1.2 临床试验统计学的发展历程 (6)2. 数据类型与变量类型 (7)2.1 定量数据与定性数据 (9)2.2 变量类型及其特点 (10)三、临床试验设计原则 (11)1. 试验设计基本原则 (12)1.1 随机化原则 (13)1.2 对照原则 (14)1.3 重复原则 (16)2. 试验类型选择 (17)2.1 临床试验与观察性研究 (18)2.2 各类试验设计的优缺点及适用场景 (20)四、数据收集与处理方法 (22)1. 数据收集过程 (23)1.1 数据来源及采集方式 (25)1.2 数据采集的注意事项 (26)2. 数据预处理 (27)2.1 数据清洗 (29)2.2 数据转换与填充 (30)3. 缺失值处理策略 (32)五、统计分析方法与技巧 (34)1. 描述性统计分析 (35)1.1 数据的描述与展示 (37)1.2 数据分布特征分析 (38)2. 推论性统计分析 (39)2.1 假设检验基本原理 (40)2.2 置信区间与假设检验的应用实例 (41)一、内容概要《药物临床试验设计与实施丛书:临床试验统计学》为我们全面揭示了临床试验统计学的重要性和应用。

统计学作为一门研究随机现象和不确定性规律的科学,为临床试验提供了严谨的设计、实施、分析及结果解读的方法。

本书内容丰富,共分为七章。

第一章为临床试验概述,介绍了药物临床试验的基本概念、分类及目的;第二章阐述试验设计的基本原则与要素,包括随机化、盲法、对照等;第三章重点讲解了数据管理与统计分析,包括数据收集、处理。

本书以实用性强、案例分析为主线,通过深入浅出的方式,帮助读者更好地理解和掌握临床试验统计学的理论与实践。

在阅读过程中,我们可以感受到统计学在药物临床试验中的重要性,以及它在保障药物安全有效、促进医学发展方面的巨大作用。

临床试验中的研究设计与样本规模确定

临床试验中的研究设计与样本规模确定

临床试验中的研究设计与样本规模确定临床试验是评估新药物、治疗方法或医疗器械安全性和有效性的重要手段。

在进行临床试验时,科学合理的研究设计和恰当的样本规模确定对于保证试验可靠性和结果的可推广性至关重要。

本文将重点探讨临床试验中的研究设计和样本规模的确定原则和方法。

一、研究设计的选择在临床试验中,我们可以选择多种不同的研究设计,包括随机对照试验、非随机对照试验、单臂试验等。

在选择研究设计时,我们应该考虑到研究目的、研究对象的特点以及研究资源的限制等因素。

随机对照试验是临床试验中最常用的研究设计之一。

在随机对照试验中,研究对象会被随机分配到治疗组和对照组,以比较不同治疗干预的效果。

这种设计可以有效地控制混杂因素的影响,提高试验结果的可靠性。

非随机对照试验则没有使用随机分组的方法,而是按照医生或患者的选择将研究对象分配到不同的组别。

这种设计适用于某些特定的研究场景,例如研究罕见疾病或特定人群时,由于样本数量有限,很难进行随机分组。

单臂试验是一种没有对照组的试验设计,通过与历史数据或文献报道进行比较,评估不同治疗干预的效果。

单臂试验适用于某些情况下,例如研究某种新治疗方法的中期或后期效果。

二、样本规模的确定样本规模的确定是临床试验中一个关键的问题,直接关系到试验结果的准确性和推广性。

样本规模的确定需要考虑到多个因素,包括研究目的、预期效应大小、显著水平和统计功效等。

在进行样本规模计算时,我们需要首先确定试验的主要研究目的是什么,是为了评估治疗效果、副作用还是其他方面的指标。

不同的研究目的会需要不同的指标和统计方法来进行样本规模计算。

预期效应大小是指预计观察到的差异大小。

在进行样本规模计算时,我们需要估计治疗组和对照组之间预期的效应大小。

这可以通过之前的研究结果、经验或专家意见来进行估计。

显著水平是指拒绝零假设的标准。

我们通常将显著水平设定为0.05或0.01。

统计功效是指在观察到真实效应时能够拒绝零假设的概率,通常将统计功效设定为0.8或0.9。

药物临床试验样本量估计指导原则

药物临床试验样本量估计指导原则

药物临床试验样本量估计指导原则(试行)2024年12月目 录 一、 概述 (3)二、 样本量估计的主要考虑 (3)(一) 试验设计 (4)(二) 检验水准及检验效能 (6)(三) 统计分析方法 (7)1. 数据分布假设 (8)2. 统计分析模型假设 (8)(四) 预期治疗效应及变异 (9)三、 样本量调整 (10)(一) 样本量调整的原则 (10)(二) 样本量调整的情形 (13)1. 基于外部数据的调整 (13)2. 基于内部数据的调整 (13)四、 其他 (16)(一) 试验实施过程中的考虑 (16)(二) 基于贝叶斯方法的样本量估计 (16)(三) 基于其他目的的样本量估计 (17)(四) 样本量的敏感性计算 (17)(五) 样本量重新估计与其他适应性设计的结合 (17)(六) 与监管机构的沟通 (18)五、 参考文献 (19)附录1 名词解释 (21)附录2 中英文词汇对照 (23)药物临床试验样本量估计指导原则(试行)一、概述样本量估计,又称样本量确定,是药物临床试验设计的重要组成部分,也是确保研究具有合理性、准确性、可靠性、完整性和科学性的重要手段。

通常,临床试验的样本要有充分的代表性,纳入的样本量必须足够大,以可靠地回答研究假设所针对的目标人群的临床问题。

对于药物临床试验,当样本量估计相关参数设置缺乏依据或依据不充分时,会为样本量估计带来不确定性,增大试验失败的风险等。

另外,若试验中样本量调整的方法不当或操作不当则会导致总I类错误率(FWER)膨胀、破坏试验完整性及引入偏倚等方面的问题。

为指导申办者进行科学合理的样本量估计,本指导原则主要阐述基于统计假设进行样本量估计时的参数设置和样本量调整等的基本考虑。

本指导原则适用于以注册为目的的确证性临床试验。

二、样本量估计的主要考虑对于临床试验所要回答的科学问题,统计学主要根据估计目标对应的研究假设提出统计假设,通过假设检验进行推断。

样本量估计一般依据主要估计目标,原则上应保证整体检验在控制FWER的同时并具有足够的检验效能。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1 - β = probt t1 - α + 1) - 2, -2,

rn A δ2 ( r + 1 ) σ2 ( 8)
)
生存分析的样本量估计虽然有其特殊之处 , 但上 述原理同样适用。以基于指数分布假设的生存分析数 据为例, 令病例入组时间 ( accrual period ) 为 AT, 试验 up peri时间全长 ( total time ) 为 TT, 随访时间 ( followod) 为 TTAT。假设第 i 组第 j 个病人生存时间 t ij 服从 风险率 ( hazard rate ) 为 λ i 的指数分布, 第 i 组的失访 率服从风险率为 η i 的指数分布, 入组时间 z ij 服从在 AT 处截 断 的 指 数 分 布, 其概率 密 度 函 数 为 g ( z) =
· 728·
Chinese Journal of Health Statistics, Aug. 2015 , Vol. 32 , No. 4
临床试验的样本量通常依据对主要指标做出相应 III 期临床试验中主要指 的假定后进行估计的。在 II、 标一般是有效性评价指标, 上市后的 IV 期临床试验主 要指标可以是有效性评价指标, 也可以是安全性评价 或兼而有之。 如果样本量估计应同时依据主要 指标, 有效性指标和主要安全性指标, 在设计时应针对有效 性和安全性分别提出统计假设, 逐一计算样本量, 最终 样本量取其中最大者。主要指标应在研究方案中明确 定义, 通常需根据专业知识确定, 应是专业领域具有共 识的或认可程度较高的指标, 一般源于某一标准或指 南, 或源于专业领域公开发表的权威论著或专家共识 等。主要指标不宜太多, 一般只有一个。 当主要指标 有多个时, 样本量估计要考虑假设检验的多重性问题 。 在定义主要指标过程中, 不仅要说明指标的含义, 其测量时点、 测量手段以及计算方法都应注明。 指标 的类型要明确, 这一点非常重要, 因为样本量估计和数 据分析都需要依此进行。例如, 某些指标可以有定量、 定性( 如有效和无效 ) 、 等级 ( 如痊愈、 显效、 有效、 无 效) 、 生存时间等不同类型。 对应于指标的不同类型, 样本量估计方法亦不相同。 所以, 方案中对主要指标 的定义要具体到指标类型上。 3. 效应量 效应量是样本量估计所需的最重要参数之一 , 根 据不同的指标类型, 常见的效应量有: 均数的组间差值 HR ) 、 OR , 或标准化差值, 率的组间差值或比值( RR 、 或 相关系数、 回归系数等。 效应量参数的确定主要基于下述三种途径 : ( 1 ) 本项目的任何既往研究结果。即源于同一项 目的预试验、 探索性试验( I 期或 II 期临床试验) 、 单中 心试验的结果等作为确定参数的依据 。由于此类研究 结果属于内部证据, 因此是首选途径。 ( 2 ) 基于他人的研究结果。当本项目的先前研究 无法提供确切的参数数据, 或尚未开展研究时, 参数的 确定可以以公开发表的研究结果作为依据 。由于此类 研究结果属外部证据, 因此是次选途径。 若公开发表 最好是经 meta 分析所得合 的同类研究报道不止一个, 并效应量作为样本量估计的参数 。 ( 3 ) 基于本试验的预期结果。如果本试验没有任 何之前的研究结果可以借鉴 ( 无论是自己的还是他人 或以往的研究数据不能得到本试验设计所需的 的) , 参数( 如本试验采用交叉设计, 而以往研究数据均来 ) , 自两平行组设计的研究 可以用预期的形式进行预 设, 通常以广义效应量表达。 若对试验药物或器械有 充足信心, 则预期效应量较大( 如设为 0. 8 ) , 此时所需 样本量较小。若对试验药物或器械信心不足, 则预期 效应量较小 ( 如设为 0. 2 ) , 此时所需样本量较大。 若 对试验药物或器械的信心尚可, 则预期效应量为中等
中国卫生统计 2015 年 8 月第 32 卷第 4 期
· 727·
· 专家共识 ·
临床试验中样本量确定的统计学考虑
CCTS 工作组 陈平雁( 执笔)
样本量确定( sample size determination ) , 又称样本 量估计( sample size estimation ) , 是指为满足统计的准 确性和可靠性 ( I 类错误的控制和检验效能的保证 ) 计 算出所需的样本量, 它是临床试验设计中一个极为重 要的环节, 直接关系到研究结论的可靠性、 可重复性, 以及研究效率的高低。 样本量估计也是一个成本效 果和检验效能的权衡过程。 ICH E9 ( 1998 ) 指出, 临 床试验的样本量必须足够大, 以可靠地回答研究假设 ; 所提出的相关问题 同时又不至于太大而造成浪费。 样本量的估计方法应该在研究方案中详细阐述 , 包括 计算样本量所依据的参数, 如方差、 均数、 反应率、 阳性 事件发生率、 差值等。本文适用于确证性试验。 样本量估计需考虑的主要因素 在确定临床研究的目的之后, 首先考虑试验设计, 包括对照的选择 ( 如 标 准 对 照、 阳 性 对 照、 安慰剂对 照、 剂量对照等) 、 比较类型 ( 如优效性试验、 非劣效性 试验、 等效性试验 ) 、 设计类型 ( 如平行设计、 交叉设 计、 析因设计、 成组序贯设计等 ) 、 主要指标 ( 定量、 定 生存时间 ) 等; 其次考虑统计分析方法, 并提出效 性、 应量( effect size ) 的假定; 然后根据试验特点定义统计 特征, 如统计分布、 检验水准( significant level ) 、 检验效 能( power) 、 单双侧和分配比例等; 再应用正确的样本 试验中的 量估计方法计算出样本量; 最后根据协变量、 脱落率、 剔除率和依从性等具体情况进行适当调整 。 1. 研究目的与试验设计 ( 1 ) 研究目的 就临床试验而言, 在确证性研究中研究目的主要 体现在有效性评价和安全性评价两个方面 。样本量估 计常用于有效性评价。 ( 2 ) 比较类型及其检验假设 临床试验常用的比较类型有优效性试验 ( superiority trial) 、 等效性试验( 包括生物等效性试验) ( equivalence trial ) 、 inferiority trial ) 等。 非 劣 效 性 试 验 ( non下面以两组效应量为均数的正向指标比较为例 , 设定
水平( 如设为 0. 5 ) , 此时所需样本量也是中等大小。 此外, 对于单臂设计或配对双臂设计, 若涉及标准 其途径的优先顺序大致 对照参数( 或目标值) 的确定, 为国际标准、 国家标准、 行业标准 ( 含指南等 ) 、 被权威 机构认可的企业标准、 外部证据 ( 同类研究的综合结 果, 如 meta 分析结果) 。 4. 统计特征 样本量估计需要考虑的统计特征主要有统计分 布、 检验水准、 检验效能、 单双侧和平衡与否等。 统计分布: 样本量估计方法的选择与主要指标的 统计分布假定密切相关, 基于正态分布的假定会选择 参数方法, 基于非正态分布的假定会选择非参数方法 。 同样, 生存分析的样本量估计方法会因 Weibull 分布 族的假定有所不同。 检验水准: 检验水准也就是 I 类错误概率, 用α表 示, 以双侧 0. 05 的水准最为常用。对于优效性检验设 以及等效性或非劣效性检验 定单侧 α = 0. 025 的情形, 设定双单侧的 α = 0. 025 的情形, 其本质仍然是双侧 0. 05 的检验水准。 但在某些情况下检验水准的设定 会有所不同。例如, 为控制整体 I 类错误概率 α, 涉及 每次检验的名义 多重检验时( 如定义多个主要指标 ) ,
*
中国卫生统计 2015 年 8 月第 32 卷第 4 期
· 729·
样本量估计原理和方法 1. 样本量估计原理 样本量估计的方法通常是从检验统计量计算公式 反推而来。一般地, 统计推断的效应量可认为是给定 模型参数 θ 的函数 f( θ) , 用 T 表示 f( θ) 的一个无偏估 若数据来自正态分布, 或根据中心极限定 计统计量, 理, 有 T - f( θ) Var( T) 槡 N( 0 , 1) ( 1)
中国临床试验生物统计学组成员 ( 按姓名拼音排序 ) : 陈峰、 陈平雁、 陈 启光、 贺佳、 黄钦、 金丕焕、 李康、 李宁、 李卫、 李晓松、 凌莉、 刘玉秀、 苏炳 华、 孙高、 王武保、 王彤、 魏朝晖、 夏结来、 姚晨、 易东、 尹平、 于 浩、 张罗 漫、 赵耐青。
优效、 等效和非劣效的界值为 Δ , 说明它们的检验假设 与推断结论。 优效性试验: 试验的目的是验证试验组效应是否 优于对照组, 如果研究不设定优效界值, 其检验假设 为: H0 : μ T = μ C ; H1 : μ T ≠ μ C 。 珔 珔 可推断试验组疗效优于对照 若 P ≤α, 且X T > XC , μ T 和 μ C 分别代表试验组和对照组的总体 组。这里, 珔 珔 X 均数, T 和 X C 分别代表试验组和对照组的样本均数 。 如果研究设定优效界值为 Δ ( Δ > 0 , 下同 ) , 即强 优效, 则检验假设为: H0 : μ T - μ C ≤ Δ ; H1 : μ T - μ C > Δ 。 此时, 若 P ≤α, 则可推断试验组疗效优于对照组 。 : 等效性试验 试验的目的是验证试验组效应是否 与对照组相当。 如果研究设定等效界值 Δ , 其检验假 设为: H0 : μ T - μ C ≤ - Δ 或 μ T - μ C ≥ Δ ; H1 : - Δ < μ T - μ C < Δ 。 这是上下限相同的情况。如果下限 Δ1 与上限 Δ2 不同, 则检验假设为: H0 : μ T - μ C ≤ - Δ 1 或 μ T - μ C ≥ Δ 2 ; H1 : - Δ 1 < μ T - μ C < Δ 2 。 此时, 若 P ≤ α, 则可推断试验组疗效等效于对照 组。 非劣性试验: 试验的目的是验证试验组效应是否 非劣于对照组。 如果研究设定非劣效界值 Δ , 其检验 假设为: H0 : μ T - μ C ≤ - Δ ; H1 : μ T - μ C > - Δ 。 此时, 若 P ≤ α, 则可推断试验组疗效非劣于对照 组。 ( 3 ) 设计类型 临床试验的设计模型相对比较简单, 常用的有平 行设计、 交叉设计、 析因设计、 序贯设计、 群随机设计和 适应性设计等。有关这些设计的详细介绍可参考相关 文献。 2. 主要指标
相关文档
最新文档