临床循证研究方法学(第五讲科学估算样本量)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
6
1.1、样本估量的基本条件
在各种临床科研设计方法的样本含量估计中,需要事 先确定的参数有:
1、I型错误率α。即假设检验出假阳性结果的发生概率
2、II型错误率β。即假设检验出假阴性结果的发生概率
3、拟检出的最小效应量(容许误差或差值)δ,一般通 过文献复习或预试验,在设计之初由研究者根据研究 目的和专业知识加以确定。
本率超过与位于0.3-0.7(0.2-0.8)范围不同,t 检验与u检验不同等。
13
➢ 2、考虑统计方法
➢ 样本量的估计还要与以后将要使用的统计方 法的条件相结合。如单因素分析、相关与回 归、多因素分析等。
➢ 目前样本含量估计的公式计算主要针对单因 素分析,而多因素分析的例数估计请参考有 关书籍
14
率等率之差。
10
➢ (4)确定总体标准差σ或总体率π
➢ 若研究的终点指标为数值变量时,总体标准差σ 为估计样本含量所必须的条件。
➢ 若研究的终点指标为分类变量时,有时,总体率 π为估计样本含量条件。
➢ 若总体标准差σ和总体率π,常常通过文献检索、 预试验或对研究作出合理的假设来获得。
11
➢ 除了基本量估算的基本条件(基本要素)。 ➢ 进一步结合研究目的、指标性质、假设检验类型及
3
➢ 为什么要估算样本量? ➢ 理论上,验证某一干预措施与对照之间的差
异,样本量越大,试验结果越接近于真实值, 即结果越可靠。 ➢ 大样本试验还有助于探讨亚组疗效,发现罕 见结局。 ➢ 临床试验报告中有无预先的样本量估计是评 价试验质量的重要依据之一。
4
➢ 试验样本量过小,无论试验结果是否存在差 异,均不能排除因机遇(随机误差)造成的 假阳性或假阴性错误。
17
➢ 6、多指标估算 ➢ 若某研究有多个效应指标,其样本含量估计应
对每个效应指标进行样本量的估计,然后取样 本数量最大者为其研究的样本量。 ➢ 若某研究能区分主要指标和次要指标时,也可 以只对主要指标进行样本含量估计,然后取量 大者为其研究的样本含量。
18
➢ 7.组间例数相等 成组设计的例数,应尽可能采用例数相
验效能(Power)与样本量间的变换曲线。
16
Βιβλιοθήκη Baidu
➢ 5.适当扩大样本量
由于估算的样本含量是能检测出差别的 最小样本量,考虑到受试者可能有不合作者、 中途失访、意外死亡等情况出现,而减少有 效观察对象的例数(失访),因此,应按照 一定失访率适当扩大样本量。
➢ 一般要求在样本量估计值的基础上增加 10%—20%。
➢ 3.样本来源的可行性和可及性 特别是考虑有无人力、时间和经费等方
面的限制。
15
➢ 4.容许误差值δ的约定
在计算样本含量之前,一定要明确欲检 测有临床意义的值/差值及其表达方式。
➢ 容许误差值δ既可为置信区间的1/2宽度,
也可以是能检出的有临床意义的差值。
➢ 不能确定δ时,需要敏感性分析,即绘制检
➢ 样本量过少:结果不稳定,检验效能过低, 结论缺乏充分依据。
➢ 样本量过大:增加临床研究难度,造成人力、 无力、时间和经济上的浪费,伦理问题,一 些临床意义不大的微弱疗效最终也可能会出 现统计学上的显著差异。
5
➢ 估计样本含量的目的: 在保证某个临床试验/临床研究的结论 具有一定科学性、真实性和可靠性前 提下,确定某研究所需的最小观察样 本量。
4、总体标准差σ或总体率π。一般通过文献复习或预试 验,亦可作合理的假设得到。
➢ 若终点指标为数值变量时,需要研究者确定总体标准差σ。 ➢ 若终点指标为分类变量时,有时需要研究者确定总体率π。
7
➢ (1)确定I型错误率α
➢ 所有样本含量估计公式中,都需要uα的值,研究者 确定检验水准(α)的大小后,查表得uα值。
20
➢ 9、临床试验样本量按规定执行 对于临床试验,特别是新药临床试验样本量
估计必须执行有关规定。例如:
一期 人体药理学研究,受试者为健康志愿者,需要20至30例
二期 探索治疗作用,受试者为患者,试验组和对照组均≧100例
三期 疗效证实试验,受试者为患者,试验组不少于300例 四期 新药上市后监测,受试者为患者,开放试验应在2000例以上
➢ β为第二类误差的概率,β值越小,检验效率越高,
所需样本量也就越大,通常β=0.1或β=0.2。一般认
为检验效率不能小于0.7。
9
(3)确定容许误差或差值δ
即有临床意义或研究意义的最小差值。 ➢ 若为数值变量时,δ可为有临床意义的均数差值、
实验前后之差等。 ➢ 若为分类资料, δ可为有临床意义的有效率、患病
临床循证研究的方法学
第五讲 科学估算样本量
(第十七章)科学估算样本量
1 概述 2 基于数值变量资料的样本量估计 3 基于无序分类资料的样本量估计 4 其他常见类型的样本量估计
2
第一节 概述
➢ 样本量(Sample)的估计是临床研究科学设 计的重要内容。
➢ 可重复性原则,是指任何科学研究必须遵守 的原则,其目的是要排除偶然因素的影响, 得出科学的、真实的、规律性的结论。
➢ α有单侧与双侧之分,单侧α的uα小于双侧uα值,
所以按单侧计算的样本量小于双侧。 ➢ α越小所需样本量越大,反之越小,一般取α ≤0.05
8
➢ (2)确定II型错误率β
➢ 样本含量计算中,需要uα的值,即研究者确定β大 小后,查表的uα值。
➢ 确定β大小,主要是要确定检验效能(Power),用 1-β表示其概率的大小,检验效能是指总体间确有差 别时,假设检验能发现这种差别的能力大小。
等的设计,尤其是多组设计时,一般要求各 组间的样本含量相等,只有在某些特殊情况 下才考虑各组的样本含量不相等。
19
➢ 8、校正样本含量——分层整群抽样时 由有些临床研究的抽样单元不是个体研
究对象,而是以一组个体为研究单位(如家 庭、班级、村、工作单位等),整体抽样的 优势在于易于管理 ,能减少沾染和提高依 从性,但同时增大了抽样误差,需要较大样 本量。
单双侧检验等加以灵活运用。 ➢ 假设检验类型不同,样本量也有所变化。如临床试
验中两组率或均数进行比较,检验目的可分为显著 性检验、优效检验、非劣效检验和等价性检验。
12
1.2.样本量估计的注意事项
➢ 1、根据研究目的,严格选择估算样本含量的 方法,如单、双侧不同,估计参数与假设检 验不同,一般假设检验与等价检验不同,样
1.1、样本估量的基本条件
在各种临床科研设计方法的样本含量估计中,需要事 先确定的参数有:
1、I型错误率α。即假设检验出假阳性结果的发生概率
2、II型错误率β。即假设检验出假阴性结果的发生概率
3、拟检出的最小效应量(容许误差或差值)δ,一般通 过文献复习或预试验,在设计之初由研究者根据研究 目的和专业知识加以确定。
本率超过与位于0.3-0.7(0.2-0.8)范围不同,t 检验与u检验不同等。
13
➢ 2、考虑统计方法
➢ 样本量的估计还要与以后将要使用的统计方 法的条件相结合。如单因素分析、相关与回 归、多因素分析等。
➢ 目前样本含量估计的公式计算主要针对单因 素分析,而多因素分析的例数估计请参考有 关书籍
14
率等率之差。
10
➢ (4)确定总体标准差σ或总体率π
➢ 若研究的终点指标为数值变量时,总体标准差σ 为估计样本含量所必须的条件。
➢ 若研究的终点指标为分类变量时,有时,总体率 π为估计样本含量条件。
➢ 若总体标准差σ和总体率π,常常通过文献检索、 预试验或对研究作出合理的假设来获得。
11
➢ 除了基本量估算的基本条件(基本要素)。 ➢ 进一步结合研究目的、指标性质、假设检验类型及
3
➢ 为什么要估算样本量? ➢ 理论上,验证某一干预措施与对照之间的差
异,样本量越大,试验结果越接近于真实值, 即结果越可靠。 ➢ 大样本试验还有助于探讨亚组疗效,发现罕 见结局。 ➢ 临床试验报告中有无预先的样本量估计是评 价试验质量的重要依据之一。
4
➢ 试验样本量过小,无论试验结果是否存在差 异,均不能排除因机遇(随机误差)造成的 假阳性或假阴性错误。
17
➢ 6、多指标估算 ➢ 若某研究有多个效应指标,其样本含量估计应
对每个效应指标进行样本量的估计,然后取样 本数量最大者为其研究的样本量。 ➢ 若某研究能区分主要指标和次要指标时,也可 以只对主要指标进行样本含量估计,然后取量 大者为其研究的样本含量。
18
➢ 7.组间例数相等 成组设计的例数,应尽可能采用例数相
验效能(Power)与样本量间的变换曲线。
16
Βιβλιοθήκη Baidu
➢ 5.适当扩大样本量
由于估算的样本含量是能检测出差别的 最小样本量,考虑到受试者可能有不合作者、 中途失访、意外死亡等情况出现,而减少有 效观察对象的例数(失访),因此,应按照 一定失访率适当扩大样本量。
➢ 一般要求在样本量估计值的基础上增加 10%—20%。
➢ 3.样本来源的可行性和可及性 特别是考虑有无人力、时间和经费等方
面的限制。
15
➢ 4.容许误差值δ的约定
在计算样本含量之前,一定要明确欲检 测有临床意义的值/差值及其表达方式。
➢ 容许误差值δ既可为置信区间的1/2宽度,
也可以是能检出的有临床意义的差值。
➢ 不能确定δ时,需要敏感性分析,即绘制检
➢ 样本量过少:结果不稳定,检验效能过低, 结论缺乏充分依据。
➢ 样本量过大:增加临床研究难度,造成人力、 无力、时间和经济上的浪费,伦理问题,一 些临床意义不大的微弱疗效最终也可能会出 现统计学上的显著差异。
5
➢ 估计样本含量的目的: 在保证某个临床试验/临床研究的结论 具有一定科学性、真实性和可靠性前 提下,确定某研究所需的最小观察样 本量。
4、总体标准差σ或总体率π。一般通过文献复习或预试 验,亦可作合理的假设得到。
➢ 若终点指标为数值变量时,需要研究者确定总体标准差σ。 ➢ 若终点指标为分类变量时,有时需要研究者确定总体率π。
7
➢ (1)确定I型错误率α
➢ 所有样本含量估计公式中,都需要uα的值,研究者 确定检验水准(α)的大小后,查表得uα值。
20
➢ 9、临床试验样本量按规定执行 对于临床试验,特别是新药临床试验样本量
估计必须执行有关规定。例如:
一期 人体药理学研究,受试者为健康志愿者,需要20至30例
二期 探索治疗作用,受试者为患者,试验组和对照组均≧100例
三期 疗效证实试验,受试者为患者,试验组不少于300例 四期 新药上市后监测,受试者为患者,开放试验应在2000例以上
➢ β为第二类误差的概率,β值越小,检验效率越高,
所需样本量也就越大,通常β=0.1或β=0.2。一般认
为检验效率不能小于0.7。
9
(3)确定容许误差或差值δ
即有临床意义或研究意义的最小差值。 ➢ 若为数值变量时,δ可为有临床意义的均数差值、
实验前后之差等。 ➢ 若为分类资料, δ可为有临床意义的有效率、患病
临床循证研究的方法学
第五讲 科学估算样本量
(第十七章)科学估算样本量
1 概述 2 基于数值变量资料的样本量估计 3 基于无序分类资料的样本量估计 4 其他常见类型的样本量估计
2
第一节 概述
➢ 样本量(Sample)的估计是临床研究科学设 计的重要内容。
➢ 可重复性原则,是指任何科学研究必须遵守 的原则,其目的是要排除偶然因素的影响, 得出科学的、真实的、规律性的结论。
➢ α有单侧与双侧之分,单侧α的uα小于双侧uα值,
所以按单侧计算的样本量小于双侧。 ➢ α越小所需样本量越大,反之越小,一般取α ≤0.05
8
➢ (2)确定II型错误率β
➢ 样本含量计算中,需要uα的值,即研究者确定β大 小后,查表的uα值。
➢ 确定β大小,主要是要确定检验效能(Power),用 1-β表示其概率的大小,检验效能是指总体间确有差 别时,假设检验能发现这种差别的能力大小。
等的设计,尤其是多组设计时,一般要求各 组间的样本含量相等,只有在某些特殊情况 下才考虑各组的样本含量不相等。
19
➢ 8、校正样本含量——分层整群抽样时 由有些临床研究的抽样单元不是个体研
究对象,而是以一组个体为研究单位(如家 庭、班级、村、工作单位等),整体抽样的 优势在于易于管理 ,能减少沾染和提高依 从性,但同时增大了抽样误差,需要较大样 本量。
单双侧检验等加以灵活运用。 ➢ 假设检验类型不同,样本量也有所变化。如临床试
验中两组率或均数进行比较,检验目的可分为显著 性检验、优效检验、非劣效检验和等价性检验。
12
1.2.样本量估计的注意事项
➢ 1、根据研究目的,严格选择估算样本含量的 方法,如单、双侧不同,估计参数与假设检 验不同,一般假设检验与等价检验不同,样