样本量估算的统计学方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4、1987年某产科医师为研究胎次与儿童智力的关
系,收集病案资料 (考上大学人数):第一胎19人、 第二胎18人、第三胎10人、第四胎7人、第五胎4 人。由此得出结论:智力与胎次有关,胎次愈多 智力愈差,第一胎智力最好。 n = ?
1、重复原则“即样本量”
Ø
样本含量(Sample)的估计是临床研究 科学设计的重要内容。
Ø
α有单侧与双侧之分,单侧α的uα小于双侧uα
值,所以按单侧计算的样本含量小于双侧。
Fra Baidu bibliotek
Ø
α 越小所需样本含量越大,反之越小,一般 取α =0.05
(2)确定第二类误差的概率β
Ø
样本含量计算中,需要uα的值,即研究者确定β 大小后,查表的uα值。 确定β大小,主要是要确定检验效能 (Power),用1β表示其概率的大小,检验效 能是指总体间确有差别时,假设检验能发现这 种差别的能力大小。
6、校正样本含量
Ø
由于估算的样本含量是最少需要量,考虑到 受试者可能有不合作者、中途失访、意外死 亡等情况出现,而减少有效观察对象的例数 (失访),因此,应该在估算的样本含量增 加若干样本例数。
Ø
通常,失访人数不得大于20%。
四、样本含量估计的 注意事项
1.组间例数相等
Ø
成组设计的例数,应尽可能采用例数相等 的设计,尤其是多组设计时,一般要求各 组间的样本含量相等,只有在某些特殊情 况下才考虑各组的样本含量不相等。
u0 . 10
计算结果
例数不相等
实例分析(例数不等)
Ø
某医院研究吲螨酰胺治疗原发性高血压的疗 效,经预试验得治疗前后舒张压差值(kPa)资 料如下,若α=0.05, β=0.10时需治疗多少例? 均数 2.28 1.32 标准差 1.09 0.40
吲螨酰胺 安慰剂
计算结果
试验组:18 + 18×0.2≈22(例) 试验组:13 + 13×0.2≈16(例)
2.多指标估算
Ø
若某研究有多个效应指标,其样本含量估计应对 每个效应指标进行样本量的估计,然后取样本数 量最大者为其研究的样本量。
Ø
若某研究能区分主要指标和次要指标时,也可以 只对主要指标进行样本含量估计,然后取量大者 为其研究的样本含量。
3.多种估计条件
Ø
尽可能将多样本含量估计方法联合使用,并且 在使用计算法估算时,可多做几种估算方案, 以便选择。
d
2 ( 1 + 1 )( 1 . 6449 + 1 . 2816 ) ( 0 . 6676 )( 1 - 0 . 6676 ) 0 . 7 = 2 0 . 2 = 115 . 4
计算结果
样本含量与统计分析特例
Ø
1、分子、细胞、组织水平的研究:专业判定样 本含量,不计算、不必假设检验。 2、药物临床试验:就高不就低。 3、特小样本:报告绝对数,如“治疗5人,治 愈4人”。 4、特大样本:专业上判定,不作假设检验(不 适用)。 5、检验效能:要用调和均数
Ø
Ø
任务3—检验总体差别
例:某2个总体指标相同 ? (把握度 = 概率分布面积)
Ø
数据:计数 (正态近似法u, 卡方),计量 (均 数检验),等级 (秩和检验) 分布:正态 (u, t),对数正态 (lg值t检验),偏 态 (秩和检验) 对比:组间比较 (u, t, H ),与总体比较 (u, t, H)
Ø Ø
Ø
Ø
六、分类变量的样本 含量估计简介
两个率比较的估算
实例分析(例数相等)
Ø
用旧的治疗方案治疗慢性肾炎的控制率为 30%,现用新的治疗方案治疗慢性肾炎,其控 制率应大于50%才有临床意义,若取两组例数 相等,且α=0.05、 β=0.10(power=0.9),问 每组需多少例数?
n=
2 2 ( ma + m b ) p ( 1 - p )
Ø
Ø
β为第二类误差的概率,β值越小,检验效率越 高,所需样本量也就越大,通常β=0.1或β=0.2。
一般认为检验效率不能小于0.7。
(3)确定容许限或插座δ
即有临床意义或研究意义的最小差值。
Ø
若为数值变量时,δ可为有临床意义的均数 差值、实验前后之差等。
Ø
若为分类资料, δ可为有临床意义的有效率、 患病率等率之差。
任务1—描述样本数据特性
例:某样本个体分布的集中趋势与离散趋势怎样 ? (1v点,2v线,3v影子_线)
Ø Ø
数据:计数(%),定量(Average),等级(M, Ridit) 分布:正态 (Mean±SD,95%CR),对数正态(G),偏 态 (M, Q/R,P ~ P ) ,相关回归 (r, b) 2.5 97.5 对比:两组对比 (各组Mean±SD ),配对比较 (差值 的Mean±SD)
实例分析(例数不等)
Ø
某医师研究某药对产后宫缩痛、外阴创伤痛 效果,预试验旧药镇痛率为55%,新药镇痛 率为75%,当α=0.05, β=0.10时需观察多少 例能说明新药镇痛效果优于旧药?
2 ( 1 + 1 )( ma + m b ) p ( 1 - p ) k n= 2
8、样本量估算 的统计学方法
骆福添 公共卫生学院
参考教材:《生物医学研究的统计方法》 主编:方积乾,2007,高等教育出版社
一、临床研究为什么需要 估计样本含量
复习:统计学任务与规则
任务:描述样本数据特征、估计总体参 数置信区间、检验总体差别
Ø
Ø
规则:(必须考虑) 数据类型、分布类型、 对比类型
3、估计样本含量的目的
在保证某个临床试验/临床研究的结论具 有一定科学性、真实性和可靠性前提 下,确定某研究所需的最小观察例数。
Ø
二、估计样本含量 的方法
两大类方法
Ø
1、公式法,可满足多种设计的要求,目 前应用广泛。
Ø
2、查表法,简单、方便,但受条件限 制,有时不一定完全适应。
三、估计样本含 量的步骤
Ø
Ø
抽样误差估计与n 关系
最基本公式: 误差=个体变异程度/n的平方根
Ø Ø
均数误差 = 标准差/ sqrt (n) 率的误差 = sqrt[p (1p) / n]
样本含量问题举例
Ø
1、n = 3,三个克隆
Ø Ø
Ø
2、女大学生33%自动退学? n =? 3、n =20,n =100,n = ? 1 2
Ø
第一类错误的概率α,第二类错误概率β,容 许误差δ(有实际意义的差异值)。 若终点指标为数值变量时,还需要研究者确 定总体标准差σ。 若终点指标为分类变量时,有时需要研究者 确定总体率π。
Ø
Ø
(1)确定第一类误差的概率α
Ø
所有样本含量估计公式中,都需要uα的值, 研究者确定检验水准(α)的大小后,查表 得uα值。
3、考虑统计方法
Ø
样本含量的估计还要与以后将要使用的 统计方法的条件相结合。如单因素分析、 相关与回归、多因素分析等。目前样本 含量估计的公式计算主要针对单因素分 析,而多因素分析的例数估计请参考有 关书籍 。(自变量数目的5-10倍)
4、确定基本参数
在各种临床科研设计方法的样本含量估计 中,需要研究者事先确定的条件有:
d 2
2 2 ( 1 . 6449 + 1 . 2816 ) 0 . 4 ( 1 - 0 . 4 ) = 2 0 . 2 = 102 . 77 = 103
计算结果
例数不等
(1 + 1 )( ma + m b )2 p (1 - p ) k n= d2
如:不同的α、β、δ 等条件组合下,估计其样本含 量,从中择优。 (不推荐“结果择优”,推荐
择优方法后计算)
4.与研究目的结合
Ø
根据研究目的,严格选择估算样本含量的方 法,如单、双侧不同,估计参数与假设检验 不同,一般假设检验与等价检验不同,样本 率超过与位于0.3-0.7(0.2-0.8)范围不同,t 检验与u检验不同等。
(4)确定总体标准差σ总体率π
Ø
若研究的终点指标为数值变量时,总体标准 差σ为估计样本含量所必须的条件。 若研究的终点指标为分类变量时,有时,总 体率π为估计样本含量条件。
Ø
Ø
若总体标准差σ和总体率π,常常通过文献检 索、预试验或对研究作出合理的假设来获得。
5、计算样本含量
Ø
用按设计方案、资料类型及可能涉及的 统计分析方法来选择样本含量的计算方 法(查书),也可以利用统计软件帮助 完成样本含量的计算。
Ø
欲研究某新药降低高血脂患者的胆固醇疗效, 研究者认为试验组与安慰剂组比较,其血清胆 固醇值平均下降0.5mmol/L才有临床意义,查 阅文献得血清胆固醇值的标准差为0.8mmol/L, 且规定两组例数相等,且α=0.05, β=0.10 (power=0.90),该研究所需样本含量为多少?
u0 . 05 u0 . 10 u0 . 05
1、确定设计方法
Ø
任何临床试验,其设计方案是首先需要 确定的,而样本含量的估计也是在设计 方案基础上的。不同的临床科研设计方 法,其样本含量的估计方法不相同
2、确定资料类型
Ø
当临床试验的设计方案确定后,需要确 定临床试验所得数据的类型,例如,计 量 (数值)、计数 (无序分类)、等级 (有序 分类),因为样本含量估计方法与数据类 型有关
5.估计的适用条件
Ø
目前,国内有关书籍提供的样本含量计算公 式,主要适用于临床试验,而并非适用于其 他医学实验,如动物实验。
Ø
动物实验的样本含量可以参考临床试验的样 本含量,并在此基础上适当减少其数量。
五、数值变量的样本 含量估计简介
两均数比较的估算
两组样本量相等时,可按下式计算每组的例数:
实例分析(例数相等)
Ø
任务2—估计置信区间
例:某总体指标在哪一区间 ?(置信度 = 借鉴反推)
Ø
数据:计数 (二项分布法/正态近似),计量 (正 态法),等级 (正态近似) 分布:正态 (正态法),对数正态 (lg值正态法), 偏态 (百分位数法) 对比:变量参数置信区间,差值参数置信区间 差值参数 (临床试验常用)
Ø
可重复性,是指任何科学研究必须遵守 的原则,其目的是要排除偶然因素的影 响,得出科学的、真实的、规律性的结 论。
2、误差主要由样本量决定
Ø
在临床研究中,样本含量越小,其抽样误差 越大。
Ø
若样本含量不足,可重复性差,检验效能 低,不能排除偶然因素的影响,其结论缺乏 科学性、真实性。
Ø
若样本含量过大,试验条件难以严格控制, 容易造成人力、物力和时间上的浪费。
系,收集病案资料 (考上大学人数):第一胎19人、 第二胎18人、第三胎10人、第四胎7人、第五胎4 人。由此得出结论:智力与胎次有关,胎次愈多 智力愈差,第一胎智力最好。 n = ?
1、重复原则“即样本量”
Ø
样本含量(Sample)的估计是临床研究 科学设计的重要内容。
Ø
α有单侧与双侧之分,单侧α的uα小于双侧uα
值,所以按单侧计算的样本含量小于双侧。
Fra Baidu bibliotek
Ø
α 越小所需样本含量越大,反之越小,一般 取α =0.05
(2)确定第二类误差的概率β
Ø
样本含量计算中,需要uα的值,即研究者确定β 大小后,查表的uα值。 确定β大小,主要是要确定检验效能 (Power),用1β表示其概率的大小,检验效 能是指总体间确有差别时,假设检验能发现这 种差别的能力大小。
6、校正样本含量
Ø
由于估算的样本含量是最少需要量,考虑到 受试者可能有不合作者、中途失访、意外死 亡等情况出现,而减少有效观察对象的例数 (失访),因此,应该在估算的样本含量增 加若干样本例数。
Ø
通常,失访人数不得大于20%。
四、样本含量估计的 注意事项
1.组间例数相等
Ø
成组设计的例数,应尽可能采用例数相等 的设计,尤其是多组设计时,一般要求各 组间的样本含量相等,只有在某些特殊情 况下才考虑各组的样本含量不相等。
u0 . 10
计算结果
例数不相等
实例分析(例数不等)
Ø
某医院研究吲螨酰胺治疗原发性高血压的疗 效,经预试验得治疗前后舒张压差值(kPa)资 料如下,若α=0.05, β=0.10时需治疗多少例? 均数 2.28 1.32 标准差 1.09 0.40
吲螨酰胺 安慰剂
计算结果
试验组:18 + 18×0.2≈22(例) 试验组:13 + 13×0.2≈16(例)
2.多指标估算
Ø
若某研究有多个效应指标,其样本含量估计应对 每个效应指标进行样本量的估计,然后取样本数 量最大者为其研究的样本量。
Ø
若某研究能区分主要指标和次要指标时,也可以 只对主要指标进行样本含量估计,然后取量大者 为其研究的样本含量。
3.多种估计条件
Ø
尽可能将多样本含量估计方法联合使用,并且 在使用计算法估算时,可多做几种估算方案, 以便选择。
d
2 ( 1 + 1 )( 1 . 6449 + 1 . 2816 ) ( 0 . 6676 )( 1 - 0 . 6676 ) 0 . 7 = 2 0 . 2 = 115 . 4
计算结果
样本含量与统计分析特例
Ø
1、分子、细胞、组织水平的研究:专业判定样 本含量,不计算、不必假设检验。 2、药物临床试验:就高不就低。 3、特小样本:报告绝对数,如“治疗5人,治 愈4人”。 4、特大样本:专业上判定,不作假设检验(不 适用)。 5、检验效能:要用调和均数
Ø
Ø
任务3—检验总体差别
例:某2个总体指标相同 ? (把握度 = 概率分布面积)
Ø
数据:计数 (正态近似法u, 卡方),计量 (均 数检验),等级 (秩和检验) 分布:正态 (u, t),对数正态 (lg值t检验),偏 态 (秩和检验) 对比:组间比较 (u, t, H ),与总体比较 (u, t, H)
Ø Ø
Ø
Ø
六、分类变量的样本 含量估计简介
两个率比较的估算
实例分析(例数相等)
Ø
用旧的治疗方案治疗慢性肾炎的控制率为 30%,现用新的治疗方案治疗慢性肾炎,其控 制率应大于50%才有临床意义,若取两组例数 相等,且α=0.05、 β=0.10(power=0.9),问 每组需多少例数?
n=
2 2 ( ma + m b ) p ( 1 - p )
Ø
Ø
β为第二类误差的概率,β值越小,检验效率越 高,所需样本量也就越大,通常β=0.1或β=0.2。
一般认为检验效率不能小于0.7。
(3)确定容许限或插座δ
即有临床意义或研究意义的最小差值。
Ø
若为数值变量时,δ可为有临床意义的均数 差值、实验前后之差等。
Ø
若为分类资料, δ可为有临床意义的有效率、 患病率等率之差。
任务1—描述样本数据特性
例:某样本个体分布的集中趋势与离散趋势怎样 ? (1v点,2v线,3v影子_线)
Ø Ø
数据:计数(%),定量(Average),等级(M, Ridit) 分布:正态 (Mean±SD,95%CR),对数正态(G),偏 态 (M, Q/R,P ~ P ) ,相关回归 (r, b) 2.5 97.5 对比:两组对比 (各组Mean±SD ),配对比较 (差值 的Mean±SD)
实例分析(例数不等)
Ø
某医师研究某药对产后宫缩痛、外阴创伤痛 效果,预试验旧药镇痛率为55%,新药镇痛 率为75%,当α=0.05, β=0.10时需观察多少 例能说明新药镇痛效果优于旧药?
2 ( 1 + 1 )( ma + m b ) p ( 1 - p ) k n= 2
8、样本量估算 的统计学方法
骆福添 公共卫生学院
参考教材:《生物医学研究的统计方法》 主编:方积乾,2007,高等教育出版社
一、临床研究为什么需要 估计样本含量
复习:统计学任务与规则
任务:描述样本数据特征、估计总体参 数置信区间、检验总体差别
Ø
Ø
规则:(必须考虑) 数据类型、分布类型、 对比类型
3、估计样本含量的目的
在保证某个临床试验/临床研究的结论具 有一定科学性、真实性和可靠性前提 下,确定某研究所需的最小观察例数。
Ø
二、估计样本含量 的方法
两大类方法
Ø
1、公式法,可满足多种设计的要求,目 前应用广泛。
Ø
2、查表法,简单、方便,但受条件限 制,有时不一定完全适应。
三、估计样本含 量的步骤
Ø
Ø
抽样误差估计与n 关系
最基本公式: 误差=个体变异程度/n的平方根
Ø Ø
均数误差 = 标准差/ sqrt (n) 率的误差 = sqrt[p (1p) / n]
样本含量问题举例
Ø
1、n = 3,三个克隆
Ø Ø
Ø
2、女大学生33%自动退学? n =? 3、n =20,n =100,n = ? 1 2
Ø
第一类错误的概率α,第二类错误概率β,容 许误差δ(有实际意义的差异值)。 若终点指标为数值变量时,还需要研究者确 定总体标准差σ。 若终点指标为分类变量时,有时需要研究者 确定总体率π。
Ø
Ø
(1)确定第一类误差的概率α
Ø
所有样本含量估计公式中,都需要uα的值, 研究者确定检验水准(α)的大小后,查表 得uα值。
3、考虑统计方法
Ø
样本含量的估计还要与以后将要使用的 统计方法的条件相结合。如单因素分析、 相关与回归、多因素分析等。目前样本 含量估计的公式计算主要针对单因素分 析,而多因素分析的例数估计请参考有 关书籍 。(自变量数目的5-10倍)
4、确定基本参数
在各种临床科研设计方法的样本含量估计 中,需要研究者事先确定的条件有:
d 2
2 2 ( 1 . 6449 + 1 . 2816 ) 0 . 4 ( 1 - 0 . 4 ) = 2 0 . 2 = 102 . 77 = 103
计算结果
例数不等
(1 + 1 )( ma + m b )2 p (1 - p ) k n= d2
如:不同的α、β、δ 等条件组合下,估计其样本含 量,从中择优。 (不推荐“结果择优”,推荐
择优方法后计算)
4.与研究目的结合
Ø
根据研究目的,严格选择估算样本含量的方 法,如单、双侧不同,估计参数与假设检验 不同,一般假设检验与等价检验不同,样本 率超过与位于0.3-0.7(0.2-0.8)范围不同,t 检验与u检验不同等。
(4)确定总体标准差σ总体率π
Ø
若研究的终点指标为数值变量时,总体标准 差σ为估计样本含量所必须的条件。 若研究的终点指标为分类变量时,有时,总 体率π为估计样本含量条件。
Ø
Ø
若总体标准差σ和总体率π,常常通过文献检 索、预试验或对研究作出合理的假设来获得。
5、计算样本含量
Ø
用按设计方案、资料类型及可能涉及的 统计分析方法来选择样本含量的计算方 法(查书),也可以利用统计软件帮助 完成样本含量的计算。
Ø
欲研究某新药降低高血脂患者的胆固醇疗效, 研究者认为试验组与安慰剂组比较,其血清胆 固醇值平均下降0.5mmol/L才有临床意义,查 阅文献得血清胆固醇值的标准差为0.8mmol/L, 且规定两组例数相等,且α=0.05, β=0.10 (power=0.90),该研究所需样本含量为多少?
u0 . 05 u0 . 10 u0 . 05
1、确定设计方法
Ø
任何临床试验,其设计方案是首先需要 确定的,而样本含量的估计也是在设计 方案基础上的。不同的临床科研设计方 法,其样本含量的估计方法不相同
2、确定资料类型
Ø
当临床试验的设计方案确定后,需要确 定临床试验所得数据的类型,例如,计 量 (数值)、计数 (无序分类)、等级 (有序 分类),因为样本含量估计方法与数据类 型有关
5.估计的适用条件
Ø
目前,国内有关书籍提供的样本含量计算公 式,主要适用于临床试验,而并非适用于其 他医学实验,如动物实验。
Ø
动物实验的样本含量可以参考临床试验的样 本含量,并在此基础上适当减少其数量。
五、数值变量的样本 含量估计简介
两均数比较的估算
两组样本量相等时,可按下式计算每组的例数:
实例分析(例数相等)
Ø
任务2—估计置信区间
例:某总体指标在哪一区间 ?(置信度 = 借鉴反推)
Ø
数据:计数 (二项分布法/正态近似),计量 (正 态法),等级 (正态近似) 分布:正态 (正态法),对数正态 (lg值正态法), 偏态 (百分位数法) 对比:变量参数置信区间,差值参数置信区间 差值参数 (临床试验常用)
Ø
可重复性,是指任何科学研究必须遵守 的原则,其目的是要排除偶然因素的影 响,得出科学的、真实的、规律性的结 论。
2、误差主要由样本量决定
Ø
在临床研究中,样本含量越小,其抽样误差 越大。
Ø
若样本含量不足,可重复性差,检验效能 低,不能排除偶然因素的影响,其结论缺乏 科学性、真实性。
Ø
若样本含量过大,试验条件难以严格控制, 容易造成人力、物力和时间上的浪费。