样本量估算的统计学方法LC骆_图文

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
➢ 用按设计方案、资料类型及可能涉及 的统计分析方法来选择样本含量的计 算方法(查书),也可以利用统计软 件帮助完成样本含量的计算。
6、校正样本含量
➢ 由于估算的样本含量是最少需要量, 考虑到受试者可能有不合作者、中途 失访、意外死亡等情况出现,而减少 有效观察对象的例数(失访),因此 ,应该在估算的样本含量增加若干样 本例数。
➢ 欲研究某新药降低高血脂患者的胆固醇疗效, 研究者认为试验组与安慰剂组比较,其血清胆 固醇值平均下降0.5mmol/L才有临床意义,查 阅文献得血清胆固醇值的标准差为0.8mmol/L,
且规定两组例数相等,且α=0.05, β=0.10(
power=0.90),该研究所需的样本含量为多少 ?
计算结果
➢ 2、查表法,简单、方便,但受条件限 制,有时不一定完全适应。
三、估计样本含 量的步骤
1、确定设计方法
➢ 任何临床试验,其设计方案是首先需 要确定的,而样本含量的估计也是在 设计方案基础上的。不同的临床科研 设计方法,其样本含量的估计方法不 相同
2、确定资料类型
➢ 当临床试验的设计方案确定后,需要 确定临床试验所得数据的类型,例如 ,计量(数值)、计数(无序分类) 、等级(有序分类),因为样本含量 估计方法与数据类型有关
、患病率等率之差。
(4)确定总体标准差σ总体率π
➢ 若研究的终点指标为数值变量时,总体标 准差σ为估计样本含量所必须的条件。
➢ 若研究的终点指标为分类变量时,有时, 总体率π为估计样本含量条件。
➢ 若总体标准差σ和总体率π,常常通过文 献检索、预试验或对研究作出合理的假设 来获得。
5、计算样本含量
药镇痛率为75%,当α=0.05, β=0.10时需
观察多少例能说明新药镇痛效果优于旧 药?
例:某总体指标在哪一区间 ?(借鉴反推) 数据:计数(直接法/正态近似),计量(正
态法),等级(正态近似) ➢ 分布:正态(正态法),对数正态(lg值置信
区间),偏态(百分位数法) ➢ 对比:变量参数置信区间,差值参数置信
区间(临床试验)
3. 假设检验任务
例:某2个总体指标相同 ? (直接应用概率分布)
➢ 若某研究能区分主要指标和次要指标时,也可 以只对主要指标进行样本含量估计,然后取量 大者为其研究的样本含量。
3.多种估计条件
➢ 尽可能将多样本含量估计方法联合使用,并 且在使用计算法估算时,可多做几种估算方 案,以便选择。
如:不同的α、β、δ等条件组合下,估计其样
本含量。
4.与研究目的结合
➢ 根据研究目的,严格选择估算样本含量的 方法,如单、双侧不同,估计参数与假设 检验不同,一般假设检验与等价检验不同 ,样本率超过与位于0.3-0.7(0.2-0.8)范围
智力最好。 n=?
可重复原则
➢ 样本含量(Sample)的估计是临床研 究科学设计的重要内容。
➢ 可重复性,是指任何科学研究必须遵 守的原则,其目的是要排除偶然因素 的影响,得出科学的、真实的、规律 性的结论。
样本含量的大小
➢ 在临床研究中,样本含量越小,其抽 样误差越大。
➢ 若样本含量不足,可重复性差,检验 效能低,不能排除偶然因素的影响, 其结论缺乏科学性、真实性。
样本量估算的统计学方法LC骆_图文.ppt
一、临床研究为什么需 要估计样本含量
复习1:统计学三大任务与三大规则
➢ 任务:描述样本特征、估计总体参数 、检验总体差别
➢ 规则:(必须考虑) 数据类型、分布 类型、对比类型
1. 统计描述任务
例:某样本个体分布的集中趋势与离散趋势怎 样 ?(1V点,2V线,3V面.影子_线)
➢ 若终点指标为数值变量时,还需要研究者确 定总体标准差σ。
➢ 若终点指标为分类变量时,有时需要研究者 确定总体率π。
(1)确定第一类误差的概率α
➢ 所有样本含量估计公式中,都需要uα的
值,研究者确定检验水准(α)的大小后
,查表得uα值。 ➢ α有单侧与双侧之分,单侧α的uα小于双
侧uα值,所以按单侧计算的样本含量小
➢ 数据:计数(正态近似法u,卡方),计量(
均数检验),等级(秩和检验)
➢ 分布:正态(u,t),对数正态(lg值t检验)
,偏态(秩和检验)
➢ 对比:组间比较(u, t, H),与总体比较( u, t, H)
统计推断中的误差估计
最基本公式:
误差=个体变异程度/n的平方根 ➢ 均数误差 = 标准差/sqrt(n) ➢ 率的误差 = sqrt[p(1-p)/ n]
例数不相等
实例分析(例数不等)
➢ 某医院研究吲螨酰胺治疗原发性高血压的疗效,经 预试验得治疗前后舒张压差值(kPa)资料如下,
若α=0.05, β=0.10时需治疗多少例?
吲螨酰胺 安慰剂
均数 2.28 1.32
标准差 1.09 0.40
计算结果
六、分类变量的样本含量 估计简介
两个率比较的估算
➢ 通常,失访人数不得大于20%。
四、样本含量估计的 注意事项
1.组间例数相等
➢ 成组设计的例数,应尽可能采用例数相等 的设计,尤其是多组设计时,一般要求各 组间的样本含量相等,只有在某些特殊情 况下才考虑各组的样本含量不相等。
2.多指标估算
➢ 若某研究有多个效应指标,其样本含量估计应 对每个效应指标进行样本量的估计,然后取样 本数量最大者为其研究的样本量。
➢ β为第二类误差的概率,β值越小,检验效率
越高,所需样本量也就越大,通常β=0.1或 β=0.2。一般认为检验效率不能小于0.7。
(3)确定容许限或插座δ
即有临床意义或研究意义的最小差值。 ➢ 若为数值变量时,δ可为有临床意义的均数
差值、实验前后之差等。 ➢ 若为分类资料, δ可为有临床意义的有效率
➢ 数据:计数(%),定量(平均数),等级 (平均Ridit值)
➢ 分布:正态(Mean,SD,95%CR),对数正 态(G),偏态(M, Q/R,P2.5~P97.5) (双/多变 量-相关回归)
➢ 对比:变量=两组观察值(各组均数与标准 差),变量=差值(差值的均数与标准差)
2. 置信区间任务
3、考虑统计方法
➢ 样本含量的估计还要与以后将要使用 的统计方法的条件相结合。如单因素 分析、相关与回归、多因素分析等。 目前样本含量估计的公式计算主要针 对单因素分析,而多因素分析的例数 估计请参考有关书籍
4、确定基本参数
在各种临床科研设计方法的样本含量估计中 ,需要研究者事先确定的条件有:
➢ 第一类错误的概率α,第二类错误概率β, 容许误差δ。
不同,t检验与u检验不同等。
5.估计的适用条件
➢ 目前,国内有关书籍提供的样本含量计 算公式,主要适用于临床试验,而并非 适用于其他医学实验,如动物实验。
➢ 动物实验的样本含量可以参考临床试验 的样本含量,并在此基础上适当减少其 数量。
五、数值变量的样本含量 估计简介
Hale Waihona Puke Baidu
两均数比较的估算
实例分析(例数相等)
于双侧。
➢ α越小所需样本含量越大,反之越小,一 般取α ≤0.05
(2)确定第二类误差的概率β
➢ 样本含量计算中,需要uα的值,即研究者确 定β大小后,查表的uα值。
➢ 确定β大小,主要是要确定检验效能( Power),用1-β表示其概率的大小,检验效 能是指总体间确有差别时,假设检验能发现 这种差别的能力大小。
n大小举例
➢ 1、n=3,三个克隆
➢ 2、女大学生33%自动退学? n=?
➢ 3、n1=20,n2=100,n=?
➢ 4、1987年某产科医师为研究胎次与儿童智 力的关系,收集病案资料(考上大学人数) :第一胎19人、第二胎18人、第三胎10人、 第四胎7人、第五胎4人。由此得出结论:智 力与胎次有关,胎次愈多智力愈差,第一胎
实例分析(例数相等)
➢ 用旧的治疗方案治疗慢性肾炎的控制率为 30%,现用新的治疗方案治疗慢性肾炎, 其控制率应大于50%才有临床意义,若取
两组例数相等,且α=0.05、 β=0.10(
power=0.9),问每组需多少例数?
计算结果
例数不等
实例分析(例数不等)
➢ 某医师研究某药对产后宫缩痛、外阴创 伤痛效果,预试验旧药镇痛率为55%,新
➢ 若样本含量过大,试验条件难以严格 控制,容易造成人力、物力和时间上 的浪费。
估计样本含量的目的
➢ 在保证某个临床试验/临床研究的结论 具有一定科学性、真实性和可靠性前 提下,确定某研究所需的最小观察例 数。
二、估计样本含量 的方法
两大类方法
➢ 1、公式法,可满足多种设计的要求, 目前应用广泛。
相关文档
最新文档