统计学的基本概念–样本量与检验效能
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
19
* Kirkwood&Ste20rne, p
例子
有3种针对心脏病发作高危的中年人群的降血脂新药(A, B,C)
药A和B 价格低廉 药C 价格昂贵
进行了5个包含这3种药物和对照(安慰剂)的随机试验 主要的检测指标
一年内血脂水平 临床上确认的血脂下降均值(相对于安慰剂)
40 mg/dl或更多 对心脏病发作有重要保护作用 20-40 mg/dl 中等保护作用
的结论? 假设检验
5
在同样的目标人群中 50个随机对照临床试验的观测值
True (population) effect
-12
-10
-8
-6
-4
-2
Observed treatment effect
0 6
参数估计与不确定性
最可靠的真实疗效的参数估计: x2 - x1 = -4.6 mm Hg 我们如何量化这种评估方法的不确定性?
x1 = -0.8 mmHg x2 = -5.4 mmHg x2 - x1 = -4.6 mmHg
个值偏离平均值的距离的平均数(标准差): σ = 10 mmHg
我们可以从中学到什么?
3
观测效应是否反映了真实的总体效应?
?
干预组
结果
目标人群 研究对象
时间
对照组
结果
4
统计学的一些基本问题
对真实的(总体)疗效最可靠的估计是怎样的? 估计 从中得出的总体疗效在什么范围内是可信的? 可信区间 治疗是否有效?也就是说, 我们是否能得出真实疗效不等于0
40 160 4000 178
180 -20 (-85,+45) 0.54 180 -2 (-8.5,+4.5) 0.54
True (population) effect
-12
-10
-8
-6
-4
-2
Observed treatment effect
0 11
计算CI几个类似的公式
90% CI : x2 x1 1.64 S.E. 95% CI : x2 x1 1.96 S.E. 99% CI : x2 x1 2.58 S.E.
如果零假设成立,那么
x2 x1 ~ N (true effect 0, S.E.2 )
比如说,如果观察到的疗效值比1.96·S.E. 大,那么意味着p<0.05
p=0.003 如果零假设成立,那就出现了1000人中只有3人有疗效 的极端情况 = 概率很低
15
假设检验步骤
4. 简要判断
III
以P值与事先设定的显著性水平源自文库α 作比较(通常 α=5%)
20
试验结果- 如何分析?
试验 药物 价格
1
A 便宜
2
A 便宜
3
B 便宜
4
B 便宜
5
C 昂贵
每组的 一年内血脂均值
病人数
(mg/dl)
待测 安慰剂 药
药物引起的下降值
估计 值
95% CI P值
30 140
180 -40 (-118,+38) 0.32
3000 140
180 -40 (-48,-32) <0.001
标准误 可信区间
7
标 量准化误估计疗效的准确性
定义为:当随机对照试验重复很多次时估计疗效的标准差
公式: x2 x1 ~ N (true effect, S.E.2 )
仅根据一次随机对照试验就可以得出:
数学公式:
S.E.
2 n
8
观察到的疗效分布图
True (population) effect
S.E.= 2 n 2.5%
1.96 S.E. 2.5%
9
可信区间 (CI)
量化试验结果中可信真实疗效的准确范围 通常采用 95% CI
我们有95%的把握认为,真实的疗效在95%的可信区间 内。
如果进行多次随机对照试验,则95%CI会包含95%的试 验的真实疗效。
10
50次随机对照试验中观察到的药物疗效 (95% CI)
16
统计检验和可信区之间的对偶性
95% CI包括 0 ↔ p>0.05
95% CI不包括0 ↔ p≤0.05
17
假设检验中的第一类和第二类错误
第一类: 零假设 (α)为真,拒绝零假设, 也就是说,错误地认 为有差别. 提前设定的一类错误的概率– 通常 α=5% (显著性水平)
第二类: 零假设 ( β)不真 ,接受零假设,也就是说,无法测 出真实的差别。 犯二类错误的可能性(即 β), 取决于效应的大小和样本 量 检验效能= 1- β
13
假设检验的步骤 I
1. 建立无疗效的零假设
H0: 干预与对照效果一样 (“无差异”, 真实疗效=0)
HA: 干预有效果, 真实疗效≠0 (对立的假设, 双侧)
2. 进行随机对照试验和收集数据
在H0假设(即“无差异”)的前提下,比较实际疗效与预期疗效
14
假设检验步骤 II
3. 计算试验观察到的样本数据符合“零假设成立” 的可能 性(P值)
Marcel Wolbers 越南牛津大学临床研究中心
1
2
例子
随机对照临床试验
一种降压药与安慰剂的比较 主要指标:随机分配后一个月时病人收缩压与之前基础水平的差值 随机分配病人到每个组,每组 n=100 (总数为:N=200)
结果
使用安慰剂后血压改变的均值: 使用降压药后血压改变的均值: 观察到的降压药效果:
12
适用于我们的例子的S.E.和CI公式
S.E.
2 n
10
2 100
1.41
95% CI : x2 x1 1.96 S.E. 4.6 1.961.41 Interval [7.4,1.8]
99% CI : x2 x1 2.58 S.E. 4.6 2.581.41 Interval [8.2,1.0]
18
显著性检验的选择
选择 接受 H0
H0 成立
正确接受
结果 HA 成立
错误接受(第二类错误, β)
拒绝 H0
错误拒绝(第一类错误,
α)
正确拒绝
显著性水平: 犯第一类错误的可能性. (一般取: α=5% or 1%.) 检验效能: 1- 犯第二类错误的可能性. (一般取: 1-β=80% or 90%.)
a) p ≤ α (通常: p ≤0.05) “有统计意义” “拒绝零假设”
那就意味着两组间的差别有统计意义
b) p> α (通常: p >0.05) “无统计意义” “零假设成立” 但是,并不说明两组一样! – 有可能是因为:
- 两组间确实无差别
- 无法测出存在的差别
- 差别很小 - 样本量不够
* Kirkwood&Ste20rne, p
例子
有3种针对心脏病发作高危的中年人群的降血脂新药(A, B,C)
药A和B 价格低廉 药C 价格昂贵
进行了5个包含这3种药物和对照(安慰剂)的随机试验 主要的检测指标
一年内血脂水平 临床上确认的血脂下降均值(相对于安慰剂)
40 mg/dl或更多 对心脏病发作有重要保护作用 20-40 mg/dl 中等保护作用
的结论? 假设检验
5
在同样的目标人群中 50个随机对照临床试验的观测值
True (population) effect
-12
-10
-8
-6
-4
-2
Observed treatment effect
0 6
参数估计与不确定性
最可靠的真实疗效的参数估计: x2 - x1 = -4.6 mm Hg 我们如何量化这种评估方法的不确定性?
x1 = -0.8 mmHg x2 = -5.4 mmHg x2 - x1 = -4.6 mmHg
个值偏离平均值的距离的平均数(标准差): σ = 10 mmHg
我们可以从中学到什么?
3
观测效应是否反映了真实的总体效应?
?
干预组
结果
目标人群 研究对象
时间
对照组
结果
4
统计学的一些基本问题
对真实的(总体)疗效最可靠的估计是怎样的? 估计 从中得出的总体疗效在什么范围内是可信的? 可信区间 治疗是否有效?也就是说, 我们是否能得出真实疗效不等于0
40 160 4000 178
180 -20 (-85,+45) 0.54 180 -2 (-8.5,+4.5) 0.54
True (population) effect
-12
-10
-8
-6
-4
-2
Observed treatment effect
0 11
计算CI几个类似的公式
90% CI : x2 x1 1.64 S.E. 95% CI : x2 x1 1.96 S.E. 99% CI : x2 x1 2.58 S.E.
如果零假设成立,那么
x2 x1 ~ N (true effect 0, S.E.2 )
比如说,如果观察到的疗效值比1.96·S.E. 大,那么意味着p<0.05
p=0.003 如果零假设成立,那就出现了1000人中只有3人有疗效 的极端情况 = 概率很低
15
假设检验步骤
4. 简要判断
III
以P值与事先设定的显著性水平源自文库α 作比较(通常 α=5%)
20
试验结果- 如何分析?
试验 药物 价格
1
A 便宜
2
A 便宜
3
B 便宜
4
B 便宜
5
C 昂贵
每组的 一年内血脂均值
病人数
(mg/dl)
待测 安慰剂 药
药物引起的下降值
估计 值
95% CI P值
30 140
180 -40 (-118,+38) 0.32
3000 140
180 -40 (-48,-32) <0.001
标准误 可信区间
7
标 量准化误估计疗效的准确性
定义为:当随机对照试验重复很多次时估计疗效的标准差
公式: x2 x1 ~ N (true effect, S.E.2 )
仅根据一次随机对照试验就可以得出:
数学公式:
S.E.
2 n
8
观察到的疗效分布图
True (population) effect
S.E.= 2 n 2.5%
1.96 S.E. 2.5%
9
可信区间 (CI)
量化试验结果中可信真实疗效的准确范围 通常采用 95% CI
我们有95%的把握认为,真实的疗效在95%的可信区间 内。
如果进行多次随机对照试验,则95%CI会包含95%的试 验的真实疗效。
10
50次随机对照试验中观察到的药物疗效 (95% CI)
16
统计检验和可信区之间的对偶性
95% CI包括 0 ↔ p>0.05
95% CI不包括0 ↔ p≤0.05
17
假设检验中的第一类和第二类错误
第一类: 零假设 (α)为真,拒绝零假设, 也就是说,错误地认 为有差别. 提前设定的一类错误的概率– 通常 α=5% (显著性水平)
第二类: 零假设 ( β)不真 ,接受零假设,也就是说,无法测 出真实的差别。 犯二类错误的可能性(即 β), 取决于效应的大小和样本 量 检验效能= 1- β
13
假设检验的步骤 I
1. 建立无疗效的零假设
H0: 干预与对照效果一样 (“无差异”, 真实疗效=0)
HA: 干预有效果, 真实疗效≠0 (对立的假设, 双侧)
2. 进行随机对照试验和收集数据
在H0假设(即“无差异”)的前提下,比较实际疗效与预期疗效
14
假设检验步骤 II
3. 计算试验观察到的样本数据符合“零假设成立” 的可能 性(P值)
Marcel Wolbers 越南牛津大学临床研究中心
1
2
例子
随机对照临床试验
一种降压药与安慰剂的比较 主要指标:随机分配后一个月时病人收缩压与之前基础水平的差值 随机分配病人到每个组,每组 n=100 (总数为:N=200)
结果
使用安慰剂后血压改变的均值: 使用降压药后血压改变的均值: 观察到的降压药效果:
12
适用于我们的例子的S.E.和CI公式
S.E.
2 n
10
2 100
1.41
95% CI : x2 x1 1.96 S.E. 4.6 1.961.41 Interval [7.4,1.8]
99% CI : x2 x1 2.58 S.E. 4.6 2.581.41 Interval [8.2,1.0]
18
显著性检验的选择
选择 接受 H0
H0 成立
正确接受
结果 HA 成立
错误接受(第二类错误, β)
拒绝 H0
错误拒绝(第一类错误,
α)
正确拒绝
显著性水平: 犯第一类错误的可能性. (一般取: α=5% or 1%.) 检验效能: 1- 犯第二类错误的可能性. (一般取: 1-β=80% or 90%.)
a) p ≤ α (通常: p ≤0.05) “有统计意义” “拒绝零假设”
那就意味着两组间的差别有统计意义
b) p> α (通常: p >0.05) “无统计意义” “零假设成立” 但是,并不说明两组一样! – 有可能是因为:
- 两组间确实无差别
- 无法测出存在的差别
- 差别很小 - 样本量不够