(完整word版)第五章 假设检验的功效与样本量

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章 假设检验的功效与样本量

∙ 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。 ∙ 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。

5.1 两类错误与功效

1. 两类错误的概率

H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0-

(5.2) (略) ∙ 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为

第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ∙ 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病

第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ∙ 两类错误的背景:

拒绝H 0时可能犯第Ⅰ类错误

不拒绝H 0时可能犯第Ⅱ类错误

∙ 两类错误的后果:

第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ∙ 一般α, β的数值要在科研设计时事先确定

2. 功效 (power)

∙ 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β

(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β

(5.5) ∙ 功效就是真实有效的药物被发现的概率∕疾病被诊断出

来的概率

5.2 影响功效的四要素

∙ 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ∙ 功效的影响因素为:δ=0μ-x ,σ,n ,α

X ≥μ0+Z αn σ (5.7) (略) ∙ 现用X 分布图形来定性地讨论四要素对功效的影响

1. 客观差异越大,功效越大

X ~N(μ,σ2/n) (5.8) (略)

若H 0为真,X ~N(μ0,σ2/n) (5.9) (略)

若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) (略)

2. 个体间标准差越小, 功效越大。

3. 样本量越大,功效越大

4. α值越大,功效越大

∙ 筛选新药时α大些,以免漏掉有苗头的新药(α=0.10/0.20) 新药上市前α小些,以免误将真实无效的新药大量生产(α=0.01)

(a)个体标准差s 1较大或样本量n 1较小; (b)个体标准差s 2较小或样本量n 2较大 图5.2 个体间标准差越小或样本量越大,功效越大

(a) α1较小; (b) α2较大

图5.3 α值越大,功效越大

(a)均数间实际距离d 1较小 (1.5); (b)均数间实际距离d 2较大(1.8) 图5.1 均数间差异越大,功效越大

5.3 功效与四要素的定量关系

1. 单组样本均数的检验

()()βασδμσμZ n n Z -=+-+00 (5.11) (略) 简化后得到

例5.1 某药的平均有效时间原为6小时,现改进了配方,据称可延长至7小时。为核实这一点,某研究组观察了25例该病患者,得到的却是阴性结果(P >0.05),即不能认为平均有效时间长于6小时,试分析原因。

解 这个问题实际上是检验假设 H 0:μ=6, H 1: μ>6 据题意,不妨令δ=1。σ的数值可参考此次25例的观察结果,设连同以往经验猜测σ=2。

将δ=1,σ=2,n =25和单侧Z 0.05=1.64代入(5.12)式 Z β=05.02

125Z Z n -⨯=-ασδ

= 0.86 查标准正态分布表得()8051

.086.0=Φ,即1-β=0.8051 果表明,此项检验的功效为80.51%

2. 两组样本均数的检验 欲检验假设

图5.4 两组样本均数检验示意图

例5.2 一项关于降血压药的临床试验分设两组随机样本,各含15例同病患者。一组服用常规药,另一组服用新药。如果新药的降压效果至少比常规药平均高出0.8kPa 方可考虑在临床推广; 据以往经验,不论常规药还是这种新药,个体降压值的标准差约为1kPa 。经α=0.05水平的两组均数比较的统计检验,两组平均降压效果的差异尚无统计学意义,此事如何理解?

解 据题意,这是关于两组均数的一项单侧检验 δ=0.8,σ=1,n =15,单侧Z 0.05=1.64,代入(5.18)式得 Z β =21518.0⎪⎭

⎫ ⎝⎛- Z 0.05 = 0.5509

查标准正态分布表,得()7088.05509.0=Φ,即1-β=0.7088只有70.88%的机会被此检验得出有差异的结论。

3. 两组样本频率的检验(大样本)

欲检验假 H 0:π1=π2, H 1:π1>π2 (5.19) (略) 根据正态近似两组样本均数的检验,有功效的计算公式

其中,δ=π1-π2

例5.3 一项关于维生素C 预防感冒作用的研究随机抽取两组正常人各30名,一组服用维生素C ,另一组服用安慰剂,欲比较一定时期内发生感冒的频率。结果,安慰剂组有6人发生感冒,维生素C 组有3人发生感冒,经α=0.05水平的检验,差异无统计学意义,此事如何理解?

解 π1=20%,假定π2=10%或更低时认为值得重视,n =30和α=0.05代入(5.19)式,

()()

5446.0645.110.0110.020.0120.03010.0-=--+-=βZ

查标准正态分布表得()2929.05446.0=-Φ,即1-β=0.2929,功效只有29.29%。

5.4 常用统计检验的样本量估算

1.

单组样本均数的检验 改写功效估计公式(5.12)得 ∙ 估计样本含量的影响因素,类似于功效:α,β,δ,σ

例5.4 为较好地解决例5.1中的新药论证问题,至少需要多大样本量?

解 α=0.05, β=0.01, δ=1, σ=2,以及Z 0.05=1.64,单侧Z 0.01=2.33,代入公式,

n =2

201.005.05.033.264.121⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛+Z Z =63.0436≈63

相关文档
最新文档