第五章 假设检验的功效与样本量

合集下载

5第五章(二)统计推断概述2假设检验基本原理

5第五章(二)统计推断概述2假设检验基本原理

13:06:12
16
统计结论:
1 检验统计量绝对值 <临界值0.05,则相伴概 率 P>0.05,接受H0 ,差异不显著;
2 临界值0.05<检验统计量绝对值 <临界值0.01, 则相伴概率 0.01<P<0.05,否定H0 ,差异 显著; 3 检验统计量绝对值 >临界值0.01,则相伴概 率 P<0.01,否定H0 ,差异极显著;
(2)相伴概率P:是指在原假设成立时检验统计 量值及所有比它更极端的可能值出现的概率之 和(P---)
13:06:12 15
假设检验的基本步骤
统计结论:
- 差异不显著:在=5%水平下, 检验统计量的观察值落在接受域中, - 差异显著:在=5%水平下,检 验统计量的观察值落在否定域中 - 差异极显著:在=1%水平下, 检验统计量的观察值落在否定域中
Biostatistics and Experimental Design
畜牧、兽医专业
生物统计 附 试验设计
13:06:12
1
统计推断概述内容1小节
一 二 三 四 五 统计推断的概念 抽样分布的概念 统计量的概率分布-抽样分布 正态总体样本平均数的抽样分布 参数估计
13:06:12
2
统计推断概述内容2
13:06:12
18
举例说明
(2)计算检验统计量
Z=
x- m
8.7 - 9 = = - 3.162 2 s n 2.5/ 10
13:06:12
19
(3)确定否定域:
若取 =5%,否定域为Z > 1.96 或 Z < 1.96,临界值U0.05=1.96 ,Z = -3.162 < -1.96,统 计量Z落入否定区,否定H0,相伴概率P<0.05 结论:该场猪的平均背膘厚与9mm差异显著

第5章-假设检验课后习题解答

第5章-假设检验课后习题解答

第五章假设检验一、选择题1.单项选择题(1)将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的 1 /2,这是(B )。

A.单侧检验B.双侧检验C.右单侧检验D.左单侧检验(2)检验功效定义为(B )。

A.原假设为真时将其接受的概率B.原假设不真时将其舍弃的概率C.原假设为真时将其舍弃的概率D.原假设不真时将其接受的概率(3)符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着(C )。

A.存在试验误差(随机误差)B.存在条件误差C.不存在什么误差D.既有抽样误差,也有条件误差(4)得出两总体的样本数据如下:甲:8,6,10,7,8;乙:5,11,6,9,7,10秩和检验中,秩和最大可能值是(C )。

A.15B.48C.45D.662.多项选择题(1)显著性水平与检验拒绝域的关系是(ABD )。

A.显著性水平提高(α变小),意味着拒绝域缩小B.显著性水平降低,意味着拒绝域扩大C.显著性水平提高,意味着拒绝域扩大D.显著性水平降低,意味着拒绝域扩大化E.显著性水平提高或降低,不影响拒绝域的变化(2)β错误(ACDE )。

A.是在原假设不真实的条件下发生的B.是在原假设真实的条件下发生的C.决定于原假设与实际值之间的差距D.原假设与实际值之间的差距越大,犯β错误的可能性就越小E.原假设与实际值之间的差距越小,犯β错误的可能性就越大二、计算题1.某牌号彩电规定无故障时间为10000 小时,厂家采取改进措施,现在从新批量彩电中抽取100 台,ο n500 100ο n60 16 测得平均无故障时间为 10150 小时,标准差为 500 小时,能否据此判断该彩电无故障时间有显著增加(α=0.01)?解:假设检验为H 0:μ0=10000,H 1:μ0<10000(使用寿命应该使用单侧检验)。

n =100 可近似采用x - μ0正态分布的检验统计量z =。

查出α=0.01 水平下的反查正态概率表得到临界值 2.34 到 2.36 之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性水平应先乘以 2,再查到对应的临界值)。

教育与心理统计学 第五章 假设检验考研笔记-精品

教育与心理统计学  第五章 假设检验考研笔记-精品
把出现小概率的随机事件称为小概率事件。
假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\

第5章 假设检验

第5章  假设检验
著,这里表现为长白后备种猪的背膘厚度极显著地低于蓝塘后备种猪 的背膘厚度。
9
假设检验的基本步骤
(1) 对样本所属总体提出统计假设,包括无效假 设和备择假设. (2) 测验计算,即在无效假设正确的假定下,依 据统计数的抽样分布,计算因随机抽样而获得实 际差数的概率. (3) 统计推断,即将确定的值与算得的概率相比 较,依据“小概率事件实际不可能性”原理作出 接受或否定无效假设的推断
1.2021.817 13.226** 0.0465
df (n1 1) (n2 1)
=(12-1)+(11-1)=21
3、查临界t值,作出统计推断 当df=21时,查临界值得:t0.01(21)=2.831, |t|>2.831,P<0.01,否定 H 0:1 , 接 2 受 H A:1 ,表明长白后备种猪与蓝塘后备种猪 2 90kg背膘厚度差异极显著,这里表现为长白后备 种猪的背膘厚度极显著地低于蓝塘后备种猪的背 膘厚度。
3、查临界t值,作出统计推断 因为单侧
t 0.10(= 双侧 11)
t 0.05 = 1.796 ,t=2.281 (11 )
> 单侧t0.05(11), P < 0.05 , 否定H0 : =246,
>246,可以认为该批饲料维生素C含量 接受HA :
符合规定要求。
第三节 两个样本平均数的差异 显著性检验
克服假设检验中可能犯的两类错误的方法: ① 适当增加样本容量 ② 精细做好试验以控制试验误差
17
两类错误
影响 II 型错误概率大小的因素 - 显著性水平 - 样本含量 n - 假设分布与真实分布总体平均数之差 - 两个分布的总体方差
检验功效 一个错误的原假设能够被否定的概率 检验功效 = 1 - II 型错误概率 =1-β

假设检验与样本数量分析①——单样本Z检验和单样本t检验

假设检验与样本数量分析①——单样本Z检验和单样本t检验

X
32.03 + 32.14 + … + 31.87 15

1.9 2.0

0.029 0.023

0.028 0.022

0.027 0.022

0.0226 0.020

0.025 0.020

0.024 0.019

0.024 0.019

0.023 0.018
原假设 (零假设)即上述的可能,符号是H0
备择假设(与原假设对立的假设),符号是H1
如本例:假设外径尺寸 H0:(μ = 32) H1: (μ≠32) 确立检验水准: α——显著水平(通常取α=0.05)

显著水平α是当原假设正确却被拒绝的概率 通常人们取0.05或0.01 这表明,当做出接受原假设的决定时,其正确的可 能性(概率)95% 或99% 概率是0~1之间的一个数,因此小概率就是接近0的 一个数 英国统计家Ronald Fisher 把0.05作为标准,从此0.05 或比0.05小的概率都被认为是小概率
8 作出不拒绝零假设的统计结论,即外径尺寸 均值没有偏离目标Ф 32
<6>
单样本 Z 检验 单样本 t 检验
预备知识
接上页

假设检验的例子(1)
检验 α = 0.05
临界值 临界值

2
=0.025
拒绝范围

1 – α = 95%
不拒绝H0范围
2
=0.025
根据小概率原理,可以先假设总体参数的 某项取值为真,也就是假设其发生的可能 性很大,然后抽取一个样本进行观察,如 果样本信息显示出现了与事先假设相反的 结果(显示出小概率),则说明原来假定 的小概率事件(一次实验中是几乎不可能发 生)在一次实验中居然真的发生了,这是 一个违背小概率原理的不合理现象,因此 有理由怀疑和拒绝原假设;否则不能拒绝 原假设。 在给定了显著水平α 后,根据容量为n的样 本,按照统计量的理论概率分布规律,可 以确定据以判断拒绝和接受原假设的检验 统计量的临界值。 临界值将统计量的所有可能取值区间分为 两个互不相交的部分,即原假设的拒绝域 和接受域。

(完整word版)第五章 假设检验的功效与样本量

(完整word版)第五章 假设检验的功效与样本量

第五章 假设检验的功效与样本量∙ 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。

∙ 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。

5.1 两类错误与功效1. 两类错误的概率H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0-(5.2) (略) ∙ 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ∙ 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ∙ 两类错误的背景:拒绝H 0时可能犯第Ⅰ类错误不拒绝H 0时可能犯第Ⅱ类错误∙ 两类错误的后果:第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ∙ 一般α, β的数值要在科研设计时事先确定2. 功效 (power)∙ 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β(5.5) ∙ 功效就是真实有效的药物被发现的概率∕疾病被诊断出来的概率5.2 影响功效的四要素∙ 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) ∙ 功效的影响因素为:δ=0μ-x ,σ,n ,αX ≥μ0+Z αn σ (5.7) (略) ∙ 现用X 分布图形来定性地讨论四要素对功效的影响1. 客观差异越大,功效越大X ~N(μ,σ2/n) (5.8) (略)若H 0为真,X ~N(μ0,σ2/n) (5.9) (略)若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) (略)2. 个体间标准差越小, 功效越大。

第五章假设检验

第五章假设检验
这个过程称为假设检验
5.1.1 假设检验基本原理
假设检验的原理是逻辑上的反证法和统计上的小概 率原理 反证法:当一件事情的发生只有两种可能A和B, 如果能否定B,则等同于间接的肯定了A。 小概率原理:发生概率很小的随机事件在一次实 验中是几乎不可能发生的。
概率小到多小才算是“小”?通常用显
8.7 - 9
=
= 3.162
2.5 10
5.1.1 假设检验基本原理
3)确定拒绝域 • 在检验统计量抽样分布的尾部(1侧或2侧)中划定 一小概率区域,一旦计算的检验统计量的实际值落 入此区域,就否定原假设,接受备择假设。 • 这个小概率也称为显著性水平,用 表示 • 通常取 =5%或 =1%
双侧检验
单侧检验 左侧检验 右侧检验
H0 : = 0 H0 : 0 H0 : 0
备择假设
H1 : 0 H1 : < 0 H1 : > 0
5.1.2 假设检验相关概念
• 例(续) –左侧检验
1)假设: H0: 9, HA: < 9
2)检验统计量:同双侧检验, z = -3.162
5.1 假设检验的基本问题
5.1.1 假设检验基本原理
假设:对总体的某些未知的或不完全知道的性质所 提出的待考察的命题。
假设检验:对假设成立与否做出的推断。
5.1.1 假设检验基本原理
问题的提出 – 例 :某猪场称该场的猪在体重为100kg时的平均背膘厚度 为9mm。 – 问题:此说法是否正确?有4种可能性(假设)
概率论与数理统计
主讲:孟丽丽
概率部分 第一章 概率论基本概念 第二章 随机变量及其分布
统计部分 第三章 统计基础知识 第四章 参数估计 第五章 假设检验 第六章 方差分析 第七章 相关与回归

第5章 假设检验

第5章 假设检验

两类错误与显著性水平
两类错误
假设检验的依据是:小概率事件在一次试验中
很难发生. 但“很难发生”不等于“不发生”, 因而 假 假设检验是由局部推断总体,并且 设检验所作出的结论有可能是错误的. 这种错误
是在给定检验水平的前提下进行 有两类: (1)推断,接受还是拒绝原假设完全取 当原假设H0为真, 观察值却落入拒绝域, 而 决于样本值, 因此所作检验可能导 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 致两类错误的产生
小 结
•构造一个统计量来决定是“接受原假设,拒绝备选假 设”,还是“拒绝原假设,接受备选假设”。
•对不同的问题,要选择不同的检验统计量。检验统计 量确定后,就要利用该统计量的抽样分布以及由实际 问题中所确定的显著性水平,来进一步确定检验统计 量拒绝原假设的取值范围,即拒绝域:
– 在给定的显著性水平α下,检验统计量的可能取值范围被 分成两部分:小概率区域与大概率区域。小概率区域就是 概率不超过显著性水平α的区域,是原假设的拒绝区域; 大概率区域是概率为1-α的区域,是原假设的接受区域。
检验统计量与拒绝域
检验统计量
(test statistic)
1. 根据样本观测结果计算得到的,并据以对 检验统计量实际上是总体参数的点估计量, 原假设和备择假设作出决策的某个样本统 由于其随机性,需要进行标准化后,才能用 计量 作检验的标准,以反映点估计量与假设的总体
参数相比,相差多少个标准差 2. 对样本估计量的标准化结果 – 原假设H0为真

H0 :μ = 某一数值
指定为符号 ≤, =或≥ – 例如, H0 :μ =10cm

备择假设
(alternative hypothesis)

第5章 功效函数

第5章 功效函数

形式参数的非参数检验
• 例如位置检验: 位 检验 F(x)连续, 连续 ( )关 关于0点 点对称。H0: =0 H1: >0. F(x) • 形式参数 =(, F(t)). • 零假设: 零假设 0={(0,F(t)) {(0 F(t)) | F(t)连续关于0点对 称}。 • 备择假设:1={(,F(t)) | >0, F(t)连续关于 0点对称}。
两样本位置检验的相合性判断(I)
• H0:=0 H1:>0.用Mann-Whitney统计量U进行检验。U是 参数=Pr(X<Y)的U统计量。令 统计量 令K()=P(X<Y).
• 当=0时,由对称性知 时 由对称性知K()=1/2. )=1/2 在H0下, 下
两样本位置检验的相合性判断(II)
两样本功效函数性质(无偏性)
• 定 定理5.2 设随机变量X1,, Xm独立同分布,分布函 独立同分布 分布 数为F(x)连续,随机变量Y1,, Yn独立同分布,分 布 数为F(x-).假设检验问题H0: = 布函数为 H1:>0. 对上述两样本问题有统计量S(X1,, Xm;y1,,yn), 拒绝域为 如果S满足 则这个检验的功效函数对单调,即
例子1的功效函数(II)
参数无偏检验
• 定义 义5.2: (无偏检验 偏检验Unbiased test) H0不成 拒 H0的概率大于或者等于 概率大 等 H0成立时 立时拒绝 拒绝H0的概率。 • 对应于功效函数即
参数相合检验
• 定义5.3 5 3 称一个检验序列对 称 个检验序列对H1中的所有备择选择 是相合的,如果H1下的任意一个固定的备择选择, 当样本量趋于无穷时 检验的功效趋于1.0, 当样本量趋于无穷时,检验的功效趋于 1 0 而序 列中每个检验的显著水平,尽可能地趋于但不超 过某一固定的显著水平 过某 固定的显著水平>0. >0 • 对例1, 1 固定检验水平后,对于给定的样本量 后 对于给定的样本量n, n可 以决定一个阈值Tn, 拒绝域为 功效函数 为

第五章参数估计和假设检验Stata实现

第五章参数估计和假设检验Stata实现

第五章参数估计和假设检验的Stata实现本章用到的Stata命令有例5-1 随机抽取某地25名正常成年男子,测得其血红蛋白含量如下:146 7 125 142 7 128 1401 7 144 151 117 118该样本的均数为137.32g/L,标准差为10.63g/L,求该地正常成年男子血红蛋白含量总体均数的95%可信区间。

数据格式为计算95%可信区间的Stata命令为:结果为该地正常成年男子血红蛋白含量总体均数的95%可信区间为(132.93~141.71)例5-2 某市2005年120名7岁男童的身高X=123.62(cm),标准差s=4.75(cm),计算该市7岁男童总体均数90%的可信区间。

在Stata中有即时命令可以直接计算仅给出均数和标准差时的可信区间。

结果为:该市7岁男童总体均数90%的可信区间(122.90~124.34)。

例5-3 为研究铅暴露对儿童智商(IQ)的影响,某研究调查了78名铅暴露(其血铅水平≥40 g/100ml)的6岁儿童,测得其平均IQ为88.02,标准差为12.21;同时选择了78名铅非暴露的6岁儿童作为对照,测得其平均IQ为92.89,标准差为13.34。

试估计铅暴露的儿童智商IQ的平均水平与铅非暴露儿童相差多少,并估计两个人群IQ的总体均数之差的95%可信区间。

本题也可以应用Stata的即时命令:结果:差值为4.86,差值的可信区间为0.81~8.90。

例5-4 为研究肿瘤标志物癌胚抗原(CEA)对肺癌的灵敏度,随机抽取140例确诊为肺癌患者,用CEA进行检测,结果呈阳性反应者共62人,试估计肺癌人群中CEA的阳性率。

Stata即时命令为结果为肺癌人群中CEA的阳性率为44.28%,可信区间为35.90%~52.82%。

例5-5 某医生用A药物治疗幽门螺旋杆菌感染者10人,其中9人转阴,试估计该药物治疗幽门螺旋杆菌感染者人群的转阴率。

Stata即时命令为结果为例5-6 某市区某年12个月发生恶性交通事故的次数分别为:5, 4, 6, 12, 7, 8, 10, 7, 6, 11, 3, 5假设每个月恶性交通事故的次数服从Poisson分布,试估计该市平均每个月恶性交通事故的次数的95%可信区间。

《统计学》第5章 假设检验

《统计学》第5章 假设检验
假设。原假设通常用H0 表示,也称为“零假设”;备择假设指的是当原
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),

样本大小与功效

样本大小与功效

样本大小与功效我们在进行假设检验的时候,一般会设置显著性水平,即我们发生第一类错误的概率,α=P(第I类错误)=P(拒绝H0|H0为真)基于显著性水平,我们可以进行拒绝域的计算,从而基于当前样本数据来推断整体数据的假设,随着计算机技术的进步,我们更能方便的通过计算的P值来判断当前样本假设检验的情况。

如果有两组样本都通过了我们的假设检验,是否说明这两组样本数据所代表的整体数据是一致的呢?就拿我们上周的找真爱这个例子,陷入爱河的两个人,为了爱情做出了很多让人惊叹的爱情故事,这时的她觉得当前这个人就是她的白马王子,此时的她,觉得他是如此的完美,但她的闺蜜却看到了一些不好的事情,并告诉她,他是很爱他,但是他也许并不是那么的完美。

我们这时候需要引入一致最大功效(UMP)准则来判断,谁的判断是更好的。

所谓的一致最大功效(UMP)准则,就是当给定检验水平α后,在所有满足的可供选择的检验样本中,哪个的样本的功效越大,那么那个假设样本则更为准确,这个就是所谓的一致最大功效检验,简称UMP检验,即:Power=1−β=P(拒绝H0|H1为真)从上述公式来看,所谓功效,就是当原假设为假的时候,你能拒绝它的概率,它反映了这个假设能够识别错误的能力。

当假设检验都能够通过显著性检验之后,我们可以假设检验具备了一定的检验正确情况的能力,此时,如果哪个假设样本的功效越大,意味着它识别错误的能力越强,那它就是更好的假设检验判定。

图:如何判断真爱如上图所示,深陷爱海中的她,觉得他一切都是好的,把一些假爱的行为也认为是真爱;而更加冷静的闺蜜,则看出了这些行为,所以相比她,闺蜜的判断则是更为准确的。

这种能够将错误行为识别出来的能力,我们称为POWER(功效),它是衡量这次通过显著性水平的假设检验中,谁更好的一个重要参数。

POWER(功效)是如此重要的参数,我们接下来看看它的大小会和那些因素有关联:1.客观差异越大,功效越大。

就是样本同检验标准之间的差异越大,此时假设检验的功效越大,就拿我们的中国足球来说,有人说随着国内联赛的水平提升,国家队的水平也得到了进步。

假设检验案例辨析及参考答案

假设检验案例辨析及参考答案

第5章假设检验案例辨析及参考答案案例5-1 为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的检验,随机抽取25名患者服用了新药,以常规药的疗效均值为,进行检验,无效假设是,对立假设是,检验水平α=1%。

结果值很大,拒绝了无效假设。

“拒绝了无效假设”意味着什么?下面的说法你认为对吗?(1)你绝对否定了总体均数相等的无效假设。

(2)你得到了无效假设为真的概率是1%。

(3)你绝对证明了总体均数不等的备择假设。

(4)你能够推论备择假设为真的概率是99%。

(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。

(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。

提示:就类似的问题,Haller和Kruss(2002)在德国的6个心理系问了30位统计学老师、44位统计学学生和39位心理学家。

结果所有的统计学学生、35位心理学家和24位统计学老师认为其中至少有一条是正确的;10位统计学老师、13位心理学家和26位统计学学生认为第4题是正确的。

(见Statistical Science, 2005, 20(3):223-230.)案例辨析6个选择均不正确。

(1)可能犯Ⅰ类错误。

(2)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率。

(3)可能犯Ⅰ类错误。

(4)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率,而不是推论备择假设为真的概率是99%。

(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是。

(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;1-=99%是指无效假设成立的条件下不犯错误的概率是99%。

正确做法“拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为。

案例5-2 某工厂生产的某医疗器械的合格率多年来一直是80.0%。

最近从该厂一次抽取20个该器械检测,合格13个,计算得到合格率为65.0%;一周后又抽取15个器械检测,合格10个,计算得到合格率为66.7%,分别进行检验,得到两总体率相等的结论,表明合格率没下降,两个合格率的平均值为65.85%,进行检验,得到两总体率不等的结论,表明合格率下降了。

医学统计学课后案例分析答案:第5章 假设检验

医学统计学课后案例分析答案:第5章 假设检验

第5章 假设检验案例辨析及参考答案案例5-1 为了比较一种新药与常规药治疗高血压的疗效,以血压下降值为疗效指标,有人作了单组设计定量资料均数比较的t 检验,随机抽取25名患者服用了新药,以常规药的疗效均值为0μ,进行t 检验,无效假设是0μμ=,对立假设是0μμ≠,检验水平α=1%。

结果t 值很大,拒绝了无效假设。

“拒绝了无效假设”意味着什么?下面的说法你认为对吗?(1)你绝对否定了总体均数相等的无效假设。

(2)你得到了无效假设为真的概率是1%。

(3)你绝对证明了总体均数不等的备择假设。

(4)你能够推论备择假设为真的概率是99%。

(5)如果你决定拒绝无效假设,你知道你将犯错误的概率是1%。

(6)你得到了一个可靠的发现,假定重复这个实验许多次,你将有99%的机会得到具有统计学意义的结果。

提示:就类似的问题,Haller 和Kruss (2002)在德国的6个心理系问了30位统计学老师、44位统计学学生和39位心理学家。

结果所有的统计学学生、35位心理学家和24位统计学老师认为其中至少有一条是正确的;10位统计学老师、13位心理学家和26位统计学学生认为第4题是正确的。

(见Statistical Science, 2005, 20(3):223-230.) 案例辨析 6个选择均不正确。

(1)可能犯Ⅰ类错误。

(2)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率。

(3)可能犯Ⅰ类错误。

(4)α=1%是表示在无效假设成立的条件下,犯Ⅰ类错误的概率,而不是推论备择假设为真的概率是99%。

(5)在无效假设成立的条件下,就该例拒绝无效假设犯错误的概率是P 。

(6)在无效假设成立的条件下,还可能犯错误,并不是完全“可靠”的发现;1-α=99%是指无效假设成立的条件下不犯错误的概率是99%。

正确做法“拒绝了无效假设”意味着在无效假设成立的条件下,推断犯错误的概率为P。

案例5-2 某工厂生产的某医疗器械的合格率多年来一直是80.0%。

医学统计5第五章 假设检验

医学统计5第五章 假设检验

二、双侧检验和单侧检验
在进行t 检验时,如果其目的在于检验两个总体均数 是否相等,即为双侧检验。例如检验某种新降压药与常 用降压药效力是否相同?就是说,新药效力可能比旧药 好,也可能比旧药差,或者力相同,都有可能。
如果我们已知新药效力不可能低于旧药效力,例如 磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用 磺胺药,这时,无效假设为H0, 备择假设为H1: 1>2 , 统计上称为单侧检验。
第五章 假设检验
一、假设检验的基本思想
例:已知一般中学男生的心率平均数为74次/分钟, 标准差为6次/分钟,为研究经常参加体育锻炼的中学 生心脏功能是否增强,在某地区随机抽取常年参加体 育锻炼的男生100名,求得心率平均数为65次/分钟。
如果一个事件发生的概率很小,那么在只进行一次试 验时这个事件是“不会发生的”,一旦发生了,称其 为小概率事件。统计类错误
设H0:=0,H1:>0, =0.05, 将拒绝了正确的无效假设 H0 称为I 类错误(type I error):也称为假阳性错误,当实际上真的为0,即H0: =0原本是正确的,但由于偶然因素的影响,随机抽样时, 得 到 一个较 大 的检验 统 计量 t 值 ,故 t t, 时 , 则 P0.05 时,按所取检验水准 只能拒绝H0,接受H1,结 论为>0, 由于拒绝了实际上是正确的H0,此推断结论当 然是错误的,即犯了I 型错误。I 型错误的概率是=0.05。
本例是均数的比较,是将常年参加体育锻炼心率平均 数为65次/分钟(它代表的总体有一总体均数)与一般中学 男生的心率平均数为74次/分钟。
研究者可能有两种目的: – ① 推断两个总体均数有无差别。不管是常年参加体育锻
炼心率高于一般,还是常年参加体育锻炼心率低于一般, 两种可能性都存在,研究者同等关心,应当用双侧检验。 – ② 根据专业知识,已知常年参加体育锻炼心率不会低于 一般,或是研究者只关心常年参加体育锻炼心率是否高 于一般,不关心常年参加体育锻炼心率是否低于一般, 应当用单侧检验。

第5章抽样估计和假设检验

第5章抽样估计和假设检验

第5章 抽样估计和假设检验
• §5.1.1 • 2.总体和样本 • 总体也称全及总体,指所要认识研究对象的全体。
它是由所研究范围内具有某种共同性质的全体单 位所组成的集合体。总体的单位数通常是很大的, 甚至是无限的,一般用N表示总体的单位数。 • 样本又称子样,它是从全及总体中随机抽取出来 的们作为代表这一总体的哪部分单位组成的集合 体,样本的单位数是有限的,相对值或标志属性 决定的。
• 1. 抽样平均误差的计算方法
• 样本平均数的抽样平均误差
• ⑴ 重复抽样: • ⑵ 不重复抽样:
x
2
nn
x
2 N n
n N 1 n
1 n N
第5章 抽样估计和假设检验
• 2. 样本比例的抽样平均误差
• ⑴ 重复抽样:
p
P
n
P(1 P) n
• ⑵ 不重复抽样: p
• §5.2.1 抽样分布 • 3. 样本方差的分布
• 当总体服从正态分布 N , 2 时,
n 1S 2 2
• 服从 2 分布(将在下一节中介绍),其中
样本方差为
s2 1 n n 1 i1
2
xi x
第5章 抽样估计和假设检验
• §5.2.1 抽样分布
• 4. 样本比例的分布
• 总体中具有某种属性的单位数与总体全部单位数 之比称为总体的比例,记作。而样本中具有某种 属性的单位数与样本总数之比称为样本比例,记 作。
第5章 抽样估计和假设检验
• §5.2.1 抽样分布
• 2. 样本均值的抽样分布
• 若 则从总总体服体从中均抽值取为出的,样方本差均为值仍2的然正服态从分正布,
态分布,即。
X

第五章-假设检验

第五章-假设检验
建立的原假设与备择假设应为
H0: 1500 H1: 1500
1-29
第二十九页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,改进生产工艺后,会使 产品的废品率降低到2%以下。检验这 一结论是否成立
研究者总是想证明自己的研究结论(废品率 降低)是正确的
H0: 355 H1: 355
1-28
第二十八页,编辑于星期五:十八点 三十四分。
单侧检验
(原假设与备择假设的确定)
一项研究表明,采用新技术生产后,将 会使产品的使用寿命明显延长到1500小 时以上。检验这一结论是否成立
研究者总是想证明自己的研究结论(寿命延 长)是正确的
备择假设的方向为“>”(寿命延长)
假设其中真有99个白球,摸 出红球的概率只有 1/100 ,
这是小概率事件。
➢小概率事件在一次试验中竟然发生了,不能不 使人怀疑所作假设的正确性,因此可以认为这 个盒子应该不是装有99个白球的那个盒子。
这个例子中所使用的推理方法,称为“带概率性
质的反证法”,或“概率反证法”。
2022/8/9
1-11
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-26
第二十六页,编辑于星期五:十八点 三十四分。
双侧检验 (显著性水平与拒绝域)
抽样分布
拒绝域 /2
1 -
置信水平 拒绝域 /2
临界值
H0值 临界值
样本统计量
1-27
第二十七页,编辑于星期五:十八点 三十四分。
单侧检验
第五章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章 假设检验的功效与样本量
• 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。

• 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。

5.1 两类错误与功效
1. 两类错误的概率
H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0-
(5.2) (略) • 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为
第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) • 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病
第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) • 两类错误的背景:
拒绝H 0时可能犯第Ⅰ类错误
不拒绝H 0时可能犯第Ⅱ类错误
• 两类错误的后果:
第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 • 一般α, β的数值要在科研设计时事先确定
2. 功效 (power)
• 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β
(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β
(5.5) • 功效就是真实有效的药物被发现的概率∕疾病被诊断出
来的概率
5.2 影响功效的四要素
• 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6) • 功效的影响因素为:δ=0μ-x ,σ,n ,α
X ≥μ0+Z αn σ (5.7) (略) • 现用X 分布图形来定性地讨论四要素对功效的影响
1. 客观差异越大,功效越大
X ~N(μ,σ2/n) (5.8) (略)
若H 0为真,X ~N(μ0,σ2/n) (5.9) (略)
若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) (略)
2. 个体间标准差越小, 功效越大。

3. 样本量越大,功效越大
4. α值越大,功效越大
• 筛选新药时α大些,以免漏掉有苗头的新药(α=0.10/0.20) 新药上市前α小些,以免误将真实无效的新药大量生产(α=0.01)
(a)个体标准差s 1较大或样本量n 1较小; (b)个体标准差s 2较小或样本量n 2较大 图5.2 个体间标准差越小或样本量越大,功效越大
(a) α1较小; (b) α2较大
图5.3 α值越大,功效越大
(a)均数间实际距离d 1较小 (1.5); (b)均数间实际距离d 2较大(1.8) 图5.1 均数间差异越大,功效越大
5.3 功效与四要素的定量关系
1. 单组样本均数的检验
()()βασδμσμZ n n Z -=+-+00 (5.11) (略) 简化后得到
例5.1 某药的平均有效时间原为6小时,现改进了配方,据称可延长至7小时。

为核实这一点,某研究组观察了25例该病患者,得到的却是阴性结果(P >0.05),即不能认为平均有效时间长于6小时,试分析原因。

解 这个问题实际上是检验假设 H 0:μ=6, H 1: μ>6 据题意,不妨令δ=1。

σ的数值可参考此次25例的观察结果,设连同以往经验猜测σ=2。

将δ=1,σ=2,n =25和单侧Z 0.05=1.64代入(5.12)式 Z β=05.02
125Z Z n -⨯=-ασδ
= 0.86 查标准正态分布表得()8051.086.0=Φ,即1-β=0.8051 果表明,此项检验的功效为80.51%
2. 两组样本均数的检验 欲检验假设
图5.4 两组样本均数检验示意图
例5.2 一项关于降血压药的临床试验分设两组随机样本,各含15例同病患者。

一组服用常规药,另一组服用新药。

如果新药的降压效果至少比常规药平均高出0.8kPa 方可考虑在临床推广; 据以往经验,不论常规药还是这种新药,个体降压值的标准差约为1kPa 。

经α=0.05水平的两组均数比较的统计检验,两组平均降压效果的差异尚无统计学意义,此事如何理解?
解 据题意,这是关于两组均数的一项单侧检验 δ=0.8,σ=1,n =15,单侧Z 0.05=1.64,代入(5.18)式得 Z β =21518.0⎪⎭
⎫ ⎝⎛- Z 0.05 = 0.5509
查标准正态分布表,得()7088.05509.0=Φ,即1-β=0.7088只有70.88%的机会被此检验得出有差异的结论。

3. 两组样本频率的检验(大样本)
欲检验假 H 0:π1=π2, H 1:π1>π2 (5.19) (略) 根据正态近似两组样本均数的检验,有功效的计算公式
其中,δ=π1-π2
例5.3 一项关于维生素C 预防感冒作用的研究随机抽取两组正常人各30名,一组服用维生素C ,另一组服用安慰剂,欲比较一定时期内发生感冒的频率。

结果,安慰剂组有6人发生感冒,维生素C 组有3人发生感冒,经α=0.05水平的检验,差异无统计学意义,此事如何理解?
解 π1=20%,假定π2=10%或更低时认为值得重视,n =30和α=0.05代入(5.19)式,
()()
5446.0645.110.0110.020.0120.03010.0-=--+-=βZ
查标准正态分布表得()2929.05446.0=-Φ,即1-β=0.2929,功效只有29.29%。

5.4 常用统计检验的样本量估算
1.
单组样本均数的检验 改写功效估计公式(5.12)得 • 估计样本含量的影响因素,类似于功效:α,β,δ,σ
例5.4 为较好地解决例5.1中的新药论证问题,至少需要多大样本量?
解 α=0.05, β=0.01, δ=1, σ=2,以及Z 0.05=1.64,单侧Z 0.01=2.33,代入公式,
n =2201.005.05.033.264.121⎪⎭⎫ ⎝
⎛+=⎪⎪⎭⎫ ⎝⎛+Z Z =63.0436≈63
以n =63查t 界值表,得t 0.05(62)与t 0.01(62)再次代入公式计算,如此多次迭代计算,当结果变化很小时便获得n 的估计值。

• 近似计算:在据Z α和Z β求得的n 值基础上再增补0.5Z 2α作为最终的样本量估算值。

这样,例5.3的样本量可取为
n =63.0436+0.5(1.64)2=64.3884≈65。

2. 两组样本均数的检验
类似地,改写(5.18)式,我们又有
例5.5 为较好地解决例5.2中新药论证问题,至少需要多大样本量?
解 仍象例5.2那样取δ=0.8,σ=1,单侧Z 0.05=1.64。

为减少埋没较好药物的机会,令β=0.05,代入(5.21)式, n =22
205.005.08.064.164.118.0⎪⎭⎫ ⎝⎛+=⎪⎪⎭⎫ ⎝⎛+Z Z =33.62≈34 类似地近似计算得
n =33.62+0.25(1.64)2=34.2924≈35。

3. 两组样本频率的检验(大样本)
改写(5.20)式,我们有样本量的计算公式
例5.6 为较好地进行例5.3中维生素C 预防作用的研究,至少需要多大样本量?
解 仍取π1=20%,π2=10%。

为了不致埋没维生素C 的预防作用,取β=0.01。

将单侧Z 0.05=1.64, 单侧Z 0.01=2.33连同π1和π2的数值代入(5.22)式,
n =210.033.264.1⎪⎭⎫ ⎝⎛+ [0.20(1-0.20)+0.10(1-0.10)]
=394.0225≈394
5.5 实例点评
• 新药强力新甘草甜素(SNMC)治疗慢性乙型肝炎的效果, • 资料与方法:
1.病人选择 2.试验药物及使用方法
表5.1 治疗前的基本资料
对照组 28±8.4 23 1 26.2 24 0 23 0 1
表5.2 治疗前的主要肝功能指标(8项)
•点评要点:
(1)作者设计周密
(2)因样本含量过小,功效很低(国家药监局规定每组n>100)
结论:尚不能认为新药与对照药疗效相同
结语:
重点是对两类错误、功效、样本含量估计的理解(计算次要)
1. 对总体推论时要时刻想着两类错误问题
2. 试验设计时必须事先估计检验功效与样本含量。

相关文档
最新文档