第五章统计学教案(假设检验)

合集下载

教育与心理统计学 第五章 假设检验考研笔记-精品

教育与心理统计学  第五章 假设检验考研笔记-精品
把出现小概率的随机事件称为小概率事件。
假设检验中的小概率原理[一级][16J]
假设检验的基本思想是概率性质的反证法,即其基本思想是基于〃小概率事件在一次实验中不可能发生”这一原理。首先假定虚无假设为
真,在虚无假设为真的前提下,如果小概率事件在一次试验中出现,则表明〃虚无假设为真"的假定是不止确的,因为假定小概率事件在
一次试验中是不可能出现的,所以也就不能接受虚无假设,应当拒绝零假设。若没有导致小概率事件出现,那就认为"虚无假设为真”的
假定是正确的,也就是说要接受虚无假设。假设推断的依据:小概率事件是否出现,这是对假设作出决断的依据。
检验的假设
Ho为真
真实情况
检验的事件发生的概率在99%或95%的范围内
检验的事件发生的概率在5%或1%以内
错误的概率,其前提是“Ho为假
②它们都是在做假设检验的统计决策时可能犯的错误,决策者同时面临犯两种错误的风险,因此都极力想避免或者减少它们,但由于在忠
体间真实差异不变情况下,它们之间是一种此消彼长的关系,即a大时,0小;c(和B不能同时减少。
③在其他条件不变的情况下,不可能同时减小或增大两种错误的发生可能,常用的办法是固定a的情况下尽可能减小B,比如通过增大样本
若进行假设检验时总体的分布形态已知,需要对总体的未知参数进行假设检验,称其为参数假设检验。
(三)非参数检验[一级]
若对总体分布形式所知甚少,需要对未知分布函数的形式及其他特征进行假设检验,通常称为非参数假设检验。
(四)小概率事件和显著性水平
(1)假设推断的依据就是小概率原理
小概率事件:通常情况下,将概率不超过0.05(即5%)的事件当作“小概率事件",有时也定为概率不超过0.01(即1%)或0.001(0.1%\

医学统计学假设检验

医学统计学假设检验

❖ 例如,根据大量调查,已知正常成年男性 平均脉搏数为72次/分,现随机抽查了20名 肝阳上亢成年男性病人,其平均脉搏为84 次/分,标准差为6.4次/分。问肝阳上亢男 病人的平均脉搏数是否较正常人快?
❖ 以上两个均数不等有两种可能:
第一,由于抽样误差所致;
第二,由于肝阳上亢的影响。
例如
已知正常成年男子脉搏平均为72 次/分,现随机检查20名慢性胃炎所致 脾虚男病人,其脉搏均数为75次/分, 标准差为6.4次/分,问此类脾虚男病人 的脉搏快于健康成年男子的脉搏?
2、假设检验的目的
判断是由于何种原因造成的不同,以做出决策。
3、假设检验的原理
反证法:当一件事情的发生只有两种可能A和B,为了肯
定其中的一种情况A,但又不能直接证实A,这时否定另一 种可能B,则间接的肯定了A。
概率论(小概率) :如果一件事情发生的概率很小,那
么在进行一次试验时,我们说这个事件是“不会发生的”。 从一般的常识可知,这句话在大多数情况下是正确的,但是 它一定有犯错误的时候,因为概率再小也是有可能发生的。
α是在统计推断时,预先设定的一个小概率值,是当H0 为真时,允许错误地拒绝H0的概率。
双侧与单侧检验界值比较
(2) 选定适当的检验方法,计算检验
统计量值 t 检验 Z 检验
❖ 设计类型 ❖ 资料的类型和分布 ❖ 统计推断的目的 ❖ n的大小 ❖ 如完全随机设计实验中,已知样本均数
与总体均数比较,n又不大,可用t检验, 计算统计量t值。
(1)建立假设,选定检验水准:
假设两种:一种是检验假设,假设差异完全由抽样误差造 成,常称无效假设,用H0表示。另一种是和H0相对立的备 择假设,用H1表示。假设检验是针对H0进行的。

假设检验《统计学原理》课件

假设检验《统计学原理》课件
图b
X=X1>X0
H0为伪
从上图可以看出,如果临界值沿水平方向右移,α将变小而β变大,即若减小 α错误,就会增大犯β错误的机会;如果临界值沿水平方向左移,α将变大而 β变小,即若减小β错误,也会增大犯α错误的机会,
a 错误和 错误的关系
在样本容量n一定的情况下,假设检验不能同时做到犯α和 β两类错误的概率都很小,若减小α错误,就会增大犯β错误 的机会;若减小β错误,也会增大犯α错误的机会,要使α和 β同时变小只有增大样本容量,但样本容量增加要受人力、 经费、时间等很多因素的限制,无限制增加样本容量就会 使抽样调查失去意义,因此假设检验需要慎重考虑对两类 错误进行控制的问题,
参数假设检验举例
例2:某公司进口一批钢筋,根据要求,钢筋的 平均拉力强度不能低于2000克,而供货商强 调其产品的平均拉力强度已达到了这一要 求,这时需要进口商对供货商的说法是否真 实作出判断,进口商可以先假设该批钢筋的 平均拉力强度不低于2000克,然后用样本的 平均拉力强度来检验假设是否正确,这也是 一个关于总体均值的假设检验问题,
假设检验的两类错误
正确决策和犯错误的概率可以归纳为下表:
假设检验中各种可能结果的概率
H0 为真
接受H0
1-α 正确决策
拒绝H0,接受H1
α 弃真错误
H0 为伪
β 取伪错误
1-β 正确决策
•假设检验两类错误关系的图示
以单侧上限检验为例,设H0 :X≤X0 , H1:X>X0
图a X≤X0 H0为真
a
H0值
样本统计量 临界值
观察到 的样本 统计量
5、假设检验的两类错误
根据假设检验做出判断无非下述四种情况:
1、原假设真实, 并接受原假设,判断正确; 2、原假设不真实,且拒绝原假设,判断正确; 3、原假设真实, 但拒绝原假设,判断错误; 4、原假设不真实,却接受原假设,判断错误, 假设检验是依据样本提供的信息进行判断,有犯错误的可 能,所犯错误有两种类型: 第一类错误是原假设H0为真时,检验结果把它当成不真而 拒绝了,犯这种错误的概率用α表示,也称作α错误 αerror 或弃真错误, 第二类错误是原假设H0不为真时,检验结果把它当成真而 接受了,犯这种错误的概率用β表示,也称作β错误 βerror 或取伪错误,

统计学导论 科学出版社 第五章 假设检验

统计学导论  科学出版社 第五章 假设检验

右侧检验

H1 : µ > µ0
H1 : µ > µ0
确定适当的检验统计量
什么检验统计量? 什么检验统计量?
用于假设检验问题的统计量 选择统计量的方法与参数估计相同, 选择统计量的方法与参数估计相同,需考虑
是大样本还是小样本 总体方差已知还是未知
检验统计量的基本形式为
z= x − µ0
σ
n
选择显著性水平α,确定临界值

☺ ☺ ☺ ☺ ☺ ☺ ☺ ☺
抽取随机样本
均值 ☺ ☺ X = 20
假设检验的基本思想
抽样分布
这个值不像我 们应该得到的 样本均值 ... ... 因此我们拒 绝假设 µ = 50
... 如果这是总 体的真实均值 20
µ = 50 H0
样本均值
假设检验应用举例
例1:抽样检验食品包装机工作是否正常 : 例2:由样本推断产品次品率是否超标 : 例3:研究黑人儿童是否有民族意识 : 例4:检验电池寿命波动性是否有显著变化 : 5: 例5:判断男女职工看电视时间是否有显著差异 例6:检验新工艺是否比旧工艺更好 : 例7:研究生活习惯是否影响血压 : 例8:检验两次地震间的天数是否服从指数分布 : 例9:比较两公司进货次品率,作出进货决策 :比较两公司进货次品率,
3、特点 、
采用逻辑上的反证法 依据统计上的小概率原理
第一节 假设检验的基本原理
一. 假设检验的一般思想 二. 假设检验的步骤 三. 假设检验的两类错误
假设检验的过程
(提出假设→抽取样本→作出决策) 提出假设→抽取样本→作出决策)
提出假设 作出决策
拒绝假设! 拒绝假设 别无选择. 别无选择
总体

《生统》第五章 假设检验-t检验

《生统》第五章 假设检验-t检验
表5-4 粤黄鸡饲养试验增重 饲料 A B 8 8 ni 增 重(g) 720、710、735、680、690、705、700、705 680、695、700、715、708、685、698、688
ni
检验步骤:
1、提出无效假设与备择假设 H0:μ1=μ2,HA: μ1 ≠ μ2 2、计算 t 值
表5-2 非配对设计资料的一般形式
处理 1 2 观察值xij x11, x12,… x1j X21, x22,… x2j 样本含量ni n1 n2i 平均数 总体平均数 μ1 μ2
x1 x2
显著性检验的基本步骤:
(一)提出无效假设与备择假设 (二)计算值 计算公式为:
t x1 x 2 S x1 x2
结论:差异极显著
二、配对设计两样本平均数 差异显著性检验
1、自身配对 2、同源配对 配对设计两样本平均数差异显著性检验的基本步骤: (一)提出无效假设与备择假设 (二)计算 t 值
d t Sd
Sd Sd n
d d
n(n 1)
2

d
2
n(n 1)
( d ) 2 / n
检验步骤:
2、计算 t 值
S x1 x2
( x1 x1 ) 2 ( x2 x2 ) 2 ( 1
(n1 1) (n 2 1)
n1

1 ) n2
1、提出无效假设与备择假设
sx1 x2
2 S12 (n1 1) S2 (n2 1) 1 1 (n1 1) n2 1) n1 n2
|t|<t0.05, |t|≥ t0.01 , 则 P>0.05 则 P≤0.01 差异不显著 差异显著 差异极显著 t0.01 ≤|t|< t0.05 ,则 0.01<P≤0.05

《统计学》第5章 假设检验

《统计学》第5章 假设检验
假设。原假设通常用H0 表示,也称为“零假设”;备择假设指的是当原
假设不成立时,即拒绝原假设时备以选择的假设,通常用H1 表示。备择
假设和原假设互斥,如在例5.1中,原假设是“2022 年全国城市平均
PM2.5 浓度与2018 年相比没有显著差异”,那么备择假设就是“2022
年全国城市平均PM2.5 浓度与2018 年相比存在显著差异”。相应的统计
小越好。但是,在一定的样本容量下,减少犯第I类错误的概率,就会
使犯第II类错误的概率增大;减少犯第II类错误的概率,会使犯第I类
错误的概率增大。增加样本容量可以使犯第I类错误的概率和犯第II类
错误的概率同时减小,然而现实中资源总是有限的,样本量不可能没有
限制。因此,在给定的样本容量下,必须考虑两类可能的错误之间的权
易被否定,若检验结果否定了原假设,则说明否定的理由是充分的。
第四章 参数估计
《统计学》
16
5.1 假设检验的基本原理
(四) P值法
假设检验的另一种常用方法是利用P值(P-value) 来确定检验决策。P值
指在原假设0 为真时,得到等于样本观测结果或更极端结果的检验统计
量的概率,也被称为实测显著性水平。P值法的决策规则为:如果P值大
1.96) 中。这里−1.96和1.96 称为临界值,区间(−1.96, 1.96) 两侧的
区域则被称为拒绝域。基于样本信息,可以计算得到相应的z检验统计量
值,已知ҧ = 46,0 = 53, = 14 , n = 100 = −5
14/10
第四章 参数估计
《统计学》
14
5.1 假设检验的基本原理
犯第I 类(弃真) 错误的概率 也称为显著性水平(Significance level),

医学统计学-假设检验概述

医学统计学-假设检验概述

二、假设检验应注意的问题
假设检验利用小概率反证法思想,从问题对立面 (H0)出发间接判断要解决的问题(H1)是否成立。在H0 成立的条件下计算检验统计量,获得P值来判断。当P ≤,就是小概率事件。
小概率事件原理:小概率事件在一次抽样中发生 的可能性很小,如果它发生了,则有理由怀疑H0,认 为H1成立,该结论可能犯的错误。
当不拒绝H0时,没有拒绝实际上不成立的H0,这 类错误称为Ⅱ类错误(“存伪”),其概率大小用β 表示。
假设检验中的两类错误
客观实际
拒绝H0
不拒绝H0
H0成立 第Ⅰ类错误(α) 推断正确(1- α)
H0不成立 推断正确(1- β) 第Ⅱ类错误(β)
α与β的关系: 当样本量一定时, α愈小, 则β愈大,反之α愈大,
距法
理论上:
• 总体偏度系数1=0为对称,1>0为正偏态,1<0为负偏态; • 总体峰度系数2=0为正态峰,2>0为尖峭峰,2<0为平阔峰。 • 只有同时满足对称和正态峰两个条件时,才能认为资料服从
假设检验概述
第五章 假设检验概述
第一节 假设检验的分类、论证方法与步骤 一、假设检验的分类 二、假设检验的论证方法 三、假设检验的步骤
第二节 假设检验的两类错误和注意事项 一、Ⅰ型错误和Ⅱ型错误 二、应用假设检验的注意事项
第三节 正态性检验与数据转换 一、正态性检验 二、数据转换
第四节 例题和SPSS电脑实验
P>:不拒绝H0 ,还不能认为差异有统计学意义… P:拒绝H0,接受H1 ,差异有统计学意义…
第二节 假设检验的两类错 误和注意事项
一、Ⅰ型错误和Ⅱ型错误
1. Ⅰ型错误: 当拒绝H0时,可能拒绝了实际上成立的H0,这

第五章-回归模型的假设检验

第五章-回归模型的假设检验

步骤二:计算F值
回归平方和
Yˆ Y
F
解释变量数 残差平方和
=
k
uˆ 2
样本数 解释变量数 1 n k 1
1
决定系数 决定系数
样本数 解释变量数 解释变量数
1
=
R2 1 R2
n
k k
1[计算式]
步骤三:计算出来的F值,服从自由度(分子,分母)=(k,n k 1)
的F分布,将其与F分布表中的到的F值(判定值)相比较,进行显著
自由度调整后的决定系数:
2
R 1
n 1
1 R2 =1 10 1 1 0.98358 0.97889
n k 1
10 2 1
(3)根据公式,
F R2 n k 1 = 0.98358 10 2 1 209.7 1 R2 k 1 0.98358 2
根据F分布表,1%的显著性水平下自由度为(分子,分母)=(k=2,n k 1=7)
单侧检验,根据t分布表,得:
tˆ =4.816 3.499
tˆ1 =16.383 2.998
tˆ2 =19.094 2.998
放弃原假设(H0 : 0, H0 : 1 0, H0 : 2 0),估计出来的回归系数
在1%的显著性水平上显著。
结构变化的F检验
• 结构变化的F检验,也称为Chow test,用于检验经济 分析中的一个重要问题--“是否存在结构变化”。基 本步骤如下:
Yˆ 2.267718 0.247759 X1 1.296761X 2 回归系数的符号条件也得到满足。
解答(2)(3)
(2)根据公式,
决定系数:
R2 = ˆ1SY1 ˆ2SY 2 = 0.247759 46+ 1.296761 17 0.98358

11、第五章 假设检验-2

11、第五章 假设检验-2
低蛋白组( X 2): 70 118 101 85 107 132 94
完全随机设计两总体均数的比较
(一)建立检验假设,确定检验水准。 H 0 : 1 2 ; H1 : 1 2 .
0.05.
双侧检验。
(二)计算检验统计量。
n1 12, n2 7,
X 1 120 , S1 21 .39; X 2 101, S 2 20 .62 .
7
配对设计资料均数的比较
(一)建立检验假设,确定检验水准。 零假设 H 0 :两总体的均数相等, (即:差值的均数为0) ;
d 0;
备择假设 H 1 :两总体的均数不等,
(即:差值的均数不为0)。
检验水准

d 0;
配对设计资料均数的比较
(二)计算检验统计量。 当计算了每对差值di 后,可以应用前面的未知总体 与已知总体均数的比较方法。
不能拒绝 H 0 。 服药前后体重的差别没有统计学意义,尚不能认为
该减肥药有效。
§5.3 医学中常见的假设检验
☞ 完全随机设计两总体均数的比较
研究目的:推断两样本所分别代表的两总体的均数 是否相等。 如:不同的处理方法(不同治疗方案治疗效果是否 相同等); 不同特征的总体(不同职业或性别的人群某病 的发病率是否相同等)。
分布特征等选用适当的统计检验方法,并计算出相应
的检验统计量。
3
§5.3 医学中常见的假设检验
☞ 未知总体与已知总体均数的比较
推断样本所代表的未知总体的均数与已知总体的均数
是否有差别。该检验对样本有如下要求:
☀ 同质性:假定样本来自同分布的总体;
☀ 独立性:每个个体的测量值相互独立;
☀ 正态性:研究的变量服从于正态或近似正态分布。

数理统计之假设检验学习教案

数理统计之假设检验学习教案
第4页/共99页
第五页,共99页。
检验一个H0时,是根据检验统计量 来判决是否接受(jiēshòu)H0的,而检验 统计量是随机的,这就有可能判决错误. 这种错误有以下两类:
H0事实上是正确的,但被我们拒绝了 ,称犯了“弃真”的(或称第一类)错误.
H0事实上是不正确的,但被我们接受
(jiēshòu)了,称犯了“存伪”的(或称
2 82
检验假设 H0 : 570, H1 : 570
抽出10个样品进行检验,测得其折断力为
572 578 570 568 572 570 570 572 596 584 看在H0条件下会不会产生不合理的现象,
第10页/共99页
第十一页,共99页。
样本均值 X为 的无偏估计,X能较好反映 的大小.
P{拒绝H0| H0为真} 称 为显著性水平。
第7页/共99页
第八页,共99页。
参数(cānshù)假设检验解题步骤
1 根据问题提出原假设H0,同时给出对立假设H1(备选假设); 2 在H0成立的前提下,选择合适的统计量,这个统计量要包含待检的
参数,并求得其分布; 3 给定显著性水平 ,按分布写出小概率事件及其概率表达式; 4 由样本计算出需要的数值; 5 判断小概率事件是否发生,是则拒绝(jùjué),否接受
(x)
2
| t | t 2 则H0相容,接受H0 t
0
2
t x
2
| t | t 2 则否定H0,接受H1
选择假设H1表示(biǎoshì)Z可能大于μ0,也可能小于μ0 这称为(chēnɡ wéi)双边假设检验。
第28页/共99页
第二十九页,共99页。
例5 对一批新的某种液体存储(cún chǔ)罐进行耐裂试验,

第五章t检验

第五章t检验
▪ 20.99,20.41,20.62,20.75,20.10,20.00, 20.80,20.91,22.60,22.30,20.99,20.41, 20.50,23.00,22.60 计算得均数为21.13,标准差为0.98
样本均数与总体均数的比较
▪ 建立检验假设,确定检验水准 H0: = 0 H1: ≠ 0 =0.05
相等
一、单样本t检验 one sample t-test
▪ 即样本均数代表的未知总体均数和已知 总体均数0(一般为理论值、标准值或 经过大量观察所得的稳定值等)的比较。 这时检验统计量的计算在H0成立的前提 条件下计算。
t
X
S X
X 0 ,
S/ n
n -1
one sample t-test
已知总体
未知总体
X=136.0g/L S= 6.0g/L n=280
出现差别的两种可能:
▪总体均数不同,故样本均数有差别 ▪总体均数相同,差别仅仅是由于抽样误差 造成的
怎样判断属于哪一种可能? 先计算一个统计量,如t值,然后根据相 应的概率做判断。
一、假设检验的基本原理
样本均数与已知总体均数不等,原因? (1) ≠ 0,两总体均数不等 (2)= 0 ,抽样误差所致 这种不等,有多大的可能性由抽样误差造成?如果抽样误差
一般认为双侧检验较保守和稳妥,尤其是多样 本。
▪ 研究者想知道是否有一方较高,则采用单侧 检验(one-side test)。
从专业知识判断知:一结果不可能低于另一结 果,拟用单侧检验。
▪ 一般认为双侧检验稳妥,故常用。
确定检验水准, size of a test,
▪ 过去称显著性水平(significance level)

统计学第5章 假设检验

统计学第5章 假设检验
第5章
假设检验
第 5 章
假设检验
• 5.1 假设检验的基本问题 • 5.2 一个总体参数的检验 • 5.3 两个总体参数的检验(自学)
5.1
假设检验的基本原理
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
假设检验的基本概念
在实际工作中常会遇到这样的问题: (1)某药物在改进工艺后的疗效是否有提高? (2)假定总体服从某种分布是否成立? 如何通过抽检的样本对上述问题做出判断? 此时常常作出适当的假设,然后进行试验或 观测,得到统计样本,构造统计方法进行判断,以 决定是否接受这个假设。
1. 基本原理
小概率推断原理: 0 α 0.05 小概率事件 (概率接近0的事件),在一次试验中,实际上可认为 不会发生(这是人们长期积累起的普遍经验!).
2. 基本思想方法
采用概率性质的反证法: 先提出假设H0 , 再根 据一次抽样所得到的样本值进行计算. 若导致小 概率事件发生,则否认假设H0 ;否则,接受假设H0 . 下面结合实例来说明假设检验的基本思想.
H0 :π ≤30%
H1 :π >30%
提出假设 (练习)
• 某厂生产的化纤的纤度服从正态分布,纤 维纤度的标准均值为1.04。某天测得25根 纤维的纤度均值为x=1.39,检验与原来设 计的标准均值相比是否有所变化,要求的 显著性水平为α =0.05,则假设形式为: •
H0 :μ =1.04
H1 :μ ≠1.04
假设检验的基本思想
抽样分布 这个值不像 我们应该得 到的样本均 值 ... ... 如果这是 总体的假设 均值 = 50 H0
... 因此我们 拒绝假设 = 50
20

管理统计学 第2版 第五章 假设检验

管理统计学 第2版 第五章 假设检验
2008年8月
原假设(null hypothesis)备择假设(alternative hypothesis)
原假设又称“0假设”,研究者想收集证据予以反对的假设,用H0表示 所表达的含义总是指参数没有变化或变量之间没有关系 最初假设是成立的,之后根据样本数据确定是否有足够的证据拒绝它 总是有符号 =, <= 或>= H0 : m = 某一数值 H0 : m 某一数值 H0 : m 某一数值
第五章 假设检验
本章学习目标 (1)了解假设检验的基本思想 (2)掌握各种条件下检验统计量的构建 (3)掌握列联表分析的原理和应用 (4)掌握应用SPSS软件进行T检验的程序步骤和报告分析
第五章 假设检验
什么是假设检验? (hypothesis test) 先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的统计方法 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理 小概率是在一次试验中,一个几乎不可能发生的事件发生的概率 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设
抽样分布
H0
临界值
临界值
a/2
a/2
拒绝H0
拒绝H0
1 -
置信水平
Region of Rejection
Region of Nonrejection
Region of Rejection
假设
双侧检验
原假设
H0 : m =m0
备择假设
H1 : m ≠m0
用统计量决策(左侧检验 )
2008年8月
备择假设也称“研究假设”,研究者想收集证据予以支持的假设,用H1或Ha表示 所表达的含义是总体参数发生了变化或变量之间有某种关系 备择假设通常用于表达研究者自己倾向于支持的看法,然后就是想办法收集证据拒绝原假设,以支持备择假设 总是有符号 , 或 H1 :: m ≠某一数值 H1 :m >某一数值 H1 :m <某一数值

医学统计5第五章 假设检验

医学统计5第五章 假设检验

二、双侧检验和单侧检验
在进行t 检验时,如果其目的在于检验两个总体均数 是否相等,即为双侧检验。例如检验某种新降压药与常 用降压药效力是否相同?就是说,新药效力可能比旧药 好,也可能比旧药差,或者力相同,都有可能。
如果我们已知新药效力不可能低于旧药效力,例如 磺胺药+磺胺增效剂从理论上推知其效果不可能低于单用 磺胺药,这时,无效假设为H0, 备择假设为H1: 1>2 , 统计上称为单侧检验。
第五章 假设检验
一、假设检验的基本思想
例:已知一般中学男生的心率平均数为74次/分钟, 标准差为6次/分钟,为研究经常参加体育锻炼的中学 生心脏功能是否增强,在某地区随机抽取常年参加体 育锻炼的男生100名,求得心率平均数为65次/分钟。
如果一个事件发生的概率很小,那么在只进行一次试 验时这个事件是“不会发生的”,一旦发生了,称其 为小概率事件。统计类错误
设H0:=0,H1:>0, =0.05, 将拒绝了正确的无效假设 H0 称为I 类错误(type I error):也称为假阳性错误,当实际上真的为0,即H0: =0原本是正确的,但由于偶然因素的影响,随机抽样时, 得 到 一个较 大 的检验 统 计量 t 值 ,故 t t, 时 , 则 P0.05 时,按所取检验水准 只能拒绝H0,接受H1,结 论为>0, 由于拒绝了实际上是正确的H0,此推断结论当 然是错误的,即犯了I 型错误。I 型错误的概率是=0.05。
本例是均数的比较,是将常年参加体育锻炼心率平均 数为65次/分钟(它代表的总体有一总体均数)与一般中学 男生的心率平均数为74次/分钟。
研究者可能有两种目的: – ① 推断两个总体均数有无差别。不管是常年参加体育锻
炼心率高于一般,还是常年参加体育锻炼心率低于一般, 两种可能性都存在,研究者同等关心,应当用双侧检验。 – ② 根据专业知识,已知常年参加体育锻炼心率不会低于 一般,或是研究者只关心常年参加体育锻炼心率是否高 于一般,不关心常年参加体育锻炼心率是否低于一般, 应当用单侧检验。

第五章-假设检验的功效与样本量

第五章-假设检验的功效与样本量

第五章 假设检验的功效与样本量∙ 当假设检验不拒绝H 0时,推断正确的概率称为检验功效。

∙ 临床科研中不时遇到假设检验无统计学意义,此时,很有必要对检验功效作出评价。

5.1 两类错误与功效1. 两类错误的概率H 0: μ=μ0, H 1: μ>μ0 (5.1) (略) Z =n X σμ0-(5.2) (略) ∙ 任何假设检验都可能出现两类错误,用两个概率来度量 第Ⅰ类错误概率=P(拒绝H 0|H 0为真)≤α (5.3) 第Ⅱ类错误概率=P(不拒绝H 0|H 1为真)≤β (5.4a) 也可以理解为第Ⅱ类错误概率=P(不拒绝H 0|H 0为假)≤β (5.4b) ∙ 如果将诊断是否患有某病也视为一个假设检验问题: H 0:无病, H 1:有病第Ⅰ类错误:假阳性∕误诊,概率 P(阳性|无病) (α) 第Ⅱ类错误:假阴性∕漏诊,概率 P(阴性|有病) (β) ∙ 两类错误的背景:拒绝H 0时可能犯第Ⅰ类错误不拒绝H 0时可能犯第Ⅱ类错误∙ 两类错误的后果:第Ⅰ类错误可能将“真实无效误作有效”∕误诊 第Ⅱ类错误可能将“真实有效误作无效”∕漏诊 ∙ 一般α, β的数值要在科研设计时事先确定2. 功效 (power)∙ 假设检验发现真实差异的功效就不低于1-β,即 检验功效=P(拒绝H 0|H 1为真)≥1-β(5.5) 检验功效=P(拒绝H 0|H 0为假)≥1-β(5.5) ∙ 功效就是真实有效的药物被发现的概率∕疾病被诊断出来的概率5.2 影响功效的四要素∙ 假设检验的功效至少受四个要素的影响,参看(5.2)式 n X σμ0- ≥Z α (5.6)∙ 功效的影响因素为:δ=0μ-x ,σ,n ,αX ≥μ0+Z αn σ (5.7) (略) ∙ 现用X 分布图形来定性地讨论四要素对功效的影响1. 客观差异越大,功效越大X ~N(μ,σ2/n) (5.8) (略)若H 0为真,X ~N(μ0,σ2/n) (5.9) (略)若H 1为真,X ~N(μ0+δ,σ2/n) (5.10) (略)2. 个体间标准差越小, 功效越大。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章假设检验参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数进行推断。

前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证,从而作出真假判断。

通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。

本章的目的与要求通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数的检验方法,主要是Z 检验和t检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。

本章主要内容(计划学时2 )一、假设检验概述与基本概念1、假设检验概述2、假设检验的有关基本概念二、总体参数检验1、总体平均数的检验2、总体成数的检验3、总体方差的检验三、总体非参数检验1、符号检验2、秩和检验3、游程检验学习重点一、假设检验的有关基本概念;二、总体平均数与总体成数的检验;三、非参数检验;学习难点一、假设检验的基本思路与有关概念;二、两类错误的理解及其关系;第一节统计检验的基本概念一、假设检验概述基本思路:首先,对总体参数作出某种假设,并假定它是成立的。

然后,根据样本得到的信息(统计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个假设。

所谓合理性,就是看是否在一次的观察中出现了小概率事件。

小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。

这种事件可以称其为“实际不可能事件”。

二、假设检验的基本概念(一)原假设与对立假设1、原假设:用“H0:”表示(也称“零假设”、“虚无假设”)这是研究者对总体参数事先提出的假设。

通常以总体没有发生显著变化为原假设。

2、对立假设:用“H1:”表示对立假设也称“备择假设”这是与原假设完全对立的、矛盾的假设,假设总体发生了显著的变化。

(二)显著性水平与显著性差异1、显著性水平:在统计检验中,判断假设是否合理,是根据一定的标准来确定的,这个标准是在检验之前由研究者事先主观选定的一个小概率值,用α表示.这个α就是显著性水平。

常用的α有0.1、0.05或0.01等2、显著性差异:如果统计量和假设的参数值存在差距,有两种可能:(1)差距不是很大(即不在小概率范围内出现),即可认为总体没发生显著变化。

可接受原假设。

(2)差距很大(即出现在小概率范围内),即可认为总体发生了显著变化。

说明存在着显著性差异,故拒绝原假设。

(三)双侧检验与单侧检验1、双侧检验(双尾检验):双侧检验要求同时注意估计值偏高和偏低的倾向,这时,差距不分正负,给出的显著水平α2、单侧检验(单尾检验):(有左单侧和右单侧两种)单侧检验只注意估计值是否偏高(或偏低),它是单方向的,给出的显著性水平α集中在同一侧。

偏高时,差距为正,为右单侧检验;偏低时,差距为负,为左单侧检验。

(四)两种类型的错误1、第一类错误——以真为假2、第二类错误 ——0β错误,属第二类错误,也叫做“存伪错误”。

在统计检验中,必须做出否定H 0:或肯定H 0:的抉择,因此,不可避免地可能犯α错误或β错误。

如果减小α错误,势必增加犯β错误的可能性;而若为了减小β错误,α错误必然增大。

所以,要同时减小犯两类错误的概率,就应增大样本容量。

此外,取多大的值,也应取决于所要研究的问题的性质。

(五)拒绝域、接受域和临界值1、拒绝域:计算结果表明总体发生了显著变化,而没有理由不拒绝原假设的区域。

2、接受域:计算结果表明总体没发生显著变化,从而接受原假设的区域。

3、临界值(临界点):拒绝域与接受域的界限。

表示在给定一个显著水平的前提下,假定总体发生显著变化的数值界限。

三、检验中决定使用的概率分布(以平均数的检验为例)假设检验中使用正态(Z )分布或t 分布的条件四、假设检验的程序1、提出假设原假设 H 0:(以总体未发生显著变化为原假设)备择假设 H 1:(总体发生显著变化)2、选择一个显著水平α等于对犯第一类错误的概率给出具体数值,通常显著水平用 0.1、0.05或 0.01等。

3、构造一个检验值(选择 Z 或 t 分布)Xx Z σ-= 或 S X x t x-=4、作出判断根据统计量 Z (或 t )的计算结果,看其是落在接受区域或者落在拒绝区域而作出接受或拒绝原假设的决定。

第二节 总体参数检验一、总体平均数的检验(一)总体标准差已知1、双侧检验例5-2.1 一个生产车轴的工厂,其生产的车轴必须能承受5 600千克/cm 2的压力;而如果过分坚硬则务必要增加成本。

多年来的经验表明,该厂的车轴硬度标准差是 250 千克/ cm 2 。

工厂从最近的生产线上抽出100根车轴进行检验,得样本的平均承受压力为5 570千克/cm 2。

试用 0.05的显著水平,检验这条生产线上的车轴是否符合要求?(总体标准差已知,样本容量为100根车轴,故选择正态分布)已知: n =100根 σ=250千克/cm 2 α = 0.05=X 5600千克/cm 2 =x 5570千克/cm 2解:(过硬过软均会带来不利影响,故选择双侧检验)(图见下页)建立假设:H 0:=X 5600千克/cm 2H 1:≠X 5600千克/cm 2构建统计量:10025056005570-=-=x Xx Z σ=-1.2 根据α = 0.05,查Z 值表得临界值:Z α/2=1.96计算结果:| Z | < | Z α/2 | ,样本平均数落在接受区域,所以接受原假设,该生产线的车轴符合要求。

x Z σ==1.96×25=49或 5551 5600 56492、单侧检验毫升,消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测量结果平均含量为248毫升,根据给出5%的显著水平,判断该饮料厂厂商是否欺骗了消费者。

(总体标准差已知,样本容量为50盒饮料,故选择正态分布)已知: n =50盒 σ=4毫升 α = 0.05=X 250毫升 =x 248毫升解:(因为要判断厂商是否有减少纸包装饮料的容量,而坑害消费者,故选择左单侧检验)(图见下页)建立假设:H 0:X ≥ 250毫升H 1:X <250毫升构建统计量:504250248-=-=x Xx Z σ=-3.54 根据α = 0.05,查Z 值表得临界值:Z α=-1.645计算结果:| Z | > | Z α |,样本平均数落在拒绝区域,所以拒绝原假设,该厂商有欺骗行为。

x Z =∆ =或 249.07 250(二)总体标准差未知1、双侧检验例5-2.3 某厂生产标准厚度为 0.15毫米(不允许过厚过薄)的带状某产品。

某日开工后抽检了10处,得平均厚度是0.164毫米,标准差为0.015毫米,试问该厂这天的生产是否正常?(显著水平为10%)(总体标准差未知,用样本的代替;样本容量为10,属小样本,故选择 t 分布)已知: n =10 S x =0.015毫米 α = 0.10=X 0.15毫米 =x 0.164毫升(因为产品要求不能过厚也不能过薄,故选择双侧检验)H 0:=X 0.15毫米H 1:≠X 0.15毫米构建统计量:110015.015.0164.01--=--=n S X x Z x =2.8 根据α = 0.10,自由度为10-1=9,查 t 值表得临界值:t α/2=1.833计算结果:| t | > | t α/2 | ,样本平均数落在拒绝区域,所以拒绝原假设,说明该日生产不正常。

产品显著过厚。

x x t σ=∆=1.883×或 0.1408 0.15 0.15922、单侧检验例5-2.4 某地水土中缺乏一种微量元素,根据医学研究结果可知,人们如果摄取这种元素过少,脑功能可能受影响。

为此心理学家采用某种智力测验方法,对该地区随机抽取的26名儿童进行智力测验,测得平均分是94分(正常一般为100分),标准差为15分。

问该地区儿童的智力水平是否明显低于一般水平?(显著水平为5%)(总体标准差未知,用样本的代替;样本容量为26,属小样本,故选择 t 分布)已知: n =25 S x =15分 α = 0.05=X 100分 =x 94分(检验智力是否明显偏低,故用左单侧检验)建立假设:H 0:=X 100分H 1:≠X 100分构建统计量:1510094-=-=S X x Z x =-2计算结果:| t | > | t α | ,样本平均数落在拒绝区域,所以拒绝原假设,显然,该地区儿童的智力明显低于一般水平。

x x t σ=∆ =或 94.876 100二、总体成数的检验1、双侧检验例5-2.5 某企业生产某产品的一级品率总是稳定在80%左右。

经选用新材料后,企业在其生产的该产品中随机抽取了 400件进行检查,有332件一级品。

试用5%的显著水平,检验该产品的一级品率是否发生显著的变化?(每件产品要么一级品或要么非一级品,所以是属性总体的成数问题;样本容量为200件,大样本,故选择成数的正态分布)已知: n =200件 σp 2=0.8×0.2 α = 0.05P =80% p =332/400 = 83%(采用新材料,可能使一级品增加也可能使一级品减少,所以采用双侧检验) 建立假设:p p Z σ=∆=1.96×0.02=0.0392 H 0: P =0.8H 1: P=Z 根据α例5-2.6 某小学六年级学生的近视率达40%,经坚持做了一段时期的眼保健操后,从中抽取了60名学生进行检查,仍有21名学生存在着不同程度的近视状况,请以5%的显著性水平检验眼保健操的锻炼效果。

(每位学生要么近视要么不近视,所以是属性总体的成数问题;样本容量为60人,大样本,故选择成数的正态分布)已知: n =60人 σp 2=0.4×0.6 α = 0.05P =40% p =21/60 = 35%(做眼保健操就是要降低近视率,所以采用左单侧检验)建立假设:H 0: P ≥ 0.4H 1: P < 0.4构建统计量:606.04.040.035.0)1(⨯-=--=n P P Pp Z =0.791根据α = 0.05,查Z 值表得临界值:Z α=1.645计算结果:| Z | < | Z α | ,样本成数落在接受区域,所以接受原假设。

说明做眼保健操后,近视率并没有明显降低。

p p Z σ=∆=1.645×或 0.296 0.40三、总体方差的检验主要是检验事物的变异程度是否发生显著变化。

相关文档
最新文档