第七章 假设检验PPT
合集下载
卫生统计学 第七章 假设检验基础 ppt课件
24
若 P ,按所取检验水准 ,拒绝 H0 ,接受
H1 ,差别有统计学意义。其统计学依据是,在 H0 成
立的条件下,得到现有检验结果的概率小于 ,因为
小概率事件不可能在一次试验中发生,所以怀疑 H0
的真实性,从而做出拒绝 H0 的决策。
若 P > ,按所取检验水准 ,不拒绝 H0 ,差
7
统计上的假设检验
首先假设样本对应的总体参数与某个 已知总体参数相同,然后根据某样本统 计量的抽样分布规律,分析样本数据, 判断样本信息是否支持这种假设,并对 假设作出取舍抉择。
8
二、假设检验的基本思想与原理
例 通过以往大量调查,已知某地一般新生 儿的头围均数为4.5cm,标准差为1.99cm。 为研究某矿区新生儿的发育情况,现从该地 某矿区随机抽取新生儿55人,测得其头围均 数为33.89cm,问该矿区新生儿的头围总体均 数与一般新生儿头围总体均数是否不同?
17
第一步 建立假设,确定检验水准
H0:原假设(无效假设、零假设)是对总体参数或 总体分布作出的假设,通常假设总体参数相等或 观察数据服从某一分布(如正态分布等).
H1:对立假设(备择假设),与H0相对立又相联系
下一页
:检验水准,上述两种假设中,要作出抉择,
即是拒绝H0,还是不拒绝H0,需根据概率的大
小作出判断. 就是对H0假设作出抉择的一 个判定标准,通常 =0.05
前进
18
单、双侧检验
若H1为0,则此检验为双侧检验 若H1只是 0或0,则此检验为单侧检
单双侧检验的确定
首先根据专业知识 其次根据研究者的目的
注意:一般认为双侧检验较保守和稳妥!
返回
19
本例
H0:0(该1县.41儿童前囟门闭合月龄的平均水
若 P ,按所取检验水准 ,拒绝 H0 ,接受
H1 ,差别有统计学意义。其统计学依据是,在 H0 成
立的条件下,得到现有检验结果的概率小于 ,因为
小概率事件不可能在一次试验中发生,所以怀疑 H0
的真实性,从而做出拒绝 H0 的决策。
若 P > ,按所取检验水准 ,不拒绝 H0 ,差
7
统计上的假设检验
首先假设样本对应的总体参数与某个 已知总体参数相同,然后根据某样本统 计量的抽样分布规律,分析样本数据, 判断样本信息是否支持这种假设,并对 假设作出取舍抉择。
8
二、假设检验的基本思想与原理
例 通过以往大量调查,已知某地一般新生 儿的头围均数为4.5cm,标准差为1.99cm。 为研究某矿区新生儿的发育情况,现从该地 某矿区随机抽取新生儿55人,测得其头围均 数为33.89cm,问该矿区新生儿的头围总体均 数与一般新生儿头围总体均数是否不同?
17
第一步 建立假设,确定检验水准
H0:原假设(无效假设、零假设)是对总体参数或 总体分布作出的假设,通常假设总体参数相等或 观察数据服从某一分布(如正态分布等).
H1:对立假设(备择假设),与H0相对立又相联系
下一页
:检验水准,上述两种假设中,要作出抉择,
即是拒绝H0,还是不拒绝H0,需根据概率的大
小作出判断. 就是对H0假设作出抉择的一 个判定标准,通常 =0.05
前进
18
单、双侧检验
若H1为0,则此检验为双侧检验 若H1只是 0或0,则此检验为单侧检
单双侧检验的确定
首先根据专业知识 其次根据研究者的目的
注意:一般认为双侧检验较保守和稳妥!
返回
19
本例
H0:0(该1县.41儿童前囟门闭合月龄的平均水
2015ppt第七章_假设检验
第 7 章 假设检验
第七章 假设检验
(Hypothesis Test)
内容提要 §7.1 假设检验的基本思想与概念 §7.2 正态总体参数的假设检验 §7.3 其他分布参数的假设检验 §7.4
2 检验法
1
第 7 章 假设检验
7.1 假设检验的基本思想与概念
§ 7.1
假设检验的基本思想与概念
假设检验是又一种重要的统计推断形式。由 Karl Pearson 提出,由 Jerzy Neyman (1894-1981) 与 Egon Sharpe Pearson (1895-1980) 发展形成了一套较完善的理论。
|X 10 | u0 . 9 751 . 9 6时拒绝 H 0 。 0.1 10
所以,在 0.05 的显著性水平下不能拒绝原假设,即样本中无充分证据表明该类电阻的总体 均值不等于标定值 10 欧姆。
15
第 7 章 假设检验
7.1 假设检验的基本思想与概念
用假设检验解决实际问题的大致步骤
1. 对实际问题建模,建立原假设与备择假设; 2. 选择检验统计量,确定检验规则(拒绝域)的形式; 3. 确定显著性水平; 4. 确定具体的检验规则(拒绝域); 5. 将样本观测值代入给定的检验规则,回答实际问题。
10
第 7 章 假设检验
7.1 假设检验的基本思想与概念
0
如果参数 与 P 一一对应,且
{P : 0 },
1
{P : 1},
则犯两类错误的概率、势函数都可表示为 的函数:
W ( ) P {( X 1 ,
, X n ) W }, 0; , X n ) W }, 1; 1 。
W ( P) P{( X 1 ,
第七章 假设检验
(Hypothesis Test)
内容提要 §7.1 假设检验的基本思想与概念 §7.2 正态总体参数的假设检验 §7.3 其他分布参数的假设检验 §7.4
2 检验法
1
第 7 章 假设检验
7.1 假设检验的基本思想与概念
§ 7.1
假设检验的基本思想与概念
假设检验是又一种重要的统计推断形式。由 Karl Pearson 提出,由 Jerzy Neyman (1894-1981) 与 Egon Sharpe Pearson (1895-1980) 发展形成了一套较完善的理论。
|X 10 | u0 . 9 751 . 9 6时拒绝 H 0 。 0.1 10
所以,在 0.05 的显著性水平下不能拒绝原假设,即样本中无充分证据表明该类电阻的总体 均值不等于标定值 10 欧姆。
15
第 7 章 假设检验
7.1 假设检验的基本思想与概念
用假设检验解决实际问题的大致步骤
1. 对实际问题建模,建立原假设与备择假设; 2. 选择检验统计量,确定检验规则(拒绝域)的形式; 3. 确定显著性水平; 4. 确定具体的检验规则(拒绝域); 5. 将样本观测值代入给定的检验规则,回答实际问题。
10
第 7 章 假设检验
7.1 假设检验的基本思想与概念
0
如果参数 与 P 一一对应,且
{P : 0 },
1
{P : 1},
则犯两类错误的概率、势函数都可表示为 的函数:
W ( ) P {( X 1 ,
, X n ) W }, 0; , X n ) W }, 1; 1 。
W ( P) P{( X 1 ,
第7章 假设检验基础PPT课件
S d 2 (d)2 / n 84.2747
d
n 1
t | d | 475.66 19.532, n 1 12 1 11
S / n 84.2747 / 12 d 3.查相应界值表,确定 P 值。
查表 t0.05/ 2,11
2.201,tt ,P 0.05/ 2,11
<0.05,拒绝 H0,差别有统计学意
第一节 假设检验的概念与原理
一、假设检验的思维逻辑 二、假设检验的基本步骤
2020/11/15
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
一、假设检验的思维逻辑
样本统计量与总体参数间(或统计量与统计 量间的)的差异产生的原因:
1. 个体变异所导致的抽样误差所引起; 2. 总体间确实有差异
1728.03
622.51
12
757.43
1398.86
641.44
2020/11/15
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
1.建立假设、确定检验水准α
H0: d 0 H1: d 0 (双侧检验)α=0.05
2.计算检验统计量
d 5707.95 12 475.66 , d 5707.95, d 2 2793182.166,
2020/11/15
青岛大学医学院公共卫生系流行病与 卫生统计学教研室 周晓彬制作
实例
用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量
序号
用药前
用药后 差值(后-前)
1
1206.44
1678.44
472.00
2
921.69
1293.36
371.67
3
1294.08
《假设检验》课件
方差分析
总结词
适用于多组数据比较的检验方法
详细描述
方差分析是一种适用于多组数据比较的假设检验方法。它通过比较不同组之间的变异和 误差来源,计算F值和对应的P值,以判断原假设是否成立。方差分析在很多领域都有
应用,如农业、生物统计学和心理学等。
秩和检验
总结词
适用于等级数据或非参数数据的检验方法
详细描述
秩和检验是一种适用于等级数据或非参数数 据的假设检验方法。它通过将数据排序后进 行比较,计算秩和值和对应的P值,以判断 原假设是否成立。秩和检验在很多领域都有 应用,如医学、生物学和环境科学等。
04 假设检验的实例分析
单样本Z检验实例
总结词
用于检验一个样本的平均值与已知的 某一总体均值之间是否存在显著差异 。
如果样本量过小,可能无 法得出可靠的结论,因为 小样本可能无法代表总体 。
样本量过大
如果样本量过大,可能会 导致统计效率降低,增加 计算复杂度和成本。
样本代表性
在选择样本时,需要确保 样本具有代表性,能
假设检验的结果只能给出拒绝或接受 假设的结论,但无法给出假设正确与 否的确凿证据。
置信区间有助于判断假设的正确性
02
通过比较置信区间和假设值的位置关系,可以判断假设是否成
立。
置信区间与假设检验的互补关系
03
置信区间和假设检验各有优缺点,可以结合使用以更全面地评
估数据的统计性质。
THANKS 感谢观看
提出假设
根据研究问题和目的,提出原 假设和备择假设。
确定临界值
根据统计量的性质和显著性水 平,确定临界值。
做出决策
根据计算出的样本统计量和临 界值,做出接受或拒绝原假设 的决策。
第七章 假设检验基础()精品PPT课件
差值
1 1206.44
1678.44
472.00
2
921.69
1293.36
Hale Waihona Puke 371.673 1294.08
1711.66
417.58
4
945.36
1416.70
471.34
5
721.36
1204.55
483.19
6
692.32
1147.30
454.97
7
980.01
1379.59
399.58
➢ 买小米手机吗? 对手机评价:适合(买)、不适合(不买)
➢ 国庆节去八里沟怎样吗? 对景区的评价:好玩(去)、不好玩(不去)
所有的决策都遵循相同的基本模式
陈述多种可供选择的方案(假设) 收集支持这些方案的证据 根据证据的强弱做出决策 根据决定执行某种行为
统计学中的假设检验也是一种决策过程,同样遵循 这一基本模式。
研究结果可供选择的结论(目前的假设)有哪些?
1.该县儿童总体平均闭合月龄与一般儿童没有差异 2.该县儿童总体平均闭合月龄迟于一般儿童
两种假设在统计上的含义
抽样研究存在抽样误差!!
样本1
总体 均数=14.1
样本2
X1 14.3 X2 14.0
从总体1中抽样
样本1 X1 14.3
µ1=14.1
样本2 X2 14.0
s/ n 5.08/ 36
自由度:
n 1 3 6 1 35
3.确定P值
P值的定义 如果H0成立的条件下,出现统计量目
前值及更不利于H0的数值的概率。
直观地看:就是统计量对应分布曲线下 的尾部面积。
通过查表可以得到 对应统计量的尾部 面积,即P值
5讲 假设检验基础ppt课件
3
假设检验的基本原理
• 已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查25 名健康男子,求得脉搏均数为74.2次/分,标准差6.5次/分。能否认为该 山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?
• 样本均数和总体均数的差异有两种可能: • 抽样误差所致, • 有本质差异
0 72
2
假设检验的原因
由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、 X4、、、,不同。 因此,X1、X2 不同有两种(而且只有两种)可能: (1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别 无统计学意义 。 (2)分别所代表的总体均数不同。差别有统计学意义。
• (2)备择假设:拒绝双H侧0时检而验被H接0:受的假设0 ,与H0对立。有三种情况:
单侧检验 单侧检验
2.单、双侧的H选1 :择:由0专业知。通常取0.05。
H1:0
6
▲选定检验方法,计算检验统计量
• 根据资料类型和推断目的选用不同的检验方法。不同的检验方法有相应 不同的检验统计量及计算公式。
2.两大样本的u检验
u X 0 sn
u X 0 n
u x1 x2 s12 s2 2 n1 n2
11
例题7-1 • 根据1983年大量调查结果,已知某地成年男子的脉搏均数为72次/分,某医
生2003年在该地随机调查了75名成年男子,求其脉搏均数为74.2次/分,标 准差为6.5次/分,能否据此认为该地成年男子的脉搏不同于1983年?
• 所大有小检,验并统且计服量从都已是知在的分H0布成。立的条件下计算出来的,反映了抽样误差的
• 例:
成立条件下 ,
则
用s代替σ,检验统计量为
假设检验的基本原理
• 已知健康成年男子的脉搏均数为72次/分。某医生在某山区随机调查25 名健康男子,求得脉搏均数为74.2次/分,标准差6.5次/分。能否认为该 山区的成年男子的脉搏均数高于一般成年男子的脉搏均数?
• 样本均数和总体均数的差异有两种可能: • 抽样误差所致, • 有本质差异
0 72
2
假设检验的原因
由于个体差异的存在,即使从同一总体中严格的随机抽样,X1、X2、X3、 X4、、、,不同。 因此,X1、X2 不同有两种(而且只有两种)可能: (1)分别所代表的总体均数相同,由于抽样误差造成了样本均数的差别。差别 无统计学意义 。 (2)分别所代表的总体均数不同。差别有统计学意义。
• (2)备择假设:拒绝双H侧0时检而验被H接0:受的假设0 ,与H0对立。有三种情况:
单侧检验 单侧检验
2.单、双侧的H选1 :择:由0专业知。通常取0.05。
H1:0
6
▲选定检验方法,计算检验统计量
• 根据资料类型和推断目的选用不同的检验方法。不同的检验方法有相应 不同的检验统计量及计算公式。
2.两大样本的u检验
u X 0 sn
u X 0 n
u x1 x2 s12 s2 2 n1 n2
11
例题7-1 • 根据1983年大量调查结果,已知某地成年男子的脉搏均数为72次/分,某医
生2003年在该地随机调查了75名成年男子,求其脉搏均数为74.2次/分,标 准差为6.5次/分,能否据此认为该地成年男子的脉搏不同于1983年?
• 所大有小检,验并统且计服量从都已是知在的分H0布成。立的条件下计算出来的,反映了抽样误差的
• 例:
成立条件下 ,
则
用s代替σ,检验统计量为
统计学 第7章 假设检验ppt课件
在对客观事物及其现象进行观测和实验中,随着观测或实验的次数增 多,事件发生的频率和均值逐渐地趋于某个常数。
(1)贝努利定理(Bernoulli Theorem)
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
完整版PPT课件
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
3.抽样分布
抽样分布(Sampling Distribution)是指从同分布总体中,独立抽 取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分 布的概率分布,抽样分布是抽样理论的研究对象。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
完整版PPT课件
《统计学教程》
独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机
变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,
则
ln i m Fn
x
n lim k1Xk
nx
x
n n
1
t2
e 2dt
(6.3)
2பைடு நூலகம்
(1)贝努利定理(Bernoulli Theorem)
ln i mPnnA
PA
1
(6.1)
贝努利定理表明事件发生的频率依概率收敛于事件发生的概率。从而 以严格的数学形式表述了频率的稳定性特征,即n当很大时,事件发生 的频率与概率之间出现较大的偏差的可能性很小。由此,在n充分大的 场合,可以用事件发生的频率来替代事件的概率。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
完整版PPT课件
《统计学教程》
第6章 抽样分布与参数估计
6.1 抽样分布
3.抽样分布
抽样分布(Sampling Distribution)是指从同分布总体中,独立抽 取的相同样本容量的样本统计量的概率分布。所以,抽样分布是样本分 布的概率分布,抽样分布是抽样理论的研究对象。
抽样分布反映了依据样本计算出来的统计量数值的概率分布,这是科 学地进行统计推断的基础。例如,在大样本场合,由中心极限定理有样 本均值趋于正态分布。
★ 讨论题 为什么说抽样分布是抽样理论研究的对象,解释三种分布之 间的联系。
完整版PPT课件
《统计学教程》
独立同分布的中心极限定理是应用最多的一种中心极限定理。设随机
变量相互独立,服从同一分布,且具有相同的有限的数学期望和方差,
则
ln i m Fn
x
n lim k1Xk
nx
x
n n
1
t2
e 2dt
(6.3)
2பைடு நூலகம்
第7章假设检验ppt
X 0 由 U ~ N (0,1), 可以确定 k ,使 n
X 0 P k n
由图知, k u 故原假设的拒绝域为
x 0 u u n
u
21
X ~ N (0,1) 若 H 0 : 0 68 正确,则 n
1. 关于均值 的检验 2 (1) 已知 在§1中已讨论了正态总体 N , 2 当 2 已知 时关于 的检验问题,结论如下 1°双边检验
拒绝域为
H 0 : 0,H1 : 0
x 0 u u 2 n
27
2°单边检验 右边检验 拒绝域为 左边检验 拒绝域为
9
令 U
X 0
n
~ N (0,1) 则统计量 U 的取值较大应是小概率事件
因此可以确定一个常数 k ,使
X 0 P k ,(0 1) n
通常 应取为较小的值 , 如 0.1,0.05,0.01 等,这里取 0.05 ,
(1.2)
的假设检验问题称为右边检验(或左边检验), 右边检验和左边检验统称为单边检验.
19
单边检验也可以表示为下面形式
右边检验 H 0 : 0 H1 : 0 ; 左边检验 H 0 : 0 H1 : 0 . (1.3)
以例1中数据来讨论(1.2)和(1.3)两种形式下单边检验 问题的拒绝域
这种利用样本检验统计假设真伪的过程叫做
统计检验(假设检验)
4
一 假设检验的内容
在实际中,我们对总体的概率分布或参数往往会作出某种 假设,所作假设可能是正确的,也可能是错误的,为了判断 所作的假设是否正确,就需要对提出的假设作出进一步决 策,具体做法如下:从总体中抽取一定量的样本,根据样本 的取值,按一定原则进行检验,然后作出拒绝还是接受所 作假设的决策.假设检验就是作出这一决策的过程. 参数假设检验
第七章 假设检验 PPT课件
2019/9/5
6
如例7.3可记为 H0:μ=μ0,高原地区成年男子的HB平均水平与一般健康成
年男子相同。 H1: μ≠μ0 ,高原地区成年男子的HB平均水平与一般健康成
年男子不同
2019/9/5
7
假设检验一般分为双侧检验(two-sided test)和单侧 检验(one-sided test)。如本例中,不管是高原地区高于一般, 还是低于一般,两种可能性都存在,应该用双侧检验;如根 据专业知识,已知高原地区不会低于一般,或是研究者只关 心高原地区是否高于一般,应当用单侧检验。单侧检验的 H1为μ>μ0或μ<μ0。一般认为双侧检验较为稳妥,故较常用。 现以样本均数的比较为例,用符号表示,见下表。
2019/9/5
13
第三节 Ⅰ型错误和Ⅱ型错误
假设检验中作出的推断结论可能发生两种错误:①拒 绝了实际上是成立的H0,这叫Ⅰ型错误(typeⅠerror)或第 一类错误,也称为α错误。如图7.1,设H0:μ=0,H1:μ >0。若μ确实为0,则H0实际上是成立的,但由于抽样的
偶然性,得到了较大的t值,因t≥ t, P≤α,按所取检验
2019/9/5
8
2019/9/5
9
2.确定检验水准 检验水准(size of a test)过去亦称显著性 水准(significance level),符号为α。它是判别差异有无统计 意义的概率水准,其大小应根据分析的要求确定。通常取 α=0.05。
3.选定检验方法和计算统计量 根据研究设计的类型和 统计推断的目的要求选用不同的检验方法。
第七章 假设检验
2019/9/5
1
[学习要求] 了解:假设检验的基本思想。 熟悉:Ⅰ型错误和Ⅱ型错误的基本概念。 掌握:假设检验的基本步骤;应用假设检验应注意 的问题;假设检验与区间估计的联系。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例:α=0.05时的接受域和拒绝域
7.1.2 假设检验的一些基本概念
5.双侧检验与单侧检验 双侧检验与单侧检验 假设检验根据实际的需要可以分为 : 双侧检验(双尾) 指只强调差异而不强调方向性的检验. 双侧检验(双尾): 指只强调差异而不强调方向性的检验.
H 0 : 1 = 0 H 1 : 1 ≠ 0 只关注 1, 0 是否有差异,不关心
7.2
总体均值的检验
7.2.1 7.2.2
Z-检验 T-检验
7.2.1 Z-检验 -
1,当总体分布为正态分布,总体标准差为已知时,检验原 ,当总体分布为正态分布,总体标准差为已知时, 假设. 成立时, 假设.当H0成立时,由于总体 X ~N( 0 , ) ;所以样本均 从而统计量为: 值 .从而统计量为:
Z=
X 0
σ/ n
~ N (0,1)
[例7-2]某市历年来对 岁男孩的统计资料表明,他们的 例 某市历年来对7岁男孩的统计资料表明 某市历年来对 岁男孩的统计资料表明, 身高服从均值为1.32米,标准差为 米的正态分布. 身高服从均值为 米 标准差为0.12米的正态分布.现从 米的正态分布 各个学校随机抽取25个 岁男学生 测得他们平均身高1.36 岁男学生, 各个学校随机抽取 个7岁男学生,测得他们平均身高 若已知今年全市7岁男孩身高的标准差仍为 岁男孩身高的标准差仍为0.12米,问与 米,若已知今年全市 岁男孩身高的标准差仍为 米 α 历年7岁男孩的身高相比是否有显著差异 岁男孩的身高相比是否有显著差异(取 历年 岁男孩的身高相比是否有显著差异 取 =0.05). .
2 可以证明,若 X 1 ~ N ( 1 , σ 12 / n1 ), X 2 ~ N ( 2 , σ 2 / n2 ),则 可以证明,
( X 1 X 2 ) ~ N ( 1 2 ,
σ 12
n1
+
2 σ2
n2
)
所以, 成立的前提下, 所以,在H0成立的前提下,有
Z=
X1 X 2
σ 12
n1
第七章 假设检验
第七章 假设检验
学习目标: 学习目标 1.理解假设检验的基本思想和基本步骤 ; 理解假设检验的基本思想和基本步骤 2.理解假设检验的两类错误及其关系; 理解假设检验的两类错误及其关系; 理解假设检验的两类错误及其关系 3.熟练掌握总体平均数,总体成数和总体方差的各 熟练掌握总体平均数, 熟练掌握总体平均数 种假设检验方法; 种假设检验方法; 4.利用 - 值进行假设检验. 利用P 值进行假设检验. 利用
7.1.2 假设检验的一些基本概念
6.假设检验中的两类错误 假设检验中的两类错误 假设检验是依据样本提供的信息进行推断的 即由部分来推 假设检验是依据样本提供的信息进行推断的,即由部分来推 是依据样本提供的信息进行推断的 断总体,因而假设检验不可能绝对准确 是可能犯错误的. 因而假设检验不可能绝对准确,是可能犯错误的 断总体 因而假设检验不可能绝对准确 是可能犯错误的. 两类错误: 两类错误: 错误(I型错误 型错误): 为真时却被拒绝,弃真错误 弃真错误; α错误 型错误 H0为真时却被拒绝 弃真错误 错误(II型错误 型错误): 为假时却被接受,取伪错误 取伪错误. β错误 型错误 H0为假时却被接受 取伪错误. 假设检验中各种可能结果的概率: 假设检验中各种可能结果的概率: 接受H 拒绝 拒绝H 接受 0 ,拒绝 1 1- α(正确决策 正确决策) - 正确决策 取伪错误) β(取伪错误 取伪错误 拒绝H 接受H 拒绝 0,接受 1 弃真错误) α(弃真错误 弃真错误 1- β(正确决策 正确决策) 正确决策
7.2.1 Z-检验 -
2.对来自两个正态总体的两个独立样本,已知样本容量, 2.对来自两个正态总体的两个独立样本,已知样本容量, 对来自两个正态总体的两个独立样本 2 Байду номын сангаас用Z检验法 均值和总体方差分别为 n1 , X 1 , σ 12 和 n2 , X 2 , σ 2 ,可用 检验法 检验零假设H 检验零假设 0:1 = 2.
7.1.2 假设检验的一些基本概念
2.检验统计量 检验统计量 用于假设检验问题的统计量称为检验统计量 检验统计量. 用于假设检验问题的统计量称为检验统计量. 与参数估计相同,需要考虑: 与参数估计相同,需要考虑: 总体是否正态分布; 总体是否正态分布; 大样本还是小样本; 大样本还是小样本; 总体方差已知还是未知 未知. 总体方差已知还是未知.
1比 0 大还是小
单侧检验(单尾) 强调某一方向性的检验. 单侧检验(单尾):强调某一方向性的检验.
H 0 : 1 ≥ 0 左侧检验 H 1 : 1 < 0 H 0 : 1 ≤ 右侧检验 H 1 : 1 >
假设检验中的单侧检验示意图
拒绝域
拒绝域
(a)右侧检验
(b)左侧检验
(3)Z的分布:Z~N(0,1) 的分布: ~ 的分布 (4)对给定的α =0.05确定临界值.因为是双侧备择假设所以 对给定的 确定临界值. 确定临界值 查表时要注意.因概率表是按双侧排列的,所以应查1-0.05 查表时要注意.因概率表是按双侧排列的,所以应查 的值, =0.95的值,查得临界值 Z1α / 2=1.96. 的值 . (5)检验准则.|Z|<1.96,接受 0,反之,拒绝 0. 检验准则. 检验准则 ,接受H 反之,拒绝H (6)决策:因Z=1.67<1.96;落在了接受域,因此认为今年 决策: 决策 = < ;落在了接受域,因此认为今年7 岁男孩平均身高与历年7岁男孩平均身高无显著差异 岁男孩平均身高无显著差异, 岁男孩平均身高与历年 岁男孩平均身高无显著差异,即不能 拒绝零假设. 拒绝零假设.
7.1.2 假设检验的一些基本概念
3.显著性水平 显著性水平 用样本推断H 是否正确,必有犯错误的可能. 用样本推断 0是否正确,必有犯错误的可能. 原假设H 正确,而被我们拒绝,犯这种错误的概率用α表示. 原假设 0正确,而被我们拒绝,犯这种错误的概率用α表示. 称为假设检验中的显著性水平 显著性水平( 把α称为假设检验中的显著性水平 Significant level), 即决 策中的风险. 策中的风险. 显著性水平就是指当原假设正确时人们却把它拒绝了的概率 显著性水平就是指当原假设正确时人们却把它拒绝了的概率 或风险. 或风险. 通常取α 那么, 通常取α=0.05或α=0.01或α=0.001, 那么 接受原假设时正 或 或 确的可能性(概率 为:95%, 99%, 99.9%. 确的可能性 概率)为 . 概率
X 解:从题意可知, =1.36米, 0=1. 32米, =0.12米. 从题意可知, 米 米 σ 米 (1)建立假设:H0: =1.32,H1: ≠ 1.32 建立假设: 建立假设 , (2)确定统计量: 确定统计量: 确定统计量
X 1.36 1.32 = = 1.67 Z= σ / n 0.12 / 25
α与β
(3)要想减少α与β,一个方法就是要增大样本容量 . 要想减少α 一个方法就是要增大样本容量n. 要想减少 一个方法就是要增大样本容量
σ σ
若增大 n ,在样本平均数的分布 变小,
X ~ N ( ,
2
2
σ
n
)中,
n
就会
变小,则分布就瘦长,
从而减少了两种错误的
n 概率 α 与 β .
7.1.3 假设检验的步骤
+
2 σ2
~ N (0,1)
n2
[例7-4]由长期积累的资料知道,甲,乙两城市 岁男 例 由长期积累的资料知道, 乙两城市20岁男 由长期积累的资料知道 青年的体重都服从正态分布,并且标准差分别为14.2公斤和 青年的体重都服从正态分布,并且标准差分别为 公斤和 10.5公斤,现从甲,乙两城市各随机抽取 名20岁男青年, 公斤, 岁男青年, 公斤 现从甲,乙两城市各随机抽取27名 岁男青年 则测得平均体重分别为65.4公斤和 公斤和54.7公斤,问甲,乙两城 公斤, 则测得平均体重分别为 公斤和 公斤 问甲, 岁男青年平均体重有无显著差异( 市20岁男青年平均体重有无显著差异 α = 0.05)? 岁男青年平均体重有无显著差异 解:从题意可知,1 = 65.4 公斤,σ 1=14.2公斤,X 2= 54.7公 公斤, 公斤, 从题意可知, 公斤 公 X σ 公斤; 斤, 2=10.5公斤; 1 = n2 = 27 . 公斤 n (I)建立假设:H0: 1 = 2 , 建立假设: 建立假设 H1: 1 ≠ 2 . :
7.1.2 假设检验的一些基本概念
1.原假设和备择假设 原假设和备择假设 原假设: 表示, 原假设:用H0表示,即虚无假设,零假设,无差异假设; 表示 即虚无假设,零假设,无差异假设; 备择假设: 表示, 备择假设:用H1表示,是原假设被拒绝后替换的假设. 表示 是原假设被拒绝后替换的假设. 若证明为H0为真, 为假; 为假, 为真. 若证明为 为真,则H1为假; H0为假,则H1为真. 为真 为假 为假 为真 对于任何一个假设检验问题所有可能的结果都应包含在两 对于任何一个假设检验问题所有可能的结果都应包含在两 所有可能的结果都应包含在 个假设之内,非此即彼. 个假设之内,非此即彼. 之内
1,建立原假设和备择假设; ,建立原假设和备择假设 2,确定适当的检验统计量 ,确定适当的检验统计量; 3,指定检验中的显著性水平 ,指定检验中的显著性水平; 4,利用显著性水平根据检验统计量的值建立拒绝原假设的规则 ,利用显著性水平根据检验统计量的值建立拒绝原假设的规则; 5,搜集样本数据 计算检验统计量的值 计算检验统计量的值; ,搜集样本数据,计算检验统计量的值 6,作出统计决策 两种方法 两种方法) ,作出统计决策:(两种方法 (1) 将检验统计量的值与拒绝规则所指定的临界值相比较 确定是 将检验统计量的值与拒绝规则所指定的临界值相比较,确定是 否拒绝原假设; 否拒绝原假设 (2)由步骤 的检验统计量计算 值,利用 值确定是否拒绝原假设. 由步骤5的检验统计量计算 利用p值确定是否拒绝原假设 由步骤 的检验统计量计算p值 利用 值确定是否拒绝原假设.