第六章假设检验
合集下载
第六章 假设检验.
![第六章 假设检验.](https://img.taocdn.com/s3/m/2466aaf0aeaad1f346933fd1.png)
n 即 z A,没有落入拒绝域内 , 所以没有足够的理由 来拒绝原假设 H 0,该样本的信息说明生 产正常
检验统计量的 P 值为: P( Z 1.8) 1 - P( Z 1.8) 1 - 0.9281 0.0719 0.05 因此,拒绝原假设的证 据也不强。
2.单侧检验 对于单侧检验,以左侧检验为例,要检验的 假设: H0 : 0对H1 : 0 1)假定原假设 H 0 : 0成立, 并令
S是样本标准方差,即检验统计量服从自 由度为n-1的t分布,我们称之为t检验统 计量,n>30, 可用z检验代替
例6.6 解:根据问题的要求,确定原假设与备择假设
H0 : 1000 对H1 : 1000
这是一个双侧检验 , S 24 已知, 可用t检验。 x 986, 0.05, 查表,t / 2 (n 1) t / 2 (8) 2.306, 因此,拒绝域A {t ; t 2.306}, 计算t检验统计量的值
P( Z za)
2)通过查标准正态分布表求出临界值za.由此临界 值确定由检验统计量表示的拒绝域
A {z; z z / 2 }
3)对于样本 x ( x1 , x2 ,..., xn )计算检验统计量的值
n 不能拒绝原假设
z
x 0
, 若 z A,则拒绝原假设,否则
即 z A {z, z 1.645},落入拒绝域内 , 所以没有充分的理由 接受原假设H 0,接受备择假设,该样 本的数据支持该公司的 自我声称
三、正态总体方差的假设检验
2 2 设原假设H 0 : 2 0 , H1 : 2 0
检验统计量为
第6章-假设检验课件
![第6章-假设检验课件](https://img.taocdn.com/s3/m/abb72c1bb207e87101f69e3143323968011cf4a4.png)
3. 第Ⅰ类错误(错误)
原假设为正确时拒绝原假设
第Ⅰ类错误的概率记为,被称为显著性水平
2. 第Ⅱ类错误(错误)
原假设为错误时未拒绝原假设
第Ⅱ类错误的概率记为
6 - 17
2008年8月
统计学
STATISTICS (第三版)
两类错误的关系
和的关系就像 翘翘板,小就 大, 大就小
你不能同时减 少两类错误!
➢ 我们应该放弃“正常人的平均体温是37oC”这个 共识吗?本章的内容就将提供一套标准统计程序 来检验这样的观点
6-4
2008年8月
第 6 章 假设检验
6.1 假设检验的基本原理
6.1.1 怎样提出假设? 6.1.2 怎样做出决策? 6.1.3 怎样表述决策结果?
6.1 假设检验的基本原理 6.1.1 怎样提出假设?
H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
6 - 10
2008年8月
统计学
STATISTICS (第三版)
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test)
2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
2. 当不拒绝原假设时,我们称样本结果是统 计上不显著的
6 - 32
2008年8月
第 6 章 假设检验
6.2 一个总体参数的检验
6.2.1 总体均值的检验 6.2.2 总体比例的检验 6.2.3 总体方差的检验
统计学
STATISTICS (第三版)
统计学第六章假设检验
![统计学第六章假设检验](https://img.taocdn.com/s3/m/684f314aeef9aef8941ea76e58fafab069dc4495.png)
10
即 z 拒绝域,没有落入接受域,所以没有足够理由接受原假设H0, 同
时,说明该类型电子元件的使用寿命确实有了显著的提高。
第六章 假设检验
1. 正态总体均值的假设检验
(2) 总体方差 2 未知的情形
双侧举例:【例 6-6】某厂用生产线上自动包装的产品重量服从正态
分布,每包标准重量为1000克。现随机抽查9包,测得样本平均重量为
100个该类型的元件,测得平均寿命为102(小时), 给定显著水平α=0.05,
问,该类型的电子元件的使用寿命是否有明显的提高?
解:该检验的假设为右单侧检验 H0: u≤100, H1: u>100
已知 z z0.05 1.645
zˆ x u0 n 100 (102 100 ) 2 1.645
986克,样本标准差是24克。问在α=0.05的显著水平下,能否认为生产线
工作正常? 解:该检验的假设为双侧检验 H0: u=0.5, H1: u≠0.5
已知 t /2 (n 1) t0.025 (9 1) 2.306, 而 tˆ x u 986 1000 1.75 可见 tˆ 1.75 2.306
设H0, 同时,说明该包装机生产正常。
其中 P( Z 1.8) 1 P( Z 1.8) 1 0.9281 0.0719 0.05。
第六章 假设检验
单侧举例:【例 6-4】某电子产品的平均寿命达到5000小时才算合格,
现从一批产品中随机抽出12件进行试验,产品的寿命分别为
5059, 3897, 3631, 5050, 7474, 5077, 4545, 6279, 3532, 2773, 7419, 5116
的显著性水平=0.05,试测算该日生产的螺丝钉的方差是否正常?
第六章 假设检验
![第六章 假设检验](https://img.taocdn.com/s3/m/e82433bbee06eff9aff8076b.png)
8
依据实际问题,建立原假设 H和0 备选假设 H1
确定检验统计量,确定该统计量的抽样分布
给定显著性水平α,查表得临界值,因此确定拒绝 的区H间0 范围(拒绝域)
据样本观察值计算统计量,
做出决策是接受原假设 H,0 还是拒绝原假设 H 0
9
H真0 实 不H 0 真实
接受 H 0
拒绝 H 0
40
一个假设检验问题的结论是简单的,给定显著性 水平,不是拒绝原假设,就是接受原假设,但是 有可能存在如下情况:在显著性水平α=0.05时拒 绝了原假设,但在显著性水平α=0.01下保留原假 设。因为降低显著性水平会导致拒绝域缩小,这 样原来落在α=0.05的拒绝域中的检验统计量的观 察值有可能落在α=0.01到接受域中。由此提出p值检验。
42
(一)z检验的p-值:
检验统计量为z统计量的p-值计算公式,z 0表示检
验统计量的抽样数据,则p-值的计算方法如下:
如果: H 1 , 0p-值=
pz z0
如果: H 1 , 0p-值= 如果: H 1 ,0 p-值=
p z z0 p z z0
例6:利用p-值检验重新检验例1。 解: 第一、第二步与例1完全相同,故省略之。 第三步:计算样本统计的数值。 样本平均数 X 2,48n=50,代入检验统计量得:
26
解:此题为右侧检验。 第一步,建立假设
H0 : , 100 H1 : 100
第二步,确定检验统计量及其分布
z X 0 ~ N 0,1
n
第三步,确定临界值,右单侧检验临界值 α=0.05,查标准正态分布表得临界值:
显著性水z平
z=1.645,拒绝域是z>1.645。
27
依据实际问题,建立原假设 H和0 备选假设 H1
确定检验统计量,确定该统计量的抽样分布
给定显著性水平α,查表得临界值,因此确定拒绝 的区H间0 范围(拒绝域)
据样本观察值计算统计量,
做出决策是接受原假设 H,0 还是拒绝原假设 H 0
9
H真0 实 不H 0 真实
接受 H 0
拒绝 H 0
40
一个假设检验问题的结论是简单的,给定显著性 水平,不是拒绝原假设,就是接受原假设,但是 有可能存在如下情况:在显著性水平α=0.05时拒 绝了原假设,但在显著性水平α=0.01下保留原假 设。因为降低显著性水平会导致拒绝域缩小,这 样原来落在α=0.05的拒绝域中的检验统计量的观 察值有可能落在α=0.01到接受域中。由此提出p值检验。
42
(一)z检验的p-值:
检验统计量为z统计量的p-值计算公式,z 0表示检
验统计量的抽样数据,则p-值的计算方法如下:
如果: H 1 , 0p-值=
pz z0
如果: H 1 , 0p-值= 如果: H 1 ,0 p-值=
p z z0 p z z0
例6:利用p-值检验重新检验例1。 解: 第一、第二步与例1完全相同,故省略之。 第三步:计算样本统计的数值。 样本平均数 X 2,48n=50,代入检验统计量得:
26
解:此题为右侧检验。 第一步,建立假设
H0 : , 100 H1 : 100
第二步,确定检验统计量及其分布
z X 0 ~ N 0,1
n
第三步,确定临界值,右单侧检验临界值 α=0.05,查标准正态分布表得临界值:
显著性水z平
z=1.645,拒绝域是z>1.645。
27
第六章--假设检验基础课件
![第六章--假设检验基础课件](https://img.taocdn.com/s3/m/71708a11ff4733687e21af45b307e87101f6f89f.png)
两样本所属总体方差相等且两总体均为正态分布
H 0 : 1 2H 1 :1 2 ( 单 1 2 或 侧 1 2 )
当H0成立时,检验统计量:
t X1X2 ~t, n1n22
Sc2n 11n12
第六章 假设检验基础
Sc2
n1
1S12 n2 1S22
n1 n2 2
X1 X1 2 X2 X2 2 n1 n2 2
第六章 假设检验基础
55、作出推断结论:当P≤时,结论为 按所取检验水准α拒绝H0,接受H1,差异有 统计学显著性意义。如果P> ,结论为按 所取检验水准α不拒绝H0,差异无统计学显 著性意义。其间的差异是由抽样误差引起
的。
第六章 假设检验基础
1.建立检验假设
原 假 设 H0:0 14.1 备 择 假H设1 :0(单 侧 ) 检 验 水 准: 0.05
第六章 假设检验基础
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
td0 ~t, n1
Sd n
第六章 假设检验基础
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
二、序号配对设计资用料药前的t 检验 用药后
n1 20, X1 17.15,S1 1.59,n1 34, X2 16.92,S2 1.42
Sc2
n1
1S12 n2 1S22
n1 n2 2
2011.592 3411.422
20342
2.2 0
t X1 X2 17.1516.92 0.550
Sc2
1 n1
1 n2
2.20 1 1 20 34
得治疗前后舒张压(mmHg)的差值(前–后)如下表。问新药和标准药的疗效
H 0 : 1 2H 1 :1 2 ( 单 1 2 或 侧 1 2 )
当H0成立时,检验统计量:
t X1X2 ~t, n1n22
Sc2n 11n12
第六章 假设检验基础
Sc2
n1
1S12 n2 1S22
n1 n2 2
X1 X1 2 X2 X2 2 n1 n2 2
第六章 假设检验基础
55、作出推断结论:当P≤时,结论为 按所取检验水准α拒绝H0,接受H1,差异有 统计学显著性意义。如果P> ,结论为按 所取检验水准α不拒绝H0,差异无统计学显 著性意义。其间的差异是由抽样误差引起
的。
第六章 假设检验基础
1.建立检验假设
原 假 设 H0:0 14.1 备 择 假H设1 :0(单 侧 ) 检 验 水 准: 0.05
第六章 假设检验基础
检验假设为:
H 0 : d 0H 1 :d 0 ( 单 d 0 或 侧 d 0 )
当H0成立时,检验统计量:
td0 ~t, n1
Sd n
第六章 假设检验基础
表6第-1二用节药前t后检患儿验血清中免疫球蛋白IgG(mg/dl)含量
二、序号配对设计资用料药前的t 检验 用药后
n1 20, X1 17.15,S1 1.59,n1 34, X2 16.92,S2 1.42
Sc2
n1
1S12 n2 1S22
n1 n2 2
2011.592 3411.422
20342
2.2 0
t X1 X2 17.1516.92 0.550
Sc2
1 n1
1 n2
2.20 1 1 20 34
得治疗前后舒张压(mmHg)的差值(前–后)如下表。问新药和标准药的疗效
卫生统计学课件_第六章_假设检验
![卫生统计学课件_第六章_假设检验](https://img.taocdn.com/s3/m/34f115b051e79b89680226b5.png)
16
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
公式:t
自由度:对子数 - 1
适用条件:两组配对计量资料。 例题:p. 34, 例8
三、两个小样本均数比较的 t 检验
▲目的:由两个样本均数的差别推断两样本
所代表的总体均数间有无差别。 ▲计算公式及意义: t 统计量: 自由度:n1 + n2 –2
18
▲ 适用条件:
(1)已知/可计算两个样本均数及它们的标准差 ;
38
(2)当不能拒绝
II 类错误的概率 β 值的两个规律:
1. 当样本量一定时, α 愈小, 则 β 愈大,反之…; 2.当 α 一定时, 样本量增加, β 减少.
39
4. 正确理解P值的意义, P值很小时“拒绝H0 ”,P值的
大小不要误解为总体参数间差异的大小; 拒绝H0 只是说 差异不为零。 统计学中的差异显著或不显著,和日常生活中所说的差 异大小概念不同. (不仅区别于均数差异的大小,还区别 于均数变异的大小)
统计推断
用样本信息推论总体特征的过程。
包括:
参数估计: 运用统计学原理,用从样本计算出来的统计
指标量,对总体统计指标量进行估计。
假设检验:又称显著性检验,是指由样本间存在的差
别对样本所代表的总体间是否存在着差别做出判断。
第一节
▲显著性检验;
假设检验
▲科研数据处理的重要工具;
▲某事发生了:
是由于碰巧?还是由于必然的原 因?统计学家运用显著性检验来 处理这类问题。
45
41
是非判断: ( )1.标准误是一种特殊的标准差,其 表示抽样误差的大小。 ( )2.N一定时,测量值的离散程度越 小,用样本均数估计总体均数的抽样误差 就越小。 ( )3.假设检验的目的是要判断两个样 本均数的差别有多大。
第六章 假设检验
![第六章 假设检验](https://img.taocdn.com/s3/m/1cf1e5dabb4cf7ec4afed0e4.png)
,接受 H 1 。表明在
第二节 总体均值的假设检验
(二)总体为非正态分布或分布未知 当总体分布为非正态分布且大样本时,检验的 X 统计量为 Z
0
/
n
在“原假定成立”的条件下,只要样本容量充分 大(一般习惯上要求 n≥30),它近似服从标准正 态分布。 如果标准差σ未知,只需用样本标准差S作为它 的估计量代替式中的 σ即可,这时检验统计量为
检验统计量服从t分布与其服从标准正态分布的检验结论判断方法一致
例6.3 某厂购买了一台新的生产机器,生产零件的长度规定为10厘米。为了 检验机器的性能是否良好,质检员随机抽取了25件产品,测得其平均长度为9.8厘 米,标准差为0.4厘米。假设生产的零件长度服从正态分布,问在显著性水平 =0.05时,该机器的性能是否良好。 2 解:设 X 表示该机器生产零件的长度,则有 X ~ N (, ),样本容量n=25,样本 均值 x =9.8厘米,样本标准差 s 0.4 厘米。根据问题提出的假设为: H0 : 0 =10厘米; H 1 : 0 =10厘米 这是一个双侧检验问题,因为总体服从正态分布但总体方差未知,用检验的小 样本数据检验,故当 H 0 成立时,检验统计量为: x 0
t
s n
规定显著性水平为 =0.05,查表得到临界值 t / 2(24) 2.064 ,所以原假设的否 定域为:t 2.064 。 计算检验统计量的值: t x 0 9.8 10 2.5
s 0.4 n 100
因为 |-2.5|=2.5>2.064,落在否定域,所以否定 H 0 显著性水平 =0.05时,不能说该机器的性能良好。 互动地带 6-11
第Ⅱ类错误,也称取伪错误 本来是非真的,却根据检验统计量的值把它给接受了。 发生这种错误的概率通常用 表示,即 P(接受H 0 / H 0非真) 在样本容量一定时,犯两种错误的风险是彼此消长的。两者要同时得到控制只 有增加样本容量。在样本容量受限时,通常根据研究问题的性质决定重点控制 第一类错误的风险还是控制第二类错误的风险。
第六章 假设检验
![第六章 假设检验](https://img.taocdn.com/s3/m/9f434d6958fafab069dc0261.png)
第六章 假设检验
第一节 假设检验的基本原理
第二节 总体参数假设检验
假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
第一节 假设检验的基本原理
一、假种假设,然后利
用样本信息来判断原假设是否成立,决定应接受或
否定假设。假设检验也称为显著性检验。
在此,我们关心的是新机床加工零件的椭圆度总体均值 与老机床加工零件的椭圆度总体均值为0.081mm是否有 不同,可作如下假设 原假设 H 0 : 0.081mm 没有明显差异 备择假设 H1 : 0.081mm 有显著差异, 这是一个双侧检验问题,所以只要 > 0 或 < 0 二者之间有一个成立就可以拒绝原假设。
例某机床厂加工一种零件,根据经验知道,该厂加工零件的椭
圆度近似服从正态分布,其总体均值为0=0.081mm,总体标
准差为= 0.025 今换一种新机床进行加工,抽取n=200个零件 进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的 椭圆度的均值与以前有无显著差异?(=0.05)
H 0 : 0.081mm H1 : 0.081mm < 0 或 > 0 有一个成立就可以拒绝原假设。
为了减少冤枉好人的概率,应尽可能接受原假设, 判被告无罪,这可能增大了放过坏人的概率。
第二节总体参数假设检验
一、总体均值的假设检验
总体均值的检验
(检验统计量)
是
总体 是否已知 ?
否
小 样本容量 n
用样本标 准差S代替
大
z 检验
z 检验
t 检验
Z
X 0
n
Z
X 0 S n
t
第一节 假设检验的基本原理
第二节 总体参数假设检验
假设检验在统计方法中的地位
统计方法
描述统计 推断统计
参数估计
假设检验
第一节 假设检验的基本原理
一、假种假设,然后利
用样本信息来判断原假设是否成立,决定应接受或
否定假设。假设检验也称为显著性检验。
在此,我们关心的是新机床加工零件的椭圆度总体均值 与老机床加工零件的椭圆度总体均值为0.081mm是否有 不同,可作如下假设 原假设 H 0 : 0.081mm 没有明显差异 备择假设 H1 : 0.081mm 有显著差异, 这是一个双侧检验问题,所以只要 > 0 或 < 0 二者之间有一个成立就可以拒绝原假设。
例某机床厂加工一种零件,根据经验知道,该厂加工零件的椭
圆度近似服从正态分布,其总体均值为0=0.081mm,总体标
准差为= 0.025 今换一种新机床进行加工,抽取n=200个零件 进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的 椭圆度的均值与以前有无显著差异?(=0.05)
H 0 : 0.081mm H1 : 0.081mm < 0 或 > 0 有一个成立就可以拒绝原假设。
为了减少冤枉好人的概率,应尽可能接受原假设, 判被告无罪,这可能增大了放过坏人的概率。
第二节总体参数假设检验
一、总体均值的假设检验
总体均值的检验
(检验统计量)
是
总体 是否已知 ?
否
小 样本容量 n
用样本标 准差S代替
大
z 检验
z 检验
t 检验
Z
X 0
n
Z
X 0 S n
t
第六章假设检验
![第六章假设检验](https://img.taocdn.com/s3/m/b9dfcaf79b89680203d82553.png)
当我们把真实的原假设当成假的加以拒绝, 称为第一类错误,也称弃真错误、α错误,犯 第一类错误的概率就是显著性水平α;当我们 把不真实的原假设当作真的加以接受,称为第 二类错误,也称取伪错误、β错误,犯第二类 错误的概率是不确定的。
α也称为生产者风险:在生产者将产品售给消费者时,通常 要进行产品的质量检验,原假设总是产品是合格的,但是检验 时生产者总是担心把合格品检验为不合格品,也就是第一类错 误α,所以α也称为生产者风险。 β也称为消费者风险:在消费者一方总恐怕把不合格品检验 不出来而当作合格品接受,因而β也称为消费者风险。
(二)未知总体分布及总体方差,大样本 1.检验总体均值的统计量
(三)总体为正态分布、方差未知、小样本 1. 检验统计量
2. 拒绝域的临界值 可以根据双侧检验还是单侧检验来确定拒绝域的 临界值。当为双侧检验,显著性水平a时,临界值 为 ;当为右侧检验时,显著性水平a,监界值 为 ;当为左侧检验时,显著性水平为a,临界值 为- 。
备择假设,常用H1表示。即原假设被否定之 后而采取的逻辑对立假设。
(二)检验统计量
有了两个假设,就要根据数据来对他们进行判 断。数据的代表是作为其函数的统计量,对样 本数据进行加工并用来判断是否接受原假设的统计 量称作检验统计量 统计量最常用的是Z统计量、t统计量。
统计量的选择要根据研究的参数及其估计量 的分布、抽样的方式、总体方差是否已知等多种 因素来确定
第四步:确定决策规则。拒绝或没有拒绝原假设的决 策是建立在由样本数据来进行统计检验并将其与假设 的抽样分布比较。抽样分布被分成两个部分,拒绝域 和非拒绝域。如果原假设是真实的,那么统计检验不 可能落入拒绝域。因此,如果统计检验落入了拒绝域, 我们拒绝原假设;否则,我们不能拒绝它。
α也称为生产者风险:在生产者将产品售给消费者时,通常 要进行产品的质量检验,原假设总是产品是合格的,但是检验 时生产者总是担心把合格品检验为不合格品,也就是第一类错 误α,所以α也称为生产者风险。 β也称为消费者风险:在消费者一方总恐怕把不合格品检验 不出来而当作合格品接受,因而β也称为消费者风险。
(二)未知总体分布及总体方差,大样本 1.检验总体均值的统计量
(三)总体为正态分布、方差未知、小样本 1. 检验统计量
2. 拒绝域的临界值 可以根据双侧检验还是单侧检验来确定拒绝域的 临界值。当为双侧检验,显著性水平a时,临界值 为 ;当为右侧检验时,显著性水平a,监界值 为 ;当为左侧检验时,显著性水平为a,临界值 为- 。
备择假设,常用H1表示。即原假设被否定之 后而采取的逻辑对立假设。
(二)检验统计量
有了两个假设,就要根据数据来对他们进行判 断。数据的代表是作为其函数的统计量,对样 本数据进行加工并用来判断是否接受原假设的统计 量称作检验统计量 统计量最常用的是Z统计量、t统计量。
统计量的选择要根据研究的参数及其估计量 的分布、抽样的方式、总体方差是否已知等多种 因素来确定
第四步:确定决策规则。拒绝或没有拒绝原假设的决 策是建立在由样本数据来进行统计检验并将其与假设 的抽样分布比较。抽样分布被分成两个部分,拒绝域 和非拒绝域。如果原假设是真实的,那么统计检验不 可能落入拒绝域。因此,如果统计检验落入了拒绝域, 我们拒绝原假设;否则,我们不能拒绝它。
第六章 假设检验
![第六章 假设检验](https://img.taocdn.com/s3/m/baf737c8710abb68a98271fe910ef12d2bf9a97b.png)
绝原假设。这时需要选择另一个假设,这个假设 就是备择假设。即:
Ha : u≠3190(克) (有符号 , 或 )
2、Ha为备择假设,表示1990年新生儿与1989年新
生儿体重有明显差异。也可表达为:
Ha:u ≠ m0 或 Ha:u- m0 ≠0
6.1 假设检验的基本概念
提出假设 (结论与建议)
第Ⅰ类错误的概率的条件下,尽可能使犯第Ⅱ类
错误的概率减小。
6.2 一个总体参数的检验
1. 总体均值的检验 2. 总体比例的检验
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验
(检验样本是否来自某已知总体均值的总体)
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验( 2 已知)
H0 :m 1.35 Ha :m <1.35 = 0.01
n = 50 临界值(c):
拒绝H0 0.01
-2.33 0
检验统计量:
z 1.3152 1.35 2.6061 0.365749 50
决策:
拒绝H0
结论:
新机床加工的零件尺寸的平均误 差与旧机床相比有极显著的降低
z
6.2 一个总体参数的检验
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0 样本统计量
第四章 概率论与抽样分布
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0
样本统计量
第四章 概率论与抽样分布
Ha : u≠3190(克) (有符号 , 或 )
2、Ha为备择假设,表示1990年新生儿与1989年新
生儿体重有明显差异。也可表达为:
Ha:u ≠ m0 或 Ha:u- m0 ≠0
6.1 假设检验的基本概念
提出假设 (结论与建议)
第Ⅰ类错误的概率的条件下,尽可能使犯第Ⅱ类
错误的概率减小。
6.2 一个总体参数的检验
1. 总体均值的检验 2. 总体比例的检验
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验
(检验样本是否来自某已知总体均值的总体)
第四章 概率论与抽样分布
6.2 一个总体参数的检验
总体均值的检验( 2 已知)
H0 :m 1.35 Ha :m <1.35 = 0.01
n = 50 临界值(c):
拒绝H0 0.01
-2.33 0
检验统计量:
z 1.3152 1.35 2.6061 0.365749 50
决策:
拒绝H0
结论:
新机床加工的零件尺寸的平均误 差与旧机床相比有极显著的降低
z
6.2 一个总体参数的检验
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0 样本统计量
第四章 概率论与抽样分布
6.2 一个总体参数的检验
显著性水平和拒绝域
抽样分布
(左侧检验 )
置信水平
拒绝H0
1 -
临界值
H0
样本统计量
第四章 概率论与抽样分布
第六章假设检验-PPT课件
![第六章假设检验-PPT课件](https://img.taocdn.com/s3/m/83f82c890029bd64783e2c50.png)
货物进行检测一下,看看这部货物次品率是否超过1%, 由于你抽取的货物是随机的,因此所抽查货物的次品率也 是随机的。为此,我们假定前面的假设是正确的,在这基 础上计算题目中的事件A:“随机抽取产品中次品率不超 过1%”发生的概率。
6 0.01 p0.01 200 P(A ) P {z } p(1 p) 0.01(10.01 ) n 200 P {z 2.619 }0.0044
例2 某地区小麦的一般生产水平是亩产250公斤,其标准 差是6公斤。现在经过品种改良试验,从25个小区抽样, 结果为小麦平均亩产比原来提高20公斤。对检验假设 H 5 0 , H 5 0 的问题,求 270 0 : 2 1 : 2 时,不犯第二类错误的概率。假设小麦亩产服从正态分布 ( 0.05 )。
在(1)式中,z 正好是统计量,并且其分布是标准正态
(1)
分布,计算结果及示意图是
y
0.0044
2.61
x
从(1)的计算结果可以看出,在超市提出的假设成立的 情况下,随机抽取的200件产品中,有6件是次品的概率 为0.0044,显然这是一个小概率事件,认为在一次抽查中 不应该发生,现在它发生了,我们怀疑超市提出的假设不 应该成立。也就是拒绝这批产品进入超市。 在这个例子中,超市提出了假设,通过抽样获得样本数
次试验中不发生原理,照样乘车、乘飞机等。 2、假设检验问题的提出 在用统计学研究自然科学和社会科学问题时,有时提出一 个假设,这个假设称为原假设,然后依据小概率事件在一 次试验中不发生原理,检验这个假设正确与否。 例1 某超市从厂家进货,双方达成协议,如果次品率超 过1% ,则超市拒收货物,今有一批货物,随机抽取200 0.05 下, 件检查,发现有次品3件,在显著性水平 试问超市是否要接受这批货物? 作为超市来说,可以提出一个假设:次品率小于或等于 1%,再抽取样本,检验这个假设对不对, 若假设成立,就 允许这批货物进入超市,相反,若假设不成立,就拒绝这 批货物进入超市。现在问题的关键在于如何判断这批货物 的次品率是否超过1%,有些同学可能会说可以抽一部分
贾俊平统计学第6章假设检验
![贾俊平统计学第6章假设检验](https://img.taocdn.com/s3/m/faf7c4f11b37f111f18583d049649b6648d709b5.png)
正态分布
01
正态分布是一种常见的概率分布 ,其概率密度函数呈钟形曲线, 具有对称性、连续性和可加性等 性质。
02
正态分布广泛存在于自然界和人 类社会中,许多随机变量都服从 或近似服从正态分布。
t分布
t分布是正态分布在自由度不同时的 另一种表现形式,其形状与正态分布 相似,但尾部概率不同。
在假设检验中,t分布在样本量较小或 总体标准差未知时常常被用来代替正 态分布进行统计分析。
界值,判断是否拒绝原假设。
双侧Z检验
总结词
双侧Z检验是用于检验一个总体均数是否与已知值存在显著差异的统计方法。
详细描述
双侧Z检验的步骤与单侧Z检验类似,但需要计算双尾Z值,并根据临界值判断是否拒绝原假设。例如,要检验某 产品的质量是否合格,可以提出原假设为产品质量合格,备择假设为产品质量不合格,然后通过计算Z值和临界 值,判断是否拒绝原假设。
03
样本统计量与抽样分布
样本均值和样本方差
样本均值
表示样本数据的平均水平,计算公式为 $bar{x} = frac{1}{n}sum_{i=1}^{n} x_i$,其中 $n$ 为样本容量, $x_i$ 为第 $i$ 个样本数据。
样本方差
表示样本数据的离散程度,计算公式为 $S^2 = frac{1}{n-1}sum_{i=1}^{n} (x_i - bar{x})^2$,其中 $S^2$ 为样本方差,$bar{x}$ 为样本均值。
假设检验的逻辑
小概率事件原理
如果一个事件在多次试验中发生的概 率很小,那么在一次试验中该事件就 不太可能发生。
反证法
先假设原假设成立,然后根据样本数 据和统计原理,推导出与已知事实或 概率相矛盾的结论,从而拒绝原假设 。
《概率论》第六章假设检验
![《概率论》第六章假设检验](https://img.taocdn.com/s3/m/274484b1d0d233d4b04e690c.png)
例1 某服务系统的相应时间服从正态分布,需求 其平均相应时间在0.5秒之内。若16次抽样测试得 到样本平均值为x=0.56秒,样本标准差为s=0.12秒, 该服务系统工作是否正常?(=0.05)
解:H0 : 0.5 n=16 =0.05 t1 1.753 t x 0 0.56 0.5 =2 >1.753 s n 0.12 16
因此否定H0 即该服务系统工作不正常
(二)未知方差2,关于期望的检验
1.检验假设(单边)H0 : 0 H1 : 0
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t (n 1),
2.选取检验统计量 T X 0 [ t(n 1)] Sn
3.由备选假设确定拒绝域形式,W=(t c)
4.由显著性水平决定临界值c=t1 (n 1),
P T t1 (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t t1 (n 1),则否定H0; 若t t1 (n 1),则接受H0.
因此这实际上需要比较第二个正态总体 的期望值是与第一个正态总体期望值相 等还是比它高?
这种作为检验对象的假设称为原假设, 通常用 H0表示。比如, 例2中的待检假设为:H0:Eξ=3140
如何根据样本的信息来判断关于总体分布的 某个设想是否成立,也就是检验假设H0成立 与否的方法是本章要介绍的主要内容。
P T t (n 1)
5.求出检验统计量的观测值,判断是否在拒绝域中
即:若t<t (n 1),则否定H0; 若t>t (n 1),则接受H0.
(二)未知方差2,关于期望的检验
第六章 假设检验
![第六章 假设检验](https://img.taocdn.com/s3/m/214523f3998fcc22bcd10d85.png)
2 2 , 1 2 已知,或大样本情况 6.3.1 2 2 两个总体均服从正态分布、两个总体的方差 1 , 2 已知;或两 个总体分布及方差未知,但大样本情况下,样本均值之差 X 1 X 2 的抽样分布服从或近似服从正态分布,即可采用检验 统计量:
第六章 假设检验 6.2 总体均值的假设检验
【例6-7】某厂采用自动包装机分装产品,假定每包产 品的重量服从正态分布,每包标准重量为1000克。某 日随机抽查9包,测得样本平均重量为986克,样本标 准差为24克。试问在0.05的显著性水平上,能否认为 这天自动包装机工作正常?
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.2
假设检验的步骤
(三)选取显著性水平,确定原假设的拒绝域和接受域 显著性水平表示原假设为真时拒绝原假设 H 0 的最大概率, 即拒绝原假设所冒的风险,用 表示。 通常取 0.05 或 0.01
6.1
第六章 假设检验 假设检验的原理
第六章 假设检验 6.2 总体均值的假设检验
6.2.3 2未知时小样本情况下总体均值的假设检验
设总体服从正态分布 X ~ N (, 2 ) ,在小样本抽样情况下,利用 t检验法对总体均值的检验,其检验统计量及分布为:
t X ~ t (n 1) s/ n
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.4
假设检验中的P值
H1 : 0
(2)左侧检验:H 0 : 0
P值= P(Z zc 0 )
H 0 : 0
(3)右侧检验:
H1 : 0
第六章 假设检验 6.2 总体均值的假设检验
【例6-7】某厂采用自动包装机分装产品,假定每包产 品的重量服从正态分布,每包标准重量为1000克。某 日随机抽查9包,测得样本平均重量为986克,样本标 准差为24克。试问在0.05的显著性水平上,能否认为 这天自动包装机工作正常?
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.2
假设检验的步骤
(三)选取显著性水平,确定原假设的拒绝域和接受域 显著性水平表示原假设为真时拒绝原假设 H 0 的最大概率, 即拒绝原假设所冒的风险,用 表示。 通常取 0.05 或 0.01
6.1
第六章 假设检验 假设检验的原理
第六章 假设检验 6.2 总体均值的假设检验
6.2.3 2未知时小样本情况下总体均值的假设检验
设总体服从正态分布 X ~ N (, 2 ) ,在小样本抽样情况下,利用 t检验法对总体均值的检验,其检验统计量及分布为:
t X ~ t (n 1) s/ n
第六章 假设检验 6.2 总体均值的假设检验
6.1
第六章 假设检验 假设检验的原理
6.1.4
假设检验中的P值
H1 : 0
(2)左侧检验:H 0 : 0
P值= P(Z zc 0 )
H 0 : 0
(3)右侧检验:
H1 : 0
第六章 假设检验
![第六章 假设检验](https://img.taocdn.com/s3/m/a50e665277232f60ddcca16e.png)
所以有 C0 = 6 × 1.65 + 250 = 因此犯第二类错误的概率是
259.9
X − 270 C0 − 270 β = P{ X ≤ C0 } = P{ } ≤ 6 6 259.9 − 270 = P{z ≤ = −1.68} = φ (−1.68) 6 = 1 − φ (1.68) = 0.0465
y
0.0044
2.61
x
从(1)的计算结果可以看出,在超市提出的假设成立的 )的计算结果可以看出, 情况下,随机抽取的200件产品中,有6件是次品的概率 件产品中, 情况下,随机抽取的 件产品中 件是次品的概率 为0.0044,显然这是一个小概率事件,认为在一次抽查中 ,显然这是一个小概率事件, 不应该发生,现在它发生了, 不应该发生,现在它发生了,我们怀疑超市提出的假设不 应该成立。也就是拒绝这批产品进入超市。 应该成立。也就是拒绝这批产品进入超市。 在这个例子中,超市提出了假设, 在这个例子中,超市提出了假设,通过抽样获得样本数
这两类错误之间的关系是:在样本容量一定时,犯第一类 这两类错误之间的关系是:在样本容量一定时, 错误概率较大时,犯第二类错误地概率较小;反之, 错误概率较大时,犯第二类错误地概率较小;反之,犯第 一类错误概率较小时,犯第二类错误概率较大。 一类错误概率较小时,犯第二类错误概率较大。要想两类 错误的概率都减小,只有增加样本容量。 错误的概率都减小,只有增加样本容量。 5、显著性水平 、 显著性水平:是指人们犯第一类错误概率的最大允许值。 显著性水平:是指人们犯第一类错误概率的最大允许值。 注意:显著性水平是人们根据自己所研究的问题来确定, 注意:显著性水平是人们根据自己所研究的问题来确定, 在经济学和其他社会科学中,常用选择的显著性水平是5% 在经济学和其他社会科学中,常用选择的显著性水平是 或者10%,在卫生和医药统计中,常用选择的显著性水平 或者 ,在卫生和医药统计中, 是1%。在我们经济学中,除非特别声明,一般都以 。在我们经济学中,除非特别声明,一般都以5% 作 为显著性水平。 为显著性水平。 6、临界值和拒绝域 、 拒绝域: 所围城的区域。 拒绝域:拒绝域就是由显著性水平 α 所围城的区域。 临界值:由给定的显著性水平确定的拒绝域的边界值, 临界值:由给定的显著性水平确定的拒绝域的边界值,称 为临界值。 分位点所对应的值。 为临界值。实际上临界值就是 α 分位点所对应的值。
第六章 假设检验
![第六章 假设检验](https://img.taocdn.com/s3/m/fe2474da6f1aff00bed51e32.png)
第一步:建立假设 第一步:
H0 : µ = 8000; H1 : µ > 8000
原假设的选取原则: 原假设的选取原则:没有充分理由 不能轻易否定的命题。 不能轻易否定的命题。
对立假设的选取原则:没有把握不 对立假设的选取原则: 能轻易肯定的命题。 能轻易肯定的命题。
第二步:寻找检验统计量 第二步:
2
第三步:给定显著性水平和临界值 第三步:
• 在原假设 H0 为真时,X 应该接近8000。 为真时, 如果 X 远离8000 ,就有理由怀疑原 假设为真。 假设为真。 • 例中,8300与8000之间算近还是算远? 例中, 之间算近还是算远? • 需要定一个界限,记此界限为c。 需要定一个界限,记此界限为c
假设检验是要根据样本的观测值对原假作 出判断,接受原假设或者拒绝。 出判断,接受原假设或者拒绝。 由于样本的随机性,客观情况未知, 由于样本的随机性,客观情况未知,有可 能犯错误。 能犯错误。 例:产品验收,有时面对的整批产品是合 产品验收, 格的,有时面对的整批产品是不合格的。 格的,有时面对的整批产品是不合格的。 拒收了合格率高的产品或者接受了合格率 低的产品都是犯了错误。 低的产品都是犯了错误。
例:餐厅的营业额问题: 餐厅的营业额问题:
H0 : µ = 8000; H1 : µ பைடு நூலகம் 8000
N(µ0 ,σ )
2 0
N(µ,σ )
2
在原假设成立的条件下,新菜单挂出后, 在原假设成立的条件下,新菜单挂出后, 每天营业额仍然服从正态分布
N(8000,640 )
如今获得了一个容量为9的样本, 如今获得了一个容量为9的样本,此时样 服从: 本均值 X 服从: 1 2 N(8000, ×640 ) 9
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
临界值
×
z
右侧检验图
右侧假设检验拒绝域在右边, 左侧假设检验拒绝域在左边。
右侧检验拒绝域:Z0 Z
左侧检验拒绝域:Z0 Z
Back
三、两类错误
以样本统计量推论总体参数,因为样本数据具随机性, 存在判断正确和错误的四种概率:
判断
接受 H0 拒绝 H0
实际
H0 为真 1(正确判断)
H0 为假
(取伪错误)
H0和H1是互斥的,主要有三种情况: 双侧或双尾假设检验(two-tailed test)
H0:μ=2500 ,H1:μ≠2500
单侧或单尾假设检验(one-tailed test)
右侧假设检验: H0:μ ≤2500 ,H1:μ>2500 左侧假设检验: H1: μ ≥2500 ,H1:μ<2500
双侧检验或单侧检验,根据H1来定。
例如:灯泡厂商在给用户提供一批灯泡时声称,该 批灯泡的平均使用寿命是1600hr。为验证厂商的说 法,需要用样本数据进行检验。
提出假设: H0:μ=1600; H1:μ≠1600
如果样本数据很接近1600hr,则可以接受H0;如果 样本数据离1600hr很远,就会拒绝H0,接受H1。
如果厂商的宣称是真的,随机抽取1件是次品的情况几乎是 不可能发生的。如果这种情况发生了,我们就有理由怀疑 原来的假设是否成立,这时我们可以推翻原来的假设。
当然,推论也可能犯错误,确实有1件次品,刚好1次被抽 到,这种错误概率是1%(显著水平)。
二、接受域和拒绝域
以统计量(称检验统计量,test statistic)的抽 样分布为基础,给定小概率α ,判断样本数据 是否接受H0。
平均数的差异性 t 检验
主讲人:朱 丹
假设检验
你相信他们的说法吗? 你要如何去证明这些说法
是正确或是错误?
对总体参数、分布形式、相互关系等提出假 设,然后利用样本数据来判断该假设论述的
合理性。
• 假设来西藏旅游的外国旅客平均消费支出8000元。 • 有人提出拉萨市民人均月收入是2500元。 • 有人提出西藏大学学生的平均IQ测验分数是110。
一、建立假设
备择假设(alternative hypothesis) :H1
研究者要收集证据予以支持的假设。 将研究结果有效的假设作为备择假设。 与原假设对立,是要研究的问题。 强调差异或方向性。
➢ 例如,某品牌洗涤剂的产品, H1:μ<500 ➢ 例如, H1:员工满意度和性别有关
一、建立假设
Back
二、接受域和拒绝域
假设设定之后,我们需要一个判别标准,判断拒绝或 接受H0。利用“小概率原理”,指发生概率很小的随机 事件,在一次试验中几乎是不可能发生的。如果发生 了,就可以拒绝提出的原假设。
例如:有一个厂商声称其产品的合格品率很高,可以达到 99%,则从一批产品(100件)中随机抽取1件,该件是次品 的概率就非常小,只有1%。
如果有人对用户说:灯泡的平均使用寿命低于1600hr。 此时,用户要研究的是μ是否会小于1600hr。
提出假设: H0:μ=1600; H1:μ<1600
思考题:
想要检验女性职员平均体重是否大于55公 斤,如何提出原假设和备择假设?
H0:μ=55; H1:μ>55 或 H0: μ≦55;H1:μ>55
三、两类错误
弃真错误
取伪错误
如前例,厂商声称产 品合格率是99%。100 件中确实只有1件次品。 进行抽样时,刚好1次 被抽到次品,这种错 误称弃真错误(第Ⅰ 类错误),错误概率 是1%(α)。
检验统计量所有可能取值分两为部分,可以拒绝H0 的检验统计量取值的集合称拒绝域。反之,称接受 域,不拒绝H0。划分的数值称临界值。
接受域的区间概率1-α,拒绝域的区间概率α。
如何定义接受域和拒绝域?
双侧假设检验的拒绝域定义:
×
z
2
z
2
临界值
H0:μ=μ0; H1:μ≠μ0
•只要μ>μ0或μ<μ0,二者 之一成立,就可以否定H0。
第六章 假设检验
第一节 假设检验原理 第二节 单一总体均值的假设检验 第三节 两个总体均值差的假设检验 第四节 总体比例与方差的假设检验 第五节 SPSS在假设检验中的应用
第一节 假设检验原理
一、建立假设 二、接受域和拒绝域 三、两类错误 四、假设检验的步骤 五、p值(p-value) 六、正确表述统计决策结果
(弃真错误) 1 (正确判断)
➢ 弃真错误又称第I类错误(Type I error)。
➢ 取伪错误又称第II类错误(Type II error)。
假设检验时,希望正确判断并减少犯错误的概率。通过 控制α(显著性水平,level of significance)减少犯错,
此种检验称显著性检验。
Back
为检验此论述,进行随机抽样调查, 以样本数据检验此假设是否成立。
假设检验
产生假设检验的原因大致有两个:
当对总体参数的真实性感到怀疑,需要通过 样本来考察其正确与否时,往往借助于假设 检验做出判断(决策)。
当对变量间存在某种关系的证据(平均值之 差、方差之比等)怀疑时,也会要求进行假 设检验。
“等号”始终在H0。
一、建立假设
例如:你对某品牌洗涤剂的产品标签中声称: “平均净含量不低于500克”,感到质疑。
你想要证实“平均净含量不足500克”。即你想 要推翻的是μ≥500克,要证实μ<500克。
此时,H0:μ≥500
例如:你研究认为员工满意度和性别有关,你 想要以样本数据来支持你的论点。 此时,H0:员工满意度和性别无关
•它有两个拒绝域,两个临界值,
× 每个拒绝域的概率α/2 。
z
2
•在抽样分布两端各α/2位置上
确定拒绝域边界的临界值。
拒绝域:ZZ0orZ0Z
2
2
样本数据计算出来的统计量Z0落在拒绝域,则拒绝H0 。
单侧假设检验的拒绝域定义:
•单侧检验有一个拒绝域,一个 临界值,拒绝域的概率α 。
•在抽样分布某一端的α位置上 确定拒绝域边界的临界值。
Backห้องสมุดไป่ตู้
一、建立假设
原假设/虚无假设(null hypothesis):H0
研究者要收集证据予以反对的假设。 将研究结果无效的说法作为原假设。 设定总体参数等于某一数值。 认为两个或两个以上总体参数相等。
H0:μ=2500 OR H0:μ≥2500 (收入) H0:μ1=μ2 (1会计,2企管,统计学成绩)