统计学假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2
分别换成 t (n1 n2 2) 和 t (n1 n2 2)
2
例6.6
Excel: t-检验:双样本等方差检验
两个总体均值之差的检验
例6.7
例7.5
例7.6
样本 X1, X 2 ,......,X n 和 Y1,Y2 ,......,Yn 来自两个非正态总体,当样本容量 n1 和 n2 较大
检验规则
当样本容量较大时,t分布趋近于标准正态分布,所以在大样 本情况下总体方差未知的均值假设检验可近似采用z检验.
例6.4
(1) H 0 : 0
H1 : 0
2
检验规则为:当 t t (n 1) 时,拒绝 H 0 ;当 t t 时,不能拒绝 H 0
2
(2) H 0 : 0 (3) H 0 : 0
单个正态总体均值的检验 (方差未知)
2 总体为 N ( , 显著性水平为 , ) (二) 总体方差 2 未知时, 用t-检验
x 0 检验统计量 t s/ n
1 n 2 s ( x x ) 这里 i n 1 i 1
2
当原假设为真时, 检验统计量t服从 t (n 1)分布.
例6.0
假设检验的步骤
1. 提出 原假设
H 0 和备择假设 H 1
2. 设计检验统计量
3. 给定显著性水平和确定临界值 4. 假设检验的判断规则:是否拒绝原假设
例6.0 假如雪碧瓶的标签上标明的容量为500毫 升。如果你从市场上随机抽取25瓶,发现其 平均含量为499.5毫升(标准差s为2.63ml) 。 问:实际容量与标明容量是否有显著不同?
学会用Excel的函数
计算机输出结果1
计算机输出结果2
例7.8
例7.9
例7.10
单个正态总体方差的检验
要检验的假设
2
2 2 (1) H 0 : 2 0 ; H1 : 2 0 2 2 ( 2) H 0 : 2 0 ; H1 : 2 0 2 2 (3) H 0 : 2 0 ; H1 : 2 0
(一) 总体方差 2已知时, 用Z-检验 也称U-检验
检验统计量
x 0 z / n
检验规则
当原假设为真时, 检验统计量z服从标准正态分布 N(0, 1).
例6.2
(二)方差未知
例6.3
(1) H 0 : 0
H1 : 0
2
检验规则为:当 z z 时,拒绝 H 0 ;当 z z 时,不能拒绝 H 0
H 0 : 1 2 H 0 : 1 2
H1 : 1 2
(2)
H 0 : 1 2
H1 : 1 2
H1 : 1 2
H1 : 1 2
(2)’ H 0 : 1 2
H1 : 1 2
(3)’ H 0 : 1 2
它们等价于以下假设(以 1 和 2 为例) (1)” H 0 : 1 2 0 (2)” H 0 : 1 2 0
法庭可能犯的第Ⅰ类错误是:
被告无罪但判他有罪,即冤枉了好人; 法庭可能犯的第Ⅱ类错误是: 被告有罪但判他无罪,即放过了坏人。
为了减少冤枉好人的概率,应尽可能接受原假设,判被告无 罪,这可能增大了放过坏人的概率。
内曼—皮尔逊原则
在控制犯第Ⅰ类错误的概率 的条件下,
尽可能使犯第Ⅱ类错误的概率 减小。
第六章 假设检验 假 设 检 验
本章内容
一、假设检验概述
关于总体的陈述;利用统 计的方法推断它是否成立 及成立的可能性有多大。
分类
二、总体均值的检验
(单个均值、两个均值之差)
三、总体成数的检验
(单个成数、两个成数之差)
四、总体方差的检验
(单个方差、两个方差之比)
分类
参数检验(parametric tests)
(一) 两个总体方差 1 和 2 都已知 检验统计量 z
xy
12
n1
22
n2
例6.5
当原假设 H 0 为真时, 即 1 2 时, z 服从标准正态分布 N (0,1) 检验规则同 P154
Excel: z-检验:双样本平均差检验
(二) 两总体方差都未知,但相等
要检验的假设分别为 (1) (3)
第三节 总体成数的检验
Z近似服从N(0,1)分布
(1) H 0 : 0 ; H1 : 0 ( 2) H 0 : 0 ; H 1 : 0 (3) H 0 : 0 ; H1 : 0
(1) H 0 : 1 2 ; H1 : 1 2 ( 2) H 0 : 1 2 ; H1 : 1 2 (3) H 0 : 1 2 ; H1 : 1 2
对总体参数(平均数、成数、方差等)所作的假
设进行检验,是本章研究的内容。
非参数检验(分布检验)
对总体分布的假设进行检验
第一节 假设检验概述
一、假设检验的基本思想
二、假设检验的步骤 三、两类错误和检验规则
第二节 总体均值的检验
一、单个正态总体均值的检验 二、两个正态总体均值之差的检验 三、两个非正态总体均值之差的检验
例7.11
两个正态总体方差之比的检验
要检验的假设 检验统计量: 检验规则:
2 2 (1) H 0 : 1 2
2 2 (1) H 0 : 12 2 ; H1 : 12 2 2 2 ( 2) H 0 : 12 2 ; H1 : 12 2 2 2 (3) H 0 : 12 2 ; H1 : 12 2
在假设检验实践中,该原则的含义是: 原假设本来正确但样本落入拒绝域是小概率 事件;一旦否定原假设,接受备择假设,理 由是充分的,犯错误的可能性至多为 !
判断
也是不同的,如下图2。
单个正态总体均值的检验 (方差已知)
2 总体为 N ( ,, 显著性水平为 )
要检验的假设
(1) H 0 : 0 ; H1 : 0 (2) H 0 : 0 ; H1 : 0 (3) H 0 : 0 ; H1 : 0
例6.8
ቤተ መጻሕፍቲ ባይዱ
例6.9
例6.10
第四节 总体方差的检验
一、单个总体方差的检验 二、两个总体方差之比的检验
假设检验的基本思想
假设检验背后的哲学:
企图肯定什么事物很难,而否定却要相 对容易得多。
假设检验遵循的原理: (类似反证法)
小概率事件在一次试验或观察中不会发生。
在某种假设下,在一次试验中小概率事件不会发生,一旦 在实际中发生了,就得出矛盾,我们认为该假设错误,从而 拒绝该假设。
具体分布。
例6.1
注意:原假设和备择假设在假设检验中不对(等)称。
例6.1
假如雪碧瓶的标签上标明的容量为500毫升。
如果你从市场上随机抽取25瓶,发现其平均含量为
499.5毫升(标准差s为2.63ml)。据此可否断定饮料
厂商欺骗了消费者? 检验统计量: t x 0 s n
H0
~
t ( n 1)
2
单侧检验:
查
1 所对应的z值.
如何t 分布表
1、自由度df=? 2、单侧还是双侧 P377 附表三
3、置信水平
两类错误
第一类错误, 拒真错误, 第二类错误, 受伪错误,
两类错误的关系
两类错误的关系
以法庭对被告进行审判为例
审判被告
法庭采用无罪推定的审判准则
原假设:被告无罪,备择假设:被告有罪。
显著性水平 =0.05,则由 t (n 1) 分布表,得 t (24) 0.05 1.711;拒绝 H 0 ,即说明该地区粮 食中六六六残留量超标。
两个正态总体均值之差的检验
样本
x1 , x2 ,, xn1 来自正态总体
2 2
N ( 1 , 1 )
2
要检验的假设
2 样本 y1 , y 2 , , y n2 来自正态总体 N ( 2 , 2 )
显著性水平 =0.05,则由标准正态分布表,得 z0.05 1.65 ; 从而拒绝 H 0 ,即认为该企业职工平均奖金本月比上月有明显提高。
0.05
显著性水平 =0.05,则由 t (n 1) 分布表, 得 t (8) 0.05 1.860;不能拒绝 H 0 ,即没有足够 的证据说明该地区粮食中六六六残留量超标。
显著性水平
拒绝域和接受域的几种情形
拒绝域、接受域和临界值
双侧检验
单侧检验
临界值符号的含义
P(Z z )
假设 C 表示拒绝域, C 表示接受域,T 表示检验统计量 则
PH 0 {T C}
小概率事件
PH0 (T C ) 1
如何查标准正态分布表
设显著性水平为 P375 附表二 1 双侧检验: 查 所对应的z值;
2 n 1 s 检验统计量: 2 ~ 2 (n 1)
0
检验规则:
2 2 (1) H 0 : 0
例6.11
2 H1 : 2 0
2 2 2 2 n 1 或 n 1 时拒绝 H 0 ,否则不能拒绝 H 0 检验规则为:当 1 2
1 2
( 30 )时,构造检验统计量:
Z X Y
12 22 n1 n2
或Z
X Y
2 s12 s2 n1 n2
当 1 2 时,Z 近似服从 N 0,1 。 因此, 两个非正态总体均值之差的检验可采用 Z 检验。检验规则同 P154.
例7.7
计算机输出结果1 计算机输出结果2
H1 : 1 2 0
H1 : 1 2 0
d
两个正态总体均值之差的检验
样本 x1 , x2 ,, xn1 来自 N ( 1 , 12 ) , 样本 y1 , y 2 , , y n2 来自 N ( 2 , 2 2 ) (二) 两个总体方差 1 和 2 都未知, 但 1 2 2
双边检验
显著性水平 =0.05,则由标准正态分布表,得 z 0.025 1.96 。 从而拒绝 H 0 ,即认为直径不符合质量标准。 若取显著性水平 =0.01,则由标准正态分布表,得 z 0.005 2.58 。 不能拒绝 H 0 ,即认为没有充分的理由说明直径不符合质量标准。
单边检验
H1 : 0
检验规则为:当 t t (n 1) 时,拒绝 H 0 ;当 t t (n 1) 时,不能拒绝 H 0
H1 : 0
检验规则为:当 t t (n 1) 时,拒绝 H 0 ;当 t t (n 1) 时,不能拒绝 H 0
单个总体均值的检验
2
2 2 H : (2) 0 0
2 H1 : 2 0
2 2 检验规则为:当 n 1 时拒绝 H 0 ,否则不能拒绝 H 0 2 2 (3) H 0 : 0
2 H1 : 2 0
0 0
2 2 检验规则为:当 1 n 1拒绝 H ,否则不能拒绝 H
2 2 2 2
(n1 1) s1 (n2 1) s2 xy 检验统计量 t , 这里 s p n1 n2 2 1 1 sp n1 n2
2
2
当原假设 H 0 为真, 即 1 2 时, t 服从自由度为 n1 n2 2 的 t 分布 检验规则类似 P155-156, 只是把其中的 t ( n 1) 和 t (n 1)
2
(2) H 0 : 0 (3) H 0 : 0
H1 : 0
检验规则为:当 z z 时,拒绝 H 0 ;当 z z 时,不能拒绝 H 0
H1 : 0
检验规则为:当 z z 时,拒绝 H 0 ;当 z z 时,不能拒绝 H 0
问:是否能断定饮料厂商欺骗了消费者?
原假设
数据集3
如果公司所在市平均受教育年限为13
问:是否有所不同?
如果公司所在市平均薪水为:35000 问:是否有所不同 是否低于
是否高于?
设计检验统计量
所设计的检验统计量与原假设有关,与 待检验的参数的估计量相关,但不包含 待检验参数。
必须知道当原假设H0为真时该统计量的
分别换成 t (n1 n2 2) 和 t (n1 n2 2)
2
例6.6
Excel: t-检验:双样本等方差检验
两个总体均值之差的检验
例6.7
例7.5
例7.6
样本 X1, X 2 ,......,X n 和 Y1,Y2 ,......,Yn 来自两个非正态总体,当样本容量 n1 和 n2 较大
检验规则
当样本容量较大时,t分布趋近于标准正态分布,所以在大样 本情况下总体方差未知的均值假设检验可近似采用z检验.
例6.4
(1) H 0 : 0
H1 : 0
2
检验规则为:当 t t (n 1) 时,拒绝 H 0 ;当 t t 时,不能拒绝 H 0
2
(2) H 0 : 0 (3) H 0 : 0
单个正态总体均值的检验 (方差未知)
2 总体为 N ( , 显著性水平为 , ) (二) 总体方差 2 未知时, 用t-检验
x 0 检验统计量 t s/ n
1 n 2 s ( x x ) 这里 i n 1 i 1
2
当原假设为真时, 检验统计量t服从 t (n 1)分布.
例6.0
假设检验的步骤
1. 提出 原假设
H 0 和备择假设 H 1
2. 设计检验统计量
3. 给定显著性水平和确定临界值 4. 假设检验的判断规则:是否拒绝原假设
例6.0 假如雪碧瓶的标签上标明的容量为500毫 升。如果你从市场上随机抽取25瓶,发现其 平均含量为499.5毫升(标准差s为2.63ml) 。 问:实际容量与标明容量是否有显著不同?
学会用Excel的函数
计算机输出结果1
计算机输出结果2
例7.8
例7.9
例7.10
单个正态总体方差的检验
要检验的假设
2
2 2 (1) H 0 : 2 0 ; H1 : 2 0 2 2 ( 2) H 0 : 2 0 ; H1 : 2 0 2 2 (3) H 0 : 2 0 ; H1 : 2 0
(一) 总体方差 2已知时, 用Z-检验 也称U-检验
检验统计量
x 0 z / n
检验规则
当原假设为真时, 检验统计量z服从标准正态分布 N(0, 1).
例6.2
(二)方差未知
例6.3
(1) H 0 : 0
H1 : 0
2
检验规则为:当 z z 时,拒绝 H 0 ;当 z z 时,不能拒绝 H 0
H 0 : 1 2 H 0 : 1 2
H1 : 1 2
(2)
H 0 : 1 2
H1 : 1 2
H1 : 1 2
H1 : 1 2
(2)’ H 0 : 1 2
H1 : 1 2
(3)’ H 0 : 1 2
它们等价于以下假设(以 1 和 2 为例) (1)” H 0 : 1 2 0 (2)” H 0 : 1 2 0
法庭可能犯的第Ⅰ类错误是:
被告无罪但判他有罪,即冤枉了好人; 法庭可能犯的第Ⅱ类错误是: 被告有罪但判他无罪,即放过了坏人。
为了减少冤枉好人的概率,应尽可能接受原假设,判被告无 罪,这可能增大了放过坏人的概率。
内曼—皮尔逊原则
在控制犯第Ⅰ类错误的概率 的条件下,
尽可能使犯第Ⅱ类错误的概率 减小。
第六章 假设检验 假 设 检 验
本章内容
一、假设检验概述
关于总体的陈述;利用统 计的方法推断它是否成立 及成立的可能性有多大。
分类
二、总体均值的检验
(单个均值、两个均值之差)
三、总体成数的检验
(单个成数、两个成数之差)
四、总体方差的检验
(单个方差、两个方差之比)
分类
参数检验(parametric tests)
(一) 两个总体方差 1 和 2 都已知 检验统计量 z
xy
12
n1
22
n2
例6.5
当原假设 H 0 为真时, 即 1 2 时, z 服从标准正态分布 N (0,1) 检验规则同 P154
Excel: z-检验:双样本平均差检验
(二) 两总体方差都未知,但相等
要检验的假设分别为 (1) (3)
第三节 总体成数的检验
Z近似服从N(0,1)分布
(1) H 0 : 0 ; H1 : 0 ( 2) H 0 : 0 ; H 1 : 0 (3) H 0 : 0 ; H1 : 0
(1) H 0 : 1 2 ; H1 : 1 2 ( 2) H 0 : 1 2 ; H1 : 1 2 (3) H 0 : 1 2 ; H1 : 1 2
对总体参数(平均数、成数、方差等)所作的假
设进行检验,是本章研究的内容。
非参数检验(分布检验)
对总体分布的假设进行检验
第一节 假设检验概述
一、假设检验的基本思想
二、假设检验的步骤 三、两类错误和检验规则
第二节 总体均值的检验
一、单个正态总体均值的检验 二、两个正态总体均值之差的检验 三、两个非正态总体均值之差的检验
例7.11
两个正态总体方差之比的检验
要检验的假设 检验统计量: 检验规则:
2 2 (1) H 0 : 1 2
2 2 (1) H 0 : 12 2 ; H1 : 12 2 2 2 ( 2) H 0 : 12 2 ; H1 : 12 2 2 2 (3) H 0 : 12 2 ; H1 : 12 2
在假设检验实践中,该原则的含义是: 原假设本来正确但样本落入拒绝域是小概率 事件;一旦否定原假设,接受备择假设,理 由是充分的,犯错误的可能性至多为 !
判断
也是不同的,如下图2。
单个正态总体均值的检验 (方差已知)
2 总体为 N ( ,, 显著性水平为 )
要检验的假设
(1) H 0 : 0 ; H1 : 0 (2) H 0 : 0 ; H1 : 0 (3) H 0 : 0 ; H1 : 0
例6.8
ቤተ መጻሕፍቲ ባይዱ
例6.9
例6.10
第四节 总体方差的检验
一、单个总体方差的检验 二、两个总体方差之比的检验
假设检验的基本思想
假设检验背后的哲学:
企图肯定什么事物很难,而否定却要相 对容易得多。
假设检验遵循的原理: (类似反证法)
小概率事件在一次试验或观察中不会发生。
在某种假设下,在一次试验中小概率事件不会发生,一旦 在实际中发生了,就得出矛盾,我们认为该假设错误,从而 拒绝该假设。
具体分布。
例6.1
注意:原假设和备择假设在假设检验中不对(等)称。
例6.1
假如雪碧瓶的标签上标明的容量为500毫升。
如果你从市场上随机抽取25瓶,发现其平均含量为
499.5毫升(标准差s为2.63ml)。据此可否断定饮料
厂商欺骗了消费者? 检验统计量: t x 0 s n
H0
~
t ( n 1)
2
单侧检验:
查
1 所对应的z值.
如何t 分布表
1、自由度df=? 2、单侧还是双侧 P377 附表三
3、置信水平
两类错误
第一类错误, 拒真错误, 第二类错误, 受伪错误,
两类错误的关系
两类错误的关系
以法庭对被告进行审判为例
审判被告
法庭采用无罪推定的审判准则
原假设:被告无罪,备择假设:被告有罪。
显著性水平 =0.05,则由 t (n 1) 分布表,得 t (24) 0.05 1.711;拒绝 H 0 ,即说明该地区粮 食中六六六残留量超标。
两个正态总体均值之差的检验
样本
x1 , x2 ,, xn1 来自正态总体
2 2
N ( 1 , 1 )
2
要检验的假设
2 样本 y1 , y 2 , , y n2 来自正态总体 N ( 2 , 2 )
显著性水平 =0.05,则由标准正态分布表,得 z0.05 1.65 ; 从而拒绝 H 0 ,即认为该企业职工平均奖金本月比上月有明显提高。
0.05
显著性水平 =0.05,则由 t (n 1) 分布表, 得 t (8) 0.05 1.860;不能拒绝 H 0 ,即没有足够 的证据说明该地区粮食中六六六残留量超标。
显著性水平
拒绝域和接受域的几种情形
拒绝域、接受域和临界值
双侧检验
单侧检验
临界值符号的含义
P(Z z )
假设 C 表示拒绝域, C 表示接受域,T 表示检验统计量 则
PH 0 {T C}
小概率事件
PH0 (T C ) 1
如何查标准正态分布表
设显著性水平为 P375 附表二 1 双侧检验: 查 所对应的z值;
2 n 1 s 检验统计量: 2 ~ 2 (n 1)
0
检验规则:
2 2 (1) H 0 : 0
例6.11
2 H1 : 2 0
2 2 2 2 n 1 或 n 1 时拒绝 H 0 ,否则不能拒绝 H 0 检验规则为:当 1 2
1 2
( 30 )时,构造检验统计量:
Z X Y
12 22 n1 n2
或Z
X Y
2 s12 s2 n1 n2
当 1 2 时,Z 近似服从 N 0,1 。 因此, 两个非正态总体均值之差的检验可采用 Z 检验。检验规则同 P154.
例7.7
计算机输出结果1 计算机输出结果2
H1 : 1 2 0
H1 : 1 2 0
d
两个正态总体均值之差的检验
样本 x1 , x2 ,, xn1 来自 N ( 1 , 12 ) , 样本 y1 , y 2 , , y n2 来自 N ( 2 , 2 2 ) (二) 两个总体方差 1 和 2 都未知, 但 1 2 2
双边检验
显著性水平 =0.05,则由标准正态分布表,得 z 0.025 1.96 。 从而拒绝 H 0 ,即认为直径不符合质量标准。 若取显著性水平 =0.01,则由标准正态分布表,得 z 0.005 2.58 。 不能拒绝 H 0 ,即认为没有充分的理由说明直径不符合质量标准。
单边检验
H1 : 0
检验规则为:当 t t (n 1) 时,拒绝 H 0 ;当 t t (n 1) 时,不能拒绝 H 0
H1 : 0
检验规则为:当 t t (n 1) 时,拒绝 H 0 ;当 t t (n 1) 时,不能拒绝 H 0
单个总体均值的检验
2
2 2 H : (2) 0 0
2 H1 : 2 0
2 2 检验规则为:当 n 1 时拒绝 H 0 ,否则不能拒绝 H 0 2 2 (3) H 0 : 0
2 H1 : 2 0
0 0
2 2 检验规则为:当 1 n 1拒绝 H ,否则不能拒绝 H
2 2 2 2
(n1 1) s1 (n2 1) s2 xy 检验统计量 t , 这里 s p n1 n2 2 1 1 sp n1 n2
2
2
当原假设 H 0 为真, 即 1 2 时, t 服从自由度为 n1 n2 2 的 t 分布 检验规则类似 P155-156, 只是把其中的 t ( n 1) 和 t (n 1)
2
(2) H 0 : 0 (3) H 0 : 0
H1 : 0
检验规则为:当 z z 时,拒绝 H 0 ;当 z z 时,不能拒绝 H 0
H1 : 0
检验规则为:当 z z 时,拒绝 H 0 ;当 z z 时,不能拒绝 H 0
问:是否能断定饮料厂商欺骗了消费者?
原假设
数据集3
如果公司所在市平均受教育年限为13
问:是否有所不同?
如果公司所在市平均薪水为:35000 问:是否有所不同 是否低于
是否高于?
设计检验统计量
所设计的检验统计量与原假设有关,与 待检验的参数的估计量相关,但不包含 待检验参数。
必须知道当原假设H0为真时该统计量的