《概率论与数理统计》第八章1假设检验的基本概念

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单侧检验 H0 : 0 1000, H1 : 1000
2. 从某批矿砂中,抽取10样本,检验这批砂矿的含 铁量是否为3%?
双侧检验 H0 : 0 3%, H1 : 3%
3.某学校学生英语平均分65分, 先抽取某个班的平均 分,看该成绩是否显著高于全校整体水平?
单侧检验 H0 : 0 65, H1 : 65
0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常?
分析 以 和 分别表示这一天袋装糖的净重
总体X 的均值和标准差,
由长期实践表明标准差比较稳定, 我们就设
0.015,于是 X ~ N(, 0.0152 ),这里 未知. 问题 问题是根据样本值判断 0.5 还是 0.5 .

以,原假
设H
不正确
0

对于这两种解释,哪种解释比较合理呢?
我们需要判断以上两种假设谁对谁错,并给出判断的理由
以上例子属于参数检验(parametric test) 的问题,(如针对总体均值,总体方差等参数的假 设检验)。
另外还有非参数检验(Nonparametric test) 的问题,如关于总体服从某种分布(如正态分布, 泊松分布)的假设检验。
4. 拒绝域与临界点
拒绝域W1: 拒绝原假设 H0 的所有样本值 (x1, x2, ···, xn)所组成的集合.
W1 W1 :拒绝原假设H0的检验统计量的取值范围.
临界点(值):拒绝域的边界点(值) (相应于检验统计量的值).
如: 在前面例4中,拒绝域 {u :| u | u / 2 }.
5. 双边备择假设与双边假设检验
之 下 做 出 的.
2. 检验统计量
用于检验假设的统计量,称为检验统计量.
如:对于例4,
统计量U X μ0 σ/ n
3. 原假设与备择假设
______ 检验统计量
假设检验问题通常叙述为: “ 在 显 著 性 水 平 下 ,
检 验 假 设 H 0 : 0 , H 1 : 0;”
或 叙 述 为 “ 在 显 著 性 水平 下 , 针 对 H 1检 验 H 0 ”. H0称为原假设或零假设, H1称为对立假设或备择假设.
例4 某食品厂生产猪肉罐头,按规定每瓶的标准 重量为500 g,由以往经验知,该厂生产的猪肉罐 头质量服从正态分布N(500, 4),随机抽取5瓶,其 重量分别为(单位:g):
501,507,498,502,504, 能否认为该厂猪肉罐头的标准重量为500 g?
分析 设该厂生产的猪肉罐头平均重量 μ = 500 g 则问题变为检验假设H0: μ = 500是否成立?
| x 0 |
n
u
2
接受域为
| x 0 |
n
u
2
也就是说,当
0
x
n
u
2
时,接受
H0 :
0
即 在区间 x
n
u
2
内,此区间正是 的置信度
由于要检验的假设涉及总体均值,可借助样
本均值X进行判断.
由样本算得 x 0.511, 样本均值和总体均值之间
存在着差异,面对这种差异,有两种不同的解释:
(1)由于抽样具有随机性,x与0之间出现的差异是
由于抽样的随机性导致的,所以,原假设H0正确。
(2)x与0之间出现的差异不是由于抽样的随机性
导致的,而是它们之间存在着实质性的差异, 或者说,他们之间存在着显著性差异,
由以往经验可知, 标准差 σ = 2 , 则X ~ N ( μ,22 ),其中μ未知.
问题: 根据样本值判断 μ = 500 还是 μ ≠ 500?
解 1° 提出两个对立假设
H0 : μ μ0 500 , H1 : μ μ0 ; 2 X是μ的无偏估计量,
若H0为真,则 | x 0 | 不应太大,
X
0
/n
u

由于当原假设成立时,
X
/
0
n
z
是小概率事件,
• 因此,选择 Z X 0 做检验统计量, / n
• 得到H0的拒绝域为:
z
x
0
/n
u
• 由于拒绝域在数轴的右端, 故称此检验为右边 检验.
右侧检验
(显著性水平与拒绝域 )
抽样分布
置信水平
1 - 接受域
拒绝域
H0值 观察到的样本统计量
为此,我们提出两个相互对立的假设
H0 : 0 0.5

H1 : 0 .
然后,我们给出一个合理的法则,根据这一法
则,利用已知样本作出决策是接受假设H 0 (即拒绝 假设H1 ), 还是拒绝假设H0 (即接受假设H1 ). 如果 作出的决策是接受H0 , 则认为 0,即认为机器 工作是正常的, 否则, 认为是不正常的.
有两类: (1) 当原假设H0为真, 观察值却落入拒绝域, 而 作出了拒绝H0的判断, 称为第Ⅰ类错误, 又叫弃真 错误, 这类错误是“以真为假”. 犯第Ⅰ类错误的概
率就是显著性水平 . = P { 拒绝原假设H0 | H0为真 }
(2) 当原假设H0不真, 而观察值却落入接受域, 从而作出了接受H0的判断, 称为第Ⅱ类错误, 又 叫取伪错误, 这类错误是“以假为真”.
第八章 假设检验
第一节 假设检验问题 第二节 正态总体均值的假设检验 第三节 正态总体方差的假设检验
第一节 假设检验的基本概念
一、假设检验的基本原理 二、假设检验的基本概念 三、两类错误 四、假设检验的一般步骤
1. 基本原理
小概率推断原理:0 α 0.05
小概率事件
(概率接近0的事件),在一次试验中,实际上可认为
N 0,1
得临界点u0.05 1.645 拒绝域 1.645,
由x 10.4
U0的观测值u0
10.4 1.6
10 36
1.5
u0 u 不拒绝H0, 即认为μ ≤10.
练习题: 某林场培育某种松树 ,树高X~N(μ,1.62),
从中随机测了36棵树高,算得直径 x=10.5cm
问 在 0 .0 5 下,该树种的平均树高是否低于10cm?
临界值
样本统计量
• (2) 左边检验:H0: 0 H1: < 0
• 由于X~N(, 2) ,所以
U X ~ N (0,1) / n
• 对于给定的小概率 , 由图知
P
X
/
n
u
,
• 当原假设成立时,由于
X X 0 , / n / n
• 所以
P
X
0
/n
u
,
• 小概率事件.
如:对于例4,
当H0
:
μ
500为真时,U
X σ
/
μ0 n
~
N 0,1,
P{| U | u / 2 | H0为真} ,
如果
|
u
|
|x
/
0
n
|
u
/2 ,则称x与0差异是显著的
,则
我们拒绝H 0 ;
反之,如果
|
u
|
|x
/
0
n
|
u
/2
,则称
x与0差异是不
显著的,则我们接受H 0 ;
上述 x与0有无显著差异的判断是在显著性水平
• 下面分别推出这两种检验的拒绝域:
• (1) 右边检验: H0: 0 H1: > 0 • 由于X~N(, 2) ,所以 Z X ~ N (0,1)
/ n
• 对于给定的小概率 , 由图易知
P
X
/
n
k
P
X
/
n
u
• 当原假设成立时,由于
X X 0 / n / n

• 所以
P
拒绝H0;

|
x
/
0
n
|
u
/
2时,
接受H0
.
如:若取定 = 0.05, 则u / 2 u0.025 1.96.
3°在假设 H0成立的条件下,由样本计算
| u | | x 0 | 做出推断. / n
二、假设检验的基本概念
1. 显著性水平
= P{拒绝H0 |H0正确} ,数 称为显著性水平.
H0值
样本统计量
观察到的样本统计量
练习题: 某林场培育某种松树 ,树高X~N(μ,1.62),
从中随机测了36棵树高,算得直径 x =10.4cm
问 在 0 .0 5 下,该树种的平均树高是否低于10cm?
1 H0 : 10, H1 : 10
H0为真时,
U0
X 10 1.6 36
衡量
|
x
0
| 的大小可归结为衡量|
x
/
0
n
|的大小,
当H0为真时,
U
X
/
0
n
~
N (0,1)
y
P{| U | u / 2 }
2
当 0很小时,
uα / 2
y pU ( x)
2
O uα / 2 x
{| U | u /2}
根据小概率原理,可以认为如果H0为真,则由一次
试验得到满足不等式|
假设检验中的两类错误
(决策结果)
H0 检验
决策 接受H0
实际情况
H0为真 正确
H0为假
第二类错 误(
拒绝H0
第一类错 误(
正确
四Байду номын сангаас假设检验的一般步骤
1. 根据实际问题的要求,提出待检验的假设H0 及备择假设;
2. 选择适当的统计量,在 H0成立的条件下,确定 它的概率分布;
3. 给定检验水平 ,确定拒绝域W1;
1 H0 : 10, H1 : 10
H0为真时,
U0
X 10 1.6 36
N 0,1
由x 10.5
U0的观测值u0
10.5 1.6
10 36
1.875
u0 u 接受H0, 即认为μ > 10.
三、两类错误
假设检验的依据是:小概率事件在一次试验中
很难发生. 但“很难发生”不等于“不发生”, 因而假 设检验所作出的结论有可能是错误的. 这种错误
犯第Ⅱ类错误的概率记为
= P {接受H0 | H0不正确 }
注 1°当样本容量 n 一定时, 若减少犯第一类
错误的概率, 则犯第Ⅱ类错误的概率往往增大. 2°若要使犯两类错误的概率都减小, 除非
增加样本容量.
错误和 错误的关系
和的关系就像 翘翘板,小就 大, 大就小
你不能同时减 少两类错误!
u
|
|x
/
0
n
|
u
/
2
的观察值
x, 几乎不会发生。
若在一次试验得到了满足不等式|
u
|
|
x
/
0
n
|
u
/
2
的观察值 x, 则我们有理由怀疑原来的假设H0
的正确性,因而拒绝H0.
若出现观察值满足不等式
|
u
|
|
x
/
0
n
|
u
/
2
则没有理由拒绝假设H0 ,因而只能接受H0 .

|x
/
0
n
|
u
/
2时,
在 H0 : 0 和 H1 : 0 中, 备择假设 H1 表示 可能大于 0 , 也可能小于0 , 称为双边备择
假设,
形如 H0 : 0 , H1 : 0 的假设检验称
为双边假设检验.
双边检验
(显著性水平与拒绝域 )
抽样分布
拒绝域 /2
1 - 接受域
置信水平 拒绝域 /2
临界值
临界点为 U u /2 ,
4. 根据样本观察值计算统计量的值;
5. 根据统计量值是否落入拒绝域W1内,作出拒 绝或接受H0的判断.
如设总体 X ~ N ( , 2 ) 已知,给定容量n的样本
样本均值为 x,则参数 的置信度为1 的置信区间为
x
n
u
2
假设检验问题 H 0 : 0 , H 1 : 0 的拒绝域为
X
0
/n
u

由于当原假设成立时,
X
/
0
n
z
是小概率事件, • 因此,仍然可以选择
统计量
Z X 0 做检验 / n
• 得到H0的拒绝域为
u
x
/
0
n
u
由于拒绝域在数轴的左端, 故称此检验为
左边检验.
左侧检验 (显著性水平与拒绝域 )
抽样分布
置信水平
拒绝域
1 - 接受域
临界值
不会发生(这是人们长期积累起的普遍经验!).
2. 基本思想方法 采用概率性质的反证法: 先提出假设H0 , 再根 据一次抽样所得到的样本值进行计算. 若导致小 概率事件发生,则否认假设H0 ;否则,接受假设H0 . 下面结合实例来说明假设检验的基本思想.
例1 某车间用一台包装机包装葡萄糖, 袋装糖的 净重是一个随机变量, 它服从正态分布. 当机器正 常时, 其均值为0.5kg, 标准差为0.015kg. 某日开工 后为检验包装机是否正常, 随机地抽取它所包装 的糖9袋, 称得净重为(kg):
H0值
样本统计量 临界值
U u /2.
6. 右侧检验与左侧检验
形如 H0 : 0 , H1 : 0 的假设检验
称为右侧检验.
形如 H0 : 0 , H1 : 0 的假设检验
称为左侧检验. 右侧检验与左侧检验统称为单侧检验.
正态总体 N(, 2) , 当 2为已知时, 关 于 0的 检 验 问 题 :
(1) 假设检验 H0 : 0 , H1 : 0 ; (2) 假设检验 H0 : 0 , H1 : 0 ;
假设检验 H0 : 0 , H1 : 0 ; (3) 假设检验 H0 : 0 , H1 : 0 .
假设检验 H0 : 0 , H1 : 0 .
双侧检验与单侧检验的例子 1. 某批元件要求寿命不低于1000h, 现抽取一批元 件, 检验这批元件是否合格?
相关文档
最新文档