假设检验的基本原理.ppt
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019年8月23
感谢你的观看
13
第二节 显著水平检验法与正态总体检验
一.假设检验的两类错误
所作判断 真实情况
H0 为真
H0 为假
接受 H0
正确 第二类错误
(取伪)
拒绝 H0
第一类错误 (弃真) 正确
注意:不可能消除这两种错误,而只能控制发生
这两类错误之一的概率.
2019年8月23
感谢你的观看
14
第十二章 假设检验
假设检验的基本原理
显著水平检验法与正态总体检验
2019年8月23
感谢你的观看
1
第十二章 假设检验
前面我们讨论了在总体分布已知的情况下,如何根 据样本去得到参数的优良估计.但有时,我们并不需要 估计某个参数的具体值而只需验证它是否满足某个条 件,这就是统计假设检验问题.
假设检验是对总体的分布函数的形式或分布中某 些参数做出某种假设,然后通过抽取样本,构造适当的 统计量,对假设的正确性进行判断的过程.
H0 : 0, H1 : 0
由于样本均值X为的无偏估计, 如果原假设
H0 : 0为真,则样本均值X应在0附近随机地 波动而不偏离0太远, 所以临界域应有形式
R {| X 0 | K}
2019年8月23
感谢你的观看
24
第二节 显著水平检验法与正态总体检验
实际不会发生.事实上,当H0成立时,事件
Z 1.96
1
z2
e2
2
发生的机会只有5﹪(如图)
2.5﹪
-2.7509 1.96
0
1.96
这是一个小概率事件.今从试验数据得到Z=-2.7509,由于 2.7509 1.96 表明这一小概率事件在该次试验中发生,这与实际 推断原理矛盾.因此否定原假设.至此本例已获得解答,即基于 数据该批药品的酒精含量不符合规定.
再根据样本观察值(x1, x2,..., xn )算出
现.
把它们原合假写设在H0一表起明就含是量:符H0合:μ规=定5 ,这H个1:5μ﹪≠也5称之为 期望数,尽管10个数据都与5﹪有出入,这只是抽
样的随机性所致;备择假设H1表明总体均值μ已经偏 离了期望数5﹪,数据与期望数5﹪的差异是其表现.
假设检验
必须在原假设与备择
的任务 假设之间作一选择
2019年8月23
第一节 检验的基本原理
对上述例子,还可做更细致考察,设想如基于一次观察 数据算出μ的估计值 ˆ 5001(h),我们能否就此接受“这批 元件合格”的这一假设呢?尽管ˆ 5000(h), 但这个估计仅仅 是一次试验的结果,能否保证下一次测试结果也能得到μ的
估计值大于5000呢?也就是说从观察数据得到的结果 ˆ 5001
当H 0为真时,
t X 0 ~ t(n 1)
S/ n
其中S 2
1 n 1
n i 1
(Xi
X
)2,于是在给定显著性水平
下, 可查出相应的临界值t /2 (n 1),使
P{| t | t /2 (n 1)}
这样就得到了临界域R {| t | t /2 (n 1)}.
/ n感谢你的观看 0
19
第二节 显著水平检验法与正态总体检验
找临界值uα/2示意图
/2
2019年8月23
u/2
0
感谢你的观看
/2
u/2
20
第二节 显著水平检验法与正态总体检验
若u R,即| u | u /2,则拒绝原假设H0 : 0.
认为总体的均值此时与原假设有明显差异; 否则接受H0, 认为此时的总体均值与原假设无差
异.此时犯第一类错误的概率恰好等于.
2019年8月23
感谢你的观看
21
例3 某降价盒装饼干,其包装上的广告上称每盒质量为269g.
但有顾客投诉,该饼干质量不足269g。为此质检部门从准备出
厂的一批盒装饼干中,随机抽取30盒,由测得的30个质量数据
算出样本平均为268.假设盒装饼干质量服从正态分布N(μ,22),
(x1,x2,...,xn)∈R时,按检验法则将拒绝原假设
H0,这种错误称为第一类错误.
2019年8月23
感谢你的观看
12
第二节 显著水平检验法与正态总体检验
一.假设检验的两类错误
另一类错误是,当原假设H0不真,即H1为真时,A也
有可能不发生,即样本观察值(x1,x2,...,xn)∈R*,
按检验法则将接受原假设H0,这种错误称为第二类 错误.
偏小等价于Z偏小,从而得到拒绝域的形式如下
2019年8月23
R
30
X
2
269
k
其中k待定,称之为临界值.
感谢你的观看
22
α=0.05,为求显著水平0.05的检验,只需选取k使得
PZ k | H0 0.05
查表可得 k 0.95 1.645
因而得到水平0.05检验的拒绝域
2019年8月23
感谢你的观看
2
第十二章 假设检验Fra Baidu bibliotek
假设检验
参数假设检验
非参数假设检验
总体分布已知, 检验关于未知参数 的某个假设
2019年8月23
感谢你的观看
总体分布未知时的 假设检验问题
3
第一节 检验的基本原理
一、检验问题的提法
假设检验是既同估计密切联系,但又有重要区 别的一种推断方法。 例如:某种电子元件寿命X服从参数为λ的指数分布, 随机抽取其中的n件。测得其寿命数据,
(3) 给定显著性水平α,求出使P{T∈R|H0}≤α的临界 域C;
(4) 若样本观察值T(x1,x2,...,xn)∈R,则拒绝原假设
H0,否则接受H0.
2019年8月23
感谢你的观看
17
第二节 显著水平检验法与正态总体检验
1 两个正态总体的假设检验
1).方差已知时总体均值的假设检验
设( X1, X 2,..., X n )是取自正态总体N (, 2 )的样本, 2 02为已知常数, 要检验假设
由于
U X 0 ~ N(0,1) 0 / n
于是在给定显著性水平下, 可查出相应的临界值
u / 2 , 使
P{|U | u /2}
这样就得到了临界域R {|U | u /2}
再根据样本观察值(x1, x2,...,xn )算出
u x 0
2019年8月23
问题⑴,这批元件的平均寿命是多少?
问题⑵,按规定该型号元件当寿命不小于5000(h) 为合格,问该批元件是否合格?
问题⑴是对总体未知参数μ=E(X)=1/λ作出估计。 回答“μ是多少?”,是定量的。问题⑵则是对假设
“这批元件合格”做出接受还是拒绝的回答,因而是
定性的。
2019年8月23
感谢你的观看
4
5.01, 4.87, 5.11, 5.21, 5.03, 4.96, 4.78, 4.98, 4.88, 5.06
如果酒精含量服从正态分布N(μ,0.00016),问该批药 品的酒精含量是否合乎规定?
任务: 通过样本推断X的均值μ是否等于5.
假设:上面的任务就是要通过样本去检验“X的均值=5”
这样一个假设是否成立.(在数理统计中把“X的均值
感谢你的观看
5
第一节 检验的基本原理
二.原假设和备择假设
下面通过一个例子介绍 原假设和备择假设
2019年8月23
感谢你的观看
6
例1(酒精含量) 一种无需医生处方即可达到的治 疗咳嗽和鼻塞的药。按固定其酒精含量为5﹪.今从 一出厂的一批药中随机抽取10瓶,测试其酒精含量 得到的10个含量的百分数:
R
30
X
2
269
1.645
代入数据得Z=-2.74,显然小于临界值-1.645,因而依据检验
规则应该拒绝H0,即该盒装广告不真实.
2019年8月23
感谢你的观看
23
第二节 显著水平检验法与正态总体检验
2). 方差未知时总体均值的双侧假设检验
设( X1, X 2 ,..., X n )是取自正态总体N (, 2 )的样本, 2为未知常数, 要检验假设
注意: 在否定论中最终能否得出矛盾的结果,取决于数据.
2019年8月23
感谢你的观看
11
第二节 显著水平检验法与正态总体检验
一.假设检验的两类错误
根据检验法则,若A发生则拒绝H0,否则接受H0. 这不免要犯二类错误.
一类错误是,当H0为真时,因为尽管事件{A|H0} 是小概率事件,但仍有可能发生,即样本观察值
观察数据,可算得的 X 观察值为4.989,代入统计量Z
的表达式,得Z的观察值为
Z 10 0.011 0.0348 2.7509 0.00016 0.01265
2019年8月23
感谢你的观看
10
在H0下,Z服从标准正态分布,对于特定的一次试验,
统计量Z取得观察值-2.7509,是十分罕见的,以至于
以显著水平α=0.05检验该产品广告是否真实.
解: 依题意,可设原假设H0:μ=269 备择假设 H1:μ<269
X 作为未知参数μ的点估计,因此 X 269偏小应该拒绝
H0.若H0成立,
X
~
N
269,
22 30
则有 Z 30 X 269 2
则在H0下Z~N(0,1),即Z的分布已知,因而Z可以做检验统计量,
μ=5”这样一个待检验的假设记作“H0:μ=5”称为 “原假设”或 “零假设”.表明数据的“差异”是偶
然的,总体没有 “变异”发生.
2019年8月23
感谢你的观看
7
原假设的对立面是“X的均值μ≠5”记作
“H1:μ≠5”称为“对立假设”或“备择假设”.表明 数据的“差异”不是偶然的,是总体 “变异”的表
第二节 显著水平检验法与正态总体检验
我们当然希望这两类错误的概率都很小,但在样本容 量n固定时是无法做到的.基于这种情况,且因为人们常常 把拒绝H0比错误地接受H0看得更重些.因此人们希望在控 制犯第一类错误的概率α的条件下,尽量使犯第二类错误 的概率小,但这也是不容易的,有时甚至是不可能的.于是 人们不得不降低要求,只对犯第一类错误的概率α加以限 制,而不考虑犯第二错误的概率,在这种原则下,寻找临界 域C时只涉及原假设H0,而不涉及备择假设H1,这种统计假 设问题称为显著性检验问题.
P({样本落入R}|H0)≤α
此时称R所代表的检验为显著水平α的检验
2019年8月23
感谢你的观看
16
第二节 显著水平检验法与正态总体检验
假设检验的方法步骤
(1) 根据问题的要求建立原假设H0和备择假设H1;
(2) 选取检验统计量T(X1,X2,...,Xn),要求T不含任何 参数,以便计算H0为真时的条件概率;
H0 : 0, H1 : 0
由于样本均值X为的无偏估计, 如果原假设
H0 : 0为真,则样本均值X应在0附近随机地 波动而不偏离0太远, 所以临界域应有形式
2019年8月23
R {| X 感谢你的观看0 | K}
18
第二节 显著水平检验法与正态总体检验
10
因而通过标准化 X 可得到检验统计量
Z
观
察 值
期
望数
10X 5
0.00016
2019年8月23
n
感谢你的观看
9
四.否定论证及实际推断原理
否定论证是假设检验的重要推理方法,其要旨是: 先假定原假设H0成立,如果从试验观察数据及此假定 将导致一个矛盾的结果,则必须否定这个原假设;反之, 如果不出矛盾的结果,就不能否定原假设. 从试验数据判断是否导致一个矛盾的结果,一个重 要的依据是小概率事件的实际推断原理. 看例1,由
感谢你的观看
8
三.检验统计量
检验统计量是构造一个适当的能度量观察数与原假
设下的期望数之间的差异程度的统计量,此统计量为
检验统计量.
特点:在原假设H0下分布是完全一致或者说可以计算.
本例的观察数通过样本平均 X 表示,它是μ的一 个无偏估计,而在H0下的期望数为μ=5,在H0下
X 5 ~ N 0, 0.00016
与参考值5000的差异仅仅是偶然的呢?还是总体均值μ确实 有大于5000的“趋势”?
这些问题是以前没有研究过的。一般而言,估计问题是 回答总体分布的未知参数是多少?或范围有多大?而假设检 验问题则是回答观察到的数据差异只是机会差异,还是反映 了总体的真实差异?因此两者对问题的提法有本质不同。
2019年8月23
对给定的犯第一类错误的概率α称为显著性水平.
2019年8月23
感谢你的观看
15
第二节 显著水平检验法与正态总体检验
二.显著水平检验法
显著水平检验法: 在数据收集之前就已经设定好 一个检验规则,即文献上称之为拒绝域R,使得当样本 观察值落入R就拒绝H0.
对拒绝域R的要求是:在H0 下{样本落入R}为一小概率 事件,即对预先给定的0<α<1有