假设检验基本原理
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
几乎不可能发生的;
• 但如果这种情况确实发生了,就有理由怀疑原来的假设, 即产品中只有1%次品的假设是否成立,这时就可以推 翻原来的假设,可以做出厂商的宣称是假的这样一个推 断。
12
• 进行推断的依据就是小概率原理。当然,推断也可能会 犯错误,即这100件产品中确实只有1件是次品,而恰好 在一次抽取中被抽到了。
拒绝域 位置 P-值检验的显 著性水平判断 标准 原假设 备择假设
双侧 左单侧 右单侧
α/2
α
H0 :θ=θ0 H0 :θ≥θ0 H0 :θ≤θ0
H1 :θ≠θ0 H1 :θ<θ0 H1 :θ>θ0
α
15
• 在统计的假设检验中,一般是把“不能轻易否定 的命题”作为原假设,把“需要验证的问题”作 为备择假设。什么是“不能轻易否定的命题”? 一般来说,原有的理论、原有的看法、原有的状 况、或者说是那些保守的、历史的、经验的,在 没有充分论据证明其错误前总是被假定为正确的, 作为原假设,处于被保护的位置,而那些猜测的、 可能的、预期的取为备择假设。假设检验的目的 就是要用事实验证原来的理论、看法、状况等是 否成立,或更明确地说,是希望用事实推翻原假 设。
就可以作出接受原假设或拒绝原假设的统计决
策。
10
三、假设检验中的小概率原理
• 假设检验的基本思路是应用小概率
原理。
• 所谓小概率原理,是指发生概率很
小的随机事件在一次实验中是几乎
不可能发生的。根据这一原理,可
以作出是否接受原假设的决定。
• 见下例。
11
• 例如,有一个厂商称其产品的合格率很高,可以得到99 %,那么从一批产品中(如100件)随机抽取1件,这一 件恰好是次品的概率就非常小,只有1%。 • 如果厂商的宣称是真的,随机抽取1件是次品的情况就
• 所以上例中犯这种错误的概率是1%,即我们在冒1%的
风险作出厂商宣称是假的这样一个推断。这里的1%即 显著性水平。
13
四、双侧检验和单侧检验
α/2 α/2
1–α
–Zα/2
(a)双侧检验
Zα/2
α
α
–Zα
0
0
Zα
(b)左侧检验
(c)右侧检验
图6-1 双侧、单侧检验的拒绝域分配
14
表6-1 拒绝域的单、双侧与备择假设之间的对应关系
5
• 例如,1989年出生的婴儿体重平均为3190克,可以 提出一个命题(假设):
• “1990年出生的婴儿与1989年出生的婴儿在体重上 没有什么差异”,于是可以这样表示:
H 0 : 3190
H1 : 3190
• 原假设与备择假设互斥,肯定原假设,意味着拒绝 备择假设;否定原假设,意味着接受备择假设。
假设检验的基本原理
一、假设检验的概念
• 所谓假设检验,就是事先对 总体的参数或总体分布形式 做出一个假设,然后利用抽 取的样本信息来判断这个假 设(原假设)是否合理,即 判断总体的真实情况与原假 设是否存在显著的系统性差 异,所以假设检验又被称为 显著性检验。
2
3
二、假设检验的步骤
一个完整的假设检验过程,包括以下几个步骤: (1)提出假设; (2)构造适当的检验统计量,并根据样本计算统计 量的具体数值; (3)规定显著性水平,建立检验规则; (4)做出判断。
16
17
六、假设检验中的P值与临界值
(一)P-值规则 • 所谓P-值,实际上是检验统计量超过(大于或小 于)具体样本观测值的概率。 • 如果P-值小于所给定的显著性水平,则认为原 假设不太可能成立;如果P-值大于所给定的标 准,则认为没有充分的证据否定原假设。
18
(二)临界值规则
• 根据所提出的显著性水平标准(它是概率密度曲线 的尾部面积)查表得到相应的检验统计量的数值, 称作临界值。 • 用检验统计量的观测值与临界值作比较,观测值落 在临界值所划定的尾部(称之为拒绝域)内,便拒 绝原假设;
6
(二)确定适当的检验统计量,并计算统计量的具
体数值
• 检验统计量是根据所抽取样本计算的用于检验原
假设是否成立的随机变量。 • 检验统计量中应当含有所要检验的总体参数。 • 检验统计量还应该在“H0成立”的前提下有已知 的分布,从而便于计算出现某种特定的观测结果 的概率。
7
8
(三)规定显著性水平
4
(一)提出原假设和备择假设
• 原假设一般用H0表示,通常是设定总体参数等于某值, 或服从某个分布函数等; • 备择假设是与原假设互相排斥的假设,原假设与备择假 设不可能同时成立。
• 所谓假设检验问题实质上就是要判断H0是否正确,若拒
绝原假设H0,则意味着接受备择假设H1 。 • 在假设检验中,“=”总是放在原假设上。 • 见下例。
• 显著性水平是指当原假设为正确时人们却把它拒绝
了的概率或风险。
பைடு நூலகம்
• 这个概率是人为确定的,通常取α=0.05或0.01。
• 这表明,当作出接受原假设的决定时,其正确的可
能性(概率)为95%或99%。
9
(四)作出判断
• 根据显著性水平和统计量的分布,可以找出接
受域和拒绝域的临界点
• 用计算出的检验统计量的值与临界点值相比较,
• 观测值落在临界值划定的尾部之外(称之为不能拒 绝域)的范围内,则认为拒绝原假设的证据不足。
19
α/2
1–α
α/2
–Zα/2
(a)双侧检验
Zα/2
α
α
–Zα
0
0
Zα
(b)左侧检验
(c)右侧检验
图6-1 双侧、单侧检验的拒绝域分配
20
• 显然,P-值规则和临界值规则是等价的。在做检验
的时候,只用其中一个规则即可。
• P-值规则较之临界值规则具有更明显的优点。这主
要是:第一,它更加简捷;第二,在值规则的检验
结论中,对于犯第一类错误的概率的表述更加精确。 • 推荐使用P-值规则。
21