假设检验基础知识讲义PPT课件( 72页)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2. 做出拒绝或不拒绝原假设的依据是什么? 3. 传统上,做出决策所依据的是样本统计
量,现代检验中人们直接使用由统计量 算出的犯第Ⅰ类错误的概率,即所tatistic)
1. 根据样本观测结果计算出对原假设和备择假 设做出决策某个样本统计量
2. 对样本估计量的标准化结果
H0 : 10cm H1 : 10cm
2011年
提出假设
(例题分析)
【例6.2】某品牌洗涤剂在它的产品说明书中声称: 平均净含量不少于500克。从消费者的利益出发, 有关研究人员要通过抽检其中的一批产品来验 证该产品制造商的说明是否属实。试陈述用于 检验的原假设与备择假设
解:研究者抽检的意图是倾向于证 绿叶
2. 先确定备择假设,再确定原假设 3. 等号“=”总是放在原假设上 4. 因研究目的不同,对同一问题可能提出不同
的假设(也可能得出不同的结论)
2011年
双侧检验与单侧检验
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test)
2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
可能犯错误
2. 原假设和备择假设不能同时成立,决策的结果要么拒绝 H0,要么不拒绝H0。决策时总是希望当原假设正确时没 有拒绝它,当原假设不正确时拒绝它,但实际上很难保 证不犯错误
3. 第Ⅰ类错误(错误)
原假设为正确时拒绝原假设

第Ⅰ类错误的概率记为,被称为显著性水平
2. 第Ⅱ类错误(错误)
3. 值越小,你拒绝原假设的理由就越充分
2011年
多大的P 值合适?
要证明原假设不正确,P值要多小,才能令人信 服呢?
原假设的可信度又多高?如果H0所代表的假设 是人们多年来一直相信的,就需要很强的证据( 小的P值)才能说服他们
拒绝的结论是什么?如果拒绝H0而肯定H1 ,你 就需要有很强的证据显示要支持H1。比如,H1 代表要花很多钱把产品包装改换成另一种包装 ,你就要有很强的证据显示新包装一定会增加 销售量(因为拒绝H0要花很高的成本)
解:研究者想收集证据予以支持的假 设是“该城市中家庭拥有汽车的比例 超过30%”。建立的原假设和备择假设 为
H0 : 30% H1 : 30%
2011年
提出假设
(结论与建议)
1. 原假设和备择假设是一个完备事件组,而且 相互对立
在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
2. 一般来说,发生哪一类错误的后果更为严重,就应该 首要控制哪类错误发生的概率。但由于犯第Ι类错误 的概率是可以由研究者控制的,因此在假设检验中, 人们往往先控制第Ι类错误的发生概率
2011年
显著性水平
(significant level)
1. 事先确定的用于拒绝原假设H0时所必须的证据 2. 能够容忍的犯第Ⅰ类错误的最大概率(上限值) 2. 原假设为真时,拒绝原假设的概率
4. 总是有符号 , 或
H0 : = 某一数值 H0 : 某一数值 H0 : 某一数值
例如, H0 : 10cm
null
2011年
备择假设
(alternative hypothesis)
1. 也称“研究假设”,研究者想收集证据予以支持的 假设,用H1或Ha表示
2011年
P 值决策与统计量的比较
1. 用P值进行检验比根据统计量检验提供更多的信息 2. 统计量检验是我们事先给出的一个显著性水平,以
此为标准进行决策,无法知道实际的显著性水平究 竟是多少
比如,根据统计量进行检验时,只要统计量的值落在拒 绝域,我们拒绝原假设得出的结论都是一样的,即结果 显著。但实际上,统计量落在拒绝域不同的地方,实际 的显著性是不同的。比如,统计量落在临界值附近与落 在远离临界值的地方,实际的显著性就有较大差异。而 P值给出的是实际算出的显著水平,它告诉我们实际的 显著性水平是多少
2. 所表达的含义是总体参数发生了变化或变量之间 有某种关系
3. 备择假设通常用于表达研究者自己倾向于支持的 看法,然后就是想办法收集证据拒绝原假设,以 支持备择假设
4. 总是有符号 , 或
H1 : 某一数值 H1 : 某一数值 H1 : <某一数值
2011年
提出假设
H0
临界值
2011年
统计量决策规则
1. 给定显著性水平,查表得出相应的临界
值z或z/2,t或t/2
2. 将检验统计量的值与 水平的临界值进行
比较 3. 作出决策
双侧检验:I统计量I > 临界值,拒绝H0 左侧检验:统计量 < -临界值,拒绝H0 右侧检验:统计量 > 临界值,拒绝H0
小概率是在一次试验中,一个几乎不可能发生的 事件发生的概率
在一次试验中小概率事件一旦发生,我们就有理 由拒绝原假设
2011年
原假设
(null hypothesis)
1. 又称“0假设”,研究者想收集证据予以反对的假 设,用H0表示
2. 所表达的含义总是指参数没有变化或变量之间没 有关系
3. 最初被假设是成立的,之后根据样本数据确定是否 有足够的证据拒绝它
(例题分析)
【例6.1】一种零件的生产标准是直径应为10cm,为 对生产过程进行控制,质量监测人员定期对一台加 工机床检查,确定这台机床生产的零件是否符合标 准要求。如果零件的平均直径大于或小于10cm, 则表明生产过程不正常,必须进行调整。试陈述用 来检验生产过程是否正常的原假设和被择假设
解:研究者想收集证据予以证明的假设应该是 “生产过程不正常”。建立的原假设和备择假 设为
统计学基础 数据分析 Fundamental Statistics
(方法与案例)
作者 贾俊平
第 5 章 假设检验
5.1 假设检验的基本原理 5.2 总体均值的检验 5.3 总体比例的检验
hypothesis test
学习目标
假设检验的基本思想和原理 总体均值的检验 总体比例的检验 P值的计算与应用
原假设为错误时未拒绝原假设
第Ⅱ类错误的概率记为 (Beta)
2011年
错误和 错误的关系
和 的关系就像 翘翘板,小 就 大, 大 就小

你要同时减少两类 错误的惟一办法 是增加样本量

2011年
两类错误的控制
1. 一般来说,对于一个给定的样本,如果犯第Ι类错误 的代价比犯第Ⅱ类错误的代价相对较高,则将犯第Ⅰ 类错误的概率定得低些较为合理;反之,如果犯第Ι 类错误的代价比犯第Ⅱ类错误的代价相对较低,则将 犯第Ⅰ类错误的概率定得高些
2011年
P 值决策与统计量的比较
拒绝H0

拒绝H0 P1 值 拒绝H0
P2 值
Z
0
临界值 统计量1 统计量2
拒绝H0的两个统计量的不同显著性
2011年
假设检验结论的表述
(“显著”与“不显著”)
Z
2011年
右侧检验的P 值

拒绝H0
1/2 P 值
0
临界值
Z
计算出的样本统计量
2011年
P值是关于数据的概率
1. P值原假设的对或错的概率无关 2. 它反映的是在某个总体的许多样本中某一类数据出
现的经常程度,它是当原假设正确时,得到目前这 个样本数据的概率
比如,要检验全校学生的平均生活费支出是否等于500元, 检验的假设为H0:=500;H0:500 。假定抽出一个样 本算出的样本均值600元,得到的值为P=0.02,这个0.02 是指如果平均生活费支出真的是500元的话,那么,从该总 体中抽出一个均值为600的样本的概率仅为0.02。如果你认 为这个概率太小了,就可以拒绝原假设,因为如果原假设 正确的话,几乎不可能抓到这样的一个样本,既然抓到了, 就表明这样的样本不在少数,所以原假设是不对的
原假设H0为真 点估计量的抽样分布
3. 标准化的检验统计量
标准化检验统计点量 点估估计计量量 —的假抽设样值标准差
2011年
用统计量决策
(双侧检验 )
抽样分布
Region of Rejection
拒绝H0
置信水平
Region of Rejection
拒绝H0
/2
1-
/2
Region of Nonrejection
备择假设的方向为“<”,称为左侧检验 备择假设的方向为“>”,称为右侧检验
2011年
双侧检验与单侧检验
(假设的形式)
以总体均值的检验为例
2011年
5.1 假设检验的基本原理 5.1.2 两类错误与显著性水平
两类错误与显著性水平
1. 研究者总是希望能做出正确的决策,但由于决策是建立 在样本信息的基础之上,而样本又是随机的,因而就有
抽样分布的拒绝域
3. 表示为 (alpha)
常用的 值有0.01, 0.05, 0.10
4. 由研究者事先确定
2011年
5.1 假设检验的基本原理 5.1.3 检验统计量与拒绝域
依据什么做出决策?
1. 若假设为H0:=500,H1:<500。样本 均值为495,拒绝H0吗?样本均值为502, 拒绝H0吗?
我认为这种新药的疗效 比原有的药物更有效!
就一个总体而言,总 体参数包括总体均值、 比例、方差等
分析之前必需陈述
2011年
什么是假设检验?
(hypothesis test)
1. 先对总体的参数(或分布形式)提出某种假设, 然后利用样本信息判断假设是否成立的统计方 法
2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率原理
临界值
H0
临界值
2011年
用统计量决策
(左侧检验 )
抽样分布
Region of Rejection
拒绝H0
置信水平

1-
Region of Nonrejection
临界值
H0
2011年
用统计量决策
(右侧检验 )
抽样分布
置信水平
Region of Rejection
拒绝H0
1-

Region of Nonrejection
实这种洗涤剂的平均净含量并不符 洗涤剂 合说明书中的陈述 。建立的原假设 和备择假设为
H0 : 500 H1 : < 500
500g
2011年
提出假设
(例题分析)
【例6.3】一家研究机构估计,某城市中家庭拥有汽 车的比例超过30%。为验证这一估计是否正确, 该研究机构随机抽取了一个样本进行检验。试 陈述用于检验的原假设与备择假设
2011年
第 5 章 假设检验
5.1 假设检验的基本原理
5.1.1 假设的陈述 5.1.2 两类错误与显著性水平 5.1.3 检验统计量与拒绝域 5.1.3 利用P值进行决策
5.1 假设检验的基本原理 5.1.1 假设的陈述
什么是假设?
(hypothesis)
在参数检验中,对总 体参数的具体数值所作 的陈述
2011年
正常人的平均体温是37oC吗?
当 问 起 健 康 的 成年人体温是多 少时,多数人的 回 答 是 37oC , 这 似乎已经成了一 种共识。下面是 一个研究人员测 量 的 50 个 健 康 成 年人的体温数据
2011年
正常人的平均体温是37oC吗?
根据样本数据计算的平均值是36.8oC ,标准差为 0.36oC 根据参数估计方法得到的健康成年人平均体温的 95%的置信区间为(36.7,36.9)。研究人员发现这 个区间内并没有包括37oC 因此提出“不应该再把37oC作为正常人体温的一 个有任何特定意义的概念” 我们应该放弃“正常人的平均体温是37oC”这个共 识吗?本章的内容就将提供一套标准统计程序来检 验这样的观点
2011年
5.1 假设检验的基本原理 5.1.4 利用P值进行决策
用P 值决策
(P-value)
1. 如果原假设为真,所得到的样本结果会像实 际观测结果那么极端或更极端的概率
• P值告诉我们:如果原假设是正确的话,我们 得到得到目前这个样本数据的可能性有多大, 如果这个可能性很小,就应该拒绝原假设
2. 被称为观察到的(或实测的)显著性水平
3. 决策规则:若p值<, 拒绝 H0
2011年
双侧检验的P 值
/2
拒绝H0
1/2 P 值
/2
拒绝H0
1/2 P 值
临界值 0
临界值
Z
计算出的样本统计量
计算出的样本统计量
2011年
左侧检验的P 值

拒绝H0
1/2 P 值
临界值 0
计算出的样本统计量
相关文档
最新文档