统计学基础与实务-ppt-第6章假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章 假设检验
STAT
第一节 假设检验的一般问题 第二节 一个总体参数的假设检验 第三节 两个总体参数的假设检验
6-1
学习目标
STAT
1. 假设检验的基本思想和原理 2. 假设检验的步骤 3. 一个总体参数的检验 4. 两个总体参数的检验 5. P值的计算与应用
6-2
假设检验在统计方法中的地位
STAT
• 统计方法
描述统计
推断统计
参数估计
假设检验
6-3
第一节 假设检验的基本问题
STAT
一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策
6-4
STAT
假设的陈述
6-5
什么是假设?
(hypothesis)
STAT
• 对总体参数的具体 数值所作的陈述
我认为这种新药的疗效 比原有的药物更有效!
• 3. 常用的 值有0.01, 0.05, 0.10
• 4. 由研究者事先确定
6-25
STAT
检验统计量与拒绝域
6-26
检验统计量
(test statistic)
STAT
1. 根据样本观测结果计算得到的,并据以对原 假设和备择假设作出决策的某个样本统计量
2. 对样本估计量的标准化结果
– 原假设H0为真 – 点估计量的抽样分布
2. 备择假设具有特定的方向性,并含有符号 “>”或“<”的假设检验,称为单侧检验或 单尾检验(one-tailed test)
– 备择假设的方向为“<”,称为左侧检验 – 备择假设的方向为“>”,称为右侧检验
6-19
双侧检验与单侧检验
(假设的形式)
STAT
假设
单侧检验 双侧检验
左侧检验 右侧检验
z 检验
z x 0 sn
z 检验
z x 0 n
t 检验
t x 0 sn
6-47
STAT
总体均值的检验
(大样本)
6-48
总体均值的检验
(提出假设)
STAT
1. 双侧检验:H0 : =0;H1 : 0 2. 左侧检验:H0 : 0;H1 : <0 3. 右侧检验:H0 : 0 ;H1 : >0
2. 先确定备择假设,再确定原假设 3. 等号“=”总是放在原假设上
4. 因研究目的不同,对同一问题可能提出不同 的假设(也可能得出不同的结论)
6-17
STAT
双侧检验与单侧检验
6-18
双侧检验与单侧检验
STAT
1. 备择假设没有特定的方向性,并含有符号 “”的假设检验,称为双侧检验或双尾 检验(two-tailed test)
... 如果这是总 体的假设均值
20
= 50
H0
样本均值
6-9
假设检验的过程
总体


提出假设
我认为人口的平 均年龄是50岁
抽取随机样本
均x =值20
STAT
作出决策 拒绝假设 别无选择!
6-10
STAT
原假设与备择假设
6-11
原假设
(null hypothesis)
算出其具体数值 4. 确定一个适当的显著性水平,并计算出其临界
值,指定拒绝域 5. 将统计量的值与临界值进行比较,作出决策
– 统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 – 也可以直接利用P值作出决策
6-43
第二节 一个总体参数的检验
STAT
一、总体均值的检验 二、总体比率的检验 三、总体方差的检验
6-49
总体均值的检验
(大样本)
STAT
1. 假定条件
– 正态总体或非正态总体大样本(n30)
2. 使用z检验统计量 2 已知:z x0 ~N(0,1) n
2 未知:z x0 ~N(0,1)
sn
6-50
总体均值的检验(大样本)
(决策规则)
STAT
1. 在双侧检验中,如果|z| z/2 ,则拒绝原 假设H0;反之,则不能
2. 如果p值很小,说明这种样本观测结果出 现的可能性很小,有理由拒绝原假设; p 值越小,拒绝原假设的理由就越充分。
3. 决策规则:若p值<, 拒绝 H0
4. p值可由现代统计软件计算给出。
6-39
双侧检验的P 值
/2
拒绝H0
1/2 P 值
STAT
/2
拒绝H0
1/2 P 值
临界值 0
临界值
STAT
• 什么小概率? • 1. 在一次试验中,一个几乎不可能发生
的事件发生的概率 • 2. 在一次试验中小概率事件一旦发生,
我们就有理由拒绝原假设 • 3. 小概率由研究者事先确定
6-8
假设检验的基本思想
这个值不像我 们应该得到的 样本均值 ...
抽样分布
STAT
... 因此我们拒
绝假设 = 50
H0 : 0 H0 : 0 H1 : <0 H1 : >0
z x 0 n
z x 0
sn
拒绝域 P值决策
z z / 2
z z
P 拒绝H0
z z
6-52
STAT
总体均值的检验
(小样本)
6-53
总体均值的检验
(小样本)
STAT
Z
计算出的样本统计量
计算出的样本统计量
6-40
左侧检验的P 值
抽样分布
置信水平
STAT
拒绝H0

P值
1-
临界值
0
计算出的样本统计量
样本统计量
6-41
右侧检验的P 值
抽样分布
STAT 置信水平
1-
拒绝H0

P值
0 临界值
计算出的样本统计量
6-42
假设检验步骤的总结
STAT
1. 陈述原假设和备择假设 2. 从所研究的总体中抽出一个随机样本 3. 确定一个适当的检验统计量,并利用样本数据
原假设 H0 : = 0 H0 : 0 H0 : 0
备择假设 H1 : ≠0 H1 : < 0 H1 : > 0
6-20
STAT
两类错误与显著性水平
6-21
假设检验中的两类错误
• 1. 第Ⅰ类错误(弃真错误)
– 原假设为真时拒绝原假设
– 第Ⅰ类错误的概率记为
STAT
1. 研究者想收集证据予以反对的假设 2. 又称“0假设” 3. 总是有符号 , 或 4. 表示为 H0
– H0 : = 某一数值
– 指定为符号 =, 或
– 例如, H0 : 10cm
6-12
备择假设
(alternative hypothesis)
STAT
1. 研究者想收集证据予以支持的假设 2. 也称“研究假设” 3. 总是有符号 , 或 4. 表示为 H1
– 总体参数包括总体均值、 比率、方差等
– 分析之前必须陈述
6-6
什么是假设检验?
(hypothesis test)
STAT
1. 先对总体的参数(或分布形式)提出某种假 设,然后利用样本信息判断假设是否成 立的过程
2. 有参数检验和非参数检验 3. 逻辑上运用反证法,统计上依据小概率
原理
6-7
假设检验中的小概率原理
解:研究者想搜集证据予以证明的 假设应该是“灯管寿命低于4000小 时”。于是原假设和备择假设应设 定为
H0 : 4000 H1 : < 4000 6-15
提出假设
(例题分析)
STAT • 【例】一家研究机构估计,某县60岁以下人群中初中及
其以下文化程度的人口所占比重超过10%。为验证这一 估计是否正确,该研究机构随机抽取了一个样本进行检 验。试建立用于检验的原假设与备择假设。
– 随着假设的总体参数的减少而增大
• 2.显著性水平
当 减少时增大
• 3.总体标准差
当 增大时增大
• 4.样本容量 n
– 当 n 减少时增大
6-24
显著性水平
(significant level)
STAT
• 1. 是一个概率值 • 2. 原假设为真时,拒绝原假设的概率
– 被称为抽样分布的拒绝域
2. 在左侧检验中,如果z﹤- z ,则拒绝原假设 H0;反之,则不能
3. 在右侧检验中,如果z﹥ z ,则拒绝原假设H0; 反之,则不能
6-51
总体均值的检验
(大样本检验方法的总结)
假设
双侧检验
左侧检验
STAT 右侧检验
假设形式 统计量
H0 : =0 H1 : 0 已知:
未知:
2. 将检验统计量的值与 水平的临界值进行比较
3. 作出决策 – 双侧检验:|统计量| > 临界值,拒绝H0 – 左侧检验:统计量 < -临界值,拒绝H0 – 右侧检验:统计量 > 临界值,拒绝H0
6-37
STAT
利用 P 值 进行决策
6-38
什么是P 值?
(P-value)
STAT
1. 在原假设正确的条件下,检验统计量取样 本统计量的概率
1. 假定条件
– 总体服从正态分布 – 小样本(n 30)
2. 检验统计量 2 已知: z x0 ~N(0,1) n
2 未知:t x0 ~t(n1)
sn
6-54
总体均值的检验(小样本)
(决策规则) STAT
1. 在双侧检验中,如果|t| t/2(n-1) ,则拒绝 原假设H0;反之,则不能
解:研究者想搜集证据予以支持的假 设是“该县60岁以下人群中初中及其 以下文化程度的人口所占比重超过 10%”。于是原假设和备择假设应设定 为:
H0 : 10% H1 : 10%
6-16
提出假设
(结论与建议)
STAT
1. 原假设和备择假设是一个完备事件组,而且 相互对立
– 在一项假设检验中,原假设和备择假设必有一 个成立,而且只有一个成立
显著性水平和拒绝域
(右侧检验 )
抽样分布
STAT 置信水平
1-
拒绝H0

0 观察到的样本统计量
样本统计量 临界值
6-35
显著性水平和拒绝域
(右侧检验 )
STAT
抽样分布
置信水平
1-
拒绝H0

0
样本统计量
临界值
6-36
决策规则
STAT
1. 给定显著性水平,查表得出相应的临界值z或
z/2, t或t/2
(单侧检验 )
STAT
抽样分布
置信水平
拒绝H0

1-
临界值
0
样本统计量
6-32
显著性水平和拒绝域
(左侧检验 )
抽样分布
STAT 置信水平
拒绝H0

1-
临界值
0
样本统计量
观察到的样本统计量
6-33
显著性水平和拒绝域
(左侧检验 )
STAT
抽样分布
置信水平
拒绝H0

1-
临界值
0
样本统计量
6-34
解:研究者想收集证据予以证明的假设应 该是“生产过程不正常”。建立的原假设 和备择假设为
H0 : 0.1cm H1 : 0.1cm
6-14
提出假设
(例题分析)
STAT • 【例】某厂家声称,所生产的某品牌灯管寿命不低于
4000小时,经销商在对该灯管经销前,有关研究人员 想通过抽检其中的一批灯管来验证该生产厂家的声称 是否属实。试建立用于检验的原假设和备择假设。
3. 标准化的检验统计量
标准化检验统计点量 点估估计计量量 —的假抽设样值标准差
6-27
显著性水平和拒绝域
(双侧检验 )
STAT
抽样分布
置信水平
拒绝H0
拒绝H0
/2
1-
/2
0 临界值
样本统计量 临界值
6-28
显著性水平和拒绝域
(双侧检验 )
STAT
抽样分布
置信水平
拒绝H0
/2
1-
拒绝H0
• 被称为显著性水平
• 2. 第Ⅱ类错误(取伪错误)
– 原假设为假时未拒绝原假 设
– 第Ⅱ类错误的概率记为
(Beta)
STAT

6-22
和 的关系
和 的关系就像 翘翘板,小 就 大, 大 就小

STAT
你不能同时减 少两类错误!

6-23
影响 的因素
STAT
• 1.总体参数的真值
/2
0 临界值
临界值
样本统计量
6-29
显著性水平和拒绝域
(双侧检验 )
STAT
抽样分布
置信水平
拒绝H0
/2
1-
拒绝H0
/2
临界值
0
临界值
样本统计量
6-30
显著性水平和拒绝域
(双侧检验 )
STAT
抽样分布
置信水平
拒绝H0
/2
1-
拒绝H0
/2
临界值
0
临界值
样本统计量
6-31
显著性水平和拒绝域
6-44
一个总体参数的检验
STAT
一个总体
均值
比率
方差Βιβλιοθήκη z 检验(单侧和双侧)
t 检验
(单侧和双侧)
z 检验
(单侧和双侧)
2 检验
(单侧和双侧)
6-45
STAT
总体均值的检验
6-46
总体均值的检验
(作出判断)
STAT

样本容量n



是否已



是否已

z 检验
z x 0 n
– H1 : <某一数值,或 某一数值 – 例如, H1 : < 10cm,或 10cm
6-13
提出假设
(例题分析)
STAT
• 【例】一种电子元件的生产标准是直径为 0.1cm,为对生 产过程进行控制,质量检测人员定期对一台加工设备检 查,确定这台设备生产的电子元件是否符合标准要求。 如果元件的平均直径大于或小于 0.1cm,则表明生产过程 不正常,必须进行调整。试建立用来检验生产过程是否 正常的原假设和备择假设
相关文档
最新文档