06 统计学 假设检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一步:确定原假设与备选假设。 <250
H 0 :
=250;H 1
:
以上的备选假设是总体均值小于 250毫升,因为消费者协会希望通过 样本数据推断出厂商的欺骗行为(大 于250毫升一般不会发生)。因此使 用左侧检验。
第二步:构造出检验统计量。
我们知道,如果总体的标准差已知,则正态总体(正常情 况下,生产饮料的容量服从正态分布)的抽样平均数,也 服从正态分布,对它进行标准化变换,可得到:
tα/2
(2) H0 :μ=μ0 , H1:μ<μ0
α
(3) H0 :μ=μ0 H1 :μ>μ0
,
–tα
0
α
0
tα
检验规则:
(1) H0 :μ=μ0 , H1:μ≠μ0
∣t∣≥tα/2(n-1) ,拒绝H0; ∣t∣<tα/2(n-1),接受H0
(2) (3)
H0
:μ=μ0 , H1:μ<μ0 :μ=μ0 , H1 :μ>μ0
三、检验功效
在犯第一类错误概率得到控制的条件下,犯取伪错误的概 率也要尽可能地小,或者说,不取伪的概率1-β应尽可能 增大。1-β越大,意味着当原假设不真实时,检验判断出 原假设不真实的概率越大,检验的判别能力就越好;1-β 越小,意味着当原假设不真实时,检验结论判断出原假设 不真实的概率越小,检验的判别能力就越差。可见1-β是 反映统计检验判别能力大小的重要标志,我们称之为检验 功效或检验力。
消费者协会实际要进行的是一项统计检验工 作。检验总体平均 =250是否成立。这就 是一个原假设(null hypothesis),通常用
H0
表示,即:
H0
:
=250
与原假设对立的是备选假设(alternative hypothesis) , 备选假设是在原假设被否定时另一种可能成立的结论。备 H1 选假设比原假设还重要,这要由实际问题来确定,一般把 期望出现的结论作为备选假设。
构造一个统计量来决定是“接受原假设,拒绝备 选假设”,还是“拒绝原假设,接受备选假设”。 对不同的问题,要选择不同的检验统计量。检验 统计量确定后,就要利用该统计的分布以及由实 际问题中所确定的显著性水平,来进一步确定检 验统计量拒绝原假设的取值范围,即拒绝域。在 给定的显著性水平α下,检验统计量的可能取值范 围被分成两部分:小概率区域与大概率区域。小 概率区域就是概率不超过显著性水平α的区域,是 原假设的拒绝区域;大概率区域是概率为1-α的区 域,是原假设的接受区域。
2
3
4
2、正态总体均值的检验-方差已知
构造检验统计量
x 0 t s n 当原假设H0 :μ=μ0为真时,统计量服从自
由度n-1的t分布。给定显著水平α , 查标准正态分布表得临界值,按检验
规则判断。
检验规则:
(1) H0
:μ=μ0 ,
α/ 2 1–α α/ 2
H1:μ≠μ0
-tα/2
二、参数检验
参数检验都是先对样本所属总体的性 质作出若干的假定,或对总体的分布 形状加以限定,然后对总体的有关参 数情况进行统计假设检验。因此,参 数检验又称为限定分布检验。如在总 体服从正态分布条件下,对其均值进 行检验。下面通过具体例子来说明参 数检验方法。
(一)总体均值的检验
考虑下面三种类型: (1) H0
t<tα(n-1),接受H0
t≤-tα(n-1) ,拒绝H0 ; t >-tα(n-1) ,接受H0
H0
t≥tα(n-1) ,拒绝H0 ;
(1)H0
:μ=μ0 ,
H1:μ≠μ0 H1 :μ>μ0
(2) H0 :μ=μ0 , H1:μ<μ0 (3) H0 :μ=μ0
,
但是,在大样本场合(样本容量n大于 30时),t-统计量与标准正态分布统 计量近似,通常用z检验代替t检验。
z X 0 248 250 4 50 3.54 1.645
n
第五步:判断。
检验统计量的样本取值落入拒绝域。 拒绝原假设,接受备选假设,认为有 足够的证据说明该种纸包饮料的平均 容量小于包装盒上注明的250毫升, 厂商有欺诈之嫌。
检验步骤
1
根据具体问题的要求,建立总体假设H0,H1 选择统计量,确定H0为真时的抽样分布 给定显著性水平α, 当原假设H0为真时,求出临界值。 计算检验统计量的数值与临界值比较
:μ=μ0 ,
H1:μ≠μ0 H1 :μ<μ0 H1 :μ>μ0
(2) H0 :μ≥μ0 , (3) H0 :μ≤μ0
,
1、正态总体均值的检验-方差已知
构造检验统计量
x 0 Z n 当原假设H0 :μ=μ0为真时,统计量服从
N(0.1),给定显著水平α ,查标准正 态分布表得临界值,按检验规则判断。
二、两种类型的错误
H0
为真
H0
非真
拒绝
H0
弃真错误(第一类错误或 α错误)
正确
接受
H0
正确
取伪错误(第二类错误 或β错误)
奈曼(Ney man)和皮尔生(Pearson)提出一个原 则,即在控制犯第一类错误的概率α 的条件下, 尽量使犯第二类错误的概率β 减小。
这一原则的含义是,原假设要受到维护,使它不 致轻易被否定;若检验结果否定原假设,则说明 否定的理由是充分的,同时,做出否定判断的可 靠程度(即概率)1-α 也得到保证
z检验的p-值:
检验统计量为z统计量的p-值计算公式, 表示检验统计量 的抽样数据,则p-值的计算方法如下:
如果 : , p-值=2
如果
如果
:
,
p-值=
p-值=
: , H 1 0
pz z0
H 1 0 H 1 0
pz z 0
pz z 0
2、假设检验的基本思想
假设检验可以用小概率原理解释。 小概率原理:即指概率很小的事件在一次试验中实几乎不 可能发生。 如果对总体的某种假设是真实的,那么不利于或不支持这 一假设的小概率事件A在一次试验中是几乎不可能发生的; 要是在一次试验中事件A发生了,就有理由怀疑这一假设 的真实性。
三、p-值检验
p-值检验就是通过计算p-值,再将它与显著性水平α作比 较,决定拒绝还是接受原假设。所谓p-值就是拒绝原假设 所需的最低显著性水平。p-值判断的原则是:如果p-值小 于给定的显著性水平α,则拒绝原假设;否则,接受原假 设。或者,更直观来说就是:如果p-值很小,拒绝原假设, p-值很大,接受原假设。请大家注意的是这里的p-值是指 概率,不要与成数指标相混淆。
例1:消费者协会接到消费者投诉,指控品牌纸包装饮料 存在容量不足,有欺骗消费者之嫌。包装上标明的容量为 250毫升。消费者协会从市场上随机抽取50盒该品牌纸包 装饮品,测试发现平均含量为248毫升,小于250毫升。 这是生产中正常的波动,还是厂商的有意行为?消费者协 会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?
第六章 假设检验
第一节 假设检验概述 第二节 总体参数检验 第三节 非参数检验
第一节 假设检验概述
一、假设检验的基本概念
1、假设检验与区间估计的差别主要在于:区间估计是用 给定的大概率推断出总体参数的范围,而假设检验是以小 概率为标准,对总体的状况所做出的假设进行判断。假设 检验与区间估计结合起来,构成完整的统计推断内容。假 设检验分为两类:一类是参数假设检验,另一类是非参数 假设检验。
当样本容量较大时,下列统计量服从标准正态分布:
z p
1p 上式中,ρ代表总体的成数, 代表样本的成数。 n 以上的z统计量可以用作总体成数检验的检验统计量。
例2:某企业声明有30%以上的消费者对其产品质量满意。 如果随机调查600名消费者,表示对该企业产品满意的有 220人。试在显著性水平α=0.05下,检验调查结果是否 支持企业的自我声明。
第二节
总体参数检验
一、单侧检验与双侧检验
α/ 2 -Zα/2
1–α
α/ 2 Zα / 2
α – Zα 0 0
α Zα
双侧检验
左侧检验
右侧检验
用单侧检验还是双侧检验,使用左侧 检验还是右侧检验,决定于备选假设 中的不等式形式与方向。与“不相等” 对应的是双侧检验,与“小于”相对 应的是左侧检验,与“大于”相对应 的是右侧检验。
例2:某汽车轮胎厂声称,该厂生产的 轮胎的平均使用寿命在一定的重量和 正常行驶条件下高于25 000公里的国 家标准。对一个由16个轮胎组成的随 机样本进行测试,得到的平均值和标 准差分别为27 000公里和5 000公里。 假定轮胎使用寿命近似服从正态分布, 试问是否可以相信厂家的说法。
总体成数的检验
可用z作为检验统计量。
z
X 0
n
~ N 0,1
第三步:确定显著性水平。 通常显著水平由实际问题确定,我们这 里取α=0.05,左侧检验,拒绝域安排 在左边,查标准正态分布表得临界值: -z =-1.645, 拒绝域是z<-1.645。
α – Zα 0
第四步:计算检验统计量的数值。 样本平均数 X 248 ,n=50,代入检验 统计量得:
解:第一步:作出假设。
:ρ> 30%。 H1 H0 以上的备选假设是企业自我声明的结论,我们希望该企业 说的是实话。因此使用右侧检验。 :ρ =30%,
第二步:构造z检验统计量。
第三步:确定拒绝域。 显著水平α=0.05,查标准正态分布表得临界值: =1.645,拒绝域是z>1.645。
pz z 0
。查标准正态分布表得:
第五步:判断。
p-值小于给出的显著性水平(0.05),拒绝原假设,接受备 选假设,与例1的结论相同。
例:利用p-值检验重新检验例1。
解:
第一、第二步与例1完全相同,故省略之。 第三步:计算样本统计的数值。 样本平均数 ,n=50,代入检验统计量得:
X 248
X 0 248 250 4 50
z0
n
3.54
第四步:计算p-值。 使用左侧检验,p-值= p-值=[1-F(3.54)]/2 =(1-0.999 8)/2 =0.000 1
∣<Zα/ห้องสมุดไป่ตู้ ,接受H0
(2) H0 :μ=μ0 , H1 :μ<μ0
Z ≤ –Zα ,拒绝H0 ; Z >–Zα ,接受H0
(3) H0 :μ=μ0 , H1 :μ>μ0
Z ≥ Zα ,拒绝H0 ; Z < Zα ,接受H0
在例1中,按历史资料,总体的标准差 是4毫升。我们通过检验总体均值是否 等于250毫升,来判断饮料厂商是否 欺骗了消费者。程序如下:
检验规则:
(1) H0
:μ=μ0 ,
α/ 2 1–α α/ 2
H1:μ≠μ0
-Zα/2
Zα/2
(2) H0 :μ=μ0 , H1:μ<μ0
α – Zα 0
(3) H0 :μ=μ0 H1 :μ>μ0
,
α
0
Zα
检验规则:
(1) H0 :μ=μ0 , H1:μ≠μ0
∣Z ∣≥Zα/2
,拒绝H0;∣Z
z
第四步:计算检验统计量的数值。 样本成数p=220/600=0.37,总体 假设的成数ρ =0.3,代入z检验统计量 得:
z p n
1
0.37 0.3
0.3 1 0.3 / 600
3.5
第五步:判断。
检验统计量的样本取值z=3.5>1.645, 落入拒绝域。拒绝原假设,接受备选 假设,认为样本数据证明该企业声明 属实。