北交大-统计学-第四章 假设检验
统计学教案习题04总体均数的估计和假设检验
第四章 总体均数的估计和假设检验一、教学大纲要求(一) 掌握内容1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。
(二) 熟悉内容 两样本方差齐性检验。
(三) 了解内容1. t 分布的图形与特征;2. 总体方差不等时的两样本均数的比较; 3. 等效检验。
二、教学内容精要(一) 基本概念 1. 抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。
统计上用标准误(standard error ,SE )来衡量抽样误差的大小。
不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。
均数的标准误与标准差的区别见表4-1。
表4-1 均数的标准误与标准差的区别均数的标准误标准差意义 反映的抽样误差大小 反映一组数据的离散情况 记法X σ(样本估计值X S )σ(样本估计值S )计算X σ=nσ X S =nSσ =nX 2)(∑-μS=1)(2--∑n X X控制方法增大样本含量可减小标准误。
个体差异或自然变异,不能通过统计方法来控制。
2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval ,CI )。
它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。
不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。
当0.05α=时,称为95%可信区间,记作95%CI 。
当0.01α=时,称为99%可信区间,记作99%CI 。
(2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。
假设检验:验证假设的正确性
假设检验:验证假设的正确性第一章:引言假设检验是统计学中一种重要的推理方法,通过对样本数据进行统计分析,以验证关于总体参数的假设是否成立。
在科学研究、社会调查、质量控制等领域,假设检验被广泛应用于判断研究问题的正确性和提供决策依据的过程中。
本文将介绍假设检验的基本概念和步骤,并通过实例展示如何进行假设检验,以验证假设的正确性。
第二章:假设检验的基本概念2.1 假设和假设检验在统计学中,假设是对总体参数或总体分布的陈述或猜测。
假设检验是一种基于样本数据对假设进行验证的方法。
通常将一个假设称为原假设(H0),它是默认的或现有的假设。
同时,我们还有一个备择假设(H1),它是对原假设的否定或对抗性假设。
2.2 类型I 错误和类型II 错误在进行假设检验时,我们需要考虑两种可能的错误。
类型I 错误是拒绝一个为真的原假设,而类型II 错误是接受一个为假的原假设。
在实际应用中,我们通常将类型I 错误的概率控制在一个较小的水平(通常为0.05或0.01),以降低犯错的风险。
第三章:假设检验的步骤3.1 确定原假设和备择假设在进行假设检验前,首先需要明确原假设和备择假设。
原假设通常是一种无效或无差异的假设,而备择假设则是对原假设的反面假设,即存在有效或有差异的情况。
3.2 选择适当的统计检验方法根据研究问题和数据类型的不同,选择适当的统计检验方法进行假设检验。
常见的统计检验方法包括t 检验、方差分析、卡方检验等。
3.3 计算检验统计量根据选择的统计检验方法,计算相应的检验统计量。
检验统计量是一个数值指标,用于判断样本数据与原假设的一致性或差异性。
3.4 设置显著性水平显著性水平(α)是用来控制类型I 错误的概率。
通常情况下,α的取值为0.05或0.01,表示犯错的风险分别为5%和1%。
3.5 进行假设检验利用计算得到的检验统计量和显著性水平,进行假设检验。
根据检验统计量的取值和显著性水平的比较,可以得出对原假设的接受或拒绝。
管理统计学-第4章 假设检验
• 在本例中,
_
x 32 35
3.184
s / n 5.96 / 40
⑤作出统计决策
• 根据样本信息计算出统计量z的具体值,Z 将它与临界值 相比较,就可以作出接受 原假设或拒绝原假设的统计决策。
• 在本例中,由于z=3.184>1.96,落在拒绝 域内,所以拒绝原假设H0。可以得出结论:
在0.05的显著性水平下,抽样结果的平
– p<α,拒绝零假设 – p>α,不应拒绝零假设
举例1
• 某健身俱乐部主管经理估计会员的平均年 龄是35岁,研究人员从2005年入会的新 会员中随机抽取40人,调查得到他们的年 龄数据如下。
33 28 32 26 37 35 27 29 33 30 35 29 39 34 27 37 34 36 31 29 29 26 19 21 36 38 42 39 36 38 27 22 29 34 36 20 39 37 22 39
素有:总体方差已知还是未知,用于进行检验的
样本是大样本还是小样本,等等。
• 在本例中,由于n=40>30是大样本,所以 近似
服从正态分布,以样本标准差代替总体标准差, 所用的统计量是:
_
x
3.184
s/ n
③选取显著性水平,确定接受域和拒绝域
• 显著性水平(Significant Level):事先给定的形 成拒绝域的小概率,用表示。
(3)右单侧检验
两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,
右单侧检验的拒绝域位于统计量分布曲线的右侧。
④计算检验统计量的值
• 在提出原假设H0和备选假设H1,确定了检验统计 量,给定了显著性水平以后,接下来就要根据
《统计学(第二版)》电子课件 第4章 假设检验
显著性检验本身对原假设起保护作用,水平越小, 检验犯第一类错误的概率就越小,换言之,越有 可能不拒绝原假设。
2021/8/7
《统计学》第4章假设检验
4-29
4.1.5 双侧检验和单侧检验
常见的三种显著性假设检验形式: (1)双侧检验 H0 : 0 H1 : 0 (2)右侧检验 H0 : 0 H1 : 0 (3)左侧检验 H0 : 0 H1 : 0
从该批产品中随机抽取了100件,发现其中有4件 次品,即样本次品率为4%,A公司认为样本次品 率4%大于1%,所以不接受B公司的这批产品,B 公司则认为虽然样本次品率为4%,但并不能说明 10万件产品的次品率大于1%,因为样本量很小;
2021/8/7
《统计学》第4章假设检验
4-3
问题
(1)A公司是否应该接受该批产品? (2)如果随机抽取了100件产品有3件次品,
H0:pp01%
2021/8/7
《统计学》第4章假设检验
4-12
记X为100件产品中次品的数目,直观上看, X越大,原假设越值得怀疑,反之, X越小, 对原假设越有利;问题是, X大到多少应 该拒绝原假设?
两种处理方法:
2021/8/7
《统计学》第4章假设检验
4-13
1. 假定H0成立,计算事件X≥4的概率
4-32
4.2 一个正态总体的检验
4.2.1 总体均值μ的检验: Z检验 考虑如下三种检验问题
H0:0 H1:0 H0:0 H1:0 H0:0 H1:0
(4.4) (4.5) (4.6)
2021/8/7
《统计学》第4章假设检验
4-33
统计学 第4章 假设检验
【解】研究者想收集证据予以支持的假设是该 城市中家庭拥有汽车的比率超过30%。 因此,建立的原假设和备择假设为 H0 :μ≤30% H1 :μ>30%
结论与建议
◆原假设和备择假设是一个完备事件组, 而且相互对立。在一项假设检验中,原假设和 备择假设必有一个成立,而且只有一个成立; ◆先确定备择假设,再确定原假设。因为 备择假设大多是人们关心并想予以支持和证实 的,一般比较清楚和容易确定; ◆等号“=”总是放在原假设上; ◆因研究目的不同,对同一问题可能提出 不同的假设,也可能得出不同的结论。 ◆假设检验主要是搜集证据来推翻和拒绝 原假设。
◆理想地,只有增加样本容量,能同时减小 犯两类错误的概率,但增加样本容量又受到很多 因素的限制; ◆通常,只能在两类错误的发生概率之间进 行平衡,发生哪一类错误的后果更为严重,就首 要控制哪类错误发生的概率; ◆在假设检验中,一般先控制第Ⅰ类错误的 发生概率。因为犯第Ⅰ类错误的概率是可以由研 究者控制的。
假设检验的过程
提出假设 作出决策
拒绝假设 别无选择!
总体
我认为人口的平 均年龄是50岁
抽取随机样本
均值 x = 20
二、原假设与备择假设
什么是假设?
对总体参数的具体数
值所作的陈述
我认为这种新药的疗效 比原有的药物更有效!
总体参数包括总体均值、 总体比率、总体方差等 分析之前必须陈述
备择假设。
500g
【解】研究者抽检的意图是倾向于证实这种洗 涤剂的平均净含量并不符合说明书中的陈述。 因此,建立的原假设和备择假设为 H0:μ≥500 H1:μ< 500
提出假设例3
一家研究机构估计,某城市中家庭拥有 汽车的比率超过 30% 。为验证这一估计是否 正确,该研究机构随机抽取了一个样本进行 检验。试陈述用于检验的原假设与备择假设
统计学中的假设检验与置信区间
统计学中的假设检验与置信区间在统计学中,假设检验与置信区间被广泛应用于数据分析与推断。
它们是确定统计假设是否成立,以及估计未知参数的范围的重要工具。
本文将讨论假设检验与置信区间的概念、应用以及计算方法。
一、假设检验假设检验是一种推断统计量是否服从某种假设分布的方法。
通常,我们将原假设标记为H0,备择假设标记为H1。
假设检验的过程分为以下几个步骤:1. 确定原假设和备择假设:原假设通常是指待检验的假设,而备择假设则是与原假设相反的假设。
2. 选择一个适当的检验统计量:检验统计量是样本数据的函数,用于判断原假设的真实性。
3. 确定拒绝域和显著性水平:拒绝域是指当检验统计量的取值落入其中时,我们拒绝原假设。
显著性水平是指在给定的检验中,犯第一类错误的概率。
4. 计算检验统计量的值:利用样本数据计算得到检验统计量。
5. 做出决策:根据检验统计量的值和拒绝域的定义,我们可以决定是接受原假设还是拒绝原假设。
假设检验的结果可以有两种可能:拒绝原假设或接受原假设。
拒绝原假设意味着我们有足够的证据来支持备择假设。
二、置信区间置信区间是对未知参数的估计范围。
在置信区间中,我们可以指定一个置信水平,这个水平给出了我们对参数估计的可信程度。
通常,我们用(1-α)的置信水平来表示置信区间,其中α是我们允许的犯第一类错误的概率。
计算置信区间的方法有很多,最常用的是利用正态分布或t分布。
下面是一个计算正态分布置信区间的示例:1. 收集样本数据并计算样本均值和样本标准差。
2. 确定置信水平以及与之对应的临界值。
3. 根据公式计算置信区间:置信区间 = 样本均值 ±临界值 * (样本标准差/ √n)。
4. 根据计算结果得出参数的估计范围。
三、假设检验与置信区间的应用假设检验与置信区间在各个领域都有广泛的应用,例如医学、社会科学、经济学等。
以下是一些常见的应用场景:1. 药物疗效评估:通过比较服用药物和接受安慰剂的患者群体的数据,可以使用假设检验来评估药物的疗效以及置信区间来估计治疗效果。
第四章 第一次课(2+1) 假设检验的原理
本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者 来自同一总体,接受零假设则表示克矽平没有疗效。
而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数和治疗 前的平均数来自不同总体,即克矽平有疗效。
2 、 确定显著水平 能否定H0的人为规定的概率标准称为显著水平,记作。 统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以 在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平 。 3 、选定检验方法,计算检验统计量,确定概率值 根据研究设计的类型和统计推断的目的选择使用不同的检验方法。 例
确定
水准
计算统计量
确定P值并与给定的
比较
做出推断结论。 假设检验的基本逻辑是“小概率事件在一次抽样 中不太可能出现”。 假设检验有两类错误。 假设检验与相应的置信区间估计既能提供等价的 结果,又有各自不同的功能。 假设检验方法很多,每种方法有相应的适用条件。 综合考虑研究目的、设计类型、变量类型、样本 含量等要素之后才能选择合适的假设检验方法。 三、课后练习 1假设检验的理论依据是什么? 2假设检验的两类错误的区别与联系是什么? 3t检验的应用条件是什么? 4假设检验中P值的意义是什么? 5如何确定检验水准? 6如何恰当地应用单侧与双侧检验?
=11头,标准差S1=1.76头;大白猪10头经产母猪产仔平均数
=9.2头,标准差S2=1.549头。能否仅凭这两个平均数的差值
-
=1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论 呢?统计学认为,这样得出的结论是不可靠的。这是因为如果我们再分 别随机抽测10头长白猪和10头大白猪经产母猪的产仔数,又可得到两个 样本资料。由于抽样误差的随机性,两样本平均数就不一定是11头和 9.2头,其差值也不一定是1.8头。造成这种差异可能有两种原因,一是 品种造成的差异,即是长白猪与大白猪本质不同所致,另一可能是试验 误差(或抽样误差)。对两个样本进行比较时,必须判断样本间差异是 抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎
第四章 假设检验 《数理统计学》PPT课件
4.2.3 用p值作判断
表4.2.2对4个不同的显著性水平α分别列出相应的拒绝域和所 下的结论。
4.2.3 用p值作判断
定义4.2.1 在一个假设检验问题中,拒绝原假设H0的最小显 著性水平称为p值。
利用p值和给定的显著性水平α可以建立如下判断法则:
● 若α≥p值,则拒绝原假设H0; ● 若α<p值,则接受原假设H0。 例4.2.4 任一检验问题的p值可用相应检验统计量的分布(如标准正 态分布、t分布等)算得。
由样本到总体的推理称为统计推断。英国统计学 家R.A.费希尔认为常用的统计推断有三种基本形式, 它们是
● 抽样分布; ● 参数估计,又可分为点估计与区间估计; ● 假设检验,又可分为参数检验与非参数检验。 其中抽样分布与参数估计在前几章已有叙述,今后 还会不断补充。从这一章开始将叙述假设检验,并讨 论假设检验与区间估计,确定样本量之间的关系。
假设检验是统计学中最具特色的部分,其统计味甚浓。 从建立假设,寻找检验统计量,构造拒绝域(或计算p值), 直到最后作出判断等各个步骤上都能体现多种统计思想 的亮点。假设检验的思维方式也独具一格,从其他数学 分支学不到这种判断问题的思路。不犯错误、不冒风险 的判断是不存在的,问题在于设法控制犯错误的概率。
4.1.3 势函数
定义4.1.2 设检验问题
H0: θ∈Θ0, H1: θ∈Θ1 的拒绝域为W,则样本观察值x=(x1,x2,…,xn)落在拒绝域 W内的概率称为该检验的势函数,记为
g(θ)=Pθ(x∈W), θ∈Θ0∪Θ1⊂Θ
(4.1.8)
例4.1.3 某厂制造的产品长期以来不合格品率不超过0.01。 某天开工后,为检验生产过程是否稳定,随机抽检了 100件产品,发现其中有2件不合格品。试在0.10水平 上判断该天生产是否稳定。
假设检验(完整版)
绿色 健康饮品
255
•H0 : = 255 •H1 : 255 = 0.05
•n = 16 •临界值(Zc):
拒绝 H0
0.025
拒绝 H0
0.025
检验统计量:
z x 0 257.2 255 1.76 n 5 16
决策:不能拒绝H0
结论:样本提供的证据表明:该 天生产的饮料与标准没有显著差 异,样本均值与标准的差异是因 为随机因素所引起的。
他在抽样分布理论、相关回 归分析、多元统计分析、最大 似然估计理论,方差分析和假 设检验有很多的建树。
女士品茶
• 20世纪20年代后期在英国剑桥一个夏日的下午, 一群大学的绅士和他们的夫人以及来访者,正围 坐在户外的桌旁享用下午的奶茶。
• 奶茶一般是由牛奶和茶混合而成的,调制时候可 以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这 时候,一名女士说她能区分这两种不同做法的调 制出来的奶茶。
(单侧检验 )
抽样分布
置信水平
拒绝H0
1-
拒绝域 临界值
0 接受域
样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
样本统计量
观察到的样本统计量
显著性水平和拒绝域
(左侧检验 )
抽样分布
置信水平
拒绝H0
1-
临界值
0
观察到的样本统计量
样本统计量
•【例2】一种罐装饮料采用自动生产线生产,每罐的容量 是255ml,标准差为5ml,服从正态分布。换了一批工人后, 质检人员在某天生产的饮料中随机抽取了16罐进行检验,
《统计假设检验》PPT课件
两均数差异越大,β值越小。
精选ppt
18
如何选择合适的α值
若一个试验耗费大,可靠性要求高,不允许反复,那么α值 应取小些;当一个试验结论的使用事关重大,容易产 生严重后果,如药物的毒性试验,α值亦应取小些。
对于一些试验条件不易控制,试验误差较大的试验,可将α 值放宽到0.1,甚至放宽到0.25。
在提高显著水平,即减小α值时,为了减否定小域犯Ⅱ型错误的概 否率定,域可适当增大接样受本域含量。增大样本含量可以同时降 低犯两类错误的可能性。
精选ppt
17
意两 图类
错 误 示
两类错误间的关系:
如图所示,图中左边曲线是H0为真时,x1 x2的分布密度曲
线;右边曲线是HA为真时,x1 的x2分布密度曲线( 1) 2
犯Ⅱ型错误可能性β的大小与α取值的大小、两均数差 异大小等因素有关:
当α值变小时, β值变大;反之亦然,也就是说Ⅰ型 错误α的降低必然伴随着Ⅱ型错误β的升高 ;
精选ppt
3
第一节 显著性检验的基本原理
一、显著性检验的意义
二、两种假设
三、显著水平与两类错误
四、双侧检验与单侧检验
五、显著性检验的基本步骤
精选ppt
4
一、显著性检验的意义
(一)为什么要进行显著性检验? 例1
某实验要求实验动物平均体重μ=10.00g, 现有
实验动物10只,平均体重 =x 10.23g, 已知总体
n
10
4.∵ HA: μ≠μ0,当∣u∣ >u0.025时拒绝H0 查正态分布表得,u0.025=1.96。 5. 做出推断及生物学解释:
∵ ∣u∣ <u0.025 ,P>0.05, ∴接受H0:μ=μ0 ,即可以认为这10只动物抽自总
4-统计假设检验与参数估计
3. 根据“小概率事件实际不可能性原理”否 定或接受无效假设
在统计学上 ,把小概率事件在一次试验中看成
是实际上不可能发生的事件,称为小概率事件实际不
可能原理。根据这一原理,当试验的表面效应是试验
误差的概率小于0.05时 ,可以认为在一次试 验
中试验表面效应是试验误差实际上是不可能的,
因而否定原先所作的无效假设H0,接受备择假设HA, 即认为试验的处理效应是存在的。当试验的表面效应
食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?
3
上一张 下一张 主 页 退 出
例2:A,B两种肥料,在相同条件下各施用于5 个小区的水稻上,水稻产量平均分别为
xA=500 kg,xB=520成的 还是由试验的随机误差造成的?
而区间( t,t )则称为α水平上的接受域。
27
上一张 下一张 主 页 退 出
图4-1 双侧检验时H0的接受域和否定域
28
对前例分析: 0=0.0975
是被检验的假设,通过检验可能被接受,也
可能被否定。
H A 备择假设(alternative hypothesis) 与H0对应的假设,只有是在无效假设被否定
后才可接受的假设。无充分理由是不能轻率
接受的。
12
上一张 下一张 主 页 退 出
如前例,原假设H0:=0=9.75% ,即 假设由新曲种酿造出的食醋的醋酸含量与原 菌种酿造的食醋醋酸含量相等,这个假设表 明采用新曲种酿造食醋对提高醋酸含量是无 效的,试验的表面效应是随机误差引起的。
一部分是两个总体平均数的差(1 - 2 ), 叫 做 试 验 的 处 理 效 应 (treatment
effect);另一部分是试验误差( 1 - 2)。
数理统计之假设检验
带概率性质的反证法 u 通常的反证法设定一个假设以后,如果出现的 事实与之矛盾,(即如果这个假设是正确的话,出现 一个概率等于0的事件)则绝对地否定假设.
u 带概率性质的反证法的逻辑是:
如果假设H0是正确的话,一次试验出现一个 概率很小的事件,则以很大的把握否定假设H0.
(3)拒绝域为
u
x 0 n
z
(4)取 , 查表确定临界值 k z z0.05 1.65
(5)计算
u x 0
2250
2000
5
1.65
n 250 25
则拒绝 H0 ,即认为这些产品较以往有显著提高.
2. 2未知时,的检验
未知
2,可用样本方差 S 2
1n n 1 k1 ( X k
当
H
为真时,
0
U
X 0 n
~
N(0,1)
衡量 u x 0 的大小 n
设一临界值 k>0,若
u x 0 k n
就认为有较大偏差;
则认为
H
不真,拒绝
0
H
0
若
u x 0 k
n
则接受 H0
显著性检验: P{拒绝H0| H0为真}
P
X
0
k
,
n
U X 0 ~ N(0,1) n
(6) t t , 则拒绝 H0 ,接受 H1;反之,接受 H0.
左边检验
(1)H0 : 0; H1 : 0
(2)选取统计量:T X 0
Sn
(3)拒绝域为
t
x 0
sn
t (n 1)
(4)取 , 查表确定临界值 k t (n 1)
第四章假设检验
• 在n重贝努利试验中,事件A可能发生0,1,2,…,n次, 则事件A 恰好发生k(0≤k≤n)次的概率Pn(k):
k Pn ( k ) = Cn p k q n − k
k=0,1,2…,n
二项分布的定义: 设随机变量x所有可能取的值为零和正整数:0,1,2,…,n, 且有
k Pn (k ) = Cn p k q n − k
k=0,1,2…,n
其中p>0,q>0,p+q=1,则称随机变量x服从参数为n和p的 二项分布,记为 x~B(n,p)。 , 在n较大,np、nq较接近时,二项分布接近于正态分布; 当n→∞时,二项分布的极限分布是正态分布。
二项分布的平均数、标准差: 当试验结果以事件A发生次数k表示时 μ=np σ=
小概率事件实际不可能原理 随机变量的概率分布——正态分布、二项分布 样本平均数的抽样分布 t分布 假设检验的基本原理和步骤
小概率事件实际不可能原理 • 概率的统计定义 • 在相同条件下进行n次重复试验,如果随机事件A发生的次 数为m,那么m/n称为随机事件A的频率; • 当试验重复数n逐渐增大时,随机事件A的频率越来越稳定 地接近某一数值p,那么就把p称为随机事件A的概率。 • 这样定义的概率称为统计概率,或者称后验概率。可以记 为P(A)=p。
由样本平均数 x 构成的总体称为样本平均数的抽样总体, 其平均数和标准差分别记为 µ x 和 σ x 。
σ x 是样本平均数抽样总体的标准差,简称标准误, ,
它表示平均数抽样误差的大小。 统计学上已证明
µx = µ
σ
x
=
σ
n
两个定理: 1、若随机变量x服从正态分布N(µ,σ2), x1 , x2 ,L, xn 是由x总体得来的随机样本,则统计量 也是正态分布, 且有
管理统计学-第4章 假设检验
4.1 假设检验的基本原理 4.2 参数假设检验 4.3 非参数假设检验
例: 某种大量生产的袋装食品,按规定每袋重量不 得少于250g。 今从一批该种食品中任意抽取50 袋,发现有6袋低于250g 。若规定不符合标准的 比例达到5%,食品就不得出厂,问该批食品能 否出厂。 从2000年的新生儿中随机抽取30个,测得其平 均体重为3210g,而根据1999年的统计资料,新生 儿的平均体重为3190g,问2000年的新生儿与1999 年相比,体重有无显著差异。
2.19
– (5)检验判断:由于 Z 2.19 Z / 2 1.96 , 落在拒绝域,故拒绝原假设H0。 – 结论:以5%的显著性水平可以认为该市2006 年的职工平均工资比2005年有明显的差异。
已知,均值的单侧Z检验
• 1. 假设
– 总数服从正态分布; – 当(n 30)时,不服从正态分布的总体可以用 正态分布来逼近。
• 2005年北京市职工平均工资为32808元, 标准差为3820元。现在随机抽取200人进 行调查,测定2006年样本平均工资为 34400元。按照5%的显著性水平判断该 市2006年的职工平均工资与2005有无显 著差异?
解答
• 在本例题中,我们关心的是前后两年职工的平 均工资有没有显著的差异,不涉及差异的方向, 因此,本题属于双侧检验。检验过程如下: – (1)提出假设: H0:32808;H1:≠32808; – (2)总体标准差已知,大样本抽样,故选用Z
– p<α,拒绝零假设 – p>α,不应拒绝零假设
举例1
• 某健身俱乐部主管经理估计会员的平均年 龄是35岁,研究人员从2005年入会的新 会员中随机抽取40人,调查得到他们的年 龄数据如下。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
说明: 在实际问题中,只能控制第一类错误的最大 概率 α ,那么选择哪个假设作为原假设 H 0 ,就要 视具体问题的目的和要求而定。
H1 反映 (1)原假设 H 0 代表一种久已存在的状态, 一种变化。
(2)相比较来说,原假设 H 0 要比 H1 简单。 (3)尽量使后果严重的错误成为第一类错误。 例如: “有病当作无病”会危害病人健康; “无病当作有病”会浪费一些药品。 两种错误相比较,前者后果严重,应把它作为第 一类错误。据此所建立的假设应该是
如果( x1 , , x n ) ∈ W,则认为 H 0不成立;
如果( x1 , , x n ) ∈ W ,则认为 H 0成立。
(三)选定适当的显著水平 α ,并求出临界值。 (四)根据样本观测值确定是否拒绝 H 0 .
由样本值 ( x1 , , x n )算得T ( x1 , , x n ),把它与临界值 相比较,若 ( x1 , , x n ) ∈ W,则拒绝 H 0,否则接受 H 0。
σ/ n
σ/ n
假设检验过程如下:
在实例中若取定 α = 0.05,
则 k = u1−α / 2 = u0.975 = 1.96,
又已知 n = 9, σ = 0.015, x − µ0 由样本算得 x = 0.511, 即有 = 2.2 > 1.96, σ/ n
于是拒绝假设H0, 认为包装机工作不正常.
于是可以选定一个适当的正数k,
x − µ0 当观察值 x 满足 ≥ k时, 拒绝假设 H 0 , σ/ n x − µ0 反之 , 当观察值 x 满足 < k时, 接受假设 H 0 . σ/ n X − µ0 当H 0为真时 Z = ~ N (0,1), σ/ n 检验统计量 根据小概率原理
X − µ0 因而当 H 0为真, 即µ = µ 0时, ≥ k 是一个 σ/ n 小概率事件 ,
控制α并制约 β ,通常选择 α = 0.01 / 0.05 / 0.1。
四、假设检验的基本步骤
(一) 建立假设:提出原假设 H 0 和备选假设 H1 . (二) 构造检验统计量与确定拒绝域的形式
分布密度 P ( x , θ )的表达式为已知时,通 常以θ的 ˆ为基础构造一个检验统 计量 极大似然估计 θ T = T ( X 1 , , X n ),并且在 H 0成立的条件下,确 定T的精确分布或渐近分布 。
H 0 : θ = 110
H 0 : X ~ N ( µ , σ 2 ).
(2) 抽取样本和集中样本的有关信息,要求对假设 H 0 的真伪进行判断,称为检验假设,最后对假 设 H 0作出拒绝或接受的决策。 假设检验问题的分类: 1. 参数假设检验:
若总体的分布函数 F ( x;θ1 , , θ k )或概率函数 p( x;θ1 , , θ k ) 已知,参数未知,假设 H 0针对未知参数提出并要 求检验。
用 µ 和 σ 分别表示这一天袋
装糖重总体 X 的均值和标准差 ,
由长期实践可知, 标准差较稳定, 设 σ = 0.015,
则 X ~ N ( µ , 0.0152 ), 其中 µ 未知.
问题: 根据样本值判断 µ = 0.5 还是 µ ≠ 0.5 . 提出两个对立假设H 0 : µ = µ 0 = 0.5 和 H 1 : µ ≠ µ 0 . 再利用已知样本作出判断是接受假设H0(拒绝假 设H1), 还是拒绝假设H0(接受假设H1). 如果作出的判断是接受H0, 则 µ = µ 0 , 即认为机器工作是正常的, 否则, 认为是不正常的.
(右侧检验)
(左侧检验)
其中 µ 0为常数。
现讨论 H 0 : µ = µ 0
v . s . H1 : µ > µ 0
对于正态总体, X是µ的UMVUE。若 X − µ 0比较大,则 应该认定 H 0为真时出现了小概率事 件,应该拒绝 H 0。
X − µ1 k + ( µ 0 − µ1 ) ≤ β ( µ ) = Pµ1 { X − µ 0 ≤ k } = Pµ1 σ σ n n
k + ( µ 0 − µ1 ) , = Φ σ n
k α ( µ ) = 1 − Φ σ n
(1) H 0 : µ = µ 0
v . s . H1 : µ ≠ µ 0
(双侧检验)
( 2) H 0 : µ = µ 0 H 0 : µ ≤ µ0 (3) H 0 : µ = µ 0 H 0 : µ ≥ µ0
v .s . H1 : µ > µ 0 v .s . H1 : µ > µ 0 v . s . H1 : µ < µ 0 v . s . H1 : µ < µ 0
注:在样本量一定的条件下,不可能找到一个使α , β 都减小的检验。
例:设总体 X ~ N ( µ , σ 2 ),σ 2为已知, X 1 , , X n为
样本,考虑检验
H 0 : µ = µ0 v . s . H1 : µ = µ1 ( µ 0 < µ1 )
选取X为检验统计量, X ~ N ( µ ,
第二类错误:
H 0不真但由于随机性样本 观测值落在接受域 W 中,从而接受 H 0。
受伪概率
β = P(接受H 0 | H1为真) = Pθ ( X ∈ W ) θ ∈ Θ1
假设检验的两类错误 真实情况 (未知) H0为真 H0不真 所 作 接受H0 正确 犯第II类错误 决 策 拒绝H0 正确
犯第I类错误
确定检验统计量 T后,根据原假设 H 0与备选假设 确定拒绝域 W。
常用的拒绝域形式: (1)单侧拒绝域
W = {( x1 , , x n ) : T ( x1 , , x n ) ≥ c }
或
W = {( x1 , , x n ) : T ( x1 , , x n ) ≤ c }
(2)双侧拒绝域
概率性质的反证法的根据: 小概率事件在一次试验中几乎是不可能发生的。 在假设检验中,我们作出接受 H 0或拒绝 H 0 的决 策,并不等于我们证明了原假设 H 0正确或错误,而 只是根据样本所提供的信息以一定的可靠程度认为 H 0 是正确或错误。
实例 某车间用一台包装机包装葡萄糖, 包得的 袋装糖净重是一个随机变量, 它服从正态分布. 当机器正常时, 其均值为0.5公斤, 标准差为 0.015公斤.某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(公 斤): 0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512, 问机器是否正常? 分析:
一、假设检验问题
例1:假定按国家规定,某种产品的次品率不得超过 1%,现从一批产品中随机抽出200件,经检查 发现有3件次品,试问:这批产品是否次品率 符合国家标准。 问题:根据抽样的结果来判断是否 p ≤ 0.01.
某厂生产的合金强度服 从正态分布 N (θ ,16),其中 例 2: θ的设计值为110( pa ),某天从生产中随机取 出25块 合金,测得强度值为 x1 , , x 25,其均值 x = 108,
2. 非参数假设检验 若总体的分布函数或概率函数为未知,假设 H 0 针对 总体的分布,分布的特征或总体的数字特征而提出 并要求检验。
H 0 表示原来的假设,称为原假设或零假设。
所考察的问题的反面称为备择假设或对立假设, 记为 H1 .
二、假设检验的基本原理
概率性质的反证法: 为了检验原假设 H 0是否正确,先假定H 0为正确,看 由此能推出什么结果,如果导致一个不合理现象出 现,则表明“假设 H 0 为正确”是错误的,拒绝原假 设 H 0;否则,则接受原假设 H 0 。
当α减小时, k变大,必导致 β 变大; 当β 减小时, k变小,必导致 α变大.定义2: 对检验问题来自H 0 : θ ∈ Θ0
v . s . H1 : θ ∈ Θ1
如果一个检验满足对任 意θ ∈ Θ 0,都有
g(θ ) = Pθ ( X ∈ W ) ≤ α θ ∈ Θ 0
则称该检验是显著性水 平为α的显著性检验, 简称水平为 α的检验。 说明:
H 0 : 有病; H1:无病。
§4.2 一个正态总体均值和方差的 检验
总体X ~ N ( µ , σ ),X 1 , , X n为X的样本, x1 , , x n
2
为观测值。
一、方差 σ 2 已知时均值 µ 的假设检验
当σ 为已知时,在给定显著 性水平 α下,关于 µ
2
的检验问题有以下三种 :
问当日生产是否正常
θ = 110.
例3:某建筑材料,其抗断强度的分布以往一直服从 正态分布,现改变配料方案,希望确定新产品 的抗断强度 X 是否仍服从正态分布. 这类问题称为假设检验,有两个共同特点:
(1) 先根据实际问题的要求 提出一个关于随机 变量的一种论断,称为 统计假设,记为 H 0
H0 : p ≤ 0.01
W = {( x1 , , x n ) : T ( x1 , , x n ) ≤ c1或T ( x1 , , x n ) ≥ c2 }
或
W = {( x1 , , x n ) :| T ( x1 , , x n ) |≥ c }
其中临界值 c1 , c2和c待定。
当拒绝域确定了,检验的判断准则也确定了
取给定的常数 α,通常 α总是取得很小 , 一般取
α = 0.01, α = 0.05, 满足
| X - µ0 | ≥ k H 0为真 = α p σ n
由标准正态分布分位点的定义得 k = u1−α / 2 ,
当 x − µ0 ≥ u1−α / 2时, 拒绝H 0 , x − µ0 < u1−α / 2时, 接受H 0 .