第三章 假设检验
3[1].1假设检验初述,二类错误
第三章 假设检验3.1 假设检验 两类错误(1)假设检验(hypothesis test ) 假设检验是统计推断的另一类重要问题,是概率意义下的一种反证法。
一般,当母体X 的分布完全未知,或只知其形式而不知其参数时,为推断母体的有关特性,提出针对母体的某项假设;再对母体进行抽样,依据子样值对所提假设做出接受或拒绝的决策。
(2)决策依据——实际推断原理 小概率事件在一次试验中几乎不发生。
若抽样结果是小概率事件在这一次试验中发生了,就有理由怀疑假设的正确性,从而做出拒绝原假设的决策;否则接受原假设。
例 3.1.1 某饮料厂在自动流水线上装饮料,每瓶的重量(单位:克))10,(~2μN X ,正常生产情况下500=μ,一段时间后,为检查机器工作是否正常,抽取9个样品,称重后算得494=x ,试问:此时自动流水线的工作是否正常?解:①提出假设母体)10,(~2μN X ,其中μ未知,在母体上作原假设0H 和备择假设(或称对立假设)1H 如下:↔==500:00μμH 500:01=≠μμH ②构造检验统计量X ∴的值应与μ很接近,想到用X 的值来检验原假设0H .当原假设成立时,10),,(~0200=σσμN X ,故),(~200n N X σμ,从而)1,0(~/10500/000N n X n X U H -=-=σμ(3-1)③给定小概率,找出拒绝域取小概率02.0=α,则有2αu 使}{2αα=≥u U P (3-2)}{2αu U ≥是一个小概率事件,如果一次抽样的结果是这一小概率事件发生了,则认为原假设不合理,应予拒绝。
即应取拒绝域}),,,{(221αu U x x x W n ≥= }),,,{(221ασμu n X x x x n ≥-= (3-3)④做出决策 这时,494=x ,5000=μ,9,100==n σ,8.1=∴U ;02.0=α,33.201.02==u u α,故2αu U <,∴应接受0H ,即认为机器工作正常.注:①假设检验又称为差异显著性检验;②假设检验是具有概率性质的反证法;③拒绝H的说服力强,接受0H的说服力不强;④α越小,拒绝H的说服力越强。
多元统计分析第三章假设检验与方差分析
多元统计分析第三章假设检验与⽅差分析第3章多元正态总体的假设检验与⽅差分析从本章开始,我们开始转⼊多元统计⽅法和统计模型的学习。
统计学分析处理的对象是带有随机性的数据。
按照随机排列、重复、局部控制、正交等原则设计⼀个试验,通过试验结果形成样本信息(通常以数据的形式),再根据样本进⾏统计推断,是⾃然科学和⼯程技术领域常⽤的⼀种研究⽅法。
由于试验指标常为多个数量指标,故常设试验结果所形成的总体为多元正态总体,这是本章理论⽅法研究的出发点。
所谓统计推断就是根据从总体中观测到的部分数据对总体中我们感兴趣的未知部分作出推测,这种推测必然伴有某种程度的不确定性,需要⽤概率来表明其可靠程度。
统计推断的任务是“观察现象,提取信息,建⽴模型,作出推断”。
统计推断有参数估计和假设检验两⼤类问题,其统计推断⽬的不同。
参数估计问题回答诸如“未知参数θ的值有多⼤?”之类的问题,⽽假设检验回答诸如“未知参数θ的值是0θ吗?”之类的问题。
本章主要讨论多元正态总体的假设检验⽅法及其实际应⽤,我们将对⼀元正态总体情形作⼀简单回顾,然后将介绍单个总体均值的推断,两个总体均值的⽐较推断,多个总体均值的⽐较检验和协⽅差阵的推断等。
3.1⼀元正态总体情形的回顾⼀、假设检验在假设检验问题中通常有两个统计假设(简称假设),⼀个作为原假设(或称零假设),另⼀个作为备择假设(或称对⽴假设),分别记为0H 和1H 。
1、显著性检验为便于表述,假定考虑假设检验问题:设1X ,2X ,…,n X 来⾃总体),(2σµN 的样本,我们要检验假设100:,:µµµµ≠=H H (3.1)原假设0H 与备择假设1H 应相互排斥,两者有且只有⼀个正确。
备择假设的意思是,⼀旦否定原假设0H ,我们就选择已准备的假设1H 。
当2σ已知时,⽤统计量nX z σµ-=在原假设0H 成⽴下,统计量z 服从正态分布z )1,0(~N ,通过查表,查得)1,0(N 的上分位点2αz 。
《应用数理统计》吴翊李永乐第三章假设检验课后作业参考答案
《应用数理统计》吴翊李永乐第三章假设检验课后作业参考答案-标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII第三章 假设检验课后作业参考答案3.1 某电器元件平均电阻值一直保持2.64Ω,今测得采用新工艺生产36个元件的平均电阻值为2.61Ω。
假设在正常条件下,电阻值服从正态分布,而且新工艺不改变电阻值的标准偏差。
已知改变工艺前的标准差为0.06Ω,问新工艺对产品的电阻值是否有显著影响( 01.0=α)解:(1)提出假设64.2:64.2:10≠=μμH H , (2)构造统计量36/06.064.261.2/u 00-=-=-=nX σμ(3)否定域⎭⎬⎫⎩⎨⎧>=⎭⎬⎫⎩⎨⎧>⋃⎭⎬⎫⎩⎨⎧<=--21212αααu u u u u u V(4)给定显著性水平01.0=α时,临界值575.2575.2212=-=-ααuu ,(5) 2αu u <,落入否定域,故拒绝原假设,认为新工艺对电阻值有显著性影响。
3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。
已知这种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000X 950 100 n=25 10002.5V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.3某厂生产的某种钢索的断裂强度服从正态分布()2,σμN ,其中()2/40cm kg =σ。
现从一批这种钢索的容量为9的一个子样测得断裂强度平均值为X ,与以往正常生产时的μ相比,X 较μ大20(2/cm kg )。
第三章假设检验
在假设检验中,检验的目的就是通过实测资料来 判断是接受还是拒绝这个原假设,这种假设检验也称 为显著性测验。如果检验的结果否定了原假设,就说 (假设与实际)差异显著,就接受备择建设;如果检 验的结果不能否定原假设,就说(假设与实际)无差 异显著。
第三章 假设检验
第一节 假设检验基本概念
例如有甲、乙两个气象站,甲站由15年实测资 料计算得的累年平均气温为25.4℃,乙站由10年实 测资料计算得的累年平均气温为24.5℃,要问如果 画25℃的年平均气温的等温线,通过甲、乙两个气 象站哪个合理?类似这样的问题,需要通过统计假 设检验来解决。
所谓统计假设检验是对总体的特征值作出某种假 设,然后根据适当的方法检验这种假设的合理性,这 种统计推断方法就称为统计假设检验。
第三节 方差的假设检验 一、单个正态总体方差检验
二、两个正态总体方差检验
第四节 总体成数的假设检验 许多试验结果用成数或百分数表示,如各格率、 达标率、发芽率、成活率等。如果样本容量较大, 百分数的分布可作正态分布,也可用U检验。 一、单一验
(一)单个正态总体均值检验
二、用小样本作总体平均值假设检验
(一) 单个正态总体均值检验
(二) 两个小样本正态总体均值检验
(三)配对数据均值检验
试验条件很接近的条件下,可采用配对数据的 均值比较。
第三章 假设检验
第三章 假设检验一、填空题1、在假设检验中,第一类错误(即弃真错误)是 。
2、在假设检验中,第二类错误(即取伪错误)是 。
3、在假设检验中,βα,分别为犯第一类错误和第二类错误的概率,n 为样本容量,则有当n 固定时,βα, ; 当n 增大时,βα, 。
4、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,所采用的检验统计量为 。
5、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ=H 01:μμ≠H ,拒绝域为 。
6、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,所采用的检验统计量为 。
7、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≥H 01:μμ<H ,拒绝域为 。
8、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,所采用的检验统计量为 。
9、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中2σ未知,则对于假设00:μμ≤H 01:μμ>H ,拒绝域为 。
10、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,所采用的检验统计量为 。
11、设n X X X ,,,21 是来自总体),(~2σμN X 的样本,其中μ未知,则对于假设2020:σσ=H 2021:σσ≠H ,拒绝域为 。
12、检验一个总体X 服从正态分布,可用的方法有(给出两种方法即可) 。
13、设某个假设检验问题的拒绝域为W ,且当原假设H 0成立时,样本值12(,,,)n X X X 落入W 的概率为0.15,则犯第一类错误的概率为_____________________。
第三章(3) 假设检验
解:H0 : 0.5, H1 : 0.5
n=16 ,0.05 ,t (15) 1.753
t x 0 s* 0.56 0.5 2 >1.753 n 0.12 16
否定H0
即该服务系统工作不正常
42/27
(三)关于方差的检验
1、检验假设 H0: ,H1:
42/31
ns 选取 = 2 0
2
2
ns2 当2= 2 b时,否定H0 0
当2 b时,不能否定H0
42/32
例6 葡萄酒厂用自动装瓶机装酒,每瓶规定重量为500克,标 准差不超过10克,每天定时检查。某天抽得9瓶,测得平均重 量为x 499克,标准差为s* 16.03克。假设瓶装酒的重量服从 正态分布。问这台机器工作是否正常?(=0.05)
H0 : EX 0.5, H1 : EX 0.5
样本平均值X 0.6
由于
X 0.5 0.1 0.224
而
DX 0.25 0.224 n 100 0.05
不能否定H0
42/10
二、参数检验
☆8
42/11
参数检验
• 参数估计与参数检验都利用样本的信 息
估计量 样本 信息 样本 统计量 检验统计量 参数检验 参数估计
解:
提出假设 H0:2 0.1082 ,H1:2 0.1082
n5 0.05
*2
s 0.2282
*2
查表可得
a=0.484
2
b=11.1
ns (n 1)s 4 0.2282 17.83 >11.1 2= 2 2 2 0 0 0.108
否定H0,即方差不能认为是0.1082
第三章假设检验
假通设常反证法与概率反证法的假区设别
命题H0为真
命题H0为真
逻辑推理 出现矛盾?
N
某一定理. 定律.公理
Y
H0为假
区别
构造小概率 原理
N
H0为假
H0真假 待定
逻辑推理←→似然推理 似然推理的结论可能出错
H0为真
9
例1 设总体X~ N( μ, σ2 ), σ=0.06,现从总体中抽取容量为 10的样本,算得样本均值50.02 ,问总体的均值μ是否等于 50?(取=0.05)
错误在于:在H0成立的前提下,这样取小概率事 件A不合理.
本例中使小概率事件A发生的所有10维样本值向量构
成的集合为: 称D为假设H0的拒绝域. 一般
若拒绝接受H0 样本观测值(x1,x2,…,xn ) ∈D
则称D为假设H0的拒绝域
11
总结上述处3理数问假题设的思检想验与问方法题,的可步得骤检验参数
若用H0表示”μ=50”,用H1表示其对立面,即”μ ≠50”,则问题等价于检验H0 μ=50是否成立,若H0 不成立,则H1 μ ≠50成立.
3
问题2 某种疾病,不用药时其康复率为θ0,现发明 一种新药(无不良反应),为此抽查n位病人用新药 的治疗效果,设其中有s人康复,根据这些信息,能 否断定“该新药有效”?
7
反证法的关键是通过推理,得到一个与常理(定理、 公式、原理)相违背的结论.“概率反证法”依据的 是“小概率原理”.那么多小的概率才算小概率呢? 这要由实际问题的不同需要来决定.以后用符合α记 小概率,一般取α=0.1,0.05等.在假设检验中,若 小概率事件的概率不超过α,则α称 α为检验水平或 显著性水平.
假设检验:利用样本对假设的真假进行判断. 参数假设检验:在总体的概率分布已知情形下,对分 布中的未知参数作假设并进行检验. 非参数假设检验:若总体的分布未知,对总体的分 布形成或参数作假设并进行检验.
数理统计 (研究生课程) :第三章 假设检验
必须认为这个差异反映了事物的本质差别,即反映 了生产已不正常.
这种差异称作 “系统误差”
正确
第二类错误
人们总希望犯这两类错误的概率越小越好,但 对样本容量一定时,不可能使得犯这两类错误的 概率都很小。 往往是先控制犯第一类错误的概率在一定限度 内,再考虑尽量减小犯第二类错误的概率。
即: 较小的 (0,1) 使得 P{拒绝H0|H0为真}≤ ,
然后减小P{接受H0|H0不真} 犯两类错误的概率:
如发现不正常,就应停产,找出原因,排除 故障,然后再生产;如没有问题,就继续按规定 时间再抽样,以此监督生产,保证质量.
很明显,不能由5罐容量的数据,在把握不大 的情况下就判断生产 不正常,因为停产的损失是 很大的.
当然也不能总认为正常,有了问题不能及时 发现,这也要造成损失.
如何处理这两者的关系,假设检验面对的就 是这种矛盾.
如果H0不成立,但统计量的实测 值未落入否定域,从而没有作出否定 H0的结论,即接受了错误的H0,那就 犯了“以假为真”的错误 . “取伪错误” 这两类错误出现的可能性是不可能排除的。 原因在于:由样本推导总体
假设检验的两类错误
实际情况 H0为真 H0不真 第一类错误 正确
决定 拒绝H0 接受H0
在上面的例子的叙述中,我们已经初步介绍 了假设检验的基本思想和方法 .
基于概率反证法的逻辑的检验: 如果小概率事件在一次试验中居然发生, 我们就以很大的把握否定原假设.
第三章多元正态总体参数的假设检验
第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布一、正态变量二次型的分布1、分量独立的n 维随机向量X 的二次型设),,1)(,(~21n i N X i i =σμ,且相互独立,记⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=n X X X 1,则),(~2n n I N X σμ,其中)',,(1n μμμ =。
X 的二次型具有以下一些结论:结论1 当),,1(0n i i ==μ,12=σ时,则)(~'212n XX X ni iχξ∑===;当),,1(0n i i ==μ,12≠σ时,则)(~'122n X X χσ(或记为)(~'22n X X χσ)。
结论2 当),,1(0n i i =≠μ,X X '的分布常称为非中心2χ分布。
Def3.1.1 设n 维随机向量)0)(,(~≠μμn n I N X ,则称随机向量X X '=ξ为服从n 个自由度、非中心参数∑===ni i 12'μμμδ的2χ分布,记为)(~'),(~'22δχδχn X X n X X 或。
若时且1),0)(,(~22≠≠σμσμn n I N X ,有)(~'122δχσn X X 。
结论3 设),0(~2n n I N X σ,A 为对称矩阵,且r A rank =)(,则二次型 A A r AX X =⇔222)(~/'χσ(A 为对称幂等矩阵)。
结论4 设),(~2n n I N X σμ,'A A =,则),(~'122δχσr AX X ,其中A A A =⇔=22'1μμσδ,且)()(n r r A rank ≤=。
结论5 二次型与线性函数的独立性:设),(~2n n I N X σμ,A 为n 阶对称矩阵,B 为n m ⨯矩阵,令)(,'维随机向量为m Z BX Z AX X ==ξ,若O BA =,则AX X BX '和相互独立。
第三章 假设检验
近似服从标准正态分布N(0,1)。
给定小概率 ,查附表1可得
u
2
P{U u }
2
,使
即
上式中花括号内是小概率事件。
m p0 n P{ u } p0 1 p0 2 n
m 进行一次抽样后得到子样废品率 的数值, n
如果使上面小概率事件发生,那么拒绝假设 H0 ,否则接受H0 。这就是说,若
10
假设H0 ,即能化。这 个例子的目的是要检验正态母体的平均数。 2 2 2 假定母体X的分布是 N , ,且 0 2 ( 0 是已知数)。在母体上作 假设H0 : 0 0是已知数 u 给定 ( 是小概率),查附表1可得 2 进行一次抽样后获得子样平均值 x 。若
1 2
n1 n2 2 的t分布,其中
1 1 * S n1 n2
S
*
n1 1S
给定显著水平 ,由附表2可得 t n1 n2 2 2 使 P{T t n1 n2 2} 即
P{ X1 X 2
2
n2 1S n1 n2 2
x 0 u
2
0
则拒绝假设H0 ,即不能认为母体平均数 0 0 若 x u
0
n n
则接受假设H0 ,即可认为母体平均数是 0
2
例2 某种产品在通常情况下废品率是5%, 现从生产出的一批中随意地抽取50个,检验 得知有4个废品,问能否认为这批产品的废 品率为5%?(取小概率 =5%) 母体X的分布是二点分布B(1,p),即 P{X=1}=p, P{X=0}=1-p 在母体上作 假设H0 :p=p0(取 p0=0.05) 2 p0 (1 p0 ) E X p0 , D X n n m p0 故 U n p0 1 p0
第三章 假设检验
小概率原理中,关于“小概率”的值通常根据实际问 题的要求而定,如取α=0.1,0.05,0.01等, α为检验的显著性水平(检验水平). 在假设检验过程中,描写(条件)小概率事件的统计 量的取值范围称为该原假设的否定域(拒绝域), 否定域的边界称为该假设检验的临界值.
φ(x)
α/2
- zα/2 否定域 zα/2
P 犯第一类错误 =P 当H 0为真拒绝H 0 =a
另一方面,当H0为不真时,样本观测值也可能不落入拒绝域, 此时致使我们作出接受H0的错误决策(纳伪). 这种错误称为第 二类(type II error)错误,犯第二类错误的概率常记为 ,即
P 犯第二类错误 =P 当H 0为假接受H 0 =
六、假设检验与区间估计的联系
§3.2 单个正态总体参数的假设检验
双侧假设检验的拒绝域见图.
那么,如何判断原假设H0 是否成立呢? 这里用到人们在实践中普遍采用的一个原则:
小概率事件在一次试验 中几乎不会发生 .
在假设检验中,我们称这个小概率为 显著性水平,用a表示. (significance level) 的选择要根据实际情况而定。 常取
现在回到我们前面灯泡寿命的例中: 在提出假设 H0: 由于 已知,取 ~ N(0,1) 当H0为真时, ~ N(0,1) 对给定的显著性水平a,可以在N(0,1)表中查到 分位数的值 ,使 = 1600; H1:≠1600后,
故不能拒绝H0 . 没有落入 拒绝域
二、假设检验的步骤 (1)根据问题的要求提出原假设 H0和备择假设H1;
以例2为例进行分析总结 (1)提出假设
H0:=0=32.5;H1:≠0
(2)在 H0为真时选取检验统计量并 (2)在H0为真时构造统计量并 确定其分布; 确定其分布 (3)对给定(或选定)的显著性水平 α,构造小概率事件,确定拒绝域 (3)对于给定的显著水平a=0.01, 由P{|t|>t0.01/2(5)}=0.01, (4)计算统计量的观测值; 推断:当统计量的值落入 拒绝域,就拒绝H0; 否则就接受H0. 得拒绝域W={|t|>4.0322} (4)计算统计量的观测值 做出推断 由于|t|=2.997≤4.0322.所以接 受H0.
第三章 Minitab之假设检验
单侧检验的例子(续一) 解:
(一)、首先找出总体参数,这里应该是总体的均值m,即谷 物的平均重量,给出原假设和备择假设,即用公式表达两个相 反的意义。 H0: m ≥ 24 (均值至少为 24)
Ha: m < 24 (均值少于24) (二)、确定概率分布和用来做检验的检验统计量。
我们要检验抽取的样本均值是否达到广告宣称的数额,就
就需要提出假设,假设包括零假设H0与备择假设 H1。
零假设的选取
假设检验所使用的逻辑上的间接证明法决定了我们 选取的零假设应当是与我们希望证实的推断相对立 的一种逻辑判断,也就是我们希望否定的那种推断。
零假设的选取(续一)
同时,作为零假设的这个推断是不会轻易被推翻的,只有当样本 数据提供的不利于零假设的证据足够充分,使得我们做出拒绝零 假设的决策时错误的可能性非常小的时候,才能推翻零假设。
4、得出关于H0和关于H1的结论
显著性水平
显著性水平α是当原假设正确却被拒绝的概率
通常人们取0.05或0.01 这表明,当做出接受原假设的决定时,其正确的可能性(概率)为
95%或99%
判定法则
1、如果检验统计量落入拒绝域中,则拒绝原假设 2、如果检验统计量落入接受域中,则我们说不能拒绝原假设
可以用样本均值离标称值的标准离差个数的多少来判断。
因此构造检验统计量
z* x n
单侧检验的例子(续二)
(三)、设定置信水平为95%。收集样本信息,假设选取了 一个数目为40的样本,计算得
x 23.76 n 40 计算检验统计量的值为(σ = 0.2)
z x 23.76 24 7.5895 n 0.2 40
Values
4.9 5.1 4.6
第三章 差异分析与假设检验
(2)两两比较。如果研究者对因素的所有水平“同等 无知”,在发现水平之间存在差异后,可以做两两比 较,找出a(a-1)/2个成对均值之间的差异是否显著。多 个均值的两两比较不宜直接两两作t检验。多重比较不 限于在F检验之后进行,只要对多个均值进行两两比较, 都应当使用多重比较的方法。两两比较式要检验如下 一组假设: H0: μi-μj=0;i>j=1,……,a-1 常用的检验方法有最小显著差数法(LSD),Duncan 多范围检验、q检验法(SNK)、Turkey法等,研究者 可以同时选用多种方法对比检验结果。
社会心理学家要比较三种宣教方式如何 影响大学生对反恐战争的态度。随机选 取90名学生,并将它们分成三组。在对 他们进行三种不同宣传后,纸笔测验他 们对待战争的态度。用ANOVA检验三 种宣传方式对学生态度的影响。方差分 析结果如下:
来源
平方和
df
均方
F
p
宣传方式
误差
180.10
438.50
2
87
一项研究“学生对文章内容的不同预期对英文 阅读理解的影响”的实验,“不同预期”在文 章中具体表现为“不同类型标题提示”(因素 A),有三个水平:正确标题提示、中性标题 提示、误导标题提示。被试是同一个学院6个 专业的大一学生,每个专业6人并被随机分成3 个组,每组2人阅读一种类型标题提示的文章。 考虑到不同专业学生的英文程度可能不同,所 以将专业作为区组。
为什么统计上显著的结果可能在理论上 和实际应用中都没有意义? 简要描述F检验的原理。 重复测量ANOVA和独立组ANOVA的主 要差异是什么? F检验和两个平均数比较有什么差异? 简单主效应和总体主效应之间有什么差 异?
第三章 假设检验ppt课件
出此时的常数k; (2)求 时犯第二类错误的概率是多 少? H 1: 1
补充:利用P-值进行决策(p-值法)
1、p值:指当原假设正确时,得到所观测数据的 概率。 2、用P值进行检验的基本思想是:小的P值表明在 原假设为真时得到目前这样一个样本结果的可能 性很小,所以应该拒绝原假设。 3、利用p值决策的准则:p值<α,拒绝 H 0 p值>α,不拒绝 H
或者 H ,H : 0: 0 1 0
单侧检验
左侧
四、假设检验的基本思想与步骤
假设检验的基本思想:为了检验原假设 H 0 是 否成立,我们先假设 H 0 成立,然后运用统计 方法观察由此导致何种后果,如果(对 H 0 不 利的)小概率事件在一次试验中发生了,就 表明 H 0 很可能不正确,从而拒绝 H 0 。反之, H0 则没有理由拒绝 ,应接受它。 即满足下式:
注:在假设检验中,应对原假H0采取“拒绝” 或“不拒绝”的表述方式,而不应采取“接受” 的表达方式。
假设检验的步骤
பைடு நூலகம்
1.提出假设(原假设和备择假设); 2.选择检验统计量; 3.给定显著性水平 的值( 的值一般取得较小, 一般为0.01,0.05,0.1等); 4、确定 H 0 的拒绝域(即能够拒绝原假设的检验 统计量的所有可能取值的集合); 5、对 H 0 做判断(如果检验统计量的值落到拒绝 域内,则拒绝原假设;否则接受原假设)
五、假设检验中可能会犯的两类错误
1、弃真错误(第一类错误)——当原假设正确时 却拒绝原假设,所犯的错误称为弃真错误。犯 这种错误的概率通常记为α ,所又称为α 错误。 (α 又称显著性水平 )
P ( W H 0)
2、取伪错误(第二类错误)——当原假设错误时 而没有拒绝原假设,所犯的错误称为取伪错误。 犯这种错误的概率通常记为β ,所以又称为β 错误。
医学统计学第三章 总体均数的估计与假设检验 PPT课件
抽样误差:样本统计量与参数之间的差异, 称抽样误差。
样本统计量是一个随机变量,在随机的原则 下从同一总体抽取不同的样本,即使每个样 本的样本含量n相同,它们的结果也会不同。
样本统计量与参数之间的差异有何特点呢?
二个特点:
A、其值互不相同,有些样本统计量与总 体参数之间差异大,有些小;有些为正 数,有些为负数。
差别对样本所代表的总体间是否存在着差别做出判断。
基本内容
计量资料 计数资料
统计描述
频数分布 集中趋势 离散趋势
统计图表
相对数
统计图表
统计推断(1)
抽样误差 标准误 t u F检验 秩和检验 u 、 2检验 秩和检验
统计推断(2)
直线相关与回归 偏相关 多元线性回归
Logistic回归
第一节 均数的抽样误差与标准误
x
100个
XX jj
Xj 100个
样本号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
xj
167.41 165.56 168.20 166.67 164.89 166.36 166.16 169.11 167.17 166.13 167.71 168.68 166.83 169.62 166.95 170.29 169.20 167.65 166.51 163.28
170.45
50
170.39
4.15
167.42
173.35
51
168.47
3.91
165.67
171.27
53
168.87
5.77
164.74
173.00
54
169.53
第三章假设检验例子
试问,在显著性水平
25%下,能否认为每匹布上的疵点数服从泊松分布。
例:一位环保工程师要考察某条河流的污染情况。 他收集了河流与某个居民点的距离 X (单位:公里) 及河流该处的生化需氧量 Y (单位: 104 mL / L )的 15 对数据如下表:
xi yi 65 2 9 18 20 25 28 50
显著性水平 =0.1 下,对总体 X 是否服从二项分 布 B 2, 0.5 作 2 拟合优度检验,其中 X 表示两 个孩子的家庭中男孩个数,并对结论作直观解释。
例:某厂在全面质量管理工作中,抽查了 50 匹布, 记录下它们的疵点数:
疵点数 频数 0 1 2 3 4
21 18 7 3 1
更新设备后,从新生产的产品中随机抽取 100 个,
测得平均重量 x 12.5 克 , 如果方差不变,问更新 设备后,产品的平均重量是否有显著变化 X ~ N , 2 , 今从一批产品中抽查 10 根测其折断力,算得
均未知,试问在显著性水平 5%下,能否认为距离与 生化需氧量无关?
例:为了考察某地区 50 岁以上的成年人吸烟 习惯与患肺癌之间的关系,调查了 112 名对象, 得列联表如下:
人数 吸烟 不吸烟 n j
患肺癌 未患肺癌 18 12 4 78
ni
,试问在
n 112
显著性水平 1%下,能否认为吸烟习惯与患肺癌无关?
例:为了检查一颗骰子是否均匀,把这颗骰子掷了 100 次,得结果如下表:
出现点数 频数 1 2 3 4 5 6
14 15 13 20 18 20
试在显著性水平
=0.05 下作 2 拟合优度检验。
例:为了检验某厂生产的灯泡的使用寿命是否服从 指数分布,随机地抽查了 150 只灯泡,测得它们的 平均使用寿命 x 200 小时 ,把这 150 个数据 分组整理后如下表:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 假设检验3.2 一种元件,要求其使用寿命不低于1000(小时),现在从一批这种元件中随机抽取25件,测得其寿命平均值为950(小时)。
已知这种元件寿命服从标准差100σ=(小时)的正态分布,试在显著水平0.05下确定这批元件是否合格。
解:{}01001:1000, H :1000950 100 n=25 10002.5V=u 0.05H x u αμμσμα-≥<====->=提出假设:构造统计量:此问题情形属于u 检验,故用统计量:此题中:代入上式得:拒绝域:本题中:0.950.950u 1.64u 0.0u H =>∴即,拒绝原假设认为在置信水平5下这批元件不合格。
3.4某批矿砂的五个样品中镍含量经测定为(%): 3.25 3.27 3.24 3.26 3.24设测定值服从正态分布,问在0.01α=下能否接受假设,这批矿砂的镍含量为3.25? 解:n=5;x=zeros(1,n);x=[3.25 3.27 3.24 3.26 3.24]; x1=sum(x)/n; x2=0; for i=1:nx2=x2+(x(1,i)-x1)^2;endx2=x2/n;S=sqrt(x2);0101102: 3.25 H :t 3.252, S=0.0117, n=50.3419H x μμμμσ==≠==提出假设:构造统计量:本题属于未知的情形,可用检验,即取检验统计量为:本题中,代入上式得:否定域为:1-20.995120 V=t>t (1)0.01,(4) 4.6041, 3.25n t t tH ααα-⎧⎫-⎨⎬⎩⎭==<∴本题中,接受认为这批矿砂的镍含量为。
3.5确定某种溶液中的水分,它的10个测定值0.452%,0.035%,X S ==2N(,),μσ设总体为正态分布试在水平5%检验假设:0101() H :0.5% H :0.5%() H :0.04% H :0.0.4%i ii μμσσ≥<≥<{}0.95()0.452% S=0.035%-4.1143(1)0.05 n=10 t (9) 1.833i t X n ασα==-==1-构造统计量:本文中未知,可用检验。
取检验统计量为X 本题中,代入上式得: 0.452%-0.5%拒绝域为:V=t >t 本题中,01 4.1143H <=∴t 拒绝{}22200222212210.952()nS S 0.035% n=10 0.04%100.035%7.65630.04% V=(1)(1)(9)16.919ii n n ααμχσσχχχχχχ--===*==>--==2构造统计量:未知,可选择统计量本题中,代入上式得:()()否定域为:本题中, 210(1)n H αχ-<-∴接受3.8用重量法和比色法两种方法测定平炉炉渣中2SiO 的含量,得如下结果重量法:n=5次测量,120.5%,0.206%X S == 比色法:n=5次测量,221.3%,0.358%Y S == 假设两种分析法结果都服从正态分布,问 (i )两种分析方法的精度σ()是否相同? (ii )两种分析方法的μ均值()是否相同?0.01α=() 解:(i )121122121221212121211H : H :n (1) F=n (1)H FF 11(11)(11)V H 0.015, n S n S n n n n n n n αασσσσα-=≠----⎧⎫⎧⎫----⎨⎬⎨⎬⎩⎭⎩⎭==00220提出原假设:对此可采用统计量在下,(,),我们可取否定域为V=F<F ,F>F ,此时 P()=本题中,111 x 20.5%, S =0.206% 5, y 21.3%, S =0.358%n ===212122120.0050.9950.0050.995n (1)5(51)0.206%F=0.3311n (1)5(51) F 0.0669 F F F H n S n S -*-*==-*-*=∴220代入上式得:()(0.358%)1(5,5)=14.94(5,5)=14.94由于 (5,5)<F<(5,5)接受即无明显差异。
(ii)1202122222121112012H H :(11() ()H 2 V=n n i ii i X Y S X X S Y Y n n t n n t μμμμσ===≠=-=-+-∑∑11提出假设::这种未知的场合,用统计量其中在成立时,服从自由度为的分布。
否定域为:12121111t ((2))V H 0.015, x 20.5%, S =0.206% 5, y 21.3%, S =0.358%t n n n n X Y αα-⎧⎫>+-⎨⎬⎩⎭======0此时 P()=本题中,代入上式得:120.9951-2121-20 =-3.8737t (2)t (8) 3.3554t(2),n n t n n H αα+-==>+-∴拒绝即差距显著。
3.9设总体116(,4),,,XN X X μ为样本,考虑如下检验问题:{}{}01123:0 H :1() =0.05 V ={2X -1.645}V = 1.502X 2.125V =2X 1.962X 1.96(ii)H i μμα==-≤≤≤≤-≥试证下述三个检验(否定域)犯第一类错误的概率同为或通过计算他们犯第二类错误的概率,说明哪个检验最好?解:{}{}{}{}00.97512012()0.050.05:02*1.960.052 1.64502 1.645 1.645( 1.645)1(1.645)=1-0.95=0.05V 1.502 2.i P x V H X U U H X V X X P X P X ααμσμσ-=∈=⎧⎫-⎪⎪=>==⎨⎬⎪⎪⎩⎭=∴>==≤-⎧⎫⎪⎪-⎪⎪≤-=≤-=Φ-=-Φ⎨⎬⎪⎪⎪⎪⎩⎭=≤≤即,P U 这里P {}{}{}{}{}{}203301110125 1.50 2.120(2.215)(1.50)0.980.930.052 1.962 1.962 1.96 1.96P(V H )=1-P 2 1.962(1(1.96))0.05ii :2 1.645X P V H V X X X X H V X σββ⎧⎫⎪⎪-⎪⎪=≤≤⎨⎬⎪⎪⎪⎪⎩⎭=Φ-Φ=-=⎫⎪⎪=≤-≥=≥=≥⎬⎪⎪⎭<=-Φ=X ≥-或()犯第二类错误的概率 =P -V =P {}1μ=-{}{}223310.3551(0.355)0.36:1 1.502 2.12511 4.125:2 1.96110.04 3.96V P X V P X σβμσβμσ⎧⎫⎪⎪+⎪⎪≥=-Φ=⎨⎬⎪⎪⎪⎪⎩⎭=-≤≤=-⎧⎫⎪⎪+⎪⎪≤≤⎨⎬⎪⎪⎪⎪⎩⎭ΦΦ=≤=-⎧⎫⎪⎪+⎪⎪≤≤⎨⎬⎪⎪⎪⎩⎭X =P X =1-P 3.50 =1-(4.125)+(3.50) =1X =P ⎪ΦΦ∴11 =(3.96)-(0.04)=0.99996092-0.516=0.48396092V 出现第二类错误的概率最小,即V 最好。
3.10 一骰子投掷了120次,得到下列结果:问这个骰子是否均匀?(0.05)α= 解:22i 122i 11:620()()20i ki i i ki i i P n np np n np np χχχ====-=-+++==∑∑0i 2222本题原假设为: H i=1,2,,6这里n=120,nP 本题采用的统计量为Pearson 统计量即, 代入数据为:(23-20)(26-20)(15-20)=4.82210.9521k-15k-1H ααχχχχ--<20()=()=11.071由于 () 所以接受即认为这个是均匀的。
3.11 某电话站在一小时内接到电话用户的呼唤次数按每分钟记录的如下表:试问这个分布能看作为泊松分布吗?α(=0.05) 解:{}{}{}{}0221122222233224H :()!81610X n 01*6*7*260606060200.13530!212*0.27071!222*0.27072!23 1.5*0.23!k e P x k k p e P P X e e P P X e e P P X e e P P X e λλλλλ-∧∧--------=====*+++++=====================0检验问题为: 参数为已知的最大似然估计 {}{}{}{}{}4225522662278222221030224*0.09024!3245* 0.03615!15246* 0.01206!457160()(860*0.1353)(1660*0.2707)(160*0.0120)60*0.135360*0.270760*0ki i i i e P P X e e P P X e e P P X e P P X P X n np np χ------=================≥=-≤=----==+++∑.01200.6145=(下面为MATLAB 编程计算程序。
)21210k-1k-1,H ααχχχχ--<∴20.952由于()=(5)=11.071()接受即分布可以看作为泊松分布。
n=60;p=zeros(1,7);p=[exp(-2) exp(-2)*2 exp(-2)*2 exp(-2)*1.5 exp(-2)*(2/3) exp(-2)*(4/15) exp(-2)*(8/90)]; nn=zeros(1,7);nn=[8 16 17 10 6 2 1]; sum=0; for i=1:7sum=sum+((nn(1,i)-n*p(1,i))^2)/(n*p(1,i)); end sumsum = 0.61453.13从一批滚珠中随机抽取了50个,测得他们的直径为(单位:mm ): 15.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 15.6 15.3 15.1 15.3 15.0 15.6 15.7 14.8 14.5 14.2 14.9 14.9 15.2 15.0 15.3 15.6 15.1 14.9 14.2 14.6 15.8 15.2 15.9 15.2 15.0 14.9 14.8 14.5 15.1 15.5 15.5 15.1 15.1 15.0 15.3 14.7 14.5 15.5 15.0 14.7 14.6 14.2 是否可认为这批滚珠直径服从正态分布?(0.05)α= 解:2123(),H :()()H 0.1833()(-1.1163)0.13210.428214.815.078p ()(-1.1163)(-0.6492)(-1.1163)0.12600.4282p X F x x F x p μσμσμσ-=Φ==Φ=Φ=-=Φ-Φ=Φ-Φ==Φ020设为滚球的直径,其分布函数为则检验问题为在成立的条件下,参数,的最大似然估计为=15.078,14.6-15.07815.115.078()(-0.6492)(0.0514)(-0.6492)0.26240.4282--Φ=Φ-Φ=4512340.952015.415.078p ()(-0.6492)(0.7520)(0.0514)0.25350.4282p 10.2260k-m-12k-m-1,p p p p H ααχχχχ-=Φ-Φ=Φ-Φ==----=<∴221-21-()=()=5.991()=5.991接受认为滚珠直径服从正态分布。