第五章 假设检验与方差分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学
第五章 假设检验与方差分析
5-1
统计学
实际中的假设检验问题
1.产品自动生产线工作是否正常; 2.某种新生产方法是否会降低产品成本; 3.治疗某疾病的新药是否比旧药疗效更高; 4.厂商声称产品质量符合标准,是否可信; 5.学生考试成绩是否服从正态分布…
※ 假设检验——事先作出关于总体参数、分布
2. 第二类错误(“取伪”或“采伪”错误 )

原假设不真时接受原假设 第二类错误的概率为
Prob(接受H0 /
H0不真)=
5 - 14
统计学
决策结果与两类错误
决策 H0为真 拒绝H0 接受H0 第一类错误() 实际情况 H0为不真 正确 (1-) 第二类错误()
正确 (1 – )
检验的步骤:

提出原假设: H0: X = 4和备择假设: H1: X 4


选择检验统计量 Z
给定显著性水平1%,查临界值Za/2=2.58
计算检验统计量的观察值: z =-26
比较检验统计量的值|z|和临界值,作出结论 (由于|z|>临界值,拒绝原假设)。
5 - 21
统计学
单侧检验(例三)

待检验的参数是什么 是大样本还是小样本 总体方差已知还是未知
3. 常用的检验统计量有: Z、t、卡方、F统计量 xX 等。如 Z ~ N (0,1) n
5 - 10
统计学
(三)规定显著性水平
1. 原假设为真时,拒绝原假设的概率,用表示.
2. 由研究者根据具体情况事先确定。 常取 0.01, 0.05, 0.10。 3. 给定 了,也就确定了临界值——原假设 的接受区域与拒绝区域的分界点。
2 2 ( n 1 ) S * nS 2 2 2 ~ (n 1) 2 0 0
1. 2. 3. 4.
利用服从 t 分布的统计量进行假设检验的方法 统称为 2检验法。
5 - 25
统计学
2检验(例)
长期正常生产的资料表明,某厂产 品的厚度服从正态分布,其方差为 0.25。现从某日产品中随机抽取 20 根 ,得修正的样本方差为 0.42 。试判断 该日产品厚度是否与正常生产情况存 在显著差异?(0.05 )
检验统计量:
Z
x X0

n

1050 1000 100 25
2.5
结论: 在 = 0.05的水平上能拒绝H0, 接受备择假设,即有证据表明这批产品的 平均使用寿命高于1000小时。
5 - 23
统计学
(二)总体方差未知时对 总体均值检验—— t 检验


1. 假定条件
总体为正态分布,但 未知(用S*代替)
小样本
2. 检验统计量 t
x X0 s* n

x X0 s n1
~ t (n 1)
给定显著性水平,查 t 分布表得临界值。其余步 骤同前。 利用服从 t 分布的统计量进行假设检验的方法统 称为 t 检验法。
5 - 24
统计学
三、正态总体方差的检验 ——卡方 (2) 检验
检验一个总体的方差或标准差 假设总体服从正态分布 原假设为 H0: 2 = 02 检验统计量
p P0 P0 (1 P0 ) / n
5 - 28
统计学
(例)
一研究者估计某市居民家庭的汽车拥有
率为30%。现随机抽查了200的家庭,其中 68 个家庭拥有汽车。试问研究者的估计是 否可信? ( =0.05)
5 - 29
统计学
检验结果
H0: p = 0.3,H1: p 0.3 =0.05,n = 20 临界值:-1.96,+1.96 检验统计量:
wenku.baidu.com
5 - 15
统计学
和 的关系
在检验中人们总希望犯两类错误的可能 性都很小,然而,在其它条件不变的情况 下, 和不可能同时减小,就象交易中买 卖双方各自承担的风险一样。 • 一般说,哪一类错误带来的后果越严重、 危害越大,就应该作为首要的控制目标. • 在假设检验中,一般都首先控制第一类错 误.
2. 双侧检验

5 - 34
统计学
P值的计算
设检验的统计量为ξ,c是计算得统计量 的值。 左侧检验时,P值= p{ξ c } 右侧检验时,P值= P= p{ξ c } 双侧检验中,P值=单侧P值的2倍。
5 - 35
统计学

在例三(1)中,用Z检验法对总体均值进 行双侧检验,给定显著性水平=0.05, 由样本数据计算出检验统计量的值=2.5 ,因此可计算出该假设检验的: P值=Prob{|Z|≥2.5}=2 ×Prob{Z≥2.5} =2×{1-Prob{Z<2.5} =2×(1-0.9938)=0.0124

根据检验统计量的分布,由给定的 查相应的概率分 布表,即得临界值。如 采用Z统计量时=0.05对

应的临界Z0.05=1.645。 临界值还与检验形式有关。
5 - 11
统计学
(四)计算检验统计量的值
——根据样本资料计算出检验 统计量的观察值。
(五)作出检验结论
——将检验统计量的值与 水平的临界值进 行比较,得出接受或拒绝原假设的结论。 • 当检验统计量的值落在拒绝区域,则拒绝 原假设;反之,接受或不能拒绝原假设。
结论: 在 =0.10的水平上拒绝H0,即有证据表明 该日厚度的波动与正常生产情况时有显著差异。
5 - 27
统计学
第三节 总体成数的 Z 检验

1. 假定条件
只有两类结果 总体服从二点分布 大样本下(且np>5,n(1-p)>5,可用正 态分布来近似)
2. 成数检验的 Z 统计量 p P0 Z or p(1 p) / n
检验的方法。 若总体不是正态分布, 但n30时可近似采用Z检验 给定 后,临界值查标准正态分布表而得。

X (or or ) X 0 ,
单侧检验时,临界值=Za或-Za; 双侧检验时,临界值= -Za/2和Za/2。
5 - 20
统计学
(一)双侧检验(例)
问题:改革后生产的零件平均长度是否为4cm?
5 - 26
统计学
检验结果
H0: 2 = 0.0025,H1: 2 0.0025 = 0.10, n-1 = 20 - 1 = 19 接受区域: (10.117, 30.144) 2 统计量: ( n 1 ) S * 2


2 0
(20 1)0.42 31.92 0.25
Z p P0 p(1 p) n 0.34 .03 0.34 0.66 200 1.194
结论: 在 =0 .05的显著性水平上接受H0,表明
研究者的估计可接受的。
5 - 30
统计学
几点补充
1。检验的P - 值 2。怎样提出假设 3。利用置信区间进行检验 (区间估计与假设检验的关系)
假设不能接受。
5-3
统计学
例2
原来的平均长度=4 cm,标准差=0.02 cm。样 本: n=100 ,平均长度 =3.948 。改革后的平均 长度=4? 假设:改革后 X =4,根据抽样分布理论, 有: x ~ N ( X , / n ),
即Z (x X ) /( / n ) ~ N (0,1)
5-6
统计学
二、假设检验的步骤

提出原假设和备择假设 确定适当的检验统计量及其分布 规定显著性水平
计算检验统计量的值
作出统计决策
5-7
统计学
(一)提出假设
包括原假设和备择假设。
原假设——待检验的假设,也称为零假设 ,用 H0表示。 备择假设——也称对立假设,与原假设内 容完全相反的假设。当拒绝原假设后应 接受的假设。用 H1表示。 事实上,对某个问题提出了原假设,也就 同时给出了备择假设。

5 - 16
统计学
给定α时考虑的因素
当犯第一类错误的后果严重时,则希望尽可能不犯 第一类错误,宁愿犯第二类错误,此时α宜小。 当犯第二类错误的后果严重时,则希望尽可能不犯 第二类错误,宁愿犯第一类错误,此时α不宜太小
——视两类错误所产生的后果轻重而定


——事前对原假设的信念

对原假设越有信心,则越小;反之则越大
5-8
统计学
假设的三种形式:
0 H 0 : o , H 1 : 0 0 双侧检验 左侧检验 右侧检验
左侧检验与右侧检验统称为单侧检验。
5-9
统计学
(二)确定检验统计量及其分布
1. 检验统计量是用于假设检验问题的统计量;
2. 选择统计量的方法与参数估计中相同:
某厂以前生产的电子元件的平均使用寿命不 低于 1000 小时。已知使用寿命服从正态 分布,标准差为100小时。现随机抽取了 25 件,得知样本平均使用寿命为 1050 小 时。问这批产品的寿命是否有显著性提 高? (=0.05)
5 - 22
统计学
(计算结果)
H0: X ≤ 1000,H1: X>1000 n = 100, = 0.05,临界值=Z0.05=1.645
5-5
统计学
假设检验中的小概率原理
1. 小概率事件:发生概率很小的随机事件。
2. 小概率原理:小概率事件在一次试验(观 察)中几乎不可能发生。
3. 什么样的概率才算小概率?
——由研究者事先确定(根据决策的风险
或要求的把握程度来决定),没有统 一的界定标准。假设检验中把这个概 率称为检验的 “显著性水平”。
由于P值<给定的,所以拒绝原假设。
5 - 36
统计学
在上述假设的前提下, =3.948等价于Z=26,是 几乎肯定不可能出现的事件。然而它发生了,这 表明原假设是不合理的。
5-4
x
统计学
假设检验的特点
——先认为假设为真,观察在此前提下 所抽到样本的出现是否合理。若合理 则判断假设可接受,反之拒绝假设。
• 采用逻辑上的反证法
• 判断是否合理的依据统计上的小概 率原理(即这里的反证法是基于一 定概率的反证法)。
5 - 12
统计学
留待后面讲解的两个问题
1。检验的P值 与传统检验方法的比较。 2。怎样提出假设。
5 - 13
统计学
三、假设检验中的两类错误
1. 第一类错误( “弃真”或“拒真” 错误 )

原假设为真时拒绝原假设 犯第一类错误的概率为 (被称为显著性水 平) Prob(拒绝H0 / H0为真)=
5 - 17
统计学
影响 错误的因素

1. 显著性水平
随 减少而增大 随着总体参数的假设值与真实值的差异缩小而增大
2. 总体参数的真值

3. 样本容量 n

随着 n 增大,检验统计量的分布曲线更集中,曲线 尾端的面积 则减少。 当 增大时 增大
4. 总体标准差

5 - 18
形式、相互关系等的命题(假设),然后通过 样本信息来判断该命题是否成立(检验) 。
5-2
统计学
第一节 假设检验的基本概念
一、假设检验的基本思想 例1. 从1000件产品中抽出10件,有4件次品, 问这批产品能否出厂? 提出假设:P<=4%,如果这一假设成立,则出现 所抽样本的概率小于1‰ 。这种可能性极 小,但在一次抽样中发生了,显然不合理 。这种不合理性源于推论的假设前提,故上述
统计学
第二节 正态总体参数的检验
一、方差已知时对正态总体均值的检验 ——z检验法 二、方差未知时对正态总体均值的检验 ——t检验法 三、对正态总体方差的检验 —— 2 检验法
5 - 19
统计学
一、方差已知时对正态总体 均值的检验——z检验法
H 0: X X 0 H 1:
根据抽样分布理论,总体方差 2 已知时则 检验统计量为: Z x X 0 ~ N (0,1) n Z检验法——利用服从标准正态分布的 Z 统计量进行假设

P值越大,在原假设为真的情况下,样本出 现的概率越大,出现这样的样本不是小概 率事件,说明原假设不能拒绝。反之,应 拒绝原假设。
5 - 33
统计学
利用 P 值进行决策
1. 单侧检验

若P值 ,不能拒绝 H0 若P值 < , 拒绝 H0
若P值 /2, 不能拒绝 H0 若P值 < /2, 拒绝 H0
5 - 31
统计学
1. 假设检验的P-值
(P-Value)
——P值(P-value)是一种概率。 —— 在原假设为真的假定前提下,出现观 察到的样本以及更极端样本的概率。 ——拒绝原假设的最小显著性水平; —— 观察到的显著性水平(实测的显著性 水平)。
5 - 32
统计学
( 续)
——P 值表示所观察到的样本对原假设 的支持程度。
相关文档
最新文档