应用统计学6-假设检验(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
比较样本数据 求出n,即n= n++ n在显著水平α下,根据 n值查符号检验表得其 临界值Sα(n) 判别显著性 ai>bi记为“+”,“+”的个数记为n+ ai<bi记为“-”,“-”的个数记为nai=bi记为“0”,“0”的个数记为n0
若S0=min{n+ , n-}<Sα(n),则拒绝 H0,认为f1(x)与f2(x) 有显著差异。 若S0=min{n+ , n-} > Sα(n), 则不 能拒绝H0,认为f1(x)与f2(x) 无显 著差异。
= −0.5251
由于 U > −1.645 , 所以在0.05的水平上不能拒绝原假设。
结论:没有证据表明乙厂工人参加技术培训的人数比例高于甲厂
第六章
假设检验
6.4 第二类错误概率 考虑左单边备择假设 H0:μ≥μ0 H1:μ<μ0
接受 接受 H0 H0 拒绝 拒绝 H0 H0
α
α µ0 β β
µ1
36
如果假定电池寿命的均值μ=112 小时,当μ=112 确实是真, 检验却接受了H0:μ≥120,此时犯第二类错误的概率有多大呢?
例题(续): 下图给出了当均值μ= 120和112 时, X 的抽样分布(标准差为2) 拒绝H0 接受H0
α=0.05
120 0.0091 β =? 112 116.71
第六章
假设检验
秩和检验法
秩和检验法的原理和符号检验法类似。 对于两个总体X1,X2,其概率密度为f1(x)和f2(x),从中 分别独立抽取样本观测值a1,a2,…,am;b1,b2,…bn。 如果f1(x)=f2(x)的假设成立,那么在将两个样本的观 测值混合排列的次序中,某个秩数对应的数是ai和bi的概 率应是相等的。
第六章
假设检验
秩和检验法
如果两个总体分布无显著差异,则T值不应太大或太小。 所谓太大或太小是比较而言,其比较值就是秩和检验表中的 下限T1和上限T2(在给定的显著水平α下) 若T1 < T < T2,则接受H0: f1(x)=f2(x),认为两总体分布无 显著差异。 若T > T2或T < T1,则拒绝假设H0而接受H1: f1(x)≠ f2(x), 认为两个总体分布有显著差异。
第六章
假设检验
秩和检验法
符号检验法的缺点:没有充分利用数据本身提 供的信息,而且必须在数据成对时使用。 如果两样本数据不成对,则可用秩和检验法。
第六章
假设检验
秩和检验法
秩和检验法的做法: 建立H0和H1;将两组数据依从小到大次序 (秩号)排列成表,如果有两个以上重复的数, 则取秩号平均数作为其秩。 取样本容量小的一组(样本容量相同时,取平 均数小的一组),其数据个数记为n1,则另一组数 据个数记为n2,将样本容量小的一组所对应的秩相 加称为该组的秩和(Sum of Ranks),记为T。
第六章
假设检验
秩和检验法 [例6.11]某药厂生产杀虫药品,检查两种配 方药品杀虫的效果(死亡百分数)如下: 甲配方效果样本 67 65 64 68 67 64 69 70 乙配方效果样本 63 62 64 64 65 68 70 71 69 问两种配方杀虫效果有无显著差异?
甲配方效果样本 67 65 64 68 67 64 69 70 乙配方效果样本 63 62 64 64 65 68 70 71 69
由于
n(1 − p0 ) = 7.5 > 5
p0 (1 − p0 ) n 0.9545 − 0.932 = 0.94 0.932 × (1 − 0.932) 110
p − p0 所以选择 = U =
查正态分布表得,临界值 u1−α / 2 = 1.96 由于 U < 1.96 , 所以在0.05的水平上不能拒绝原假设。
第六章
2
假设检验
(1) Biblioteka Baidu 拟合优度检验法
(4)根据已写出的F0(x)或f0(x),计算出总体X 在每个区间(ai-1 , ai)中的概率值pi。
pi = P{α i −1 < X < α i }
(5)构造统计量
χ2
( f i − np i ) 2 =∑ np i i =1
m
如果H0成立,对于大样本,上述统计量近似服从 自由度为m-r-1的χ2分布(其中r是分布函数概率密度 函数中观测值估计的参数个数)。
第六章
假设检验
6.6.1 两个总体分布差异的检验
实际问题中,经常要检验两种不同的处理方法效 果是否相同。 例如,比较在不同钻机、不同操作人员、不同地 质条件下,钻机效率是否相同等等。 诸如此类问题是对两个总体的分布是否相同的检 验。下面介绍两种简单易行的方法:“符号检验法” 和“秩和检验法”。
第六章
甲组的秩和 T=4.5+4.5+7.5+9.5+9.5+11.5+13.5+15.5 =76。
所以判定甲、乙两种配方的杀虫效果无显著差异。
查秩和检验表, α=0.05 ,n1=8,n2=9时, T1=54 <T=76<T2=90,
第六章
假设检验
6.6.2 总体分布的假设检验
χ 2 拟合优度检验法
正态概率纸 列联表的独立性检验
解:
H 0:f1 ( x) = f 2 ( x)H1:f1 ( x) ≠ f 2 ( x)
将数据按秩号排列,并将数据少的甲组数据用 深绿色填充区别乙组数据
秩号 数据 秩号 数据 11 62 9.5 10 67 22 3 4.5 63 64 11.5 11 11.5 12 68 68 4 4.5 5 4.5 6 4.5 7 7.5 64 64 64 65 13.5 13 13.5 14 15.5 15 15.5 16 69 69 70 70 8 7.5 9 9.5 65 67 17 17 71
当三者中有二者已知时,即 可计算得到第三者。 α、β 和n 之间 关系 对于给定的显著性水平α,增 大样本容量将会减少β 对于给定的样本容量,减小α 会使β 增大,相反增大α将会 使β 减小。
第六章
假设检验
6.6 非参数的假设检验
前两节的假设检验都是在已知总体的分布类型(如正 态分布)下进行的。 但是在许多问题中,总体不一定是属于正态分布,甚 至总体的分布未知。 为此,本节介绍统计上常用的不依赖于总体分布及其 参数知识的检验——非参数检验(Nonparametric Tests) 方法。
解: H0:“5种球的个数相等”, H1:“5种球的个数不等”。 由已知n=200,m=5,假定H0成立,则每次抽得第i 种球概率pi=1/5
种别 1 2 3 4 5 ∑ fi 35 40 43 38 44 200 npi 40 40 40 40 40 200 fi-npi -5 0 3 -2 4 0 (fi-npi)2/npi 0.625 0 0.225 0.1 0.4 1.35
第六章
假设检验
H0为真且μ=μ0时,X 的抽样分布
6.5 对总体均值进行假设检验时样本容量的确定
检验假设:H0:μ≥μ0 H1:μ<μ0 拒绝H0
α
H0为假且μ=μ1时, X 的抽样分布
μ0 β
μ1
c
第六章
假设检验
6.5 对总体均值进行假设检验时样本容量的确定
上图中上半部分为当H0为真并且μ=μ0时 ,
第六章
假设检验
6.3 总体比率的假设检验 6.3.1 单个总体比率的假设检验
如果样本容量n与原总体比率 p0 满足:np0 ≥ 5, n(1 − p0 ) ≥ 5 时,用u检验法。
【例6.8】某企业的备件库存标准有所调整。调整前的库 存周转率为0.932,今调查库存资料如下表(α=0.05)
H 0 : p = p0 , H 1 : p ≠ p0 建立假设:
X
的抽样分布。
c = µ 0 − µα
σ
n
X
上图中下半部分为当H0为假并且μ=μ1<μ0时 ,
的抽样分布。
c = µ1 + µ β
得:
σ
n
n=
( µα + µ β ) 2 σ 2 ( µ 0 − µ1 ) 2
第六章
假设检验
6.5 对总体均值进行假设检验时样本容量的确定
由上面得到的公式可得α、β和样本容量n 之间的关系:
结论:没有证据表明调整前后该企业的库存周转率有显著差异。
第六章
假设检验
6.3.2 两个总体比率的假设检验
比较两个总体比率有无显著差异时,如比较两种机车生 产产品的次品率有无显著差异,可取容量 n1、n2足够大, 使得
n1 p1 ≥ 5, n1 (1 − p1 ) ≥ 5; n 2 p 2 ≥ 5, n 2 (1 − p 2 ) ≥ 5;
(1) χ 拟合优度检验法
用 χ 2 检验法进行检验,具体步骤如下: (1)求出F0(x)或f0(x)中未知参数的估计值(一 般用最大似然估计值),从而写出F0(x)或f0(x)的具 体表达式。 (2)按第二章的分组方法,把样本值分成m个 区间(a0 , a1),(a1 , a2),…(ai-1 , ai),…,(am-1 , am)。 (3)求出样本观测值在每个区间(ai-1 , ai)内的频 数fi;
1 1 1 1 0.32(1 − 0.32) + ˆ (1 − p ˆ ) + p n n 60 40 2 1 查正态分布表得,临界值 − u1−α = −1.645
H1: p1- p2 < 0
z=
( p1 − p2 ) − ( p1 − p2 )
=
0.30 − 0.35 − 0
第六章
假设检验
符号检验法(Sign Tests)
令ai >bi 的事件为yi,
1, a i > bi yi = 0, a i < bi
于是y=y1+y2+...+ym服从二项分布
根据二项分布计算出了比较ai > bi或ai < bi 差异的临界值 Sα(n),见附表5。
第六章
假设检验
符号检验法步骤:
第六章
2
假设检验
(1) χ 拟合优度检验法
[例 6.12] 盒中有5种球,重复抽取200次(每次抽1个球), 各种球出现的次数见下表。问盒中5种球的个数是否 相等?(显著水平α=0.05)
种别 1 2 3 4 5 ∑ fi 35 40 43 38 44 200
第六章
2
假设检验
(1) χ 拟合优度检验法
第六章
2
假设检验
(1) χ 拟合优度检验法
已知总体分布函数F(x)的类型F0(x)或概率密度 f(x)的类型f0(x)以及总体X的随机样本X1,X2,…,Xn。 要检验 H0:F(x)=F0(x) H1:F(x)≠F0(x) 或 H0:f(x)=f0(x) H1:f(x)≠f0(x)
第六章
2
假设检验
【例6.10】某种品牌电池标明其使用寿命为120小时, 若已知总体的标准差σ =12小时,现选取36节电池组成 一个样本,显著性水平α=0.05。检验假设: H0:μ≥120 检验统计量 U =
σ
H1:μ<120
x−µ n
假设检验的拒绝规则:如果U<-1.645,则拒绝H0,
12 即当 x < 120 − 1.645 = 116.71 时,拒绝H0
第六章
2
假设检验
(1) χ 拟合优度检验法
2 χ (6)在给定显著水平α下查出 分布表中的
2 临界值 χα ( m − r − 1) 。
2 若χ 2 > χ α (m − r − 1) ,则拒绝原假设H0。
2 ( m − r − 1) ,则不能拒绝原假设H0。 若χ 2 < χ α
统计研究表明,实际检验中,样本容量并不需要非常 大。通常的规则为:如果对每一组的期望频数npi 至少为5, 则认为样本容量是足够大的,统计量近似χ2分布
假设检验
符号检验法(Sign Tests)
设两个总体X1和X2,它们的分布皆未知,以f1(x)和f2(x)分 别表示两总体的概率密度。
问题:检验 f1(x)= f2(x) 是否成立。 即 H0: f1(x)=f2(x) H1: f1(x)≠f2(x)
抽样:对两个总体分别独立地抽取m个元素,即得到m对数据: (a1 , b1),(a2,b2),…,(am,bm) 分析:如果 f1(x)=f2(x) 假设成立,那么ai > bi或ai < bi (i=1,2,…,m) 应该有相同的概率(1/2)。且样本ai > bi 与ai < bi 的个数差异不 应很大。
这样就可采用u 检验法。
【例6.9】对两个大型企业青年工人参加技术培训的情况进行 调查,调查结果如下:甲厂:调查60人,18人参加技术培训。 乙厂调查40人,14人参加技术培训。能否根据以上调查结果 认为乙厂工人参加技术培训的人数比例高于甲厂?(α=0.05) 建立假设: H0: p1- p2≥ 0 统计量
若S0=min{n+ , n-}<Sα(n),则拒绝 H0,认为f1(x)与f2(x) 有显著差异。 若S0=min{n+ , n-} > Sα(n), 则不 能拒绝H0,认为f1(x)与f2(x) 无显 著差异。
= −0.5251
由于 U > −1.645 , 所以在0.05的水平上不能拒绝原假设。
结论:没有证据表明乙厂工人参加技术培训的人数比例高于甲厂
第六章
假设检验
6.4 第二类错误概率 考虑左单边备择假设 H0:μ≥μ0 H1:μ<μ0
接受 接受 H0 H0 拒绝 拒绝 H0 H0
α
α µ0 β β
µ1
36
如果假定电池寿命的均值μ=112 小时,当μ=112 确实是真, 检验却接受了H0:μ≥120,此时犯第二类错误的概率有多大呢?
例题(续): 下图给出了当均值μ= 120和112 时, X 的抽样分布(标准差为2) 拒绝H0 接受H0
α=0.05
120 0.0091 β =? 112 116.71
第六章
假设检验
秩和检验法
秩和检验法的原理和符号检验法类似。 对于两个总体X1,X2,其概率密度为f1(x)和f2(x),从中 分别独立抽取样本观测值a1,a2,…,am;b1,b2,…bn。 如果f1(x)=f2(x)的假设成立,那么在将两个样本的观 测值混合排列的次序中,某个秩数对应的数是ai和bi的概 率应是相等的。
第六章
假设检验
秩和检验法
如果两个总体分布无显著差异,则T值不应太大或太小。 所谓太大或太小是比较而言,其比较值就是秩和检验表中的 下限T1和上限T2(在给定的显著水平α下) 若T1 < T < T2,则接受H0: f1(x)=f2(x),认为两总体分布无 显著差异。 若T > T2或T < T1,则拒绝假设H0而接受H1: f1(x)≠ f2(x), 认为两个总体分布有显著差异。
第六章
假设检验
秩和检验法
符号检验法的缺点:没有充分利用数据本身提 供的信息,而且必须在数据成对时使用。 如果两样本数据不成对,则可用秩和检验法。
第六章
假设检验
秩和检验法
秩和检验法的做法: 建立H0和H1;将两组数据依从小到大次序 (秩号)排列成表,如果有两个以上重复的数, 则取秩号平均数作为其秩。 取样本容量小的一组(样本容量相同时,取平 均数小的一组),其数据个数记为n1,则另一组数 据个数记为n2,将样本容量小的一组所对应的秩相 加称为该组的秩和(Sum of Ranks),记为T。
第六章
假设检验
秩和检验法 [例6.11]某药厂生产杀虫药品,检查两种配 方药品杀虫的效果(死亡百分数)如下: 甲配方效果样本 67 65 64 68 67 64 69 70 乙配方效果样本 63 62 64 64 65 68 70 71 69 问两种配方杀虫效果有无显著差异?
甲配方效果样本 67 65 64 68 67 64 69 70 乙配方效果样本 63 62 64 64 65 68 70 71 69
由于
n(1 − p0 ) = 7.5 > 5
p0 (1 − p0 ) n 0.9545 − 0.932 = 0.94 0.932 × (1 − 0.932) 110
p − p0 所以选择 = U =
查正态分布表得,临界值 u1−α / 2 = 1.96 由于 U < 1.96 , 所以在0.05的水平上不能拒绝原假设。
第六章
2
假设检验
(1) Biblioteka Baidu 拟合优度检验法
(4)根据已写出的F0(x)或f0(x),计算出总体X 在每个区间(ai-1 , ai)中的概率值pi。
pi = P{α i −1 < X < α i }
(5)构造统计量
χ2
( f i − np i ) 2 =∑ np i i =1
m
如果H0成立,对于大样本,上述统计量近似服从 自由度为m-r-1的χ2分布(其中r是分布函数概率密度 函数中观测值估计的参数个数)。
第六章
假设检验
6.6.1 两个总体分布差异的检验
实际问题中,经常要检验两种不同的处理方法效 果是否相同。 例如,比较在不同钻机、不同操作人员、不同地 质条件下,钻机效率是否相同等等。 诸如此类问题是对两个总体的分布是否相同的检 验。下面介绍两种简单易行的方法:“符号检验法” 和“秩和检验法”。
第六章
甲组的秩和 T=4.5+4.5+7.5+9.5+9.5+11.5+13.5+15.5 =76。
所以判定甲、乙两种配方的杀虫效果无显著差异。
查秩和检验表, α=0.05 ,n1=8,n2=9时, T1=54 <T=76<T2=90,
第六章
假设检验
6.6.2 总体分布的假设检验
χ 2 拟合优度检验法
正态概率纸 列联表的独立性检验
解:
H 0:f1 ( x) = f 2 ( x)H1:f1 ( x) ≠ f 2 ( x)
将数据按秩号排列,并将数据少的甲组数据用 深绿色填充区别乙组数据
秩号 数据 秩号 数据 11 62 9.5 10 67 22 3 4.5 63 64 11.5 11 11.5 12 68 68 4 4.5 5 4.5 6 4.5 7 7.5 64 64 64 65 13.5 13 13.5 14 15.5 15 15.5 16 69 69 70 70 8 7.5 9 9.5 65 67 17 17 71
当三者中有二者已知时,即 可计算得到第三者。 α、β 和n 之间 关系 对于给定的显著性水平α,增 大样本容量将会减少β 对于给定的样本容量,减小α 会使β 增大,相反增大α将会 使β 减小。
第六章
假设检验
6.6 非参数的假设检验
前两节的假设检验都是在已知总体的分布类型(如正 态分布)下进行的。 但是在许多问题中,总体不一定是属于正态分布,甚 至总体的分布未知。 为此,本节介绍统计上常用的不依赖于总体分布及其 参数知识的检验——非参数检验(Nonparametric Tests) 方法。
解: H0:“5种球的个数相等”, H1:“5种球的个数不等”。 由已知n=200,m=5,假定H0成立,则每次抽得第i 种球概率pi=1/5
种别 1 2 3 4 5 ∑ fi 35 40 43 38 44 200 npi 40 40 40 40 40 200 fi-npi -5 0 3 -2 4 0 (fi-npi)2/npi 0.625 0 0.225 0.1 0.4 1.35
第六章
假设检验
H0为真且μ=μ0时,X 的抽样分布
6.5 对总体均值进行假设检验时样本容量的确定
检验假设:H0:μ≥μ0 H1:μ<μ0 拒绝H0
α
H0为假且μ=μ1时, X 的抽样分布
μ0 β
μ1
c
第六章
假设检验
6.5 对总体均值进行假设检验时样本容量的确定
上图中上半部分为当H0为真并且μ=μ0时 ,
第六章
假设检验
6.3 总体比率的假设检验 6.3.1 单个总体比率的假设检验
如果样本容量n与原总体比率 p0 满足:np0 ≥ 5, n(1 − p0 ) ≥ 5 时,用u检验法。
【例6.8】某企业的备件库存标准有所调整。调整前的库 存周转率为0.932,今调查库存资料如下表(α=0.05)
H 0 : p = p0 , H 1 : p ≠ p0 建立假设:
X
的抽样分布。
c = µ 0 − µα
σ
n
X
上图中下半部分为当H0为假并且μ=μ1<μ0时 ,
的抽样分布。
c = µ1 + µ β
得:
σ
n
n=
( µα + µ β ) 2 σ 2 ( µ 0 − µ1 ) 2
第六章
假设检验
6.5 对总体均值进行假设检验时样本容量的确定
由上面得到的公式可得α、β和样本容量n 之间的关系:
结论:没有证据表明调整前后该企业的库存周转率有显著差异。
第六章
假设检验
6.3.2 两个总体比率的假设检验
比较两个总体比率有无显著差异时,如比较两种机车生 产产品的次品率有无显著差异,可取容量 n1、n2足够大, 使得
n1 p1 ≥ 5, n1 (1 − p1 ) ≥ 5; n 2 p 2 ≥ 5, n 2 (1 − p 2 ) ≥ 5;
(1) χ 拟合优度检验法
用 χ 2 检验法进行检验,具体步骤如下: (1)求出F0(x)或f0(x)中未知参数的估计值(一 般用最大似然估计值),从而写出F0(x)或f0(x)的具 体表达式。 (2)按第二章的分组方法,把样本值分成m个 区间(a0 , a1),(a1 , a2),…(ai-1 , ai),…,(am-1 , am)。 (3)求出样本观测值在每个区间(ai-1 , ai)内的频 数fi;
1 1 1 1 0.32(1 − 0.32) + ˆ (1 − p ˆ ) + p n n 60 40 2 1 查正态分布表得,临界值 − u1−α = −1.645
H1: p1- p2 < 0
z=
( p1 − p2 ) − ( p1 − p2 )
=
0.30 − 0.35 − 0
第六章
假设检验
符号检验法(Sign Tests)
令ai >bi 的事件为yi,
1, a i > bi yi = 0, a i < bi
于是y=y1+y2+...+ym服从二项分布
根据二项分布计算出了比较ai > bi或ai < bi 差异的临界值 Sα(n),见附表5。
第六章
假设检验
符号检验法步骤:
第六章
2
假设检验
(1) χ 拟合优度检验法
[例 6.12] 盒中有5种球,重复抽取200次(每次抽1个球), 各种球出现的次数见下表。问盒中5种球的个数是否 相等?(显著水平α=0.05)
种别 1 2 3 4 5 ∑ fi 35 40 43 38 44 200
第六章
2
假设检验
(1) χ 拟合优度检验法
第六章
2
假设检验
(1) χ 拟合优度检验法
已知总体分布函数F(x)的类型F0(x)或概率密度 f(x)的类型f0(x)以及总体X的随机样本X1,X2,…,Xn。 要检验 H0:F(x)=F0(x) H1:F(x)≠F0(x) 或 H0:f(x)=f0(x) H1:f(x)≠f0(x)
第六章
2
假设检验
【例6.10】某种品牌电池标明其使用寿命为120小时, 若已知总体的标准差σ =12小时,现选取36节电池组成 一个样本,显著性水平α=0.05。检验假设: H0:μ≥120 检验统计量 U =
σ
H1:μ<120
x−µ n
假设检验的拒绝规则:如果U<-1.645,则拒绝H0,
12 即当 x < 120 − 1.645 = 116.71 时,拒绝H0
第六章
2
假设检验
(1) χ 拟合优度检验法
2 χ (6)在给定显著水平α下查出 分布表中的
2 临界值 χα ( m − r − 1) 。
2 若χ 2 > χ α (m − r − 1) ,则拒绝原假设H0。
2 ( m − r − 1) ,则不能拒绝原假设H0。 若χ 2 < χ α
统计研究表明,实际检验中,样本容量并不需要非常 大。通常的规则为:如果对每一组的期望频数npi 至少为5, 则认为样本容量是足够大的,统计量近似χ2分布
假设检验
符号检验法(Sign Tests)
设两个总体X1和X2,它们的分布皆未知,以f1(x)和f2(x)分 别表示两总体的概率密度。
问题:检验 f1(x)= f2(x) 是否成立。 即 H0: f1(x)=f2(x) H1: f1(x)≠f2(x)
抽样:对两个总体分别独立地抽取m个元素,即得到m对数据: (a1 , b1),(a2,b2),…,(am,bm) 分析:如果 f1(x)=f2(x) 假设成立,那么ai > bi或ai < bi (i=1,2,…,m) 应该有相同的概率(1/2)。且样本ai > bi 与ai < bi 的个数差异不 应很大。
这样就可采用u 检验法。
【例6.9】对两个大型企业青年工人参加技术培训的情况进行 调查,调查结果如下:甲厂:调查60人,18人参加技术培训。 乙厂调查40人,14人参加技术培训。能否根据以上调查结果 认为乙厂工人参加技术培训的人数比例高于甲厂?(α=0.05) 建立假设: H0: p1- p2≥ 0 统计量