应用数理统计2
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 假设检验 内容提要 §1 假设检验的基本概念 §2 单个正态总体均值与方差的检验 §3 两个正态总体均值与方差的检验 §4 分布拟合检验 §5 两总体相等性检验
§1 假设检验的基本概念
§ 1 假设检验的基本概念
一、假设检验的任务与基本原理 1、分类及基本任务
参数检验:在总体分布类型已知的的前提下对总体参
2 1 2 2
§4 分布拟合检验
判断总体是否为某种分布(如正态分布)的检验问 题,通称为分布的拟合优度检验,简称为分布拟合
检验。
一、分布拟合检验的一般方法 χ2分布拟合检验;K-S 拟合检验
(一)χ2分布拟合检验法
1、理论基础 (1) 多项分布: 假设n 次独立试验中,每次试验有k 种结果。每次出 现第i 种结果的概率是pi (i=1,…,k),∑pi=1。记n 次试 验中出现第i 种结果的次数是Ni(Ni是随机变量,但满 足∑Ni=n),则有 n! n pN 1 n1 , , N k nk p1n1 pk k n1 ! nk ! 则称 (N1,…,Nk) 的分布为多项分布,记为 M(n;p1,…,pk)
1
0.057
2
0.123
3
0.178
4
0.193
5
0.167
6
0.124
7
0.071
8
0.040
≥9
0.034
1.3 0
5.7 7
12.3 17.8 19.3 16.7 12 18 17 20
12.1 13
7.4 6
4.0 3
3.4 4
3、连续型分布的拟合检验
基本思想:为了检验随机变量X是否服从连续型分 布F0(x),可将X的取值范围分割为若干个区间,并在 每个区间上算出相应的理论概率pi0。通过这样的处理 ,就把连续型问题转化为离散型问题了。 具体步骤: 1)分组: 将F0(x)的自变量划分成k(5≤k≤16)组 (b0, b1], (b1, b2], …,(bk-1, bk).
n np
i i0
2
npi0
则当n→∞时,χ2服从χ2(k-1) 分布。
2、离散型随机变量的分布拟合检验
基本思想:通过分组,将总体分布看成多项分布。 基本步骤: (1) 分组:将X的值域分成互不相交的k 组:I1,…,Ik,记
P{ x∈Ii}=pi, i=1,…,k .
(2) 给出检验假设: H0: pi=pi0 (i=1,…,k), H1: pi≠pi0 至少 对某个i 成立。
§3 两个正态总体均值与方差的检验
例3.3 (P95)某实验室采集到12块岩石样品,用两台 光谱仪分别测得岩石内含镉量如下(单位‰):
样品号: 1 2 3 4 5 6 7 8 9 10 11 12 甲仪器:3.1 0.6 8.4 2.5 4.1 3.7 3.1 2.8 3.2 4.4 4.6 2.9 乙仪器:3.0 0.7 8.0 2.2 3.9 3.5 3.0 2.6 3.1 4.4 4.6 2.6
例4.3 测量了100 根人造纤维的长度(毫米),所得 的数据如下表:
长度 5.5~6.0 ~6.5 ~7.0 ~7.5 ~8.0 ~8.5 ~9.0 ~9.5
频数 2 7 6 17 17 14 16 10
~10 ~10.5 ~11
7 3 1
问:能认为人造纤维的长度服从正态分布吗?
组号
1 2 3 4 5 6 7 8 9 10 11
,
单侧检验 对立假设 H1 : a a0 ,拒绝域形式为:
u1 ,
§2 单个正态总体均值与方差的检验
(b) σ2未知, 关于a 的检验 —— t 检验
在H0: a=a0成立时, 检验统计量 T x a0 ~ t n 1
s/ n
例1 用某种仪器间接测量硬度,重复测量5次,所得
数及有关性质进行判断。
非参数检验:总体分布的类型部分或全部未知,检验
的目的是作出一般性的推断,如分布的类型,两变量
是否独立,分布是否相同等。
§1 假设检验的基本概念
例1 某车间用一台包装机包装葡萄糖,包得的袋装糖
重是一个随机变量,服从正态分布(σ=2 (克))。 当机器正常时,其均值为500克。在装好的葡萄糖中 任取一袋,测得糖重为508克,问包装量的均值是500 克吗?若测得的糖重是498克,能否认为包装量的均
X Y
12
n1
Βιβλιοθήκη Baidu
2 2
~ N 0,1
n2
§3 两个正态总体均值与方差的检验
(b) σ12 =σ22 =σ2, 但σ2未知时两个总体的均值检验 — — t 检验 检验假设: H0 : a1= a2, H1 : a1≠a2
检验统计量:
T X Y n1n2 n1 n2 2 ~ t n1 n2 2 n1 n2
§1 假设检验的基本概念
例3 自动车床加工中轴,从成品中抽出11根,测量
它们的直径(毫米)数据如下:
10.52, 10.41, 10.32, 10.18, 10.64, 10.77, 10.82, 10.67,
10.59, 10.38, 10.49,
问这批零件的直径是否服从正态分布。
§1 假设检验的基本概念
值是500克?
§1 假设检验的基本概念
例2
某工厂生产的固体燃料推进器的燃烧率服从正
态分布N(μ,σ2), μ=40cm/s,σ=2cm/s. 现在用新方法生产
了一批推进器. 从中随机地取n=25只, 测得燃烧率的样
./s x 41.25cm 设在新方法下总体均方差 仍为2cm/s, 问这批推进器的燃烧率是否较以往生产的 本均值为 推进器的燃烧率有显著的提高?(取显著性水平α= 0.05)
的概率仅为0.0027,所以否定H0
§1 假设检验的基本概念
处理参数的假设检验问题的步骤如下:
1o 根据实际问题, 提出原假设H0及备择假设H1; 如: H0 :a=500; H1 :a≠500. 2o 在H0成立的条件下,确定检验统计量; 如:H0成立时: U X 500 ~ N 0,1 3o 给定显著性水平α,并由此及给定的统计量确定拒 绝域。
02 (2) 当均值a 未知时,检验统计量
2
(n 1)s 2
2
X
i 1
n
i
a
2
~ 2 n
0
2
~ 2 n 1
§2 两个正态总体均值与方差的检验
例2.4 某生产车间生产的金属丝,质量较为稳定,
折断力方差为64。今从一批产品中抽10根作折断力
试验,结果(Kg)为:
578,572,570,568,572,570,572,596,584,570,
问是否可以认为这批金属丝的折断力方差仍是64 (α=0.05)?
§3 两个正态总体均值与方差的检验
设X~N(a1,σ12), Y~N(a2,σ22),来自两个总体的样本分 别为:(X1,…,Xn1), (Y1,…,Xn2). (a) 方差已知时两个正态总体的均值检验 —— u 检验 检验假设: H0 : a1= a2, H1 : a1≠a2 检验统计量: U
(3) 构造检验统计量:ni 表示落入Ii 内的观测值的个数,
记
2 i 1
k
n np
i i0
2
npi0
(4) 进行χ2检验:取右侧拒绝域W.
分组的原则: npi0≥5 注:如果分布检验中,有r 个待估参数,则可将这 r 个 参数用极大似然法估出后,再计算 pi0,此时χ2分布的 自由度应相应改成 k-r-1 .
2)求各组上的理论概率pi0及理论频数npi0:
pi0=P{bi-1<X≤bi}=F0(bi)-F0(bi-1)
3)计算统计量:
2 i 1
k
n np
i i0
2
npi0
4)判断:若 2 12 k 1 ,则拒绝H0:F(x)=F0(x). 注:若F0(x)中有r个待估参数,则首先估计参数。 最后判断时,统计量的自由度降低r。
pi0
0.0294 0.0454 0.0886 0.1346 0.1700 0.1762 0.1524 0.1030 0.0594 0.0166 0.0143
npi0
2.94 4.54 8.86 13.46 17.00 17.62 15.24 10.30 5.94 1.66 1.43
例4.2 某电话交换台,在100分钟内记录了每分钟被呼
叫次数xi , 整理后结果如下 (ni 是出现xi 值的次数) xi ni 0 0 1 7 2 3 4 5 6 12 18 17 30 13 7 6 8 3 9 4
问:是否可以认为X 服从 Poisson 分布? xi
pi0 npi0 ni
0
0.013
2、假设检验的基本原理
假设检验是一种带有概率性质的反证法,其依据是:
小概率事件在一次观测中不会出现。以例1为例。
假设H0: a=500,即假设X~N(500, 22 )。注意到:
pa 3 X a 3 0.9973
即X落入区间(494, 506) 的概率是0.9973,落入区间外
n1 1S12 n2 1S22
§3 两个正态总体均值与方差的检验
例3.2(P95) 设有甲乙两种砌块,形状相同。但乙 砌块比甲砌块制作简单,造价低。经过试验得抗压强 度 (kg/cm2)为:
甲:88,87,92,90,91;
乙:89,89,90,84,88,
试问能用乙种砌块代替甲种砌块吗(α=0.05)?
问两台仪器是否有显著差别(α=0.05)?
§3 两个正态总体均值与方差的检验
(c) 两个总体的方差检验—— F检验法 检验假设: H0 : σ12 =σ22, H1 : σ12 ≠σ22 (1) a1 , a2未知,在H0 成立的条件下,检验统计量
S F ~ F n1 1, n2 1 S (2) a1 , a2已知,在H0 成立的条件下,检验统计量 2 1 n1 i 1 X i a1 n1 F ~ F n1 , n2 2 1 n2 i 1 Yi a2 n2
bi
6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10 10.5 +∞
ui
-1.89 -1.44 -0.98 -0.53 -0.08 0.37 0.83 1.28 1.74 2.19 +∞
F0(bi)
0.0294 0.0749 0.1635 0.2981 0.4681 0.6443 0.7967 0.8997 0.9591 0.9857 1
例:假设一罐中有白球(1/2)、红球(1/3)和蓝球(
1/6)。从中有放回地抽取7次,问恰好抽中3次白球、 两次红球、两次蓝球的概率有多大? (2) Pearson 定理:设在多项分布中pi=pi0 (i=1,…,k)。记 n 次试验中出现各种结果的次数分别是ni,∑ni=n。令
k
2 i 1
评价一个检验法优劣的标准:固定α,使β达到最小。
§2 单个正态总体均值与方差的检验
(a) σ2已知, 关于a 的检验 —— u检验
在H0: a=a0成立时,统计量
U
X a0
n ~ N 0,1
双侧检验 对立假设 H1 : a a0 ,拒绝域形式为:
,u
1 2
u
1 2
2
§1 假设检验的基本概念
如:若H0不成立,则U的绝对值有增大的趋势。当增 大到一定程度时,就应拒绝H0。 令α=0.05, 注意到 p U u 1 2 查分位数表,得 u u0.975 1.96 由此得拒绝域
即 4o
W X 496.08 X 503.92
取样,根据样本观察值确定接受还是拒绝H0 .
W | U 1.96 U
2
1
§1 假设检验的基本概念
二、错误类型及概率 第一类错误(拒真):H0成立,样本值落入W内。 第一类错误概率为: pT W | H 0 成立 第二类错误(纳伪): H1成立,样本值落入接受域中。
第二类错误概率为: pT W | H1 成立
数据是:
175,173,178,174,176 。
而用别的精确方法直接测量硬度为179,问此仪器的 间接测量是否有系统误差?(α=0.05)
§2 单个正态总体均值与方差的检验
(c) 单个正态总体的方差检验 —— χ2检验
检验假设: H0 : σ2 =σ02, H1 : σ2 ≠σ02 (1) 当均值a 已知时,检验统计量
§1 假设检验的基本概念
§ 1 假设检验的基本概念
一、假设检验的任务与基本原理 1、分类及基本任务
参数检验:在总体分布类型已知的的前提下对总体参
2 1 2 2
§4 分布拟合检验
判断总体是否为某种分布(如正态分布)的检验问 题,通称为分布的拟合优度检验,简称为分布拟合
检验。
一、分布拟合检验的一般方法 χ2分布拟合检验;K-S 拟合检验
(一)χ2分布拟合检验法
1、理论基础 (1) 多项分布: 假设n 次独立试验中,每次试验有k 种结果。每次出 现第i 种结果的概率是pi (i=1,…,k),∑pi=1。记n 次试 验中出现第i 种结果的次数是Ni(Ni是随机变量,但满 足∑Ni=n),则有 n! n pN 1 n1 , , N k nk p1n1 pk k n1 ! nk ! 则称 (N1,…,Nk) 的分布为多项分布,记为 M(n;p1,…,pk)
1
0.057
2
0.123
3
0.178
4
0.193
5
0.167
6
0.124
7
0.071
8
0.040
≥9
0.034
1.3 0
5.7 7
12.3 17.8 19.3 16.7 12 18 17 20
12.1 13
7.4 6
4.0 3
3.4 4
3、连续型分布的拟合检验
基本思想:为了检验随机变量X是否服从连续型分 布F0(x),可将X的取值范围分割为若干个区间,并在 每个区间上算出相应的理论概率pi0。通过这样的处理 ,就把连续型问题转化为离散型问题了。 具体步骤: 1)分组: 将F0(x)的自变量划分成k(5≤k≤16)组 (b0, b1], (b1, b2], …,(bk-1, bk).
n np
i i0
2
npi0
则当n→∞时,χ2服从χ2(k-1) 分布。
2、离散型随机变量的分布拟合检验
基本思想:通过分组,将总体分布看成多项分布。 基本步骤: (1) 分组:将X的值域分成互不相交的k 组:I1,…,Ik,记
P{ x∈Ii}=pi, i=1,…,k .
(2) 给出检验假设: H0: pi=pi0 (i=1,…,k), H1: pi≠pi0 至少 对某个i 成立。
§3 两个正态总体均值与方差的检验
例3.3 (P95)某实验室采集到12块岩石样品,用两台 光谱仪分别测得岩石内含镉量如下(单位‰):
样品号: 1 2 3 4 5 6 7 8 9 10 11 12 甲仪器:3.1 0.6 8.4 2.5 4.1 3.7 3.1 2.8 3.2 4.4 4.6 2.9 乙仪器:3.0 0.7 8.0 2.2 3.9 3.5 3.0 2.6 3.1 4.4 4.6 2.6
例4.3 测量了100 根人造纤维的长度(毫米),所得 的数据如下表:
长度 5.5~6.0 ~6.5 ~7.0 ~7.5 ~8.0 ~8.5 ~9.0 ~9.5
频数 2 7 6 17 17 14 16 10
~10 ~10.5 ~11
7 3 1
问:能认为人造纤维的长度服从正态分布吗?
组号
1 2 3 4 5 6 7 8 9 10 11
,
单侧检验 对立假设 H1 : a a0 ,拒绝域形式为:
u1 ,
§2 单个正态总体均值与方差的检验
(b) σ2未知, 关于a 的检验 —— t 检验
在H0: a=a0成立时, 检验统计量 T x a0 ~ t n 1
s/ n
例1 用某种仪器间接测量硬度,重复测量5次,所得
数及有关性质进行判断。
非参数检验:总体分布的类型部分或全部未知,检验
的目的是作出一般性的推断,如分布的类型,两变量
是否独立,分布是否相同等。
§1 假设检验的基本概念
例1 某车间用一台包装机包装葡萄糖,包得的袋装糖
重是一个随机变量,服从正态分布(σ=2 (克))。 当机器正常时,其均值为500克。在装好的葡萄糖中 任取一袋,测得糖重为508克,问包装量的均值是500 克吗?若测得的糖重是498克,能否认为包装量的均
X Y
12
n1
Βιβλιοθήκη Baidu
2 2
~ N 0,1
n2
§3 两个正态总体均值与方差的检验
(b) σ12 =σ22 =σ2, 但σ2未知时两个总体的均值检验 — — t 检验 检验假设: H0 : a1= a2, H1 : a1≠a2
检验统计量:
T X Y n1n2 n1 n2 2 ~ t n1 n2 2 n1 n2
§1 假设检验的基本概念
例3 自动车床加工中轴,从成品中抽出11根,测量
它们的直径(毫米)数据如下:
10.52, 10.41, 10.32, 10.18, 10.64, 10.77, 10.82, 10.67,
10.59, 10.38, 10.49,
问这批零件的直径是否服从正态分布。
§1 假设检验的基本概念
值是500克?
§1 假设检验的基本概念
例2
某工厂生产的固体燃料推进器的燃烧率服从正
态分布N(μ,σ2), μ=40cm/s,σ=2cm/s. 现在用新方法生产
了一批推进器. 从中随机地取n=25只, 测得燃烧率的样
./s x 41.25cm 设在新方法下总体均方差 仍为2cm/s, 问这批推进器的燃烧率是否较以往生产的 本均值为 推进器的燃烧率有显著的提高?(取显著性水平α= 0.05)
的概率仅为0.0027,所以否定H0
§1 假设检验的基本概念
处理参数的假设检验问题的步骤如下:
1o 根据实际问题, 提出原假设H0及备择假设H1; 如: H0 :a=500; H1 :a≠500. 2o 在H0成立的条件下,确定检验统计量; 如:H0成立时: U X 500 ~ N 0,1 3o 给定显著性水平α,并由此及给定的统计量确定拒 绝域。
02 (2) 当均值a 未知时,检验统计量
2
(n 1)s 2
2
X
i 1
n
i
a
2
~ 2 n
0
2
~ 2 n 1
§2 两个正态总体均值与方差的检验
例2.4 某生产车间生产的金属丝,质量较为稳定,
折断力方差为64。今从一批产品中抽10根作折断力
试验,结果(Kg)为:
578,572,570,568,572,570,572,596,584,570,
问是否可以认为这批金属丝的折断力方差仍是64 (α=0.05)?
§3 两个正态总体均值与方差的检验
设X~N(a1,σ12), Y~N(a2,σ22),来自两个总体的样本分 别为:(X1,…,Xn1), (Y1,…,Xn2). (a) 方差已知时两个正态总体的均值检验 —— u 检验 检验假设: H0 : a1= a2, H1 : a1≠a2 检验统计量: U
(3) 构造检验统计量:ni 表示落入Ii 内的观测值的个数,
记
2 i 1
k
n np
i i0
2
npi0
(4) 进行χ2检验:取右侧拒绝域W.
分组的原则: npi0≥5 注:如果分布检验中,有r 个待估参数,则可将这 r 个 参数用极大似然法估出后,再计算 pi0,此时χ2分布的 自由度应相应改成 k-r-1 .
2)求各组上的理论概率pi0及理论频数npi0:
pi0=P{bi-1<X≤bi}=F0(bi)-F0(bi-1)
3)计算统计量:
2 i 1
k
n np
i i0
2
npi0
4)判断:若 2 12 k 1 ,则拒绝H0:F(x)=F0(x). 注:若F0(x)中有r个待估参数,则首先估计参数。 最后判断时,统计量的自由度降低r。
pi0
0.0294 0.0454 0.0886 0.1346 0.1700 0.1762 0.1524 0.1030 0.0594 0.0166 0.0143
npi0
2.94 4.54 8.86 13.46 17.00 17.62 15.24 10.30 5.94 1.66 1.43
例4.2 某电话交换台,在100分钟内记录了每分钟被呼
叫次数xi , 整理后结果如下 (ni 是出现xi 值的次数) xi ni 0 0 1 7 2 3 4 5 6 12 18 17 30 13 7 6 8 3 9 4
问:是否可以认为X 服从 Poisson 分布? xi
pi0 npi0 ni
0
0.013
2、假设检验的基本原理
假设检验是一种带有概率性质的反证法,其依据是:
小概率事件在一次观测中不会出现。以例1为例。
假设H0: a=500,即假设X~N(500, 22 )。注意到:
pa 3 X a 3 0.9973
即X落入区间(494, 506) 的概率是0.9973,落入区间外
n1 1S12 n2 1S22
§3 两个正态总体均值与方差的检验
例3.2(P95) 设有甲乙两种砌块,形状相同。但乙 砌块比甲砌块制作简单,造价低。经过试验得抗压强 度 (kg/cm2)为:
甲:88,87,92,90,91;
乙:89,89,90,84,88,
试问能用乙种砌块代替甲种砌块吗(α=0.05)?
问两台仪器是否有显著差别(α=0.05)?
§3 两个正态总体均值与方差的检验
(c) 两个总体的方差检验—— F检验法 检验假设: H0 : σ12 =σ22, H1 : σ12 ≠σ22 (1) a1 , a2未知,在H0 成立的条件下,检验统计量
S F ~ F n1 1, n2 1 S (2) a1 , a2已知,在H0 成立的条件下,检验统计量 2 1 n1 i 1 X i a1 n1 F ~ F n1 , n2 2 1 n2 i 1 Yi a2 n2
bi
6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 10 10.5 +∞
ui
-1.89 -1.44 -0.98 -0.53 -0.08 0.37 0.83 1.28 1.74 2.19 +∞
F0(bi)
0.0294 0.0749 0.1635 0.2981 0.4681 0.6443 0.7967 0.8997 0.9591 0.9857 1
例:假设一罐中有白球(1/2)、红球(1/3)和蓝球(
1/6)。从中有放回地抽取7次,问恰好抽中3次白球、 两次红球、两次蓝球的概率有多大? (2) Pearson 定理:设在多项分布中pi=pi0 (i=1,…,k)。记 n 次试验中出现各种结果的次数分别是ni,∑ni=n。令
k
2 i 1
评价一个检验法优劣的标准:固定α,使β达到最小。
§2 单个正态总体均值与方差的检验
(a) σ2已知, 关于a 的检验 —— u检验
在H0: a=a0成立时,统计量
U
X a0
n ~ N 0,1
双侧检验 对立假设 H1 : a a0 ,拒绝域形式为:
,u
1 2
u
1 2
2
§1 假设检验的基本概念
如:若H0不成立,则U的绝对值有增大的趋势。当增 大到一定程度时,就应拒绝H0。 令α=0.05, 注意到 p U u 1 2 查分位数表,得 u u0.975 1.96 由此得拒绝域
即 4o
W X 496.08 X 503.92
取样,根据样本观察值确定接受还是拒绝H0 .
W | U 1.96 U
2
1
§1 假设检验的基本概念
二、错误类型及概率 第一类错误(拒真):H0成立,样本值落入W内。 第一类错误概率为: pT W | H 0 成立 第二类错误(纳伪): H1成立,样本值落入接受域中。
第二类错误概率为: pT W | H1 成立
数据是:
175,173,178,174,176 。
而用别的精确方法直接测量硬度为179,问此仪器的 间接测量是否有系统误差?(α=0.05)
§2 单个正态总体均值与方差的检验
(c) 单个正态总体的方差检验 —— χ2检验
检验假设: H0 : σ2 =σ02, H1 : σ2 ≠σ02 (1) 当均值a 已知时,检验统计量