数理统计-第四章 假设检验-2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二个总体相等的检验 柯尔莫哥洛夫-斯米尔诺夫/符号检验法/秩和检验
法/游程检验法
1 分布拟合检验
设总体X的实际分布函数为F(x),它是未知的.
X 1 , X 2 ,, X n 为来自总体 X的样本.
根据这个样本来检验总体X的分布函数F(x) 是否等于某个给定的分布函数 F0(x),即检验假设
H 0 : F ( x) F0 ( x),
*
u / 2 u0.025 1.96,
统计量U的值为
u
| u | 15 1.96
2.58 2.64 0.04 / 100
15
=>拒绝假设 H 0 : 2.64,
接受假设 H 1 : 2.64
=>新工艺对电子元件的平均电阻有显著影响.
3.两个总体均值的假设检验
H 0 : 0 , H1 : 0
由中心极限定理知,当样本容量n充分大时,
X 0 U / n
近似地服从标准正态分布N(0,1)
由于样本方差 S
*2
2的无偏估计量, 为
=>可以用 S
*2
1 n 2 X i X n 1 i 1
2
近似代替 ,并且当 H 0 为真
性水平 α=0.05下, 判断新工艺对此元件的平均电
阻有无显著影响. 解 设该电器元件的电阻为X, 其均值为μ 检验假设 拒绝域为
H 0 : 2.64, H 1 : 2.64
x 2.64 u * u / 2 s / n
现在 n 100 , x 2.58, s 0.04, 0.05
4.4 非正态总体参数的假设检验 1.(0—1)分布参数的假设检验
设总体 X 服从参数为 p 的(0—1)分布, 即
PX x p (1 p)
x
1 x
, x 0, 1
设 X 1 , X 2 ,, X n 为 X 的样本, 检验假设
H 0 : p p0 , H 1 : p p0
解
设这两台机床加工的轴承的椭圆度分别为X,Y
且 1 E X , 2 E Y 检验假设
H 0 : 1 2 ,
H 1 : 1 2
由于题目给出的两个样本都是大样本,因此该假设 检验问题的拒绝域为
u s
现在 n1 200 ,
xy
*2 1
n1 s
*2 2
pi P( Ai ).
选取统计量
fi hi n pi i 1
k
2
来度量样本与H0中所假设的分布的吻合程度,hi是 给定的常数。
如果选取 hi n / pi , 则上述统计量变成
( f i npi ) fi n npi i 1 i 1 npi
例2 某农科站为了考察某种大麦穗长的分布情况, 在一块实验地里随机抽取了100个麦穗测量其长度, 得到数据如下(单位: cm) 6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 5.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
服从标准正态分布N(0,1). =>该假设检验问题的拒绝域为
u
x p0 u / 2 p0 (1 p0 ) / n
例1 某种产品在通常情况下次品率为5%. 现在从
生产出的一批产品中随机地抽取50件进行检验, 发
现有4件次品. 问能否认为这批产品的次品率为5%?
(α=0.05) 解 设这批产品的次品率为 p. 在这批产品中任 任意取一件产品,定义随机变量 X 如下
x y
*2 1
n1 s
*2 2
u / 2 n2
例3
两台机床加工同一中轴承,现在从他们加工 的轴承中分别随机地抽取200根和100根,测量其椭 圆度(单位:mm),经计算得
x 0.081,
y 0.062, s 0.025, s 2 0.062
* 1 *
能否认为这两台机床加工的轴承的平均椭圆度是相 同的(α=0.05)
2 (k r 1) 分布, 其中r是 X的分布函数 近似服从
F(x)包含的未知参数的个数. 若给定显著性水平α,则前述假设检验问题的拒绝域为
2 2 (k r 1)
2 检验法检验总体分布, 把样本数据进 注意:运用
行分类时, (1)大样本, 通常取 n 50
:
H1 : F ( x) F0 ( x)
注意: 若总体 X 为离散型的, 则 H 0 相当于 总体 X 的分布律为
P{ X xi } pi , i 1,2,
若总体 X 为连续型的, 则 H 0 相当于总体 X 的 概率密度为 f (x) .
(1)若 H 0 中 X 的分布函数 F (x) 不含未知参数.
k 2 k 2 2
定理1 (皮尔逊)当H0为真且n充分大时, 统计量
( f i npi ) fi n npi i 1 i 1 npi
k 2 k 2 2
近似服从 (k 1) 分布.
2
由定理1, 若给定显著性水平α,则前述假设检验问 题的拒绝域为
2 2 (k 1)
设总体 X 和 Y 相互独立,X 1 , X 2 , , X n1 是
X 的样本, Y1 , Y2 , , Yn2 是 Y 的样本. 记 n1 1 2 1 n1 * 2 X Xi, S1 (Xi X ) n1 i 1 n1 1 i 1 n2 n2 1 1 *2 2 Y Yi , S 2 (Yi Y ) n2 i 1 n2 1 i 1
Y R
Y rr
yyR
yyrr
总计
(黄圆)(黄皱) (绿圆)(绿皱)
315株 101株 108株 32株 556株
试问这些植株是否符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例 ( 0.05)
解
检验假设
H 0 : 这些植株符合 9 : 3 : 3 : 1 的理论比例.
H1 : 这些植株不符合 9 : 3 : 3 : 1 的理论比例.
ˆ (2)要求各组的理论频数 npi 5 或 npi 5
(3)一般数据分成7到14组. 有时为了保证各组
npi 5
组数可以少于7组
例1 孟德尔在著名的豌豆杂交实验中, 用结黄色 圆形种子与结绿色皱形种子的纯种豌豆作为亲本进 行杂交, 将子一代进行自交得到子二代共556株豌 豆, 发现其中有四种类型植株
f 3 108,
2
f 4 32, k 4,
计算得
( f i npi ) 0.47 . npi i 1
2 分布表得 由 α=0.05 ,自由度 k 1 4 1 3, 查
2 0.05
(3) 7.815
2 2 0.05 (3)
=>在α=0.05下接受 H 0 =>这些植株是符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例
由 9 : 3 : 3 : 1 的理论比例可知
9 p1 , 16
由n=556,得
3 p2 , 16
3 p3 , 16
1 p4 16
np1 312 .75, np2 104 .25
np3 104 .25, np4 34.75
百度文库
而 f1 315,
f 2 101,
k 2
且样本容量n充分大时,统计量
X 0 U * S / n
仍近似地服从标准正态分布N(0,1)
=>该假设检验问题的拒绝域为
x 0 u * u / 2 s / n
例2 某电器元件的平均电阻一直保持在2.64Ω. 改
变加工工艺后, 测得100个元件的电阻, 计算得平
均电阻为 2.58 Ω, 样本标准差为0.04 Ω. 在显著
近似地服从标准正态分布 ,从而当原假设 H 0 成立时,统计量
U S
X Y
*2 1
n1 S
*2 2
n2
仍近似地服从标准正态分布. =>当 H 0 成立且 n1 , n2 都充分大时,
统计量U的值应该在零附近摆动,
当 u 过大时就认为 H 0 不成立.
=>该假设检验问题的拒绝域为
u s
记 为 X 的所有可能取值的全体,将 分为k个
两两互不相交的子集
A1 , A2 ,, Ak
以 f i (i 1,2,, k ) 表示样本观察值 x1 , x 2 ,, x n
中落入 Ai 的个数,
=> 在n次试验中,事件 Ai发生的频率为 fi /n
另一方面,当H0为真时, 可以根据H0所假设的 X 的分 布函数来计算
2 k ˆ i )2 ( f i np fi 2 n ˆ ˆ npi i 1 i 1 np i k
定理2 (皮尔逊)当 H 0 为真且 n 充分大时, 统计量
ˆ ( f i npi ) fi n ˆ ˆ npi i 1 i 1 np i
k 2 k 2 2
近似地服从标准正态分布.由于样本方差 S
*2 1和
S
*2 2 分别为
2 12 和 2 的无偏估计量,因此 可以
分别用 S
*2 1
和S
*2 2
近似代替
2 1 和
,并且当
2 2
n1 和 n 2 都充分大时, X Y 1 2 U 2 2 1 n1 2 n2
u / 2 n2
u / 2 u0.025 1.96
n2 100 ,
u s
xy
*2 1
n1 s
*2 2
3.5849 1.96 n2
=>拒绝原假设 H 0 ,
即认为这两台机床加工的
轴承的平均椭圆度是不相同的.
4.5 非参数假设检验
一个总体的检验
分布的卡方拟合检验/柯尔莫哥洛夫拟合检验
1 n E( X ) E( X i ) p 由于 n i 1 1 n 1 D( X ) 2 D( X i ) p(1 p) n n i 1 因此由中心极限定理可知, 当 H 0 成立且样本容量 X p0 近似地 n充分大时,统计量 U p0 (1 p0 ) / n
1, 该产品为次品, X . 0, 该产品为合格品
X ~ b(1, p)
检验假设
H 0 : p 0.05, H1 : p 0.05
该假设检验问题的拒绝域为
x 0.05 u u / 2 0.05(1 0.05) / n 4 0.08, u / 2 u0.025 1.96 现在 n 50, x 50
统计量U的值为
0.08 0.05 u 0.0306 0.051 0.05 / 50
| u | 0.0306 1.96
=>接受假设 H 0
=>可以认为这批产品的次品率为5%
2.总体均值的假设检验
假设总体X 的均值为μ, 方差为
2
X 1 , X 2 ,, X n 为 X 的样本,检验假设
1 ,方差为 12 设总体 X的均值为
2 总体 Y的均值为 2 ,方差为 2
求假设检验问题
H 0 : 1 2 ,
H 1 : 1 2
的拒绝域. 由中心极限定理知,当样本容量 n1 和
n 2 都充分大时, X Y 1 2 U 2 12 n1 2 n2
(2)若H0中X 的的分布函数含有未知参数.
此时, 首先在假设下利用样本求出未知参数的最大 似然估计, 以估计值作为参数值, 然后再根据 H0中 所假设的 X 的分布函数 F(x)求出 pi的估计值
ˆ ˆ pi P ( Ai ) k k ( f i npi ) 2 fi2 2 n 并在 npi i 1 i 1 npi ˆ 中以 p i 代替 p i , 得到统计量
法/游程检验法
1 分布拟合检验
设总体X的实际分布函数为F(x),它是未知的.
X 1 , X 2 ,, X n 为来自总体 X的样本.
根据这个样本来检验总体X的分布函数F(x) 是否等于某个给定的分布函数 F0(x),即检验假设
H 0 : F ( x) F0 ( x),
*
u / 2 u0.025 1.96,
统计量U的值为
u
| u | 15 1.96
2.58 2.64 0.04 / 100
15
=>拒绝假设 H 0 : 2.64,
接受假设 H 1 : 2.64
=>新工艺对电子元件的平均电阻有显著影响.
3.两个总体均值的假设检验
H 0 : 0 , H1 : 0
由中心极限定理知,当样本容量n充分大时,
X 0 U / n
近似地服从标准正态分布N(0,1)
由于样本方差 S
*2
2的无偏估计量, 为
=>可以用 S
*2
1 n 2 X i X n 1 i 1
2
近似代替 ,并且当 H 0 为真
性水平 α=0.05下, 判断新工艺对此元件的平均电
阻有无显著影响. 解 设该电器元件的电阻为X, 其均值为μ 检验假设 拒绝域为
H 0 : 2.64, H 1 : 2.64
x 2.64 u * u / 2 s / n
现在 n 100 , x 2.58, s 0.04, 0.05
4.4 非正态总体参数的假设检验 1.(0—1)分布参数的假设检验
设总体 X 服从参数为 p 的(0—1)分布, 即
PX x p (1 p)
x
1 x
, x 0, 1
设 X 1 , X 2 ,, X n 为 X 的样本, 检验假设
H 0 : p p0 , H 1 : p p0
解
设这两台机床加工的轴承的椭圆度分别为X,Y
且 1 E X , 2 E Y 检验假设
H 0 : 1 2 ,
H 1 : 1 2
由于题目给出的两个样本都是大样本,因此该假设 检验问题的拒绝域为
u s
现在 n1 200 ,
xy
*2 1
n1 s
*2 2
pi P( Ai ).
选取统计量
fi hi n pi i 1
k
2
来度量样本与H0中所假设的分布的吻合程度,hi是 给定的常数。
如果选取 hi n / pi , 则上述统计量变成
( f i npi ) fi n npi i 1 i 1 npi
例2 某农科站为了考察某种大麦穗长的分布情况, 在一块实验地里随机抽取了100个麦穗测量其长度, 得到数据如下(单位: cm) 6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 5.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
服从标准正态分布N(0,1). =>该假设检验问题的拒绝域为
u
x p0 u / 2 p0 (1 p0 ) / n
例1 某种产品在通常情况下次品率为5%. 现在从
生产出的一批产品中随机地抽取50件进行检验, 发
现有4件次品. 问能否认为这批产品的次品率为5%?
(α=0.05) 解 设这批产品的次品率为 p. 在这批产品中任 任意取一件产品,定义随机变量 X 如下
x y
*2 1
n1 s
*2 2
u / 2 n2
例3
两台机床加工同一中轴承,现在从他们加工 的轴承中分别随机地抽取200根和100根,测量其椭 圆度(单位:mm),经计算得
x 0.081,
y 0.062, s 0.025, s 2 0.062
* 1 *
能否认为这两台机床加工的轴承的平均椭圆度是相 同的(α=0.05)
2 (k r 1) 分布, 其中r是 X的分布函数 近似服从
F(x)包含的未知参数的个数. 若给定显著性水平α,则前述假设检验问题的拒绝域为
2 2 (k r 1)
2 检验法检验总体分布, 把样本数据进 注意:运用
行分类时, (1)大样本, 通常取 n 50
:
H1 : F ( x) F0 ( x)
注意: 若总体 X 为离散型的, 则 H 0 相当于 总体 X 的分布律为
P{ X xi } pi , i 1,2,
若总体 X 为连续型的, 则 H 0 相当于总体 X 的 概率密度为 f (x) .
(1)若 H 0 中 X 的分布函数 F (x) 不含未知参数.
k 2 k 2 2
定理1 (皮尔逊)当H0为真且n充分大时, 统计量
( f i npi ) fi n npi i 1 i 1 npi
k 2 k 2 2
近似服从 (k 1) 分布.
2
由定理1, 若给定显著性水平α,则前述假设检验问 题的拒绝域为
2 2 (k 1)
设总体 X 和 Y 相互独立,X 1 , X 2 , , X n1 是
X 的样本, Y1 , Y2 , , Yn2 是 Y 的样本. 记 n1 1 2 1 n1 * 2 X Xi, S1 (Xi X ) n1 i 1 n1 1 i 1 n2 n2 1 1 *2 2 Y Yi , S 2 (Yi Y ) n2 i 1 n2 1 i 1
Y R
Y rr
yyR
yyrr
总计
(黄圆)(黄皱) (绿圆)(绿皱)
315株 101株 108株 32株 556株
试问这些植株是否符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例 ( 0.05)
解
检验假设
H 0 : 这些植株符合 9 : 3 : 3 : 1 的理论比例.
H1 : 这些植株不符合 9 : 3 : 3 : 1 的理论比例.
ˆ (2)要求各组的理论频数 npi 5 或 npi 5
(3)一般数据分成7到14组. 有时为了保证各组
npi 5
组数可以少于7组
例1 孟德尔在著名的豌豆杂交实验中, 用结黄色 圆形种子与结绿色皱形种子的纯种豌豆作为亲本进 行杂交, 将子一代进行自交得到子二代共556株豌 豆, 发现其中有四种类型植株
f 3 108,
2
f 4 32, k 4,
计算得
( f i npi ) 0.47 . npi i 1
2 分布表得 由 α=0.05 ,自由度 k 1 4 1 3, 查
2 0.05
(3) 7.815
2 2 0.05 (3)
=>在α=0.05下接受 H 0 =>这些植株是符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例
由 9 : 3 : 3 : 1 的理论比例可知
9 p1 , 16
由n=556,得
3 p2 , 16
3 p3 , 16
1 p4 16
np1 312 .75, np2 104 .25
np3 104 .25, np4 34.75
百度文库
而 f1 315,
f 2 101,
k 2
且样本容量n充分大时,统计量
X 0 U * S / n
仍近似地服从标准正态分布N(0,1)
=>该假设检验问题的拒绝域为
x 0 u * u / 2 s / n
例2 某电器元件的平均电阻一直保持在2.64Ω. 改
变加工工艺后, 测得100个元件的电阻, 计算得平
均电阻为 2.58 Ω, 样本标准差为0.04 Ω. 在显著
近似地服从标准正态分布 ,从而当原假设 H 0 成立时,统计量
U S
X Y
*2 1
n1 S
*2 2
n2
仍近似地服从标准正态分布. =>当 H 0 成立且 n1 , n2 都充分大时,
统计量U的值应该在零附近摆动,
当 u 过大时就认为 H 0 不成立.
=>该假设检验问题的拒绝域为
u s
记 为 X 的所有可能取值的全体,将 分为k个
两两互不相交的子集
A1 , A2 ,, Ak
以 f i (i 1,2,, k ) 表示样本观察值 x1 , x 2 ,, x n
中落入 Ai 的个数,
=> 在n次试验中,事件 Ai发生的频率为 fi /n
另一方面,当H0为真时, 可以根据H0所假设的 X 的分 布函数来计算
2 k ˆ i )2 ( f i np fi 2 n ˆ ˆ npi i 1 i 1 np i k
定理2 (皮尔逊)当 H 0 为真且 n 充分大时, 统计量
ˆ ( f i npi ) fi n ˆ ˆ npi i 1 i 1 np i
k 2 k 2 2
近似地服从标准正态分布.由于样本方差 S
*2 1和
S
*2 2 分别为
2 12 和 2 的无偏估计量,因此 可以
分别用 S
*2 1
和S
*2 2
近似代替
2 1 和
,并且当
2 2
n1 和 n 2 都充分大时, X Y 1 2 U 2 2 1 n1 2 n2
u / 2 n2
u / 2 u0.025 1.96
n2 100 ,
u s
xy
*2 1
n1 s
*2 2
3.5849 1.96 n2
=>拒绝原假设 H 0 ,
即认为这两台机床加工的
轴承的平均椭圆度是不相同的.
4.5 非参数假设检验
一个总体的检验
分布的卡方拟合检验/柯尔莫哥洛夫拟合检验
1 n E( X ) E( X i ) p 由于 n i 1 1 n 1 D( X ) 2 D( X i ) p(1 p) n n i 1 因此由中心极限定理可知, 当 H 0 成立且样本容量 X p0 近似地 n充分大时,统计量 U p0 (1 p0 ) / n
1, 该产品为次品, X . 0, 该产品为合格品
X ~ b(1, p)
检验假设
H 0 : p 0.05, H1 : p 0.05
该假设检验问题的拒绝域为
x 0.05 u u / 2 0.05(1 0.05) / n 4 0.08, u / 2 u0.025 1.96 现在 n 50, x 50
统计量U的值为
0.08 0.05 u 0.0306 0.051 0.05 / 50
| u | 0.0306 1.96
=>接受假设 H 0
=>可以认为这批产品的次品率为5%
2.总体均值的假设检验
假设总体X 的均值为μ, 方差为
2
X 1 , X 2 ,, X n 为 X 的样本,检验假设
1 ,方差为 12 设总体 X的均值为
2 总体 Y的均值为 2 ,方差为 2
求假设检验问题
H 0 : 1 2 ,
H 1 : 1 2
的拒绝域. 由中心极限定理知,当样本容量 n1 和
n 2 都充分大时, X Y 1 2 U 2 12 n1 2 n2
(2)若H0中X 的的分布函数含有未知参数.
此时, 首先在假设下利用样本求出未知参数的最大 似然估计, 以估计值作为参数值, 然后再根据 H0中 所假设的 X 的分布函数 F(x)求出 pi的估计值
ˆ ˆ pi P ( Ai ) k k ( f i npi ) 2 fi2 2 n 并在 npi i 1 i 1 npi ˆ 中以 p i 代替 p i , 得到统计量