研究生数理统计课件第4章假设检验(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 设总体 X的均值为 1 ,方差为 1 2 总体 Y的均值为 2 ,方差为 2
下求假设检验问题 H0 : 1 2 , H1 : 1 2 的拒绝域. 由中心极限定理知,当样本容量 n1和n2都充分大时,
U X Y 1 2
n1 n2
由 9 : 3 : 3 : 1 的理论比例可知
9 p1 , 16
由n=556,得
3 p2 , 16
3 p3 , 16
1 p4 16
np1 312.75, np2 104.25
np3 104.25, np4 34.75
而 f1 315 ,
f 2 101 ,
2 k
由于
1 n E( X ) E( X i ) p n i 1
1 n 1 D( X ) D( X i ) p(1 p) n i 1 n
因此由中心极限定理可知, 当 H 0 成立且样本容量
n充分大时,统计量 U
X p0 近似地服从标准正态分布. p0 (1 p0 ) / n
=>该假设检验问题的拒绝域为
u
x p0 u / 2 p0 (1 p0 ) / n
例1 某种产品在通常情况下次品率为5%. 现在从生产出的一批产 品中随机地抽取50件进行检验, 发现有4件次品. 问能否认为这批 产品的次品率为5%?(α=0.05)
, 1, 该产品为次品 X . 0, 该产品为合格品
即检验假设:H0 : F ( x) F0 ( x), H1 : F ( x) F0 ( x)
:
总体 X 的分布律为 P{X xi } pi , i 1,2, 若总体 X 为连续型的, 则 H 0 相当于总体 X 的
注意: 若总体 X 为离散型的, 则 H 0 相当于
概率密度为 f (x) .
u s xy
*2 1
n2 100,
*2 2
u / 2 u0.025 1.96
=>拒绝原假设 H 0 ,
n2
/2
n1 s
n2
3.5849 1.96
即认为这两台机床加工的 轴承的平均椭圆度是不相同的.
4.5 非参数假设检验 1 分布拟合检验 设总体X的实际分布函数为F(x),它是未知的. X 1 , X 2 ,, X n 为来自总体 X的样本. 根据这个样本来检验总体X的分布函数F(x) 是否等于某个给定的分布函数 F0(x),
解 设这两台机床加工的轴承的椭圆度分别为X,Y 且 1 E X , 2 E Y 检验假设 H0 : 1 2 , H 1 : 1 2 由于题目给出的两个样本都是大样本,因此该假设检验 问题的拒绝域为 u xy u
s
*2 1
n1 s
*2 2
现在 n1 200,
例2 某农科站为了考察某种大麦穗长的分布情况, 在一块实验地里随机抽取了100个麦穗测量其长度, 得到数据如下(单位: cm) 6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 5.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
试检验大麦穗长是否服从正态分布?(α=0.05)
解 检验假设 H 0 : X的概率密度为 f ( x)
2
1 2
e
2
( x )2 2 2
n 把X可能取值的全体 [3.95, 7.55] 划分为
k =12个互不重叠的小区间:
, 是未知的, 所以应首先估计 , 2 , 的最大似然估计为 n 1 *2 2 2 ˆ ˆ x 5.921 , s 0.6034
4 u / 2 u0.025 0.08, 50 0.08 0.05 u 0.0306 0.051 0.05 / 50
1.96
| u | 0.0306 1.96 =>接受假设 H 0
=>可以认为这批产品的次品率为5%
2.总体均值的假设检验
2 X 1 , X 2 ,, X n 为 X 的样本, 设总体X 的均值为μ,方差为
Y R
Y rr
yyR
yyrr
总计
(黄圆)(黄皱) (绿圆)(绿皱)
315株 101株 108株 32株 556株
试问这些植株是否符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例 ( 0.05)
解
检验假设
H 0 : 这些植株符合 9 : 3 : 3 : 1 的理论比例.
H1 : 这些植株不符合 9 : 3 : 3 : 1 的理论比例.
解 设这批产品次品率为 p, 在这批产品中任意取一件产品, 定义随机变量 X :
X ~ b(1, p)
检验假设 H 0 : p 0.05,
现在
H1 : p 0.05
u
该假设检验问题的拒绝域为
x 0.05 u / 2 0.05(1 0.05) / n
n 50,
x
统计量U的值为
另一方面,当H0为真时, 可以根据H0所假设的 X 的分 布函数来计算
pi P( Ai ).
选取统计量
fi hi pi n i 1
k
ຫໍສະໝຸດ Baidu
2
来度量样本与H0中所假设的分布的吻合程度,hi是 给定的常数。
如果选取 hi n / pi , 则上述统计量变成
( fi npi ) npi i 1
(1)若 H 0 中 X 的分布函数 F ( x) 不含未知参数.
记 为 X 的所有可能取值的全体,将 分为k个
两两互不相交的子集
A1 , A2 ,, Ak
以 f i (i 1,2,, k ) 表示样本观察值 x1 , x2 ,, xn
中落入 Ai 的个数,
=> 在n次试验中,事件 Ai发生的频率为 fi /n
n1 s
*2 2
n2
u / 2
例3 两台机床加工同一种轴承,现在从他们加工的轴承中分别随机 地抽取200根和100根,测量其椭圆度(单位:mm),经计算得:
x 0.081 ,
* * s 0 . 025 , s 1 2 0.062 y 0.062,
能否认为这两台机床加工的轴承的平均椭圆度是相同的(α=0.05)
解 设该电器元件的电阻为X, 其均值为μ 检验假设 H 0 : 2.64, H1 : 2.64 拒绝域为
u x 2.64 u / 2 * s / n
*
现在 n 100, x 2.58, s 0.04, 0.05
u / 2 u0.025 1.96,
x 0 u / 2 =>该假设检验问题的拒绝域为 u * s / n
S / n
例2 某电器元件的平均电阻一直保持在2.64Ω. 改变加工工艺后, 测得100个元件的电阻, 计算得平均电阻为 2.58 Ω, 样本标准差 为0.04 Ω. 在显著性水平 α=0.05下, 判断新工艺对此元件的平均 电阻有无显著影响.
4.4 非正态总体参数的假设检验
1.(0—1)分布参数的假设检验
设总体 X 服从参数为 p 的(0—1)分布, 即
PX x p x (1 p)1 x , x 0, 1
设 X 1 , X 2 ,, X n 为 X 的样本. 检验假设 H 0 : p p0 , H1 : p p0
检验假设 H 0 : 0 , H1 : 0 由中心极限定理知,当样本容量n充分大时,U 近似地服从标准正态分布N(0,1)
X 0 / n
用 S
*2
近似代替 2 ,并且当 H 0 为真
且样本容量n充分大时, X 0 统计量 U * 仍近似服从标准正态分布
X 的样本, Y1 , Y2 ,, Yn 是 Y 的样本. 记 2 n1 n1 1 2 1 2 X Xi, S *1 ( X X ) i n1 i 1 n1 1 i 1 n2 n2 1 1 *2 2 Y Yi , S2 (Yi Y ) n2 i 1 n2 1 i 1
| u | 15 1.96
统计量U的值为 u
2.58 2.64 0.04 / 100
15
=>拒绝假设 H 0 : 2.64, 接受假设 H1 : 2.64 =>新工艺对电子元件的平均电阻有显著影响.
3.两个总体均值差的假设检验
设总体 X 和 Y 相互独立,X 1 , X 2 ,, X n1 是
2 k
2
定理1 (皮尔逊)当H0为真且n充分大时, 统计量
2 ( f np ) i 2 i npi i 1 k
近似服从 (k 1) 分布.
2
由定理1, 若给定显著性水平α,则前述假设检验问 题的拒绝域为
2 2 (k 1)
(2)若H0中X 的的分布函数含有未知参数.
此时, 首先在假设下利用样本求出未知参数的最大 似然估计, 以估计值作为参数值, 然后再根据 H0中 所假设的 X 的分布函数 F(x)求出 pi的估计值
ˆ(A ) ˆi P p i 2 k ( fi npi ) 2 并在 npi i 1 ˆ i 代替 pi , 得到统计量 中以 p 2 k ˆ ( fi npi ) 2 ˆi np i 1
2 1 2 2
近似地服从标准正态分布
2
2 2 *2 分别用 S *1 和 S 2 近似代替 1 和 2 ,
当n1和n2都充分大且原假设 H0 成立时,
U S X Y
*2 1
n1 S
*2 2
n2
仍近似地服从标准正态分布.
u s x y
*2 1
=>该假设检验问题的拒绝域为
注意:运用 检验法检验总体分布, 把样本数据进
2
行分类时, (1)大样本, 通常取 n 50
ˆi 5 (2)要求各组的理论频数 npi 5 或 np
(3)一般数据分成7到14组. 有时为了保证各组
npi 5
组数可以少于7组
例1 孟德尔在著名的豌豆杂交实验中, 用结黄色 圆形种子与结绿色皱形种子的纯种豌豆作为亲本进 行杂交, 将子一代进行自交得到子二代共556株豌 豆, 发现其中有四种类型植株
f3 108 ,
2
f 4 32, k 4,
计算得
( f i npi ) 0.47. npi i 1
2 2 0 .05 (3)
2 由 α=0.05 ,自由度 k 1 4 1 3, 查 分布表得
2 0.05
(3) 7.815
=>在α=0.05下接受 H 0 =>这些植株是符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例
定理2 (皮尔逊)当 H 0 为真且 n 充分大时, 统计量
2 ˆ ( f np ) i 2 i ˆi np i 1 k
近似服从 (k r 1) 分布, 其中r是 X的分布函数
2
F(x)包含的未知参数的个数. 若给定显著性水平α,则前述假设检验问题的拒绝域为
2 2 (k r 1)
A1 [3.95, 4.25], A2 (4.25, 4.55],
A12 (7.25, 7.55]
=>大麦穗长的频数、频率分布表
Ai
3.95~4.25 4.25~4.55 4.55~4.85 4.85~5.15 5.15~5.45 5.45~5.75 5.75~6.05 6.05~6.35 6.35~6.65 6.65~6.95 6.95~7.25 7.25~7.55 合计
下求假设检验问题 H0 : 1 2 , H1 : 1 2 的拒绝域. 由中心极限定理知,当样本容量 n1和n2都充分大时,
U X Y 1 2
n1 n2
由 9 : 3 : 3 : 1 的理论比例可知
9 p1 , 16
由n=556,得
3 p2 , 16
3 p3 , 16
1 p4 16
np1 312.75, np2 104.25
np3 104.25, np4 34.75
而 f1 315 ,
f 2 101 ,
2 k
由于
1 n E( X ) E( X i ) p n i 1
1 n 1 D( X ) D( X i ) p(1 p) n i 1 n
因此由中心极限定理可知, 当 H 0 成立且样本容量
n充分大时,统计量 U
X p0 近似地服从标准正态分布. p0 (1 p0 ) / n
=>该假设检验问题的拒绝域为
u
x p0 u / 2 p0 (1 p0 ) / n
例1 某种产品在通常情况下次品率为5%. 现在从生产出的一批产 品中随机地抽取50件进行检验, 发现有4件次品. 问能否认为这批 产品的次品率为5%?(α=0.05)
, 1, 该产品为次品 X . 0, 该产品为合格品
即检验假设:H0 : F ( x) F0 ( x), H1 : F ( x) F0 ( x)
:
总体 X 的分布律为 P{X xi } pi , i 1,2, 若总体 X 为连续型的, 则 H 0 相当于总体 X 的
注意: 若总体 X 为离散型的, 则 H 0 相当于
概率密度为 f (x) .
u s xy
*2 1
n2 100,
*2 2
u / 2 u0.025 1.96
=>拒绝原假设 H 0 ,
n2
/2
n1 s
n2
3.5849 1.96
即认为这两台机床加工的 轴承的平均椭圆度是不相同的.
4.5 非参数假设检验 1 分布拟合检验 设总体X的实际分布函数为F(x),它是未知的. X 1 , X 2 ,, X n 为来自总体 X的样本. 根据这个样本来检验总体X的分布函数F(x) 是否等于某个给定的分布函数 F0(x),
解 设这两台机床加工的轴承的椭圆度分别为X,Y 且 1 E X , 2 E Y 检验假设 H0 : 1 2 , H 1 : 1 2 由于题目给出的两个样本都是大样本,因此该假设检验 问题的拒绝域为 u xy u
s
*2 1
n1 s
*2 2
现在 n1 200,
例2 某农科站为了考察某种大麦穗长的分布情况, 在一块实验地里随机抽取了100个麦穗测量其长度, 得到数据如下(单位: cm) 6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.6 5.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.8 6.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.5 6.8 6.0 6.3 5.5 5.0 6.3 5.2 6.0 7.0 6.4 6.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.7 7.4 6.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.6 5.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.0 5.5 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 5.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3
试检验大麦穗长是否服从正态分布?(α=0.05)
解 检验假设 H 0 : X的概率密度为 f ( x)
2
1 2
e
2
( x )2 2 2
n 把X可能取值的全体 [3.95, 7.55] 划分为
k =12个互不重叠的小区间:
, 是未知的, 所以应首先估计 , 2 , 的最大似然估计为 n 1 *2 2 2 ˆ ˆ x 5.921 , s 0.6034
4 u / 2 u0.025 0.08, 50 0.08 0.05 u 0.0306 0.051 0.05 / 50
1.96
| u | 0.0306 1.96 =>接受假设 H 0
=>可以认为这批产品的次品率为5%
2.总体均值的假设检验
2 X 1 , X 2 ,, X n 为 X 的样本, 设总体X 的均值为μ,方差为
Y R
Y rr
yyR
yyrr
总计
(黄圆)(黄皱) (绿圆)(绿皱)
315株 101株 108株 32株 556株
试问这些植株是否符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例 ( 0.05)
解
检验假设
H 0 : 这些植株符合 9 : 3 : 3 : 1 的理论比例.
H1 : 这些植株不符合 9 : 3 : 3 : 1 的理论比例.
解 设这批产品次品率为 p, 在这批产品中任意取一件产品, 定义随机变量 X :
X ~ b(1, p)
检验假设 H 0 : p 0.05,
现在
H1 : p 0.05
u
该假设检验问题的拒绝域为
x 0.05 u / 2 0.05(1 0.05) / n
n 50,
x
统计量U的值为
另一方面,当H0为真时, 可以根据H0所假设的 X 的分 布函数来计算
pi P( Ai ).
选取统计量
fi hi pi n i 1
k
ຫໍສະໝຸດ Baidu
2
来度量样本与H0中所假设的分布的吻合程度,hi是 给定的常数。
如果选取 hi n / pi , 则上述统计量变成
( fi npi ) npi i 1
(1)若 H 0 中 X 的分布函数 F ( x) 不含未知参数.
记 为 X 的所有可能取值的全体,将 分为k个
两两互不相交的子集
A1 , A2 ,, Ak
以 f i (i 1,2,, k ) 表示样本观察值 x1 , x2 ,, xn
中落入 Ai 的个数,
=> 在n次试验中,事件 Ai发生的频率为 fi /n
n1 s
*2 2
n2
u / 2
例3 两台机床加工同一种轴承,现在从他们加工的轴承中分别随机 地抽取200根和100根,测量其椭圆度(单位:mm),经计算得:
x 0.081 ,
* * s 0 . 025 , s 1 2 0.062 y 0.062,
能否认为这两台机床加工的轴承的平均椭圆度是相同的(α=0.05)
解 设该电器元件的电阻为X, 其均值为μ 检验假设 H 0 : 2.64, H1 : 2.64 拒绝域为
u x 2.64 u / 2 * s / n
*
现在 n 100, x 2.58, s 0.04, 0.05
u / 2 u0.025 1.96,
x 0 u / 2 =>该假设检验问题的拒绝域为 u * s / n
S / n
例2 某电器元件的平均电阻一直保持在2.64Ω. 改变加工工艺后, 测得100个元件的电阻, 计算得平均电阻为 2.58 Ω, 样本标准差 为0.04 Ω. 在显著性水平 α=0.05下, 判断新工艺对此元件的平均 电阻有无显著影响.
4.4 非正态总体参数的假设检验
1.(0—1)分布参数的假设检验
设总体 X 服从参数为 p 的(0—1)分布, 即
PX x p x (1 p)1 x , x 0, 1
设 X 1 , X 2 ,, X n 为 X 的样本. 检验假设 H 0 : p p0 , H1 : p p0
检验假设 H 0 : 0 , H1 : 0 由中心极限定理知,当样本容量n充分大时,U 近似地服从标准正态分布N(0,1)
X 0 / n
用 S
*2
近似代替 2 ,并且当 H 0 为真
且样本容量n充分大时, X 0 统计量 U * 仍近似服从标准正态分布
X 的样本, Y1 , Y2 ,, Yn 是 Y 的样本. 记 2 n1 n1 1 2 1 2 X Xi, S *1 ( X X ) i n1 i 1 n1 1 i 1 n2 n2 1 1 *2 2 Y Yi , S2 (Yi Y ) n2 i 1 n2 1 i 1
| u | 15 1.96
统计量U的值为 u
2.58 2.64 0.04 / 100
15
=>拒绝假设 H 0 : 2.64, 接受假设 H1 : 2.64 =>新工艺对电子元件的平均电阻有显著影响.
3.两个总体均值差的假设检验
设总体 X 和 Y 相互独立,X 1 , X 2 ,, X n1 是
2 k
2
定理1 (皮尔逊)当H0为真且n充分大时, 统计量
2 ( f np ) i 2 i npi i 1 k
近似服从 (k 1) 分布.
2
由定理1, 若给定显著性水平α,则前述假设检验问 题的拒绝域为
2 2 (k 1)
(2)若H0中X 的的分布函数含有未知参数.
此时, 首先在假设下利用样本求出未知参数的最大 似然估计, 以估计值作为参数值, 然后再根据 H0中 所假设的 X 的分布函数 F(x)求出 pi的估计值
ˆ(A ) ˆi P p i 2 k ( fi npi ) 2 并在 npi i 1 ˆ i 代替 pi , 得到统计量 中以 p 2 k ˆ ( fi npi ) 2 ˆi np i 1
2 1 2 2
近似地服从标准正态分布
2
2 2 *2 分别用 S *1 和 S 2 近似代替 1 和 2 ,
当n1和n2都充分大且原假设 H0 成立时,
U S X Y
*2 1
n1 S
*2 2
n2
仍近似地服从标准正态分布.
u s x y
*2 1
=>该假设检验问题的拒绝域为
注意:运用 检验法检验总体分布, 把样本数据进
2
行分类时, (1)大样本, 通常取 n 50
ˆi 5 (2)要求各组的理论频数 npi 5 或 np
(3)一般数据分成7到14组. 有时为了保证各组
npi 5
组数可以少于7组
例1 孟德尔在著名的豌豆杂交实验中, 用结黄色 圆形种子与结绿色皱形种子的纯种豌豆作为亲本进 行杂交, 将子一代进行自交得到子二代共556株豌 豆, 发现其中有四种类型植株
f3 108 ,
2
f 4 32, k 4,
计算得
( f i npi ) 0.47. npi i 1
2 2 0 .05 (3)
2 由 α=0.05 ,自由度 k 1 4 1 3, 查 分布表得
2 0.05
(3) 7.815
=>在α=0.05下接受 H 0 =>这些植株是符合孟德尔所提出的 9 : 3 : 3 : 1 的理论比例
定理2 (皮尔逊)当 H 0 为真且 n 充分大时, 统计量
2 ˆ ( f np ) i 2 i ˆi np i 1 k
近似服从 (k r 1) 分布, 其中r是 X的分布函数
2
F(x)包含的未知参数的个数. 若给定显著性水平α,则前述假设检验问题的拒绝域为
2 2 (k r 1)
A1 [3.95, 4.25], A2 (4.25, 4.55],
A12 (7.25, 7.55]
=>大麦穗长的频数、频率分布表
Ai
3.95~4.25 4.25~4.55 4.55~4.85 4.85~5.15 5.15~5.45 5.45~5.75 5.75~6.05 6.05~6.35 6.35~6.65 6.65~6.95 6.95~7.25 7.25~7.55 合计