第四节 总体分布函数的假设检验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四节 总体分布函数的假设检验
上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的假设.例如检验假设:“总体服从正态分布”等.本节仅介绍2
χ检验法.
所谓2
χ检验法是在总体的分布为未知时,根据样本值x 1,x 2,…,x n 来检验关于总体分布的假设
H 0:总体X 的分布函数为F (x );
H 1:总体X 的分布函数不是F (x ) (8.22)
的一种方法(这里的备择假设H 1可不必写出).
注意,若总体X 为离散型,则假设(8.22)相当于
H 0:总体X 的分布律为P {X =x i }=p i ,i =1,2,…;(8.23)
若总体X 为连续型,则假设(8.22)相当于
H 0:总体X 的概率密度为f (x ). (8.24)
在用2
χ检验法检验假设H 0时,若在假设H 0下F (x )的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.
2
χ检验法的基本思想与方法如下:
(1) 将随机试验可能结果的全体Ω分为k 个互不相容的事件A 1,A 2,…,A k (1
k
i i A = =Ω,
A i A j =∅,i ≠j ;i ,j =1,2,…,k ),于是在H 0为真时,可以计算概率ˆi p =P (A i )(i =1,2,…,k ).
(2) 寻找用于检验的统计量及相应的分布,在n 次试验中,事件A i 出现的频率
i f n
与
概率ˆi p
往往有差异,但由大数定律可以知道,如果样本容量n 较大(一般要求n 至少为50,最好在100以上),在H 0成立条件下
ˆi i f p
n
-的值应该比较小,基于这种想法,皮尔逊使用 2
χ=2
1
ˆ()ˆk
i i i i f n p
n p
=-∑
(8.25)
作为检验H 0的统计量,并证明了如下的定理.
定理8.1 若n 充分大(n ≥50),则当H 0为真时(不论H 0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k -r -1的2
χ分布,其中r 是被估计的参数的个数.
(3) 对于给定的检验水平α,查表确定临界值2
(1)k r αχ--使
P {2χ>2
(1)k r αχ--)}=α,
从而得到H 0的拒绝域为
2
χ>2
(1)k r αχ--).
(4)由样本值x 1,x 2,…,x n 计算2χ的值,并与2
(1)k r αχ--比较.
(5) 作结论:若2
χ>2
(1)k r αχ--,则拒绝H 0,即不能认为总体分布函数为F (x );否则接受H 0.
例8.10 一本书的一页中印刷错误的个数X 是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.
其中f i 是观察到有i 个错误的页数.问能否认为一页书中的错误个数X 服从泊松分布(取α=0.05)?
解 由题意首先提出假设:
H 0:总体X 服从泊松分布.
P {X =i }=
!
e
i
i λ
λ
-,i =0,1,2,…,
这里H 0中参数λ为未知,所以需先来估计参数.由最大似然估计法得
03614061ˆ+70
100
x λ
⨯+⨯++⨯⨯== =1.
将试验结果的全体分为A 0,A 1,…,A 7两两不相容的事件.若H 0为真,则P {X =i }有估计
1
1
1ˆˆ{}!!
e e i
p
P X i i i --====,i =0,1,2,…. 例如
10ˆˆ{0},e p
P X -=== 11ˆˆ{1},e p
P X -=== 1
2ˆˆ{2},2
e p
P X -=== ………………
1
6
6
70
1
ˆˆˆ{7}11.!
e
i i i p
P X p
i -===≥=-=-∑
∑
计算结果如表8-6所示.将其中有些np i <5的组予以适当合并,使新的每一组内有np i ≥5,
如表8-6所示,此处并组后k =4,但因在计算概率时,估计了一个未知参数λ,故
2
4
2
2
1
ˆ()~(411).ˆi i i i f n p
n p
χ
χ=-=
--∑
计算结果为2χ=1.460(表8-6).因为2
2
0.05(411)(2)αχχ--==5.991>1.46,所以在显著性水平为0.05下接受H 0,即认为总体服从泊松分布.
例8.11 研究混凝土抗压强度的分布.200件混凝土制件的抗压强度以分组形式列出(表
8-7).n =6
1
i i f =∑=200.要求在给定的检验水平α=0.05下检验假设
H 0:抗压强度X ~N (μ,σ2).
解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ的极大似然估计值.
由第七章知,μ与σ2的极大似然估计值为
ˆx μ
=, 2
2
1
1
ˆ()n
i
i x x n
σ
==-∑.
设*
i x 为第i 组的组中值,我们有