第四节 总体分布函数的假设检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四节 总体分布函数的假设检验

上两节中,我们在总体分布形式为已知的前提下,讨论了参数的检验问题.然而在实际问题中,有时不能确知总体服从什么类型的分布,此时就要根据样本来检验关于总体分布的假设.例如检验假设:“总体服从正态分布”等.本节仅介绍2

χ检验法.

所谓2

χ检验法是在总体的分布为未知时,根据样本值x 1,x 2,…,x n 来检验关于总体分布的假设

H 0:总体X 的分布函数为F (x );

H 1:总体X 的分布函数不是F (x ) (8.22)

的一种方法(这里的备择假设H 1可不必写出).

注意,若总体X 为离散型,则假设(8.22)相当于

H 0:总体X 的分布律为P {X =x i }=p i ,i =1,2,…;(8.23)

若总体X 为连续型,则假设(8.22)相当于

H 0:总体X 的概率密度为f (x ). (8.24)

在用2

χ检验法检验假设H 0时,若在假设H 0下F (x )的形式已知,而其参数值未知,此时需先用极大似然估计法估计参数,然后再作检验.

2

χ检验法的基本思想与方法如下:

(1) 将随机试验可能结果的全体Ω分为k 个互不相容的事件A 1,A 2,…,A k (1

k

i i A = =Ω,

A i A j =∅,i ≠j ;i ,j =1,2,…,k ),于是在H 0为真时,可以计算概率ˆi p =P (A i )(i =1,2,…,k ).

(2) 寻找用于检验的统计量及相应的分布,在n 次试验中,事件A i 出现的频率

i f n

概率ˆi p

往往有差异,但由大数定律可以知道,如果样本容量n 较大(一般要求n 至少为50,最好在100以上),在H 0成立条件下

ˆi i f p

n

-的值应该比较小,基于这种想法,皮尔逊使用 2

χ=2

1

ˆ()ˆk

i i i i f n p

n p

=-∑

(8.25)

作为检验H 0的统计量,并证明了如下的定理.

定理8.1 若n 充分大(n ≥50),则当H 0为真时(不论H 0中的分布属什么分布),统计量(8.25)总是近似地服从自由度为k -r -1的2

χ分布,其中r 是被估计的参数的个数.

(3) 对于给定的检验水平α,查表确定临界值2

(1)k r αχ--使

P {2χ>2

(1)k r αχ--)}=α,

从而得到H 0的拒绝域为

2

χ>2

(1)k r αχ--).

(4)由样本值x 1,x 2,…,x n 计算2χ的值,并与2

(1)k r αχ--比较.

(5) 作结论:若2

χ>2

(1)k r αχ--,则拒绝H 0,即不能认为总体分布函数为F (x );否则接受H 0.

例8.10 一本书的一页中印刷错误的个数X 是一个随机变量,现检查了一本书的100页,记录每页中印刷错误的个数,其结果如表8-5所示.

其中f i 是观察到有i 个错误的页数.问能否认为一页书中的错误个数X 服从泊松分布(取α=0.05)?

解 由题意首先提出假设:

H 0:总体X 服从泊松分布.

P {X =i }=

!

e

i

i λ

λ

-,i =0,1,2,…,

这里H 0中参数λ为未知,所以需先来估计参数.由最大似然估计法得

03614061ˆ+70

100

x λ

⨯+⨯++⨯⨯== =1.

将试验结果的全体分为A 0,A 1,…,A 7两两不相容的事件.若H 0为真,则P {X =i }有估计

1

1

1ˆˆ{}!!

e e i

p

P X i i i --====,i =0,1,2,…. 例如

10ˆˆ{0},e p

P X -=== 11ˆˆ{1},e p

P X -=== 1

2ˆˆ{2},2

e p

P X -=== ………………

1

6

6

70

1

ˆˆˆ{7}11.!

e

i i i p

P X p

i -===≥=-=-∑

计算结果如表8-6所示.将其中有些np i <5的组予以适当合并,使新的每一组内有np i ≥5,

如表8-6所示,此处并组后k =4,但因在计算概率时,估计了一个未知参数λ,故

2

4

2

2

1

ˆ()~(411).ˆi i i i f n p

n p

χ

χ=-=

--∑

计算结果为2χ=1.460(表8-6).因为2

2

0.05(411)(2)αχχ--==5.991>1.46,所以在显著性水平为0.05下接受H 0,即认为总体服从泊松分布.

例8.11 研究混凝土抗压强度的分布.200件混凝土制件的抗压强度以分组形式列出(表

8-7).n =6

1

i i f =∑=200.要求在给定的检验水平α=0.05下检验假设

H 0:抗压强度X ~N (μ,σ2).

解 原假设所定的正态分布的参数是未知的,我们需先求μ与σ的极大似然估计值.

由第七章知,μ与σ2的极大似然估计值为

ˆx μ

=, 2

2

1

1

ˆ()n

i

i x x n

σ

==-∑.

设*

i x 为第i 组的组中值,我们有

相关文档
最新文档