概率论精品课件 (3)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
§7.4 分布拟合检验
§7.4 .1 分布拟合优度检验
设总体X的分布函数F(x)未知,检验问题为:
H0 : F ( x) F0 ( x) H1 : F ( x) F0 ( x)
1、其中 F0( x) 是一个已知的分布函数。
2、其中 F0( x) 分布形式已知,但分布中含有未知参数。
这个分布检验问题就是检验观测数据是否与理论 分布相符合。
(7.4.2)
并证明在H0 成立时对充分大的n, (7.4.2) 给出的检验
统计量近似服从自由度为k-1的 2 分布。
拒绝域为:
W

2

2 1
k
1
例7.4.1 为募集社会福利基金,某地方政府发行福利彩票,中彩 者用摇大转盘的方法确定最后中奖金额。大转盘均分为20份,其 中金 额为5万、10万、20万、30万、50万、100万的分别占2份、 4份、6份、4份、2份、2份。假定大转盘是均匀的,则每一点朝 下是等可 能的,于是摇出各个奖项的概率如下:
二、F0( x) 不完全已知
F0 (x) 含有k (k<r)个未知参数 1,...,k
2 r ni npi 2 pi pi (1,,k ), i 1,, r.
i 1
npi
首先给出 1,,k 的最大似然估计ˆ1,,ˆk ,
然后给出诸
pi
,
i
1,, r 的极大似然估计 pˆi pi (1,,ˆk ).
B两属性独立”的假设可以表述为
H0 : pij pi p j ,
i 1,, r, j 1,, c
表7.4.4 二维离散分布表
A \ B 1 j c 行和
1
p11 p1 j p1c
p1

i
pi1 pij pic
pi

r
pr1 prj prc
的个数,设pi是当H0成立时,X落于区间Ai=(yi-1,yi]
的概率。
如果H0 成立,则对每一类Ai,其频率ni /n与概率pi 应
较接近。即观测频数ni 与理论频数npi 应相差不大。
据此,英国统计学家K.Pearson提出如下检验统计量:
r
2
ni npi 2
i 1
npi
这是一个典型的分布拟合优度检验,总体共有6类, 其发生概率分别为0.1、0.2、0.3、0.2、0.1和0.1
解:H 0: 大转盘是均匀
H1: 大转盘是不均匀
r
2
ni npi 2 ~ 2 (5)
i 1
npi
r=6
检验拒绝域为:W
2

2 1
5
2 r ni npˆi 2
i1 npˆi
在H0成立时近似服从自由度
为r-k-1的 2 分布,于是检验拒绝域为
W

2

2 1
r

k
1
例7.4.2 卢瑟福在2608个等时间间隔内观测一 枚放射性物质放射的粒子数X,表7.4.1是观测 结果的汇总,其中ni表示2608次观测中放射粒 子数为i的次数。
检验如下假设:H0 : P( Ai ) pi , i 1, 2,, r .(7.4.1)
r
其中诸 pi 0 且 pi 1. pi 均已知
i 1
其备择假设是(7.4.1)中的诸等式不全成立。
在实际中,此种备择假设可以省略不写。
如果H0 成立,则对每一类Ai,其频率ni /n与概 率pi 应较接近。即观测频数ni 与理论频数npi 应 相差不大。据此,英国统计学家K.Pearson提
(ni
n
npipi
)2
0.000082
0.65 0.158342 0.150477
0.000376
0.9593
练习8
7.4.2 列联表的独立性检验
列联表是将观测数据按两个或更多属性 (定性变量) 分类时所列出的频数表。例 如,对随机抽取的1000人按性别(男或 女)及色觉(正常或色盲) 两个属性分类 ,得到如下二维列联表,又称2×2表或 四格表。
表 rc列联表
A\B 1 j c 和
1
n11 n1 j n1c n1

i
ni1 nij nic ni

r
nr1 nrj nrc nr
列和 n1 n j nc n
列联表分析的基本问题是: 考察各属性之间有无关联, 即判别两属性是否独立。如在前例中,问题是:一个人
出如下检验统计量:
r
2
ni npi 2
i 1
npi
(7.4.2)
并证明在H0 成立时对充分大的n, (7.4.2) 给出的
检验统计量近似服从自由度为r-1的 2 分布。
拒绝域为: W

2

2 1
r
1
2、总体为连续分布的情形 在这种情形下检验的做法如下:
是否色盲与其性别是否有关?
H0 : 属性A和B独立 H1 : 属性A和B不独立
记:pij P{ X Ai ,Y B j }
pi P{ X Ai } p j P{Y B j } 则“A、B两属性独立”的假设可以表述为
H0 : pij pi p j ,
i 1,, r, j 1,, c
在这种情形下检验的做法如下:
Байду номын сангаас
在这种情形下检验的做法如下:
如果H0 成立,则对每一类Ai,其频率ni /n与概率pi 应 较接近。即观测频数ni 与理论频数npi 应相差不大。 据此,英国统计学家K.Pearson提出如下检验统计量:
r
2
ni npi 2
(7.4.2)
i 1
1.0000
npˆ i
54.5 210.5 407.4 525.5 508.6 393.5 253.8 140.3 67.8 29.2 11.2 5.7
2068
ni npˆi 2 / npˆi
0.1147 0.2672 1.4614 0.0005 1.0766 0.5343 1.4525 0.0120 7.6673 0.1658 0.1258 0.0158
这里有一个未知参数 ,
ˆ x 1 1 203 2 383 ... 14 0 3.870
2608
2 r ni npˆ i 2 ~ 2(r k 1) r=12,k=1
i 1
npˆ i
若取 =0.05,则
2 1
r

k
pˆ i

ˆ i
i!
e ˆ
i 0,1,,10
pˆ 11

i 11
ˆ i
i!
e ˆ
列表如下。
i
ni
0
57
1
203
2
383
3
525
4
532
5
408
6
273
7
139
8
45
9
27
10
10
≥11
6
合计 2608
pˆ i
0.0209 0.0807 0.1562 0.2015 0.1950 0.1509 0.0973 0.0538 0.0260 0.0112 0.0043 0.0022
2=12.8967
W 2 18.307
本例中 2 =12.8967<18.307,故接
受原假设。
本例中 2=12.8967<18.307,故接受
原假设。使用统计软件可以计算出 此处检验的p 值是0.2295。
作业7
15.0 15.8 15.2 15.1 15.9 14.7 14.8 15.5 15.6 15.3 15.0 15.6 15.7 15.8 14.5 15.1 15.3 14.9 14.9 15.2 15.9 15.0 15.3 15.6 15.1 14.9 14.2 14.6 15.8 15.2 15.2 15.0 14.9 14.8 15.1 15.5 15.5 15.1 15.1 15.0 15.3 14.7 14.5 15.5 15.0 14.7 14.6 14.2 14.2 14.5
8
15.5 X 15.75
4
15.75 X
4
合计
p i
0.0885 0.1321 0.2080 0.2268 0.1835 0.1029 0.0582
n pi
4.425 6.605 10.4 11.34 9.175 5.145 2.91
ni npi
-0.030 2.6
-1.34 -1.175 -0.055
pr
列和 p1 p j pc
1
这就变为上一小节中诸 pij不完全已知时的分布 拟合检验。这里诸pij 共有rc个参数,在原假设 H和0p成1,立时, p,c决这定rc。个在参这数rp+ijc由后r个+c参个数参中数存p1在,两, 个pr 约束条件:
a0 , a1 14.55, a2 14.95, a3 15.35, a4 15.75, a5
结果如下表:
练习8
Ai
ni
X 14.5
6
14.5 X 14.75
5
14.75 X 15.0
13
15.0 X 15.25
10
15.25 X 15.5
在分布拟合检验中使用p 值也是方便的。
本例中,以T 记服从 2(5)的随机变量,则使用
统计软件可以算出
p P T 3.75 0.5859.
这个p 值就反映了数据与假设的分布拟合程度的 高低,p 值越大,拟合越好。
作业6
二、F0( x) 不完全已知
总体可分为有限类,但总体分布中含有未知参数
一 F0( x) 完全已知
H0 : F ( x) F0 ( x) H1 : F ( x) F0 ( x)
其中 F0( x) 是一个已知的分布函数。
1、总体X是离散分布
设总体X 可以分成r 类,记为 A1,, A,r 现对该总 体作了n 次观测,r 个类出现的频数分别为:
r
n1,…,nr, 且ni 5, ni n. i 1
,

=0.05
W
2

2 0.95
5

2 11.07
2 =
222 642 662 342 322 022 3.75
2
4
6
4
2
2
由于 2 3.75 未落入拒绝域,故接受原假设,
没有理由认为转盘不均匀。
i 0 1 2 3 4 5 6 7 8 9 10 11 12
ni 57 203 383 525 532 408 273 139 45 27 10 4 2
试利用该组数据检验该放射物质在单位时间内放 射出的粒子数是否服从泊松分布。
解:设X该放射物质在单位时间内放射出的粒子数
H0 : X ~ P( )
1

2 0.95
10

18.307.
W 2 18.307
k
2
ni npˆ i 2
i 1
npˆ i
i 0 1 2 3 4 5 6 7 8 9 10 11 12 ni 57 203 383 525 532 408 273 139 45 27 10 4 2
性别
男 女
视觉
正常 色盲
535
65
382
18
在实际问题中常遇到证实两个因素是否相关联。 例如气管炎患病是否与吸烟有关?
一般,若总体中的个体可按两个属性A与B 分类,A 有r 个类A1 ,, Ar ,B 有c个B类1 ,, Bc 从总体中抽取大小为n的样本,设其中有nij 个个体既属于Ai类又属于 Bj类, nij称为频 数,将rc个 nij排列为一个r行c列的二维列 联表,简称rc列联表。
列联表分析的基本问题是: 考察各属性之间有无
关联,即判别两属性是否独立。如在前例中,问
题是:一个人是否色盲与其性别是否有关?在 rc表中,若以pi, p j 和pij 分别表示总体中的个体 仅属于 Ai ,仅属于Bj 和同时属于Ai 与Bj 的概率,
可得一个二维离散分布表(表7.4.4),则“A、
额度 5万 10万 20万 30万 50万 100万
概率 0.1 0.2 0.3 0.2 0.1 0.1
现20人参加摇奖,摇得5万、10万、20万、30万、50万和100 万的人数分别为2、6、6、3、3、0,由于没有一个人摇到100 万,于是有人怀疑大转盘是不均匀的,那么该怀疑是否成立 呢?这就需要对转盘的均匀性作检验。
npi
并证明在H0 成立时对充分大的n, (7.4.2) 给出的检验
统计量近似服从自由度为r-1的 2 分布。
拒绝域为:
W

2

2 1
r
1
2、总体X 是连续分布
假设总体X的取值范围分为r个区间,第i个小区间表 示为Ai=(yi-1,yi],设ni是样本值落于区间Ai=(yi-1,yi]
相关文档
最新文档