8.3-0总体分布的检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1/7 1/7 1/7 1/7 1/7 1/7 1/7 1
10 10 10 10 10 10 10 70
-8 0 1 -2 3 9 -3 0
6.4 0 0. 1 0. 4 0. 9 8.1 0.9 16.8

5)无参数被估计, r 0 6)显著性水平 0.05,自由度k r 1 7 0 1 6
表3.3.2 某地12岁男孩身高资料(单位:厘米)
128.1 134.1 126.0 133.4 142.7 135.8 138.4 145.1 150.4 152.7 140.3 140.2 141.4 142.9 142.2 154.3 127.4 140.8 138.9 133.0 144.4 124.3 125.6 131.0 137.6 134.8 136.6 141.4 142.7 148.1 137.3 136.6 139.7 144.7 152.1 147.9 146.0 127.7 123.1 142.8 150.3 147.9 127.7 125.4 139.9 139.1 139.2 139.9 144.3 139.6 134.6 139.5 136.2 138.8 142.4 141.3 155.8 150.7 126.0 136.8 146.2 143.0 154.4 130.3 122.7 139.0 141.6 140.6 136.4 138.9 145.2 135.7 138.4 138.3 142.7 143.8 141.2 160.3 150.0 133.1 140.6 143.1 142.7 142.3 131.8 132.3 141.0 140.2 134.5 136.1 128.2 139.8 138.1 135.3 136.2 138.1 146.4 148.5 143.7 144.5 139.7 142.7 141.2 146.8 147.7 134.7 138.4 131.0 132.3 135.9 135.9 129.1 132.9 140.6 135.0 139.7 139.4 147.5 156.9 142.4

n pi
4.128 8.028 15.53 22.92 25.49 21.30 13.39 6.26 3.07

ni n p i
0. 872 -0.028 -5.53 -0.92 7.51 -1.30 -2.39 -0.26 1.93

( ni n p i ) / n p i
0. 1817 0. 0001 1. 9659 0. 0369 1. 2126 0. 0793 0. 4265 0. 0108 1.2133
1)提出假设 : H 0 : 12岁男孩的身高X服从正态分布 N ( , 2 ),其中 , 2 未知, 用极大似然估计值代替
X 139.5

55, 7.42
2

2)分组 : 数据的最小值122.7, 最大值160.3.故取实数126, 130,134,138,142,146,150,154将实数轴分为9个区间. (,126),[126.140],...[154, )
§8.3 分布拟合检验

分布拟合检验
2
1 分布假设 2 2 检验法基本思想


2
拟合检验法的一般步骤
前面介绍了总体分布已知时,未知参数 的假设检验问题.但在实际问题中,有时不能 预知总体服从什么类型的分布,这就需要根 据样本来检验关于总体分布的假设.本节介 2 绍的 检验法,就是分布拟合检验法之一.

i 1, 2,..., k
(3)统计在n次试验中, 事件Ai出现的实际 频数ni , i 1, 2,..., k , 且有 ni n,
而pi或 pi 为Ai出现的概率, npi或n pi 为n次试验中Ai出现 的理论频数。当H 0为真时, ni与npi应相差无多. 且随n的增大, 差异会愈来愈小。
i 1 i
k
2 检验计算表
Ai
A1
ni
n1
pi
p1
npi
np1
ni npi
n1 np1
(ni npi )2 / npi
(n1 np1 )2 / np1

Ak


nk npk
0

(nk npk )2 / npk
2
nk
pk
1
npk
n
n
5)确定分布中被估计的参 数个数r 6)由显著性水平 及自由度k r 1, 确定H 0的拒绝域为
统计数据x1 , x2 ,..., x120落入各个 区间的个数ni , i 1, 2,...,9
126 139.5 3)计算 p1 P X 126 0.0344 7.42

p2 P 126 X 130 130 139.5 126 139.5 0.0699 7.42 7.42
2 ( n np ) i 2 i ~ 2 (k r 1) npi i 1 k
(3.5)
其中r为被估计的参数的个数。
于是, 在H 0为真时, 可由(3.5)式得到显著性水平为 时H 0的 拒绝域为
2 2 (k r 1)
(3.6)
若由样本观察值计算得 (3.6)成立, 则拒绝H 0 , 否则接受H 0 注意上述中n须充分大, npi 亦不应太小 , 一般要求为n 50, npi 5, 否则应适当地合并 Ai ,以满足此要求。
2)故障实际频数由题设给出, ni 70
i 1
7
3)故障理论频数为 : npi n / 7 10
i 1, 2,...,7
4) 2 检验计算表
x 1 2 3 4 5 6 7
ni pi
npi ni npi
(ni npi )2 / npi
2 10 11 8 13 19 7 70
2 极大似然估计 x, sn 代替., 故实际上检验的是
H 0 : X ~ N ( x, s )
2 2 检验法基本思想
2 n
检验法主要依据频率与概率的关系, 建立
2
近似的检验统计量以进行分布拟合检验, 具体思想是 :
(1)首先将随机试验可能结果的全体, 即样本空间S 划分成个互不相容的事件A1 , A2 ,..., Ak , 满足
二 拟合检验法的一般步骤
2
由 2 似合检验法的基本思想, 进行分布拟合检验的 一般步骤为 : 1)利用频率直方图提出假设 当X 是离散型, pi为已知分布律 P X xi pi H0 : X ~ f ( x) 当X 是连续型, f ( x)是已知概率密度 而H1可不必写出, 其中未知参数用极大似然估计值代替.
一 分布拟合检 验 1 分布假设
2
设样本X 1 , X 2 , , X n来自总体X , X 的分布函数F ( x) 为未知, 关于分布的一般假设是 H 0 : 总体X 的分布函数为F ( x) H1 : 总体X 的分布函数不为F ( x)
注1 (1)若已知X 为离散型总体, 则(3.1) 相当于 H 0 : 总体X的分布律为P X xi pi , i 1, 2, (3.2)
k
A
i 1
i
S , Ai A j , i j , i, j 1, 2,..., k
即A1 , A2 ,..., Ak 为S的一个划分.
(2)在H 0为真时, 计算每个Ai的概率,即pi P( Ai ) 若F ( x)中未知参数用相应极大似然估计值代替, 则得Ai的近似概率值 pi P( Ai )
2 2 H 0的拒绝域为 2 (k r 1) 0.05 (6) 12.592
7)由计算表得 2 16.8 12.592, 故应拒绝H 0 , 认为故 障的发生与机床无关, 而与机床本身质量有关。 .
例3.2 下表( 下页 )给出某地 120名12岁男孩身高的资料: 用X表示12岁男孩子的身高 ,要求利用 2 检验法检验假设 H 0 : X服从正态分布 ( 0.05 ) 解:
2)分组并统计实际频数 样本值x1 , x2 ,..., xn中X xi出现的个数, X 为离散型 ni 样本值x1 , x2 ,..., xn落入第i段 ai 1 , ai (i 1, 2,..., n)的 个数,当X 为连续型
n n
3)计算理论频数 npi , i 1, 2,..., n的值 P X xi 其中 pi ai f ( x)dx ai1 4)编制 2检验计算表 X 为离散型 X 为连续型
(3.1)
(2)若已知X 为连续型总体, 则(3.1)相当于 H0 : 总体X的概率密度为f ( x) (3.3)
注2
若在H 0下F ( x)的形式已知, 但其参数值未知时,
2 2
则需用极大似然估计值代替未知参数, 再作假设检验.
例如H 0 : X ~ N ( , ), 其中 , 未知, 则分别用其

k
i 1

基于这种想法, 皮尔逊使用统计量
2 ( n np ) i 2 i npi i 1 k
(3.4)
来衡量实际频数ni与理论频数npi , 或实际频率ni / n 与概率之间差异程度。 .
(4)可以证明 : 当n 50, 在H 0为真时, 统计量(3.4)总是近似服从自由度为k r 1的 2分布,

4)列出 检验30 ] ( 130,134 ] ( 134,138 ] ( 138,142 ] ( 142,146 ] ( 146,150 ]
( 150 ,154 ]
ni
5 8 10 22 33 20 11 6 5
pi
0. 0344 0. 0699 0. 1294 0. 1910 0. 2124 0. 1775 0. 1116 0. 522 0.0256
1 2 3 4 5 6 7 7
工序.,在一段时间内统计 7台机床故障数的资料如 下:
机床代号 故障频数
2 10 11
8 13 19
试问故障的发生是否与 机床本身质量有关 ( 0.05) ?
解 : 设X 为出现故障的机床代号, 则X 的可能取值为 1, 2,..., 7, 欲检验故障的发生与机床本身质量无关, 则 每台机床出现故障是等可能的, 提出相应的假设H 0 : 1 1) H 0 : pi P X i , i 1, 2,..., 7 7


( 150, )

120
1
120
0
6.172
5)被估计的参数为 , 2 , 故r 2 6)显著性水平 0.05,自由度k r 1 9 2 1 6 H 0的拒绝域为
2 2 2 (k r 1) 0.05 (6) 12.592
7)由计算表得 2 6.1272 12.592, 故应接受H 0 , 认为 该地区12岁男孩的身高X 服从正态分布N (139.5, 55)。
2 ( n np ) 2 i 2 i (k r 1) npi i 1 k
7)由样本值计算得 的观察值, 若 (k r 1),则
2 2 2
拒绝H 0 , 认为X的分布函数不是 F ( x).
例3.1 7台自动机床在相同条件 下, 独立完成相同的
相关文档
最新文档