拟合优的卡方检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
根据计算实践,要求n不小于50,以及 npi 都不小于 5. 否则应适当合并区间,使 npi满足这个要求 .
例 自1965年1月1日至1971年2月9日共2231天中,
全世界记录到里氏震级4级和4级以上地震共162次,
统计如下:
( 0.05)
(X 表示相继两次地震间隔天数, Y 表示出现的频数)
K.皮尔逊在1900年发表的一篇文章中引进
的所谓 2检验法.
这是一项很重要的工作,不少人 把它视为近代统计学的开端.
K.皮尔逊
2检验法是在总体X 的分布未知时,
根据来自总体的样本,检验关于总体分 布的假设的一种检验方法.
使用 2检验法对总体分布进行检验时,
我们先提出原假设: H0:总体X的分布函数为F(x)
得拒绝域: 2 2 (k 1) (不需估计参数)
2 2 (k r 1) (估计r 个参数)
如果根据所给的样本值 X1,X2, …,Xn算得
统计量 2的实测值落入拒绝域,则拒绝原假
设,否则就认为差异不显著而接受原假设.
皮尔逊定理是在n无限增大时推导出来 的,因而在使用时要注意n要足够大,以及 npi 不太小这两个条件.
2.把落入第i个小区间Ai的样本值的个数记 作fi , 称为实测频数. 所有实测频数之和 f1+ f2+ …+ fk等于样本容量n.
3.根据所假设的理论分布,可以算出总体X的 值落入每个Ai的概率pi,于是npi就是落入Ai的 样本值的理论频数.
实测频数
理论频数
fi npi
标志着经验分布与理论分布之间的差异的大小.
的分布渐近(k-1)个自由度的
2分布.
如果理论分布F(x)中有r个未知参数需用
相应的估计量来代替,那么当 n 时,统
计量 2的分布渐近 (k-r-1)个自由度的 2分
布.
为了便于理解,我们对定理作一 点直观的说明.
根据这个定理,对给定的显著性水平 ,
查 2分布表可得临界值
2
,使得
P( 2 2 )
X 0 4 5 9 10 14 15 19 20 24 25 29 30 34 35 39 40
Y 50 31 26
17
10
8
6
6
8
试检验相继两次地震间隔天数 X 服从指数分布.
解 所求问题为: 在水平 0.05下检验假设
wk.baidu.com
H0 : X 的概率密度
f
(
x)
1
x
e
,
0,
x 0, x 0.
然后根据样本的经验分布和所假设的理论分 布之间的吻合程度来决定是否接受原假设.
这种检验通常称作拟合优度检验,它是一 种非参数检验.
在用 2检验法检验假设H0时,若在H0下
分布类型已知,但其参数未知,这时需要先 用极大似然估计法估计参数,然后作检验.
分布拟合的 2检验法 的基本原理和步
骤如下:
1. 将总体X的取值范围分成k个互不重迭的小 区间,记作A1, A2, …, Ak .
pˆ i
0.2788 0.2196 0.1527 0.1062 0.0739 0.0514 0.0358 0.0248 0.0568
npˆ i
45.1656 35.5752 24.7374 17.2044 11.9718
8.3268 5.7996 4.0176 9.2016
在 H0 为真的前提下,
8
pˆ9 Fˆ ( A9 ) 1 Fˆ ( Ai ) 0.0568,
i 1
2 1.5633, k 9,r 1,
2
(k
r
1)
2
0.05
(7)
14.067
1.5633,
故在水平0.05下接受H0,
认为样本服从指数分布.
在此,我们以遗传学上的一项伟大发现为 例,说明统计方法在研究自然界和人类社会的 规律性时,是起着积极的、主动的作用.
X
的分布函数的估计为
Fˆ ( x)
1
x
e 13.77
,
0,
x0 x 0.
概率 pi P( Ai )有估计
pˆ i Pˆ ( Ai ) Pˆ {ai X ai1} Fˆ (ai1) Fˆ (ai ),
如 pˆ 2 Pˆ ( A2 ) Pˆ{4.5 X 0.5}
Fˆ (9.5) Fˆ (4.5) 0.2196,
卡方分布拟合检验
在前面的课程中,我们已经了解了假 设检验的基本思想,并讨论了当总体分布 为正态时,关于其中未知参数的假设检验 问题 .
然而可能遇到这样的情形,总体服从何 种理论分布并不知道,要求我们直接对总体 分布提出一个假设 .
如,某钟表厂对生产的钟进行精确性检查, 抽取100个钟作试验,拨准后隔24小时以后 进行检查,将每个钟的误差(快或慢)按 秒记录下来.
A1 : 0 x 4.5
50
A2 : 4.5 x 9.5
31
A3 : 9.5 x 14.5 A4 :14.5 x 19.5 A5 :19.5 x 24.5
26 17 10 8
A6 : 24.5 x 29.5 6
A7 : 29.5 x 34.5 6
A8 : 34.5 x 39.5 8 A9 : 39.5 x
问该厂生产的钟的误差是否服从正态分布?
再如,某工厂制造一批骰子, 声称它是均匀的.
也就是说,在投掷中,出 现1点,2点,…,6点的概 率都应是1/6.
为检验骰子是否均匀,要把骰子实地投掷 若干次,统计各点出现的频率与1/6的差距.
问题是:得到的数据能否说明“骰子均匀” 的假设是可信的?
解决这类问题的工具是英国统计学家
皮尔逊引进如下统计量表示经验分布
与理论分布之间的差异:
2 k ( fi npi )2
i1
npi
在理论分布 已知的条件下,
npi是常量
统计量 2 的分布是什么?
皮尔逊证明了如下定理:
若原假设中的理论分布F(x)已经完全给
定,那么当n 时,统计量
2 k ( fi npi )2
i1
npi
由于在 H0 中参数 未具体给出, 故先估计 .
由最大似然估计法得 ˆ x 2231 13.77,
162
X 为连续型随机变量,
将 X 可能取值区间[0, ) 分为 k 9 个互不重叠 的子区间[ai , ai1), i 1, 2, ,9. (见下页表)
例3的 2 拟合检验计算表
Ai
ni
奥地利生物学家孟德尔进行了长 达八年之久的豌豆杂交试验, 并根据 试验结果,运用他的数理知识, 发现了 遗传的基本规律.
相关文档
最新文档