经典拟合优度检验.ppt
合集下载
拟合优度检验.ppt

实际频数
理论频数
nk npk
标志着经验分布与理论分布之间的差异的大小.
皮尔逊引进如下统计量表示经验分布
与理论分布之间的差异:
2 r (nk npk )2
k 1
npk
在理论分布 已知的条件下,
npk是常量
统计量 2 的分布是什么?
皮尔逊证明了如下定理:
若原假设中的理论分布F0(x)已经完全给
小区间[ai-1,ai], i=1,…r, 记作A1, A2, …, Ar .
2.把落入第k个小区间Ak的样本值的个数记 作 nk , 称为实际频数.
3.根据所假设的理论分布,可以算出总体X的 值落入每个Ak的概率pk,于是npk就是落入Ak 的样本值的理论频数.
pk P( Ak ) P(ak1 ak ) F0 (ak ) F0 (ak1)
定,那么当n 时,统计量
2 r (nk npk )2
k 1
npk
的分布渐近(r-1)个自由度的
2分布.
如果理论分布F0(x)中有m个未知参数需
用相应的估计量来代替,那么当n 时,
统计量 2的分布渐近 (r-m-1) 个自由度 的 2
分布.
根据这个定理,对给定的显著性水平 ,
查
2分布表可得临界值
2 检验 Chi-Squared Test
Goodness-of-fit Test 拟合优度检验 &
Test of Row and Column Independenc 独立性检验
2分布 (图示)
n=1 n=4 n=10
n=20
2
样本方差的分布
1. 在重复选取容量为n的样本时,由样本方差的 所有可能取值形成的相对频数分布
拟合优度的卡方检验(精选)PPT文档共25页

1、不要轻言放弃,否则对不起自己。
2、要冒一次险!整个生命就是一场冒险。走得最远的人,常是愿意 去做,并愿意去冒险的人。“稳妥”之船,从未能从岸边走远。-戴尔.卡耐基。
梦 境
3、人生就像一杯没有加糖的咖啡,喝起来是苦涩的,回味起来却有 久久不会退去的余香。
拟合优度的卡方检验(精选) 4、守业的最好办法就是不断的发展。 5、当爱不能完美,我宁愿选择无悔,不管来生多么美丽,我不愿失 去今生对你的记忆,我不求天长地久的美景,我只要生生世世的轮 回财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应,言行相称。——韩非
经典拟合优度检验.ppt

§8.4 拟合优度检验
在前面的讨论中,我们总假定总体的分 布形式是已知的。例如,假设总体分布为正
态分布 N(, 2), 总体分布为区间 (a, b) 上的
均匀分布,等等。
然而,在实际问题中,我们所遇到的总 体服从何种分布往往并不知道。需要我们先 对总体的分布形式提出假设,如:总体分布
是正态分布N( , 2),总体分布是区间(a, b)
(3). 计算各子区间 Ii 上的实际频数 fi 。
fi =﹟{ X1, X2, …, Xn ∈ Ii } , i=1, 2, …, k .
计数符号,取集 合中元素的个数
(4). 计算理论频数与实际频数的偏差平方和。
2
k
[
i1
fi
npi (ˆ)]2 npi (ˆ)
,
( 2)
每一项用npi (ˆ) 去除的其目的是:缩小理论
由度为 k-r-1=7。由
22.15 2 k2r1( ) 18.48.
于是,拒绝原假设,即认为棉纱拉力强
度不服从正态分布。
χ 2检验的一个著名应用例子是孟德尔豌豆 实验。奥地利生物学家孟德尔在1865年发表的 论文,事实上提出了基因学说,奠定了现代遗 传学的基础。他的这项伟大发现的过程有力地 证明了统计方法在科学研究中的作用。因此, 我们有必要在这里将这一情况介绍给大家。
孟德尔这个发现的深远意义是他开辟了 遗传学研究的新纪元。下面的例子就是用 χ 2 检验来检验孟德尔提出黄绿颜色豌豆数目之 比为 3:1的论断。
例2:孟德尔豌豆试验中,发现黄色豌豆为25 粒, 绿色豌豆11粒,试在α=0.05下, 检验豌豆 黄绿之比为3:1。
解:定义随机变量 X
X
1, 0,
豌豆为黄色, 豌豆为绿色.
在前面的讨论中,我们总假定总体的分 布形式是已知的。例如,假设总体分布为正
态分布 N(, 2), 总体分布为区间 (a, b) 上的
均匀分布,等等。
然而,在实际问题中,我们所遇到的总 体服从何种分布往往并不知道。需要我们先 对总体的分布形式提出假设,如:总体分布
是正态分布N( , 2),总体分布是区间(a, b)
(3). 计算各子区间 Ii 上的实际频数 fi 。
fi =﹟{ X1, X2, …, Xn ∈ Ii } , i=1, 2, …, k .
计数符号,取集 合中元素的个数
(4). 计算理论频数与实际频数的偏差平方和。
2
k
[
i1
fi
npi (ˆ)]2 npi (ˆ)
,
( 2)
每一项用npi (ˆ) 去除的其目的是:缩小理论
由度为 k-r-1=7。由
22.15 2 k2r1( ) 18.48.
于是,拒绝原假设,即认为棉纱拉力强
度不服从正态分布。
χ 2检验的一个著名应用例子是孟德尔豌豆 实验。奥地利生物学家孟德尔在1865年发表的 论文,事实上提出了基因学说,奠定了现代遗 传学的基础。他的这项伟大发现的过程有力地 证明了统计方法在科学研究中的作用。因此, 我们有必要在这里将这一情况介绍给大家。
孟德尔这个发现的深远意义是他开辟了 遗传学研究的新纪元。下面的例子就是用 χ 2 检验来检验孟德尔提出黄绿颜色豌豆数目之 比为 3:1的论断。
例2:孟德尔豌豆试验中,发现黄色豌豆为25 粒, 绿色豌豆11粒,试在α=0.05下, 检验豌豆 黄绿之比为3:1。
解:定义随机变量 X
X
1, 0,
豌豆为黄色, 豌豆为绿色.
拟合优度检验-PPT

总数 98 (n1 ) 95 (n2 ) 193 (N)
有效率 59.2% 67.4%
22
※二、2 2列联表的精确检验法(Fisher检验法)
前提条件:某一格的理论数小于5。 思 想:用古典概型的方法求出尾区的概率,
然后与给定的显著性水平 相比,大于则接
受 H 0 ,反之拒绝。 需要解决的问题:
1.用古典概型求2 2列联表出现某一组数值的概率
注射 c
d
Tij
(i行和 )(j列 N
和 )
自由度 df = 1
19
四格表资料 2 检验的专用公式:
和前面的结果 一样
2
(adbc)2n
(ab)(cd)(ac)(bd)
2 (|adbc|0.5n)2n
(ab)(cd)(ac)(bd)
20
2. rc列联表
n11 n12 n13 L n1c
n21 n22 n23 L n2c
与理论(期望)频数(Expected frequency )之差 是否由抽样误差所引起。
补充:皮尔逊定理(pearson) 设 (p1,p2,L,pr)为总体的真实概率分布,统计量
2 r (ni npi )2 i1 npi 随n的增加渐近于自由度为r-1的 2 分布。
6
r
X2
(Oi Ti)2 ~X2(r1)
Oi
实际频数
黄花 84
绿花 16
合计 100
12
【补例7.3】( Poisson分布的拟合优度检验)将酵母细
胞的稀释液置于某种计量仪器上,数出每一小方格内的酵
母细胞数,共观察了413个小方格,结果见表7.3第1、2列,
试问该资料是否服从Poisson分布?
《拟合优度检验》课件

柯克伦科夫勒检验
总结词
柯克伦科夫勒检验是一种基于概率的拟合优度检验方法,用于检验观测频数与期望频数之间的差异是否显著。
详细描述
柯克伦科夫勒检验基于二项分布,通过计算观测频数与期望频数的离差平方和,得到柯克伦科夫勒统计量。在样 本量足够大的情况下,柯克伦科夫勒统计量近似服从正态分布。通过比较柯克伦科夫勒统计量与临界值,可以判 断观测频数与期望频数是否存在显著差异。
03
拟合优度检验的步骤
Chapter
确定检验假设
零假设(H0)
样本数据与理论分布无显著差异。
对立假设(H1)
样本数据与理论分布存在显著差异。
计算检验统计量
统计量计算
根据样本数据和理论分布的性质,计 算相应的统计量,如卡方统计量、熵 值统计量等。
统计量性质
了解统计量的分布特性,以便后续的 临界值判断。
斯皮尔曼秩检验
总结词
斯皮尔曼秩检验是一种非参数拟合优度检验方法,用于检验观测频数与期望频数之间的差异是否显著 。
详细描述
斯皮尔曼秩检验基于秩次,通过将观测频数与期望频数按照大小排序,并计算秩次之差得到秩次统计 量。在自由度等于分类数减一的情况下,秩次统计量服从F分布。通过比较秩次统计量与临界值,可 以判断观测频数与期望频数是否存在显著差异。
Chapter
皮尔逊卡方检验
总结词
皮尔逊卡方检验是最常用的拟合优度检验方法之一 ,用于检验观测频数与期望频数之间的差异是否显 著。
详细描述
皮尔逊卡方检验基于卡方分布,通过计算观测频数 与期望频数的离差平方和,得到卡方统计量。在自 由度等于分类数减一的情况下,卡方统计量服从卡 方分布。通过比较卡方统计量与临界值,可以判断 观测频数与期望频数是否存在显著差异。
线性回归模型的拟合优度检验方法分析PPT(18张)

§3 线性回归模型的拟合优度 检验
说明
回归分析是要通过样本所估计的参数来代替总体 的真实参数,或者说是用样本回归线代替总体回归 线。尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体 的参数真值,但在一次抽样中,估计值不一定就等 于该真值。那么,在一次抽样中,参数的估计值与 真值的差异有多大,是否显著,这就需要进一步进 行统计检验。主要包括拟合优度检验、变量的显著 性检验及参数的区间估计。
TSS=ESS+RSS
Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回 归线(ESS),另一部分则来自随机势力 (RSS)。
在给定样本中,TSS不变,如果实际观测点 离样本回归线越近,则ESS在TSS中占的比重 越大,因此定义拟合优度:回归平方和ESS与 Y的总离差TSS的比值。
•
18、无论是对事还是对人,我们只需要做好自己的本分,不与过多人建立亲密的关系,也不要因为关系亲密便掏心掏肺,切莫交浅言深,应适可而止。
•
19、大家常说一句话,认真你就输了,可是不认真的话,这辈子你就废了,自己的人生都不认真面对的话,那谁要认真对待你。
•
20、没有收拾残局的能力,就别放纵善变的情绪。
•
9、这世上没有所谓的天才,也没有不劳而获的回报,你所看到的每个光鲜人物,其背后都付出了令人震惊的努力。请相信,你的潜力还远远没有爆发出来,不要给自己的人生设限,你自以为的极限,只是别人的起点。写给渴望突破瓶颈、实现快速跨越的你。
•
10、生活中,有人给予帮助,那是幸运,没人给予帮助,那是命运。我们要学会在幸运青睐自己的时候学会感恩,在命运磨练自己的时候学会坚韧。这既是对自己的尊重,也是对自己的负责。
说明
回归分析是要通过样本所估计的参数来代替总体 的真实参数,或者说是用样本回归线代替总体回归 线。尽管从统计性质上已知,如果有足够多的重复 抽样,参数的估计值的期望(均值)就等于其总体 的参数真值,但在一次抽样中,估计值不一定就等 于该真值。那么,在一次抽样中,参数的估计值与 真值的差异有多大,是否显著,这就需要进一步进 行统计检验。主要包括拟合优度检验、变量的显著 性检验及参数的区间估计。
TSS=ESS+RSS
Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回 归线(ESS),另一部分则来自随机势力 (RSS)。
在给定样本中,TSS不变,如果实际观测点 离样本回归线越近,则ESS在TSS中占的比重 越大,因此定义拟合优度:回归平方和ESS与 Y的总离差TSS的比值。
•
18、无论是对事还是对人,我们只需要做好自己的本分,不与过多人建立亲密的关系,也不要因为关系亲密便掏心掏肺,切莫交浅言深,应适可而止。
•
19、大家常说一句话,认真你就输了,可是不认真的话,这辈子你就废了,自己的人生都不认真面对的话,那谁要认真对待你。
•
20、没有收拾残局的能力,就别放纵善变的情绪。
•
9、这世上没有所谓的天才,也没有不劳而获的回报,你所看到的每个光鲜人物,其背后都付出了令人震惊的努力。请相信,你的潜力还远远没有爆发出来,不要给自己的人生设限,你自以为的极限,只是别人的起点。写给渴望突破瓶颈、实现快速跨越的你。
•
10、生活中,有人给予帮助,那是幸运,没人给予帮助,那是命运。我们要学会在幸运青睐自己的时候学会感恩,在命运磨练自己的时候学会坚韧。这既是对自己的尊重,也是对自己的负责。
生物统计学课件--9拟合优度检验

二、测验的目的:
通过实测值判断试验结果是否与某总体分布、某理论、模型或 假说等相吻合。
三、自由度的确定: df = k-1,其中 k 为属性性状的分组数,在例1中, 按花色将大豆分成两组,则 k = 2,df = 1。 四、应用实例:
例3:以紫花大豆和白花大豆品种杂交,在 F2 代共得到 289株,其中紫花208 株,白花81株,如果花色受一对等 位基因控制,则根据遗传学理论, F2 代紫花与白花植株 的分离比应为3:1,问现在的试验结果是否符合一对等 位基因的遗传规律? 分析:①属性性状:紫花、白花,
例4:黄圆豌豆与绿皱豌豆杂交,第二代分离数目如下:
Y-R黄圆 315 Y-rr 黄皱 101 yyR绿圆 108 yyrr 绿皱 32 总数 556
问试验结果是否符合自由组合律?
解:若性状间相互独立,根据孟德尔的自由组合律,则可以
有:
Y R : Y rr : yyR : yyrr 9 : 3 : 3 : 1
这一类数据的特点是都属于离散型数据,是通过数 数的办法获得的原始数据,它们不再符合基于正态 分布的 u分布、t分布和 F分布等,因此也就不能再 用基于正态分布的u检验、t检验、F检验等对数据进 行统计推断,而必须引入新的检验方法,这就是我 们即将给大家介绍的新内容:
拟和优度检验
第六章
一、什么是拟合优度检验 1、概念
208 216.75
216.75
2
81 72.25
72.25
2
1.4129
查表,df = k-1 = 2-1 =1 时, ∵
2 1, 0.05
3.841
2
2 1, 0.05
∴接受 H0:O =T,
通过实测值判断试验结果是否与某总体分布、某理论、模型或 假说等相吻合。
三、自由度的确定: df = k-1,其中 k 为属性性状的分组数,在例1中, 按花色将大豆分成两组,则 k = 2,df = 1。 四、应用实例:
例3:以紫花大豆和白花大豆品种杂交,在 F2 代共得到 289株,其中紫花208 株,白花81株,如果花色受一对等 位基因控制,则根据遗传学理论, F2 代紫花与白花植株 的分离比应为3:1,问现在的试验结果是否符合一对等 位基因的遗传规律? 分析:①属性性状:紫花、白花,
例4:黄圆豌豆与绿皱豌豆杂交,第二代分离数目如下:
Y-R黄圆 315 Y-rr 黄皱 101 yyR绿圆 108 yyrr 绿皱 32 总数 556
问试验结果是否符合自由组合律?
解:若性状间相互独立,根据孟德尔的自由组合律,则可以
有:
Y R : Y rr : yyR : yyrr 9 : 3 : 3 : 1
这一类数据的特点是都属于离散型数据,是通过数 数的办法获得的原始数据,它们不再符合基于正态 分布的 u分布、t分布和 F分布等,因此也就不能再 用基于正态分布的u检验、t检验、F检验等对数据进 行统计推断,而必须引入新的检验方法,这就是我 们即将给大家介绍的新内容:
拟和优度检验
第六章
一、什么是拟合优度检验 1、概念
208 216.75
216.75
2
81 72.25
72.25
2
1.4129
查表,df = k-1 = 2-1 =1 时, ∵
2 1, 0.05
3.841
2
2 1, 0.05
∴接受 H0:O =T,
生物统计学课件拟合优度检验1

3)
df=(2-1)×(2-1)=1
2 ( 58 61.95 0.5)2 ( 40 36.05 0.5)2 ( 64 60.05 0.5)2
61.95
36.05
60.05
( 31 34.95 0.5)2
0.19213 0.33017 0.19821 0.34056 1.061
第五章 拟合优度检验
一、概念: 用来检验实际观测数与理论 数之间的一致性。
多数用于非连续性数据的检验
二、Χ2检验
(一) 在一个总体中进行随机抽样,n为样本含量,具有 r种不同属性出现(或可分为r组),Oi为样本中第i种属性出 现的次数的观察值,T为i样本中第i种属性出现次数的理论值, 则Pearson统计量定义为:
2 r (Oi Ti )2
i1
Ti
df=r-1
如果样本来自理论总体,那么Oi和Ti之间的差异就只是 随机误差,则有随n的增加渐近于自由度为r-1的χ2分布。
(二)连续性矫正
若自由度为1,则应作连续性矫正,即把统计量改为:
2 r ( Oi Ti 0.5)2
i1
Ti
任何一组的理论值都必须大于5,否则需要合 并组或增加样本量
理论数T
9/16*179 3/16*179 3/16*179 1/16*179
2 4 (Oi Ti )2
i 1
Ti
(96100.6875)2 (37 33.5625)2 (31 33.5625)2 (1511.1875)2
100.6875
33.5625
33.5625
11.1875
0.2182 0.3521 0.19561.2992
属性(x) 红米非糯(0) 红米糯(1) 白米非糯(2) 白米糯(3)
[课件]第07章 拟合优度检验PPT
![[课件]第07章 拟合优度检验PPT](https://img.taocdn.com/s3/m/67e50b4a25c52cc58bd6beb9.png)
解:假设3种方法增重不显著。 2lnP服从2自由度的x2分布
判断: x2=13.90 > x26, 0.05=12.592 ,拒绝假设
解:假设两种饲料饲养增重没差异。 因为有一个值为0,所以可以直接计算组合概率。
5 ! 6 ! 4 ! 7 ! P 0 . 015 判断:计算的P=0.015 < P=0.025 11 ! 4 ! 1 ! 0 ! 6 !
拒绝假设。
第七章 拟合优度检验——x2-检验
三、独立性检验——列联表x2检验
(无重复试验x2检验)
例题分析 精确列联表x2检验对于2×2列联表
性别 有 无 小计 例7.6 观测性别对药物的 4 1 5 男 0组合的概率都计入, 反应见右侧表: 之所以将这种组合的概率以及最小值变为 3 6 9 女 问男女对药物反应有无差异? 是因为这样才能构成一个尾区的概率。 7 7 14 解:假设男女对药物反应没差异。 小计
判断:接受假设。
第七章 拟合优度检验——x2-检验
四、x2的可加性
(一) x2的齐性检验
例1 试验绿玉米G对黄玉米Y的理论比为3:1。共收集了11个 谱系,每一个谱系的x2值都不具显著性,即都可能是从3:1 的总体中抽取的,问这11个谱系是否具齐性? 绿x2 +黄x2 解:假设具齐性。 3 1
Ni 4 Ni 4
第七章 拟合优度检验——x2-检验
二、一致性检验 解:假设该试验结果符合自由组合律。
有许多质量性状表型比值为: 9 1:1, 3 32:1, 1 3:1, 9:7, 13:3, Y-R-:Y-rr:yyR-:yyrr= : : :2 15:1, 63:1, 1:2:1, 9:3:3:1 对这些试验进行检验, 16 等。用 16 16x 16 都属适合度检验,它们的共同特点是总体参数概率 φ已知。 根据公式计算理论值 T =NP ,此例中N=556
卡方-拟合优度检验PPT课件

求各组内的理论次数不小于5。若某组的理论次数小 于5,则应把它与其相邻的一组或几组合并,直到理 论次数大 于5 为止。
精选ppt课件最新
13
• 统计量:
2 r (Oi Ti )2
i1
Ti
• 使用条件:
– 各理论值均大于5。 – 若自由度为1,则应作连续性矫正:
r
2
(Oi Ti 0.5)2
i1
精选ppt课件最新
27
(二)拟合优度检验按已知的属性分类理论或学说, 计算理论次数。独立性检验在计算理论次数时没有现 成的理论或学说可资利用,理论次数是在两因子相互 独立的假设下进行计算。
(三)在拟合优度检验中确定自由度时,只有一个 约束条件:各理论次数之和等于各实际次数之和,自 由度为属性类别数减1。而在r×c列联表的独立性检 验中,共有rc个理论次数,但受到以下条件的约束:
而另一组实际观察次数为26理论次数为21相差亦为了弥补b这一不足将各差数平方除以相应的理论次数后再相加并记之为也就是说2是度量实际观察次数与理论次数偏离程度的一个统计量2越小表明实际观察次数与理论次数越接近
生物统计学
第七章 拟合优度检验- 2检验
精选ppt课件最新
1
§7.1、拟合优度检验的一般原理
若20.05≤2 (或2c)<20.01, 若2 ( 或2c)≥20.01,
精选ppt课件最新
18
7.2.2 对二项分布的检验(P93)
下面结合实例说明适合性检验方法。
(总体参数已知 )
【例】 在研究牛的毛色和角的有无两对相对性状分离
现象时 ,用黑色无角牛和红色有角牛杂交 ,子二代出 现黑色无角牛192头,黑色有角牛78头,红色无角牛72 头,红色有角牛18头,共360头。试 问这两对性状是否 符合孟德尔遗传规律中9∶3∶3∶1的遗传比例?
精选ppt课件最新
13
• 统计量:
2 r (Oi Ti )2
i1
Ti
• 使用条件:
– 各理论值均大于5。 – 若自由度为1,则应作连续性矫正:
r
2
(Oi Ti 0.5)2
i1
精选ppt课件最新
27
(二)拟合优度检验按已知的属性分类理论或学说, 计算理论次数。独立性检验在计算理论次数时没有现 成的理论或学说可资利用,理论次数是在两因子相互 独立的假设下进行计算。
(三)在拟合优度检验中确定自由度时,只有一个 约束条件:各理论次数之和等于各实际次数之和,自 由度为属性类别数减1。而在r×c列联表的独立性检 验中,共有rc个理论次数,但受到以下条件的约束:
而另一组实际观察次数为26理论次数为21相差亦为了弥补b这一不足将各差数平方除以相应的理论次数后再相加并记之为也就是说2是度量实际观察次数与理论次数偏离程度的一个统计量2越小表明实际观察次数与理论次数越接近
生物统计学
第七章 拟合优度检验- 2检验
精选ppt课件最新
1
§7.1、拟合优度检验的一般原理
若20.05≤2 (或2c)<20.01, 若2 ( 或2c)≥20.01,
精选ppt课件最新
18
7.2.2 对二项分布的检验(P93)
下面结合实例说明适合性检验方法。
(总体参数已知 )
【例】 在研究牛的毛色和角的有无两对相对性状分离
现象时 ,用黑色无角牛和红色有角牛杂交 ,子二代出 现黑色无角牛192头,黑色有角牛78头,红色无角牛72 头,红色有角牛18头,共360头。试 问这两对性状是否 符合孟德尔遗传规律中9∶3∶3∶1的遗传比例?
拟合优度的卡方检验PPT共29页

39、没有不老的誓言,没有不变的承 诺,踏 上旅途 ,义无 反顾。 40、对时间的价值没有没有深切认识 的人, 决不会 坚韧勤 勉。
谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应36、“不可能”这个字(法语是一个字 ),只 在愚人 的字典 中找得 到。--拿 破仑。 37、不要生气要争气,不要看破要突 破,不 要嫉妒 要欣赏 ,不要 托延要 积极, 不要心 动要行 动。 38、勤奋,机会,乐观是成功的三要 素。(注 意:传 统观念 认为勤 奋和机 会是成 功的要 素,但 是经过 统计学 和成功 人士的 分析得 出,乐 观是成 功的第 三要素 。
谢谢你的阅读
❖ 知识就是财富 ❖ 丰富你的人生
71、既然我已经踏上这条道路,那么,任何东西都不应妨碍我沿着这条路走下去。——康德 72、家庭成为快乐的种子在外也不致成为障碍物但在旅行之际却是夜间的伴侣。——西塞罗 73、坚持意志伟大的事业需要始终不渝的精神。——伏尔泰 74、路漫漫其修道远,吾将上下而求索。——屈原 75、内外相应36、“不可能”这个字(法语是一个字 ),只 在愚人 的字典 中找得 到。--拿 破仑。 37、不要生气要争气,不要看破要突 破,不 要嫉妒 要欣赏 ,不要 托延要 积极, 不要心 动要行 动。 38、勤奋,机会,乐观是成功的三要 素。(注 意:传 统观念 认为勤 奋和机 会是成 功的要 素,但 是经过 统计学 和成功 人士的 分析得 出,乐 观是成 功的第 三要素 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由度为 k-r-1=7。由
22.15 2 k2r1( ) 18.48.
于是,拒绝原假设,即认为棉纱拉力强
度不服从正态分布。
χ 2检验的一个著名应用例子是孟德尔豌豆 实验。奥地利生物学家孟德尔在1865年发表的 论文,事实上提出了基因学说,奠定了现代遗 传学的基础。他的这项伟大发现的过程有力地 证明了统计方法在科学研究中的作用。因此, 我们有必要在这里将这一情况介绍给大家。
§8.4 拟合优度检验
在前面的讨论中,我们总假定总体的分 布形式是已知的。例如,假设总体分布为正
态分布 N(, 2), 总体分布为区间 (a, b) 上的
均匀分布,等等。
然而,在实际问题中,我们所遇到的总 体服从何种分布往往并不知道。需要我们先 对总体的分布形式提出假设,如:总体分布
是正态分布N( , 2),总体分布是区间(a, b)
上均匀分布等,然后利用数据 (样本) 对这一 假设进行检验,看能否获得通过。
解决这类问题的方法最早由英国统计学 家K. Pearson (皮尔逊) 于1900年在他发表的 一篇文章中给出, 该方法后被称为Pearson χ 2 检验法,简称χ 2检验。
这是一项非常重要的工作, 许多学者视它为近代统计学的 开端。
设F(x)为一已知的分布函数,现有样本 X1, X2, …, Xn,但我们并不知道样本的总体分 布是什么。现在试图检验
H0:总体X的分布函数为F(x) ; (1)
对立假设为H1:总体 X 的分布函数非F(x)。 如果F(x)形式已知,但含有未知参数θ 或参
数向量θ =(θ1, θ2,…, θr ) ,则记其为F(x,θ )。
(3). 计算各子区间 Ii 上的实际频数 fi 。
fi =﹟{ X1, X2, …, Xn ∈ Ii } , i=1, 2, …, k .
计数符号,取集 合中的偏差平方和。
2
k
[
i1
fi
npi (ˆ)]2 npi (ˆ)
,
( 2)
每一项用npi (ˆ) 去除的其目的是:缩小理论
μˆ X 1.41, σˆ2 n 1 S 2 0.262. n
(1). 先将数据Xi 分成13组,每组落入一个区 间,区间的端点为:a0 , a1 0.64,
a2 0.78, ,a12 2.18,a13 .
(2). 计算数据落入各子区间的理论频数。
因分布中含有两个未知参数,所以,理论
在实用上,一般要求n ≥ 50,以及所有
npi ≥5。如果初始子区间划分不满足后一个 条件, 则适当地将某些子区间合并,可使npi 满足上述要求。
例1:为检验棉纱的拉力强度X(单位: 千克) 服 从正态分布,从一批棉纱中随机抽取300条进 行拉力试验,结果列在表8.2中。给定α= 0.01, 检验假设
频数只能近似地估计。落入第 i 个子区间Ii 的理论频数的估计为 npˆi , 其中
pˆ i
pˆi (ˆ,ˆ
2)
ai 1.41 0.26
ai1 1.41, 0.26
i 1,2, ,13.
因 npˆ1 0.46,npˆ2 1.85,npˆ12 1.85,npˆ13 0.46, 而 npˆ3, ,npˆ11 均大于5,所以,我们将前两组和
孟德尔在关于遗传问题的研 究中,用豌豆做实验。豌豆有黄 和绿两种颜色,在对它们进行两 代杂交之后,发现一部分杂交豌 豆呈黄色,另一部分呈绿色。其 数目的比例大致是 3:1。
孟德尔把他的实验重复了多次,每次都 得到类似结果。
这只是一个表面上的统计规律。但它启 发孟德尔去发展一种理论,以解释这种现象。 他大胆地假定存在一种实体,即现在我们称 为“基因”的东西,决定了豌豆的颜色。这 基因有黄绿两个状态,一共有四种组合:
(2). 计算各子区间 Ii 上的理论频数。
如果总体的分布函数为F(x,θ ),那么每个
点落在区间 Ii 上的概率均为
pi ( ) F(ai , ) F(ai1, ), i 1,2, ,k.
n个点中,理论上有npi (θ )个点落在 Ii 上, (称为理论频数)。当分布函数中含有未知
参数θ 时,理论频数也未知,要用 npi (ˆ) 来估计npi (θ ),其中 ˆ 为θ 的极大似然估。
频数比较大的那些项在和式中的影响力。
可以证明:在 H0 成立,且n→∞时,
2
2 k -r-1
,
( 3)
即 2统计量的分布收敛到自由度为k r 1
的 2分布,k是子区间数,r是参数个数。
(5). H0的显著性水平为α的检验的拒绝域为
2 k2-r-1 ( ),
( 4)
注意:该检验方法是在 n 充分大时使用 的,因而,使用时要注意 n必须足够地大, 以及 npi 不能太小这两个条件。
这种检验通常称为拟合优度检验。
不妨设总体 X 是连续型分布。检验思想 与步骤如下:
(1). 将总体X的取值范围分成k个互不重叠的 小区间 I1, I2, …, Ik, I1 (a0,a1],I2 (a1,a2], ,Ik (ak 1,ak ],
a0 a1 a2 ak 1 ak .
H0:拉力强度 X ~ N(μ, σ2) .
解:本例中,并未给出各观测值 Xi 的具体值, 只给出了各观测值的取值范围,这样的数据
称为区间数据。样本均值与样本方差可通过
下列式计算:
X
1
n
k i1
ni
ai1 2
ai
,
S2
n
1
1
k
i1
ni
ai1 2
ai
2
nX
2
.
对正态总体N (μ,σ 2), 和 σ 2 的 极大似然估计为
(黄, 黄),(黄, 绿),(绿, 黄),(绿, 绿).
(黄, 黄),(黄, 绿),(绿, 黄),(绿, 绿).
孟德尔认为, 前三种配合使豆子呈黄色, 而第四种配合使豆子呈绿色。从古典概率的 观点看,黄色豆子出现的概率为3/4,绿色豆 子出现的概率为1/4。这就解释了黄绿颜色豆 子之比为什么总是接近 3:1 这个观察结果。
最后两组合并成一组(见表8.3)。
(3). 计算数据落入各子区间上的实际频数 fi 。
fi =﹟{ X1, X2, …, Xn ∈ Ii } , i=1, 2, …, 10 .
(4). 计算检验统计量的值
2 k [ fi npˆi ]2
i1 npˆi
22.15.
(5). H0的显著性水平为α 的检验 因为k=10,r=2,所以上述 χ 2分布的自