生物统计第七章拟合优度检验
拟合优度检验课件
![拟合优度检验课件](https://img.taocdn.com/s3/m/3200216086c24028915f804d2b160b4e767f81b1.png)
为了解决上述问题,以 Ti 为权求加权值
自由度的确定
变量之间存在着一个制约关系: 故统计量 渐近 (k-1) 个自由度的 分布。
在 F(x) 尚未完全给定的情况下,每个未知参数用相应的估计量代替,就相当于增加一个制约条件,因此,自由度也随之减少一个。
1
若有 r 个未知参数需用相应的估计量来代替,自由度就减少 r 个。
【例1】
子二代
子一代
…
黄色纯系
…
绿色纯系
他的一组观察结果为:
黄70,绿27
近似为2.59:1,与理论值相近。
根据他的理论,子二代中,黄、绿之比 近似为3:1,
添加标题
提出假设H0: O-T=0 (p1=3/4,p2=1/4)
添加标题
这里,n=70+27=97,k=2,
添加标题
检验孟德尔的3:1理论:
04解:05 Nhomakorabea将有关计算结果列表如下:
06
因H0所假设的理论分布中有一个未知参数 λ,故自由度为4-1-1=2。
将npi < 5的组予以合并,即将发生3次及4次战争的组归并为一组。
按α =0.05,自由度为4-1-1=2,查表得: 统计量: 未落入拒绝域。 故认为每年发生战争的次数 X 服从参数为 0.69的泊松分布。
【例】下表给出不同给药方式与给药效果,求证:给药方式与给药效果有无关联。
若事件 A 和事件 B 是相互独立的,则
提出零假设:假设实测数与理论数无差异。即H0:O-T=0。 计算理论数:若事件 A 和事件 B 是相互独立的,则 P(AB)=P(A)P(B)。 例如:在给药方式和效果之间是相互独立的前提下,计算口服(事件B)有效(事件A)的概率 P(BA)=P(B)P(A) = (98/193) (122/193)。其理论数T1=(98/193)(122/193) 193 = (98)(122)/193 。 每个理论值用Tij表示,Tij=(i行总数)(j列总数)/总数。
第七章 拟合优度检验
![第七章 拟合优度检验](https://img.taocdn.com/s3/m/c605fc17cf84b9d528ea7a7c.png)
• 1.拟合优度检验的一般原理(※)
• 2.拟合优度检验 • 3.独立性检验
难点
统计学家推荐的拟合检验方法是: Shapiro-Wilk检验 Kolmogorov-Smirnov检验
7.3 独立性检验
难点
一、列联表的独立性检验
原理:Pearson定理
用途:检验事物之间的独立性
1. 2×2列联表检验 2. r×c列联表检验
四格表资料的基本形式
处理组
甲 乙 合计
阳性事件发 阳性事件未发
生数
生数
a
b
c
d
a+c
b+d
合计
a+b c+d
n
四格表的前提条件:双边固定
1 . 2 2列联表(四格表 fourfold table)
处理 方式
口服
效 有效 a
果 无效 b
2 2列联表
注射 c
d
自由度 df = 1
四个表资料 检验的专用公式:
和前面的结果 一样
2
(ad bc)2 n
(a b)(c d)(a c)(b d)
需要解决的问题:
1.用古典概型求2 2列联表出现某一组数值的概率 2.离散分布尾区建立的方法。
1. 2 2列联表概率的计算方法
a
b
a+bcdc+da +c b +d
N
2.离散分布尾区概率的计算方法:
从实际观测值开始,把对 成立不利的方向上 的概率全加起来,作为尾区概率。
3. 2 2列联表的精确检验
Goodness Of Fit Test
※7.1 拟合优度检验的一般原理 7.2 拟合优度检验 7.3 独立性检验(难点)
生物统计学 拟合优度检验与列联表卡方检验
![生物统计学 拟合优度检验与列联表卡方检验](https://img.taocdn.com/s3/m/7d4a193c31126edb6f1a1055.png)
点击Analyze——Nonparametric Tests非参数 检验——Chi-Square检验(卡方检验)
正态分布、二项式分布
学习小组任务
自学例7.1(p129),讲解该例题。
自学例7.3(p134),讲解该例题。
自学例7.5和例7.6(p136),讲解该例
生物统计学
Biostatistics
第七章 拟合优度检验与列 联表卡方检验
Goodness of Fit Test & Contingency Table χ2 Test
2013.4
§7.1 一般原理
拟合优度检验(goodness of fit test) 一致性 实际观测数 理论数
判断事件之间 的独立性
自学例7.3(p134),讲解该例题。
自学例7.5和例7.6(p1பைடு நூலகம்6),讲解该例
题。
作业
P139
7.11,7.12, 7.16
请翻译以下术语/Try
to translate these terms
please: 拟合优度检验,Contingency Table χ2 Test, 2×2列联表
学习小组任务
自学例7.1(p129),讲解该例题。
自学例7.3(p134),讲解该例题。
自学例7.5和例7.6(p136),讲解该例
题。
没有理论数可言
独立事件
非独立事件
1、理论数是否小于5?
2、自由度是否为1?
P>0.05
P<0.05
学习小组任务
自学例7.1(p129),讲解该例题。
题。
二项分布的拟合优度检验
拟合优度检验
![拟合优度检验](https://img.taocdn.com/s3/m/e71b6d212af90242a895e527.png)
计算上例的χ 值并做推断。先计算各理论数Ti。
2
给药方式 口服
(B )
有效( A )
O1=58 ( 98)(122 ) = 61.95 T1 = 193 O3=64 ( 95)(122 ) = 60.05 T3 = 193
无效( A )
总数
T2
( 98)( 71) = 36.5 =
193
O4=31 ( 95)( 71)
列联表中的数据可以用以下符号表示: a c a+c b d b+d a+b c+d N
在行总数和列总数及N都保持不变的情况下,a、b、c、d的各种组合 的概率可以由下式给出:
P=
( a + b )!( c + d )!( a + c )!( d + b )!
N !a !b !c !d !
零假设:不存在处理效应。若P > α 则接受零假设;反之则拒绝。 若a、b、c、d中的任何一个出现0时,则直接用该概率值作为判断标 准。若无,则应当将这个组合的概率以及从最接近于0的哪个观测值到 0的各种组合的概率都计入。这样才能构成一个尾区的概率。
将以上数据列成下表:
Y_R_ 实际观测数O 理论频率p 理论数T O-T (O-T) 2/ T 315 9/16 312.75 2.25 0.016
Y_rr 101 3/16 104.25 -3.25 0.101
yyR_ 108 3/16 104.25 3.75 0.135
yyrr 32 1/16 34.75 -2.75 0.218
2. 总体参数未知 例 调查到幼儿园接小孩的家长性别,以10人为一组,记录每组女性的人数,共得到
100组,列入下表的第2列中。问女性家长人数是否符合二项分布。 解:人群中男女比率各 占一半,但去接小孩的 家长中是否也是这个比 率就不一定。因此二项 分布的参数ϕ 是未知 的,需从样本数据估 计。
拟合优度检验-
![拟合优度检验-](https://img.taocdn.com/s3/m/bec088ea910ef12d2af9e752.png)
的 分 离 现 象 符 合 孟 德 尔遗传规律中9∶3∶3∶1 的遗传比例。
例7.1;7.2(P93;94)
• 总体参数未知 例P95,表7-1 不同之处:要由样本估计出总体参数。
7.2.3 对正态分布的检验(P96) 7.2.4 其他类型问题的检验(P97)
表
性别
动物性别实际观察次数与理论次数
实际观察 理论次 次数Oi 数Ti O i-T i (Oi-Ti)2/Ti
雌
雄 合计
428
448 876
438
438 876
-10
10 0
0.2283
0.2283 0.4563
从上表可以看到 ,实际观察次数与理论次数存在
一定的差异。 这个差异是属于抽样误差、还是其性别
§7.3、独立性检验
7.3.1 列联表2 检验(P97)
一、独立性检验的意义
对次数资料,除进行拟合优度检验外,有时需 要分析两类因子是相互独立还是彼此相关。如研究 两类药物对实验动物某种疾病治疗效果的好坏,先 将动物分为两组,一组用第一种药物治疗,另一组 用第二种药物治疗,然后统计每种药物的治愈头数 和未治愈头数。
当自由度大于1时,原公式的2分布与连续型随机
变量2分布相近似,这时,可不作连续性矫正,但要
求各组内的理论次数不小于5。若某组的理论次数小 于5,则应把它与其相邻的一组或几组合并,直到理 论次数大 于5 为止。
• 统计量:
(Oi Ti ) Ti i 1
2 r
2
• 使用条件:
– 各理论值均大于5。 – 若自由度为1,则应作连续性矫正:
比例发生了实质性的变化?
要回答这个问题: ①首先需要确定一个统计量用以表示实际观察次数与 理论次数偏离的程度; ②然后判断这一偏离程度是否属于抽样误差,即进行 显著性检验。
卡方-拟合优度检验
![卡方-拟合优度检验](https://img.taocdn.com/s3/m/50a26d42011ca300a6c390bf.png)
黑色无角牛的理论次数T1:360×9/16=202.5;
黑色有角牛的理论次数T2:360×3/16=67.5; 红色无角牛的理论次数T3:360×3/16=67.5;
红色有角牛的理论次数T4:360×1/16=22.5。
或 T4=360-202.5-67.5-67.5=22.5
(四)列表计算2
表 2计算表
~ 2 (n);
2
若用样本平均数
量
n
x 代替总体平均数μ,则随机变
2 i
x
2
(x x)
i 1
2
(n 1) S 2
2
服从自由度为n-1的2分布,记为
(n 1) S
2
~
2
2
( n 1)
显 然 ,2≥0 , 即 2 的 取 值 范 围 是[0,+∞;2 分布密度曲线是随自由度不同而改变的一组曲线。随 自由度的增大, 曲线由偏斜渐趋于对称;df≥30时, 接近正态分布。下面给出了几个不同自由度的2概率 分布密度曲线。
比例发生了实质性的变化?
要回答这个问题: ①首先需要确定一个统计量用以表示实际观察次数与 理论次数偏离的程度; ②然后判断这一偏离程度是否属于抽样误差,即进行 显著性检验。
为了度量实际观察次数与理论次数偏离程度:
A:最简单的办法是求出实际观察次数与理论次数的 差数。如上表:O1-T1 =-10,O2-T2=10,由于这两个 差数之和为0,显然此方法不可行; B:计算∑(O-T)2,其值越大,实际观察次数与理论次 数相差亦越大,反之则越小。但尚有不足。例如某一 组 实 际 观 察 次 数为505、理论次数为500,相差5; 而另一组实际观察次数为26、 理论次数为21,相差亦 为 5。
第7章 拟合优度检验
![第7章 拟合优度检验](https://img.taocdn.com/s3/m/540ebbf47c1cfad6195fa7ed.png)
§7.1拟合优度检验的一般原理 拟合优度检验的一般原理
7.1.1 什么是拟合优度检验
拟合优度检验( 拟合优度检验(goodness of fit test) ) 是用来检验实际观测数与依照某种假设或模型 计算出来的理论数之间的一致性,以便判断该 计算出来的理论数之间的一致性, 假设或模型是否与观测数相配合。拟合优度检 假设或模型是否与观测数相配合。 验也会出现Ⅰ型错误(弃真) 验也会出现Ⅰ型错误(弃真)和Ⅱ型错误(取伪)。 型错误(取伪)
上一张 下一张 主 页 退 出
7.2.2 对二项分布的检验 1.总体参数 ϕ 已知 纯合的黄圆豌豆与绿皱豌豆杂交,F 例7.1 纯合的黄圆豌豆与绿皱豌豆杂交,F1 代自交,第二代分离数目如下: 代自交,第二代分离数目如下:
Y_R_ (黄圆) 黄圆) 315 Y_rr (黄皱) 黄皱) 101 yyR_ yyR_ (绿圆) 绿圆) 108 yyrr (绿皱) 绿皱) 32 556
χ2检验是对一个正态总体的标准差所作的检验。 检验是对一个正态总体的标准差所作的检验。
引例: 引例: 根据遗传学理论,动物的性别比例是1:1。 根据遗传学理论,动物的性别比例是1:1。 统计某羊场一年所产的876只羔羊中 只羔羊中, 统计某羊场一年所产的876只羔羊中,有 公羔428只 母羔448只 1:1的性别 公羔428只,母羔448只。按1:1的性别 比例计算, 母羔均应为438只 比例计算,公、母羔均应为438只。以A 表示实际观察次数, 论次数, 表示实际观察次数,T 表 示 理 论次数, 可将上述情况列成表7 可将上述情况列成表7-1。
从上述结果可以看出,矫正后的χ2比矫正前 从上述结果可以看出, 的低,若未加矫正,就已经接受H0,矫正后的χ2 的低,若未加矫正,就已经接受H 更低,不会影响结论,可以不加矫正。若未矫正 更低,不会影响结论,可以不加矫正。 时χ2> χ2α,一定要计算矫正的χ2。
生物统计学-7
![生物统计学-7](https://img.taocdn.com/s3/m/f1ae8aea172ded630b1cb66f.png)
此统计量在n充分大时近 似服从2分布,要求每一 组内的理论数不得小于5。
表
实际观察次数Oi
犊牛性别实际观察次数与理论次数
理论次数Ti
Oi - Ti
4
( Oi - Ti )2/
Ti
38(O1) 34(T1) 0.4706
30(O2) 68
34(T2) 68
-4 0
0.4706 0.9412
返回本节
间无差异。即认为有效或无效与给药方式无关联。
2)求理论值:根据事件的概率法则,若事件A和事件B
是相互独立的,则有
P( AB) P( A) P( B)
98 122 P( BA) P( B) P( A) ( )( ) 193 193
在零假设的基础上,有:
其理论数T1可由理论频数乘以总数得出:同样可求出 其它理论数。
共获得n个独立的观测值,第i类观测值的数目为Oi,
O
i 1
k
i
n
k
O
i 1
k
i
38 30 68
第i类的概率为pi 。
p
i 1
i
1
p1=1/2, p2=1/2.
第i类的理论数为Ti,Ti=npi.则T1=T2=34。 于机会造成的
i 1 Oi与Ti进行比较,判断Oi与Ti之间总的不符合程度有否由
对二项分布的检验- p 未知
表中理论概率由二项分布概率计算公式:计算,如 10! 0 0 10 C10 p q 0.21750 0.782510 0.0861 10!0!
10! C pq 0.21751 0.78259 0.2392 9!1!
《拟合优度检验》课件
![《拟合优度检验》课件](https://img.taocdn.com/s3/m/e2f31a5f5e0e7cd184254b35eefdc8d377ee147b.png)
柯克伦科夫勒检验
总结词
柯克伦科夫勒检验是一种基于概率的拟合优度检验方法,用于检验观测频数与期望频数之间的差异是否显著。
详细描述
柯克伦科夫勒检验基于二项分布,通过计算观测频数与期望频数的离差平方和,得到柯克伦科夫勒统计量。在样 本量足够大的情况下,柯克伦科夫勒统计量近似服从正态分布。通过比较柯克伦科夫勒统计量与临界值,可以判 断观测频数与期望频数是否存在显著差异。
03
拟合优度检验的步骤
Chapter
确定检验假设
零假设(H0)
样本数据与理论分布无显著差异。
对立假设(H1)
样本数据与理论分布存在显著差异。
计算检验统计量
统计量计算
根据样本数据和理论分布的性质,计 算相应的统计量,如卡方统计量、熵 值统计量等。
统计量性质
了解统计量的分布特性,以便后续的 临界值判断。
斯皮尔曼秩检验
总结词
斯皮尔曼秩检验是一种非参数拟合优度检验方法,用于检验观测频数与期望频数之间的差异是否显著 。
详细描述
斯皮尔曼秩检验基于秩次,通过将观测频数与期望频数按照大小排序,并计算秩次之差得到秩次统计 量。在自由度等于分类数减一的情况下,秩次统计量服从F分布。通过比较秩次统计量与临界值,可 以判断观测频数与期望频数是否存在显著差异。
Chapter
皮尔逊卡方检验
总结词
皮尔逊卡方检验是最常用的拟合优度检验方法之一 ,用于检验观测频数与期望频数之间的差异是否显 著。
详细描述
皮尔逊卡方检验基于卡方分布,通过计算观测频数 与期望频数的离差平方和,得到卡方统计量。在自 由度等于分类数减一的情况下,卡方统计量服从卡 方分布。通过比较卡方统计量与临界值,可以判断 观测频数与期望频数是否存在显著差异。
第七章 拟合优度检验
![第七章 拟合优度检验](https://img.taocdn.com/s3/m/cb5d8c1710a6f524ccbf85c2.png)
例7.2
用正常翅的野生型果蝇(vg+ vg+ )与残翅(vg
vg )的果蝇杂交,F1代均表现正常( vg+
vg )。 F1自交,所得F2代中311个正常翅和
81个残翅。问这一分离比是否符合孟德尔
3:1的理论比。
正常翅
实际观测值 理论频率 311 3/4
残翅
81 1/4
总 数
392
理论数(未矫正)
第七章
第一节
拟合优度检验
拟合优度检验的一般原理
什么是拟合优度检验
拟合优度检验是用来检验实际观测数与依照某种假
设或模型计算出来的理论数之间的一致性,以便判 断假设或模型是否与观测数相配合。 包括两种类型,第一种是检验观测数与理论数之间 的一致性,第二种是通过检验观测数与理论数之间 的一致性来判断事件之间的独立性。
Y_R_
实际观测值 理论频率 理论数 O-T (O-T)2 (O-T)2/T 315 9/16 312.75 2.25 5.0625 0.016
Y_rr
101 3/16 104.25 -3.25
yyR_
108 3/16 104.25 3.75
yyrr
32 1/16 34.75 -2.75
10.5625 14.0625 7.5625 0.101 0.135 0.218
1、对数据进行分组
2、根据总体分布类型和样本含量计算理论数 3、有时需用样本数据估计总体参数。计所估计参数的 个数为a 4、分别合并两个尾区的理论数,使之不小于5,合并 后的组数计为k 5、相应于2的自由度为k-1,相对于3的自由度为k-1-a
6、零假设:因为拟合优度检验不是针对总体参数
第7章 拟合优度检验
![第7章 拟合优度检验](https://img.taocdn.com/s3/m/2ba00f6a783e0912a2162a92.png)
Chi-square统计量的极限分布
• 因为似然比的对数以卡方分布作为极限分 布,容易想见Chi-square统计量也以卡方分 布作为其极限分布。 • 定理 7.1 在零假设 square统计量有 下,Chi-
自由度修正
• 上面定理中零假设参数是给定的,但更多 的时候只是将分布的形式给出,参数需要 从数据中估计,这时候需要对自由度进行 修正 • 此时问题可以这样表述:理论分布F含有s 个位置参数,样本空间分割成k个互不相交 的区域, • 根据样本可以得到参数的估计值 由相应 的 构造chi-square统计量
KS检验的应用-GSEA
• Gene Set Enrichment Analysis (GSEA) • References
– Subramanian et al. PNAS 102:15546, 2005. – Tian et al. PNAS 102:13544, 2005. – Mootha et al. Nature Genetics 2003.
Overview of GSEA
• Given a prior defined gene set S , GSEA is to determine whether members of S are randomly distributed throughout the list, or primarily found at the top or bottom in the list. • Step of GSEA:
• Interpreting the results to gain insights into biological mechanisms remains a major challenge; • For a typical study (e.g., experimental condition vs. control, disease state vs. normal, tumor type A vs. tumor type B), a standard approach has been to produce a list of differentially expressed genes (DEGs);
生物统计学(第3版)杜荣骞 课后习题答案 第七章 拟合优度检验
![生物统计学(第3版)杜荣骞 课后习题答案 第七章 拟合优度检验](https://img.taocdn.com/s3/m/07a5a33310661ed9ad51f394.png)
第七章拟合优度检验7.12000年在5 760 295名成年人群中和1 596 734名儿童群体中严重CDH(先天性心脏病)和其他程度CDH的流行病学患者数如下表[36]:尚存活的成年人 2 205 21 358 23 563尚存活的儿童 2 316 16 663 18 979 合计 4 521 38 021 42 542检验在尚存活的成年人和儿童中受损害的程度,差异是否显著?答:这是2×2列联表χ2检验,使用程序如下:options linesize=76 nodate;data;do a=1 to 2;do b=1 to 2;input case @@;output;end;end;cards;2205 213582316 16663;proc freq formchar(1,2,7)='|-+';weight case;tables a*b/cellchi2 expected nocol norow nopercent chisq;title '2*2 Contingency Table Test';run;程序运行结果见下表:2*2 Contingency Table TestTABLE OF A BY BA BFrequency |Expected |Cell Chi-Square| 1| 2| Total---------------+--------+--------+1 | 2205 | 21358 | 23563| 2504.1 | 21059 || 35.72 | 4.2474 |---------------+--------+--------+2 | 2316 | 16663 | 18979| 2016.9 | 16962 || 44.347 | 5.2733 |---------------+--------+--------+Total 4521 38021 42542STATISTICS FOR TABLE OF A BY BStatistic DF Value Prob------------------------------------------------------Chi-Square 1 89.588 0.001Likelihood Ratio Chi-Square 1 89.070 0.001Continuity Adj. Chi-Square 1 89.289 0.001Mantel-Haenszel Chi-Square 1 89.586 0.001Fisher's Exact Test (Left) 2.21E-21(Right) 1.000(2-Tail) 4.20E-21Phi Coefficient -0.046Contingency Coefficient 0.046Cramer's V -0.046Sample Size = 42542从“A×B列联表的统计量”部分可以得出,连续性矫正的χ2显著性概率P=0.001,P <0.01,故拒绝H0,在尚存活的成年人和儿童中受损害的程度差异极显著。
生物统计第七章 拟合优度检验
![生物统计第七章 拟合优度检验](https://img.taocdn.com/s3/m/3ddd4e355727a5e9856a619e.png)
(三)
χ 2统计量的计算 2 K.Pearson根据的 定义,根据 属性性状资料的分布,推导出用 2 于次数资料分析的 公式
2
O E
E
2
上式中O为观察次数,E为理论次 数,自由度为df.
• 卡方分布
( n 1) S 2
2
~
2
( n 1)
图7-1
几个自由度的概率分布密度曲线
表 7—9
结核菌数 x(1) 0 1 2 3 4 5 6 7 8 9 总计
结核菌数服从波松分布适合性检验计算表
理论概率(3) 0.0506 0.1511 0.2253 0.2240 0.1671 0.0997 0.0496 5.9708 17.8298 26.5854 26.4320 19.7178 5.8528 2.4898 0.9322 0.3068 117.8820 0.7288 9.5818 0.1297 0.2611 0.1578 0.1768 0.0129 0.0071 0.0834 理论格子数(T)(4)
1.016 1.704 3.720 6.920 12.060 18.120 23.180 27.700 28.400 24.960 20.480 14.040 8.980 4.880 2.288 1.552 200.00 8.7308 8.72 0.3393 0.6252 0.3519 1.4467 1.6476 0.1043 1.5338 0.3703 0.0132 0.2736 0.1069 6.44 1.9680
• 1、先将资料(原始数据略)整理成次数分布 表,组限、组中值、各组的次数列于表7-7的 (1)、(2)、(3)栏,再将各组上限列于 第(4)栏中。 • 2、计算各组组上限与均数( x =65.6kg)之差, 列于第(5)栏。 • 3、计算校正标准差Sc。由于由分组资料求得 的标准差较不分组时所得标准差为大,故需作 校正。
生物统计学第7章拟合优度检验
![生物统计学第7章拟合优度检验](https://img.taocdn.com/s3/m/179b9382fc4ffe473268ab88.png)
7.1.2 拟合优度检验的统计量
• 拟合优度检验一般方法是: (1)将观测值分为k种不同的类别。 (2)共获得n个独立观测值,第i类观测值的数目为
Oi, (3)求第i类的概率Pi (4)第i类的期望数即理论数为Ti,Ti=nPi (5)Oi与Ti进行比较,判断二者之间总的不符合程
例7.3 表7-3是不同给药方式与给药效果表。
解:因为零假设是给药方式与给药效果之间无
关联,则口服与有效同时出现的理论频率应为
口服的频率与有效的频率的乘积, P(BA)=P(B)P(A)=(98/193)(122/193)。其理 论数 由理T论i 频率乘以总数得出,
Ti
( 98 )(122 )193 193 193
7.2.2 对二项分布的检验
1.总体参数已知 【例7.1】纯合的黄圆豌豆与绿皱豌豆杂交,F1代自交,第
二代分离数目如下,问是否符合自由组合律?
1. 分组,根据孟德尔独立分配规律,YyRr×YyRr= Y_R_ :Y_rr :yyR_ :yyrr=9/16:3/16:3/16: 1/16,因此可分4组。
度是否由于机会所造成的。
2 k (Oi Ti )2
i 1
Ti
若理论数小于5 时应将相邻组 合并,直到大
于5为止。
当df=1时
2 k | oi Ti |2 0.5
i 1
Ti
Χ2的自由度:df=k-1-a
a为需要由样本估计的参数个数
7.2 拟合优度检验
7.2.1一般程序 (1)对数据进行分组(离散型数据组间距通常是1) (2)根据总体分布类型和样本含量n 计算理论数Ti。 (3)有时需用样本数据估计总体参数。记所估计的参数的个 数为a。 (4)分别合并两个尾区的理论数,使之不小于5,合并后的 组数计为k。 (5)相应于2的自由度为k-1, 相应于3的自由度为k-1-a。 (6)零假设:因为拟合优度检验不是针对总体参数做检验的, 因而零假设不需提出具体参数值,只需判断观测数是否符合理 论数或某一理论分布。它的零假设是观测数与理论数相符合, 可以形象化地记为H0:O-T=0。 (7)计算χ2值。
拟合优度检验
![拟合优度检验](https://img.taocdn.com/s3/m/db3d9d86d4d8d15abe234e40.png)
52 .479
df=(3-1)×(2-1)=2,查表得χ22,0.05=5.991, χ2> χ20.05,结论是拒绝H0:O-T=0,3种处理方式引 起的染色体畸变数是不同的。
作业
习题7.1,7.2
7.2.2 对二项分布的检验
1、总体参数已知
例1 纯合的黄圆豌豆与绿皱豌豆杂交,第二代律
解:当性状间相互独立时,根据孟德尔独立 分配定律,两对独立基因自由组合,表现型出现 的概率p=3/4,F2代各表现型出现的概率为 (3/4+1/4)2=9/16+3/16+3/16+1/16, 即黄圆,黄皱,绿圆,绿皱出现的概率分别 为9/16、3/16、3/16及1/16。
2
i 1
4
Oi Ti 2
Ti
1.391
df=(2-1)×(2-1)=1,查表得χ20.05=3.841, χ2< χ20.05 ,即口服给药与注射给药的效果没有显 著不同。因为已经接受H0,不必再矫正。
例题2 行数与列数大于2的r×c列连表χ2检验
各行列对应的理论数的计算方法:
5.相应于2的自由度为k-1,相应于3的自由度为 k-1-a; 6.零假设:因为拟合优度χ2 检验不是针对总体 参数做检验的,因而零假设不需提出具体参数 值,只需要判断观测数是否符合理论数或者某 一理论分布。它的零假设是观测数与理论数相 符合。可以记为H0:O-T=0; 7.按上述公式计算出χ2值,并与χ2临界值做比较, 当χ2>χ2α时拒绝H0;当χ2<χ2α时接受H0。
生物统计学
第七章 拟合优度检验
7.1 拟合优度检验的一般原理
7.1.1 拟合优度检验的概念 拟合优度检验是用来检验实际观测数与依照 某种假设或模型计算出来的理论数之间的一致 性,以便判断该假设或模型是否与观测数相配 合。 该检验包括两种类型:第一种类型是检验观 测数与理论数之间的一致性;第二种类型是通 过检验观测数与理论数之间的一致性来判断事 件之间的独立性。这两种类型的问题都使用χ2检 验,但这个χ2 检验与假设检验中所讲的χ2检验是 不同的,假设检验中的χ2检验是对一个正态总体 的方差差异显著性进行检验的方法。
[课件]第07章 拟合优度检验PPT
![[课件]第07章 拟合优度检验PPT](https://img.taocdn.com/s3/m/67e50b4a25c52cc58bd6beb9.png)
解:假设3种方法增重不显著。 2lnP服从2自由度的x2分布
判断: x2=13.90 > x26, 0.05=12.592 ,拒绝假设
解:假设两种饲料饲养增重没差异。 因为有一个值为0,所以可以直接计算组合概率。
5 ! 6 ! 4 ! 7 ! P 0 . 015 判断:计算的P=0.015 < P=0.025 11 ! 4 ! 1 ! 0 ! 6 !
拒绝假设。
第七章 拟合优度检验——x2-检验
三、独立性检验——列联表x2检验
(无重复试验x2检验)
例题分析 精确列联表x2检验对于2×2列联表
性别 有 无 小计 例7.6 观测性别对药物的 4 1 5 男 0组合的概率都计入, 反应见右侧表: 之所以将这种组合的概率以及最小值变为 3 6 9 女 问男女对药物反应有无差异? 是因为这样才能构成一个尾区的概率。 7 7 14 解:假设男女对药物反应没差异。 小计
判断:接受假设。
第七章 拟合优度检验——x2-检验
四、x2的可加性
(一) x2的齐性检验
例1 试验绿玉米G对黄玉米Y的理论比为3:1。共收集了11个 谱系,每一个谱系的x2值都不具显著性,即都可能是从3:1 的总体中抽取的,问这11个谱系是否具齐性? 绿x2 +黄x2 解:假设具齐性。 3 1
Ni 4 Ni 4
第七章 拟合优度检验——x2-检验
二、一致性检验 解:假设该试验结果符合自由组合律。
有许多质量性状表型比值为: 9 1:1, 3 32:1, 1 3:1, 9:7, 13:3, Y-R-:Y-rr:yyR-:yyrr= : : :2 15:1, 63:1, 1:2:1, 9:3:3:1 对这些试验进行检验, 16 等。用 16 16x 16 都属适合度检验,它们的共同特点是总体参数概率 φ已知。 根据公式计算理论值 T =NP ,此例中N=556
第七章_拟合优度检验
![第七章_拟合优度检验](https://img.taocdn.com/s3/m/1fc84e1a6edb6f1afe001f07.png)
492
522
486
524
492
492
536
478
题解
(1)零假设:H0:O-T=0;备择假设HA: O-T≠0 (2)分组:样本容量n=100,取组数m=10,组距为8g (3)计算理论频率pi和理论频数Ti
(4)检验统计量的计算
2 i 1
k
Oi Ti 2
Ti
6.1638
6.25
0.81
12.09 20.87 25.03 20.58 15.71 100
0.302 0.061 0.155 0.121 0.09 1.539
题解
1、提出假设 H0:O-T=0;HA: O-T≠0 2、总体参数未知,需要由样本比例估计P=590/1000=0.59 3、计算理论值和卡方值,理论频率Pi按照二项分布公式计 算——n=10,0≤k ≤10,理论数Ti=NPi
i 1
k
(3)第i组的理论频率为Pi,其计算方法如下:
y 156.1cm s 4.98cm
① 先计算样本平均数和标准差
, ②假设高粱“三尺三”符合正态分布 2
2 156 设高粱的株高y服从正态分布 .1,4.99
。根据参数估计
y 原理, 用 估计 , 用s/c4=4.98/0.9975=4.99估计。即假
2
i 1 k
Oi Ti 2
Ti
2.141
2 2 ③建立拒绝域 2 df ,0.05 3,0.05 7.815
④结论:高粱株高服从正态分布
(二)总体参数已知的正态性检验
袋标准重量为500g,调查了100袋,结果如下表所示。 袋装食盐重量调查表