第7章 拟合优度检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
98 122 Ti ( )( )193 61.15 193 193
以此类推其它格的理论数值。如下
2 | oi T | 0.5 2 i Ti i 1 k
= ((58-61.15)2/69.15)+ ((40-36.05)2/36.05)+ ((6460.05)2/60.05)+ ((31-34.95)2/34.95)=1.391
9! 4!5!
而第一表中,将9分解为0,4,3,2的组合方式共有 9! 0!4! 3!2! 种,因此,出现第一个残联表的概率
9! 0!4!2!3! P 1 9! 9! ( )( ) 4!5! 3!6!
同样可以计算出另外三个列联表出现的概率。 在行总数,列总数及N都保持不变的情况下,a, b,c,d的各种组合的概率可由以下通式给出:
矫正后的
2
<
2.总体参数未知
调查到幼儿园接小孩 的家长性别,以10人 为一组,记录每组女 性人数,共得到100组 数据,列在表7-1中的 第2列。问女性家长人 数是否符合二项分布?
1、家长性别只有男和女,因而采用二项分布 2、分组已经完成,n=10 第三列总数 3、参数估计 ˆ 0.59
100(10)
4、根据二项分布计算理论频率(0.41+0.59)10 5、根据理论频率计算理论值 Ti Np( xi ) 6、检查数据是否需要合并,确定k值(6) 7、由于a=1,确定df=k-1-1=6-1-1=4 8、建立零假设O-T=0 9、查表比较,得出结论
7.2.3、对正态性的检验
第七章 拟合优度检验
7.1、拟合优度检验的一般原理 7.2、拟合优度检验 7.3、独立性检验 7.4、χ2的可加和性
7.1、拟合优度检验的一般原理
7.1.1、拟合优度检验的概念和类型
拟合优度检验是用来检验实际观测数与依照某种假设
或模型计算出来的理论数之间的一致性,以便判断该假 设或模型是否与观测数相配合。
分析:理论数小于5,无法合并,所以采用本节所学公式。
5!6!4!7! P 0.015 11!4!1!0!6!
双侧检验,α=0.05/2=0.025, P<α,拒绝零假设。
【例7.6】观测性别对药物的反应如下:
有 4 3 7 有 5 2 7 无 1 6 7 无 0 7 7
男 女
5 9 14
5!9!7!7! P 0.122 1 14!4!1!3!6!
男 女
5 9 14
5!9!7!7! P 0.010 1 14!5!0!2!7!
P=P1+P2=0.132>0.025
7.4
2 的可加性
7.4.1 表7-5中列出了玉米叶绿素遗传的一些实验 数据。其中绿玉米G对黄玉米Y的理论比为 2 3:1。共收集了11个谱系,每一谱系的 2 值列在表的最后一列。每一个 值都不具 显著性。因此,这11个谱系很可能都是从 3:1的总体中抽取出来的。
拟合优度检验的两种类型
(1)检验观测数与理论值之间的一致性 (2)检验观测数与理论数之间的一致性判断事件之间
的独立性
7.1.2 拟合优度检验的统计量
拟合优度检验一般方法是:
(1)将观测值分为k种不同的类别。 (2)共获得n个独立观测值,第i类观测值的数目为 Oi, (3)求第i类的概率Pi
2 k 2
Χ2的自由度:df=k-1-a a为需要由样本估计的参数个数
7.2、拟合优度检验
7.2.1一般程序 (1)对数据进行分组(离散型数据组间距通常是1) (2)根据总体分布类型和样本含量n 计算理论数Ti。 (3)有时需用样本数据估计总体参数。记所估计的参数的 个数为a。 (4)分别合并两个尾区的理论数,使之不小于5,合并后的 组数计为k。 (5)相应于2的自由度为k-1, 相应于3的自由度为k-1-a。 (6)零假设:因为拟合优度检验不是针对总体参数做检验 的,因而零假设不需提出具体参数值,只需判断观测数是 否符合理论数或某一理论分布。它的零假设是观测数与理 论数相符合,可以形象化地记为H0:O-T=0。 (7)计算χ2值。
H0:O-T=0 , α=0.05,df=(2-1)(2-1)=1, 2 2< 0 .05 (3.841) ,p>0.05
结论是用口服方式给药与注射方式给药的 效果没有显著不同。
7.3.2 2×2列联表的精确检验法
2×2列联表中的任何一格的理论数都 不得小于5,当小于5时,用 检验 便会有偏敧,这时就需要用下述精确 检验法。
(4)第i类的期望数即理论Baidu Nhomakorabea为Ti,Ti=nPi
(5)Oi与Ti进行比较,判断二者之间总的不符合程
度是否由于机会所造成的。
(Oi Ti ) Ti i 1
2 k
2
若理论数小于5 时应将相邻组 合并,直到大 于5为止。
当df=1时
| oi Ti | 0.5 Ti i 1
2
=3.08在10个自由度
2
下,不齐性是不显著的, 这11个谱系是具齐性的。
7.4.2、概率的混合
某种实验的效果,往往可以通过不 同的实验方法去证实。实验所得到 的数据是不能直接累加的,但是可 以把从每个实验中所得到的概率P 混合起来,以便累加从各方面所得 到的信息。
例如,用两种不同的饲料做动物实验,其效 果是通过3 种实验进行估计的,一种方法是 将动物分成超过某一标准和不超过某一标准 2 的,可以计算出 =2.7,df=1,P=0.10。
第二个实验是成组数据平均数比较, 得t=1.65,df=18,P=0.12。第三个实 验是成对比较,得t=2.00,df=9, P=0.08。可见每个实验在α=0.05水平上 不显著,于是将上述职3个概率按下述 方法混合起来:
> 02.05,证实了不同饲料在动物增重上的差异。
2
2 齐性检验
从上述资料中还能计算出另一个 。将11 个谱系的绿玉米与黄玉米分别相加,计 算合计数据的 2值,得 2 =3.46。刚好 2 小于 0.05 =3.841,在5%水平上几乎达到 了显著。这很可能是由于11个G/Y的比 值中,有9个大于3,累加这种倾向导致 上述后果。 2 2 根据以上两个 值,可做 齐性检验, 方法如下:
(1)提出零假设 (2)事件A和事件B是相互独立事件的充分必要条件: P(AB)=P(A)P(B) (3)如拟合优度检验那样计算 χ2值。 (4)确定自由度,2×2列联表的自由度为(行-1) (列-1)。
例7.3 表7-3是不同给药方式与给药效果表。
解:因为零假设是给药方式与给药效果之间 无关联,则口服与有效同时出现的理论频率 应为口服的频率与有效的频率的乘积, P(BA)=P(B)P(A)=(98/193)(122/193)。 其理论数 Ti 由理论频率乘以总数得出,
(a b)!(c d )!(a c)!(b d )! Pi N!a!b!c!d!
零假设仍然为不存在处理效应,若计算得到的p>α则接受 零假设:否则拒绝零假设。若a,b,c,d中的任何一个出 现0时,可直接用该概率作为判断的标准。若a,b,c,d 中的任何一个都没有出0时,还应当将这种组合的概率以 及从最接近于0的那个观测值0的各种组合都计入。这样才 能构成一个尾区的概率。 【例7.5】用两种饲料A和B饲养小白鼠,一周后测其增重 情况,入下表。问用不同的饲料饲养,小白鼠的增重差异 是否显著? 未增重/只 A饲料 B饲料 4 0 4 增/只 1 6 7 5 6 11
【例7.2】 用正常翅的野生型果蝇(vg+ vg+)与残翅(vgvg)果蝇杂 交,F1代均表现为正常翅(vg+vg)。F1代自交 (vg+vg×vg+vg),所得F2代中包括311个正常翅(vg+vg+和 vg+vg)和81个残翅(vgvg)。问这一分离比是否符合孟德尔3:1 的理论比。
未 矫 正 的
2
列联表中的数据可用以下符号表示:
将a、b、c、d换成具体数字,说明这种检验法。 设有总数N=9的2×2列联表,可能有以下4种情 况:
在这四个表中,a+b=4
c+d=5, a+c=3 b+d=6及N=9都相同。根据 组合公式,由9分解为4和5的组合, 4 C 共有 9 种;由9分解为3和6的组合, 3 C 共有 9 种。因此行间为分解为4 和5的组合,列间为分解为3和6的组 9! 4 3 合,共有 C9 = C9 、3!6! 种。
状表 态 分给 布出 。了 个 调 查 数 据 , 判 断 其 是 否 为
7-2 1000
7.3.1列联表 检验 2 2 列联表 检验是另一种类型的 检 验,可以用它检验事件间的独立性或 者说检验处理之间的差异显著性。
7.3、独立性检验
2
2×2列联表的χ2检验一般需经以下各步:
7.2.2 对二项分布的检验
1.总体参数已知 【例7.1】纯合的黄圆豌豆与绿皱豌豆杂交,F1代自交,第 二代分离数目如下,问是否符合自由组合律?
1、分组,根据孟德尔独立分配规律,YyRr×YyRr= Y_R_ :Y_rr :yyR_ :yyrr=9/16:3/16:3/16:1/16, 因此可分4组。 2、 根据总体分布类型和样本含量n 计算理论数Ti(见 下表)。 3、a=0,k=4 4、Ti均大于5,不需要合并,df=4-1=3,不需要连续 矫正。 5、建立零假设 6、利用公式计算χ2值 7、查表,比较计算值与临界值(7.815)大小,得出结论。
以此类推其它格的理论数值。如下
2 | oi T | 0.5 2 i Ti i 1 k
= ((58-61.15)2/69.15)+ ((40-36.05)2/36.05)+ ((6460.05)2/60.05)+ ((31-34.95)2/34.95)=1.391
9! 4!5!
而第一表中,将9分解为0,4,3,2的组合方式共有 9! 0!4! 3!2! 种,因此,出现第一个残联表的概率
9! 0!4!2!3! P 1 9! 9! ( )( ) 4!5! 3!6!
同样可以计算出另外三个列联表出现的概率。 在行总数,列总数及N都保持不变的情况下,a, b,c,d的各种组合的概率可由以下通式给出:
矫正后的
2
<
2.总体参数未知
调查到幼儿园接小孩 的家长性别,以10人 为一组,记录每组女 性人数,共得到100组 数据,列在表7-1中的 第2列。问女性家长人 数是否符合二项分布?
1、家长性别只有男和女,因而采用二项分布 2、分组已经完成,n=10 第三列总数 3、参数估计 ˆ 0.59
100(10)
4、根据二项分布计算理论频率(0.41+0.59)10 5、根据理论频率计算理论值 Ti Np( xi ) 6、检查数据是否需要合并,确定k值(6) 7、由于a=1,确定df=k-1-1=6-1-1=4 8、建立零假设O-T=0 9、查表比较,得出结论
7.2.3、对正态性的检验
第七章 拟合优度检验
7.1、拟合优度检验的一般原理 7.2、拟合优度检验 7.3、独立性检验 7.4、χ2的可加和性
7.1、拟合优度检验的一般原理
7.1.1、拟合优度检验的概念和类型
拟合优度检验是用来检验实际观测数与依照某种假设
或模型计算出来的理论数之间的一致性,以便判断该假 设或模型是否与观测数相配合。
分析:理论数小于5,无法合并,所以采用本节所学公式。
5!6!4!7! P 0.015 11!4!1!0!6!
双侧检验,α=0.05/2=0.025, P<α,拒绝零假设。
【例7.6】观测性别对药物的反应如下:
有 4 3 7 有 5 2 7 无 1 6 7 无 0 7 7
男 女
5 9 14
5!9!7!7! P 0.122 1 14!4!1!3!6!
男 女
5 9 14
5!9!7!7! P 0.010 1 14!5!0!2!7!
P=P1+P2=0.132>0.025
7.4
2 的可加性
7.4.1 表7-5中列出了玉米叶绿素遗传的一些实验 数据。其中绿玉米G对黄玉米Y的理论比为 2 3:1。共收集了11个谱系,每一谱系的 2 值列在表的最后一列。每一个 值都不具 显著性。因此,这11个谱系很可能都是从 3:1的总体中抽取出来的。
拟合优度检验的两种类型
(1)检验观测数与理论值之间的一致性 (2)检验观测数与理论数之间的一致性判断事件之间
的独立性
7.1.2 拟合优度检验的统计量
拟合优度检验一般方法是:
(1)将观测值分为k种不同的类别。 (2)共获得n个独立观测值,第i类观测值的数目为 Oi, (3)求第i类的概率Pi
2 k 2
Χ2的自由度:df=k-1-a a为需要由样本估计的参数个数
7.2、拟合优度检验
7.2.1一般程序 (1)对数据进行分组(离散型数据组间距通常是1) (2)根据总体分布类型和样本含量n 计算理论数Ti。 (3)有时需用样本数据估计总体参数。记所估计的参数的 个数为a。 (4)分别合并两个尾区的理论数,使之不小于5,合并后的 组数计为k。 (5)相应于2的自由度为k-1, 相应于3的自由度为k-1-a。 (6)零假设:因为拟合优度检验不是针对总体参数做检验 的,因而零假设不需提出具体参数值,只需判断观测数是 否符合理论数或某一理论分布。它的零假设是观测数与理 论数相符合,可以形象化地记为H0:O-T=0。 (7)计算χ2值。
H0:O-T=0 , α=0.05,df=(2-1)(2-1)=1, 2 2< 0 .05 (3.841) ,p>0.05
结论是用口服方式给药与注射方式给药的 效果没有显著不同。
7.3.2 2×2列联表的精确检验法
2×2列联表中的任何一格的理论数都 不得小于5,当小于5时,用 检验 便会有偏敧,这时就需要用下述精确 检验法。
(4)第i类的期望数即理论Baidu Nhomakorabea为Ti,Ti=nPi
(5)Oi与Ti进行比较,判断二者之间总的不符合程
度是否由于机会所造成的。
(Oi Ti ) Ti i 1
2 k
2
若理论数小于5 时应将相邻组 合并,直到大 于5为止。
当df=1时
| oi Ti | 0.5 Ti i 1
2
=3.08在10个自由度
2
下,不齐性是不显著的, 这11个谱系是具齐性的。
7.4.2、概率的混合
某种实验的效果,往往可以通过不 同的实验方法去证实。实验所得到 的数据是不能直接累加的,但是可 以把从每个实验中所得到的概率P 混合起来,以便累加从各方面所得 到的信息。
例如,用两种不同的饲料做动物实验,其效 果是通过3 种实验进行估计的,一种方法是 将动物分成超过某一标准和不超过某一标准 2 的,可以计算出 =2.7,df=1,P=0.10。
第二个实验是成组数据平均数比较, 得t=1.65,df=18,P=0.12。第三个实 验是成对比较,得t=2.00,df=9, P=0.08。可见每个实验在α=0.05水平上 不显著,于是将上述职3个概率按下述 方法混合起来:
> 02.05,证实了不同饲料在动物增重上的差异。
2
2 齐性检验
从上述资料中还能计算出另一个 。将11 个谱系的绿玉米与黄玉米分别相加,计 算合计数据的 2值,得 2 =3.46。刚好 2 小于 0.05 =3.841,在5%水平上几乎达到 了显著。这很可能是由于11个G/Y的比 值中,有9个大于3,累加这种倾向导致 上述后果。 2 2 根据以上两个 值,可做 齐性检验, 方法如下:
(1)提出零假设 (2)事件A和事件B是相互独立事件的充分必要条件: P(AB)=P(A)P(B) (3)如拟合优度检验那样计算 χ2值。 (4)确定自由度,2×2列联表的自由度为(行-1) (列-1)。
例7.3 表7-3是不同给药方式与给药效果表。
解:因为零假设是给药方式与给药效果之间 无关联,则口服与有效同时出现的理论频率 应为口服的频率与有效的频率的乘积, P(BA)=P(B)P(A)=(98/193)(122/193)。 其理论数 Ti 由理论频率乘以总数得出,
(a b)!(c d )!(a c)!(b d )! Pi N!a!b!c!d!
零假设仍然为不存在处理效应,若计算得到的p>α则接受 零假设:否则拒绝零假设。若a,b,c,d中的任何一个出 现0时,可直接用该概率作为判断的标准。若a,b,c,d 中的任何一个都没有出0时,还应当将这种组合的概率以 及从最接近于0的那个观测值0的各种组合都计入。这样才 能构成一个尾区的概率。 【例7.5】用两种饲料A和B饲养小白鼠,一周后测其增重 情况,入下表。问用不同的饲料饲养,小白鼠的增重差异 是否显著? 未增重/只 A饲料 B饲料 4 0 4 增/只 1 6 7 5 6 11
【例7.2】 用正常翅的野生型果蝇(vg+ vg+)与残翅(vgvg)果蝇杂 交,F1代均表现为正常翅(vg+vg)。F1代自交 (vg+vg×vg+vg),所得F2代中包括311个正常翅(vg+vg+和 vg+vg)和81个残翅(vgvg)。问这一分离比是否符合孟德尔3:1 的理论比。
未 矫 正 的
2
列联表中的数据可用以下符号表示:
将a、b、c、d换成具体数字,说明这种检验法。 设有总数N=9的2×2列联表,可能有以下4种情 况:
在这四个表中,a+b=4
c+d=5, a+c=3 b+d=6及N=9都相同。根据 组合公式,由9分解为4和5的组合, 4 C 共有 9 种;由9分解为3和6的组合, 3 C 共有 9 种。因此行间为分解为4 和5的组合,列间为分解为3和6的组 9! 4 3 合,共有 C9 = C9 、3!6! 种。
状表 态 分给 布出 。了 个 调 查 数 据 , 判 断 其 是 否 为
7-2 1000
7.3.1列联表 检验 2 2 列联表 检验是另一种类型的 检 验,可以用它检验事件间的独立性或 者说检验处理之间的差异显著性。
7.3、独立性检验
2
2×2列联表的χ2检验一般需经以下各步:
7.2.2 对二项分布的检验
1.总体参数已知 【例7.1】纯合的黄圆豌豆与绿皱豌豆杂交,F1代自交,第 二代分离数目如下,问是否符合自由组合律?
1、分组,根据孟德尔独立分配规律,YyRr×YyRr= Y_R_ :Y_rr :yyR_ :yyrr=9/16:3/16:3/16:1/16, 因此可分4组。 2、 根据总体分布类型和样本含量n 计算理论数Ti(见 下表)。 3、a=0,k=4 4、Ti均大于5,不需要合并,df=4-1=3,不需要连续 矫正。 5、建立零假设 6、利用公式计算χ2值 7、查表,比较计算值与临界值(7.815)大小,得出结论。