第七章 拟合优度检验

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Oi-Ti
6
104
13.70
90.3
5
191
89.04
101.96
4
217
241.15
-24.15
3
164
348.32
-184.32
2
99
283.01
-184.01
1
83
122.64
-39.64
0
262
22.14
239.86
(Oi-Ti)2/Ti 595.189 116.755 2.419 97.536 119.641 12.825 2598.592
的各理论数受该列总数约束,所以自由度df=(r-1)(c-1)。
4、计算2值:如同吻合度检验那样计算2值,若2 < 2 α,则接
受H0;若2 > 2 α,则拒绝H0。与吻合度检验一样,理论数不
得小于5,当理论数小于5时应使用另外的方法。
上例的计算结果如下:
有效
无效
总数
口服
O1=58
O2=40
98
T1=(98)(122)/193=61.95 T2=(98)(71)/193=36.05
结论:正常翅与残翅的分离比符合3∶1
可见,同一问题矫正与不矫正所得结论不同。 因矫正后的结果比矫正前低,若未矫正已接受了H0,可不 再矫正;若未矫正时拒绝H0,则一定要矫正。
2.总体参数未知
例:调查到幼儿园接小孩家长的性别,10人为一组,记录每组女性人数,
共100组数据,列在表7-1中。问女性家长人数是否符合二项分布?
从上表可以看到,实际观察次数与理论次数存在一定的 差异,这里公、母各相差10只。 这个差异是属于抽样误差、 还是羔羊性别比例在养殖过程中发生了实质性的变化?
7.1.2 拟合优度检验的统计量
例1.1 黄圆豌豆与绿皱豌豆杂交,第二代分离数目如下:
黄圆
绿皱
绿圆 绿皱 总计
实测数(Oi) 315(O1) 101(O2) 108(O3) 32(O4) 556 理论数(Ti) 312.75(T1) 104.25(T2) 104.25(T3) 34.75(T4) 556
2、计算理论数: • 若事件A和事件B是相互独立的,则P(AB) =P(A)P(B)。 • 在给药方式和效果之间是相互独立的前提下,计算口服(事件B)
有效(事件A)的概率P(BA)=P(B)P(A)=(98/193) (122/193)。 • 其理论数T1=(98/193)(122/193)(193)=(98)(122)/93=61.95。 • 以类似的方法可以计算出另外三个理论数。 3、确定自由度:因为每一行的各理论数受该行总数约束,每一列
61.95
36.05
60.05
34.95
0.192 0.330 0.198 0.341
1.061
2 0.05
3.841,
2
2 0.05
,
P 0.05
结论:接受H0,不同给药方式的治疗效果没有显著不同。
r×c列联表
➢ 例7.3称为2×2列联表,虽然在生物学问题中, 经常遇到的是2×2列联表,对于行、列大于2 的情况称为r×c列联表。
表中查出临界值。
⑤条件:当理论数小于5和df=1时,上式与2分布偏离较大,因
此:1) 当理论数小于5时,应与相邻项合并直到大于等于5。2)当 df=1时应做连续型矫正,矫正方法如下:
k
2
Oi Ti 0.5 2
i 1
Ti
⑥χ2的自由度为:df=k-1-a
当理论数已经给定或计算理论数时所用的参数已知时a=0。若 总体参数没有给出,需由样本数据估计,这时a ≠ 0,a为需由样本 估计的参数的个数。
3297
3616
γ3
194
3620
3814
解:计算出的理论数如下表
处理方式 有桥细胞数 无桥细胞数
总数
γ1 γ2 γ3
总数
O1=192 T1=228.8 O3=319 T3=231.8 O5=194 T5=244.4
705
O2=3378 T2=3341.2 O4=3297 T4=3384.2 O6=3620 T6=3569.6
类型 色盲(B) 非色盲
合计
聋(A) 3 47 50
非聋 797 9153 9950
合计 800 9200 10000
P(A)P(B)=0.0050×0.0800 =0.0004=P(AB)
拟合优度检验:
根据遗传学理论,动物的性别比例是1:1。统计某羊场 一年所产的876只羔羊中,有公羔428只,母羔448只。按 1:1的性别比例计算,公、母羔均应为438只。以O表示实 际观察次数,T 表 示 理 论次数,可将上述情况列成下表。
去幼儿园接小 孩的家长中男女 性是否各占一半 并不一定。因此 二项分布中的φ 未知,需由样本 数据估计,则接 小孩的家长中女 性 比 例 为 : φ= 590/1000=0.59
展开二项式(0.41+0.59)10得到第4列,再计算出理论数,其前4个数都小于5,合 并。最后两个数也都小于5,合并后仍小于5,所以合并最后三个数。相应的观
➢ 零假设是观测数与理论数符合,拟合优度2检验为非
参数统计,零假设可形象地记为:H0:O-T=0。
➢ 计算出2值,与临界值比较,当2 > α2时拒绝H0。 注意:Pearson 2检验查上侧表。
7.2.2 二项分布的检验
1. 总体参数φ已知时
注意:计算理论数时,由于
参数φ=3/4是已知的,并不需要 用 样本 数去估 算 , 因此a=0, df=4-1=3。
注射
O3=64
O4=31
95
T3=(95)(122)/193=60.05 T4=(95)(71)/193=34.95
总数
122
71
193
H0 : O T 0, 0.05,
4
2
Oi Ti 0.5 2
i 1
Ti
df 2 12 1 1
61.95 58 0.52 40 36.05 0.52 64 60.05 0.52 34.95 31 0.52
7.3 独立性检验
7.3.1 列联表2检验
列联表2检验属独立性检验,或者说检验处理之间的差异
显著性。
例7.3 下表给出不同给药方式与给药效果
给药方式
有效
无效
总数
有效率
口服
58
40
98
59.2%
注射
64
31
95
67.4%
总数
122
71
193
列联表2检验的原理
现在要考虑的是给药方式与给药效果有无关联,如果有关联,
i 1
Ti
438
2 1,0.05
3.841
∴2 < 20.05。结论是接受H0,动物性比符合1∶1。
例:随机播种棉籽1120穴,每穴6粒,共下种6720粒,统计 发芽数为3200粒频数分布见下表。问发芽情况是由于棉籽质 量原因还是另有其它原因造成。
解:H0:设发芽情况符合二项分布,O-T=0
ຫໍສະໝຸດ Baidu
每穴发芽数 实际穴数 理论穴数
例7.1 检验上一节给出的例子。理论数均大于5,df=3, φ
已知,H0:O-T = 0,α = 0.05。将数据代入公式
k
2
Oi Ti 2
i 1
Ti
2 315 312.752 101 104.252 108 104.252 32 34.752
312.75
104.25
104.25
次数小于5的组,则需加大样本容量,或将理论次 数小于5的组与邻组合并。
7.2 拟合优度检验
7.2.1 一般程序
➢ 对数据进行分组,组数为k。 ➢ 计算理论数Ti
• 根据总体参数计算理论数Ti。这时df=k-1 • 由样本数据估计参数并理论数Ti。这时df=k-1-a。a为由
样本所估计参数的个数。
➢ 合并理论数小于5的各组,并修改合并后的组数k。
Pearson 2统计量
皮尔逊(K.Pearson)首创2统计量。2是度
量实际观察次数与理论次数偏离程度的一个统计量,
2越小,表明实际观察次数与理论次数越接近; 2=0,表示两者完全吻合;2越大,表示两者相差
越大。
应用中n需要比较大且各组的理论次数皆大于5
时,该统计量即可近似的服从2分布。若存在理论
测数也合并。合并后k=6,自由度为k-1-a=6-1-1=4,从附表中查出2 4,0.05=9.488 > 2 =1.539,接受H0。结论是女性家长人数符合二项分布。
动物的性别比例是否为1:1 ?
a=1,df =2-0-1=1
k
2
Oi Ti 0.5 2 ( 428 438 0.5)2 2 0.4121
解:计算过程见下表
(1)不矫正
正常翅
残翅
总数
实际观测数 理论数 O-T (O-T)2 (O-T)2/T
311
81
392
294
98
392
17
17
289
289
0.893
2.949
2 =0.893+2.949=3.932
H0: O-T=0, α=0.05, df=1, 2 0.05=3.841, 2 > 2 0.05
结论:正常翅与残翅的分离比不符合3∶1
(2)矫正
∣O-T∣-0.5 ( ∣O-T∣-0.5 )2 ( ∣O-T∣-0.5 )2/T
正常翅 16.5 272.25 0.926
残翅 16.5 272.25 2.778
2 =0.926+2.778=3.704
H0: O-T=0, α=0.05, df=1, 2 0.05=3.841, 2 < 2 0.05
第七章 拟合优度检验
7.1 拟合优度检验的一般原理
7.1.1 什么是拟合优度检验
用来检验实际观测数与依照某种假设或模型计算 出来的理论数之间的一致性的方法。可分为两种 类型: (1)拟合优度检验:检验观测数与理论数之间的 一致性。 (2)独立性检验:通过检验实际观测数与理论数 之间的一致性来判断事件之间的独立性。
4+)T第3 +i类T4的=n理。论数Ti =npi, k个理论数之和等于n。如上例中的T1 +T2
(5)Oi与Ti不符合程度的计算:
①求k个Oi-Ti之和,显然它们恒等于0。
②求k个(Oi-Ti)2之和,得不出相对的不符合程度。如Oi=9、Ti=6, Oi-Ti=3;Oi=49、Ti=46,Oi-Ti=3。前者的不符合程度远大于 后者。
即不同的给药方式产生不同的效果;反之,如果无关联,即不 同的给药方式的治疗效果没有不同。从另一个角度讲,我们要 考虑的是不同的给药方式与给药效果之间是否相互独立,因此 列联表χ2检验又称为独立性检验。
列联表2检验的步骤
1、提出零假设:假设实测数与给药方式和给药效果并无关联的前 提下所计算出的理论数之间无差异。即H0:O-T=0。
34.75
0.016 0.101 0.135 0.218
0.470
从附表中查出23, 0.05=7.815, 2 < 20.05。结论是接受H0,
杂交结果符合9∶3∶3∶1的分离比。
❖ 当df=1时一定要做矫正,否则可能会得到错误结论。
例7.2 用正常翅的野生型果蝇与残翅的果蝇杂交,F1代均表现 为正常翅。F1代自交,所得F2代中包括311个正常翅和81个残 翅。问这一分离比是否符合孟德尔3∶1的理论比。
10295
3570 3616 3814 11000
➢ 其理论数的计算与2×2列联表相同:
df=(r-1)(c-1)
Tij
(i行
总数)( j列总数) 总数
例7.4 用三种γ射线照射大麦.观测处理后种子根尖染色体畸变情况,得
到下表结果.问不同处理方式所引起的染色体畸变差异是否显著?
处理方式 有桥细胞数 无桥细胞数
总数
γ1
192
3378
3570
γ2
319
合计
1120
1120.00
3542.94
df=7-1-1=5, 2 5,0.01=15.086< 2 。拒绝H0,不符合二项分布。
可见,理论与实际差异极显著,这说明棉籽的每穴发芽数除由于棉
籽的质量原因外尚有其它原因影响了棉籽的发芽。也就是说仅棉籽本 身的原因并不会出现该分布情况。至于何原因造成很难判定,很可能 是客观因素,如土壤不均,水分不均,有的地方适合发芽有的不适合。 因此,欲种植该棉籽首先要加强平整试验田、合理灌溉。
③求k个[(Oi-Ti)/Ti]2之和,但仍有问题。如:Oi=8、Ti=5以及Oi =80、Ti=50时Oi-Ti/Ti都等于0.6。
④为解决上述问题,以Ti为权求加权值。
i
k 1
Ti
Oi Ti Ti
2
k i 1
Oi T Ti
2
由上式所定义的统计量也称2 。近似服从2分布,可由2分布
问此豌豆性状的比率是否符合遗传分离定律的9∶3∶3∶1比例?
拟合优度检验的一般做法是:
1)将观测值分为k种不同类别,如四种类型豌豆。
2+)O共4=获n。得n个独立观测值,第i类观测值的数目为Oi。如O1 +O2 +O3
3相)第互i独类立的的概率等为位p基i,因如自上由述组四合类的豌概豆率的得概出率,可分根别据为遗9/1传6学、中3/1两6对、 3/16、1/16,概率之和等于1。
相关文档
最新文档