第六章 卡方测验及适合度检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
χ2应用于独立性测验(test for independence),
主要为探求两个变数间是否独立。这是次数资料
的一种相关性研究。
假设H0:两个变数相互独立,对HA:两个变数彼
此相关。
2 当观察的χ2< a , 时,接受H0,即两个变数相互独立;
2 当观察的χ2≥ a , 时,否定H0,接受HA,即两个变数相关。
显著水平α=0.05。
测验计算
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 17
在H0为正确的假设下,种子作灭菌处理的概率 为76/460;发病穗数的概率为210/460。因此, 任一经种子作灭菌处理而又发病的麦穗的概率 为p11=(76/460) ×(210/460), 因此理论次数为:
χ2=0.2798
小于 0.05,1 ,所以接受H0。即认为观察次数
2
与理论次数相符,接受玉米F1代花粉粒碘反应比 率为1:1的假设。
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 10
适合性检验 是检验实际观测数是否符合某种理论比 率的一种假设检验。在遗传学中,常用来检验杂交 后代的分离比例是否符合某种遗传定律,如孟德尔 的分离定律(3:1)、独立分配定律(9:3:3:1 )等。
5
适合性测验
适合性χ2测验的方法
次数分布的适合性测验
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
6
适合性χ2测验的方法
适合性测验(test for goodness-of-fit):比较 实验数据与理论假设是否符合的假设测验。 现以玉米花粉粒碘染反应为例,予以说明:
玉米花粉粒碘反应观察次数与理论次数
2 0.05,1
自由度df的确定:因为每一行的各理论数 受该行总数约束,每一列的各理论数受该 列总数约束,所以df=(2-1)(2-1)=1。
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
20
2×c表的独立性测验
2×c表是指横行分为两组,纵行分为c≥3组 的相依表资料。其ν=(2-1)(c-1)>1,故无需作 连续性矫正。 [例6.9]进行大豆等位酶Aph的电泳分析,193 份野生大豆、223份栽培大豆等位基因型的次数
23
假设H0:稻叶衰老情况与灌溉方式无关;对HA:稻叶衰老 情况与灌溉方式无关。取α=0.05。
2
(146 140.69) 140.69
2
2
(7 8.78) 8.78
2
2
(16 11.98) 11.98
2
5.62
0.05, 4 9.49, 现 5.62 0.05, 4 P 0.05
第六章 2)测验与拟合度检 卡平方(χ 验
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
1
6.1卡平方(χ2)的定义与分布
适合性检验:检验实际观测数是否与某种 理论比率相符合。 独立性检验:通过检验实际观测数与理论 数之间的一致性来判断事件之间是否相互 独立。
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 12
正常翅
实 际 数(O) 理 论 数(T) |O-T|-0.5 (|O-T|-0.5)2 (|O-T|-0.5)2/T 311 294 16.5 272.25 0.926
残翅
81 98 16.5 272.25 2.778
总数
392 392
312.75
2
2
101 104.25
104.25
2
2
108 104.25
104.25
32 34.75
34.75
0.016 0.101 0.135 0.218 0.470
4、推断:从附表6中查出23, 0.05=7.815, H0的拒绝域 为2>7.815。由于实得2< 7.815 ,结论是接受H0,F2代 表现型符合9:3:3:1的分离比率。 [实例] 用正常翅的野生型果蝇与残翅果蝇杂交,F1代 均表现为正常翅。F1 代自交,在F2 代中有311个正常 翅和81个残翅。问这一分离比是否符合孟德尔3∶1的 理论比?
2 2
C
2
(| 50 41.3 | 0.5) 41.3
2
(| 200 208.7 | 0.5) 208.7
2
4.267
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
19
查附表3,
2 2 3.84 现实得 C 4.267 0.05,1 故P<0.05,否定H0。即种子灭菌与否和散黑穗病 发病高低有关,种子灭菌对防治小麦散黑穗病 有一定效果。
[实例1] 检验黄圆豌豆与绿皱豌豆杂交F2代表现型是否 符合9:3:3:1 的分离比例。
黄 圆 实测数(Oi) 理论数(Ti) Oi_ - Ti 315(O1) 312.75(T1) 2.25 黄 皱 101(O2) 104.25(T2) -3.25 绿 圆 108(O3) 104.25(T3) 3.75 绿 皱 32(O4) 34.75(T4) -2.75 总 计 556 556 0
2
χ2的定义一:
u u u u u (
2 2 1 2 2 2 i 2 n 2 i
yi i
若所研究的对象来自同一总体,则μi=μ,σi=σ,从而
(
2
i
)
2
Βιβλιοθήκη Baidu
yi
)
2
χ2分布图形为一组具有不同自由度ν值的曲线。 χ2值最 2 小为0,最大为+∞,因而在坐标轴的右边。附表6为χ2≥ p
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
9
2 C
(| O E | 1 2) E
2
2
本例
C
2
(| 22.5 | 1 2) 3459.5
(| 22.5 | 1 2) 3459.5
2
0.2798
2 查附表3,当ν=k-1=2-1=1时,0.05,1 3.84 ,实得
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 8
4、依所得概率值的大小,接受或否定无效 假设。若实 得 a ,否定H0;若实得
2 2 ,
a , 时,则 H0 被接受。
2 2
χ2分布是连续的,而次数资料则是间断的。 由间断性资料算得的χ2值有偏大的趋势 (尤其是在ν=1时),需作连续性矫正。
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 16
处理项目 种子灭菌
发病穗数 26(34.7)
未发病穗数 50(41.3)
总数 76
种子未灭菌
总数
184(175.3)
210
200(208.7)
250
384
460
H0:种子灭菌与否和散黑穗病病穗多少无关; HA:种子灭菌与否和散黑穗病病穗多少有关。
列于下表,试分析大豆Aph等位酶的等位基因频
率是否因物种而不同。
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
21
物种
1 野生大豆 栽培大豆 总计 29(23.66) 22(27.34) 51
等位基因
2 68(123.87) 199(143.13) 267 3 96(45.47) 2(52.53) 98
碘反应 蓝色 非蓝色 观察次数(O) 3437(O1) 3482(O2) 理论次数(E) 3459.5(E1) 3459.5(E2) O-E -22.5 +22.5 (O-E)2/E 0.1463 0.1463
总数
6919
6919
0
0.2926
问:是否符合1:1?
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 7
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
15
2×2表的独立性测验
2×2相依表是指横行和纵行皆分为两组的 资料。其ν=(2-1)(2-1)=1,计算的χ2值需 作连续性矫正。
[例]调查经过种子灭菌处理与未经种子 灭菌处理的小麦发生散黑穗病的穗数,得 相依表如下,试分析种子灭菌与否和散黑 穗病穗多少是否有关。
2
否定H0,接受HA。即不同物种Aph等位基因频率有显著相 关。
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 22
r×c表的独立性测验
若横行分r组,纵行分c组,且r≥3,c≥3,则为r×c相 依表,其ν=(r-1)(c-1) [例]下表为不同灌溉方式下水稻叶片衰老情况的调查资 料。试测验稻叶衰老情况是否与灌溉方式有关。
1、假设H0:F2代表现型符合9:3:3:1 的分离比例, 即H0:O-T=0, HA:不符合
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 11
2、显著水平:a =0.05 3、计算2值:由于k=4, df=k-1=3,所以2值不需要 连续性矫正。
2
315 312.75
1、假设H0:正常翅与残翅的分离比符合理论比3∶1, HA:不符合 2、显著水平: a = 0.05 3、计算2值:由于自由度df=k-1=1,所以2值需要连 续性矫正。2 = 0.926+2.778 = 3.704 4 、 推 断 : 从 附 表 6 中 查 出 df = 1,20.05 = 3.841, 实 得 2<20.05,结论是接受H0,即正常翅与残翅的分离比符 合理论比3∶1。
4
若所研究的总体μ不知,而以样本 y 代替,则
2
(
2
yi y
2
)
2 2 2
1
2
( yi y )
2
( n 1) s
s
χ2的定义二:
用于次数资料(计数资料)分析的χ2公式:
2
(O E ) E
2
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 13
独立性测验
独立性检验 是通过检验实际观测数与理论 数之间的一致性来判断事件之间的独立性。 这种检验也叫列联表2检验。 2×2表的独立性测验 2×c表的独立性测验
r×c表的独立性测验
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院 14
时的右尾概率表。
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
3
2
i 1
k
Oi Ti
Ti
2
1899年统计学家K.Pearson发现上式服从自 由度df=k-1-a的2分布,所以定义该统计 量为2。 k为类型数或组数;a为需由样本估计的参 数的个数。
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
= (76/460) ×(210/460) ×460=34.7
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
18
用同样的方法算出其余的理论次数,并将 其写入上表的括号中。
(| 26 34.7 | 0.5) 34.7 (| 184 175.3 | 0.5) 175.3
灌溉方式 深水 浅水 湿润 总计 绿叶数 146(140.69) 183(180.26) 152(160.04) 481 黄叶数 7(8.78) 8(11.24) 14(9.98) 30 枯叶数 7(10.53) 13(13.49) 16(11.98) 36 总计 160 205 182 547
西南科技大学生命科学与工程学院周海廷制作 三峡大学化学与生命科学学院
总计
193 223 416
假设H0:等位基因频率与物种无关;对HA:不同物种等位 基因频率不同。 显著水平α=0.05
2
( 29 23.66) 23.66
2
(68 123.87) 123.87
2
2
( 2 52.53) 52.53
2
2
154.02
0.05,2 5.99; 现实得 154.02 0.05,2 ; P 0.05
1、设立无效假设,即假设观察次数与理论 次数的差异由抽样误差所引起。本例H0:花 粉粒碘反应比例为1:1与HA:花粉粒碘反应 比例不成1:1。
2、确定显著水平α=0.05。 3、在无效假设为正确的假设下,计算超过 观察χ2值的概率。试验观察的χ2值愈大, 观察次数与理论次数之间相差程度也愈大, 两者相符的概率就愈小。