试验设计与分析(园艺)第六章 卡平方测验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如果所研究总体的μ未知,而用样本代替,那么
2 2 x x 1 ( n 1 ) s s 2 i 2 df 2 ( xi x ) 2 2 2
此时,独立的正态离差个数为n-1个,故df= n-1。
二、Pearson 定义
E
2
三、Bartlett 定义
设从一个正态总体中独立地随机抽取k个样本,其 方差分别为s12、s22、…、sk2,自由度分别为df1、 df2、…、dfk,那么:
SS1 SSk SS2 2 2 s sk s2 df1 、 dfk df2 、…、
2 1
其合并方差为
s
2 p
SS df
(|O11O22 O12O21| n 2) χ n C1C 2 R1 R2
2 2 C
上例中
χ
2 C
26 200 184 50 460 2
76 384 210 250
2
460 4.267
三、r×c表独立性测验
这种列联表有r行,c列,且r≥3、c≥3,所以计算
Pearson根据Helment的定义,从属性性状的分布推 导出应用于计数资料(次数资料)分析的 2公式:
2 i 1
k
O E
E
2
其中,O为观察次数,E为理论次数,i为计数资料
的分组数,自由度为df,其大小为分组数减去1。
Pearson定义的分布图形与Helment定义的相同。
处理项目 种子灭菌 发病穗数 26(O1) 未发病穗数 50 (O2) 总 数 76
种子未灭菌
总 数
184 (O3)
210
200 (O4)
250
384
460
H0:两因素相互独立,即种子灭菌与否和散黑穗病病穗 多少无关;HA:两因素彼此相关。
2 规定显著水平α=0.05,当df=1时, 0 .05 3.84
2
四、多组资料的适合性测验
多组资料指组数k≥3的计数资料,其自由度df=k-
2 1,在计算 值时不必进行连续性矫正。
如番茄果实的黄色、粉色和红色;玫瑰的红色、 白色和黄色等。
应用举例
黄色圆粒和绿色皱粒的纯种豌豆作为亲本进行杂 交。F1代全部表现黄色圆粒。F1代自交共得到F2 代植株556株,其中有4种类型:黄色圆粒315株, 黄色皱粒101株,绿色圆粒108株,绿色皱粒32株。 问这些植株是否符合孟德尔提出的9:3:3:1的理论
应用举例
油桃与毛桃杂交,所得分离群体共实生苗168株,
其中果皮有毛茸的132株,无毛茸的36株。问桃果 皮毛茸的有无是否受一对完全显性基因控制?
1. H0:桃果皮毛茸的有无受一对完全显性基因控 制,即有毛:无毛=3:1,HA:有毛:无毛≠3:1。 2. 确定显著水平α=0.05,查附表4, df=1时,
互独立;
2 当 2 ,df 时便接受HA而否定H0,即两个因素彼
此相关。
二、2×2表独立性测验
2×2列联表是指横行和竖行都分为两组的资料。
在作独立性测验时,其df=(2-1)(2-1)=1,
2 在计算 时需要作连续性矫正。
应用举例
调查经过种子灭菌处理与未经种子灭菌处理的小 麦发生散黑穗病的穗数,得如下列联表,试分析 种子灭菌与否和散黑穗病穗多少是否有关。
一、适合性测验的意义
二、适合性测验的步骤 三、两组资料的适合性测验 四、多组资料的适合性测验
一、适合性测验的意义
以试验所得的观察数据,与自然法则或以往试验
结果所形成的理论数据进行比较,探求实际资料 是否吻合理论假设的测验,称为适合性测验。 在遗传学中,常用测验来判断杂种后代的表现 型是否与孟德尔定律或其它规律相符合。
实际资料多于两组的 2值通式则为:
2 O 2 i m n n i
式中mi为各项理论比率,Oi为其对应的观察次数。
上例中,
2 2 2 2 315 101 108 32 2 χ 556 (9 / 16) 556 ( 3 / 16) 556 ( 3 / 16) 556 (1 / 16) 556 0.470
未发病穗数
总 数
种子灭菌
26(34.7)
50 (41.3)
76
种子未灭菌
184 (175.3)
200 (208.7)
384
总 数
210
250
460
E (|26 34.7| 0 .5) 2 (|50 41.3| 0 .5) 2 34.7 41.3 (|184 175.3| 0 .5) 2 (|200 208.7| 0 .5) 2 175.3 208.7 4 .267
2 2 由于 χC 0 .05,1,故否定H0,接受HA 。
χ
2 C
O E 0.5
推断:种子灭菌与否和散黑穗病发病高低有相关,
种子灭菌对防治小麦散黑穗病有一定效果。
以上 C 的计算也可以不通过
2
O11 O21 C1
O12 O22 C2
R1 R2 n
理论值,而采用下面的公式
2 2 0.9603 0 (4)由上表知,C ,接受H0而否定 .05
HA。
(5)推断:桃果皮毛茸的有无受一对完全显性基
因控制。
2 C 值也可以直接计算(假设理论比例为r:s):
上例中:
rs sO1 rO2 2 2 C rsn
2
31 1 132 3 36 2 2 C 0.9603 3 1 168
排列成相依表;
(2)根据两个变数相互独立的假设,算出每
一组格的理论次数;
2 ( O E ) (3)由 2 算得 2值。 E
2 此 的自由度随两个因素各自的分组数而不同。
设横行r分组,竖行c分组,那么df=(r-1)(c-1)。
2ຫໍສະໝຸດ Baidu 当 2 ,df 时就接受H0而否定HA,即两个因素相
i
i
2 Bartlett的 值为:
2 2 dfi lns 2 df ln s i p i
C
2 C 2
其中C为矫正数:
1 1 1 C 1 3( k 1) dfi dfi
第二节 适合性测验
根据两变数相互独立的假定,算得各组格的理论次数: 该组格的横行总和乘以纵行总和再除以观察总次数 E1=(210×76)/460=34.7 E2=(250×76)/460=41.3
E3=(210×384)/460=175.3
E4=(250×384)/460=208.7
处理项目
发病穗数
由于 2值是多项ui2或(O-E)2/E之和,所以它 具有可加性。 根据Helment定义, 2 分布是连续性的,但计数 资料是间断性的。由间断性资料计算出 2的偏大, 这就容易犯第一类错误。尤其是在df=1时,需要 加以连续性矫正。
2 C i 1
k
O E 0.5
2 0 .05 3.841
3. 计算 2 值:
桃果皮 毛茸
有 无 ∑
观察株数 (O)
132(O1) 36(O2) 168
理论株数 (E) 168×0.75= 126(E1) 168×0.25= 42(E2) 168
O-E 6 -6 0
O E 0.5
E
2
0.2401 0.7202 0.9603
2/σ2,那么:
u (
2 i
xi
)2
经过反复多次抽样即可得到一系列的 ui2 ,这 些 ui2就构成自由度为n的一种分布。 这里的自由度为独立的正态离差的个数。 以上这种因自由度的不同而变化的一组分布, 统称卡平方(也叫卡方,记作)分布,它的一 般性定义为:
u u u u (
2 不需要进行连续性矫正。
应用举例
下表为不同灌溉方式下水稻衰老情况的调查资料。 试测验稻叶衰老情况是否与灌溉方式有关 (α=0.05)。
灌溉方式 绿叶数 黄叶数 枯叶数 总 计
深 水
浅 水 湿 润 总 计
146
183 152 481
7
8 14 30
7
13 16 36
160
205 182 547
2
O E 2
推断:这些植株符合孟德尔提出的9:3:3:1的理论 比例。
2 C 值也可以直接计算(假设理论比例为a1:a2:…:
an-1:an ):
2 2 2 2 16 O 3 O 3 O 9 O 1 2 3 4 χ2 n 9n
上例中:
2 2 2 2 16 315 3 101 3 108 9 32 χ2 556 0.470 9 556
E 2 2 2 2 315 312.75 101 104.25 108 104.25 32 34.75 312.75 104.25 104.25 34.75 0.016 0.101 0.135 0.218 0.470
2 由于 2 0 .05 ,接受H0而否定HA。
2 2 1 2 2 2 n 2 i
xi
)2
2 分布的图形为一组具有 不同df的曲线(右图)。 2
值最小为0,最大为+∞,因
而在坐标轴的右边。 df较 小时呈偏态,随着df增加, 偏度降低,到+∞时,呈对 称分布。该分布的平均数
为df,方差为2df。附表6为
2 2 时的右尾概率表。 p
第六章 卡平方( )测验
2
主要内容
2 第一节 卡平方( )分布
第二节 适合性测验 第三节 独立性测验 第四节 方差同质性测验
第一节 卡平方( )分布
2
一、Helment 定义
二、Pearson 定义
三、Bartlett 定义
一、Helment 定义
假设从正态总体N(μ,σ2)中独立抽取样本。若 抽取一个样本容量为n的样本,其观察值为x1、 x2、…、xn,则由u=(x-μ)/σ,有u2=(x-μ)
1. H0:稻叶衰老情况与灌溉方式无关,HA:稻叶衰老情况
与灌溉方式有关。 2. 3.
2 确定显著水平α=0.05,当df=4时, 0.05 9.49 。
二、适合性测验的步骤
1. 提出无效假设:观察次数与理论次数一致,即观
察次数与理论次数的差异由抽样误差引起,备择
假设:观察次数与理论次数不一致。
2. 确定显著水平α=0.05或α=0.01 。
3. 在无效假设为正确的假定下,计算大于观察次数 值大于临界值的概率。 4. 根据所得概率值的大小,接受或否定无效假设。 5. 作出统计推断。
在实际应用中,往往不需要计算具体的概率值。
2 只要计算出 2 ,df ,我们就认为无效假设发生
的概率小于等于α,属于小概率事件,从而否定它,
而接受备择假设。
三、两组资料的适合性测验
两组资料指计数资料可以分为两组的资料,其自
由度为1,在计算 2值时需要进行矫正。 如豌豆的黄色与绿色,圆粒与皱粒;黄瓜的有 刺与无刺;洋葱的紫皮与白皮;桃果实茸毛的 有无;桃果肉的白色与黄色等。
比例(α=0.05)。
1. H0:实际观察次数之比符合9:3:3:1的理论比例, HA:实际观察次数之比不符合9:3:3:1的理论比
例。
2 2. 确定α=0.05,df=3时, 0 。 .05 7.815
3. 各组的理论次数:
黄色圆粒:556×9/16=312.75 黄色皱粒:556×3/16=104.25 绿色圆粒:556×3/16=104.25 绿色皱粒:556×1/16=34.75
第三节 独立性测验
一、独立性测验的意义
二、2×2表独立性测验 三、r×c表独立性测验
一、独立性测验的意义
判断两个因素是否独立或者相关的假设测验就是 独立性测验。 例如,如种子灭菌与发病的关系等。
用 2进行独立性测验的无效假设是两个因素相互
独立,备择假设是两个因素彼此相关。
计算过程: (1)所得次数资料按两个变数作两向分组,