第5章-卡平方测验

合集下载

卡平方测验

卡平方测验

第八章卡平方(χ2)测验知识目标:●理解卡平方(χ2)的概念;●掌握适合性测验的方法;●掌握独立性测验的方法;●了解卡平方(χ2)的可加性和联合分析。

能力目标:●学会适合性测验的方法;●学会独立性测验的方法;前面介绍了数量性状资料的统计分析方法。

在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。

间断性变数的计数资料也可整理为次数资料。

凡是试验结果用次数表示的资料,皆称为次数资料。

次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。

本章主要介绍卡平方测验。

第一节卡平方(χ2)测验一、卡平方(χ2)概念为了便于理解,现结合一实例说明χ2统计量的意义。

菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。

按1:1的性比计算,雌、雄株均应为100株。

以O表示实际观察次数,E表示理论次数,可将上述情况列成表8-1。

表8-1 菠菜雌雄株实际观测株数与理论株数的比较性别观测株数O理论株数EO-E(O-E)2/E雌92(O1) 100(E1) -8 0.64雄108(O2) 100(E2) 8 0.64合计200 200 0 1.28从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。

这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。

为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。

从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。

为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算∑-2)(E O ,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。

第5章 卡方测验

第5章  卡方测验
浅 水 湿 润
146
183 152
7
9 14
7
13 16
表现型 观察次数(O) 理论次数(E) 稃尖有色 稃尖有色 稃尖无色 稃尖无色 非糯 糯稻 非糯 糯稻 491 417.94 76 139.31 90 139.31 86 46.44
5.2 独立性测验
独立性测验
调查经过种子灭菌处理与未经种子灭菌处理
的小麦发生散黑穗病的穗数,得相依表,试分析
种子灭菌与否和散黑穗病穗多少是否有关。(数
据源:盖P139)
防治小麦散黑穗病的观察结果
处理项目
种子灭菌 种子未灭菌
发病穗数
26 184
未发病穗数
50 200
独立性测验
下表为不同灌溉方式下水稻叶片衰老情况的
调查资料。试测验稻叶衰老情况是否与灌溉方式
有关。(数据源:盖P141)
水稻在不同灌溉方式下叶片的衰老情深 水
第5章 卡方测验
5.1 适合性测验
5.2 独立性测验
属性资料的适合性测验
大豆花色一对等位基因的遗传研究,在289
株F2分离株中有208株开紫色花、81株开白色花。
问这一资料的实际观察比例是否符合于3∶1的 理论比值。
花 色 紫 色 白 色 总 数
表 7.3 大豆花色一对等位基因遗传的适合性测验 F2 代实际株数 理论株数 | O-E (|O-E|-1/2)2 O-E (O) (E) |8.25 -1/2 /E 208 216.75 -8.75 0.3140 81 72.25 +8.75 8.25 0.9420 289 289 0 1.2560
属性资料的适合性测验
两对等位基因遗传试验,如基因为独立分配, 则F2代的四种表现型在理论上应有9∶3∶3∶1的 比率。有一水稻遗传试验,以稃尖有色非糯品种 与稃尖无色糯性品种杂交,其F2代结果如下。试 检查实际结果是否符合9∶3∶3∶1的理论比率。

第五章卡平方检验

第五章卡平方检验

防止小麦散黑穗病的观察结果 未发病穗数 50(41.30) 行总和 76 384 460
发病穗数 26(34.70)
184(175.30) 200(208.70) 210 250
表中括号内为依据无效假设成立而计算出的理论次数。
湖南大学研究生院隆平分院
• 提出假设。H0: 种子灭菌与小麦穗部发病无关。

2 c i 1
k
A
i
Ti 0.5 Ti
2
(5-2)
湖南大学研究生院隆平分院
二、适合性检验
1. 适合性检验的意义
•Байду номын сангаас判断实际观察的属性类别是否符合已知的属性类别的分配
理论或学说的假设检验称为适合性检验。
• 在遗传学中,常用2测验法来决定所得实验结果是否与孟
德尔遗传规律或其他定律相符合。适合性检验的无效假设 一般是实际数据资料与理论假设相符合。
性、无连锁。
湖南大学研究生院隆平分院
三、独立性检测验 1. 独立性检验的意义 对于次数资料,还可分析两类因子是相互独立还是彼此 相关。例如研究玉米种子灭菌与否和果穗是否发病有无 关系,若相互独立,表示种子灭菌和果穗发病无关,处 理无效果;反之则处理有效果。 根据次数资料判断两类因子相互独立或彼此相关的假设 检验称为独立性检验。
湖南大学研究生院隆平分院
(4)统计推断
2 当自由度df=3时, 0.01(3) 11.34 ,因实际计算的2=92.71
>11.34,故p<0.01,否定H0,接受HA,表明该水稻稃尖
和糯性性状在F2的实际观察次数之比极显著不符合9:3:3:1
的理论比例。这一结果表明,该两对等位基因并非完全显
2 ( A T ) 2 T (37 49.00) 2 (49 39.04) 2 (57 59.04) 2 49.00 39.04 59.04 7.69

2020年智慧树知道网课《田间试验与统计分析》课后章节测试满分答案

2020年智慧树知道网课《田间试验与统计分析》课后章节测试满分答案

第一章测试1【多选题】(10分)试验设计的基本原则()。

A.局部控制B.唯一差异C.重复D.随机排列2【多选题】(10分)顺序排列试验设计中小区的排列方式有()。

A.对比法设计B.逆向式C.正向式D.阶梯式3【多选题】(10分)随机排列试验设计包括()。

A.拉丁方设计B.随机区组设计C.裂区试验设计D.完全随机设计4【多选题】(10分)完全随机设计应用()两个基本原则。

A.局部控制B.唯一差异C.随机排列D.重复5【判断题】(10分)随机排列方式可以避免系统误差。

A.对B.错6【判断题】(10分)在完全随机设计中,每一处理的重复数必须相等。

A.对B.错7【判断题】(10分)随机区组设计应用重复、随机排列和唯一差异三个试验设计的基本原则。

A.错B.对8【判断题】(10分)第一横行和第一纵行均为顺序排列的拉丁方称为标准方。

A.对B.错9【判断题】(10分)在拉丁方设计中,每一处理在每一横行和每一纵行可出现多次。

A.对B.错10【判断题】(10分)裂区设计是多因素试验的一种设计方法。

A.对B.错第二章测试1【单选题】(10分)总体的样本容量为()A.MB.NC.HD.I2【单选题】(10分)下列样本容量中()是大样本。

A.30B.15C.5D.103【多选题】(10分)质量性状资料的统计方法有()A.给分法B.统计次数法C.统计法D.集团法4【判断题】(10分)参数是用来描述样本的特征数()A.错B.对5【判断题】(10分)制作连续性变数资料次数分布表时,数据必须从大到小排序。

()A.对B.错6【判断题】(10分)变异数是反映一组数据变异程度的特征数。

()A.错B.对7【单选题】(10分)下列哪项为均方的正确表示方法()。

A.B.C.D.8【多选题】(10分)常用的次数分布图有()。

A.方柱形图B.条形图C.多边形图D.饼图9【多选题】(10分)平均数的种类包括以下哪几种()。

A.几何平均数B.算数平均数C.中数D.众数10【单选题】(10分)总体平均数用()表示。

五、卡平方测验

五、卡平方测验

F2代红花与白花的理论比例为3:1
于是将各差数平方除以相应的理 论次数再相加,记为 论次数再相加,记为χ2,即:
(O − E ) 2 χ2 = ∑ E
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计量, 越小, 偏离程度的一个统计量,χ2越小,表明实 际观察次数与理论次数越接近; χ2=0, 际观察次数与理论次数越接近 ; , 表示二者完全吻合; 越大, 表示二者完全吻合;χ2越大,表示二者相 差越大。 差越大。
各种自由度下右尾概率取α的临界
χα,df值列于附表4,供测验时查用。 值列于附表4 供测验时查用。
例如, 例如, df=10, α=0.05, , ,
χ20.05,10=18.31,表示 0.05, =18.31,
P( χ2 > 18.31)=0.05 图5.2)。 )=0.05(图 。 )=0.05
2×2表的独立性测验 × 表的独立性测验
H0:种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关 HA:种子灭菌与散黑穗病发病有关 种子灭菌与散黑穗病发病有关 显著水平 α=0.05 。
E11=460×(76/460)×(210/460)=34.7 × × 同理,O12=184相应的理论次数为 同理, 相应的理论次数为 E12=460×(384/460)×(210/460)=175.3 × × O21=50相应的理论次数为 相应的理论次数为 E21=460×(76/460)×(250/460)=41.3 × × O22=200相应的理论次数为 相应的理论次数为 E22=460×(384/460)×(250/460)=208.7 × ×
( x i − x ) 2 = ( n − 1) S 2

田间试验与统计分析 第五章 卡平方测验

田间试验与统计分析 第五章 卡平方测验

例 3 : 某 一 杂 交 组 合 , 在 F2 得 到 四 种 表 型 , B_C_,B_cc,bbC_,bbcc, 其 实 际 观 察 次 数 分 别 为 132,42,38,14。试测验是否适合9:3:3:1的理论比率。 根据计算结果,是独立遗传还是连锁遗传? p144 7.6
第三节 独立性测验
第四节 方差的同质性测验
(一)单个样本方差的假设测验
(二)两个样本方差的同质性测验
(三)多个样本方差的同质性测验
方差的同质性测验 方差同质性是指各个总体的方差相等
1. 单个样本方差的假设测验是测验一个样本方差和某 一指定值C是否有显著差异。
2. 两个样本方差的同质性测验是测验两个抽自正态总 体的独立样本的方差所属的总体是否有显著差异。 3.测定 3 个或3个以上样本方差是否来自相同方差的总 体称为方差的同质性测验,又叫Bartlett测验。
品种 健株数 病株数 总计 A 442 78 520 B 460 39 499 C 478 35 513 D 376 298 674 E 494 50 544 总计 2250 500 2750
(一)单个样本方差的假设测验
1.两尾测验 2 H0: =C 若计算的
HA: 2 ≠C
此时,在α水平上否定H0。
2.一尾测验 测验s2是否显著大于指定值C,无效假设为: H0: 2≤C HA: 2 >C
2 2 > ,df 如果算得的 则否定H0,这是应用2 分布的右边一尾。
3.1 ,各自有自由度 4 、 5 、 11 ,试测验其是 否同质。
方差同质性测验

多个样本方差同质性测验,经常应用在多点或多年 试验的综合性分析中,对不同试验点误差方差的同

卡平方测验

卡平方测验

卡平方测验
实验目的
1.以提供的数据练习计算x2值,并测定其是否近似理论假设的期望比值。

2.依据相应自由度,检验计算所得x2值。

3.熟练掌握x2值的计算和利用x2值评估实验结果
实验原理
卡平方(x2)测验的目的是以吻合度断定所获得的资料与理论上期望的比值是否满足或近似,也就是x2测验可以测定所得数据是否偏离吻合概率。

显然,如果偏差小是因为偶然机会,偏差大则不是出于偶然机会。

卡平方x2测验试图为我们解决这个问题:“骗差小到何种程度才可以认为只是出于偶然机会。

”卡平方x2值的公式如下:
x2 =∑(O-E)2/E
这里的o是特定表现型个体的观察数目;E是这一表现型在理论上期望的数目;∑是各种表现型(O-E)2/E的累加值。

例如,高茎番茄和矮茎番茄杂交,F1全为高茎,F2有102株高茎和44株矮茎。

这些资料是否符合3:1的概率?回答这个问题必须计算x2值,把计算过程综合整理于表2-1。

2
计算所得的x值为2.0548,x值意味着什么呢?如果实际观察值(O)精确等于理论期望值(E),x2值为 0,是一个完满的好适度。

于是x2值小,表明观察结果接近期望比率;x2值大,表明观察结果与期望比率存在明显差异。

一般统计学家把P=1/20或P=0.05定为显著水平。

当两组变数自由度为1时,卡平方x2值为3.841的概率是0,05,观察值与期望值相抵触。

在刚才的实例中x2=2.0548,它小于允许最大值x2 =3.841,P>0.05。

因而可以认为偏差只是偶然机会,实验数据符合3:1的概率的假设。

卡平方检验

卡平方检验

观测值 Oi 4 36 129 188 211 176 142 80 30 4 1000
编码 Vi 0 1 2 3 4 5 6 7 8 9
V i2 0 1 4 9 16 564 844 880 852 560 240 36 4270
Oi*Vi2 0 36 516 1692 3376 4400 5112 3920 1920 324 21296
当样本的方差等于理论平均数时: 即 当样本的方差等于理论平均数时 (即: δ2 = µ) (X- 2 X-µ)2 X- U 则: X2= ∑ 由此可知: 由此可知: 1.X2分布是当样本的方差等于理论平均数时的一种特 殊形式的正态离差平方的分布. 殊形式的正态离差平方的分布. 其分布是连续的, 2.其分布是连续的,其值域的大小随着自由度的 增加 而增加。 而增加。 项数越多, 值越大)。 (即:项数越多,X2值越大)。 2、适合性检验: 、适合性检验: 已知:男女性别比例为: : 。调查某地100名新生 例:已知:男女性别比例为:1:1。调查某地 名新生 儿,得:男:58,女:42。 , 。 该地区新生儿是否符合1: 比例 比例? 问:该地区新生儿是否符合 :1比例? 假设: 符合1: 比例 比例)。 解:假设:H0:O-T=0(符合 :1比例)。 符合 HA:O-T≠0(不符合 :1比例)。 不符合1: 比例 比例)。 不符合
= = = = = =
2(|a-T|-1/2)2 + 2(|b-T|-1/2)2 n 分子分母同乘以2) (分子分母同乘以 ) 2[|a-(1/2a+1/2b)|-1/2]2+2[|b-(1/2a+1/2b)|-1/2]2 n 2[|a-1/2a-1/2b|-1/2]2 + 2[|b-1/2a-1/2b|-1/2]2 n 2[|1/2a-1/2b|-1/2]2 + 2[|1/2b-1/2a|-1/2]2 n 2×1/4[|a-b|-1]2 +2×1/4[|b-a|-1]2 × × n (|a-b|-1)2 n 一对基因 1:1分离 : 分离

卡平方测验

卡平方测验

0.05
(3)测验计算: : 在假设 H 0为正确的前题下, 则可得如下求理论值的比例式,求出理论值: 300∶100=231∶E1 300∶200=231∶E2 300∶100=69∶E3 300∶200=69∶E4 所以 E1=77 E2=154 E3=23 E4=46
健株 甲品种 乙品种 合 计 O 88 143 231 E 77(E1) 154(E2) 231 O 12 57 69
病株
E 23(E3) 100 46(E4) 200 69 300
合计
当 df r 1c 1 2 12 1 1时,
O E 0.5 2 2 E


77 154 2 2 2 2 2 2 2 .34 .5 6 . 63 4 0.5 9 12 23 0 57 46 0 . 5 0 . 01 , 1 88 77 0.5 143 154 0.5 12 23 54 23 46 77 154 2
注:卡方适合性测验还经常用来测验试验数据的次 数分布是否和某种理论分布(如二项分布、正态分布等) 相符,以推断实际的次数分布究竟属于哪一种曲线类型。
(即:拟合优度检验)
单向分组计数资料:将资料列成表格后,行数 R=1,列数C≥2的计数资料。 [例] 某地进行人口调查,共有人口378万人,其
中男、女人口分别为190、188(万人),即:
2 9.34 0 .05, 1 3.84

88 77 0.5
2

143 154 0.5
2

12 23
所以 p 0.05 。 (4)推断:否定H 0 ,接受 H A ,即发病率的高低与品 种有关。

卡平方测验公式

卡平方测验公式

卡平方测验公式卡平方检验是一种常用的假设检验方法,用于检测两个变量之间是否存在统计学上的关联性。

其中,卡方分布是一种概率分布,常用于统计学分析中。

本文将从卡平方测验的定义、原理、公式、注意事项等方面进行详细介绍。

一、卡平方测验的定义卡平方测验(Chi-square test)是一种用于分析分类资料的统计方法,用来评估随机变量的频率分布与某种理论分布之间的偏离程度。

它通过比较实际观测值和理论值的差异,来判断这种差异是否显著。

二、卡平方测验的原理卡平方测验的原理是基于卡方分布的统计原理。

卡方分布是指自由度为n的卡方变量X2的概率分布,其概率密度函数为f(x) =x^(n/2-1)*e^(-x/2) / (2^(n/2)*Γ(n/2)) ,其中,Γ(n/2)为伽玛函数值。

卡方分布的特点是非对称的,取值范围为[0,+∞)。

卡平方测验的基本思路是:1.设定原假设和备择假设;2.收集样本数据;3.计算观测值的卡方值;4.确定自由度;5.查找卡方分布表,找到临界值;6.比较观测值的卡方值和临界值;7.根据比较结果,判断原假设是否成立。

三、卡平方测验的公式卡平方测验的公式如下:卡方值=Σ(观测值-理论值)²/理论值其中,Σ表示对所有分类统计量求和。

四、注意事项1.在进行卡平方测验时,样本数量应该尽可能大,否则可能会导致误差增大;2.进行卡平方测验时,要保证分类变量的独立性,即各分类变量之间应该互相独立;3.进行卡平方测验时,要注意设置显著性水平,一般取α=0.05或α=0.01;4.进行卡平方测验时,要选择合适的观测和理论值,否则可能会导致结果不准确;5.进行卡平方测验时,最好使用专业的卡平方测验软件或计算器,以提高效率和准确性。

五、总结卡平方测验是一种重要的假设检验方法,常用于分析分类数据和判断两个变量之间的关联性。

它基于卡方分布的统计原理,通过比较理论值和观测值的差异来判断原假设是否成立。

在进行卡平方测验时,需要注意样本数量的大小、分类变量的独立性、显著性水平的设置、观测和理论值的选择以及使用专业工具等因素。

第五章卡平方测验-

第五章卡平方测验-

11
5.3 适合性测验
西南科技大学生命科学与工程学院周海廷制作
12
适合性χ2测验的方法
适合性测验(test for goodness-of-fit):比较 实验数据与理论假设是否符合的假设测验。 现以玉米花粉粒碘染反应为例,予以说明:
玉米花粉粒碘反应观察次数与理论次数
碘反应 蓝色 非蓝色 观察次数(O) 3437(O1) 3482(O2) 理论次数(E) 3459.5(E1) 3459.5(E2) O-E -22.5 +22.5 (O-E)2/E 0.1463 0.1463
西南科技大学生命科学与工程学院周海廷制作
15
(| O E | 1 2) E
2 C
2
本例
2 2 (| 22 . 5 | 1 2 ) (| 22 . 5 | 1 2 ) 2 C 0.2798 3459.5 3459.5
2 ,实得 0 查附表6,当ν=k-1=2-1=1时, .05,1 3.84
2 2 1 2 2 2 i 2 n 2 i
xi i
)2
(
2
xi

)2
χ2分布图形为一组具有不同自由度ν值的曲线。 χ2值最 2 小为0,最大为+∞,因而在坐标轴的右边。附表6为χ2≥ p
时的右尾概率表。
西南科技大学生命科学与工程学院周海廷制作
3
若所研究的总体μ不知,而以样本
(
2
代替,则 x
xi x

)
2
1
2
2 ( x x ) i

(n 1) s 2
2
s 2 2
χ2的定义二:

卡方检验

卡方检验
36
总计 160 205 182 547
H0:稻叶衰老情况与灌溉方式无关;HA:稻叶衰老情 况与灌溉方式有关。
取 =0.05。 根据H0的假定,计算各组格观察次数的相应理论次数: 如与146相应的E=(481×160)/547=140.69,
与183相应的E=(481×205)/547=180.26,……, 所得结果填于表7.11括号内。
因本例共有k=4组,故df=k-1=3。查附表4,
,现实得
,所以否定
H0,接受HA,即该水稻稃尖和糯性性状在F2的实际结果 不符合9∶3∶3∶1的理论比率。
这一情况表明,该两对等位基因并非独立遗传, 而可能为连锁遗传。
实际资料多于两组的 值通式则为:
(5·15)
上式的mi为各项理论比率,ai为其对应的观察次数。 如本例,亦可由(5·15)算得
如种子灭菌项的发病穗数O11=26,其理论次数 E11=(210×76)/460=34.7,即该组格的横行总和乘以纵行总 和再除以观察总次数(下同);同样可算得
O12=50 的 E12=(250×76)/460=41.3; O21=184的E21=(210×384)/460=175.3; O22=200的E22=(250×384)/460=208.7。 以上各个E值填于表5.7括号内。
(1)设立无效假设,即假设观察次数与理论次数的差 异由抽样误差所引起,即H0:花粉粒碘反应比例为1∶1 与HA:花粉粒碘反应比例不成1∶1。
(2)确定显著水平 =0.05。
(3)计算 值
查附表4,当

=3.84 ,实得
=0.2926小于
,所以接受H0。即认为观察次数和理
论次数相符,接受该玉米F1代花粉粒碘反应比率为1∶1的

卡平方测验

卡平方测验

,
所以否定H0,接受HA,即该水稻稃尖和糯性性 状在F2的实际结果不符合9∶3∶3∶1的理论比率。
这一情况表明,该两对等位基因并非独立遗
传,而可能为连锁遗传。
第三节 独立性测验
一、 2×2表的独立性测验
二、 2×c表的独立性测验 三、 r×c表的独立性测验
14
χ2应用于独立性测验(test for independence),
O- E | O-E |-1/2 (|O-E|-1/2)2/E
208 81
216.75 72.25
-8.75 +8.75
8.25 8.25
0.3140 0.9420
总数
289
289
0
1.2560
H0:大豆花色F2分离符合3∶1比率;HA:不符合3∶1比率。 显著水平 a =0.05。由于该资料只有k=组, ν k 1 1 ,
2 2 2 0 9 . 49 , 现 5 . 62 .05, 4 0.05, 4 P 0.05
接受H0:不同的灌溉方式对水稻叶片的衰老情况没有显 著影响。
23
21
三、r×c表的独立性测验
若横行分r组,纵行分c组,且r≥3,c≥3,则为r×c相 依表,其ν=(r-1)(c-1) [例]下表为不同灌溉方式下水稻叶片衰老情况的调查资 料。试测验稻叶衰老情况是否与灌溉方式有关。
灌溉方式 深水 绿叶数 146(140.69) 黄叶数 7(8.78) 枯叶数 7(10.53) 总计 160
故应接受H0,说明大豆花色这对性状是符合3∶1比率,即符
合一对等位基因的表型分离比例。
[例2]
两对等位基因遗传试验,如基因为独立分配,则F2
代的四种表现型在理论上应有9∶3∶3∶1的比率。有一水稻 遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种杂交, 其F2代得表2结果。试检查实际结果是否符合9∶3∶3∶1的理 论比率。

第5章 卡平方检验

第5章 卡平方检验

r=2 c=3
B C 总数 58 45
10(19.71) 40(31.53) 8(6.76) 25(15.29) 16(24.47) 4(5.24)
总数
35
56
12
103
第一步 H0:三地区与花生污染无关 HA:三地区与花生污染有关
第二步 α=0.05, 0.01
第三步 计算 与df
2
理论次数:
2
df≥2
第二节 适合性检验
适合性检验主要检验实际结果是否符
合理论比率。
H0:实际结果符合理论比率。 理论次数 T=总次数 n ×理论比率
df=k-1
例1, [例7-1] 已知:A甲=34,A乙=46,n=80 理论比率=48:52
解: 第一步 建立假设H0:实际符合理论比率 (消费者喜好无变化) HA:实际不符合理论比率
第四步 查找临界值 ,并作出统计推断
2
由df=1和α=0.05、0.01查表11 得

2 0.05(1)=3.84,
2 c

2 0.01(1)=6.63
2 0.05(1)
因为 0.7617 <
,p>0.05,所
以接受无效假设H0,认为实际次数与理论
次数差异不显著,即消费者对两种产品的
例1, [例7-4] r=2
食品 性别 男性 女性 总数
c=2
常规
40(35) 30 (35) 70
“有机”
10 (15) 20 (15) 30
总数
50 50 100
第一步 H0:性别与食品类型无关 HA:性别与食品类型相关
第二步 第三步
α=0.05, 0.01 计算 和 df

卡平方测验

卡平方测验
df=3
0.1
df=∞
df=5
0.0
0
2
4
2
6
8
10 12
图5.1 df=1,3和5的χ2分布图
第27页,此课件共29页哦
f(2)
F( 2) 1-F( 2)
2
0
2i
图5.2 2分布概率累积函数图解
第28页,此课件共29页哦
课程内容
第一章 绪论 第二章 试验设计原理及食品试验常用的设计 第三章:数据资料的整理与特征数 第四章:理论分布及抽样分布 第五章:统计假设检验 第六章 卡平方检验 第七章 方差分析 第八章 正交试验设计与分析 第九章 直线回归与相关
卡平方测验
第1页,此课件共29页哦
&6.1 卡平方测验概述
一、卡平方的定义与分布
X2定义:在方差为σ2的正态总体中,随机独立抽取容量为n 的样本,n个独立的正态离差u1、u2、…、un的平方和则定义为 x2 (chi square) ,即:
2 u 1 2 u 2 2 u i 2 u n 2 u i 2 (y ii)2
2
图7.4 H0:σ2≥σ20, HA:σ2<σ20,否定区在左尾。
第25页,此课件共29页哦
f(2)
α/2
α/2
2 (1α/2) ,df
2 α/2 ,df
2
图7.5 H0:σ2=σ20, HA:σ2≠σ20,否定区在左或右尾。
第26页,此课件共29页哦
f(2)
0.5
0.4 df=1
0.3
0.2
X2的基本公式:必须用连续性矫正公式;当df≥2时,可以不
作连续性矫正。
X2连续性矫正公式:
[(at)1]2
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

花色 F2代实际株数(O) 理论株数(E)
白色
192
187.5
黄皮
58
62.5
总数
250
250
O-E 4.5 -4.5
1.提出假设:观察次数与理论次数的差异由抽样误 差所引起,即H0:F2代南瓜果皮色泽分离符合 3:1比率,对备择假设HA:不符合3:1。
2.确定显著水平: 0.0,50.01
184
175
.3

1 2

50

41 .3

1
2

2
2
175 .3
41 .3
200
208 .7

1 2

2 4 .267
208 .7
当df=1时,(20.05,1) 3.84,(20.01,1) 6.63
由于 2 0 .0,1 5 3 .8 4 c 2 4 .2 62 0 7 .0,1 1 6 .63
效假设或否定无效假设。
第二节 适合性测验
一、适合性 2 测验的方法
适合性测验是指测验观察的实际次数与某种 理论或需要预期的理论次数是否相符合。
例1:某项试验观察淀粉质与非淀粉质玉米杂 交的F1代花粉粒,经碘处理后有3437粒呈 蓝色反映,3482粒呈非蓝色反映。如果属于 1对等位基因控制的遗传性状,F1代花粉粒 碘反映的理论比例应该是1:1,问其遗传性 状是否符合1对等位基因控制的遗传规律。
将本例数据代入上式
26200184504602 460
c2
2 76384210250
4.267
2. 2XC表的独立性测验
2XC表是指横行分为两组,纵列分为 C大于等于3组,因为df=(r-1)(c-1) ≥ 2,因此可以不做连续性的矫正。
可先计算各理论值做表格化计算, 也可以根据下式直接计算:
2 0.0 5
,表示
H0成立,即两类现象是相互独立的;

,则否定H0,接受HA,
说明不2 独立02.0,5 处理有效。
1. 2x2表的独立性测验
是指横行和纵列都是两组的计数资料, 即r与c分组均为2,其df=(r-1)(c-
1)=1, 因此在计算 2 时,需进行连
续性的矫正。
例:调查经过种子灭菌处理与未经种 子灭菌处理的辣椒发生枯萎病的株数, 得相依表,试分析种子灭菌与否和病 株多少是否相关。
3. 2 卡平方值的连续性矫正
2是一种连续分布的理论曲线,但 是 测验所应用的次数资料是间断性 的,如果把间断性的资料作连续性 的处理,会产生很大的偏差,降低 了显著标准。特别是在自由度为1时, 需要加以矫正。其方法是将各偏差 的绝对值都减去1/2,即
OE 1 2
c2

k i1
与利用公式计算的结果一致。
例3
今调查10年生元帅苹果盛果期树3株的 枝类组成,共调查了110760枝,其 中中短枝(结果枝和叶丛枝)77021 枝,长枝(15cm以上)33739枝, 问其枝类组成是否达到中短枝占70%, 长枝占30%的丰产指标?
1.假设枝类组成达中短枝占70%,长
枝占30%丰产指标,即Ho:中短枝:长 枝=7:3,
2 OEE2
(2923.66)2 (6812.387)2 (252.53)2
23.66
12.387
52.53
15.402
本例中df=(2-1)×(3-1)=2,查附表5
2 (0.01,2)
9.21,
c 2 1.5 0 4 22 0 .0,2 1 9 .2,P 1 0 .01
2 n2

Tr1Tr2
O12j Tcj
Tnr21
例1:进行大豆等位酶的Aph的电泳分 析,193份野生大豆、223份栽培大豆 等位基因型的次数分布,试分析大豆 Aph等位酶的等位基因型频率是否因 物种而不同。
物种
等位基因
1
2
3
野生大豆 29(23.66) 68(123.87) 96(45.47)
1.提出假设:观察次数与理论次数的差异由
抽样误差所引起,即H0:花粉粒碘反应比 例为1:1,对备择假设HA:花粉粒碘反应 比例不为1:1。
2.确定显著水平:0.0,50.01
3.测验计算:
碘反应 观察次数(O) 理论次数(E) O-E
蓝色
3437
3459.5
-22.5
非蓝色
3482
3459.5
故0.01<P<0.05,否定H0,即种子灭菌 与否和枯萎病发病率相关,灭菌后的病 株数与未灭菌的病株数存在着显著的差 异,种子灭菌对防治辣椒枯萎病有一定 效果。
2X2表的独立性测验,也可以不经过计 算理论值,根据下式可直接算得值:
c2


O11O22 O12O21

n2n 2
Tr1Tr2Tc1Tc2
2 (0.01,3)
11.345,
c 2 1.2 8 92 0 .0,3 1 1.3 1,4 P 5 0 .01
所以否定H0,接受HA,即该病害的发生与 品种密切相关,品种不同,感染某病害
有极显著差异。
3. rc表的独立性测验
由于自由度大于2,故不必进行连续 性的矫正。可利用公式直接计算
第三节 独立性测验
独立性测验是探求两个计数资料之间 是否相互独立,这是次数资料的一 种相关研究。
例如,喷药保果试验,以喷清水为对照, 二者若相互独立,表明喷药与落果无关, 处理无效。若相互不独立,表明喷药与 保果有关,处理有效。
应用独立性测验时
先假设各类现象是独立的,然后计算
值,如果计算出的
2
2.确定检验水平 0.0,50.01那么:
c2
3A7a 52 21n
37702173373952

11.204
21110760
当df=1时,(20.01,1) 6.63,由于c21.120420.0,11
否定无效假设,差异非常显著。说明没有达 到7:3的丰产指标。
总计
176 10 9 195
1.提出假设,H0:叶片衰老与密度无关,二 者独立;对备择假设HA:叶片衰老情况 与密度有关。
2.确定显著水平:0.0,50.01
3.测验计算:实际数代入公式

2 n


Oห้องสมุดไป่ตู้
2 ij
TriTcj

1

195 [( 64 2 60 2 52 2 176 67 176 66 176 62

O E 1 2 2
E
这样就可以使其概率接近于 2 分布
的真实水平,矫正后的

2 常用

2 c
表示。当自由度等于2或大于2时,
一般不做连续性的矫正。
4. 2 测验的原理和显著性测验原理相同
可分为以下步骤: 1.提出假设:
2.确定检验水平: 0.0,50.01
3.测定误差概率:计算卡平方值 4.统计推断:依据试验结果决定接受无
栽培大豆 22(27.34) 199(143.13) 2(52.53)
总计
51
267
98
总计
193 223 416
1.提出假设,H0:等位基因频率与大豆种类 无关,对备择假设HA:两者有关,不同 大豆种类的等位基因频率不同。
2.确定显著水平:0.0,50.01
3.测验计算:计算出理论数代入公式
2. 2 分布具有的特点:
1. 2 无负值,因此 2 分布自0至+ ∞ 之间, 故左右不对称,向右倾斜。
2. 2分布是随自由度而改变的一组连续性曲线。
3. 2 分布的形状与样本大小及理论比率无关, 而与分组数有关。
不论理论比率为1:1,或3:1,或15:1,都是两组, 自由度均等于1;理论比率分三组1:2:1自由度 等于3-1=2,理论比率9:3:3:1,自由度4-1=3
22.5
总数
6919
6919
0
(O-E)2/E
0.1463 0.1463 0.2926
(OE1)2
c2
2 E
2.2 50.52 2.2 50.52


34.59 34.59
0.2798
当df=1时,(20.05,1) 3.84, C20.27 9(8 20.0,5 1)3.8,4

Tr1Tr2
O12j Tcj
Tnr21
218 10 7 620832 42 0 502 32 0 001 22 5 002 20 2 70 1810270
1.82903
本例中df=(2-1)×(4-1)=3,查附表5,
第五章 卡平方( 2)测验
第一节 卡平方( 2)测验的方法 1.卡平方( 2 )定义、公式和分布
1900年K.Pearson根据从属性状的分布推 导出用于次数资料(亦称计数资料)分
析的 2 公式:
2 k OE2
i1 E
上式中:
O为观察次数, E为理论次数, k为分组数。
其分布属于连续 型分布。
3.测验计算:
E11

210 76 460

34 .70
E12

250 76 460

41.3
E21

210 384 460
175 .3
E22

250 384 460
208 .7
O E

1
2


26
34 .7

1
2
相关文档
最新文档