生物统计5-卡平方测验
卡平方测验
第八章卡平方(χ2)测验知识目标:●理解卡平方(χ2)的概念;●掌握适合性测验的方法;●掌握独立性测验的方法;●了解卡平方(χ2)的可加性和联合分析。
能力目标:●学会适合性测验的方法;●学会独立性测验的方法;前面介绍了数量性状资料的统计分析方法。
在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。
间断性变数的计数资料也可整理为次数资料。
凡是试验结果用次数表示的资料,皆称为次数资料。
次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。
本章主要介绍卡平方测验。
第一节卡平方(χ2)测验一、卡平方(χ2)概念为了便于理解,现结合一实例说明χ2统计量的意义。
菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。
按1:1的性比计算,雌、雄株均应为100株。
以O表示实际观察次数,E表示理论次数,可将上述情况列成表8-1。
表8-1 菠菜雌雄株实际观测株数与理论株数的比较性别观测株数O理论株数EO-E(O-E)2/E雌92(O1) 100(E1) -8 0.64雄108(O2) 100(E2) 8 0.64合计200 200 0 1.28从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。
这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。
为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。
从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。
为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算∑-2)(E O ,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。
生物统计学—卡方检验
k
cc2 i 1
Oi Ei 0.5 2 Ei
当自由度df>1时,与连续型随机变量卡方分相
近似,这时可以不做连续性矫正
注意:要求各个组内的理论次数不小于5,如某 组理论次数小于5,则应把它与其相邻的一组或 几组合并,知道理论次数大于5为止
适合性检验
适合性检验(吻合性检验或拟合优度检验) 步骤:
1. 提出无效假设,即认为观测值和理论值之间 没有差异
2. 规定显著性水平 3. 计算样本卡方值 4. 根据规定的显著水平和自由度计算出卡方值, 再和实际计算的卡方值进行比较
例:有一鲤鱼遗传试验,以荷包鲤鱼(红色,隐性)与湘江 野鲤(青灰色,显性)杂交,其F2获得下表的所列的体色分 离尾数,问这一资料的实际观测值是否符合孟德尔一对等位 基因的遗传规律?
所以卡方值是度量实际观测值与理论值偏南 程度的一个统计量
卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越大 卡方值为0,表明H0严格成立,且它不会有下侧 否定区,只能进行右尾检验
卡方检验的原理和方法
由于离散型资料的卡方检验只是近似地服从连 续型变量的卡方分布,所以在对离散型资料进行 卡方检验计算的时,结果常常偏低,特别是当自 由度df=1时,有较大偏差,为此需要进行矫正:
总和Ri 300 200
T=500
分析:1)独立性检验问题 2) 自由度为df=(2-1)*(2-1)=1,需要连续性矫正
解:(1)假设 H0 : 吸烟与患气管炎无关 对 H A : 吸烟与患气管炎有关联
(2)选取显著水平 0.05
(3)检验计算: 计算联表中的各项的理论次数
不同人群 吸烟人群 不吸烟人群
需要计算分布的数字 (X>0) 自由度
生物统计学—卡方检验
CHIINV Probability Degrees_freedom
卡方分布的单尾概率 自由度
精品课件
卡方检验基础
2检验是以2分布为基础的一种假设检验 方法,主要用于分类变量,根据样本数据推 断总体的分布与期望分布是否有显著差异, 或推断两个分类变量是否相关或相互独立。
精品课件
卡方检验基础
2值的计算:
其否定 2 区 2为 和 2 : 2
1
2
2
精品课件
例:已知某农田受到重金属污染,经抽样测定铅浓度分别为:
4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),方差为
0.150, 试检验受到污染的农田铅浓度的方差是不是和正常 浓度铅浓度的方差(0.065)相同
分析:1)一个样本方差同质性检验
由于离散型资料的卡方检验只是近似地服
从连续型变量的卡方分布,所以在对离散型资料
进行卡方检验计算的时,结果常常偏低,特别是
当自由度df=1时,有较大偏差,为此需要进行矫
正:
k c2 i1
等
精品课件
卡方 (c2) 分布
总体
m
选择容量为n 的 简单随机样本 计算样本方差S2
计算卡方值
2 = (n-1)S2/σ2
计算出所有的
2值
精品课件
不同容0
2
卡方 (c2) 分布的特点
不同容量样本的抽样分布
1、 2分布是一个以自由度n为参数
的分布族,自由度n决定了分布的 形状,对于不同的n有不同的卡方 分布
如果样本确实是抽自由(P1, P2,…,Pk)代表的总体,Oi和Ei之间的差异就只
是随机误差,则Pearson统计量可视为服从卡方 分布
第5章-卡平方测验
花色 F2代实际株数(O) 理论株数(E)
白色
192
187.5
黄皮
58
62.5
总数
250
250
O-E 4.5 -4.5
1.提出假设:观察次数与理论次数的差异由抽样误 差所引起,即H0:F2代南瓜果皮色泽分离符合 3:1比率,对备择假设HA:不符合3:1。
2.确定显著水平: 0.0,50.01
184
175
.3
1 2
50
41 .3
1
2
2
2
175 .3
41 .3
200
208 .7
1 2
2 4 .267
208 .7
当df=1时,(20.05,1) 3.84,(20.01,1) 6.63
由于 2 0 .0,1 5 3 .8 4 c 2 4 .2 62 0 7 .0,1 1 6 .63
效假设或否定无效假设。
第二节 适合性测验
一、适合性 2 测验的方法
适合性测验是指测验观察的实际次数与某种 理论或需要预期的理论次数是否相符合。
例1:某项试验观察淀粉质与非淀粉质玉米杂 交的F1代花粉粒,经碘处理后有3437粒呈 蓝色反映,3482粒呈非蓝色反映。如果属于 1对等位基因控制的遗传性状,F1代花粉粒 碘反映的理论比例应该是1:1,问其遗传性 状是否符合1对等位基因控制的遗传规律。
将本例数据代入上式
26200184504602 460
c2
2 76384210250
4.267
2. 2XC表的独立性测验
2XC表是指横行分为两组,纵列分为 C大于等于3组,因为df=(r-1)(c-1) ≥ 2,因此可以不做连续性的矫正。
生物统计学 第五章 卡方检验
验,通过假设所观测的各属性之间没有关联, 然后证明这种无关联的假设是否成立。
同质性检验 在连续型资料的假设检验中,对一个样本方差
的同质性检验,也需进行χ2 检验。
第五章 第一节 χ2检验的原理与方法 第二节 适合性检验 第三节 独立性检验
➢ χ2检验就是统计样本的实际观测值与理论推算
离散型资料 总体分布未知
检验对象
总体参数或几个总体参 数之差
不是对总体参数而是对 总体分布的假设检验
χ2 检验的相关知识
三、χ2检验的用途 指对样本的理论数先通过一定的理论分布推算
适合性检验 出来,然后用实际观测值与理论数相比较,从
而得出实际观测值与理论数之间是否吻合。因 此又叫吻合度检验。 是指研究两个或两个以上的计数资料或属性资
(4)推断
确定自由度,df=(r-1)(c-1),查临界值 表,进行推断。
给药方式 口服 注射 总数
给药方式与给药效果的2×2列联表
有效 58 64 122(C1)
无效 40 31 71(C2)
总数
98(R1) 95(R2) 193(T)
有效率 59.2% 67.4%
1.H0 :给药方式与给药效果相互独立。 HA :给药方式与给药效果有关联。
进行计算:
2 1
n
Oi2 n pi
Oi -第 i 组的实际观测数 pi -第 i 组的理论比率 n-总次数
豌豆
F2代,共556粒
315
101 108
32
此结果是否符合自由组合规律
根据自由组合规律,理论分离比为:
黄圆:黄皱:绿圆:绿皱= 9 :3 :3 :1 16 16 16 16
五、卡平方测验
F2代红花与白花的理论比例为3:1
于是将各差数平方除以相应的理 论次数再相加,记为 论次数再相加,记为χ2,即:
(O − E ) 2 χ2 = ∑ E
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计量, 越小, 偏离程度的一个统计量,χ2越小,表明实 际观察次数与理论次数越接近; χ2=0, 际观察次数与理论次数越接近 ; , 表示二者完全吻合; 越大, 表示二者完全吻合;χ2越大,表示二者相 差越大。 差越大。
各种自由度下右尾概率取α的临界
χα,df值列于附表4,供测验时查用。 值列于附表4 供测验时查用。
例如, 例如, df=10, α=0.05, , ,
χ20.05,10=18.31,表示 0.05, =18.31,
P( χ2 > 18.31)=0.05 图5.2)。 )=0.05(图 。 )=0.05
2×2表的独立性测验 × 表的独立性测验
H0:种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关 HA:种子灭菌与散黑穗病发病有关 种子灭菌与散黑穗病发病有关 显著水平 α=0.05 。
E11=460×(76/460)×(210/460)=34.7 × × 同理,O12=184相应的理论次数为 同理, 相应的理论次数为 E12=460×(384/460)×(210/460)=175.3 × × O21=50相应的理论次数为 相应的理论次数为 E21=460×(76/460)×(250/460)=41.3 × × O22=200相应的理论次数为 相应的理论次数为 E22=460×(384/460)×(250/460)=208.7 × ×
( x i − x ) 2 = ( n − 1) S 2
卡平方测验
根据处理及考察指标的多少分为不同的列联表:
宜宾学院
15
第四章 孟德尔遗传
检验程序
1、提出假设 H0:O-E=0;HA: O-E≠0 2、根据概率的乘法法则计算理论数:理论数的计算方法——
E ij
3、检验统计量:
i行总数 j列总数
总数
4、统计推断
宜宾学院
16
第四章 孟德尔遗传
[例] 表5.11为不同灌溉方式下水稻叶片衰老情况的调查资料。试
H0:稃尖和糯性性状在F2的分离符合9∶3∶3∶1; HA:不符合9∶3∶3∶1。
显著水平: 然后计算
表现型
=0.05。 值
稃尖有色非 糯 稃尖有色 糯稻 稃尖无色 非糯 稃尖无色 糯稻 总数
观察次数(O) 理论次数(E) O -E
宜宾学院
491 417.94 73.06
76 139.31 -63.31
4、依所得概率值的大小,接受或否定无效假设
在实际应用时,往往并不需要计算具体的概率值。 若实得 若实得 ≥ < 时,则H0发生的概率小于等于 时,则H0被接受。 , 属小概率事件,H0便被否定;
宜宾学院
8
第四章 孟德尔遗传
情况1:大豆花色一对等位基因的遗传研究如 下图:
P F1 F2 紫花 白花 紫花
稃尖有色 非糯 491 稃尖有色 糯稻 76 稃尖无色 非糯 90 稃尖无色 糯稻 86 总数 743
结果是否符合 9∶3∶3∶1的 理论比率?
宜宾学院
11
第四章 孟德尔遗传
二、 适合性检验
有一水稻遗传试验的适合性测验 按9∶3∶3∶1的理论比率算得各种ห้องสมุดไป่ตู้现型的理论次数E,
如稃尖有色非糯稻 E=743×(9/16)=417.94……
生物统计学 第六章 卡平方测验
解:( 1 )列联表
第一块田 第二块田 总数
有锈病 372 ( 396*702/774=359.16 ) 330 ( 378*702/774=342.84 ) 702
无锈病 24 ( 396*72/774=36.84 ) 48 ( 378*72/774=35.16 ) 72
H 0 : 两块地发病率一致, H A : 两块地 发病率不一致
进行列联表分析,那些情况下需要进行连续 性矫正( A)。
A.2×2 表 B.2×3 表 C.2×c 表 D.r ×2 表
以红米非糯稻和白米糯稻杂交,子二代检测
179 株,数据如下:
属性 (x)
红米非糯 红米糯 白米非糯 白
株数
96
37
31
问子二代分离是否符合 9 : 3 : 3 : 1 的
规律? ( A)。
,等等。
查表,得
,所以
差异极显著,拒绝 H 0 ,这一品种已不纯。
求置信区间,首先有,
由于该表有三行三列,∴自由度 df =(3-1) ×(3-1) = 4。不须连续性矫正。查表:
,∴差异不显著,接 受 H 0 ,叶片衰老与灌溉方式无关。
所以
的置信区间为,
22. 纯种玉米株高方差不应大于 64
。
现测量某一品种玉米 75 株,得株高
总数 396 378 774
=0.4240+4.1334+0.4442+4.3309 =9.3325
,
=7.8794
9 . 3325 > 7 . 8794, 所以差异极显著, 拒绝 H 0 ,两块地发病率不一致
( 2 )百分数检验: H 0 : 两块地发病率 一致, H A : 两块地发病率不一致
卡平方测验
0.05
(3)测验计算: : 在假设 H 0为正确的前题下, 则可得如下求理论值的比例式,求出理论值: 300∶100=231∶E1 300∶200=231∶E2 300∶100=69∶E3 300∶200=69∶E4 所以 E1=77 E2=154 E3=23 E4=46
健株 甲品种 乙品种 合 计 O 88 143 231 E 77(E1) 154(E2) 231 O 12 57 69
病株
E 23(E3) 100 46(E4) 200 69 300
合计
当 df r 1c 1 2 12 1 1时,
O E 0.5 2 2 E
77 154 2 2 2 2 2 2 2 .34 .5 6 . 63 4 0.5 9 12 23 0 57 46 0 . 5 0 . 01 , 1 88 77 0.5 143 154 0.5 12 23 54 23 46 77 154 2
注:卡方适合性测验还经常用来测验试验数据的次 数分布是否和某种理论分布(如二项分布、正态分布等) 相符,以推断实际的次数分布究竟属于哪一种曲线类型。
(即:拟合优度检验)
单向分组计数资料:将资料列成表格后,行数 R=1,列数C≥2的计数资料。 [例] 某地进行人口调查,共有人口378万人,其
中男、女人口分别为190、188(万人),即:
2 9.34 0 .05, 1 3.84
88 77 0.5
2
143 154 0.5
2
12 23
所以 p 0.05 。 (4)推断:否定H 0 ,接受 H A ,即发病率的高低与品 种有关。
卡平方测验公式
卡平方测验公式卡平方检验是一种常用的假设检验方法,用于检测两个变量之间是否存在统计学上的关联性。
其中,卡方分布是一种概率分布,常用于统计学分析中。
本文将从卡平方测验的定义、原理、公式、注意事项等方面进行详细介绍。
一、卡平方测验的定义卡平方测验(Chi-square test)是一种用于分析分类资料的统计方法,用来评估随机变量的频率分布与某种理论分布之间的偏离程度。
它通过比较实际观测值和理论值的差异,来判断这种差异是否显著。
二、卡平方测验的原理卡平方测验的原理是基于卡方分布的统计原理。
卡方分布是指自由度为n的卡方变量X2的概率分布,其概率密度函数为f(x) =x^(n/2-1)*e^(-x/2) / (2^(n/2)*Γ(n/2)) ,其中,Γ(n/2)为伽玛函数值。
卡方分布的特点是非对称的,取值范围为[0,+∞)。
卡平方测验的基本思路是:1.设定原假设和备择假设;2.收集样本数据;3.计算观测值的卡方值;4.确定自由度;5.查找卡方分布表,找到临界值;6.比较观测值的卡方值和临界值;7.根据比较结果,判断原假设是否成立。
三、卡平方测验的公式卡平方测验的公式如下:卡方值=Σ(观测值-理论值)²/理论值其中,Σ表示对所有分类统计量求和。
四、注意事项1.在进行卡平方测验时,样本数量应该尽可能大,否则可能会导致误差增大;2.进行卡平方测验时,要保证分类变量的独立性,即各分类变量之间应该互相独立;3.进行卡平方测验时,要注意设置显著性水平,一般取α=0.05或α=0.01;4.进行卡平方测验时,要选择合适的观测和理论值,否则可能会导致结果不准确;5.进行卡平方测验时,最好使用专业的卡平方测验软件或计算器,以提高效率和准确性。
五、总结卡平方测验是一种重要的假设检验方法,常用于分析分类数据和判断两个变量之间的关联性。
它基于卡方分布的统计原理,通过比较理论值和观测值的差异来判断原假设是否成立。
在进行卡平方测验时,需要注意样本数量的大小、分类变量的独立性、显著性水平的设置、观测和理论值的选择以及使用专业工具等因素。
生物统计学第五章 卡方检验
500
512
515
542
522
514
488
497
475
487
497
493 498 502 494 499 490
500
491 494 496 518 484 496
518
506 482 494 503 517 491
508
487 482 494 503 517 491
530
486 512 488 503 506 490
三、独立性检验
原理:通过观测数与理论数之间的一致性判断事件 之间的独立性,即判断两个事件是否是独立事件或 处理间差异是否显著。
方法:将数据列成列联表,也称列联表卡方检验。
一、2×2列联表卡方检验
(一)原理:例5 青霉素可以注射,也可以口服,每天给感冒患者 口服或注射 80 万单位的青霉素,调查两种给药方 式的药效,结果如下表所示,试分析青霉素的两 种给药方式的药用效果是否有差异?
0.302 0.061 0.155 0.121 0.09 1.539
10
总计
0
100
0
590
0.0051
1
题解
1、提出假设 H0:O-E=0;HA: O-E≠0 2、总体参数未知,需要由样本比例估计P=590/1000=0.59 3、计算理论值和卡方值,理论频率Pi按照二项分布公式计 算——n=10,0≤k ≤10,理论数Ei=NPi
10 ——
167.5~170.5 ——
1 100
0.01 1.00
0.009 1.00
0.9 100
(5)Oi与Ei进行比较,判断两者之间的不符合度,检验程序 如下:①零假设:H0:O-E=0;HA: O-E≠0 ②检验统计量:
第五章卡平方检验
(3)计算2 :将实际观察次数A1、A2、A3、A4与理论次数T1、 T2、T3、T4代入(5-1)式,得:
2 ( A T )2
T
(491 417.94)2 (76 139.31)2 (90 139.31)2 (86 46.44)2
2 c
(| A T | 0.5)2 T
(|1260 1237.5 | 0.5) (|1390 412.5 | 0.5)
1237.5
412.生院隆平分院
(4) 统计推断 当df=1时,查2值表得20.05(1)=3.84,实际计算的 2值小于查表的2值,p>0.05,故接受无效假设,表 明实际观察次数与理论次数没有显著差异。大豆花色 在F2代符合3:1分离遗传规律。
第五章 2 检 验
湖南大学研究生院隆平分院
一、2统计数
1. 什么是2统计数
• 在符合二项分布的试验资料中,样本观察次数和依一
定概率计算出的理论次数之间常常存在一定的差异, 这些差异是否表示实际试验结果不符合具有同一概率 的理论假设呢?为了测验这种差异是否属于随机抽样 误差,或者说测验观察次数和理论次数的符合性,需 要计算一个新的统计数。
湖南大学研究生院隆平分院
• 为了比较观察次数与理论次数的符合程度,以A代表观察次
数,T代表理论次数,各组A-T的数值相加总和等零,不能 反映观察次数与理论次数相差的大小。与计算SS的原理相 似,把A-T的数值平方,即可消除负号,再累积各(A-T)2, 观察次数与理论次数相差愈大,则(A-T)2的值愈大,反之 则愈小。如果各组的(A-T)2除以相应的理论次数 (A- T)2/T , 变绝对数为相对数,就可进行合并和比较。各种 试验资料的分组数不同,在得到各组的(A-T)2/T的数值后, 再将其加而得总和,并以2表示。
第五章卡平方测验-
11
5.3 适合性测验
西南科技大学生命科学与工程学院周海廷制作
12
适合性χ2测验的方法
适合性测验(test for goodness-of-fit):比较 实验数据与理论假设是否符合的假设测验。 现以玉米花粉粒碘染反应为例,予以说明:
玉米花粉粒碘反应观察次数与理论次数
碘反应 蓝色 非蓝色 观察次数(O) 3437(O1) 3482(O2) 理论次数(E) 3459.5(E1) 3459.5(E2) O-E -22.5 +22.5 (O-E)2/E 0.1463 0.1463
西南科技大学生命科学与工程学院周海廷制作
15
(| O E | 1 2) E
2 C
2
本例
2 2 (| 22 . 5 | 1 2 ) (| 22 . 5 | 1 2 ) 2 C 0.2798 3459.5 3459.5
2 ,实得 0 查附表6,当ν=k-1=2-1=1时, .05,1 3.84
2 2 1 2 2 2 i 2 n 2 i
xi i
)2
(
2
xi
)2
χ2分布图形为一组具有不同自由度ν值的曲线。 χ2值最 2 小为0,最大为+∞,因而在坐标轴的右边。附表6为χ2≥ p
时的右尾概率表。
西南科技大学生命科学与工程学院周海廷制作
3
若所研究的总体μ不知,而以样本
(
2
代替,则 x
xi x
)
2
1
2
2 ( x x ) i
(n 1) s 2
2
s 2 2
χ2的定义二:
卡平方测验
0.1
df=∞
df=5
0.0
0
2
4
2
6
8
10 12
图5.1 df=1,3和5的χ2分布图
第27页,此课件共29页哦
f(2)
F( 2) 1-F( 2)
2
0
2i
图5.2 2分布概率累积函数图解
第28页,此课件共29页哦
课程内容
第一章 绪论 第二章 试验设计原理及食品试验常用的设计 第三章:数据资料的整理与特征数 第四章:理论分布及抽样分布 第五章:统计假设检验 第六章 卡平方检验 第七章 方差分析 第八章 正交试验设计与分析 第九章 直线回归与相关
卡平方测验
第1页,此课件共29页哦
&6.1 卡平方测验概述
一、卡平方的定义与分布
X2定义:在方差为σ2的正态总体中,随机独立抽取容量为n 的样本,n个独立的正态离差u1、u2、…、un的平方和则定义为 x2 (chi square) ,即:
2 u 1 2 u 2 2 u i 2 u n 2 u i 2 (y ii)2
2
图7.4 H0:σ2≥σ20, HA:σ2<σ20,否定区在左尾。
第25页,此课件共29页哦
f(2)
α/2
α/2
2 (1α/2) ,df
2 α/2 ,df
2
图7.5 H0:σ2=σ20, HA:σ2≠σ20,否定区在左或右尾。
第26页,此课件共29页哦
f(2)
0.5
0.4 df=1
0.3
0.2
X2的基本公式:必须用连续性矫正公式;当df≥2时,可以不
作连续性矫正。
X2连续性矫正公式:
[(at)1]2
田间试验与统计分析 第五章 卡平方测验
例 3 : 某 一 杂 交 组 合 , 在 F2 得 到 四 种 表 型 , B_C_,B_cc,bbC_,bbcc, 其 实 际 观 察 次 数 分 别 为 132,42,38,14。试测验是否适合9:3:3:1的理论比率。 根据计算结果,是独立遗传还是连锁遗传? p144 7.6
第三节 独立性测验
第四节 方差的同质性测验
(一)单个样本方差的假设测验
(二)两个样本方差的同质性测验
(三)多个样本方差的同质性测验
方差的同质性测验 方差同质性是指各个总体的方差相等
1. 单个样本方差的假设测验是测验一个样本方差和某 一指定值C是否有显著差异。
2. 两个样本方差的同质性测验是测验两个抽自正态总 体的独立样本的方差所属的总体是否有显著差异。 3.测定 3 个或3个以上样本方差是否来自相同方差的总 体称为方差的同质性测验,又叫Bartlett测验。
品种 健株数 病株数 总计 A 442 78 520 B 460 39 499 C 478 35 513 D 376 298 674 E 494 50 544 总计 2250 500 2750
(一)单个样本方差的假设测验
1.两尾测验 2 H0: =C 若计算的
HA: 2 ≠C
此时,在α水平上否定H0。
2.一尾测验 测验s2是否显著大于指定值C,无效假设为: H0: 2≤C HA: 2 >C
2 2 > ,df 如果算得的 则否定H0,这是应用2 分布的右边一尾。
3.1 ,各自有自由度 4 、 5 、 11 ,试测验其是 否同质。
方差同质性测验
多个样本方差同质性测验,经常应用在多点或多年 试验的综合性分析中,对不同试验点误差方差的同
生物统计5-卡平方测验
生物统计5-卡平方测验第11章卡平方测验次数资料的统计分析方法有二项分布的正态接近法和卡平方测验法。
例:大豆花色一对等位基因的遗传研究,F2代共289株,紫花208株,白花81,问这一资料的实际观察值是否符合3:1的理论数值?方法一:二项资料的百分数假设测验,U 测验。
Ho :p =0.75;H A :p ≠0.75;α=0.05;U0.05=1.960.052080.71972890.02550.71970.751.190.0255pp u u u σ=====-==-=p>0.05接受Ho ,即实际观察值符合3:1的理论数值。
方法二:O :Observe ;E :Theory比较理论次数与实测次数符合程度,适合性测验,可用()O E -∑来表示;但()O E -∑为0,可用2()O E -∑消除负号;但如:O1-E1=303-300=3,300次中占3次O2-E2=18-15=3,15次中占3次比重不同可用2()O E E-∑即将绝对数变为相对数。
1、故定义221()kO E Eχ-=∑,其中k 为组数。
显然,卡平方越大,越不符合;卡平方为0时完全符合。
2、χ2分布:是一组曲线,随自由度不同而不同,呈正偏斜,不是对称分布;v =1时偏斜最厉害,v 增大时趋近于正态分布。
是连续性变数的理论分布而不是间断性变数的抽样分布。
小结:连续性变数的理论分布:正态分布连续性变数的抽样分布:t ,F ,χ2间断性变数的理论分布:二项分布,潘松分布 3、χ2测验Ho :观察次数与理论次数的差异是抽样误差H A :观察次数与理论次数的差异不是抽样误差α=0.05假定Ho 正确,算得χ2值,再查χ2(α,v )推断:如实得卡平方值大于临界值,则否定Ho ,即不符合。
注意v =k -1,k 为组数,不是样本容量。
4、平方的连续性矫正卡平方分布是连续性的,次数资料是间断性的,由次数资料算得的卡平方值偏大,易达到显著水平。
4实用生物统计学-卡平方检验 2014-06-03 [兼容式]
2、计算理论次数 论次数:
在无效假设成立的条件
下,计算理论次数,即根据理论比例3:1计算理 紫花理论次数:T1=1650×3/4=1237.5; 白花理论次数:T2=1650×1/4=412.5, 或
T2=1650-1237.5=412.5。
表6-2
c2 计算表
理论次数 (T) 1237.5 412.5 1650
2 0.05
2
2 2 c )< 0.01,0.01<
p≤0.05,表
明实际观察次数与理论次数差异显著,实际观察 的属性类别分配显著不符合已知属性类别分配的 理论或学说;
若 (或
2
2 )≥ c
2 0.01
,p ≤0.01,表明实际
观察次数与理论次数差异极显著,实际观察的 属性类别分配极显著不符合已知属性类别分配 的理论或学说。
下面积代表概率
卡方检验(chi-square test)
χ2检验是现代统计学的创始人之一,英国人
Karl . Pearson于1900年提出的一种具有广泛 用途的统计方法 可用于计数资料的关联度分析,拟合优度检验 等等
本节内容:适合型检验与独立性检验
二、 统计数的意义
2
引入卡方检验的目的:
2
2 c。
k-1查 2 值表(附表7)所得的临界 值: 0.05 或 0.01比
较:
将所计算得的 或
2
2 c 值与根据自由度 2 2
2 ,p>0.05,表明实际观察 若 (或 c2)< 0.05 次数与理论次数差异不显著,可以认为实际观察
2
的属性类别分配符合已知属性类别分配的理论或 学说; 若 ≤ (或
第5章 卡平方检验
r=2 c=3
B C 总数 58 45
10(19.71) 40(31.53) 8(6.76) 25(15.29) 16(24.47) 4(5.24)
总数
35
56
12
103
第一步 H0:三地区与花生污染无关 HA:三地区与花生污染有关
第二步 α=0.05, 0.01
第三步 计算 与df
2
理论次数:
2
df≥2
第二节 适合性检验
适合性检验主要检验实际结果是否符
合理论比率。
H0:实际结果符合理论比率。 理论次数 T=总次数 n ×理论比率
df=k-1
例1, [例7-1] 已知:A甲=34,A乙=46,n=80 理论比率=48:52
解: 第一步 建立假设H0:实际符合理论比率 (消费者喜好无变化) HA:实际不符合理论比率
第四步 查找临界值 ,并作出统计推断
2
由df=1和α=0.05、0.01查表11 得
2 0.05(1)=3.84,
2 c
2 0.01(1)=6.63
2 0.05(1)
因为 0.7617 <
,p>0.05,所
以接受无效假设H0,认为实际次数与理论
次数差异不显著,即消费者对两种产品的
例1, [例7-4] r=2
食品 性别 男性 女性 总数
c=2
常规
40(35) 30 (35) 70
“有机”
10 (15) 20 (15) 30
总数
50 50 100
第一步 H0:性别与食品类型无关 HA:性别与食品类型相关
第二步 第三步
α=0.05, 0.01 计算 和 df
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第11章 卡平方测验
次数资料的统计分析方法有二项分布的正态接近法和卡平方测验法。
例:大豆花色一对等位基因的遗传研究,F2代共289株,紫花208株,白花81,问这一资料的实际观察值是否符合3:1的理论数值? 方法一:二项资料的百分数假设测验,U 测验。
Ho :p =0.75;H A :p ≠0.75;α=0.05;U0.05=1.96
0.05
2080.7197289
0.0255
0.71970.75
1.19
0.0255
p
p u u u σ
===
=
=-=
=-=
p>0.05
接受Ho ,即实际观察值符合3:1的理论数值。
方法二:O :Observe ;E :Theory
比较理论次数与实测次数符合程度,适合性测验,可用()O E -∑来表示;但()O E -∑为0,可用2()O E -∑消除负号;但如: O1-E1=303-300=3,300次中占3次 O2-E2=18-15=3,15次中占3次 比重不同
可用
2
()O E E
-∑即将绝对数变为相对数。
1、故定义2
2
1
()
k
O E E
χ-=
∑
,其中k 为组数。
显然,卡平方越大,越不符合;卡平方为0
时完全符合。
2、χ2分布:是一组曲线,随自由度不同而不同,呈正偏斜,不是对称分布;v =1时偏斜最厉害,v 增大时趋近于正态分布。
是连续性变数的理论分布而不是间断性变数的抽样分布。
小结:连续性变数的理论分布:正态分布 连续性变数的抽样分布:t ,F ,χ2
间断性变数的理论分布:二项分布,潘松分布 3、χ2测验
Ho :观察次数与理论次数的差异是抽样误差 H A :观察次数与理论次数的差异不是抽样误差 α=0.05
假定Ho 正确,算得χ2值,再查χ2(α,v )
推断:如实得卡平方值大于临界值,则否定Ho ,即不符合。
注意v =k -1,k 为组数,不是样本容量。
4、平方的连续性矫正
卡平方分布是连续性的,次数资料是间断性的,由次数资料算得的卡平方值偏大,易达到显著水平。
一般v =1,尤其是小样本,须矫正。
V ≥2的样本可不矫正, V ≥30时接近正态分布。
2
2
1
(0.5)
k
c O E E
χ--=
∑
c :correct
5、适合性测验:
上例:大豆花色是否符合一对等位基因遗传规律?
2
2
1
(0.5)
k
c O E E
χ--=
∑
=1.256<χ2(α,v )=χ2(0.05,1)=3.84,故接受Ho ,即大豆花色符合一
对等位基因遗传规律。
6、昆虫分布型的拟合(适合性测验)
随机分布:个体间相互独立,即不相互吸引,也不相互排斥。
包括潘松分布和正二项分布。
其理论次数为()!
k
m
m
NP k Ne
k -=
均匀分布:个体间相互排斥,如沙滩上水母的分布,鸟类领域筑巢等。
聚集分布:个体间相互吸引,包括核心分布和负二项分布等。
在昆虫生态及预测预报中有详细讨论。
7、独立性测验
主要探求两个变数间是否相互独立,只介绍2×2列联表。
种间关联是对两个种群间的相互关系的一个测定尺度。
正联接表明两个物种趋于在一起相互有吸引作用,或对同一环境有相同的适应,如共生、共栖、捕食者-猎物、植食者-植物等。
负联接表明两个物种趋于分离,相互有排斥干扰作用,或对相同环境有不同的适应性,如两种单寄生物对同一个寄主有排斥作用;三化螟等单食性害虫与非取食水稻的植食性害虫等。
无联接表明两物种独立存在,既不干扰,也不吸引。
例:调查460株甘蓝上蚜虫和食蚜蝇的有无,数据如下:
现在测定天敌对害虫跟随作用的强弱。
Ho :相互独立无关联;H A :有关联。
在460株中,有蚜虫的为250株,故p1=250/460 在460株中,有食蚜蝇的为76株,故p2=76/460 两者都有的概率为p1×p2
两者都有的理论株数=p1×p2×460=41.3株
同理算得其他各格的理论次数,计算卡平方值,注意要作连续性矫正。
在实际应用中一般不求理论次数,而直接由观察值求得2c χ。
2
2
112212212
1212
460
()(5018420026)460
22
76384250210
c n a a a a n
C C R R χ--
⨯-⨯-
⨯=
=
⨯⨯⨯=4.267
χ2(0.05,1)=3.84
否定Ho ,即两物种之间有关联。
再进一步判定联接方向:
11221221a a a a >,正连接,同时出现,同时不在,相互吸引; 11221221a a a a <,负连接,有我无你,有你无我,相互排斥; 11221221a a a a ,无连接,相互独立。
现1122122192005200a a a a =>=,故为正联接。
注意:只有存在关联时才进一步判定联结方向。
若考虑0.01显著水平,则:
正联结:+,++,分别代表显著和极显著 负联结:-,――, 无联结:0
对多个种同时测定两两之间的联结关系,可得下图:
也可考虑用两物种之间得协调系数来表示,可得一量化关系。
a a a a v -=
v ∈[-1,1]
v 约等于0,无协调。
V>0,正协调 V<0,负协调。