卡平方(2)测验

合集下载

第5章-卡平方测验

第5章-卡平方测验

花色 F2代实际株数(O) 理论株数(E)
白色
192
187.5
黄皮
58
62.5
总数
250
250
O-E 4.5 -4.5
1.提出假设:观察次数与理论次数的差异由抽样误 差所引起,即H0:F2代南瓜果皮色泽分离符合 3:1比率,对备择假设HA:不符合3:1。
2.确定显著水平: 0.0,50.01
184
175
.3

1 2

50

41 .3

1
2

2
2
175 .3
41 .3
200
208 .7

1 2

2 4 .267
208 .7
当df=1时,(20.05,1) 3.84,(20.01,1) 6.63
由于 2 0 .0,1 5 3 .8 4 c 2 4 .2 62 0 7 .0,1 1 6 .63
效假设或否定无效假设。
第二节 适合性测验
一、适合性 2 测验的方法
适合性测验是指测验观察的实际次数与某种 理论或需要预期的理论次数是否相符合。
例1:某项试验观察淀粉质与非淀粉质玉米杂 交的F1代花粉粒,经碘处理后有3437粒呈 蓝色反映,3482粒呈非蓝色反映。如果属于 1对等位基因控制的遗传性状,F1代花粉粒 碘反映的理论比例应该是1:1,问其遗传性 状是否符合1对等位基因控制的遗传规律。
将本例数据代入上式
26200184504602 460
c2
2 76384210250
4.267
2. 2XC表的独立性测验
2XC表是指横行分为两组,纵列分为 C大于等于3组,因为df=(r-1)(c-1) ≥ 2,因此可以不做连续性的矫正。

五、卡平方测验

五、卡平方测验

F2代红花与白花的理论比例为3:1
于是将各差数平方除以相应的理 论次数再相加,记为 论次数再相加,记为χ2,即:
(O − E ) 2 χ2 = ∑ E
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计量, 越小, 偏离程度的一个统计量,χ2越小,表明实 际观察次数与理论次数越接近; χ2=0, 际观察次数与理论次数越接近 ; , 表示二者完全吻合; 越大, 表示二者完全吻合;χ2越大,表示二者相 差越大。 差越大。
各种自由度下右尾概率取α的临界
χα,df值列于附表4,供测验时查用。 值列于附表4 供测验时查用。
例如, 例如, df=10, α=0.05, , ,
χ20.05,10=18.31,表示 0.05, =18.31,
P( χ2 > 18.31)=0.05 图5.2)。 )=0.05(图 。 )=0.05
2×2表的独立性测验 × 表的独立性测验
H0:种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关, 种子灭菌与散黑穗病发病无关 HA:种子灭菌与散黑穗病发病有关 种子灭菌与散黑穗病发病有关 显著水平 α=0.05 。
E11=460×(76/460)×(210/460)=34.7 × × 同理,O12=184相应的理论次数为 同理, 相应的理论次数为 E12=460×(384/460)×(210/460)=175.3 × × O21=50相应的理论次数为 相应的理论次数为 E21=460×(76/460)×(250/460)=41.3 × × O22=200相应的理论次数为 相应的理论次数为 E22=460×(384/460)×(250/460)=208.7 × ×
( x i − x ) 2 = ( n − 1) S 2

卡平方测验

卡平方测验

根据处理及考察指标的多少分为不同的列联表:
宜宾学院
15
第四章 孟德尔遗传
检验程序
1、提出假设 H0:O-E=0;HA: O-E≠0 2、根据概率的乘法法则计算理论数:理论数的计算方法——
E ij
3、检验统计量:
i行总数 j列总数
总数
4、统计推断
宜宾学院
16
第四章 孟德尔遗传
[例] 表5.11为不同灌溉方式下水稻叶片衰老情况的调查资料。试
H0:稃尖和糯性性状在F2的分离符合9∶3∶3∶1; HA:不符合9∶3∶3∶1。
显著水平: 然后计算
表现型
=0.05。 值
稃尖有色非 糯 稃尖有色 糯稻 稃尖无色 非糯 稃尖无色 糯稻 总数
观察次数(O) 理论次数(E) O -E
宜宾学院
491 417.94 73.06
76 139.31 -63.31
4、依所得概率值的大小,接受或否定无效假设
在实际应用时,往往并不需要计算具体的概率值。 若实得 若实得 ≥ < 时,则H0发生的概率小于等于 时,则H0被接受。 , 属小概率事件,H0便被否定;
宜宾学院
8
第四章 孟德尔遗传
情况1:大豆花色一对等位基因的遗传研究如 下图:
P F1 F2 紫花 白花 紫花
稃尖有色 非糯 491 稃尖有色 糯稻 76 稃尖无色 非糯 90 稃尖无色 糯稻 86 总数 743
结果是否符合 9∶3∶3∶1的 理论比率?
宜宾学院
11
第四章 孟德尔遗传
二、 适合性检验
有一水稻遗传试验的适合性测验 按9∶3∶3∶1的理论比率算得各种ห้องสมุดไป่ตู้现型的理论次数E,
如稃尖有色非糯稻 E=743×(9/16)=417.94……

卡平方测验

卡平方测验

卡平方测验
实验目的
1.以提供的数据练习计算x2值,并测定其是否近似理论假设的期望比值。

2.依据相应自由度,检验计算所得x2值。

3.熟练掌握x2值的计算和利用x2值评估实验结果
实验原理
卡平方(x2)测验的目的是以吻合度断定所获得的资料与理论上期望的比值是否满足或近似,也就是x2测验可以测定所得数据是否偏离吻合概率。

显然,如果偏差小是因为偶然机会,偏差大则不是出于偶然机会。

卡平方x2测验试图为我们解决这个问题:“骗差小到何种程度才可以认为只是出于偶然机会。

”卡平方x2值的公式如下:
x2 =∑(O-E)2/E
这里的o是特定表现型个体的观察数目;E是这一表现型在理论上期望的数目;∑是各种表现型(O-E)2/E的累加值。

例如,高茎番茄和矮茎番茄杂交,F1全为高茎,F2有102株高茎和44株矮茎。

这些资料是否符合3:1的概率?回答这个问题必须计算x2值,把计算过程综合整理于表2-1。

2
计算所得的x值为2.0548,x值意味着什么呢?如果实际观察值(O)精确等于理论期望值(E),x2值为 0,是一个完满的好适度。

于是x2值小,表明观察结果接近期望比率;x2值大,表明观察结果与期望比率存在明显差异。

一般统计学家把P=1/20或P=0.05定为显著水平。

当两组变数自由度为1时,卡平方x2值为3.841的概率是0,05,观察值与期望值相抵触。

在刚才的实例中x2=2.0548,它小于允许最大值x2 =3.841,P>0.05。

因而可以认为偏差只是偶然机会,实验数据符合3:1的概率的假设。

第六章 卡方测验及适合度检验

第六章 卡方测验及适合度检验
程度也愈大,两者相符的概率就愈小。
三峡大学化西南学科与技大生学命生命科科学学与学工院程学院周海廷制作
8
• 4、依所得概率值的大小,接受或否定无效假设。若实

2


a ,
时,则
H0 被接受。
χ2分布是连续的,而次数资料则是间断的。由间断性资 料算得的χ2值有偏大的趋势(尤其是在ν=1时),需作连
第六章 卡平方(χ2)测验与拟合度检验
三峡大学化西南学科与技大生学命生命科科学学与学工院程学院周海廷制作
1
6.1卡平方(χ2)的定义与分布
适合性检验:检验实际观测数是否与某种理论比率相符 合。 独立性检验:通过检验实际观测数与理论数之间的一致 性来判断事件之间是否相互独立。
三峡大学化西南学科与技大生学命生命科科学学与学工院程学院周海廷制作
三峡大学化西南学科与技大生学命生命科科学学与学工院程学院周海廷制作
4
• 若所研究的总体μ不知,而以样本 代替,则 y
2
(
yi

y )2

1
2
(yi y)2

(n 1)s 2
2

s 2 2
χ2的定义二:
用于次数资料(计数资料)分析的χ2公式:
2
(O E )2 E

3.84
,实得
χ2=0.2798 小于
2 0.05,1
,所以接受H0。即认为观察次数
与理论次数相符,接受玉米F1代花粉粒碘反应比率为1:1的假设。
三峡大学化西南学科与技大生学命生命科科学学与学工院程学院周海廷制作
10
适合性检验 是检验实际观测数是否符合某种理论比率的一种假设检验。 在遗传学中,常用来检验杂交后代的分离比例是否符合某种遗传定律, 如孟德尔的分离定律(3:1)、独立分配定律(9:3:3:1 )等。

卡平方测验

卡平方测验

0.05
(3)测验计算: : 在假设 H 0为正确的前题下, 则可得如下求理论值的比例式,求出理论值: 300∶100=231∶E1 300∶200=231∶E2 300∶100=69∶E3 300∶200=69∶E4 所以 E1=77 E2=154 E3=23 E4=46
健株 甲品种 乙品种 合 计 O 88 143 231 E 77(E1) 154(E2) 231 O 12 57 69
病株
E 23(E3) 100 46(E4) 200 69 300
合计
当 df r 1c 1 2 12 1 1时,
O E 0.5 2 2 E


77 154 2 2 2 2 2 2 2 .34 .5 6 . 63 4 0.5 9 12 23 0 57 46 0 . 5 0 . 01 , 1 88 77 0.5 143 154 0.5 12 23 54 23 46 77 154 2
注:卡方适合性测验还经常用来测验试验数据的次 数分布是否和某种理论分布(如二项分布、正态分布等) 相符,以推断实际的次数分布究竟属于哪一种曲线类型。
(即:拟合优度检验)
单向分组计数资料:将资料列成表格后,行数 R=1,列数C≥2的计数资料。 [例] 某地进行人口调查,共有人口378万人,其
中男、女人口分别为190、188(万人),即:
2 9.34 0 .05, 1 3.84

88 77 0.5
2

143 154 0.5
2

12 23
所以 p 0.05 。 (4)推断:否定H 0 ,接受 H A ,即发病率的高低与品 种有关。

【生物统计】第七章卡平方测验

【生物统计】第七章卡平方测验

⑵ 计算:2
(O E)2 (3435 3459.5)2 (3482 3459.5)2
0.2927
E
3459.5
3459.5

因为
2
=
0.2927<
2 0.0
5
= 3.84,接受H0,认为实际比
率与理论比率1:1相符。
第三节 适合性测验 碘反映
观察数(O)
理论数(E)
因控的例甚制计可题至的算以:从玉性公证它米状式明们花。也。粉淀粒粉中不粒变形变加蓝蓝成碘淀将粉变粒3蓝34或4833色32447(38糊n,(72x-x精)而) 是糊由精一加3344对3355碘4499等55..55则99((..nn位55不//22基))会
的曲线。
第一节 卡平方( 2)的定义和分布
样本容量n不同,计算出的值不同,所以分布与自由度有 关,分布曲线是一系列曲线而不是一条曲线,它随着自由度 的改变而改变,值最小为0,最大为+∞,因而在坐标轴的第 一象限。自由度小时呈偏态,随着自由度增加,偏度降低, 至+∞时,呈现对称分布。该分布的平均数为v,方差为2v。
附表6为时的右尾概率表,当v=12时,
2
0.05
=21.03,它的
统计意义是从总体中以n=13进行抽样,计算出的值大于21.03
的概率有5%。
K.Pearson 根据的定义从属性性状的分布推导出用于次 数资料分析的公式:
2
(O E)2 其中:O为观察次数,E为理论次数。 E
第二节 2在方差同质性测验中的应用
变蓝。如果等位基因的共复计制是等量696的1991(,9n)并且在配6子96199中1(9n分) 配
是查两问u随了正种测实机69态测验际的19离验中比,粒差的:率F花1本与uu代粉2的质理中,平是论的发pˆ方p一比两0现q就样0率p种有/0n等的1花3:241于。粉3之7粒粒n间2pˆ。n的会是p0n以q数变p否00本目蓝有2 例应。显(为x该著np例n是0差qp0,01)异2:可1。的以。验现证调

第四章 卡平方测验

第四章  卡平方测验

-1 0
3 -3 0 3 -3 0
1 2
9 9 18 9 9 18

非糯
53
4750500 Nhomakorabea180.18 0.36 0.09 0.09 0.18

糯 非糯 ∑
100
97 103 200
100
100 100 200
将观察次数与理论次数差数平方除以相应的理论 次数再相加而得的总和,记为c 2,即:
2 ( O E ) i c2 i Ei i 1 k
0.470
【例4.3】有一批水稻种子,规定发芽率达80%合格,即
发芽:不发芽=4:1。随机抽200粒做发芽试验,发芽种子
数为150粒。这批水稻种子是否合格?
H0:合格,即发芽:不发芽=4:1 , HA:不合格。 显著水平 a=0.05
该资料分组数k=2,其自由度df=k-1=2-1=1,所以 计算c2时需要进行连续性矫正。
卡平方(c2)的概念 c2分布 c2测验 c2的连续性矫正
一. 卡平方(c2)的概念
玉米花粉粒糯与非糯的观察次数与理论次数
花粉类别 糯 非糯 ∑ 观察次数(O) 理论次数(E) 51 49 100 50 50 100 O-E 1 (O-E)2 1 (O-E)2/E 0.02 0.02 0.04
2
df
2 e
χ
2
c2分布的特性有:
⑴ c2分布的取值范围为[0, , ) 并且呈反J形的偏 斜分布。 ⑵c2分布的形状决定于自由度df。 ⑶ c2分布曲线与横坐标轴所围成的面积等于1,即
P(0≤ c2
<+ ) f(c02)d(c2)=1
+
f(c2) 0.5 0.4 0.3

第7章 卡平方测验

第7章  卡平方测验


2
值与
2 ,
接近,应作矫正。
如果算得的
2 C
值>
2 ,
,便否定H0,表明这些样本
所属总体方差不是同质的。
最新课件
29
[例7.4] 假定有3个样本方差s12=4.2, s22=6.0, s32=3.1,各
具有自由度 ν1 4 ,ν2 5 ,ν3 11,试测验其是否同质。
假设H0:12 22 32对HA:3个方差不全相等(这里的
--右尾测验。
如果测验其是否大于C,则H0: 2 ≥C对HA: <2 C,若
算得的 < 2
2 (1
),, 则否定H0。
----左尾测验。
f(2
f(2
α
2 1α) ,df
2
H0:σ2≥σ20, HA:σ2<σ20,否定区在左尾。最新课件
α
2
H0:σ2≤σ20, HA:σ2>σ20,否定区在 右尾。
19
在作两尾测验有 H0:2 C,
对 HA:2 C。其显著大于
和小于C的值是>
2 (
/
2),

<
2
(1/ 2),
,此时,H0在

著水平上被否定。
α/2
α/2
2 1α/2) ,df
2 2 α/2 ,df
否定区在左、右两尾。
最新课件
15
[例7.1] 硫酸铵施于水田表层试验,得4个小区的稻谷
产量为517、492、514、522(kg),计得样本方差为
或: 实得统最新计课量件 与临界统计量比较
13
1. H0:μ =μ 0;
2.
HA:μ ≠ μ 0
2. α =0.05

卡方测验及适合度检验ppt课件

卡方测验及适合度检验ppt课件

2 (yi )2

χ2分布图形为一组具有不同自由度ν值的曲线。 χ2值最
小为0,最大为+∞,因而在坐标轴的右边。附表6为χ2≥

2 p
时的右尾概率表。
xx
k
2
Oi Ti 2
i1
Ti
1899年统计学家K.Pearson发现上式服从自
由度df=k-1-a的2分布,所以定义该统计
[实例1] 检验黄圆豌豆与绿皱豌豆杂交F2代表现型是否 符合9:3:3:1 的分离比例。
实测数(Oi) 理论数(Ti)
Oi_ - Ti
黄圆
315(O1) 312.75(T1)
2.25
黄皱 101(O2) 104.25(T2)
-3.25
绿圆
108(O3) 104.25(T3)
3.75
绿皱
32(O4) 34.75(T4)
C 2(2 | 6 33.4 7 .4 7|0.5)2(5 | 0 44.1 3 .1 3|0.5)2
(1 | 8417.35|0.5)2(2 | 0020.78|0.5)24.267
17.35
20.78
xx
查附表3,
2 0.05,1
3.84现实得
C 24.26702.0,51
36
总计 160 205 182 547
xx
假设H0:稻叶衰老情况与灌溉方式无关;对HA:稻叶衰
老情况与灌溉方式无关。取α=0.05。
2 ( 1 4 1.6 6 4 ) 2 9 0 ( 7 8 .7 ) 2 8 ( 1 1 6 .9 1 ) 2 8 5 .62 1.6 49 0 8 .78 1 .9 18 0 2 .0,4 5 9 .4,9 现 2 5 .6 20 2 .0,4 5P 0.05

第7章 卡平方(X2)测验

第7章  卡平方(X2)测验

比较, 比较,
则否定H 接受H 如果 ,则否定H0接受HA,即试验总体 不符合理论假设.反之则相反.(P147,例题) 不符合理论假设.反之则相反. P147,例题) 例题
2 X 2 ≥ X α ,( df )
当属性类别数大于2 当属性类别数大于2时,可利用下面的简化 2 公式计算。 公式计算。
Oi 1 χ = ∑ −T T pi
2 0.025
f (χ 2 )
0.6 0.5
不同自由度的分布曲线
0.4
ν =1
0.3
0.2
ν =3
ν =5
0.1
0.0 0 2 4 6 8 10 12
χ2
(二).X2分布的特点
1.X2分布是连续性分布,取值区间为[0, +∞),平 分布是连续性分布,取值区间为[0, ),平 连续性分布 方差为2df 均数µ x2 = df 方差为2df 分布的形状决定于自由度df, df=1时 形状决定于自由度df 2.X2分布的形状决定于自由度df,当df=1时,曲线极 度左偏,呈反J 随着df增大, df增大 度左偏,呈反J形;随着df增大,曲线逐渐趋向对称而 接近于正态分布. df→∞时为正态分布 时为正态分布. 接近于正态分布.当df→∞时为正态分布. 分布是一组动态变化曲线. 一组动态变化曲线 3.X2分布是一组动态变化曲线. 2分布具有可加性,若 x ~ χ 2 , x ~ χ 2 可加性, 4.X 分布具有可加性 1 (n) 2 (m) 则
第三节 独立性测验
什么是独立性测验? 一.什么是独立性测验? 对次数资料探求两个变量间是否彼此独立 的假设检验. 的假设检验.
二.独立性测验的步骤
1.提出假设H 两个变量相互独立; 1.提出假设H0:两个变量相互独立; HA两个 提出假设 变量彼此相关. 变量彼此相关. 2.确定显著水平 2.确定显著水平 3.根据2个变量相互独立的假设, 3.根据2个变量相互独立的假设,计算每一 根据 组的理论数,再计算X 组的理论数,再计算X2值. 4.推断:当算得的X ,则接受 则接受H 4.推断:当算得的X2值< X α2,( df ) ,则接受H0,即 推断 两个变量独立.反之则相反. 两个变量独立.反之则相反.

2.5卡平方测验

2.5卡平方测验

小题教学计划2.5 卡平方(χ2)测验一、次数资料的2χ测验凡试验结果出现多少次、多少回来表示的资料称为次数资料或计数资料。

在农业试验中,不论是质量性状还是数量性状,有些性状以次数表示是方便而合理的,这就要找出一个相应的概率分布测验次数资料。

一般采用2χ测验法。

卡平方(2χ)测验这一数学方法,就是判断质量性状的次数资料的某种假设的理论次数与实际次数出现的差异,是属于偶然因素产生的,还是必然的结果?因此2χ测验必须有明确的假设,然后计算实际发生的现象与假设进行比较,以确定假设的概率值,再承认或推翻假设,这同以前所讲的显著性测验的步骤是完全一样的。

(一)2χ的计算方法例题1:菠菜的雌株与雄株的比例为1:1,今观察200株菠菜,其中雌株92株,雄株108株,试测验此二数是否符合1:1的性别比例,如下表1表1 菠菜雌株与雄株的观察株数与理论株数性别 观察株数 (O ) 理论株数(E ) O-E EE O 2)(-雌 92(O 1) 100(E 1) -8 0.64 雄 108(O 2) 100(E 2) 8 0.64 总和 200(n ) 200(n ) 0 1.28计算公式是:2χ=EE O k21)(-∑ O=实际观察数 E=理论次数 k=组数从上式可以看出:2χ值是偏差与理论次数之比值的总和,用以度量观察次数与理论次数的相差程度,当偏差(O-E )愈大时,其卡平方值愈大,说明观察次数和理论次数愈不符合;当偏差愈小时,其卡平方值愈小,观察次数与理论次数愈接近;当2χ=0时,说明观察值与理论值完全符合。

因离差总和等于零,必须对(O-E )加以平方,以免除偏差正负值的影响,因此上式的分子为(O-E )2。

而分母用理论次数。

(二)2χ分布及显著性测验 1、2χ的分布2χ分布曲线可用下列方式表示:y=2212/2221]2/2[21χυυχυ---e)()(!)(上式中的υ为自由度,e 为自然对数的底数,即2.71828。

卡平方测验

卡平方测验

,
所以否定H0,接受HA,即该水稻稃尖和糯性性 状在F2的实际结果不符合9∶3∶3∶1的理论比率。
这一情况表明,该两对等位基因并非独立遗
传,而可能为连锁遗传。
第三节 独立性测验
一、 2×2表的独立性测验
二、 2×c表的独立性测验 三、 r×c表的独立性测验
14
χ2应用于独立性测验(test for independence),
O- E | O-E |-1/2 (|O-E|-1/2)2/E
208 81
216.75 72.25
-8.75 +8.75
8.25 8.25
0.3140 0.9420
总数
289
289
0
1.2560
H0:大豆花色F2分离符合3∶1比率;HA:不符合3∶1比率。 显著水平 a =0.05。由于该资料只有k=组, ν k 1 1 ,
2 2 2 0 9 . 49 , 现 5 . 62 .05, 4 0.05, 4 P 0.05
接受H0:不同的灌溉方式对水稻叶片的衰老情况没有显 著影响。
23
21
三、r×c表的独立性测验
若横行分r组,纵行分c组,且r≥3,c≥3,则为r×c相 依表,其ν=(r-1)(c-1) [例]下表为不同灌溉方式下水稻叶片衰老情况的调查资 料。试测验稻叶衰老情况是否与灌溉方式有关。
灌溉方式 深水 绿叶数 146(140.69) 黄叶数 7(8.78) 枯叶数 7(10.53) 总计 160
故应接受H0,说明大豆花色这对性状是符合3∶1比率,即符
合一对等位基因的表型分离比例。
[例2]
两对等位基因遗传试验,如基因为独立分配,则F2
代的四种表现型在理论上应有9∶3∶3∶1的比率。有一水稻 遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种杂交, 其F2代得表2结果。试检查实际结果是否符合9∶3∶3∶1的理 论比率。

卡平方χ2测验

卡平方χ2测验

第八章卡平方(χ2)测验知识目标:●理解卡平方(χ2)的概念;●掌握适合性测验的方法;●掌握独立性测验的方法;●了解卡平方(χ2)的可加性和联合分析。

能力目标:●学会适合性测验的方法;●学会独立性测验的方法;前面介绍了数量性状资料的统计分析方法。

在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。

间断性变数的计数资料也可整理为次数资料。

凡是试验结果用次数表示的资料,皆称为次数资料。

次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。

本章主要介绍卡平方测验。

第一节卡平方(χ2)测验一、卡平方(χ2)概念为了便于理解,现结合一实例说明χ2统计量的意义。

菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。

按1:1的性比计算,雌、雄株均应为100株。

以O表示实际观察次数,E表示理论次数,可将上述情况列成表8-1。

表8-1 菠菜雌雄株实际观测株数与理论株数的比较性别观测株数O理论株数EO-E(O-E)2/E雌92(O1)100(E1)-8 0.64雄108(O2)100(E2)8 0.64合计200 200 0 1.28从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。

这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。

为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。

从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。

为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算∑-2)(E O ,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。

二项分布的有关假设测验

二项分布的有关假设测验

u
pˆ p0
~ N(0,1)
u
pˆ p0
0.5
n ~ N(0,1)
p0 (1 p0 ) n
p0 (1 p0 ) n
例:一批果树种子的平均发芽率为0.75.现随机取 100粒,用福尔马林浸种,得发芽种子86粒,问福尔 马林浸种对种子发芽有无效果 (α=0.05)?
H0 : p p0, H A : p p0
总计

丅 丅 正 正正 正正正正 正正正正 正正正正 正正 正 丅 丅
f Fˆ 次数
i频率
pˆ i
fi n
累加频率
i
2
0.0167
0
0.0000
0
0.0000
2
0.0167
2
0.0167
8
0.667
13
0.1083
23
0.1917
24
0.2000
21
0.1570
14
0.1167
6
0.0500
2
0.0167
(Xi )2 2 2 (n)
,
(Xi )2
2 1
2 (n)
n
(Xi )2
2 i1 2
~ 2 (n)
0 1 2
1 2
(a)
1
0 2
2
(b)
1
0
2
2 1
(c)
两个正态总体参数的区间估计—μ
u ( X1 X 2 ) (1 2 ) ~ N (0,1)
2 1
Hale Waihona Puke 22n1 n2或学说
分析两个 变数是相 互独立还 是彼此相

2×2表 2×c表 r×c表

第七章卡平方测验

第七章卡平方测验
一个样本方差与已知总体方差的统计测验
若从一个总体抽取一个大小为n的样本,算得样本方差
为s2,想了解此总体方差 2是否与已知方差02间有显
著的差异。
两个样本方差是否来自同一总体方差的统计测验
若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。
2020/5/9
附表5是各种ν 1和ν 2下右尾概率为
0.05和0.01时的临界F值表。
该显表著时大专于S供2测2的验总S体12方的差总而体设方计差的是。否
2020/5/9
2020/5/9
第三节 适合性测验
适合性测验是比较实际比率与理论比率之间是否有显
著差异的方法。
例题: 玉米花粉粒中形成淀粉粒或糊精是由一对等位
附表6为时的右尾概率表,当v=12时,
2
0.05
=21.03,它的
统计意义是从总体中以n=13进行抽样,计算出的值大于21.03
的概率有5%。
K.Pearson 根据的定义从属性性状的分布推导出用于次 数资料分析的公式:
2
2020/5/9
(OE)2 其中:O为观察次数,E为理论次数。 E
第二节 2在方差同质性测验中的应用
根据各因素的水平数多少分为:
2×2 相依表的独立性测验 2×C 相依表的独立性测验
R×C 相依表的独立性测验
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
2020/5/9
第七章 卡平方测验
2020/5/9
第七章 卡平方( 2)测验
第一节 卡平方( 2)的定义和分布

第八章卡方测验-精品

第八章卡方测验-精品

分组
1 2 ∑
1
2

O11
O12
r1
O21
O22
r2
c1
c2
n
例8.3 用一方法对甲乙两种试管做灭 菌试验,每种试管又分为完好和破碎 两组,资料如下,做独立性检验
分组
甲种试管 乙种试管
完好数
898(906) 914(906)
破碎数
102(94) 86(94)
行次数
1000 1000
列次数
1812
2、k≥3组次数资料的适合性检验
这种资料分3组以上,即k≥3,其总体分 布为多项分布。无效假设H0:符合假设的 多项分布。HA:不符合假设的多项分布。这 种分布亦受理论次数等于实际总次数即 ∑E=N这一条件的限制。自由度df=k-1≥2, 不用矫正公式。
例8.2 用乳白色和红色金鱼草杂交F2代 的实验结果列于下表。试检验该样本所 属的总体分布与假设理论比率为 1:2: 1的多项分布之间有无显著性差异。
理论次数和自由度的计算
Eij=
ric j n
df=(r-1)(c-1) =rc-r-c+1
式中r为行区组;c为列区组;ri 为 行合计次数;cj为列合计次数;n为总 次数。
一、2×2组次数资料的独立性检验
这种资料按行分为2组,即r=2;按 列分为2组,即c=2;资料的一般形式 如下表,其自由度df=(2-1)(2-1)=1, 需要用矫正公式。
显著水平:α =0.05
检验计算:
2 c

Oi Ei 0.52=1.5625
Ei
df=2-1=1
查附表6得右尾临界值 0.05 2 =3.84
推断:因 c=2 1.5625< 0.=05 23.84故 接受H0,否定HA ,即该批海棠种子发 芽试验的结果所属的二项分布与假 设发芽率p=0.90的二项总体之间 无显著性差异。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章卡平方(χ2)测验知识目标:●理解卡平方(χ2)的概念;●掌握适合性测验的方法;●掌握独立性测验的方法;●了解卡平方(χ2)的可加性和联合分析。

能力目标:●学会适合性测验的方法;●学会独立性测验的方法;前面介绍了数量性状资料的统计分析方法。

在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。

间断性变数的计数资料也可整理为次数资料。

凡是试验结果用次数表示的资料,皆称为次数资料。

次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。

本章主要介绍卡平方测验。

第一节卡平方(χ2)测验一、卡平方(χ2)概念为了便于理解,现结合一实例说明χ2统计量的意义。

菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。

按1:1的性比计算,雌、雄株均应为100株。

以O表示实际观察次数,E表示理论次数,可将上述情况列成表8-1。

表8-1 菠菜雌雄株实际观测株数与理论株数的比较性别观测株数O理论株数EO-E(O-E)2/E雌92(O1)100(E1)-80.64雄108(O2)100(E2)80.64合计2002000 1.28从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。

这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。

为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。

从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。

为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算∑-2)(E O ,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。

但利用∑-2)(E O 表示实际观察次数与理论次数的偏离程度尚有不足。

例如某一组实际观察次数为505,理论次数为500,相差5;而另一组实际观察次数为26,理论次数为21,相差亦为5。

显然这两组实际观察次数与理论次数的偏离程度是不同的。

因为前者是相对于理论次数500相差5,后者是相对于理论次数21相差5。

为了弥补这一不足,可先将各差数平方除以相应的理论次数后再相加,并记之为χ2,即∑-=EE O 22)(χ (8-1)也就是说,χ2是度量实际观察次数与理论次数偏离程度的一个统计量。

χ2越小,表明实际观察次数与理论次数越接近;χ2 =0,表示两者完全吻合;χ2越大,表示两者相差越大。

对于表8-1的资料,可计算得χ2=∑=+-=-28.11008100)8()(222E E O但是,由于抽样误差的存在,χ2值究竟大到什么程度才算差异显著(不相符合),小到什么程度才算差异不显著(相符合)呢?这个问题需用χ2的显著性测验来解决,而χ2测验的依据则是χ2的抽样分布(χ2分布)。

二、卡平方(χ2)的分布理论研究证明,χ2的分布为正偏态分布,其分布特点为:1. χ2分布没有负值,均在0~+∞之间,即在χ2=0的右边,为正偏态分布。

2. χ2的分布为连续性分布,而不是间断性的。

3. χ2分布曲线是一组曲线。

每一个不同的自由度都有一条相应的χ2分布曲线。

4. χ2分布的偏斜度随自由度ν不同而变化。

当ν=1时偏斜最厉害,ν>30时曲线接近正态分布,当ν→∞时,则为正态分布。

图8-1为几个不同自由度的χ2分布曲线。

附表列出不同自由度时χ2的一尾(右尾)图8-1 不同自由度的χ2分布曲线概率表,可供次数资料的χ2测验之用。

三、卡平方(χ2)的连续性矫正χ2分布是连续性的,而次数资料则是间断性的。

由(8-1)式计算的χ2只是近似地服从连续型随机变量χ2分布。

在对次数资料进行χ2检验利用连续型随机变量χ2分布计算概率时,常常偏低,特别是当自由度ν=1时偏差较大。

Yates(1934)提出了一个矫正公式,矫正后的χ2值记为:2χc2χc =∑--EE O 2)5.0( (8-2)当自由度ν>1时,(8-1)式的χ2分布与连续型随机变量χ2分布相近似,这时,可不作连续性矫正。

第二节 适合性测验一、适合性测验的意义判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设测验称为适合性测验。

在适合性测验中,无效假设H 0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;备择假设H A :实际观察的属性类别分配不符合已知属性类别分配的理论或学说。

并在无效假设H 0成立的条件下,按照已知属性类别分配的理论或学说计算各属性类别的理论次数。

因计算所得的各个属性类别理论次数的总和应等于各个属性类别实际观察次数的总和,即独立的理论次数的个数等于属性类别分类数减1。

也就是说,适合性测验的自由度等于属性类别分类数减1。

若属性类别分类数为k ,则适合性测验的自由度ν=k -1。

然后根据(8-1)或(8-2)计算出χ2或2χc 。

将计算所得的χ2或2χc 值与根据自由度ν=k -1查χ2值表(附表6)所得的临界χ2值:2050χ.、2010χ.比较:若χ2 (或2χc )<2050χ.,P >0.05,表明实际观察次数与理论次数差异不显著,可以认为实际观察的属性类别分配符合已知属性类别分配的理论或学说;若2050χ.≤χ2 (或2χc )<2010χ.,0.01<P ≤0.05,表明实际观察次数与理论次数差异显著,可以认为实际观察的属性类别分配不符合已知属性类别分配的理论或学说;若χ2 (或2χc )≥2010χ.,P ≤0.01,表明实际观察次数与理论次数差异极显著,可以认为实际观察的属性类别分配极显著地不符合已知属性类别分配的理论或学说。

二、适合性测验的方法下面结合实例说明适合性测验方法。

[例8.1]大豆花色一对等位基因的遗传研究,在F 2获得表8-2所列分离株数。

问这一资料的实际观察比例是否符合于孟德尔遗传规律中3:1的遗传比例?测验步骤如下:1.提出无效假设与备择假设H 0:大豆花色F 2分离符合3:1比例。

H A :不符合3:1比例。

2.选择计算公式 由于该资料只有k =2组,自由度ν=k -1=2-1=1,须使用公式(8-2)来计算2χc 。

3.计算理论株数 根据理论比例3:1求理论株数: 紫花理论株数:E 1=289×3/4=216.75 白花理论株数:E 2=289×1/4=72.25 或 E 2=260-E 1=289-216.75=72.25 4.计算2χc表8-2 大豆花色一对等位基因基因遗传的适合性测验紫 色 208 216.75 -8.75 0.3140 白 色 81 72.25 +8.75 0.9420 总 和2892891.25602560.125.72)5.0|25.7281(|75.162)5.0|75.216208(|)5.0|(|χ2222=--+--=--=∑E E O c5.查临界χ2值,作出统计推断 当自由度ν=1时,查附表6得2005χ.=3.84,计算的2χc<2005χ.,故P >0.05,不能否定H 0,表明实际观察次数与理论次数差异不显著,可以认为大豆花色这对性状符合孟德尔遗传分离定律3:1的理论比例。

[例8.2]两对等位基因遗传试验,如基因为独立分配,则F 2代的四种表现型在理论上应有9:3:3:1的比率。

有一水稻遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种杂交,其F 2代得表8-3结果。

试问这两对性状是否符合孟德尔遗传规律中9:3:3:1的遗传比例?测验步骤:1.提出无效假设与备择假设H 0:实际观察次数之比符合9:3:3:1的分离理论比例。

H A :实际观察次数之比不符合9:3:3:1的分离理论比例。

2.选择计算公式 由于本例共有k =4组,自由度ν=k -1=4-1=3>1,故利用(8-1)式计算χ2。

3.计算理论次数 依据理论比例9:3:3:1计算理论次数: 稃尖有色非糯稻的理论次数E 1:743×9/16=417.94 稃尖有色糯稻的理论次数E 2:743×3/16=139.31 稃尖无色非糯稻的理论次数E 3:743×3/16=139.31 稃尖无色糯稻的理论次数E 4:743×1/16=46.44 或 E 4=743-417.94-139.31-139.31=46.44 4.计算χ2表8-3 F 2代表现型的观察次数和理论次数类 型 实际观察次数O 理论次数E O-E()E E O 2-稃尖有色非糯 491(O 1) 417.94(E 1) 73.06 12.772 稃尖有色糯稻 76(O 2) 139.31(E 2) -63.31 28.771 稃尖无色非糯 90(O 3) 139.31(E 3) -49.31 17.454 稃尖无色糯稻86(O 4) 46.44(E 4) 39.56 33.699 总 计74374392.696χ2=∑-E E O 2)(=12.772+28.771+17.454+33.699=92.6965.查临界χ2值(附表6),作出统计推断 当ν=3时,2005χ.=7.815,因χ2>2005χ.,P <0.05,所以应否定H 0 ,接受H A ,表明实际观察次数与理论次数差异显著,即该水稻稃尖和糯性性状在F 2的实际结果不符合9:3:3:1的理论比率。

这一情况表明,该两对等位基因并非独立遗传,而可能为连锁遗传。

实际资料多于两组的χ2值通式则为:χ2=n n m a i i-⎪⎪⎭⎫ ⎝⎛∑2(8-3)上式的m i 为各项理论比率,a i 为其对应的观察次数。

如本例,亦可由(8-3)算得χ2=()()()()706.927437431618674316390743163767431694912222=-⎥⎦⎤⎢⎣⎡⨯+⨯+⨯+⨯前面的χ2=92.696,与此χ2=92.706略有差异,系前者有较大计算误差之故。

第三节 独立性测验一、独立性测验的意义对于次数资料,除进行适合性测验外,有时需要分析两个变数是相互独立还是彼此相关,这是次数资料的一种相关研究。

例如,小麦种子灭菌与否和麦穗发病两个变数之间,若相互独立,表示种子灭菌和麦穗发病高低无关,灭菌处理对发病无影响;若不相互独立,则表示种子灭菌和麦穗发病高低有关,灭菌处理对发病有影响。

应用χ2进行独立性测验的无效假设是:H 0:两个变数相互独立,对H A :两个变数彼此相关。

在计算χ2时,先将所得次数资料按照两个变数作两向分组,排列成相依表;然后,根据两个变数相互独立的假设,算出各个组的理论次数;再由(8-1)算得χ2值。

相关文档
最新文档