第七章 卡平方测验
卡平方测验
第八章卡平方(χ2)测验知识目标:●理解卡平方(χ2)的概念;●掌握适合性测验的方法;●掌握独立性测验的方法;●了解卡平方(χ2)的可加性和联合分析。
能力目标:●学会适合性测验的方法;●学会独立性测验的方法;前面介绍了数量性状资料的统计分析方法。
在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。
间断性变数的计数资料也可整理为次数资料。
凡是试验结果用次数表示的资料,皆称为次数资料。
次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。
本章主要介绍卡平方测验。
第一节卡平方(χ2)测验一、卡平方(χ2)概念为了便于理解,现结合一实例说明χ2统计量的意义。
菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。
按1:1的性比计算,雌、雄株均应为100株。
以O表示实际观察次数,E表示理论次数,可将上述情况列成表8-1。
表8-1 菠菜雌雄株实际观测株数与理论株数的比较性别观测株数O理论株数EO-E(O-E)2/E雌92(O1) 100(E1) -8 0.64雄108(O2) 100(E2) 8 0.64合计200 200 0 1.28从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。
这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。
为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。
从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。
为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算∑-2)(E O ,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。
第7章 卡平方测验
),, 则否定H0。
----左尾测验。
f(2
f(2
α
2 1α) ,df
2
H0:σ2≥σ20, HA:σ2<σ20,否定区在左尾。
α
2
H0:σ2≤σ20, HA:σ2>σ20,否定区在 右尾。
[例7.2] 试审查例7.1试验结果的总体方差是否真大于 某一定值,如50(kg)2?
这里试验的表面结果方差175.6(kg)2大于50(kg)2,要问 其总体方差是否真正大,抑或并不大,甚至小于50(kg)2
第七章 卡平方( 2 )测验
第一节 卡平方( 2 )的定义和分布 第二节 2在方差同质性测验中的应用
第三节 适合性测验 第四节 独立性测验
第五节 2的可加性和联合分析
• 教学要求:掌握卡平方测验方法在方差的同质性 测验、适合性测验和独立性测验中的应用。
问题一:大豆F2群体植株62株红花,18株白花, 请问是否符合3:1分离规律?
s
2 p
为:
s2p k isi2
k
i
i1
i1
(7·7)
由此,Bartlett 2 值为:
2(i k1i)lns2 pi k1i lnsi2
(7·8)
C2 2 /C
(7·9)
上式的i ni 1,ni为样本容量,而C为矫正数:
C13(k11)i k11i 1i
(7·10)
如采用常用对数,则(7·9)可写为
因为
3
,χ02.9
7,53
0.22,
χ2 0.0
2,53
9.35,且已知
s2 =175.6,故对总体方差 2 的95%置信限的下限L1和上限
L2为:
L1χν(2αs2/2),ν
2020年智慧树知道网课《田间试验与统计分析》课后章节测试满分答案
第一章测试1【多选题】(10分)试验设计的基本原则()。
A.局部控制B.唯一差异C.重复D.随机排列2【多选题】(10分)顺序排列试验设计中小区的排列方式有()。
A.对比法设计B.逆向式C.正向式D.阶梯式3【多选题】(10分)随机排列试验设计包括()。
A.拉丁方设计B.随机区组设计C.裂区试验设计D.完全随机设计4【多选题】(10分)完全随机设计应用()两个基本原则。
A.局部控制B.唯一差异C.随机排列D.重复5【判断题】(10分)随机排列方式可以避免系统误差。
A.对B.错6【判断题】(10分)在完全随机设计中,每一处理的重复数必须相等。
A.对B.错7【判断题】(10分)随机区组设计应用重复、随机排列和唯一差异三个试验设计的基本原则。
A.错B.对8【判断题】(10分)第一横行和第一纵行均为顺序排列的拉丁方称为标准方。
A.对B.错9【判断题】(10分)在拉丁方设计中,每一处理在每一横行和每一纵行可出现多次。
A.对B.错10【判断题】(10分)裂区设计是多因素试验的一种设计方法。
A.对B.错第二章测试1【单选题】(10分)总体的样本容量为()A.MB.NC.HD.I2【单选题】(10分)下列样本容量中()是大样本。
A.30B.15C.5D.103【多选题】(10分)质量性状资料的统计方法有()A.给分法B.统计次数法C.统计法D.集团法4【判断题】(10分)参数是用来描述样本的特征数()A.错B.对5【判断题】(10分)制作连续性变数资料次数分布表时,数据必须从大到小排序。
()A.对B.错6【判断题】(10分)变异数是反映一组数据变异程度的特征数。
()A.错B.对7【单选题】(10分)下列哪项为均方的正确表示方法()。
A.B.C.D.8【多选题】(10分)常用的次数分布图有()。
A.方柱形图B.条形图C.多边形图D.饼图9【多选题】(10分)平均数的种类包括以下哪几种()。
A.几何平均数B.算数平均数C.中数D.众数10【单选题】(10分)总体平均数用()表示。
卡平方测验
根据处理及考察指标的多少分为不同的列联表:
宜宾学院
15
第四章 孟德尔遗传
检验程序
1、提出假设 H0:O-E=0;HA: O-E≠0 2、根据概率的乘法法则计算理论数:理论数的计算方法——
E ij
3、检验统计量:
i行总数 j列总数
总数
4、统计推断
宜宾学院
16
第四章 孟德尔遗传
[例] 表5.11为不同灌溉方式下水稻叶片衰老情况的调查资料。试
H0:稃尖和糯性性状在F2的分离符合9∶3∶3∶1; HA:不符合9∶3∶3∶1。
显著水平: 然后计算
表现型
=0.05。 值
稃尖有色非 糯 稃尖有色 糯稻 稃尖无色 非糯 稃尖无色 糯稻 总数
观察次数(O) 理论次数(E) O -E
宜宾学院
491 417.94 73.06
76 139.31 -63.31
4、依所得概率值的大小,接受或否定无效假设
在实际应用时,往往并不需要计算具体的概率值。 若实得 若实得 ≥ < 时,则H0发生的概率小于等于 时,则H0被接受。 , 属小概率事件,H0便被否定;
宜宾学院
8
第四章 孟德尔遗传
情况1:大豆花色一对等位基因的遗传研究如 下图:
P F1 F2 紫花 白花 紫花
稃尖有色 非糯 491 稃尖有色 糯稻 76 稃尖无色 非糯 90 稃尖无色 糯稻 86 总数 743
结果是否符合 9∶3∶3∶1的 理论比率?
宜宾学院
11
第四章 孟德尔遗传
二、 适合性检验
有一水稻遗传试验的适合性测验 按9∶3∶3∶1的理论比率算得各种ห้องสมุดไป่ตู้现型的理论次数E,
如稃尖有色非糯稻 E=743×(9/16)=417.94……
卡平方测验
卡平方测验
实验目的
1.以提供的数据练习计算x2值,并测定其是否近似理论假设的期望比值。
2.依据相应自由度,检验计算所得x2值。
3.熟练掌握x2值的计算和利用x2值评估实验结果
实验原理
卡平方(x2)测验的目的是以吻合度断定所获得的资料与理论上期望的比值是否满足或近似,也就是x2测验可以测定所得数据是否偏离吻合概率。
显然,如果偏差小是因为偶然机会,偏差大则不是出于偶然机会。
卡平方x2测验试图为我们解决这个问题:“骗差小到何种程度才可以认为只是出于偶然机会。
”卡平方x2值的公式如下:
x2 =∑(O-E)2/E
这里的o是特定表现型个体的观察数目;E是这一表现型在理论上期望的数目;∑是各种表现型(O-E)2/E的累加值。
例如,高茎番茄和矮茎番茄杂交,F1全为高茎,F2有102株高茎和44株矮茎。
这些资料是否符合3:1的概率?回答这个问题必须计算x2值,把计算过程综合整理于表2-1。
2
计算所得的x值为2.0548,x值意味着什么呢?如果实际观察值(O)精确等于理论期望值(E),x2值为 0,是一个完满的好适度。
于是x2值小,表明观察结果接近期望比率;x2值大,表明观察结果与期望比率存在明显差异。
一般统计学家把P=1/20或P=0.05定为显著水平。
当两组变数自由度为1时,卡平方x2值为3.841的概率是0,05,观察值与期望值相抵触。
在刚才的实例中x2=2.0548,它小于允许最大值x2 =3.841,P>0.05。
因而可以认为偏差只是偶然机会,实验数据符合3:1的概率的假设。
卡平方检验
观测值 Oi 4 36 129 188 211 176 142 80 30 4 1000
编码 Vi 0 1 2 3 4 5 6 7 8 9
V i2 0 1 4 9 16 564 844 880 852 560 240 36 4270
Oi*Vi2 0 36 516 1692 3376 4400 5112 3920 1920 324 21296
当样本的方差等于理论平均数时: 即 当样本的方差等于理论平均数时 (即: δ2 = µ) (X- 2 X-µ)2 X- U 则: X2= ∑ 由此可知: 由此可知: 1.X2分布是当样本的方差等于理论平均数时的一种特 殊形式的正态离差平方的分布. 殊形式的正态离差平方的分布. 其分布是连续的, 2.其分布是连续的,其值域的大小随着自由度的 增加 而增加。 而增加。 项数越多, 值越大)。 (即:项数越多,X2值越大)。 2、适合性检验: 、适合性检验: 已知:男女性别比例为: : 。调查某地100名新生 例:已知:男女性别比例为:1:1。调查某地 名新生 儿,得:男:58,女:42。 , 。 该地区新生儿是否符合1: 比例 比例? 问:该地区新生儿是否符合 :1比例? 假设: 符合1: 比例 比例)。 解:假设:H0:O-T=0(符合 :1比例)。 符合 HA:O-T≠0(不符合 :1比例)。 不符合1: 比例 比例)。 不符合
= = = = = =
2(|a-T|-1/2)2 + 2(|b-T|-1/2)2 n 分子分母同乘以2) (分子分母同乘以 ) 2[|a-(1/2a+1/2b)|-1/2]2+2[|b-(1/2a+1/2b)|-1/2]2 n 2[|a-1/2a-1/2b|-1/2]2 + 2[|b-1/2a-1/2b|-1/2]2 n 2[|1/2a-1/2b|-1/2]2 + 2[|1/2b-1/2a|-1/2]2 n 2×1/4[|a-b|-1]2 +2×1/4[|b-a|-1]2 × × n (|a-b|-1)2 n 一对基因 1:1分离 : 分离
卡平方测验
0.05
(3)测验计算: : 在假设 H 0为正确的前题下, 则可得如下求理论值的比例式,求出理论值: 300∶100=231∶E1 300∶200=231∶E2 300∶100=69∶E3 300∶200=69∶E4 所以 E1=77 E2=154 E3=23 E4=46
健株 甲品种 乙品种 合 计 O 88 143 231 E 77(E1) 154(E2) 231 O 12 57 69
病株
E 23(E3) 100 46(E4) 200 69 300
合计
当 df r 1c 1 2 12 1 1时,
O E 0.5 2 2 E
77 154 2 2 2 2 2 2 2 .34 .5 6 . 63 4 0.5 9 12 23 0 57 46 0 . 5 0 . 01 , 1 88 77 0.5 143 154 0.5 12 23 54 23 46 77 154 2
注:卡方适合性测验还经常用来测验试验数据的次 数分布是否和某种理论分布(如二项分布、正态分布等) 相符,以推断实际的次数分布究竟属于哪一种曲线类型。
(即:拟合优度检验)
单向分组计数资料:将资料列成表格后,行数 R=1,列数C≥2的计数资料。 [例] 某地进行人口调查,共有人口378万人,其
中男、女人口分别为190、188(万人),即:
2 9.34 0 .05, 1 3.84
88 77 0.5
2
143 154 0.5
2
12 23
所以 p 0.05 。 (4)推断:否定H 0 ,接受 H A ,即发病率的高低与品 种有关。
《田间试验与统计方法》各章考点
自考《田间试验与统计方法》各章考题自考《田间试验与统计方法》各章考题目錄试验基础复习资料(第一、二章) (1)资料整理及特征数(第三、四章) (7)统计基础(第五章) (10)统计推断(第六章) (12)卡平方测验(第七章) (17)方差分析(第八、十二、十三、十四、十五章) (20)相关回归(第九、十、十一章) (30)其它(第十六、十七、十八章) (36)试验基础复习资料(第一、二章)一、单项选择题(每小题1分)1.田间试验设计中运用随机原则的作用是【】A.无偏估计试验误差B.降低试验误差C.消灭试验误差D.减少土壤差异2.想了解试验地土壤肥力的差异,通常采用【】A.合理轮作 B.空白试验 C.多施有机肥 D.匀地种植3.田间试验设计中运用随机排列原则的作用是【】A.无偏误差估计 B.降低试验误差 C.消灭试验误差 D.减少土壤差异二、多项选择题(每小题2分)4.田间试验设计的原则有【】A.土壤肥力均匀B.重复C.随机排列D.局部控制E.合理规划试验区5.农业和生物试验中常用的抽样方法有【】A.顺序抽样B.随机抽样C.典型抽样D.个体抽样E.成片抽样6.田间试验的代表性是指符合将来准备推广这项试验结果地区的【 BE 】A.栽培条件 B.农业条件C.地理条件 D.机械条件E.自然条件7.田间试验设置保护区的作用有【 BD 】A.防风B.防止人畜践踏和损害 C.防沙D.防止边际效应 E.防鸟害8.试验设计中控制土壤差异的主要技术有【】A.小区形状 B.小区面积 C.随机排列D.设置保护区 E.设置对照区9.控制土壤差异的小区技术主要包括【 ABCDE 】A.小区形状 B.小区面积 C.重复次数 D.设置对照区 E.设置保护区三、填空题(每小题1分)10.样本中所包含的个体数目称为样本容量。
11.设置保护区(行),除保护试验材料不受人、畜践踏和损害外,还可防止边际效应。
12.设置对照区目的之一,就是为了便于在田间观察,比较各个处理或品种的优劣时,作为比较的标准。
生物统计第七章卡平方测验幻灯片课件
第七章
卡平方( 2)测验
第一节 卡平方( 2)的定义和分布
第二节 2在方差同质性测验中的应用
第三节 适合性测验 第四节 独立性测验
第二节 2在方差同质性测验中的应用
一个样本方差与已知总体方差的统计测验
若从一个总体抽取一个大小为n的样本,算得样本方差
为s2,想了解此总体方差 2是否与已知方差02间有显
著的差异。
两个样本方差是否来自同一总体方差的统计测验
若样本方差s12来自总体方差12,样本方差s22来自总体 方差22,想了解这两个总体方差之间是否有显著差异。
第二节
2在方差同质性测验中的应用
1如值两.果,针尾一是直对测个大 接研验样样 与究时本本u的方u比,问差较计题H与0:,算提2已做出出知22出的一总=推对体2值断0统2方2v可。计v差s利即假1的用:设H统A正:。计态测2分验≠布转02为u
(大端)一尾测验时 H0: 2 ≤ 02 vs HA: 2 > 02 (小端)一尾测验时 H0: 2 ≥ 02 vs HA: 2 < 02
常见心律失常心电图诊断的误区诺如 病毒感 染的防 控知识 介绍责 任那些 事浅谈 用人单 位承担 的社会 保险法 律责任 和案例 分析现 代农业 示范工 程设施 红地球 葡萄栽 培培训 材料
第一节
卡平方( 2)的定义和分布
以前几章介绍u和t的抽样分布,本章引进另一种在统计 推断中十分重要的统计数的抽样分布,即卡平方分布。
第一节
卡平方( 2)的定义和分布
《园艺植物研究法》课程教学大纲
《园艺植物研究法》课程教学大纲课程名称:园艺植物研究法课程类别:专业选修课适用专业:园艺考核方式:考查总学时、学分:32 学时 2 学分其中实验学时:学时一、课程教学目的园艺植物研究法,是数理统计理论与方法在农业科学研究和技术工作中运用的一门应用学科。
本课程主要介绍数理统计的基本概念和基本原理,讲解园艺植物生物学调查、田间试验的基本要求、田间试验设计、田间试验的实施和试验资料统计分析的方法。
是在一定数学基础上、学习和掌握专业基础课及专业课知识后的一门专业提高课。
主要培养学生初步掌握园艺植物科学研究的一般过程,提高学生进行科学研究的能力,同时也为学生后续学习专业基础课和专业课打下坚实的基础。
二、课程教学要求通过本课程的学习,要求学生掌握园艺植物生物学调查方法;采集、整理试验数据的方法;掌握对试验数据的分析,如数据资料特征值的计算,显著性测验的方法;掌握试验设计的基本原则和各种设计的要求和特点,并能根据所给试验条件正确选用试验设计方法,制定合理的试验方案;掌握利用SPSS及EXCEL等统计分析软件进行数据分析的基本技能。
三、先修课程本课程的先修课程有《概率论》、《数理统计》、《线性代数》等课程,以及《土壤学》、《农业气象学》、《植物学》、《植物生理生化》等专业基础课程。
由于实验课要借助计算机完成,因此还要具备计算机的基础知识,熟练掌握计算机的基本操作。
四、课程教学重、难点课程教学重点:试验设计应遵循的原则、试验误差的控制、各种设计的特点及不同设计资料的统计分析方法、相关分析与回归分析。
难点:小区技术、局部控制、田间试验的实施、各种设计方法的具体应用。
五、课程教学方法与教学手段园艺植物科学研究导论是一门既偏重理论但实践性也很强的学科,因此课程教学要求理论联系实际,采用启发、引导、案例分析与多媒体教学相结合的方法与手段,同时在数据统计分析部分使用SPSS统计分析软件的计算机教学。
六、课程教学内容绪论(2学时)1.教学内容(1) 科学研究的基本概念及园艺植物科学研究的意义。
第7章 卡平方(X2)测验
比较, 比较,
则否定H 接受H 如果 ,则否定H0接受HA,即试验总体 不符合理论假设.反之则相反.(P147,例题) 不符合理论假设.反之则相反. P147,例题) 例题
2 X 2 ≥ X α ,( df )
当属性类别数大于2 当属性类别数大于2时,可利用下面的简化 2 公式计算。 公式计算。
Oi 1 χ = ∑ −T T pi
2 0.025
f (χ 2 )
0.6 0.5
不同自由度的分布曲线
0.4
ν =1
0.3
0.2
ν =3
ν =5
0.1
0.0 0 2 4 6 8 10 12
χ2
(二).X2分布的特点
1.X2分布是连续性分布,取值区间为[0, +∞),平 分布是连续性分布,取值区间为[0, ),平 连续性分布 方差为2df 均数µ x2 = df 方差为2df 分布的形状决定于自由度df, df=1时 形状决定于自由度df 2.X2分布的形状决定于自由度df,当df=1时,曲线极 度左偏,呈反J 随着df增大, df增大 度左偏,呈反J形;随着df增大,曲线逐渐趋向对称而 接近于正态分布. df→∞时为正态分布 时为正态分布. 接近于正态分布.当df→∞时为正态分布. 分布是一组动态变化曲线. 一组动态变化曲线 3.X2分布是一组动态变化曲线. 2分布具有可加性,若 x ~ χ 2 , x ~ χ 2 可加性, 4.X 分布具有可加性 1 (n) 2 (m) 则
第三节 独立性测验
什么是独立性测验? 一.什么是独立性测验? 对次数资料探求两个变量间是否彼此独立 的假设检验. 的假设检验.
二.独立性测验的步骤
1.提出假设H 两个变量相互独立; 1.提出假设H0:两个变量相互独立; HA两个 提出假设 变量彼此相关. 变量彼此相关. 2.确定显著水平 2.确定显著水平 3.根据2个变量相互独立的假设, 3.根据2个变量相互独立的假设,计算每一 根据 组的理论数,再计算X 组的理论数,再计算X2值. 4.推断:当算得的X ,则接受 则接受H 4.推断:当算得的X2值< X α2,( df ) ,则接受H0,即 推断 两个变量独立.反之则相反. 两个变量独立.反之则相反.
次数资料分析---卡方检验
第七章 次数资料分析---χ2检验第一节 χ2检验的原理与方法1.χ2分布χ2分布是从正态分布派生出来的一种分布。
⏹[定义]设X 1,X 2,X 3,…,X n 相互独立同分布,且X i ~N(0,1),则随机变量χ2= x i 2n i=1的分布称为具有n 个自由度的χ2分布。
记作: χ2 = x i 2n i=1 ~χ2(n ) 即:n 个标准正态分布的随机变量的平方和,服从自由度为n 的χ2分布。
⏹[推论]若随机变量X 1,X 2,X 3,…,X n 相互独立,且X i ~N(μ, σ2),则χ2= (x i −μ)2σ2n i=1~χ2(n)⏹[自由度]在计算χ2的过程中,如果有一个统计量代替了其中的一个参数,则其自由度为(n-1);如果有两个统计量代替了其中的两个参数,则其自由度为(n-2)。
χ2= ~χ2(n-1)22212)1()(σσS n x x ni i -=-∑=2.χ2分布的性质⏹χ2分布的“可加性”—在进行χ2统计分析时,可将相邻的数据合并在一起统计⏹χ2分布为非对称的连续性分布,分布区间为[0,+∞]⏹χ2分布曲线因自由度不同而异不同自由度的概率分布密度曲线 2χ 3.χ2检验的基本原理与方法χ2检验是与计数数据相关联的,因而用于计数资料或间断性数据的检验。
⏹[基本原理] 用于实际观测值(O )与理论推算值(E )之间的偏离程度来计算χ2值的大小,根据χ2的概率来检验观测值与理论值的差异程度和符合程度的大小。
⏹[检验方法]按照假设检验的一般步骤,对计数资料进行右尾检验。
如果有k 组资料,则检验统计量的值按下式计算:χ2=(A i −T i )2T iki=1【k:类别;A i :实际观测值;T i :理论推算值】⏹[连续性矫正] 当自由度df ≧2时,一般不作连续性矫正。
但在自由度df =1时,需进行连续性矫正,统计量计算公式:x c2= (∣A i −T i ∣−0.5)2T iki=1第二节 适合性检验1.适合性检验的定义所谓适合性检验,就是检验某一试验结果类别频数的划分是否符合某一理论比例。
卡平方测验
,
所以否定H0,接受HA,即该水稻稃尖和糯性性 状在F2的实际结果不符合9∶3∶3∶1的理论比率。
这一情况表明,该两对等位基因并非独立遗
传,而可能为连锁遗传。
第三节 独立性测验
一、 2×2表的独立性测验
二、 2×c表的独立性测验 三、 r×c表的独立性测验
14
χ2应用于独立性测验(test for independence),
O- E | O-E |-1/2 (|O-E|-1/2)2/E
208 81
216.75 72.25
-8.75 +8.75
8.25 8.25
0.3140 0.9420
总数
289
289
0
1.2560
H0:大豆花色F2分离符合3∶1比率;HA:不符合3∶1比率。 显著水平 a =0.05。由于该资料只有k=组, ν k 1 1 ,
2 2 2 0 9 . 49 , 现 5 . 62 .05, 4 0.05, 4 P 0.05
接受H0:不同的灌溉方式对水稻叶片的衰老情况没有显 著影响。
23
21
三、r×c表的独立性测验
若横行分r组,纵行分c组,且r≥3,c≥3,则为r×c相 依表,其ν=(r-1)(c-1) [例]下表为不同灌溉方式下水稻叶片衰老情况的调查资 料。试测验稻叶衰老情况是否与灌溉方式有关。
灌溉方式 深水 绿叶数 146(140.69) 黄叶数 7(8.78) 枯叶数 7(10.53) 总计 160
故应接受H0,说明大豆花色这对性状是符合3∶1比率,即符
合一对等位基因的表型分离比例。
[例2]
两对等位基因遗传试验,如基因为独立分配,则F2
代的四种表现型在理论上应有9∶3∶3∶1的比率。有一水稻 遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种杂交, 其F2代得表2结果。试检查实际结果是否符合9∶3∶3∶1的理 论比率。
卡方测验
2 6.0 5 30.0 1.79176 8.95880
3 3.1 11 34.1 1.13140 12.44540
∑
20 80.9 4.35824 27.14452
s2p=∑υi Si2/∑υi=80.9/20=4.045 ∑υi lns2p=20×4.045=27.94960
C=1+[1/(3k-3)][∑(1/υi)-1/∑υi]=1+[1/(9-3)][1/4+1/5+1/11-1/20]=1.0818
若若如本所果χ所得算²值属得χ与总的²值 χ体χ不²α方²,显cυ差值接著不>近,是χ应则同²作不α质,矫必υ的,正在。便。做否矫定正H,0,应表接明受这H0些; 样
[例] 假定有3个样本方差s21 =4.2 s22=6.0 s2k=3.1,各具有自
由度υ1=4, υ2=5,υ3=11,试测验其是否同质。
(2.5758)2
Z2 0.01/ 2
2.2分布密度曲线是随自由度不同而改变的
一组曲线。随自由度的增大, 曲线由偏
斜渐趋于对称;df≥30时,接近正态分布。
若研究的总体μ不知,而以样本y代替,则
此时独立的正态离差个数为n-1个,故df=n-1。
χ2与u,t,F统计数比较 按定义: ∑ui2=χ2,
假定有3个或3个以上样本,每一样本均可估得一方差,由χ2测 验各样本方差是否来自相同方差总体的假设。
H0: σ21 =σ22=…=σ2k (k为样本数) H A: σ21、σ22、…、σ2k不全相等。 假如有k个独立的方差估计值:
同质性测验
各具υ1,υ2,…υk个自由度, 合并的方s2p为:
由此,Bartlett χ²值为:
卡平方检验
4.统计推断.0.052=5.99,由于20.052,所以否定H 0而接受HA.即消费者对3种不同产品的满意程度没 有改变.
湛江师范学院生命科学与技术学院欧阳乐军制作
21
作 业(明道绪教材67)
按饲料配方规定,每1000kg某种饲料中维生 素C不得少于246g,现从工厂的产品中随机 抽测12个样品,测得1000kg维生素C含量如 下: 255、260、262、248、244、245、250、238、 246、248、258、270g,若样品的维生素C含 量服从正态分布,问此产品是否符合规定要 求?
0
17
湛江师范学院生命科学与技术学院欧阳乐军制作
首先,按9∶3∶3∶1的理论比率算得各种表现型的理 论次数E, 如稃尖有色非糯稻 E=743×(9/16)=417.94,
稃尖有色糯稻
E=743×(3/16)=139.31,…。
H0:稃尖和糯性性状在F2的分离符合9∶3∶3∶1; HA:不符合9∶3∶3∶1。 显著水平: =0.05。 然后计算 2值
2 2 。现 χ C 1.2560 0.05,1 故应接 0 .05, 3.84 1 受H0,说明大豆花色这对性状是符合3∶1比率,即符合一对查附表6, χ 2来自等位基因的表型分离比例。
湛江师范学院生命科学与技术学院欧阳乐军制作 16
[例3]
两对等位基因遗传试验,如基因为独立分配,
则F2代的四种表现型在理论上应有9∶3∶3∶1的比率。有 一水稻遗传试验,以稃尖有色非糯品种与稃尖无色糯性品 种杂交,其F2代得表5.4结果。试检查实际结果是否符合 9∶3∶3∶1的理论比率。
湛江师范学院生命科学与技术学院欧阳乐军制作
5
f ( 2 )
第7章 卡平方测验
的属性类别分配符合已知属性类别分配的理论或
学说;
若 ≤ (或
2 0.05
2
2 2 ,0.01< c )< 0.01
p≤0.05,表
明实际观察次数与理论次数差异显著,实际观察
的属性类别分配显著不符合已知属性类别分配的
理论或学说;
若 (或
2
2 c )≥
2 0.01
,p ≤0.01,表明实际
2
当df≥2时, (Oi Ei )2
i 1
k
Ei
式计算的 2 与
连续型随机变量 2 相近,这时,可不作连续
性矫正,但要求各组内的理论次数不小于5。
如果某一组的理论次数小于5,则应把它与其
相邻的一组或几组合并 ,直到合并组的理论
次数大于5为止。
第二节 在方差的同质性测验中的应用
homogeneity among variances)。
2 2 H 0 : 12 2 k2 , 对H A : 12、 2、 、 k2不全相等。
这一测验由Bartlett(1937)提出,故又称为 Bartlett测验(Bartlett test)
假如有k个独立的方差估计值:
2
(n 1) s
2
2
(4 1) 175.6 10.54 50
查附表6,在ν=n-1=3时, χ2的临界值为:
2 0.025
9.35,
2 0.975
0.22
现χ2=10.54>
H0被否定。
02.025 9.35 ,在0.22~9.35的范围之外,
总体方差σ2的置信区间
卡方检验的详细推导过程
卡方检验的详细推导过程嘿,朋友!今天咱来聊聊卡方检验这个有点神秘但其实也不难懂的家伙。
你知道吗,卡方检验就像是一个超级侦探,专门用来探寻数据背后隐藏的秘密。
想象一下,你面前有一堆杂乱无章的数据,就像一个乱糟糟的房间,而卡方检验就是那个能帮你把房间整理得井井有条,找出关键线索的高手。
咱们先来说说卡方检验的基本概念。
它其实就是比较观察值和理论值之间的差异程度。
这就好比你预期今天会收到五个快递,结果只收到了三个,那这预期和实际之间的差别,就是卡方检验要去琢磨的事儿。
那卡方检验到底是怎么推导出来的呢?咱一步一步来。
先得有个观察频数,这就像是你实际数出来的苹果个数。
然后还有个理论频数,这好比是你按照某种规律或者预期应该有的苹果个数。
接着,咱就要计算卡方值啦。
这卡方值的计算,就像是给每个数据都穿上一件独特的衣服,然后把这些衣服的特点综合起来。
具体的公式呢,就是把观察频数和理论频数的差值平方,再除以理论频数,最后把所有的结果加起来。
你可能会想,这算来算去的有啥用啊?这用处可大了去啦!比如说,你想看看不同地区的人们对某种产品的喜好是不是有差别。
通过卡方检验,就能清楚地知道到底是真有差别,还是只是偶然现象。
再比如说,医学研究中,想知道某种治疗方法对不同性别患者的效果是否不同,卡方检验就能给出答案。
这就好比你在茫茫人海中寻找那个与你最合拍的朋友,卡方检验就是帮你筛选的工具,让你不被表象迷惑,找到真正的契合。
总之,卡方检验虽然看起来有点复杂,但只要咱们耐心去琢磨,就会发现它其实就像一个贴心的小助手,能帮咱们在数据的海洋中找到有价值的信息。
所以啊,别被卡方检验的外表吓到,勇敢地去探索它,你会发现数据的世界原来如此精彩!。
第七章 卡平方测验
多个样本方差是否来自同一总体方差的统计测验
若总共有k个样本,第i个样本的样本方差si2来自总体方 差i2。想了解这k个总体方差之间是否有显著差异。
第二节 2在方差同质性测验中的应用
如果是大样本,计算出的2值可利用正态分布转为u 一个样本方差与已知总体方差的统计测验 值,直接与u比较,做出推断。即: 1.针对研究的问题提出一对统计假设。 u H : 2 = 2vvs 1 H : 2 ≠ 2 22 2 两尾测验时 0 0 A 0 (大端)一尾测验时 H0: 2 ≤ 02 vs HA: 2 > 02 (小端)一尾测验时 H0: 2 ≥ 02 vs HA: 2 < 02 2.利用试验数据计算一个统计量的值。 ( n 1) s 2 用df=n-1查2分布表。 2 计算统计量: 02 3.根据“小概率事件实际上不可能发生”原理作判断。
第二节 2在方差同质性测验中的应用
2 i 多个样本方差是否来自同一总体方差的统计测验 若总共有k个样本,第i个样本的样本方差si2来自总体方 5.077671 96.47574 1 160.4 19 3047.6 差i2。想了解这k个总体方差之间是否有显著差异。 4.782479 90.8671 2 119.4 19 2268.6 1.针对研究的问题提出一对统计假设。 2 vs 84.5662 3H0:85.72 =19 22 1628.3= 4.450853 A: 并非都相等 1 = … H k 用df=k-1查2分布表。 2.利用试验数据计算一个统计量的值。 4.837075 91.90443 4 126.1 19 2395.9 k 1 k 2 2 2 19.14808 ) 计算统计量: 9340.4 dfi ) ln s p (dfi ln si363.8135 76 (
兽医统计学 第七章 卡方检验
➢ 独立性检验没有理论比率,因此必须用列表的方式从现 有的观测值次数来推算理论比值,这种用表的方式来推 算理论次数的方法是建立在两因子无关的基础上的。
➢ 独立性检验实际上是基于次数资料对子因子间相关性的 研究。
一、 2×2列联表
➢ 2×2列联表的一般形式如下表所示,其自由度 df=(c-1)(r-1)=(2-1)(2-1)=1,
5.929
其它三种表现型合并组
244
234.375
9.625
0.395
总和
250
250.000
0
6.324
由df2
=2-1=1,查2表得,
2
=3.84,2
=6.63,
0.05(1)
0.05(1)
由于2
< 2< 2
,故0.01<P<0.05,
0.05(1) 2
0.01(1)
表明实际观察次数与理论次数差异显著,不符合1∶15的比例,
现需验证这次试验的结果是否符合这一分离比例
1477+493+446+143=2559
长翅灰身(LLGG)× 残翅黑檀体(llgg) 长翅灰身(L_G_)
2559 9 1439.44 16
2559 3 479.81 16
2559 1 159.94 16
2 1477 1439.442 ... 143 159.942 5.519
2、计算理论次数
实际基因型频率:
D 400 / 500 0.8000
H 80 / 500 0.1600 R 20 / 500 0.0400
p D 1/ 2H 0.8000 1/ 2 0.1600 0.8800 基因频率 q R 1/ 2H 0.0400 1/ 2 0.1600 0.1200
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
其步骤和方法是:
H0:两个变数相互独立,
HA:两个变数彼此相关。
确定显著水平 a0.05或0.01。 将资料按两向分组排列成r行、c列的 相依表(表7.3),在H0下计算每一组性状 的理论次数,求出2值。 按自由度df=(r-1)(c-1)查表进行2测验。
【例7.4 】为防治小麦散黑穗病,播种 前对小麦种子进行灭菌处理,以未灭 菌处理的为对照,得结果于表5.4。试 分析种子灭菌与否和散黑穗病病穗的 多少是否有关。
注意,最后要比实际资料多算一组。
查附表1得各组下限累积概率,列于第
5列(表7.2) 。
相邻两组累积概率之差为各组概率,列
于第6列(表7.2) 。
求各组理论次数列于第7列(表7.2) 。理论次数
少于5的组,应合并到5,以满足2测验的要求。
根据各组实际次数与理论次数计算2值。
因为理论次数受平均数 x 、标准差s、理论次
0.470
df=k-1=4-1=3,
由附表6查出20.05,3 7.815。
2<20.05,3 ,不能否定H0 ,认为豌豆
杂种F2代的分离是符合9:3:3:1的理论比
率。
【例7.2 】有一批水稻种子,规定发芽 率达80%合格,即发芽:不发芽=4:1。 随机抽200粒做发芽试验,发芽种子数 为150粒。这批水稻种子是否合格?
表7.4 种子灭菌与小麦散黑穗病发病的2×2相依表 种子灭菌 不灭菌 总数
发病穗数
未发病穗数 总数
26(34.7)
50(41.3) 76
184(175.3)
200(208.7) 384
210
250 460
2×2表的独立性测验
H0:种子灭菌与散黑穗病发病无关,
HA:种子灭菌与散黑穗病发病有关 显著水平 a0.05。
2 ( 26 - 34.7 - 0.5) ( 50-41.3 -0.5)2 2 c 41.3 34.7
( 200-208.7 -0.5)2 4.267 208.7 175.3
H0:发病与品种无关, HA:发病与品种有关。 显著水平 a0.05
A品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3 B品种 健康株理论数=900×(599/900) ×(300/900)=199.7 病株理论数=900×(301/900) ×(300/900)=100.3
S2
故
2 ( x x ) i
n 1
2 2 ( x x ) ( n 1 ) S i
x2
( xi x ) 2
2
( n 1) S 2
2
此式中x2值的自由度为(n-1)
若从正态总体中抽取无数个样
本,就可形成2值的概率分布,称
为2分布。
2分布的特性有:
2 2 i 2
xi
f ( x 2 )d ( x 2 )
(图7.2)
各种自由度下右尾概率取a的临界
a,df值列于附表6,供测验时查用。
例如, df=10, a=0.05,
20.05,1018.31,表示
P( 2 > 18.310.05(图7.2)。
2测验的具体步骤为:
⑴ 提出无效假设与备择假设
二、χ2分布与χ2测验
n个独立的正态离差u1、u2、…、un的平
方和则定义为2,即
2
u u
2 1
2 2
2 ... un
u2 i
i 1
n
2 ( x i )2
1
i 1
n
上式的的自由度df=n。
当用样本来计算时,因为∑(xi-)2需由 ( xi x ) 2 来估计,而
( 184-175.3 -0.5)2
df=(2-1)(2-1)=1,由附表6查出20.05,1 3.84
c220.05,1 ,否定H0 ,接受HA,种子灭
菌与散黑穗病发病有关。
【例7.5 】调查A、B、C三个大豆品种 病毒病发生情况,每个品种调查300株,
结果列于表7.6。试分析病毒病的发生
C品种 健康株理论数=900×(599/900) ×(300/900)=199.7
病株理论数= 900×(301/900) ×(300/900)=100.3
2 2 2 (169 - 199.7) (248 - 199.7) (182 - 199.7) 2 199.7 199.7 199.7
F2代红花与白花的理论比例为3:1
实际观察次数与理论次数的符合程度
(O-E) (O-E)2
(O E ) 2 E
2
(O E ) 2 = E
于是将各差数平方除以相应的理
论次数再相加,记为χ2,即:
(O E ) E
2 2
故χ2是度量实际观察次数与理论次数 偏离程度的一个统计量,χ2越小,表明实 际观察次数与理论次数越接近; χ2=0, 表示二者完全吻合;χ2越大,表示二者相 差越大。
是否与品种有关。
表7.6 健株数 病株数 总数 大豆品种与病毒病发病情况的2×3相依表 A B C 52(100.3) 300 总数 599 301 900
182(199.7) 169(199.7) 248(199.7) 118(100.3) 131(100.3) 300 300
2×C 表的独立性测验
假设 H0:合格,即发芽:不发芽=4:1 ,
HA:不合格。
显著水平 a0.05。
2c
( Oi-Ei -0.5)2 =Σ i 1 Ei
k
( 150-160 -0.5)2 ( 50-40 -0.5)2 =2.82 40 160
(131-100.3)2 (52-100.3)2 (118-100.3)2 53.75 100.3 100.3 100.3
df=(2-1)(3-1)=2,
由附表6查出20.05,2 5.99。
df=k-1=2-1=1,由附表6查出20.05,1 3.84。
结论:c 2< 20.05,1 ,不能否定H0 ,
认为这批水稻种子是合格的。
【例7.3 】试测验100株湘菊梨单株产
量数据是否服从正态分布(表7.2)。
H0:服从正态分布;
HA:不服从正态分布。 显著水平 a0.05。
⑴ 2分布的取值范围为[0, 。 ⑵2分布的形状决定于自由度df。 (图7.1。 ⑶ 2分布曲线与横坐标轴所围成的面积等于1,即 P(0≤ 2 <+ f(02)d(2)=1
+
2 2 因此, 分布右尾从 到 的概率为 i
p( x x ) 1 F ( x )
三、卡平方测验的连续性矫正
2是连续分布,而次数资料是间断性 的,由间断性资料计算的2值均有不同程
度偏大的趋势,尤其在df=1时偏差较大。 为此,需对2进行连续性矫正使之符合2 的理论分布:
x [
2 c
( O E 0.5) E
2
]
当df≥2时,可以不作连续性矫正。
第二节 适合性测验
豌豆杂种F2代性状分离的观察次数与理论次数(n=556) 次数 黄子叶饱满 黄子叶皱缩 绿子叶饱满 绿子叶皱缩
实际次数(O)
理论次数(E)
315
312.75
101
104.25
108
104.25
32
34.75
假设 H0: F2代的分离符合9:3:3:1的理论比率,
HA: F2代的分离不符合9:3:3:1的理论比率。 显著水平
E11=460×(76/460)×(210/460)=34.7 同理,O12=184相应的理论次数为 E12=460×(384/460)×(210/460)=175.3 O21=50相应的理论次数为
E21=460×(76/460)×(250/460)=41.3
O22=200相应的理论次数为 E22=460×(384/460)×(250/460)=208.7
⑵ 确定显著水平
⑶ 计算2值
确定a0.05或0.01等。
由样本资料和理论假设计算
2 2值;根据自由度,由附表6查出a ,df 。
⑷ 推断,若χ2≤χ2α.df,则p>α,故接受H0; χ2≥χ2α.df ,则p<α,故否定H0,
卡平方测验均为一尾测验,且是右尾测验。
次数资料是间断性的,而卡平方分布 则是连续性分布,为了使间断性的计算结 果适合于连续性分布给出的概率,在计算 卡平方值x2时需注意以下问题: 任何一组性状的理论次数都必须大于5; 在自由度为1时需进行连续性矫正;
x 61.014和 s5.7052分别估计和, 用
按
离差(ui:
xi-xui= s
将各组下限换算成标准正态
第一组下限u1=
47.01-61.014
5.7052 50.01-61.014 5.7052
=-2.45
第二组下限u2=
=-1.93,
其余类推,结果列于表7.2第4列(表7.2) 。
2 2
0.05,2 ,否定H0
,接受HA,
可以认为发病与品种有关。
【例7.6】研究1418个小麦品种原产地与 抗寒性的关系,结果见表7.8。分析小麦 品种的抗寒性与原产地是否有关。
表7.8 原产地 河北 小麦原产地与品种抗寒性的3×3相依表
抗寒性
极强 强 中和弱 190(116.1) 241(231.8) 107(190.1)
312.75
a0.05。
2 2 2 2
(315-312.75) (101-104.25) (108-104.25) (32-34.75) 2 104.25 104.25 34.75