卡平方测验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章 卡平方(χ2)测验
知识目标:
● 理解卡平方(χ2)的概念; ● 掌握适合性测验的方法; ● 掌握独立性测验的方法;
● 了解卡平方(χ2)的可加性和联合分析。
能力目标:
● 学会适合性测验的方法; ● 学会独立性测验的方法;
前面介绍了数量性状资料的统计分析方法。在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。间断性变数的计数资料也可整理为次数资料。凡是试验结果用次数表示的资料,皆称为次数资料。次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。本章主要介绍卡平方测验。
第一节 卡平方(χ2)测验
一、卡平方(χ2)概念
为了便于理解,现结合一实例说明χ2统计量的意义。菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。按1:1的性比计算,雌、雄株均应为100株。以O 表示实际观察次数,E 表示理论次数,可将上述情况列成表8-1。 表8-1 菠菜雌雄株实际观测株数与理论株数的比较
性 别 观测株数O 理论株数E
O-E (O-E)2/E
雌 92(O 1) 100(E 1) -8 0.64 雄 108(O 2) 100(E 2) 8 0.64 合 计
200
200
1.28
从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算
∑-2
)
(E O ,其
值越大,实际观察次数与理论次数相差亦越大,反之则越小。但利用
∑-2
)
(E O 表示实际
观察次数与理论次数的偏离程度尚有不足。例如某一组实际观察次数为505,理论次数为500,相差5;而另一组实际观察次数为26,理论次数为21,相差亦为5。显然这两组实际观察次数与理论次数的偏离程度是不同的。因为前者是相对于理论次数500相差5,后者是相对于理论次数21相差5。为了弥补这一不足,可先将各差数平方除以相应的理论次数后再相加,并记之为χ2,即
∑-=E
E O 2
2
)(χ (8-1)
也就是说,χ2是度量实际观察次数与理论次数偏离程度的一个统计量。χ2越小,表明实际观察次数与理论次数越接近;χ2 =0,表示两者完全吻合;χ2越大,表示两者相差越大。 对于表8-1的资料,可计算得
χ2=
∑=+-=-28.11008100)8()(2
22E E O
但是,由于抽样误差的存在,χ2值究竟大到什么程度才算差异显著(不相符合),小到什么程度才算差异不显著(相符合)呢?这个问题需用χ2的显著性测验来解决,而χ2测验的依据则是χ2的抽样分布(χ2分布)。
二、卡平方(χ2)的分布
理论研究证明,χ2的分布为正偏态分布,其分布特点为:
1. χ2分布没有负值,均在0~+∞之间,即在χ2=0的右边,为正偏态分布。
2. χ2的分布为连续性分布,而不是间断性的。
3. χ2分布曲线是一组曲线。每一个不同的自由度都有一条相应的χ2分布曲线。
4. χ2分布的偏斜度随自由度ν不同而变化。当ν=1时偏斜最厉害,ν>30时曲线接近正态分布,当ν→∞时,则为正态分布。图8-1为几个不同自由度的χ2分布曲线。附表列出不同自由度时χ2的一尾(右尾)概率表,可供次数资料的χ2测验之用。
三、卡平方(χ2)的连续性矫正
χ2分布是连续性的,而次数资料则是间断性的。由(8-1)式计算的χ2只是近似地服从连续型随机变量χ2分布。在对次数资料进行χ2检验利用连续型随机变量χ2分布计算概率时,常常偏低,特别是当自由度ν=1时偏差较大。Yates (1934)提出了一个矫正公式,矫正后的χ2值记为:
2χc
图8-1 不同自由度的χ2分布曲线
紫色208 216.75 -8.75 0.3140 白色81 72.25 +8.75 0.9420
稃尖有色非糯491(O1)417.94(E1)73.06 12.772 稃尖有色糯稻76(O2)139.31(E2)-63.31 28.771 稃尖无色非糯90(O3)139.31(E3)-49.31 17.454
稃尖无色糯稻
之和,自由度为属性类别数减1。而在r×c表的独立性测验中,共有rc个理论次数,但受到以下条件的约束:
(1) rc个理论次数的总和等于rc个实际次数的总和;
(2) r个横行中的每一个横行理论次数总和等于该行实际次数的总和。但由于r个横行实际次数之和的总和等于rc个实际次数之和,因而独立的行约束条件只有r-1个;
(3)类似地,独立的列约束条件有c-1个。因而在进行独立性测验时,自由度ν=rc-1-(r-1)-(c-1)=(r-1)(c-1),即等于(横行属性类别数-1)×(直列属性类别数-1)。
二、独立性测验的方法
下面结合实例分别介绍2×2表、2×c表、r×c表独立性测验的具体过程。
1.2×2表的独立性测验
2×2相依表是指横行和纵行皆分为两组的资料。2×2表的一般形式如表8-4所示,其自由度ν=(c-1)(r-1)=(2-1)(2-1)=1,在进行χ2检验时,需作连续性矫正,应计算2χc值。
[例8.3]调查经过种子灭菌处理与未经种子灭菌处理的小麦发生散黑穗病的穗数,得表8-4,试分析种子灭菌与否和散黑穗病穗多少是否有关?
表8-4 防治小麦散黑穗病的观察结果
种子灭菌26(34.7)50(41.3)76