卡平方测验
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第八章卡平方(χ2)测验
知识目标:
●理解卡平方(χ2)的概念;
●掌握适合性测验的方法;
●掌握独立性测验的方法;
●了解卡平方(χ2)的可加性和联合分析。
能力目标:
●学会适合性测验的方法;
●学会独立性测验的方法;
前面介绍了数量性状资料的统计分析方法。在生物和农业科学研究中,还有许多质量性状的资料,这样的资料可以转化为次数资料。间断性变数的计数资料也可整理为次数资料。凡是试验结果用次数表示的资料,皆称为次数资料。次数资料的统计分析方法有二项分布的正态接近法和卡平方(χ2)测验法等。本章主要介绍卡平方测验。
第一节卡平方(χ2)测验
一、卡平方(χ2)概念
为了便于理解,现结合一实例说明χ2统计量的意义。菠菜雌雄株的性比为1:1,今观测200株菠菜,其中有92棵雌株,108棵雄株。按1:1的性比计算,雌、雄株均应为100株。以O表示实际观察次数,E表示理论次数,可将上述情况列成表8-1。
表8-1 菠菜雌雄株实际观测株数与理论株数的比较
性别观测株数O理论株数EO-E(O-E)2/E
雌92(O1) 100(E1) -8 0.64
雄108(O2) 100(E2) 8 0.64
合计200 200 0 1.28
从表8-1看到,实际观察次数与理论次数存在一定的差异,这里雌、雄各相差8株。这个差异是属于抽样误差,还是菠菜雌雄性比发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度,然后判断这一偏离程度是否属于抽样误差,即进行显著性测验。为了度量实际观察次数与理论次数偏离的程度,最简单的办法是求出实际观察次数与理论次数的差数。从表8-1看出:O1-E1= 8,O 2-E 2=8,由于这两个差数之和为0, 显然不能用这两个差数之和来表示实际观察次数与理论次数的偏离程度。为了避免正、负抵消,可将两个差数O 1-E 1、O 2-E 2平方后再相加,即计算∑-2)
(E O ,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。但利用∑-2)(E O 表示实
际观察次数与理论次数的偏离程度尚有不足。例如某一组实际观察次数为505,理论次数为500,相差5;而另一组实际观察次数为26,理论次数为21,相差亦为5。显然这两组实际观察次数与理论次数的偏离程度是不同的。因为前者是相对于理论次数500相差5,后者是相对于理论次数21相差5。为了弥补这一不足,可先将各差数平方除以相应的理论次数后再相加,并记之为χ2,即
∑-=E E O 2
2
)(χ (8-1) 也就是说,χ2是度量实际观察次数与理论次数偏离程度的一个统计量。χ2越小,表明实际观察次数与理论次数越接近;χ2 =0,表示两者完全吻合;χ2越大,表示两者相差越大。 对于表8-1的资料,可计算得
χ2=∑=+-=-28.1100
8100)8()(222E E O 但是,由于抽样误差的存在,χ2值究竟大到什么程度才算差异显著(不相符合),小到什么程度才算差异不显著(相符合)呢?这个问题需用χ2的显著性测验来解决,而χ2测验的依据则是χ2的抽样分布(χ2分布)。
二、卡平方(χ2)的分布
理论研究证明,χ2的分布为正偏态分布,其分布特点为: 1. χ2分布没有负值,均在0~+∞之间,即在χ2=0的右边,为正偏态分布。
2. χ2的分布为连续性分布,而不是间断性的。
3. χ2分布曲线是一组曲线。每一个不同的自由度
都有一条相应的χ2分布曲线。
4. χ2分布的偏斜度随自由度ν不同而变化。当ν=1
时偏斜最厉害,ν>30时曲线接近正态分布,当ν→∞
时,则为正态分布。图8-1为几个不同自由度的χ2分布
曲线。附表列出不同自由度时χ2的一尾(右尾)概率表,可供次数资料的χ2测验之用。
三、卡平方(χ2)的连续性矫正
χ2分布是连续性的,而次数资料则是间断性的。由(8-1)式计算的χ2只是近似地服从连续型随机变量χ2分布。在对次数资料进行χ2检验利用连续型随机变量χ2分布计算概率时,常常偏低,特别是当自由度ν=1时偏差较大。Yates(1934)提出了一个矫正公式,矫正后的χ2值记为:2χc
2
χc =∑--E E O 2
)5.0( (8-2)
当自由度ν>1时,(8-1)式的χ2分布与连续型随机变量χ2分布相近似,这时,可不作连续性矫正。
第二节 适合性测验
一、适合性测验的意义
判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设测验称为适合性测验。在适合性测验中,无效假设H 0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;备择假设H A :实际观察的属性类别分配不符合已知属性类别分配的理论或学说。并在无效假设H 0成立的条件下,按照已知属性类别分配的理论或学说计算各属性类别的理论次数。因计算所得的各个属性类别理论次数的总和应等于各个属性类别实际观察次数的总和,即独立的理论次数的个数等于属性类别分类数减1。也就是说,适合性测验的自由度等于属性类别分类数减1。若属性类别分类数为k ,则适合性测验的自由度ν=k -1。然后根据(8-1)或(8-2)计算出χ2或2χc 。将计算所得的χ2或2χc 值与根据自由度ν=k -1查χ2值表(附表
6)所得的临界χ2值:2050χ.、2010χ.比较:若χ2 (或2χc )<2050χ.,P >0.05,表明实际观察次数与理论次数差异不显著,可以认为实际观察的属性类别分配符合已知属性类别分配的理论或学说;若2050χ.≤χ2 (或2χc )<2010χ.,0.01<P ≤0.05,表明实际观察次数与理论次数差异显著,可以认为实际观察的属性类别分配不符合已知属性类别分配的理论或学说;若χ2 (或2χc )≥2010χ.,P ≤0.01,表明实际观察次数与理论次数差异极显著,可以认为实际观察的属性类别分配极显