卡方测验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
9:3:3:1理论比例的适合性检验简式
χ²=[16(a12+3a22+3a32+9a42)]/9n - n
式中的a1,a2,a3,a4分别为9:3:3:1比率中各 项表现型的实际观察次数,n为总次数
实际资料多于两组的X²值通式则为:
χ²=∑[ai2/(min)]- n
上式的mi为各项理论比率,ai为其对应的观察 次数。
如上例资料计算的χ²C=0.2798, 仍小于χ²0.05,
1=3.84, 结论于前相同。
当自由度大于1时,不作连续性矫正。
[例] 水稻遗传试验,以稃尖有色非糯品种与稃尖无
色糯性品种杂交,其F2代得下表结果。试检查实际 结果是否符合9:3:3:1的理论比率?
解: (1) H0:F2代的分离符合9:3:3:1; HA:不符合9:3:3:1。
解:(1) H0: σ21 =σ22=σ23对HA:3个方差不全相等
HA:σ21 ≠σ22=σ23 ?σ21 =σ22≠σ23 ?σ21 ≠ σ22≠σ23 ? (2) 同质性测验的计算:
3个方差同质性测验的计算
i
s2i υi υisi2
lns2i
υilns2i
1 4.2 4 16.8 1.43508 5.74032
当只有一个正态离差时u2=χ2, u=(χ2)1/2 t=(y-μ)/s, 当s的自由度无限增大时:
t=(y-μ)/σ=u =(χ2)1/2, 此时χ2的df=1 F=s12/s22, 当s22的自由度无限增大时:
F=s12/σ22=χ2/df,df为s12的自由度。
计数资料分析的χ2
Pearson定义:当(P1,P2,…Pr)是总体的真实概率分布时
12.0 2.08
19.8 0.16
27.9 0.60
33.8 1.53
35.4 0.07
31.7 1.42
24.5 0.26
16.3 0.45
9.3 1.17
4.6 0.43
1.9 7.27 0.64
此例,实得X²=0.2926小于χ²0.05,1,接受H0。
试验结果符合一对等位基因的理论分离比例。
χ²测验连续性矫正:
上式的2只是近似地服从连续型随机变量2分布。 在对次数资料进行2检验计算概率时,常常偏低,特
别是当υ为1时偏差较大。
矫正后 χ²C=∑[(|Oi-Ei|-0.5)2/Ei]
若若如本所果χ所得算²值属得χ与总的²值 χ体χ不²α方²,显cυ差值接著不>近,是χ应则同²作不α质,矫必υ的,正在。便。做否矫定正H,0,应表接明受这H0些; 样
[例] 假定有3个样本方差s21 =4.2 s22=6.0 s2k=3.1,各具有自
由度υ1=4, υ2=5,υ3=11,试测验其是否同质。
χ²C=χ2/C
上式的υi=ni-1, ni为样本容量,而C为矫正数:
C=1+[1/(3k-3)][∑(1/υi)-1/∑υi]
如采用常用对数,则(7.9)可写为
χ²C=2.3026/C [(∑υi)lgS2p - ∑υilgS2i]
如χ²值不进行C矫正,亦近似地作χ²分布,不论矫正
与否均具有
υ=k-1
α=0.05; k=4组,故υ=k-1=3。 查附表6,χ²0.05,3=7.815
(2) 计算X²值 χ²=73.062/417.94+(-63.31)2/139.31 +(-49.31)2/139.31+39.562/46.44=92.696
(3) 实得X²=92.696>X²0.05,3, H0应予否定,接受 HA,即该水稻稃尖和糯性性状在F2的实际结果不符合9: 3:3:1的理论比率。
(2.5758)2
Z2 0.01/ 2
2.2分布密度曲线是随自由度不同而改变的
一组曲线。随自由度的增大, 曲线由偏
斜渐趋于对称;df≥30时,接近正态分布。
若研究的总体μ不知,而以样本y代替,则
此时独立的正态离差个数为n-1个,故df=n-1。
χ2与u,t,F统计数比较 按定义: ∑ui2=χ2,
50.5~ 53
55.5~ 58
60.5~ 63
65.5~ 68
次数(O) y-y
7 -26.43
5 -21.43
7 -16.43
18 -11.43
32
-6.43
41
-1.43
37
3.57
25
8.57
22 13.57
19 18.57
6
23.57
6
28.57
3
33.57
1
38.57
(y-y)/s
-2.065 -1.674 -1.284 -0.893 -0.502 -0.112 0.279 0.670 1.060 1.451 1.841 2.232 2.623 3.013
514,522(kg),计得样本方差为175.6(kg)2。现要测验H0:σ2=50(kg)2对HA: σ2≠50(kg)2,采用显著水平α=0.05。
解:(1) χ²=(n-1)S2/σ2 =(4-1)×175.6/50=10.54 (2) 查 附 表 6 , 在 df=n-1=3 时 , α/2 和 (1-α/2) 水 平 的 χ²临 界 值 为 :
解: (1)因为υ=3,χ20.975,3=0.22, χ20.025,3=9.35,且已知 S2=175.6, (2)总体方差σ2的95%置信区间的下限L1和上限 L2为: L1=υS2 /X2(α/2),υ= 3×175.6/9.35=56.3 L2=υS2 /X2(1-α/2),υ= 3×175.6/0.22=2394.5 56.3 ≤ σ2≤2394.5
配的理论或学说计算各属性类别的理论次数。 因∑(O-E)=0,υ=k-1。
(4) 计算χ²或χc² (5)查临界值,比较,判断接受或否定无效假设。
• 若2 (或c2)<0.052,P>0.05,差异不显著; • 0.052≤2 (或c2)<0.012,0.01<P≤0.05,差异显著; • 2(或 c 2 )≥0.012,P≤0.01,差异极显著。
χ χ ²0.025,3=9.35, 20.975,3=0.22。 于(03.)05现,χH²=01被0.否54定,。大于χ²0.025=9.35, 在0.22~9.35范围外,符合H0 的概率小
(4) 结论:该样本并非从σ2=50(kg)2的总体中抽取的。
2、在作一尾测验时 (1) H0:σ2≤C,HA:σ2>C;若χ2>χ2α,df,否定H0。
3.总体方差的区间估计
根据χ2的定义:χ2=υS2/σ2 应用χ2分布由样本S2给出一个总体σ2的置信区间,在 此区间内包括有总体σ2的概率为(1-α),即
P{χ2(1-α/2),υ≤υS2/σ2≤χ2(α/2),υ}=1-α
已知υS2=∑(y-y)2
[例] 硫酸铵施于水田表层试验,得4个小区的稻谷 产量分别为517,492,514,522(kg),计得样本方 差为175.6(kg)2。求总体σ2的95%的置信限。
χ²c=1/1.0818 ×(27.94960-27.14452)=0.744
(3) 查附表6,当υ=k-1=3-1=2时,χ²>0.744的概率在0.50~0.75之间, 符合H0的概率不小,因此说明本例的3个方差估计值是同质性的。
第三节 适合性测验 一、适合性χ²测验的意义
判断实际观察的属性类别分配是否符合 已知属性类别分配理论或学说的假设检验。
c-1
[例] 大豆单株粒重观察分布与理论正态分布的适应性测验
(摘自Steel and Torrie,1980) (单位:g)
单株产量
组限(y) 组中点
0.5~
3
5.5~
8百度文库
10.5~ 13
15.5~ 18
20.5~ 23
25.5~ 28
30.5~ 33
35.5~ 38
40.5~ 43
45.5~ 48
若所研究的对象属同一个总体,则μi=μ,σi=σ,
χ2 =∑[(yi-μ)/σ]2 ~ χ2 (n)
附表6为χ2≥χp2时的右尾概率表。
0.3
0.2
0.1
0.0
0
2
特征:
1.2≥0;
4
6
8
10
2 0.05(1)
3.84
(1.96)2
Z2 0.05 / 2
2 0.01(1)
6.63
也可进行显著性检验:
给定总体σ2=50,在56.3~2394.5范围外,故 亦推断两者非同一总体。
n≤30时,单个样本方差用χ2分布来测验和推断置信
区间;
n>30时,χ2分布近似对称,可采用u测验并进行区
间估计。
二、几个样本方差的方差的同质性测验(test for homogeneity
among variances)
【例】观察淀粉质与非淀粉质玉米杂交的F1代花粉粒,
经碘处理后有3437粒呈蓝色反应,3482呈非蓝色反
应。F1代花粉粒碘反应的理论比例应该是1:1。实 际观察结果是否符合理论假设须进行统计分析。
二、χ²测验的步骤
(1) H0: 花粉粒碘反应为1:1 HA: 花粉粒碘反应比例不成1:1。
(2) α=0.05,0.01 (3) 在无效假设为正确的假定下,按已知属性类别分
三、次数分布的适合性测验
1、提出理论分布的可能类型, 2、对观察分布是否符合理论分布进行测验,测验的
假设为H0:观察分布符合理论分布,H A:观察分布不符 合理论分布。
用 χ2=∑[(Oi-Ei)2/Ei] 进行测验。 3、按理论分布计算出各组的理论次数 4、计算χ2值 5、查χ2表, k=组数,c=理论分布的参数个数, 故υ=k-
(2) H0: σ2≥C,HA:σ2<C;若χ2<χ21-α,df,否定H0;
[例] 试审查上例试验结果的总体方差是否真大于 50(kg)2?
解:(1) H0:σ2≤50,HA: σ2﹥50。取5%为显著水平。 (2)查附表6,这一测验的χ2临界值为χ20.05,3=7.81, (3) 计算:χ2=3×175.6/50=10.54,因10.54>7.81,所以 H0应被否定,即总体方差大于50(kg)2。
2 r (ni npi )2
i1
npi
随n的增加渐近于自由度为r-1的χ2分布。
其中P1,P2,…Pr为r种不同属性出现的概率,n为 样本含量,ni为样本中第i种属性出现的次数。
等同于χ2=∑[(Oi-Ei)2/Ei] 式中O为观察次数,E为理论次数,i=1,…,k为计数资料
的分组数,自由度为df,依分组数及其相互独立的程度决定。
假定有3个或3个以上样本,每一样本均可估得一方差,由χ2测 验各样本方差是否来自相同方差总体的假设。
H0: σ21 =σ22=…=σ2k (k为样本数) H A: σ21、σ22、…、σ2k不全相等。 假如有k个独立的方差估计值:
同质性测验
各具υ1,υ2,…υk个自由度, 合并的方s2p为:
由此,Bartlett χ²值为:
2 6.0 5 30.0 1.79176 8.95880
3 3.1 11 34.1 1.13140 12.44540
∑
20 80.9 4.35824 27.14452
s2p=∑υi Si2/∑υi=80.9/20=4.045 ∑υi lns2p=20×4.045=27.94960
C=1+[1/(3k-3)][∑(1/υi)-1/∑υi]=1+[1/(9-3)][1/4+1/5+1/11-1/20]=1.0818
χ²值是多项ui2或(O-E)2/E之和,故χ²具有可加性
第二节 χ²在方差同质性测验中的应用
一、 一个样本方差与给定总体方差比较检验
1、在作两尾测验时
χ χ χ χ H0:σ2=C,HA:σ2≠C。若 ²> 2(α/2),df或 ²< 2(1-α/2),df ,H0被否定。
[例] 硫酸铵施于水田表层试验,得4个小区的稻谷产量分别为517,492,
第七章 卡平方(X²)测验
要求:
理解 卡平方(X²)的定义和分布 掌握 X²在方差同质性测验中的应用
适合性测验 独立性测验
第一节 卡平方(χ²)的定义和分布
χ²的定义: 相互独立的多个正态离差平方值的总和
χ²= u1²+u2²+…+ui²+…+un²=∑ui² =∑[(yi-μi)/σi]2
其中,yi~N(ui,σi²),ui=(yi-μi)/σi为标准正态离差。
n=229 y=31.93 s=12.80 υ=14-3=11
P
0.0195 0.0277 0.0525 0.0863 0.1219 0.1477 0.1545 0.1386 0.1068 0.0712 0.0405 0.0201 0.0084 0.0044
理论次数 X²
(E)
4.5
1.39
6.3 0.27