卡方测验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 6.0 5 30.0 1.79176 8.95880
3 3.1 11 34.1 1.13140 12.44540
∑
20 80.9 4.35824 27.14452
s2p=∑υi Si2/∑υi=80.9/20=4.045 ∑υi lns2p=20×4.045=27.94960
C=1+[1/(3k-3)][∑(1/υi)-1/∑υi]=1+[1/(9-3)][1/4+1/5+1/11-1/20]=1.0818
若若如本所果χ所得算²值属得χ与总的²值 χ体χ不²α方²,显cυ差值接著不>近,是χ应则同²作不α质,矫必υ的,正在。便。做否矫定正H,0,应表接明受这H0些; 样
[例] 假定有3个样本方差s21 =4.2 s22=6.0 s2k=3.1,各具有自
由度υ1=4, υ2=5,υ3=11,试测验其是否同质。
(2.5758)2
Z2 0.01/ 2
2.2分布密度曲线是随自由度不同而改变的
一组曲线。随自由度的增大, 曲线由偏
斜渐趋于对称;df≥30时,接近正态分布。
若研究的总体μ不知,而以样本y代替,则
此时独立的正态离差个数为n-1个,故df=n-1。
χ2与u,t,F统计数比较 按定义: ∑ui2=χ2,
假定有3个或3个以上样本,每一样本均可估得一方差,由χ2测 验各样本方差是否来自相同方差总体的假设。
H0: σ21 =σ22=…=σ2k (k为样本数) H A: σ21、σ22、…、σ2k不全相等。 假如有k个独立的方差估计值:
同质性测验
各具υ1,υ2,…υk个自由度, 合并的方s2p为:
由此,Bartlett χ²值为:
当只有一个正态离差时u2=χ2, u=(χ2)1/2 t=(y-μ)/s, 当s的自由度无限增大时:
t=(y-μ)/σ=u =(χ2)1/2, 此时χ2的df=1 F=s12/s22, 当s22的自由度无限增大时:
F=s12/σ22=χ2/df,df为s12的自由度。
计数资料分析的χ2
Pearson定义:当(P1,P2,…Pr)是总体的真实概率分布时
9:3:3:1理论比例的适合性检验简式
χ²=[16(a12+3a22+3a32+9a42)]/9n - n
式中的a1,a2,a3,a4分别为9:3:3:1比率中各 项表现型的实际观察次数,n为总次数
实际资料多于两组的X²值通式则为:
χ²=∑[ai2/(min)]- n
上式的mi为各项理论比率,ai为其对应的观察 次数。
若所研究的对象属同一个总体,则μi=μ,σi=σ,
χ2 =∑[(yi-μ)/σ]2 ~ χ2 (n)
附表6为χ2≥χp2时的右尾概率表。
0.3
0.2
0.1
0.0
0
2
特征:
1.2≥0;
4
6
8
10
2 0.05(1)
3.84
(1.96)2
Z2 0.05 / 2
2 0.01(1)
6.63
χ²c=1/1.0818 ×(27.94960-27.14452)=0.744
(3) 查附表6,当υ=k-1=3-1=2时,χ²>0.744的概率在0.50~0.75之间, 符合H0的概率不小,因此说明本例的3个方差估计值是同质性的。
第三节 适合性测验 一、适合性χ²测验的意义
判断实际观察的属性类别分配是否符合 已知属性类别分配理论或学说的假设检验。
c-1
[例] 大豆单株粒重观察分布与理论正态分布的适应性测验
(摘自Steel and Torrie,1980) (单位:g)
单株产量
组限(y) 组中点
0.5~
3
5.5~
8
10.5~ 13
15.5~ 18
20.5~ 23
25.5~ 28
30.5~ 33
35.5~ 38
40.5~ 43
45.5~ 48
χ²值是多项ui2或(O-E)2/E之和,故χ²具有可加性
第二节 χ²在方差同质性测验中的应用
一、 一个样本方差与给定总体方差比较检验
1、在作两尾测验时
χ χ χ χ H0:σ2=C,HA:σ2≠C。若 ²> 2(α/2),df或 ²< 2(1-α/2),df ,H0被否定。
[例] 硫酸铵施于水田表层试验,得4个小区的稻谷产量分别为517,492,
50.5~ 53
55.5~ 58
60.5~ 63
65.5~ 68
次数(O) y-y
7 -26.43
5 -21.43
7 -16.43
18 -11.43
32
-6.43
41
-1.43
37
3.57
25
8.57
22 13.57
19 18.57
6
23.57
6
28.57
3
33.57
1
38.57
(y-y)/s
-2.065 -1.674 -1.284 -0.893 -0.502 -0.112 0.279 0.670 1.060 1.451 1.841 2.232 2.623 3.013
【例】观察淀粉质与非淀粉质玉米杂交的F1代花粉粒,
经碘处理后有3437粒呈蓝色反应,3482呈非蓝色反
应。F1代花粉粒碘反应的理论比例应该是1:1。实 际观察结果是否符合理论假设须进行统计分析。
二、χ²测验的步骤
(1) H0: 花粉粒碘反应为1:1 HA: 花粉粒碘反应比例不成1:1。
(2) α=0.05,0.01 (3) 在无效假设为正确的假定下,按已知属性类别分
χ²C=χ2/C
上式的υi=ni-1, ni为样本容量,而C为矫正数:
C=1+[1/(3k-3)][∑(1/υi)-1/∑υi]
如采用常用对数,则(7.9)可写为
χ²C=2.3026/C [(∑υi)lgS2p - ∑υilgS2i]
如χ²值不进行C矫正,亦近似地作χ²分布,不论矫正
与否均具有
υ=k-1
(2) H0: σ2≥C,HA:σ2<C;若χ2<χ21-α,df,否定H0;
[例] 试审查上例试验结果的总体方差是否真大于 50(kg)2?
解:(1) H0:σ2≤50,HA: σ2﹥50。取5%为显著水平。 (2)查附表6,这一测验的χ2临界值为χ20.05,3=7.81, (3) 计算:χ2=3×175.6/50=10.54,因10.54>7.81,所以 H0应被否定,即总体方差大于50(kg)2。
如上例资料计算的χ²C=0.2798, 仍小于χ²0.05,
1=3.84, 结论于前相同。
当自由度大于1时,不作连续性矫正。
[例] 水稻遗传试验,以稃尖有色非糯品种与稃尖无
色糯性品种杂交,其F2代得下表结果。试检查实际 结果是否符合9:3:3:1的理论比率?
解: (1) H0:F2代的分离符合9:3:3:1; HA:不符合9:3:3:1。
解: (1)因为υ=3,χ20.975,3=0.22, χ20.025,3=9.35,且已知 S2=175.6, (2)总体方差σ2的95%置信区间的下限L1和上限 L2为: L1=υS2 /X2(α/2),υ= 3×175.6/9.35=56.3 L2=υS2 /X2(1-α/2),υ= 3×175.6/0.22=2394.5 56.3 ≤ σ2≤2394.5
此例,实得X²=0.2926小于χ²0.05,1,接受H0。
试验结果符合一对等位基因的理论分离比例。
χ²测验连续性矫正:
上式的2只是近似地服从连续型随机变量2分布。 在对次数资料进行2检验计算概率时,常常偏低,特
别是当υ为1时偏差较大。
矫正后 χ²C=∑[(|Oi-Ei|-0.5)2/Ei]
也可进行显著性检验:
给定总体σ2=50,在56.3~2394.5范围外,故 亦推断两者非同一总体。
n≤30时,单个样本方差用χ2分布来测验和推断置信
区间;
n>30时,χ2分布近似对称,可采用u测验并进行区
间估计。
二、几个样本方差的方差的同质性测验(test for homogeneity
among variances)
514,522(kg),计得样本方差为175.6(kg)2。现要测验H0:σ2=50(kg)2对HA: σ2≠50(kg)2,采用显著水平α=0.05。
解:(1) χ²=(n-1)S2/σ2 =(4-1)×175.6/50=10.54 (2) 查 附 表 6 , 在 df=n-1=3 时 , α/2 和 (1-α/2) 水 平 的 χ²临 界 值 为 :
n=229 y=31.93 s=12.80 υ=14-3=11
P
0.0195 0.0277 0.0525 0.0863 0.1219 0.1477 0.1545 0.1386 0.1068 0.0712 0.0405 0.0201 0.0084 0.0044
理论次数 X²
(E)
4.5
1.39
6.3 0.27
3.总体方差的区间估计
根据χ2的定义:χ2=υS2/σ2 应用χ2分布由样本S2给出一个总体σ2的置信区间,在 此区间内包括有总体σ2的概率为(1-α),即
P{χ2(1-α/2),υ≤υS2/σ2≤χ2(α/2),υ}=1-α
已知υS2=∑(y-y)2
[例] 硫酸铵施于水田表层试验,得4个小区的稻谷 产量分别为517,492,514,522(kg),计得样本方 差为175.6(kg)2。求总体σ2的95%的置信限。
χ χ ²0.025,3=9.35, 20.975,3=0.22。 于(03.)05现,χH²=01被0.否54定,。大于χ²0.025=9.35, 在0.22~9.35范围外,符合H0 的概率小
(4) 结论:该样本并非从σ2=50(kg)2的总体中抽取的。
2、在作一尾测验时 (1) H0:σ2≤C,HA:σ2>C;若χ2>χ2α,df,否定H0。
解:(1) H0: σ21 =σ22=σ23对HA:3个方差不全相等
HA:σ21 ≠σ22=σ23 ?σ21 =σ22≠σ23 ?σ21 ≠ σ22≠σ23 ? (2) 同质性测验的计算:
3个方差同质性测验的计算
i
s2i υi υisi2
lns2i
υilns2i
1 4.2 4 16.8 1.43508 5.74032
12Байду номын сангаас0 2.08
19.8 0.16
27.9 0.60
33.8 1.53
35.4 0.07
31.7 1.42
24.5 0.26
16.3 0.45
9.3 1.17
4.6 0.43
1.9 7.27 0.64
三、次数分布的适合性测验
1、提出理论分布的可能类型, 2、对观察分布是否符合理论分布进行测验,测验的
假设为H0:观察分布符合理论分布,H A:观察分布不符 合理论分布。
用 χ2=∑[(Oi-Ei)2/Ei] 进行测验。 3、按理论分布计算出各组的理论次数 4、计算χ2值 5、查χ2表, k=组数,c=理论分布的参数个数, 故υ=k-
第七章 卡平方(X²)测验
要求:
理解 卡平方(X²)的定义和分布 掌握 X²在方差同质性测验中的应用
适合性测验 独立性测验
第一节 卡平方(χ²)的定义和分布
χ²的定义: 相互独立的多个正态离差平方值的总和
χ²= u1²+u2²+…+ui²+…+un²=∑ui² =∑[(yi-μi)/σi]2
其中,yi~N(ui,σi²),ui=(yi-μi)/σi为标准正态离差。
配的理论或学说计算各属性类别的理论次数。 因∑(O-E)=0,υ=k-1。
(4) 计算χ²或χc² (5)查临界值,比较,判断接受或否定无效假设。
• 若2 (或c2)<0.052,P>0.05,差异不显著; • 0.052≤2 (或c2)<0.012,0.01<P≤0.05,差异显著; • 2(或 c 2 )≥0.012,P≤0.01,差异极显著。
2 r (ni npi )2
i1
npi
随n的增加渐近于自由度为r-1的χ2分布。
其中P1,P2,…Pr为r种不同属性出现的概率,n为 样本含量,ni为样本中第i种属性出现的次数。
等同于χ2=∑[(Oi-Ei)2/Ei] 式中O为观察次数,E为理论次数,i=1,…,k为计数资料
的分组数,自由度为df,依分组数及其相互独立的程度决定。
α=0.05; k=4组,故υ=k-1=3。 查附表6,χ²0.05,3=7.815
(2) 计算X²值 χ²=73.062/417.94+(-63.31)2/139.31 +(-49.31)2/139.31+39.562/46.44=92.696
(3) 实得X²=92.696>X²0.05,3, H0应予否定,接受 HA,即该水稻稃尖和糯性性状在F2的实际结果不符合9: 3:3:1的理论比率。