次数资料分析——2检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
★χ2分布
● χ2分布的特点: (1)χ2 ≥0,即χ2 的取值范围是 [ 0,+∞)。 (2) χ2 分布是偏斜分布,随df 减少而加剧;当df=1时,曲线 以纵轴为渐近线。 (3)df 逐渐增大,曲线趋对称; df=30时,x2 分布近于正态分布。
x2检验的连续性矫正
问题: 1、什么情况下x2检验需矫正? 2、如何矫正? 3、为什么?
▲【例7.2】在研究牛的毛色(黑色、红色)和角 (无角、有角)这两对相对性状的分离现象时,用黑 色无角牛与红色有角牛进行杂交,结果在360头子二 代中,黑色无角牛有192头,黑色有角牛有78头,红 色无角牛有72头,红色有角牛18头。问这两对性状是 否符合孟德尔遗传规律中9:3:3:1的比例。
第二节 适合性检验
成比相同的假设计算。
如优等组中,甲地、乙地的理论次数按理论比率 20/135计算;良等组中,甲地、乙地的理论次数按理论 比率15/135计算;中等、劣等组中,甲地、乙地的理论 次数分别按理论比率80/135和20/135计算。
甲地优等组理论次数: T11=90×20/135=13.3,
乙地优等组理论次数: T21=45×20/135=6.7,
▲(五)查临界
x
2 c
值,作出统计推断
(P139)
●当自由度df=1时,查得
x
2 00( 5 1)
3.84
。
●由于
x
2 c
<
x 020(5 1),故P>0.05,不能否定H0,
表明实际观察次数与理论次数差异不显著。
因此,可以认为白色山羊与黑色山羊的比率符合孟德
尔遗传分离定律3:1的理论比例。
第二节 适合性检验
★ χ2的连续性矫正
● 当df=1时,计算χ2 值必须进行矫正,计算公式为:
2 c
பைடு நூலகம்
( A T 0.5)2 T
原因: χ2分布属于连续型随机变量的概率分布,在对 次数资料进行χ2检验时,计算所得的χ2值偏大,概率 偏低,因此需要矫正。
●当df>1时,可不作连续性矫正,但要求各组内的理 论次数不小于5。若某组的理论次数小于5,则应把它 与其相邻的一组或几组合并,直到理论次数大于5为 止。
表7—12 2×c 联列表一般形式
表7—12 2×c联列表一般形式
其中Aij(i=1,2;j=1,2,…,c)为实际观察次数。
上一张 下一张 主 页 退 出
第三节 独立性检验
★【例7.8】在甲、乙两地进行水牛体型调查,将 体型按优、良、中、劣四个等级分类,结果见表 7-13。问两地水牛体型构成比是否相同?
第二节 适合性检验
★判断实际观察的属性类别分配是否符合已知属 性类别分配理论或学说的假设检验称为适合性 检验。
●遗传学上:
一对性状杂种后代的分离现象,3:1; 二对性状杂种后代的分离现象是否符合9:3:3:1; 动物性别比 1:1。
适合性检验方法
(一) 建立假设 (二) 计算实际x2值 (三) 查x2值表,作统计判断
总计
表7-3 x 2 计算表
实际观察次 数(A)
理论次数(T)
192
202.5
78
67.5
72
67.5
18
22.5
360
360
A-T
-10.5 +10.5 +4.5
-4.5
0
( A T )2 T
0.5444 1.6333
0.3 0.9
3.377
第二节 适合性检验
▲(五)查临界 x 2 值,作出统计推断 (P346)
(7—8)
(7-7)与(7-8)式的区别在于:
(7-7)式利用第一行中的实际观察次数A1j和 行总和T1.;(7-8)式利用第二行中的实际观察 次数A2j和行总和T2.,计算结果相同。对于[例7.7]
利用(7-8)式计算 2 值得:
2 135 2 [10 2 52 20 2 10 2 452 ] 7.502
●根据次数资料判断两类因子彼此相关或相互独 立的假设检验就是独立性检验。
●例如:
注射某种疫苗预防某种疾病的关系(猪瘟); 不同配种(单次配、双重配)与受胎数有关系。
★独立性检验与适合性检验的区别: (1)独立性检验的次数资料是按两因子属性类别进行归 组。根据两因子属性类别数的不同而构成2×2、2×c、 r×c列联表(r为行因子的属性类别数,c为列因子的属 性类别数)。而适合性检验只按某一因子的属性类别将 如性别、表现型等次数资料归组。 (2)适合性检验按已知的属性分类理论或学说计算理论 次数。独立性检验在计算理论次数时没有现成的理论 或学说可利用,理论次数是在两因子相互独立的假设 下进行计算。 (3)适合性检验的自由度=属性类别数-1。 r×c列联表的独立性检验中,自由度df=(r-1)(c-1)。
第三节 独立性检验
★4.计算卡方值
df =(c-1)(r-1)=(2-1)(2-1)=1
xc2
( A T 0.5)2 T
(12 18.7 0.5)2 ( 32 25.3 0.5)2
18.7
25.3
( 22 15.3 0.5)2 (14 20.7 0.5)2
15.3
20.7
7.944
●当自由度df=3时,查得
x
2 00( 5 3)
7.。81
x ●由于 2 < x 020(5 3),故P>0.05,不能否定H0,表明
实际观察次数与理论次数差异不显著。因此,可以认为毛
色与角的有无两对性状杂交二代的分离现象符合孟德尔遗
传规律中9:3:3:1的理论比例。
第七章 χ2检验
第三节 独立性检验 ★独立性检验的意义
x2检验的显著性三个判断标准
1、x2<x20.05 P>0.05
差异不显著;
2、x20.05≤x2<x20.01 0.01<P≤0.05
差异显著;*
3、x2≥x20.01 P≤0.01
差异极显著;**
第二节 适合性检验
▲【例7.1】为了研究山羊毛色的遗传规律,用白 色山羊与黑色山羊进行杂交,结果在260只杂 交子二代中,181只为白色,79只为黑色。问 是否符合孟德尔遗传分离定律。
【例7.7】某猪场用80头猪检验某种疫苗是否有 预防效果。结果是注射疫苗的44头中有12头发 病,32头未发病;未注射的36头中有22头发病,
14头未发病。问该疫苗是否有预防效果?
第三节 独立性检验
★1.将资料整理成列联表 表7—11 2×2列联表
第三节 独立性检验
★2.建立假设
H0:发病与否和注射疫苗无关,即二因子相互独立 HA:发病与否和注射疫苗有关,即二因子彼此相关
第三节 独立性检验
★5.查临界值,作出统计推断
●当自由度df=1时,查得
x2 00(1 1)
6.63
。
由于
x
2 c
> x020(1 1),故P<0.01,否定H0,接
受HA,表明发病率与是否注射疫苗极显著相
关。也就是注射组的发病率极显著低于未注
射组,说明该疫苗是有预防效果的。
第三节 独立性检验
★(二)2×C列联表的独立性检验 2×c列联表是行因子的属性类别数为2,列因子的属性 类别数为c(c≥3)的列联表。 其自由度df = (2-1) (c -1) = (c-1),因为c≥3,所以 自由度大于2,在进行2检验时,不需作连续性矫正。
或T21=20-13.3=6.7;
其余各个理论次数的计算类似。
3.计算计算2值
2 (10 13.3)2 (10 10)2
13.3
10
(20 26.7)2 (10 6.6)2
26.7
6.6
7.582
4. 由自由度df=3查临界2值,作出统计推断 因 为 20..05(3) = 7 . 8 1 , 而 2=7.582<20..05(3),p>0.05,不能否定H0,可以认
●根据9:3:3:1的理论比例, 黑色无角牛的理论数 T1=360×9/16=202.5 黑色有角牛的理论数 T2=360×3/16=67.5 红色无角牛的理论数 T3=360×3/16=67.5 红色有角牛的理论数 T4=360×1/16=22.5
第二节 适合性检验
▲(四)计算 x 2
类型
黑色无角牛 黑色有角牛 红色无角牛 红色有角牛
表7—13 两地水牛体型分类统计
这是一个2×4列联表独立性检验的问题。 检验步骤如下: 1. 提出无效假设与备择假设 H0:水牛体型构成比与地区无关,即两地 水牛体型构成比相同。 HA:水牛体型构成比与地区有关,即两地 水牛体型构成比不同。
2. 计算各个理论次数,并填在各观察次数后的括号中 计算方法与2×2表类似,即根据两地水牛体型构
独立性检验和适合性检验 的区别
1、独立性检验无已知的理论比率; 2、独立性检验必须安排以因子划分的两 向列联表; 3、 独立性检验是次数资料相关性的研究; 4、适合性检验的自由度df=属性类别数k-1,
独立性检验中,自由度df=(r-1)(c-1)。
第三节 独立性检验
★独立性检验的方法 (一)2×2列联表的独立性检验
第七章 次数资料分析
——2检验
★ χ2检验是次数资料显著性检验的方法。它是通 过提出某种假设,用理论次数与观察次数进行比 较,从而确定两者的符合程度。
χ2检验的分类: 适合性检验 独立性检验
x2-检验的分类
(1)适合性检验———用来检验某性状 观察次数与该性状的理论比率是否符合。
(2)独立性检验 ——— 根据次数资料 判断两类因子彼此相关或相互独立的假 设检验。是次数资料的相关性研究。
▲(三)计算理论数
●根据3:1的理论比例, 白色山羊的理论数T1=260×3/4=195 黑色山羊的理论数T2=260×1/4=65
第二节 适合性检验
▲(四)计算卡方值
xc2
( A T 0.5)2 T
(118 195 0.5)2 ( 79 65 0.5)2
195
65
3.739
第二节 适合性检验
第三节 独立性检验
★3.计算理论次数
根据假设,二因子相互独立,即注射疫苗与否不影响 发病率,也就是注射组与未注射组的发病率应当相同, 均应等于总发病率34/80=0.425。
依此可计算出各个理论次数。 注射组 理论发病数:
理论未发病数: 未注射组 理论发病数:
理论未发病数:
T11=44×0.425=18.7 T12=44-18.7=25.3 T21=36×0.425=15.3 T22=36-15.3=20.7
§ 7~1 2统计量与2分布
一、x²检验的意义 1、 定义 2、 分类 二、x²统计量的意义 1、 x²值——度量A与T偏差程度大小 2、 公式 三、x²分布 1、 x²值概率分布 2、 特点:①、②、③ 四、连续性矫正
★案例:统计某羊场一年所产的876只羔羊中,有公 羔428只,母羔448只。问其性别比例是否正常。 ★根据遗传学理论,动物的性别比例是1:1。 ★按1:1的性别比例计算,公、母羔均应为438只。 ★实际观察次数(A)与理论次数(T)存在一定的 差异。 ★这是抽样误差,还是本质差异? ★这取决于其偏离程度。
★由于A1-T1=-10,A2-T2=10,差数之和为0; ★为避免正负抵消,可将差数平方后再相加:∑(A-T)2。 其值越大,实际观察次数与理论次数相差亦越大,反之则 越小。 ★为了弥补基数不同的影响,可先将各差数平方除以相应
的理论次数后再相加,以统计量χ2表示:
2
(A T )2
T
●χ2越小,表明实际观察次数与理论次数越接近; ● χ2 =0,表示两者完全吻合; ● χ2越大,表示两者相差越大。
为甲、乙两地水牛体型构成比基本相同。 在进行2×c列联表独立性检验时,还可利用下
述简化公式(7-7)或(7-8)计算 2:
2 T..2 [ A12j T12.] (7—7)
T1.T2. T. j T.. 上一张 下一张 主 页 退 出
或
2 T..2 [ A22j
T1.T2 . T. j
T22 .] T ..
(一)建立假设 ●H0:子二代分离现象符合3:1的理论比例
HA:子二代分离现象不符合3:1的理论比例
第二节 适合性检验
▲(二)计算公式
●本例的属性类别分类数k=2(包括白色、黑色), 则自由度df=k-1=2-1=1,为了减少偏差,必须采 用矫正公式 :
x
2 c
( A T 0.5)2 T
第二节 适合性检验
▲(一)建立假设
H0:实际观察次数之比符合9:3:3:1的理论比例 HA:实际观察次数之比不符合9:3:3:1的理论比例
第二节 适合性检验
▲(二)计算公式
●本例的属性类别分类数k=4, 因此自由度df=k-1=4-1=3,可采用一般公式
x 2 ( A T )2
T
第二节 适合性检验
▲(三)计算理论数