第六章次数资料的检验
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
甲地优等组理论次数: T11=90×20/135=13.3 乙地优等组理论次数: T21=45×20/135=6.7, 或T21=20-13.3=6.7 其余各个理论次数的计算类似。 3.计算计算χ2值
(10−13.3 2 (10−10)2 ) χ = + +⋯ ⋯ 13.3 10 (20−26.7)2 (10−6.6)2 + + 26.7 6.6 =7.58 2
独立性检验时,自由度为(r-1)(c-1),即等于(横行属性类 别数-1)×(直列属性类别数-1)。
(一)2×2列联表的独立性检验 2×2列联表的一般形式如下表所示,其自由度 df=( c-1) (r-1)=(2-1) (2-1)=1,在进行χ2检验时,需作连续性矫正,应
2 计算 χc 值。
2×2列联表的一般形式
这时需要分析药物种类与疗效是否相关,若两者彼此相关, 表明疗效因药物不同而异;若两者相互独立,表明两种药物疗 效相同。这种根据次数资料判断两类因子彼此相关或相互独立 的假设检验就是独立性检验。 独立性检验的次数资料是按两因子属性类别进行归组。根据 两因子属性类别数的不同而构成2×2、2×c、r×c列联表(r 为 行因子的属性类别数, c 为 列 因子的属性类别数)。
( A1A 2 −A2A 1 −T../ 2 2T.. ) 1 2 1 2 T.1T.2T . 2. 1T
2 χc =
(二)2×c列联表的独立性检验 2×c列联表是行因子的属性类别数为2,列因子的属性类别 数为c(c≥3)的列联表。其自由度d f = (2-1) (c -1) = (c-1),因为 c≥3,所以自由度大于2,在进行χ2检验时,不需作连续性矫正。 2×c表的一般形式见表7—12。
设样本中各种属性的实际次数为A,其相对应的理论次数为T, 则:
( A − T )2 χ2 = ∑ → df > 1 T
而当自由度df=1时,要用连续型矫正公式:
χ c2 = ∑
( A − T − 0.5) 2 T → df = 1
自由度在适合性检验和独立性检验中的确定不一样,下述。 自由度在适合性检验和独立性检验中的确定不一样,下述。
黑色无角牛的理论次数T1:360×9/16=202.5; 黑色有角牛的理论次数T2:360×3/16=67.5; 红色无角牛的理论次数T3:360×3/16=67.5; T 360 1/16=22.5 红色有角牛的理论次数T4:360×1/16=22.5。 或 T4=360-202.5-67.5-67.5=22.5 4、列表计算χ2
2×2列联表 未发病 发病 注射 未注射 12(18.7) 22(15.3) T.1:34 32(25.3) 14(20.7) T.2:46 行总和T i. T1.:44 T 2.:36 T..:80 发病率 27.3% 61.1%
列总和T.j
2、 提出无效假设与备择假设 H0:发病与否和注射疫苗无关,即二因子相互独立。 HA:发病与否和注射疫苗有关,即二因子彼此相关。 3、 计算理论次数 根据二因子相互独立的假设,由样本数据计算出各个理论次 数。 二因子相互独立,就是说注射疫苗与否不影响发病率。也就 是说注射组与未注射组的理论发病率应当相同,均应等于总发 病率34/80=0.425=42.5%。 依此计算出各个理论次数如下:
2. 计算各个理论次数,并填在各观察次数后的括号中 计算方法与2×2表类似,即根据两地水牛体型构成比相同 的假设计算。 如优等组中,甲地、乙地的理论次数按理论比率20/135计 算;良等组中,甲地、乙地的理论次数按理论比率15/135计算; 中等、劣等组中,甲地、乙地的理论次数分别按理论比率80/135 和20/135计算。
两地水牛体型分类统计 优 甲 乙 列总和T.j 10(13.3) 10(6.7) 20 良 10(10.0) 5(5.0) 15 中 60(53.3) 20(26.7) 80 劣 10(13.4) 10(6.6) 20 行总和Ti. 90 45 135
这是一个2×4列联表独立性检验的问题。 检验步骤如下: 1. 提出无效假设与备择假设 H0:水牛体型构成比与地区无关,即两地水牛体型构成比 相同。 HA:水牛体型构成比与地区有关,即两地水牛体型构成比 不同。
2
4. 由自由度df=3查临界χ2值,作出统计推断 因 为
χ20..05(3) = 7 . 8 1 , 而χ2=7.582<χ20..05(3),p>0.05,
Ti .
1 1 2
A11
2
T11
行总和
T12 T1 .
A12
A22
T .2
A21
T .1
T21
T22
T 2.
T..=A11+A12+A21+A22
列总合T.j
其中Aij为实际观察次数,Tij为理论次数。
【例6.3】 某猪场用80头猪检验某种疫苗是否有预防效果。结 果是注射疫苗的44头中有 12 头发病,32头未发病;未注射的36 头中有22头发病,14头未发病,问该疫苗是否有预防效果? 1、先将资料整理成列联表
第六章 次数资料的统计分析( χ 检验)
2
主要内容
• 卡方检验适用资料 • 适合性检验 • 独立性检验
χ2检验适用资料及χ2值
检验适用于次数资料。所谓次数资料是指在一个总体( χ2检验适用于次数资料。所谓次数资料是指在一个总体(群 体、样本)中,个体的性状有两种以上的不同属性类别,通过 样本) 个体的性状有两种以上的不同属性类别, 数数的方法获得不同属性类别的个体数,例如: 数数的方法获得不同属性类别的个体数,例如: (1)在一个确定大小的人群中,我们能够确切知道男性 在一个确定大小的人群中, 和女性两个性别的人数; 和女性两个性别的人数; (2)用同样的治疗方法(药物)治疗一种疾病,我们可 用同样的治疗方法(药物)治疗一种疾病, 以确知治愈、好转、无效、死亡等人数; 以确知治愈、好转、无效、死亡等人数; (3)用不同的药物治疗同一种疾病,我们也可以确知各 用不同的药物治疗同一种疾病, 种药物治愈、好转、无效、死亡等人数。 种药物治愈、好转、无效、死亡等人数。
适合性检验
判断实际观察的属性类别分配是否符合已知属性类别分 配理论或学说的假设检验称为适合性检验。
在适合性检验中, 无效假设为H0:实际观察的属性类别分配符合已知属性类别 分配的理论或学说; 备择假设为HA:实际观察的属性类别分配不符合已知属性类 别 分配的理论或学说。 在无效假设成立的条件下,按已知属性类别分配的理论或学 说计算各属性类别的理论次数。
2 c
(| 22−15.3| −0.5)2 + =7.944 15.3
5、 作出统计推断
2 2 因为χ20.01(1) = 6 . 6 3,而 χc =7.944>χ20.01(1),P<0.01, χc
否定H0,接受HA,表明发病率与是否注射疫苗极显著相关,这 里表现为注射组发病率极显著低于未注射组,说明该疫苗是有 预防效果的。 在进行2×2列联表独立性检验时,还可利用下述简化公式计 算:(不需要计算相应的理论次数)
4、计算
(| 2 χC =Σ
A−T| − .5 2 (|1 1− 9 | − .5 2 (| 7 −6 | − .5 2 0 ) 8 15 0 ) 9 5 0 ) = + =37 9 .3 T 15 9 6 5
可以列表计算:
性 状
实际观察次数 理论次数(T) A-T (A) 181 79 260 195 65 260 -14 +14 0
类 型 黑色无角牛 黑色有角牛 红色无角牛 红色有角牛 总 计
实际观察次数A 192(A1) 78(A2) 72(A3) 18(A4) 360
理论次数T 202.5(T1) 67.5(T2) 67.5(T3) 22.5(T4) 360
A-T -10.5 +10.5 +4.5 -4.5 0
(A-T)2/T 0.5444 1.6333 1.6333 0.9000 4.711
2 χc
白 色 黑 色 总 和
0.935 2.804 3.739
2、查临界χ2值,作出统计推断 当自由度 df=1 时, 查 得
χ20.05(1) =3.84,计算的
χ2c<χ20.05(1),P>0.05,不能否定H0,表明实际观察次数与理论
次数差异不显著,可以认为白色羊与黑色羊的比率符合孟德尔 遗传分离定律3∶1的理论比例。
2×c联列表一般形式 行总和 1 1 2 列总和 T. j 2
A12
A22
… … … …
c
A1C
Ti .
A11
A21
T .1
T1 .
T2 .
总总和 T ..
A2c
T.c
T .2
其中(i=1,2;j=1,2,…,c)为实际观察次数。
Байду номын сангаас
【例6.4】 在甲、乙两地进行水牛体型调查,将体型按优、良、 中、劣 四个等级分类,其结果见下表,问两地水牛体型构成比 是否相同。
【例6.2】 在研究牛的毛色和角的有无两对相对性状分离现 象时 ,用黑色无角牛和红色有角牛杂交 ,子二代出现黑色无角 牛192头,黑色有角牛78头,红色无角牛72头,红色有角牛18头, 共360头。试 问这两对性状是否符合孟德尔遗传规律中 9∶3∶3∶1的遗传比例?
1、提出无效假设与备择假设 H0:实际观察次数之比符合9∶3∶3∶1的理论比例。 HA:实际观察次数之比不符合9∶3∶3∶1的理论比例。 2、选择计算公式 由于本例的属性类别分类数 k=4:自由 度df=k-1=4-1=3>1, 故利用非矫正公式计算χ2。 3、计算理论次数 依据各理论比例9:3:3:1计算理论次数:
2、选择计算公式
χ2
由于本例是涉及到两组毛色(白色与黑色),属性类别分类 数k=2,自由度df=k-1=2-1=1,须使用矫正公式来计算 3、计算理论次数 根据理论比率3∶1求理论次数: 白色理论次数:T1=260×3/4=195 。
χ2 黑色理论次数:T2=260×1/4=65 或 T2=260-T1=260-195=65
自由度: 因所计算得的各个属性类别理论次数的总和应等于各个属 性类别实际观察次数的总和,即独立的理论次数的个数等于 属性类别分类数减1。 也就是说,适合性检验的自由度等于属性类别分类数减1。 若属性类别分类数为k ,则适合性检验的自由度为k-1。
统计推断: 若χ2 (或χ2c)<χ20.05,P>0.05,表明实际观察次数与理论次数 差异不显著,可以认为实际观察的属性类别分配符合已知属性 类别分配的理论或学说; 若χ20.05≤χ2 (或χ2c)<χ20.01,0.01<P≤0.05,表明实际观察次数 与理论次数差异显著,实际观察的属性类别分配显著不符合已 知属性类别分配的理论或学说; 若χ2 ( 或χ2c)≥χ20.01,P≤0.01,表明实际观察次数与理论次数差 异极显著 ,实际观察的属性类别分配极显著不符合已知 属性类 别分配的理论或学说。
T11=44×34/80=18.7, T12=44×46/80=25.3, 或 T12=44-18.7=25.3; T21=36×34/80=15.3, 或 T21=34-18.7=15.3; T22=36×46/80=20.7, 或 T22=36-15.3=20.7
2 4、计算 χc 值
(|12−18.7| −0.5)2 (| 32−25.3| −0.5)2 χ= + 18.7 25.3
5、作出统计推断 当df=3时,χ20.05(3)=7.81,因 χ2<χ2005(3) ,P>0.05,不能否定 H0 ,表明实际观察次数与理论次数差异不显著,可以认为毛 色与角的有无两对性状杂交二代的分离现象符合孟德尔遗传规 律中9∶3∶3∶1的遗传比例。
独立性检验
对次数资料,除进行适合性检验外,有时需要分析两类 因子是相互独立还是彼此相关。 如研究两类药物对家畜某种疾病治疗效果的好坏,先将 病畜分为两组,一组用第一种药物治疗,另一组用第二种 药物治疗,然后统计每种药物的治愈头数和未治愈头数。
【例6.1】 在进行山羊群体遗传检测时,观察了 260只白色羊与黑色羊 杂交的子二代毛色,其中181只为白色,79只为黑色,问此毛色 的比率是否符合孟德尔遗传分离定律的3∶1比例?
检验步骤:
1、提出无效假设与备择假设 H0:子二代分离现象符合3∶1的理论比例。 HA:子二代分离现象不符合3∶1的理论比例。