卫生统计学第九章 分类变量的检验
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二节 率的比较
2 对上述2×3列联表,作 检验:
(1)建立检验假设,确定检验水准
H
H
0
:
:
大骨节病区男、女性的膳食结构相同
1
大骨节病区男、女性的膳食结构不全相同
α=0.05 (2)检验统计量的选择与计算
( Aij Tij ) 2 Tij
2 i 1 j 1
R
C
=2.53
(3)确定 P 值,作出统计推断
(2)检验统计量的选择与计算
2
AT
2
T (7 8.00)2 (9 8.00)2 (24 23.00) 2 (22 23.00) 2 + 0.34 8.00 8.00 23.00 23.00
(3)确定 P 值,作出统计推断
2 2 =(2-1)×(2-1)=1, 0.025,1 = 5.02,可知 =0.34<5.02,则P >0.025,在 自由度
(3)确定 P 值,作出统计推断
2 2 0.05,1 =3.84。本例 =14.82>3.84,即P<0.05。在 α=0.05水平上拒绝H ,接受H 。可
0
1
以认为两个病区大骨节病的检出率之间差别具有统计学意义,且泉水饮用区的检出率较高。
第二节 率的比较
2 检验适用条件:
(1)若n ≥ 40,且任意一个格子的理论频数Tij ≥ 5,可直接使用 检验公式。
第二节 率的比较
2 3. 分割
多个率或多个频率分布比较的 检验,当结论为拒绝 H 时,仅表示多组之间是有差别的。
2
0
若需明确究竟是哪两组之间存在差别,可做率的多重比较,将R×C表分割为若干个小的四格表 进行检验。但在具体分割过程中,需根据比较的次数合理地修正检验水准α ,否则将人为地增大 犯第Ⅰ类错误的概率。
2 2 2 =3.84 。 =1时,0.05,1 分布右侧尾部面积(概率)为 α 时的临界值记为 . ,列于 界值表。当
2 第一节 检验的基本思想
(3) 分布的期望值(均值)为自由度,方差为2 。随着自由度 的增
2
2 分布将随均值的增大向数轴右侧延伸,而分布曲线也将随方差 2 的增大 大,
结果如下:
1. NOC组和DON组比较
DON组和NOC组致小鼠肝脏组织组织大片脂肪变性比较
第二节 率的比较
(1)建立检验假设,确定检验水准 H 0 : 1 2,即DON组和NOC组肝脏脂肪变性发生率相同 H 1 : 1 2,即DON组和NOC组肝脏脂肪变性发生率不同
α= 0.025
α=0.025水平上不拒绝H 0 ,尚不能认为DON组和NOC组脂肪变性的检出率不同。
第二节 率的比较
2. (NOC+DON)组与DON组进行比较
DON组和(NOC+DON)组致小鼠肝脏组织组织大片脂肪变性比较
第二节 率的比较
(1)建立检验假设,确定检验水准
H : 1 2,即DON组和(NOC+DON)组肝脏脂肪变性发生率相同 H : 1 2,即DON组和(NOC+DON)组肝脏脂肪变性发生率不同
n1 m1 ab ac 变量 1 的阳性率= n = n ;变量 2 的阳性率= n = n 。 变量 1 的阳性率 - 变量 2 的阳
性率=
ab ,同样提示两个变量阳性率的比较只和 n
b、c 有关,而与 a、d 无关。
在原假设H 0 成立的条件下,b 与 c 两个格子理论频数都应该为 (b+c)/2。当 b c 40 时,
2 (一) 统计量
2 1. 检验的基本思想
例1 为比较不同大骨节病区的大骨节病检出情况,分别随机抽取河水饮用区
377人,泉水饮用区301人,采用X光拍片进行大骨节病诊断。结果见表9-1。现 检验两个病区的大骨节病检出率是否不同?
不同病区的大骨节病检出情况
地区 河水饮用区 泉水饮用区 合计
检出 75 99 174
2 第一节 检验的基本思想
2 (二) 分布的性质
2 1. 分布
2 分布是一种连续型随机变量的概率分布,自由度 是其唯一参数,记为
2
( )
。
4种自由度 分布的概率密度曲线
2
2 第一节 检验的基本思想
2 2. 分布的性质
2 (1) 分布也可看作一种特殊的抽样分布。 2 2 2 (2) 分布是一簇连续光滑曲线,不同自由度的 曲线形状各有不同。各种自由度取值下
越趋低阔。 (4) 检验的基本思想实质是将对两个或多个总体率(构成比)的比较转
2
化为实际频数与理论频数吻合程度的比较。
第二节 率的比较
第二节 率的比较
2 (一) 2×2交叉表数据的 检验
2 结合例1,四格表 检验基本步骤为:
(1)建立检验假设,确定检验水准
H : 1 2 ,即河水饮用区和泉水饮用区大骨节病的总体检出率相同
第二节 率的比较
1. 多个构成比的比较
例2 比较大骨节病区男、女性的膳食结构是否存在差异,研究组对病区555名男性,819名
女性大骨节病患者的膳食结构进行调查。数据整理如下。
大骨节病区男性和女性主食情况比较 性别 男 女 合计 大米 157 216 373 糌粑 212 348 560 外地面 186 255 441 合计 555 819 1374
T12 nC 2 (
T22 nC 2 (
n n nR1 377 504 ) R1 C 2 =280.25 n n 678
nR 2 n ) nR 2 nC 2 n 301 504 678 =223.75
四格表中所有格子Aij 的Tij 和之间的差异,可用式(9-1)计算的统计量来衡量:
2 如:原有检验水准α=0.05,若进行组数 k 为 3 的两两比较,需比较 C3 =3次,故调整后的水
准 α'=0.05/3=0.0167;若设置一个共用对照进行3组比较,则只需(k-1)= 2次,调整后的水准 α'
=0.05/2=0.025。
第二节 率的比较
2 现将例3中的DON组设置为共用对照,以下表为例介绍 分割的过程。
0 1
α = 0.025 (2) 检验统计量的选择与计算 2 A T 2
T (7 13.78)2 (24 17.22)2 (21 14.22)2 (11 17.78)2 + 11.82 13.78 17.22 14.22 17.78
(3)确定 P 值,作出统计推断
2 自由度 =(2-1)×(3-1)=2, 0.05,2 = 5.99,则 P >0.05,在α=0.05水平上
不拒绝 H 0,尚不能认为大骨节病区男女膳食结构不同。
第二节 率的比较
2. 多个率的比较
例3 为研究NOC(N-亚硝基化合物)和DON(脱氧雪腐镰刀菌烯醇)对小鼠肝脏的致病 作用,将94只小鼠随机分配到NOC组、DON组和(NOC+DON)组,染毒剂量分别为:NOC:
未检出 302 202 504
合计 377 301 678
检出率(%) 19.89 32.89 25.66
2 第一节 检验的基本思想
独立样本数据2×2交叉表
组别 甲 乙 合计
属性
属性1 A11 (T11) A21 (T21) 属性2 A12 (T12) A22 (T22)
合计
nC1
nC1
nR1 nR1 n
其中, Aij (i,j =1,2)为实际频数,Tij (i,j =1,2)为理论频数
2 第一节 检验的基本思想
2. 理论频数
T11 nC1 (
T21 nC1 (
n n nR1 377 174 ) R1 C1 =96.75 n n 678
n n nR 2 301174 ) R 2 C1 =77.25 n n 678
可进行简单推导:
2
(A T) T
2
(b
bc 2 bc 2 ) (c ) (b c) 2 2 2 bc bc bc 2 2
i 1 j 1 R C
( Aij Tij ) 2 Tij
=2.53
(3)确定 P 值,作出统计推断 2 2 2 自由度 =(3-1)×(2-1)=2, 0.05,2 = 5.99, =14.29> 0.05,2 ,则P<0.05,在 α=0.05水
H 1,可以认为三组脂肪变性的发生率不全相同。 0 平上拒绝 H,接受
2
(2)若n ≥ 40,但出现1个格子的理论频数1 ≤ Tij < 5时,则需对值按以下公式 进行连续) T
(3)若n < 40或者任意一个格子的理论频数Tij < 1 时,则检验不再适用,宜 采用 Fisher 确切概率法进行处理。
第二节 率的比较
第九章 分类变量的检验
目录
01
2 第一节 检验的基本思想
02
03
第二节 率的比较 第三节 独立性检验 第四节 拟合优度检验 第五节 确切概率法
04
05
重点难点
2 ※ 独立样本列联表资料的 检验
2 ※ 配对设计资料的 检验
※ 四格表的Fisher确切概率法
第一节 检验的基本思想
2
2 第一节 检验的基本思想
2 (二) R×C交叉表数据的 检验
1. 用于推断3个以上的总体率(或构成比)之间的差异
2 2. 与2×2交叉表 检验比较不同之处:
(1)理论频数 Tij 的公式可泛化为:
2
i 1 j 1
R
C
( Aij Tij ) 2 Tij
(2)可直接使用下面公式 计算统计量:
nR i nC j Tij (i 1, 2,, R; j 1, 2,, C) n
0.25mg/kg;DON:0.5mg/kg;NOC:0.25mg/kg + DON:0.5mg/kg,60天后观察小鼠肝脏
出现大片脂肪变性的数量,整理结果如表所示。现比较3种处理对小鼠肝脏的影响。
3种处理致小鼠肝脏组织大片脂肪变性的比较
组别
DON组 NOC组 (NOC+DON)组 合计
病变
7 9 21 37
0
H : 1 2 ,即河水 饮用区和泉水饮用区大骨节病的总体检出率不同
1
α= 0.05
第二节 率的比较
(2) 检验统计量的选择与计算
2
A T
2
T (75 96.75)2 (302 280.25)2 (99 77.25)2 (202 223.75)2 14.82 96.75 280.25 77.25 223.75
2 1. 配对四格表 检验
例4 为比较间接酶联免疫法和双抗原夹心酶联免疫法对丙肝病毒(HCV)抗原的诊
断性能,某检验室将135名血清样本一分为二,分别进行两种试剂盒检测,结果 见下表。现比较两种检测方法的结果是否不同?
间接法和夹心法检测结果
第二节 率的比较
配对四格表的通用表格如表所示
配对四格表的一般格式
2 2 自由度 =(2-1)×(2-1)=1, 0.025,1 = 5.02,可知 =11.82>5.02,则P<0.025,在 α=
0.025水平上拒绝 H ,接受 H 1,即可认为DON组和(NOC+DON)组脂肪变性的检出率不同。
0
第二节 率的比较
2 (三)配对设计数据的 检验
非病变
24 22 11 57
合计
31 31 32 94
病变率(%) 22.58 29.03 65.63
39.36
第二节 率的比较
(1)建立检验假设,确定检验水准 H : 三组脂肪变性的总体发生率相同
0
H : 三组脂肪变性的总体发生率不全相同 α= 0.05
1
(2)检验统计量的选择与计算
2
2
i 1 j 1
0
2
2
( Aij Tij ) 2 Tij
(i 1, 2; j 1, 2)
2 H 成立时,统计量 服从自由度为 1 的分布。自由度的计算公式为: 可以证明, (行数-1) (列数-1) 。上面公式可简化为:
2
A T
T
2
表中的实际频数分别为: a=80为两种检测方法均阳性的对子数,d=10为两种检测方法均阴 性的对子数,很显然,a 与 d 都不能反映两种检验方法的差别。而 b=15 和 c=30 则是两种检测 方法检验结果不一致的对子数,故两种方法的检测结果有无差别就体现在 b 和 c 这两个对子数。
第二节 率的比较