计数资料的统计分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Fisher确切概率法的应用范围

当四格表中由理论频数小于1或n≤40时,宜用
四格表的确切概率法;

当 2检验所得概率P略大于a时,应用Fisher确 切概率法。
实例
两种药物治疗某病结果见下表,试比较其差别有
无显著性。 表
组别 旧药 新药 合计
两种药物治疗某病结果比较
治愈 2(3.2) 4(2.8) 6 未愈 5(3.8) 2(3.2) 7 合计 7 6 13
缺点:①不利于保密;②不便于比较
表 某季度甲、乙两部队的感冒发生情况 部别 总人数 发病人数 发病率(%)
甲部队
乙部队 合计
1834
1313 3147
58
42 100
3.16
3.20 3.18
相对数指标(relative number ):有联系的两个 指标之比。
意义:便于表达事物出现的普遍程度;
率与构成比
率 构成比 发生的频率或强度 各组成部分所占的比重 随机发生事件 各部分的构成
概念 强调点
资料获得 特点
较难 不一定
容易 合计为100%
率与构成比的例子
年龄 组 ⑴ 40~ 50~ 60~ 70~ ≥80 合计 受检 人数 ⑵ 560 441 296 149 22 1468 白内障 例数 ⑶ 68 129 135 97 19 448 患者年龄构 患病率(%) 成比(%) ⑸=(3)/(2) ⑷ 15.18 12.14 28.79 29.25 30.13 45.61 21.65 65.10 4.24 86.36 100.00 30.52
防护服种类
阳性例数 1 10 11
阴性例数 14 18 32
患病率(%) 6.7 35.7 25.6
1.H0:π1=π2,两组工人的皮肤炎总体患病率相同; H1:π1≠π2,两组工人的皮肤炎总体患病率不同。 α=0.05。 2.求理论频数:T11=(11×15)/43=3.84,同理T12=11.16, T21=7.16 ,T22=20.84 本例有1个理论频数1<T<5,而且N>40, 应用校正公式。
组工人的皮肤炎患病率有差别。

若不进行校正,用公式:
(ad bc) N (a b)(c d )(a c)(b d )
2 2


1 18 14 10 2 43 得出: 2 1 14 10 18 1 10 14 18
=4.33 P<0.05,结论正好相反。可见,校正是必要 的。

(四)四格表资料的Fisher确切概率法
四格表确切概率法的基本思想是:将四格表的周边 合计固定不变后,表内四个实际频数之组合数共有“周 边合计中的最小数+1”个,各组合出现的概率服从超几
何分布,概率和为1,其概率按下式计算:
(a b)!(c d )!(a c)!(b d )! P a!b!c!d!n!
(如 2 02.05 ) ,则P<0.05,说明实际频数与理论
频数的较大差别是由抽样误差所引起的可能性很
小,有理由拒绝H0 ,接受H1( H1 :п1≠п2 )

是一种用途较广的假设检验方法,它是利用
χ2分布(Chi-square distribution)的原理
进行统计检验;

用于计数资料;
比(ratio):比值, 两个相关指标之比,说明 两个指标的对比关系。两个指标可以是同类的, 也可以是不同类但有联系的。 比= 甲现象的数量 (或×100%)
乙现象的数量
比通常用倍数或分数表示。 如:男:女、医生:护士、教师:学生
三、应用相对数的注意事项
根据需要正确选择相对数 在相对数中,最容易混淆的是 率(强度相对数)与构成比(结构相对数)。常见错误是以 构成比代率。

X1
X2

n11
n21

n12
n22

„ „ „ „
XR
n R1
nR 2
n RC
2检验 四格表资料的χ
一、两样本率比较
问题:某医师用两种方法治疗慢性乙型肝炎的 疗效见表,问两组疗效间有无显著差别? (能否直接从数字下结论?风险?)
表1 两种方法治疗慢性乙型肝炎的疗效比较


有效数 51 27 78
把基数标准化,便于相互比较和保密。
表1 药名 甲药 某药物治疗效果 治愈人数 120 治愈率(%) 80.00 治疗人数 150
乙药
丙药 合计
200
300 650
150
180 450
75.00
60.00 69.23
二、几种常用的相对数
率(rate):强度相对数或频率,它是一定时期或 一定范围内某现象的实际发生数与可能发生该现象 的总数之比,反映某一现象发生的频率或强度。
原因:χ 2分布是连续的光滑曲线。大样本 (当N 值大)时,计算得到的χ 2值相应的概 率P与真正的概率比较接近;但当样本含量 较小,尤其在自由度为1时,所得到的χ 2值 偏大,相应的概率偏低。因此,需作连续性 校正。
连续性校正方法
1、有一理论频数为1<T<5且N>40时需用校正公式
计算χ2值;
2、当用未校正公式计算出的χ2值略大于3.84时,需用
肝炎灵注射液 常 规 疗 法 合 计
1.列四格表
组 别 肝炎灵注射液 常 规 疗 法 合 计 有 效 无 效 合计 51 42.16) 9(17.84) ( 60 27 35.84) 24(15.16) 51 ( 78 33 111
四格表资料(fourfold table),也称2×2表资料
2.建立检验假设,确定检验水准
组 别 肝炎灵注射液 常 规 疗 法 合 计
有 效 无 效 51(a) 9(b) 27(c) 24(d) 78 33
合计 60(a+b) 51(c+d) 111(N)
(51 24 9 27 ) 2 111 2 13.562 78 33 60 51
(三)四格表资料的连续性校正公式
用于两个或两个以上样本率(或构成比)之
间的比较,两因素间的相关分析等;
问题:某医师用两种方法治疗慢性乙型肝炎的 疗效见表,问两组疗效间有无显著差别? (能否直接从数字下结论?风险?)
表1 两种方法治疗慢性乙型肝炎的疗效比较

法(%) 9 24 33 60 51 111 85.00 52.94 70.27
确切概率计算法。 3、当T<1或N<40时,需用确切概率计算法。
χ2连续性校正公式
( A T 0.5) T
2 2

2
( ad bc N / 2) N
2
(a b)(c d )( a c)(b d )
连续性校正是一种保守的方法
实例
新 旧 合 计
穿新旧两种防护服工人的皮肤炎患病率比较
甲、乙两医院的治愈率
计数资料的统计推断
Analysis Statistics
什么是列联表
列联表(contingency table)是将每个观察个体按 两个或两个以上的属性(分类变量)交叉分类时形成的 频数表。
表 6-1 按照两个变量 X 和 Y 分类的 R×C 表
Y1
Y2

YC n1C
n2C
常用医学统计方法
Medical Statistics
计数资料的统计描述
Descriptive Statistics
一、基本概念
统计指标是统计分析的基本依据, 在医学统计学中常用的统计指标有:总 量指标、相对数指标、平均数指标和变 异指标。
总量指标(绝对数指标):是统计分组 汇总后小计或总计的绝对数,用以反映事物 在一定条件下的规模和水平。
3.求χ2值:
( 118 - 14 10 43 / 2) 43 2.94 15 28 11 32
2 2

4.求自由度
ν=(2-1)(2-1)=1
5.定P值,作结论 查表得χ20.05,1=3.84。χ2<χ20.05,1,P>0.05,在
=0.05 水准处不拒绝H0。故不能认为穿不同防护服的两
理论频数计算公式
TRC
nR nC N
4.计算χ2值
计算χ2值的基本公式为:
可见χ2值能反映实际频数与理论频数差别的大小,χ2越 大,说明实际频数与理论频数的差别越大,反之亦然。
(51 - 42.16) 2 (9 - 17.84) 2 (27 - 35.84) 2 (24 - 15.16) 2 2 42 .16 17 .84 35.84 15.16 1 1 1 1 8.84 ( ) 42 .16 17 .84 35.84 15.16 13 .569
(A T) T
2
2
5.定自由度
自由度(由于分布中涉及自由度问题)是指 计算某一统计量时能自由取值的变量个数。 ν=(R-1)(C-1)
式中:ν为自由度,R为行数,C为列数。对四格表, ν=(2-1)(2-1)=1。
6.定P值,作结论
χ20.05,1=3.84, χ20.01,1=6.63。 χ2>χ20.01,1,P<0.01
无效数 合计 有效率(%) 9 24 33 60 51 111 85.00 52.94 70.27
肝炎灵注射液 常 规 疗 法 合 计
(一)χ2检验的基本思想和基本公式

Χ2检验是判断实际频数和理论频数的差别是否由
抽样误差所引起,χ2值的大小反映了实际频数与
理论频数的吻合程度。在H0( H0 :п1=п2)成 立的条件下,实际频数与理论频数相差不应该很 大,即χ2值不应该很大,若计算得到的χ2值很大, 超过了事先设定的检验水准所对应的χ2界值
分母应当够大
如果分母太小,宜用绝对数表示,
如“4例全部治愈”,“3例中死亡1例”等。
注意是否具有可比性 在比较相对数时,除了要对比的因素,其余的影响因 素应尽可能相同或相近。 • 研究对象要同质,方法要相同,观察时期要一致;


地区、民族等客观条件是否相近;
内部构成是否相同或相近。
样本率或构成比的比较应建立在随机抽样的基础上, 并要作假设检验。
用二种不同的免疫学检测方法检验类风湿因子。 (配对实验)
两种血清免疫学检测结果
A法 + 合计
B法 + 172 8 12 68 184 76
反之, χ2<χ20.01,1,P>0.01 本例拒绝H0,从而接受H1,即认为两总体有 效率是不相等的,可以得出结论肝炎灵注射液治 疗慢性乙型肝炎的有效率较高。
(二)四格表专用公式
a c
2
b d
(a b) (c d )
N
2
(a c) (b d )
(ad bc) N (a b)(c d )( a c)(b d )
二、配对四格表资料的χ2检验
设计类型
对一组观察对象,同时按照两个二 项分类的特征进行交叉分类,分别观察其两种 分类变量的表现,这种资料从实验设计上属配 对设计,称为2×2交叉分类资料。
计数资料的配对设计常用于:两种检验方法、 培养方法、诊断方法、治疗方法的比较。
实例 有260份血清样品,每份样品一分为二,
H0:π1=π2。 H1:π1≠π2。 取α=0.05。
3.推算理论频数
本例中可由合计治疗111人中有效78人算得 理论上的有效率为78/111=70.27%。根据这个有 效率可计算各组中理论上的有效人数:
肝炎灵注射液组

常规疗法组
T11=60×70.27%=42.16 T12=60-42.16=17.84 T21=51×70.27%=35.84 T22=51-35.84=15.16
表 2-3 职业 人数 发病率(%) 工人 1792 42.5 农民 754 17.9 各种职业砂眼患者就诊情况 学生 920 21.8 干部 320 7.6 其他 432 10.2 合计 4218 100.0
计算观察单位数不等的几个率的平均率时不能将几个率 直接相加求平均率
正确选择分母 计算率(强度相对数)时,分母中的每 一观察单位应当都有可能成为分子。
某现象的实际发生数 率= ×比例基数 可能发生该现象的总数
比例基数:100%、1000‰、10000/万、100000(1/10万)等
如:发病率、死亡率、发生率、阳性率、患病率等
构成比( proportion):结构相对数、百分比,
某现象内部各个构成部分所占的比重或分布。
构成比= 某一构成部分的数量 ×100% 各构成部分数量之和 构成比常以100为基数,各构成部分构成比之和必须为 100% 。
相关文档
最新文档