计数资料统计描述与推断

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

反映用药与疗效、性别与疗效的关系。
4. 等级资料的频数表
某药物疗效的频数表
治疗结果 频数 频率% 累计频数 累计频率%
治愈
43
43.3
43
43.3
好转
无效 恶化 合计
பைடு நூலகம்
30
17 10 100
30.3
16.7 10.0 100.0
73
90 100 ——
73.6
90.0 100.0 ——
二、计数资料的统计描述
HCC 非HCC 合计
56 39 95
(3)行×列表资料的2检验
行×列表


2

(A T ) T
2
2
经推导,
N(
A
2
n R n C
1)
列联表注意事项:
1.理论数不能小于1;理论数在1~5间的格子数 不能多于1/5的总格子数。 2.多个样本率比较,若所得结论为拒绝H0,接受 H1,只能认为各总体率之间总的来说有差别, 但不能说明任两个总体率之间皆有差异。 3.对于有序的R×C表资料不宜用χ2检验。
(二)统计表和统计图
表 四项检测指标异常检出率
指标 受检人数 异常人数 检出率(%) 血压 100 10 10.0 心率 100 5 5.0 心电图 100 7 7.0 血糖 100 4 4.0
12 10
检 出 率 (%)
8 6 4 2 0 血压 心率 心电图 血糖

四项生理指标异常检出率
表 某年某地1560例后天性聋哑病因构成情况
患病率 (%) 49.268 73.203 59.497
(2)配对资料的2检验
甲 乙 + a c
2
+ -
b d
(b c ) bc (| b c | 1) bc
2 2
b c 4 0时 , b c 4 0时 ,
2 校正
例1 用甲乙两种方法检查已确诊的胰腺 癌病人120例,结果如下表。问两种方 法检出结果是否有差异? 甲乙两法对胰腺癌的检出结果
重最小,而98年所占比重最大
根据表(6)栏可见:以93年为基数,以后各年度
的病死率与93年的比较的倍数基本是(98年除外)
越来越大
4. 动态数列
一系列按时间顺序排列起来的统计
指标,用以观察和比较该事物在时间上的
变化和发展趋势。
绝对增长量,发展速度与增长速度
,平均发展速度与增长速度。
绝对增长量
• 一定时期内增长的绝对值 • 累计增长量:报告期与基期之差 • 逐年增长量:报告期与前一期之差
2.率(rate):又称频率指标,说明某现象发生的频 率或强度。
强度相对数的特点
• 分子是发生某现象的观察单位数,分母是可能
发生某现象的观察单位总数
• 比例基数:习惯;便于阅读;便于比较
3.相对比(ratio):反映指标间的相对水平
,即增加了/增加到、减少了/减少到、一
成/两番
甲指标 乙指标
相对比
pc
X1 X 2 n1 n2
(三)卡方检验
(1)四格表资料的2检验
+ a c a+c 合计 b a+b d c+d b+d n=a+b+c+d
甲 乙 合计

2


(A T ) T
2

2
2
( ad bc) n ( a b )( c d )( a c )(b d )
Fisher确切概率法 当n<40,或T<1时,用Fisher确切概率法
• 例:某医师进行高血压子代患病率调查,结果如下 表。试问两组的高血压患病率是否一样? 两组子代的高血压患病率
患病 人数 父或母患病组 父母均患病组 合计 101 112 213 未患病 人数 104 41 145
合计
205 153 358
X3 A B A B B
X4 11.27 12.53 10.93 14.67 16.80
X5 37.5 37.0 36.5 37.8 37.6
X6 显效 有效 有效 无效 无效
一、计数资料的整理
1.按一个分组因素分类计数的频数表
病种 病例数 单纯原发性高血压 52 继发性高血压 33 原发性高血压合并心脏病 10 其他 5 合计 100
发展速度与增长速度
• 相对比,说明事物在一定时期内的变化速度
• 发展速度:定基比—报告期与基期之比
环比—报告期与前一期之比
• 增长速度:定基比增长速度,环比增长速度
• 增长速度=发展速度-1
• 平均发展速度:各环比发展速度的几何平均
数,表示逐期平均发展的速度
平均发展速度= n an a0
• 平均增长速度:各环比增长速度的平均数, 表示逐期平均增长的速度
威胁最大,况且,构成比的大小还受到其它组成部分的影响
,所以不能因为结构百分比最大,就得出“50~岁组死于恶 性肿瘤的威胁最大”的结论。
分母不能太小 合并率(总率)的计算 注意资料的可比性 除研究因素外,其余的重要因素应相同或相近。 • 对象性质,研究方法,观察时间及环境条件等方面的可
比性
714
748 942 1095
12
16 21 24
1.68
2.14 2.23 2.19
13.2
17.6 23.0 26.4
1.23
1.56 1.63 1.60
合计
4654
91
1.96
100.0
——
根据表(4)栏分析:1993年~1998年间损伤与中毒
病死率呈逐年上升趋势,1998年略有下降
根据表(5)栏可见,93年病死数占病死总数的比
病名 高烧抽风 传染病 中耳炎 脑膜炎 其它 合计 例数 434 264 193 101 568 1560 百分比(%) 27.8 16.9 12.4 6.5 36.4 100.0

某地1560例后天性聋哑各类 病因构成圆图
(三)应用相对数的注意事项
比与率不能混淆 • 患者的病种构成不同于发病率
• 两个合计(总)率的比较,其内部构成必须相同或相近 。否则,各组成部分分别比较或对内部构成进行标准化 处理
两种疗法疗效比较
治疗 分组
成人组 儿童组
旧疗法
治疗人数 治愈人数 100 200 50 20 治愈率(%) 50.0 10.0
新疗法
治疗人数 治愈人数 200 100 100 10 治愈率(%) 50.0 10.0
• 患者的死因构成不同于病死率
例 某县1996年各年龄组恶性肿瘤死亡情况统 计见下表,试作简要分析。 表 某县1996年恶性肿瘤死亡统计
年龄组 (1) 0~ 15~ 30~ 50~ ≥70 人口数 (2) 356980 232505 205032 121882 20047 死亡数 (3) 11 22 142 443 107 构成比(%) 死亡率(1/10万) (4) 1.5 3.0 19.6 61.1 14.8 (5) 3.1 9.5 69.3 363.5 533.8
合计
936446
725
100.0
77.4
(1)随着年龄的增大,死亡率逐渐升高,即年龄愈大,恶性 肿瘤的死亡强度愈高。由于死亡率是强度相对数,各年龄组 的死亡水平由该年龄组发生的例数所决定,故不受其他年龄 组死亡数的影响。 (2)在恶性肿瘤的死亡人数中,50~岁组人数最多,占的比重 最大,为66.1%。但并不意味着该年龄组人死于恶性肿瘤的
,进行假设检验。根据检验结果,结合专
业知识,得出研究结论。
在同一个总体中随机抽取含量相同的若干个样本, 各样本率之间往往是不同的,且与总体率之间也有一 定的误差,这种由于抽样所造成的样本率之间及样本 率与总体率之间的差别称为率的抽样误差。
率的抽样误差大小可由率的标准误来衡量。当π与 n已知时,率的标准误由下式计算:
计数资料统计描述与推断
计数资料的统计分析
一、资料的整理:频数表、交叉表 二、资料的描述:统计量、统计表、统计图 三、统计推断:χ2检验、u检验
表 100例高血压患者治疗后临床记录
患者 编号 年龄 性别 治疗组 舒张压 体温 疗效
1 2 3 4 ┆ 100
X1 37 45 43 59 54
X2 男 女 男 女 男
10.0 23.3
50
20 70
50.0
10.0 36.7
50
20 70
以旧疗法组病人构成为标准构成
新旧两种疗法的标准化治愈率(2)
治疗 分组 成人组 儿童组 合计 标准治 疗人数 旧疗法 原治愈 率(%) 50.0 10.0 23.3 预期治 愈人数 150 30 180 新疗法 原治愈率 (%) 50.0 10.0 36.7 预期治 愈人数 150 30 180
(一)统计量
绝对数:
相对数:强度相对数、结构相对数、 相对比、动态数列
1.构成比(proportion):又称构成指标,表示 事物或现象内部各组成部分的比重或分布。
某组成部分的观察单位数 各组成部分的观察单位总数
构成比
100%
结构相对数的特点
• 各组成部分构成比总和等于100%或1 • 各组成部分相互消长,不能同时都增大或都减小
表 1993~1998年某地损伤、 中毒病死率(%)与构成比(%)
年度 (1) 1993 1994 发病人数 (2) 584 571 病死人数 (3) 8 10 病死率 (4) 1.37 1.75 构成比 (5) 8.8 11.0 相对比 (6) —— 1.28
1995
1996 1997 1998

2 (校 正 )


( | A T | 0 .5) T
2

2
(| a d b c | ) n 2 2 (校 正 ) ( a b )( c d )( a c )( b d )
n
四格表注意
当n≥40且所有的T≥5时,用基本公式或四 格表专用公式
当n≥40但1≤T<5时,用校正公式,或改用
合计
300
70
23.3
300
110
36.7
标化法的基本思想
• 从表中的合计看,新疗法的治愈率比旧疗法高。但分别观 察成人组和儿童组的治愈率相同。其合计的差别之所以大 ,是由于两种疗法的选择的样本人群年龄构成不同。新疗 法成人所占比例高,而成人的治愈率高,造成总率较旧法
高。要正确比较两法的疗效,需按照统一标准进行校正,
2.按两个因素交叉分组的频数表
不同用药与疗效的关系 分组 疗效(Y) (X) 有效数 无效数 合计 用A药组 20 30 50 用B药组 10 40 50
3.两个以上因素交叉分组的频数表 不同用药、性别与疗效的比较
男 女
用药 有效 用A药组 20 用B药组 10
无效 10 15
有效 10 11
无效 10 14
率的u检验的应用条件为:
1.n较大,如每组例数大于60 例;
2.样本p或1-p均不接近于100%和0%;
3.np和n(1-p)均大于5。
1.单样本率的u检验
u p 0 p 0
p
0 (1 0 ) / n
2.两个率比较的u检验
u p1 p2 S p1 p2 p1 p2 pc (1 pc )(1/ n1 1/ n2 )
甲法 乙法 合计
+ 42
18 60
30
30 60
+
合计
72
48 120
例2 现对53例经标准化诊断为原发性肝癌(HCC) 病人和42例非原发性肝癌病人采用血清胎盘酸性 同功铁蛋白(PAIF)进行鉴别诊断,结果见下表 。问PAIF判断结果与标准诊断结果是否一样?
对原发性肝癌的鉴别诊断
PAIF诊断 标准诊断 HCC 非HCC 48 8 5 34 53 42 合计
例 某医师研究血型与胃、十二指肠溃疡间的关联性, 比较胃溃疡病人与十二指肠溃疡病人的血型分布, 结果见下表。 胃溃疡与十二指肠溃疡病人的血型分布
(1 )
n
p
如果总体率π未知,用 样本率p估计
sp
p(1 p) n
三、计数资料的统计推断
(一 )总体率的估计
1.点估计:类似于样本均数的点估计,直接用 样本p去估计相应的总体率,即 p 。 ˆ
2.区间估计:
(1)查表法:
(2)正态近似法:
(二)大样本率的假设检验
然后进行比较 • 当两组资料进行比较时,如果其内部不同小组率有明显差 别,而且各小组内部构成也明显不同 ,直接比较不合理
新旧两种疗法的标准化治愈率(1)
治疗分 组 成人组
儿童组 合计
标准治 疗人数
旧疗法
原治愈 率(%) 预期治 愈人数
新疗法
原治愈率 (%) 预期治 愈人数
100
200 300
50.0
300 300 600
以两组各部分病人之和为标准组
标准化注意事项
• 两组内部构成不同影响总率比较
• 选用标准不同,标化率会改变,但比较结
论相同。比较的两组应选用同一标准。
• 标准化率为两组的相对水平,不再反映实
际情况,只能用于比较
• 比较标准化率,也应作显著性检验
样本率(或构成比)的抽样误差
在随机抽样的前提下,估计抽样误差
相关文档
最新文档