计数资料的统计描述
计数资料的统计描述
A.频率指标 B.构成指标 C.相对指标 D.动态数列
多选题
7.对两个总率进行标准化时,主要目的是
A.消除内部构成的差异 B.使其在实际水平下进行比较
D.使其在共同标准下进行比较 D.反映各自的实际水平
E.反映各自的相对水平
8.使用相对数时应注意
A.计算相对数的分母不宜太小 B.不要把比作率分析
C.资料要具有可比性 D.资料内部构成不同应进行标准化
E.对率和比的比较应进行假设检验
9.某医师用某新疗法治疗了2例肺癌病人,均治愈,该医师报道,他所采
用的新疗法治愈率为100%,你认为有些不妥,应建议该医生
A.增大样本含量 B.报告绝对数 C.进行有对照的临床试验
D.与国外研究资料对比 E.与历史资料对照
10.构成比的特点有
A.各部分的构成比之和为100% B.各部分的构成比之和为1 C.某部分比重的增减可影响其他部分 D.每部分的构成比可大于1
E.具体计算时,有时受尾数的影响,其总和不等于1
11.关于率,以下哪几项是错误的
A.反映某现象发生的频率或强度 B.反映某事物内部的构成
C.表示两个同类指标之比 D.表示某现象在时间上顺序排
列
E.又称为频率指标或强度指标
12.描述计数资料的主要指标是
A.构成比 B.平均数 C.率 D.相对比 E.标准差(二)论述题
1.某地某年肿瘤普查资料整理如下表。
请填补表中空缺,并分析讨论哪个
年龄组最易患肿瘤?哪个年龄组病人最多?
实习表4-1 某地某年肿瘤普查资料
年龄(岁)人口数肿瘤患者数构成比(%)患病率(1/万)。
医学统计学计数资料的统计描述(一)
医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的统计描述
计数资料的统计描述第一节常用相对数一、绝对数定义:计数资料各类别的频数,即各分类事物的合计数。
如某病的出院人数、治愈人数、死亡人数等。
意义:绝对数反映出事物在某时、某地出现的实际水平,即实际发生的规模大小。
缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感染有150人,乙村钩虫感染有100人。
据此,我们只能说甲村钩虫感染较乙村多50人,但不能肯定甲村较乙村钩虫感染程度更为严重。
例2:甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义。
例3:如04级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义。
二、相对数定义:两个有关的绝对数之比,统称为相对数。
意义:1.消除基数影响,便于事物间的比较。
2.给出事物发生频率(强度)的估计。
3.相对数是工作决策的依据。
常用的相对数指标•例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。
高血压患病率为:(2823 / 8589 ) 100% = 32.87% 。
在实际工作中,“率”的应用非常广泛,如:发病率、死亡率、发生率、阳性率、患病率等。
当“率”的分母足够大时,常用“率”的大小表示某现象发生的概率。
第二节应用相对数的注意事项1. 计算相对数应有足够数量即分母不宜太小。
如果例数较少会使相对数波动较大。
如某种疗法治疗5例病人,5例全部治愈,则计算治愈率为5/5×100% =100%,若4例治愈,则治愈率为4/5×100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。
•在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示•但动物实验时,可以通过周密设计,严格控制实验条件,如毒理实验,每组用10只纯种小鼠也可以•分母到底多大才可以呢?要根据研究目的、研究指标而定2.不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误。
计数资料的描述和x2检验
(4)χ2界值
当自由度ν确定后,χ2分布曲线下右侧尾 部的面积为α时,横轴上相应的χ2值即为χ2
界值,表示为 χα2,ν 。
χ2界值可以通过查χ2界值表得到,当自 由度一定时,χ2值越大,P值越小;χ2值越 小,P值越大。
一、四格表资料的χ2检验
1。四格表资料(完全随机设计)
四格表的格式
分组 +
116
130
85
41
29
776
305
人口数
(ni)
241 315 175
农村 预期患病人数
( niPi)
51 145 115
58
42
789
353
④ 计算城乡两地的SMR及标准化患病率
城市SMR:
SMR = 322 = 1.05 305
城市标准化患病率: p ' = 42.1% ×1.05 = 44.2%
③ 求预期治愈人数
表5-5 直接法计算标准化率
标准治
甲疗法
病型 疗人数 原治愈率 预期治愈数
(Ni) (pi) ( Nipi)
普通型 400 60.0
240
乙疗法
原治愈率 预期治愈数
(pi)
65.0
( Nipi)
260
重型 400 35.0
140
41.7
167
合计 800
-
380
-
427
④ 计算甲、乙两种疗法的标准化治愈率
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
计数资料的统计描述
案例
《600例小儿烧伤休克期治疗分析》
600例烧伤患儿,210例早期有休克症状,其中 3岁以下者110例,占52%,3岁以上者100例, 占48%,年龄越小,休克发生率越高。
相对数
相对比 率 构成比
比(ratio) )
比又称相对比,是两个有关的指标之比,表示 对比指标间的数量关系,可用倍数或百分数表 示。 比=甲指标/乙指标(或×100%) / 100 甲、乙两个指标可以是绝对数,也可以是平均 数或率;可以性质相同,也可以性质不同。
各种疟疾的构成情况
1955年 类别 发病人数 恶性疟 间日疟 三日疟 合计 68 12 17 97 % 70 12 18 100 发病人数 21 12 17 50 % 42 24 34 100 1956年
相对数在应用中应注意的事项
计算相对数的分母一般不宜过小。样本量过小时计算 所得的相对数稳定性较差,受偶然性影响易产生较大 的误差。观察例数过小时应用绝对数表示。 正确区分率与构成比。构成比只能说明事物内部各组 成部分的构成或分布,并不能反映某现象发生的频率 或强度,分析资料时不要将构成比当率做解释。
急性脑出血病死率的比较
某省医院 患者 例数 1600 死亡 例数 255 病死率 (%) 15.9 患者 例数 920
某县医院 死亡 例数 101 病死率 (%) 11.0
ห้องสมุดไป่ตู้ 急性脑出血病死率的比较
某省医院 病情 患者 例数 100 500 1000 1600 死亡 例数 5 50 200 255 病死率 (%) 5 10 20 15.9 患者 例数 800 100 20 920 某县医院 死亡 例数 80 15 6 101 病死率 (%) 10 15 30 11.0
统计学-计数资料的统计描述
实际死亡数 SMR = 预期死亡数 标化率 = SMR × 标准死亡率
注意事项
(1)标化率不能反映实际水平,只 能用 )标化率不能反映实际水平, 于比较; 于比较; (2)选用标准不同,标化率会改变,但 )选用标准不同,标化率会改变, 比较结果只有一个,不能改变; 比较结果只有一个,不能改变; (3)比较标化率,也要作显著性检验。 )比较标化率,也要作显著性检验。 (4)各小组率在比较的两组有波动时 不 )各小组率在比较的两组有波动时,不 宜进行标准化。 宜进行标准化。
儿童 成人 合计
100 50 150
40 45 85
40.0 90.0 56.7
50 100 150
10 80 90
20.0 80.0 60.0 Nhomakorabea又例1-5 见P18 又例
(2)间接法: )间接法: 各小组率不清楚时选用(只知道实际死亡人数 只知道实际死亡人数) 各小组率不清楚时选用 只知道实际死亡人数 标准选用标准发生率(如标准年龄别死亡率见 如标准年龄别死亡率见P19) 标准选用标准发生率 如标准年龄别死亡率见
死亡率 =
某年内的总死亡人数
× 1000‰
未被诊断为某病的病人数 漏诊率 = ×100% 确实为该病的病人数 确实不是某病的人数 误诊率 = ×100% 被诊断该病的病人数
相对比(ratio):反映指标间的相 相对比( ):反映指标间的相 ): 对水平。 对水平。
甲指标 相对比 = 乙指标
增加了/增加到 增加了 增加到 减少了/减少到 减少了 减少到 一成/两番 一成 两番
构成比(proportion):又称构成指 构成比( ):又称构成指 ): 标,表示事物或现象内部各组成部分 的比重或分布。 的比重或分布。
计数资料的统计描述与卡方检验
25
41 45 50 28 31
女
男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常
+
++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
计数资料的统计描述
高血压 172665
40
23.2
冠心病 172665
11
脑卒中 172665
253
6.4
率
146.5
风心病 172665
38
22.0
9
常用统计指标
发病率与患病率: 某时期某人群
发病率= 中新发病人次 K 同时期平均人口数
某一时点一定人群中 患病率= 现患某病新旧病例数 K
同期平均人口数
10
病死率与死亡率
某时期内因某病死亡人数
病死率=Biblioteka K同期患某病的病人数
某地某时期死亡人数
死亡率=
K
该地同期平均人口数
11
2.结构相对数——构成比
含义:指一事物内部结构相对某一组成部分 的观察单位数与该事物各组成部分的观察 单位总数之比,常用百分数表示。
计算:
构成比=
某一组成部分的观察单位数 100 同一事物各组成部分的观察单位总数 %
合计
74.61
44298
乙地预期发 病人数
3=1*2
26.93 46.35 45.53 59.9 44.75 8.54
232
28
标准化时应注意的问题
1. 应明确在对比两组(或多组)总率或总均数 时,若内部构成明显不同,影响总率的可比 性,需作标准化处理。
2. 相互比较的两组(或几组)资料的标准化率, 应选用同一标准;选用的标准不同,算得的 标准化率也不同。标准化率仅表明对比资料 间的相对水平,并不反映某时某地该现象发 生的实际水平。
287 64.79
18
标准化的意义:
• 其合计的差别之所以大,是由于两地人 群年龄构成不同。要正确比较甲、乙两 地的总发病率,需按照统一标准进行校 正,然后进行比较。
第3讲 计量资料与计数资料的统计描述
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
2、计数资料 (count data)
按某种属性分类计数后得到的数据,又称无序分类变量,有二分 类和多分类两种情形.
366
28 34
35
10
34
78
57
248
30 11
14
11
22
39
17
114
32 14
2
3
14
24
3
60
34
4
2
5
3
12
2
28
36
2
1
1
4
5
1
14
38
3
1
1
0
2
1
8
40
0
0
2
0
0
0
2
合计 207
141
102
208 537 206 1401
2、常用相对数指标
计数资料常用的数据形式是绝对数,如某病的出院人数,治愈人数 等.但绝对数不具可比性,需要计算相对数.
2、三线表
表号 标题(包括何时、何地、何事)
横标目的 总标目 横标目
┋
总标目
纵标目 纵标目
××× ×××
××
××
总 标 目(单位)
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ×:
计数资料的统计描述与统计推断
2 nnARn2C 1
(一) 多个样本率的比较:
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某 成同 年 比年 某死 类亡 死总 因人 死 1数 亡 0% 0人数
8
(二)疾病统计指标
某 病 发病 一率 定 该时 期期 间内 新可 病 发能 的 生 例发 平 的 数生 均 某 某 人 K病
某病患病率 某该时时点点某受病检现人患口病 K数例数
某
病
病死同 因率期 某某 病
死亡人数 病病 10人 % 0 数
29
31
(三)四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3
计数资料的统计描述
35
35.0
300 125
41.7
————————————————————————————————
合计
400
215
53.8
400 190
47.5
———————————————————————————————
2021年2月16日星期二
• 标准化法的基本思想: 采用某影响因素的统一标准构成以消
除构成不同对合计率的影响,使通过标准 化后的标准化合计率具有可比性。
相当于一个时间端面 一般不超过一个月
2021年2月16日星期二
• 期间患病率 = 某期间某病的新旧病例数 × K
•
同期平均人口数
=开始时点上的患病率+该期间内发病率 2021年2月16日星期二
• (2)含义
•
指某特定时间内总人口中,某病新旧
病例所占的比例。
•
强调的是某人群中某时间断面上患病
者的比例。
疾病构成
1990年
1998年
—————————— ——————————
死亡人数 构成比(%) 死亡人数 构成比(%)
恶性肿瘤
58
30.53
循环系统疾病
44
23.16
呼吸系统疾病
37
19.47
消化系统疾病
19
10.00
传染病
32
16.84
40
26.85
44
29.53
29
19.46
18
12.08
18
12.08
计数资料的统计描述
2021年2月16日星期二
一、相对数的概念及计算
• 计数资料的变量值是定性的,对其观察结果的分 析比较常用率、构成比、相对比等统计指标描述。 这些指标都是由两个有联系的指标组成,又称相 对数(relative number)。
医学统计学-计数资料的统计描述
02
相对频数的计算公 式
相对频率 = (某组的频数 / 所有 观察值的总数) × 100%。
03
相对频数分布的应 用
用于比较不同组别之间的相对大 小关系,特别是在样本量差异较 大时。
集中趋势的描述:平均数、中位数、众数
平均数
所有观察值的总和除以观察值的数量,反映 数据的平均水平。
中位数
将数据从小到大排序后,位于中间位置的数 值,反映数据的中心位置。
总结词
Logistic回归分析是一种用于处理因变量 为分类变量(通常是二分类)的统计方 法。
VS
详细描述
Logistic回归分析通过建立数学模型,将 自变量与因变量的关系转化为概率形式, 从而预测因变量的发生概率。它广泛应用 于医学、经济学、社会学等领域,尤其在 医学研究中,常用于疾病发生风险的预测 和诊断模型的建立。
Spearman秩相关与Kendall秩相关
Spearman秩相关和Kendall秩相关是两种常用的非参数相关分析方法, 适用于处理等级数据。
Spearman秩相关是根据变量的秩次来计算相关系数,反映两个变量之间 的线性关系。
Kendall秩相关则是基于排序数据中相邻数据的变化情况来计算相关系数, 反映两个变量之间的单调关系。
1 2 3
早期发展
计数资料统计描述起源于早期的统计学研究,最 初主要用于人口普查和农业统计等领域。
近代发展
随着计算机技术的进步和统计学理论的不断完善, 计数资料统计描述的方法和手段得到了极大的丰 富和发展。
未来趋势
随着大数据时代的到来,计数资料统计描述将更 加注重自动化、智能化和可视化,以提高数据处 理和分析的效率和准确性。
计数资料统计描述的重要性
第3讲--计数资料统计描述PPT课件
一、 统计表
(一)统计表的意义与制作原则
1.意义:统计表用简明的表格形式,有条理 地罗列数据和统计量,方便阅读、比较和计算。
2. 基本格式:三条线(顶线、标目线、底 线),三部分(标题、标目、数字) 3. 基本结构:包括:表号、标题、标目、线条、 数字、备注 4. 种类:简单表和组合表 5.制表原则:重点突出、层次清楚
• 基本概念:标准组、标化组
13
•
直接法的计算
• 1) 选择年龄别人口数作标准时,直接法标准化率的 计算公式为:
p Ni pi
Ni为标准年龄别人口数N,为实际年龄别死亡率
N为标准人口总数。
是预期死亡数,它除以
标准人口总数N即得直Ni接pi 法的标准化死亡率。
14
• 2)选择年龄别人口构成比作标准时,直接 法标准化率的计算公式为:
17
标准化组的选择
• 标准化组的选择: 标准化法计算的关键是选择 统一的标准构成。选择标准构成的方法通常有 三种:
– 1.两组资料中任选一组资料的人口数(或人口构成) 作为两者的“共同标准”。
– 2.两组资料各部分人口之和组成的人口数(或人口 构成)作为两者的“共同标准”。
– 3.另外选用一个通用的或便于比较的标准作为两者 的“共同标准”,如采用全国、全省或全地区的数据作 为标准。
• 因此需要在绝对数的基础上计算相对数。
2
第一节:常用相对数
• 常用的相对数:
– 一、率 – 二、构成比 – 三、相对比
3
一、率
率:说明某现象发生的频率或强度。 常以百分率(%)、千分率(‰)、
万分率(1/万)、十万分率(1/10万)等表 示,计算公式为:
率同某期时可期能内发发生生某某现现象象的的观观察察单单位位总数数比例基数
第六章计数资料的统计描述
甲乙两种疗法治疗某病的治愈率比较
甲疗法
病型
病人数
治愈数
治愈率 (%)
普通型 300 180 60.0
重型 100 35 35.0
合计 400 215 53. 8
乙疗法
病人数
治愈数
治愈率 (%)
100 65 65.0
300 125 41.7
400 190 47.5
从合计看,甲疗法的治愈率高于乙疗法; 从类型看,乙疗法的治愈率高于甲疗法; 自相矛盾! 为什么? 两种疗法所选的人群病型构成不同。 怎么办? 按照统一标准进行校正,然后进行比较。
一、常用相对数
1、率 描述某现象发生的频率或强度,又叫强度相对数。 计算公式:
率=
某时期内发生某种现象的观察单位数 同期可能发生某种现象的观察单位总数
×k
K是比例基数,通常取100%、1000‰、1万/1万和10万 /10万等,根据习惯用法来确定。
总体率用π,样本率用 p 表示。 例:全班100名同学(观察单位)某课程考试优秀者
医学统计学
statistics of medicine
王俊明 wjm_2000163 河北北方学院预防医学教研室
第六章 计数资料的统计描述
计数资料的基本形式是绝对数, 如某地区高血压患者人数,某单位A型血人数。
在进行比较的时候,绝对数通常说明不了全部问题。 问:怎么办? 答:在绝对数的基础上计算相对数,再进行比较。
(发生现象)5名, 优秀率为5%。
2、构成比 描述事物内部某一部分个体与该事物各部分个体的总和 之比,用来说明各构成部分在总体中所占的比重,又叫 结构相对数。比例基数通常取100%。计算公式:
构成比=
统计学:计数资料
10
110
10.0
36.7
内部构成不同时,如需比较两个总率,可以用标准化法 标准化法的基本思想:采用统一的标准构成以消除构成 不同对总率的影响,使通过标准化后的标准化总率具有 可比性。
治疗分组 成人组 儿童组 合计
旧疗法 治疗人数 痊愈人数 治愈率% 100 200 300 50 20 70 50.0 10.0 23.3 200 100 300
死因构成
死因顺位
死亡原因 构成比(%) 死因顺位
恶性肿瘤
脑血管病 心脏病 呼吸系统 损伤与中毒
24.93
20.41 17.61 13.36 5.87
1
2 3 4 5
(二)率、频率
说明某种现象发生的机会大小的指标。
计算:率
该现象实际发生数 比例基数 可能发生某现象的总数
比例基数(k)可以是100%、1000‰、10000/万、 100000/10万等。
各构成比之间相互制约,某一组成部分数量的 变化会使所有组成部分的构成比都改变。
计算:
被观察事物内部某一组成部分的观察单位数 100% 同一事物各组成部分的观察单位总数
例:计算下表中各种疾病病人数占总病人数的构成比
疾病名称 痢疾 肝炎 流脑 麻疹 其它 合计
发病人数 3685 2111 522 411 850 7579
1949 年死亡率 3.3 死亡率之比 33倍 1980 年死亡率 0.1
(四)动态数列
按照一定的时间顺序,将某事物的统计指标依次排列起来, 便于观察和比较该事物在时间上的发展变化趋势。
年份 (1) 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 符号 (2) a0 a1 a2 a3 a4 a5 a6 a7 a8 a9 学生 人数 (3) 4200 4500 4800 4900 5150 5320 5510 5780 5950 6000 绝对增长量 累计 逐年 (4) (5) --300 600 700 950 1120 1310 1580 1750 1800 300 300 100 250 170 190 270 170 50 发展速度(%) 定基比 环比 (6) (7) 100.0 100.0 107.1 114.3 116.7 122.6 126.7 131.2 137.6 141.7 142.9 107.1 106.7 102.1 105.1 103.3 103.6 104.9 102.9 100.8 增长速度(%) 定基比 环比 (8) (9) --7.1 14.3 16.7 22.6 26.7 31.2 37.6 41.7 42.9 7.1 6.7 2.1 5.1 3.3 3.6 4.9 2.9 0.8
计数资料的统计描述 (2)
Description of Enumeration Data
数据类型及赋值
数据(变量)类型 变量的表现
1.计量变量:
血压值:12.3kpa
2.分类(定性):
1)两分类: 疗效:有效=1,无效=0
性别:男=1,女=2
2)多分类(无序):血型:A,B,O,AB
3.等级(有序):
疗效:痊愈=4、显效=3、有效=2、无效=1
构成比 死亡率 (%) (1/10万)
(2)
(3)
(4)
(5)
356980
11
1.5
3.1
232505
22
3.0
9.5
205032
142
19.6
69.3
121882
443
61.1
363.5
20047
107
14.8
533.8
936446
725
100.0
77.4
解:
0~14
11 100000/10万 3.1/10万 356980
相对比 甲乙指指标标(倍数或百分数%)
例1:某医院出生性别比=男性婴儿数/女性婴儿数 =370/358=1.03(或103%)
医护比=医生人数/护士人数
对性质相同的资料,它可说明两者间的差别或比
例关系。如:出生性别比
对性质不同的资料,它表示一个量 A 相对与另
一个量 B 的对比数。如:每千人口的医生数
平,即实际发生的规模大小。 缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感 染有150人,乙村钩虫感染有100人。据此,我们 只能说甲村钩虫感染较乙村多50人,但不能肯定 甲村较乙村钩虫感染程度更为严重。
计数资料的统计描述
某地某时期某病患病例 数 某人群某时期某病患病 率 K 某年同时期内平均人囗 数
患病率通常用于描述病程较长或发病时间不易 明确的疾病的患病情况。患者不论何时发病,不论
新旧病例,凡调查时尚未痊愈者均算作一个病例。
3.病死率(cause fatality) 表示某期间内,某病 患者中因某病死亡的频率,计算公式如下:
第一节 常用相对数
例如:某医院2005年在某城市随机调查了 8589例60岁及以上老人,体检发现高血压患 者为2823例,则
该城市2005年60岁以上老人高血压的患病率为:
2823/8589×100%=32.87%
第一节 常用相对数
表5-1 2000年某地区不同年龄组恶性肿瘤死亡构成与死亡率
年龄组 (岁)
0~
平均 人口数
112994
恶性肿瘤 死亡人数
6
死亡 构成比(%)
4.48
死亡率 (1/10万)
5.31
20~
40~ 60~ 合计
56022
34900 13760 217676
16
58 54 134
11.94
43.28 40.30 100.00
Hale Waihona Puke 28.56166.19 392.44 61.56
医学常用的相对数指标
一、强度相对数
说明某现象发生的频率或强度,又称率。 常以%,‰,1/万,1/10万等表示。计算公式 为:
某时期内发生某现象的观察单位数 率 比例基数 同期可能发生某现象的观察单位总数
比例基数: 100%,1000‰,万/万,10万/10万
比例基数的选择根据习惯用法和使计算的结果能保 留1~2位整数。
某一组成部分的 观察单位数 构成比 100% 同一事物各组成部分的 观察单位总数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计数资料描述
静态指标 动态指标
强度 结构 优势
绝对量、相对量 构成 比、优势比
趋势 发展
动态数列
内 容 资料仅供参考,不当之处,请联系改正。
• 相对数
– 强度 – 分布 – 相对比
• 应用相对数时的注意事项 • 率的标准化法
– 标准化法的意义和基本思想 – 标准化率的计算
• 应用标准化法的注意事项 • 动态数列及其指标
零点固定(零点意义明确)
称为比例尺度数据。任何两 个数据的比值是有意义的。
有序数据(ordinal data) 名义尺度数据(nominal scale data)
2020/4/4
可以排列次序,比较大小, 但是没有指定的数值。通常 的算数运算没有意义。
不同的数值代表的是类型, 而类型是没有次序的。
1
观察的全部可能现象数量
资料仅供参考,不当之处,请联系改正。
结构相对数 —构成比(constituent ratio) 概念:说明某事物内部各组成部分所占的比重或分布,又称构成比。 计算公式:
某部分的数量
某部分的比重(%)= -----------------------------------事物内部各部分数量的和
– 绝对增长量 – 发展速度与增长速度 – 平均发展速度和平均增长速度
资料仅供参考,不当之处,请联系改正。
相对数
相对数(Relative number):是两个有关联的数据之比,用以说明事物 的相对关系,便于对比分析。
常用的相对数指标很多,按联系的性质和说明的问题不同,主要分为:
率、构成、相对比三类。
基数数据(cardinal data)
资料仅供参考,不当之处,请联系改正。
可以使用某种尺度测出任何 两个数据的距离。基数数据 的均值和标准差都是有意义 的。
区间尺度数据(interval scale data)
对于基数数据,如果零点是
任意的(零点意义不明确) 称为区间尺度数据。
比例尺度数据(ratio scale data)
患者
患病频
病例数
百分比 率(%) (%)
398 35.4
29 45.3 7.3
311 27.7 260 23.2
13 20.3 4.2 13 20.3 5.0
154 13.7
9 14.1 5.8
1123 100.0
64 100.0 5.7
收集数据
--处,请联系改正。
数据粒度
不同工种调查对象白细胞减少症登记表
观察序号 年龄 性别 工种 …
白细胞减少症
1
56
男 笨作业 …
是
2
47
女 塑料作业 …
否
3
25
男 化学药物 …
否
…
…
…
…
…
…
1123
59
男 放射作业 …
是
表1. 不同工种调查对象白细胞减少症患者统计
工种
笨作业 塑料作业 化学药物 放射作业
合计
调查对象
例数
百分比 (%)
资料仅供参考,不当之处,请联系改正。
本质是事物的根本性质,是事物自身组成要素之间相对稳定的内在
联系,是由事物本身所具有的特殊矛盾构成的。组成事物的要素以及要素 之间的关系结构是事物本质存在的客观基础,一个事物和其他事物的本质 区别是由事物的各个特殊的组成要素及其关系结构决定的。
本质
=
要素
+
关系结构
X 100%
基数:100%。 构成比可相加,和等于100%。
资料仅供参考,不当之处,请联系改正。
优势相对数 ----比(ratio) 比是指两个有关联的指标A和B之比,简称比。A和B可以是性质相同, 也可以是性质不相同。通常以倍数或百分数(%)表示。
计算公式:
A 比=------- X 100%
B
在随机抽样的情况下, 从样本估计值推断总体的相对数应当考虑抽样误差, 不能仅凭数字表面差别的大小下结论,而应根据需要进行参数估计和假设检验。
资料仅供参考,不当之处,请联系改正。
第二节 粗率的标准化法
资料仅供参考,不当之处,请联系改正。
一、标准化法的意义和基本思想
强度相对数--频率(frequency) 是最常见的一种相对数,频率在实践中又称为比率(proportion)。 它表示事物内部某个组成部分所占的相对多少。具有可比性。
计算公式:
某现象出现的数量 比率=-------------------------------------------- X 100%(K)
应用相对数时的注意事项 资料仅供参考,不当之处,请联系改正。
1、正确理解相对数的含义,常见问题是解释错误。 2、频率型指标的解释要紧扣总体与属性 3、计算相对数时分母应有足够数量 4、正确计算合计率 5、注意资料的可比性
在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽 可能相同或相近。下列因素可能影响对比组之间的可比性: (1) 观察对象是否同质,研究方法是否相同,观察时间是否相等,以及地区、 周围环境、风俗习惯和经济条件是否一致或相近等。 (2) 观察对象内部结构是否相同,若两组资料的年龄、性别等构成不同。 (3)对比不同时期资料应注意客观条件是否相同。 6、 样本相对数的统计推断
计数资料
类别
,
数量
资料仅供参考,不当之处,请联系改正。
计数资料 --》性质 --》类别 --》数量 计数资料本质的描述维度
总量分析 频数分析 集中度分析 位次分析 均衡性分析
绝对总量 相对总量
绝对集中度 相对集中度
资料仅供参考,不当之处,请联系改正。
强度是某个量的多少或强弱程度。 结构是一系统诸要素之间的组织形态,包括诸要素及组织的序量、张量等。 优势是指某些方面超过同类的形势。
式中A、B指标可以是绝对数、相对数或平均数等。
资料仅供参考,不当之处,请联系改正。
两种相对比
对比指标: 指两个同类事物某种指标的比,说明一个数 为另一个数的几倍或百分之几,两指标可是 绝对数、相对数或平均数。 如:2000年我国人口普查,男子65355 万人, 女子61228 万人,男女性别比为:1.0674