计数资料的统计描述
统计描述与统计推断
统计描述与统计推断统计的主要工作就是对统计数据进行统计描述和统计推断。
统计描述是统计分析的最基本内容,是指应用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述;而统计推断是指通过抽样等方式进行样本估计总体特征的过程,包括参数估计和假设检验两项内容。
(一)统计描述1.计量资料的统计描述计量资料的统计描述主要通过编制频数分布表、计算集中趋势指标和离散趁势指标以及统计图表来进行。
(1)集中趋势。
指频数表中频数分布表现为频数向某一位置集中的趋势。
集中趋势的描述指标:1)算术平均数。
直接法:x为观察值,n为个数加权法又称频数表法,适用于频数表资料,当观察例数较多时用。
f为各组段的频数。
2)几何平均数(geometric mean)。
几何平均数用符号G表示。
用于反映一组经对数转换后呈对称分布的变量值在数学上的平均水平。
直接法:加权法又称频数表法,当观察例数n较大时,可先编制频数分布表,用此法算几何平均数:3)百分位数(percentile )与中位数(median )。
百分位数是一种位置坐标,用符号x P 表示常用的百分位数有 2.5P 、5P 、50P 、75P 、95P 、97.5P 等,其中25P 、50P 、75P 又称为四分位数。
百分位数常用于描述一组观察值在某百分位置上的水平,多个百分位结合使用,可更全面地描述资料的分布特征。
中位数是一个特定的百分位数即50P ,用符号M 表示。
把一组观察值按从小到大(或从大到小)的次序排列,位置居于最中央的那个数据就是中位数。
中位数也是反映频数分布集中位置的统计指标,但它只由所处中间位置的部分变量值计算所得,不能反映所有数值的变化,故中位数缺乏敏感性。
中位数理论上可以用于任何分布类型的资料,但实践中常用于偏态分布资料和分布两端无确定值的资料。
其计算方法有直接法和频数表法两种。
直接法:当观察例数n 不大时,此法常用,先将观察值按大小次序排列,选用下列公式求M 。
医学统计学计数资料的统计描述(一)
医学统计学计数资料的统计描述(一)医学统计学计数资料的统计描述计数资料是医学研究中常见的数据类型,例如统计某种疾病的患病人数、治愈人数等。
如何对这些数据进行科学统计描述,成为了医学研究不可避免的问题。
一、计数资料的基本概念计数资料是指由离散数据组成的一种数据类型,这些数据仅取有限个数值,如某类疾病的患病人数(自然数)或治愈人数(非负整数)。
计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述极为重要。
二、计数资料的统计描述1. 频数频数是指计数资料中各取值出现的次数,常以小写字母n表示。
例如患病人数为0的样本数为n0,患病人数为1的样本数为n1,以此类推。
2. 频率频率是指频数与总样本数的比值,常以小写字母f表示。
例如患病人数为0的频率为f0=n0/n,患病人数为1的频率为f1=n1/n,以此类推。
频率可以体现每个取值在样本中的分布情况,是比较常用的统计指标,其和为1。
3. 百分比百分比是指频数与总样本数的比值乘以100,常以百分号表示。
例如患病人数为0的百分比为f0×100%,患病人数为1的百分比为f1×100%,以此类推。
4. 累计频率累计频率是指某一取值及其以下所有取值的频率之和,常以小写字母F 表示。
例如患病人数小于等于3的累计频率为F3=f0+f1+f2+f3。
累计频率可以体现小于等于某个取值的样本在总样本中所占比例。
三、总结计数资料是医学研究中常见的数据类型,对于这些数据的科学统计描述有益于研究者更加深入地了解样本的分布情况,进而提出相应的研究假设。
频数、频率、百分比和累计频率是计数资料的常用统计指标,可分析每个取值在样本中的分布情况和各个取值间的差异。
在实际研究中,研究者应根据实际情况选择合适的统计方法进行分析,以期得到更为科学的结论。
计数资料的统计描述
计数资料的统计描述第一节常用相对数一、绝对数定义:计数资料各类别的频数,即各分类事物的合计数。
如某病的出院人数、治愈人数、死亡人数等。
意义:绝对数反映出事物在某时、某地出现的实际水平,即实际发生的规模大小。
缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感染有150人,乙村钩虫感染有100人。
据此,我们只能说甲村钩虫感染较乙村多50人,但不能肯定甲村较乙村钩虫感染程度更为严重。
例2:甲、乙两个医院某病出院人数不同时,比较两医院该病的死亡人数没有意义。
例3:如04级七年制一、二大班学生人数不同时,比较两班医学统计学的及格人数没有意义。
二、相对数定义:两个有关的绝对数之比,统称为相对数。
意义:1.消除基数影响,便于事物间的比较。
2.给出事物发生频率(强度)的估计。
3.相对数是工作决策的依据。
常用的相对数指标•例5-1 某医院1998年在某城区随机调查了8589例60岁及以上老人,体检发现高血压患者为2823例。
高血压患病率为:(2823 / 8589 ) 100% = 32.87% 。
在实际工作中,“率”的应用非常广泛,如:发病率、死亡率、发生率、阳性率、患病率等。
当“率”的分母足够大时,常用“率”的大小表示某现象发生的概率。
第二节应用相对数的注意事项1. 计算相对数应有足够数量即分母不宜太小。
如果例数较少会使相对数波动较大。
如某种疗法治疗5例病人,5例全部治愈,则计算治愈率为5/5×100% =100%,若4例治愈,则治愈率为4/5×100% =80%,由100%至80%波动幅度较大,但实际上只有1例的变化。
•在临床试验或流行病调查中,各种偶然因素都可能导致计算结果的较大变化,因此例数很少的情况下最好用绝对数直接表示•但动物实验时,可以通过周密设计,严格控制实验条件,如毒理实验,每组用10只纯种小鼠也可以•分母到底多大才可以呢?要根据研究目的、研究指标而定2.不能以构成比代替率构成比是用以说明事物内部某种构成所占比重或分布,并不说明某现象发生的频率或强度,在实际工作中经常会出现将构成比指标按率的概念去解释的错误。
计数资料的描述和x2检验
(4)χ2界值
当自由度ν确定后,χ2分布曲线下右侧尾 部的面积为α时,横轴上相应的χ2值即为χ2
界值,表示为 χα2,ν 。
χ2界值可以通过查χ2界值表得到,当自 由度一定时,χ2值越大,P值越小;χ2值越 小,P值越大。
一、四格表资料的χ2检验
1。四格表资料(完全随机设计)
四格表的格式
分组 +
116
130
85
41
29
776
305
人口数
(ni)
241 315 175
农村 预期患病人数
( niPi)
51 145 115
58
42
789
353
④ 计算城乡两地的SMR及标准化患病率
城市SMR:
SMR = 322 = 1.05 305
城市标准化患病率: p ' = 42.1% ×1.05 = 44.2%
③ 求预期治愈人数
表5-5 直接法计算标准化率
标准治
甲疗法
病型 疗人数 原治愈率 预期治愈数
(Ni) (pi) ( Nipi)
普通型 400 60.0
240
乙疗法
原治愈率 预期治愈数
(pi)
65.0
( Nipi)
260
重型 400 35.0
140
41.7
167
合计 800
-
380
-
427
④ 计算甲、乙两种疗法的标准化治愈率
人工流产后 255
78
61.9
30.6
月经后
87
39
31.0
44.8
哺乳期
17
9
7.1
52.9
计数资料的统计描述与卡方检验
25
41 45 50 28 31
女
男 女 女 男 女
1.61
1.71 1.58 1.60 1.76 1.62
AB
A B O AB Oຫໍສະໝຸດ 正常异常 正常 异常 正常 正常
+
++ ++ ++ +++ +
农民
工人 工人 干部 干部 军人
3.92
3.49 5.48 6.78 7.10 5.24
1、频数表
部分原始数据
重 中 轻
800 200 100
合计 1100
1、标准化法的基本方法
• 方法1:采用标准人口构成与原始分组率, 计算标准化率,直接比较。 • 方法2:采用分组标准化率与原始人口,计 算标准化比,间接比较。
1)、直接法--标准人口
病情程度
例数
甲医院
感染数 160 20 5 185 感染率 例数 20% 10% 5% 16.8% 800 200 100 1100
计数资料的统计描述与卡方检验
四川大学华西医院 康德英
临床研究中计数资料来源、分类
• 本身设置为分类变量(PI/ECOT) • 从计量资料转化而来:
如评价降压疗效时,将舒张压降低值分为三类: <5mmHg 无效
5-10mmHg
10-20mmHg
有效
显效
Note:计量资料转化为计数资料,过程本身损 失信息,应慎重。
4、NNT
• NNT(Numbers Needed to Treat):为避免 一例不良事件发生而需要治疗的病例数.其 值为绝对危险度的倒数(1/AR) • 类似还有:NNH(Numbers Needed to Harm)。
计数资料的统计描述
高血压 172665
40
23.2
冠心病 172665
11
脑卒中 172665
253
6.4
率
146.5
风心病 172665
38
22.0
9
常用统计指标
发病率与患病率: 某时期某人群
发病率= 中新发病人次 K 同时期平均人口数
某一时点一定人群中 患病率= 现患某病新旧病例数 K
同期平均人口数
10
病死率与死亡率
某时期内因某病死亡人数
病死率=Biblioteka K同期患某病的病人数
某地某时期死亡人数
死亡率=
K
该地同期平均人口数
11
2.结构相对数——构成比
含义:指一事物内部结构相对某一组成部分 的观察单位数与该事物各组成部分的观察 单位总数之比,常用百分数表示。
计算:
构成比=
某一组成部分的观察单位数 100 同一事物各组成部分的观察单位总数 %
合计
74.61
44298
乙地预期发 病人数
3=1*2
26.93 46.35 45.53 59.9 44.75 8.54
232
28
标准化时应注意的问题
1. 应明确在对比两组(或多组)总率或总均数 时,若内部构成明显不同,影响总率的可比 性,需作标准化处理。
2. 相互比较的两组(或几组)资料的标准化率, 应选用同一标准;选用的标准不同,算得的 标准化率也不同。标准化率仅表明对比资料 间的相对水平,并不反映某时某地该现象发 生的实际水平。
287 64.79
18
标准化的意义:
• 其合计的差别之所以大,是由于两地人 群年龄构成不同。要正确比较甲、乙两 地的总发病率,需按照统一标准进行校 正,然后进行比较。
计数资料的统计描述
率同某期时可期能内发发生生某某现现象象的的观观察察单单位位总数数比例基数
式中比例基数,可以取100%、1000‰、 10万/10万…等。
常用的率有发病率、患病率、死亡率、 病死率、治愈率等。
例10-1 某医院1998年在某城区随机调查了 8589例60岁及以上老人,体检发现高血 压患者为2823例。
高血压患病率为: 2823 / 8589 100% = 32.87% 。
二、构成比(结构相对数)
构成比:表示事物内部某一部分的个体数 与该事物各部分个体数的总和之比,用 来说明各构成部分在总体中所占的比重 或位次。
通常以100%为比例基数。其计算公式为:
构成比
某一组成部分的观察单位数 同一事物各组成部分的观察单位总数
例10-2 某医院1990年和1998年住院病人死于五 种疾病的人数见表10-1。
表 10-1 某医院 1990 年和 1998 年住院病人五种疾病死亡人数和构成比
疾病构成
1990 年
1998 年
死亡人数 构成比(%)
死亡人数 构成比(%)
恶性肿瘤
58
30.53
40
26.85
循环系统疾病
44
23.16
﹡2、不能以构成比代替率
构成比是用以说明事物内部某种构成所 占比重或分布,并不说明某现象发生的 频率或强度。
统计描述是指选用适当的特征性统计指标
(即统计量)、合适的统计表、统计图正确地描
述资料的分布规律和数量特征。
计数资料的统计描述
常用相对数 应用相对数的注意事项 率的标准化法
一:常用相对数
计数资料常见的数据形式是绝对数,如某病的 出院人数、治愈人数、死亡人数等。
但绝对数通常不具有可比性:
计数资料的统计描述与统计推断
2 nnARn2C 1
(一) 多个样本率的比较:
表3.8 三种药物治疗高血压的疗效
处理
有效
无效
合计
有效率%
复方哌唑嗪 35
5
40
87.50
复方降压片 20
10
30
66.67
安慰剂
7
25
32
21.88
合计
62
40
102
60.78
38
H0:三种处理方法的有效率相等, 即π1= π2= π3 H1:三种处理方法的有效率不等或不全相等
某类死因构某 成同 年 比年 某死 类亡 死总 因人 死 1数 亡 0% 0人数
8
(二)疾病统计指标
某 病 发病 一率 定 该时 期期 间内 新可 病 发能 的 生 例发 平 的 数生 均 某 某 人 K病
某病患病率 某该时时点点某受病检现人患口病 K数例数
某
病
病死同 因率期 某某 病
死亡人数 病病 10人 % 0 数
29
31
(三)四格表χ2检验的专用公式
2
(ad b)c2n
(ab)c(d)a (c)b (d)
两组人群尿棕色素阳性率比较
组别
阳性数
阴性数
合计
铅中毒病人 对照组
29(a) 9(c)
7(b) 28(d)
36(a+b) 37(c+d)
合计
38(a+c)
35(b+d)
73(n)
阳性率(%) 80.56 24.32 52.05
712 142 185
61
1100
4
0.6
9
6.3
第七章 计数资料的描述
平均增长速度是各环比增长速度的平均数,说明某事 物在一个较长时期中逐期平均增长的程度。
二、构成比(proportion)
概念:又称百分比(percentage),是指一事物内部某 一组成部分的观察单位数与该事物各组成部分的观察单 位总数之比,用以说明某一事物内部各组成部分所占的 比重或分布。
计算公式:
比 某一 组成部分的观察单位数 各 组组成 部分的观察单位总数
100 %
患病率=发病率 病程
发病率 病程 诊断水平 治疗水平 病死率 健康者、 病人流动
发病率
↑
患病率
↓
↙治愈率
病死率↘
患病率与发病率及病程的关系
影响患病率升高、降低的因素
患病率升高
新病例增加 未治愈者的寿命延长 病程延长 病例迁入 健康者迁出 易感者迁入 诊断水平提高 报告率提高
患病率降低
新病例减少 病死率增高 病程缩短 病例迁出 健康者迁入 治愈率提高
罹患率= 观察期间的新病例 K 同期暴露人口数
3.患病率(prevalence rate)
患病率:是指某特定时间内总人口中某病新旧病例所占的比例。
患病率= 某时间内某病病例数 K 该人群同期平均人口数
时点患病率和期间患病率 影响患病率升高和降低的因素 患病率与发病率、病程的关系
3.环比发展速度:以前一个时间的指标作基数,相邻的后一个指标 与之相比。
动态数列的两个要素: 时点或时期: t0 , t1 , t2 , , ti , tn 统计指标: a0 , a1, a2 ,, ai ,an
【例7-5】某医院2003年~2010年日门诊量的统计数据见
医学统计学-计数资料的统计描述
02
相对频数的计算公 式
相对频率 = (某组的频数 / 所有 观察值的总数) × 100%。
03
相对频数分布的应 用
用于比较不同组别之间的相对大 小关系,特别是在样本量差异较 大时。
集中趋势的描述:平均数、中位数、众数
平均数
所有观察值的总和除以观察值的数量,反映 数据的平均水平。
中位数
将数据从小到大排序后,位于中间位置的数 值,反映数据的中心位置。
总结词
Logistic回归分析是一种用于处理因变量 为分类变量(通常是二分类)的统计方 法。
VS
详细描述
Logistic回归分析通过建立数学模型,将 自变量与因变量的关系转化为概率形式, 从而预测因变量的发生概率。它广泛应用 于医学、经济学、社会学等领域,尤其在 医学研究中,常用于疾病发生风险的预测 和诊断模型的建立。
Spearman秩相关与Kendall秩相关
Spearman秩相关和Kendall秩相关是两种常用的非参数相关分析方法, 适用于处理等级数据。
Spearman秩相关是根据变量的秩次来计算相关系数,反映两个变量之间 的线性关系。
Kendall秩相关则是基于排序数据中相邻数据的变化情况来计算相关系数, 反映两个变量之间的单调关系。
1 2 3
早期发展
计数资料统计描述起源于早期的统计学研究,最 初主要用于人口普查和农业统计等领域。
近代发展
随着计算机技术的进步和统计学理论的不断完善, 计数资料统计描述的方法和手段得到了极大的丰 富和发展。
未来趋势
随着大数据时代的到来,计数资料统计描述将更 加注重自动化、智能化和可视化,以提高数据处 理和分析的效率和准确性。
计数资料统计描述的重要性
计数资料的统计描述
2021/1/8
标准化率的计算 (一)标准化方法
直接法 间接法
2021/1/8
• 标准人口构成的选择方法: • 1、比较组的各层的合计 • 2、另选一个标准构成 • 3、其中的一组
2021/1/8
• 直接法的计算公式:
Ni pi p' = ———
• K 比例系数,可为1000‰ 万分率 10万分率 • 时间单位 年、季、月,常以年为单位 • (2)含义 • 表示一定期间内、一定人群中某病新病例出现的
频率。 • 202强1疾/1/病8 发生的危险性
发病率
•
可分年龄、性别、职业、民族、种
族、婚姻状况、病因等分别计算,即发病
专率
2021/1/8
1998.1.1
1、死亡率(mortality rate, death rate)
(1)公式
死亡率= 某人群某年总死亡人数 × K 该人群同年平均人口总数
死亡粗率 死亡专率
2021/1/8
• (2)含义
•
指在一定期间内总死亡人数与该人群同期平
均人口数之比。
• (3)应用
•
用于衡量某一时期、某一地区人群死亡危险
2021/1/8
• (2)含义 • 表示一定时期内(通常为1年),患某
病的全部病人中因该病而死亡者的比例。 • (3)应用 • 它既表明疾病的严重程度,也可反映
出当地的医疗水平(可比性)。
2021/1/8
实例
2021/1/8
• 2、比(ratio): • 也称相对比,是表示两个数相除所得的值,说明
2021/1/8
4、注意资料的可比性 在比较相对数时,除了要对比的因素
第3讲--计数资料统计描述PPT课件
一、 统计表
(一)统计表的意义与制作原则
1.意义:统计表用简明的表格形式,有条理 地罗列数据和统计量,方便阅读、比较和计算。
2. 基本格式:三条线(顶线、标目线、底 线),三部分(标题、标目、数字) 3. 基本结构:包括:表号、标题、标目、线条、 数字、备注 4. 种类:简单表和组合表 5.制表原则:重点突出、层次清楚
• 基本概念:标准组、标化组
13
•
直接法的计算
• 1) 选择年龄别人口数作标准时,直接法标准化率的 计算公式为:
p Ni pi
Ni为标准年龄别人口数N,为实际年龄别死亡率
N为标准人口总数。
是预期死亡数,它除以
标准人口总数N即得直Ni接pi 法的标准化死亡率。
14
• 2)选择年龄别人口构成比作标准时,直接 法标准化率的计算公式为:
17
标准化组的选择
• 标准化组的选择: 标准化法计算的关键是选择 统一的标准构成。选择标准构成的方法通常有 三种:
– 1.两组资料中任选一组资料的人口数(或人口构成) 作为两者的“共同标准”。
– 2.两组资料各部分人口之和组成的人口数(或人口 构成)作为两者的“共同标准”。
– 3.另外选用一个通用的或便于比较的标准作为两者 的“共同标准”,如采用全国、全省或全地区的数据作 为标准。
• 因此需要在绝对数的基础上计算相对数。
2
第一节:常用相对数
• 常用的相对数:
– 一、率 – 二、构成比 – 三、相对比
3
一、率
率:说明某现象发生的频率或强度。 常以百分率(%)、千分率(‰)、
万分率(1/万)、十万分率(1/10万)等表 示,计算公式为:
率同某期时可期能内发发生生某某现现象象的的观观察察单单位位总数数比例基数
第六章计数资料的统计描述
甲乙两种疗法治疗某病的治愈率比较
甲疗法
病型
病人数
治愈数
治愈率 (%)
普通型 300 180 60.0
重型 100 35 35.0
合计 400 215 53. 8
乙疗法
病人数
治愈数
治愈率 (%)
100 65 65.0
300 125 41.7
400 190 47.5
从合计看,甲疗法的治愈率高于乙疗法; 从类型看,乙疗法的治愈率高于甲疗法; 自相矛盾! 为什么? 两种疗法所选的人群病型构成不同。 怎么办? 按照统一标准进行校正,然后进行比较。
一、常用相对数
1、率 描述某现象发生的频率或强度,又叫强度相对数。 计算公式:
率=
某时期内发生某种现象的观察单位数 同期可能发生某种现象的观察单位总数
×k
K是比例基数,通常取100%、1000‰、1万/1万和10万 /10万等,根据习惯用法来确定。
总体率用π,样本率用 p 表示。 例:全班100名同学(观察单位)某课程考试优秀者
医学统计学
statistics of medicine
王俊明 wjm_2000163 河北北方学院预防医学教研室
第六章 计数资料的统计描述
计数资料的基本形式是绝对数, 如某地区高血压患者人数,某单位A型血人数。
在进行比较的时候,绝对数通常说明不了全部问题。 问:怎么办? 答:在绝对数的基础上计算相对数,再进行比较。
(发生现象)5名, 优秀率为5%。
2、构成比 描述事物内部某一部分个体与该事物各部分个体的总和 之比,用来说明各构成部分在总体中所占的比重,又叫 结构相对数。比例基数通常取100%。计算公式:
构成比=
统计学:计数资料
10
110
10.0
36.7
内部构成不同时,如需比较两个总率,可以用标准化法 标准化法的基本思想:采用统一的标准构成以消除构成 不同对总率的影响,使通过标准化后的标准化总率具有 可比性。
治疗分组 成人组 儿童组 合计
旧疗法 治疗人数 痊愈人数 治愈率% 100 200 300 50 20 70 50.0 10.0 23.3 200 100 300
死因构成
死因顺位
死亡原因 构成比(%) 死因顺位
恶性肿瘤
脑血管病 心脏病 呼吸系统 损伤与中毒
24.93
20.41 17.61 13.36 5.87
1
2 3 4 5
(二)率、频率
说明某种现象发生的机会大小的指标。
计算:率
该现象实际发生数 比例基数 可能发生某现象的总数
比例基数(k)可以是100%、1000‰、10000/万、 100000/10万等。
各构成比之间相互制约,某一组成部分数量的 变化会使所有组成部分的构成比都改变。
计算:
被观察事物内部某一组成部分的观察单位数 100% 同一事物各组成部分的观察单位总数
例:计算下表中各种疾病病人数占总病人数的构成比
疾病名称 痢疾 肝炎 流脑 麻疹 其它 合计
发病人数 3685 2111 522 411 850 7579
1949 年死亡率 3.3 死亡率之比 33倍 1980 年死亡率 0.1
(四)动态数列
按照一定的时间顺序,将某事物的统计指标依次排列起来, 便于观察和比较该事物在时间上的发展变化趋势。
年份 (1) 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 符号 (2) a0 a1 a2 a3 a4 a5 a6 a7 a8 a9 学生 人数 (3) 4200 4500 4800 4900 5150 5320 5510 5780 5950 6000 绝对增长量 累计 逐年 (4) (5) --300 600 700 950 1120 1310 1580 1750 1800 300 300 100 250 170 190 270 170 50 发展速度(%) 定基比 环比 (6) (7) 100.0 100.0 107.1 114.3 116.7 122.6 126.7 131.2 137.6 141.7 142.9 107.1 106.7 102.1 105.1 103.3 103.6 104.9 102.9 100.8 增长速度(%) 定基比 环比 (8) (9) --7.1 14.3 16.7 22.6 26.7 31.2 37.6 41.7 42.9 7.1 6.7 2.1 5.1 3.3 3.6 4.9 2.9 0.8
计数资料的统计描述 (2)
Description of Enumeration Data
数据类型及赋值
数据(变量)类型 变量的表现
1.计量变量:
血压值:12.3kpa
2.分类(定性):
1)两分类: 疗效:有效=1,无效=0
性别:男=1,女=2
2)多分类(无序):血型:A,B,O,AB
3.等级(有序):
疗效:痊愈=4、显效=3、有效=2、无效=1
构成比 死亡率 (%) (1/10万)
(2)
(3)
(4)
(5)
356980
11
1.5
3.1
232505
22
3.0
9.5
205032
142
19.6
69.3
121882
443
61.1
363.5
20047
107
14.8
533.8
936446
725
100.0
77.4
解:
0~14
11 100000/10万 3.1/10万 356980
相对比 甲乙指指标标(倍数或百分数%)
例1:某医院出生性别比=男性婴儿数/女性婴儿数 =370/358=1.03(或103%)
医护比=医生人数/护士人数
对性质相同的资料,它可说明两者间的差别或比
例关系。如:出生性别比
对性质不同的资料,它表示一个量 A 相对与另
一个量 B 的对比数。如:每千人口的医生数
平,即实际发生的规模大小。 缺点:绝对数往往不便于互相比较。
例1:某乡两个村的调查结果为,甲村钩虫感 染有150人,乙村钩虫感染有100人。据此,我们 只能说甲村钩虫感染较乙村多50人,但不能肯定 甲村较乙村钩虫感染程度更为严重。
计数资料的统计描述
某地某时期某病患病例 数 某人群某时期某病患病 率 K 某年同时期内平均人囗 数
患病率通常用于描述病程较长或发病时间不易 明确的疾病的患病情况。患者不论何时发病,不论
新旧病例,凡调查时尚未痊愈者均算作一个病例。
3.病死率(cause fatality) 表示某期间内,某病 患者中因某病死亡的频率,计算公式如下:
第一节 常用相对数
例如:某医院2005年在某城市随机调查了 8589例60岁及以上老人,体检发现高血压患 者为2823例,则
该城市2005年60岁以上老人高血压的患病率为:
2823/8589×100%=32.87%
第一节 常用相对数
表5-1 2000年某地区不同年龄组恶性肿瘤死亡构成与死亡率
年龄组 (岁)
0~
平均 人口数
112994
恶性肿瘤 死亡人数
6
死亡 构成比(%)
4.48
死亡率 (1/10万)
5.31
20~
40~ 60~ 合计
56022
34900 13760 217676
16
58 54 134
11.94
43.28 40.30 100.00
Hale Waihona Puke 28.56166.19 392.44 61.56
医学常用的相对数指标
一、强度相对数
说明某现象发生的频率或强度,又称率。 常以%,‰,1/万,1/10万等表示。计算公式 为:
某时期内发生某现象的观察单位数 率 比例基数 同期可能发生某现象的观察单位总数
比例基数: 100%,1000‰,万/万,10万/10万
比例基数的选择根据习惯用法和使计算的结果能保 留1~2位整数。
某一组成部分的 观察单位数 构成比 100% 同一事物各组成部分的 观察单位总数
计量资料与计数资料统计描述
第3讲 计量与计数资料的统计描述
本讲结构
一、数据类型的分类 二、计量资料的统计描述 三、SPSS实现计量资料的统计描述 四、计数资料的统计描述 五、统计表与统计图
一、数据类型的分类
1、计量资料 (measurement data)
用仪器、工具等测量方法获得的数据,又称数值变量。 特点:有计量单位,如患者的身高(cm),体重(kg),血压(kPa)等.
频数表的编制步骤
(1)求极差(range):即最大值与最小值之差,又称为全距。 (2)数据分组: 由样本容量n确定组数、通常分10-15个组; 一般采取等距分 组, 组距=极差/组数。 (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包 含最大值,其它组段上限值忽略。 (4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。
住院 天数
5 5 6 5 11 2 4 3 7
职业
无 无 管理员 无 商业 无 无 无 干部
文化 程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩 方式 顺产 助产 顺产 剖宫产 剖宫产 顺产 助产 助产 剖宫产
妊娠 结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
计量资料
计数资料
大学
32
无
小学
27
无
中学
29
无
大学
25
农民
中学
26无小学源自分娩方式 顺产 助产 顺产 顺产 顺产
剖宫产 顺产
剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
医学统计学第讲计数资料统计描述
标准人口数
甲
原死亡率
县 预期死亡人数
乙
县
原死亡率 预期死亡人数
Ni (2)
pi (3)
Nipi (4)
pi (5)
Nipi (6)
3240494
0.0
0.0
0.0
0.0
512018
4.9
25.0
8.6
44.0
489946
36.2
177.4
49.9
244.5
386029
148.3
572.5
179.9
694.5
0.16 0.16 0.40 0.21 0.57 0.12
a4 24723 a5 29734 a6 34614 a7 39780 a8 47381 a9 51526 a10 56608
4123 5011 4880 5166 7601 4145 5082
1.68 1.07 1.82 1.08 1.96 1.07 2.10 1.07 2.31 1.10 2.43 1.05 2.57 1.06
基数 100% 100% 100%
100% 100% 100% 100%
人口死亡统计指标
指标
分子
分母
基数
粗死亡率 某年龄组死亡率
同年内死亡人数 同年年龄组死亡人数
婴儿死亡率 新生儿死亡率 围产儿死亡率
5 岁以下儿童死亡率 孕产妇死亡率 某死因死亡率 某病病死率 比例死亡比
同年<1 周岁死亡人数 同年<28 天死亡人数 同年围产期死胎数+死产 数+<7 天死亡人数 同年 5 岁以下儿童死亡数 同年孕产妇死亡数 同年内某原因死亡人数 同年某病死亡人数 同年某死因死亡数
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
二,结构相对数 —构成比(constituent ratio) 构成比(constituent
概念: 概念 : 说明某事物内部各组成部分所占的比 重或分布,又称构成比. 重或分布,又称构成比.
位数 某一组成部分的观察单 构成比= ×100% 同一事物各组成部分的 观察单位总数
计算公式: 计算公式:
10
(11.1+6.1+5.2+2.3+2.3)/5=5.4
常用统计指标
1. 发病率与患病率
某时期新发病人次 发病率= ×1000‰ 同时期平均人口数
调查时患某病人数 患病率= ×1000‰ 调查人数
11
常用统计指标
2. 病死率与死亡率
病死人数 病死率= ×100% 经治疗人数
某地某时期死亡人数 死亡率= ×1000‰ 该地同时期ence Rate) 缺乏各年龄组患病率
25
选择另一地区某年的50岁以上老年妇女原发性 选择另一地区某年的 岁以上老年妇女原发性 骨质疏松症的年龄组患病率P 骨质疏松症的年龄组患病率 i作为标准
用间接法计算标准化患病率( ) 用间接法计算标准化患病率(%)
年龄组 (岁) (1) ) 50~ 60~ 70~ 80 及以上 合计 标准患病率 人口数 城市 预期患病人数 人口数 农村 预期患病人数
基数: % 基数:100%. 构成比可相加 和等于100%. 比可相加, 构成比可相加,和等于 .
13
汉族不同年龄组孕妇携带HBsAg情况 情况 汉族不同年龄组孕妇携带
年龄 (岁) 岁 ≤20 21- - 26- - 31- - 36- - 合计 受检人数 36 985 999 263 44 2327 HBsAg 阳性人数 4 60 52 6 1 123 阳性构 成比(% 成比 %) 3.2 48.8 42.3 4.9 0.8 100.0 阳性率 (%) % 11.1 6.1 5.2 2.3 2.3 5.3
16
第二节 应用相对数的注意事项
17
⒈率与构成比要区分开. 率与构成比要区分开. ⒉分母要选择适当,要够大. 分母要选择适当,要够大. ⒊构成比可相加,和为100%; 构成比可相加,和为 ; 平均率不能由各组率相加后求平均. 平均率不能由各组率相加后求平均. 样本率或构成比的取得应遵循随机化原则, ⒋样本率或构成比的取得应遵循随机化原则, 内部构成不同要用标准化法处理. 内部构成不同要用标准化法处理. 构成比或率比较时, ⒌构成比或率比较时,不能凭表面数值大小下 结论,要考虑抽样误差,需作假设检验. 结论,要考虑抽样误差,需作假设检验.
第 5章
计数资料的统计描述
Statistical Description for Enumeration Data
第二军医大学卫生统计学教研室 张罗漫
1
讲课内容: 讲课内容:
第一节 常用相对数 第二节 应用相对数的注意事项 第三节 率的标准化法 第四节 动态数列及其分析指标
2
1998 年医学期刊中统计学方法的应用情况 年医学期刊中统计学方法的应用情况*
'
乙疗法 原治愈率 (pi) (5) ) 65.0 41.7 — 预期治愈数 (Nipi) (6) = (2)(5) 260 167 427∑Nipi
预期治愈数 (Nipi) (4)= (2)(3) ) 240 140 380∑Nipi
甲疗法标准化治愈率 乙疗法标准化治愈率
380 p= ×100%= 47.5% 53.8% 800
41.5% 42.5%
27
三,应用标准化时的注意事项
1.标准化法只适用于某因素两组内部构成不 标准化法只适用于某因素两组内部构成不 并有可能影响两组总率比较的情况. 同,并有可能影响两组总率比较的情况. 对于因其它条件不同而产生的不具可比性 的问题,标准化法不能解决. 的问题,标准化法不能解决. 2.由于选择的标准人口不同,算出的标准化 由于选择的标准人口不同, 由于选择的标准人口不同 率也不同.当比较几个标准化率时, 率也不同.当比较几个标准化率时,应采 用同一标准人口. 用同一标准人口.
4
概
念
1. 总量指标 — 绝对数 反映事物的规模和水平. 反映事物的规模和水平. 缺点:不利于保密,不可比. 缺点:不利于保密,不可比. 2. 相对指标 — 相对数 是两个有联系的数据的比值. 是两个有联系的数据的比值. 目的:将基数化为相同,便于比较. 目的:将基数化为相同,便于比较.
5
第一节 常用相对数
腮腺炎发病率 36 = ×100%= 20.57% 200 25
8
基数:可取百分率 基数:可取百分率(100%),千分率 % ,千分率(1000‰) 万分率(1/万 ,十万分率(1/10万)等. ,万分率 万),十万分率 万等 使计算结果保留1~ 位整数 位整数. 使计算结果保留 ~2位整数. 平均率不能由各组率相加后求平均, 平均率不能由各组率相加后求平均, 应为分子合计除以分母合计. 应为分子合计除以分母合计.
Pi
(2) ) 21.3 46.1 65.5 71.7 42.1
ni
(3) ) 354 251 130 41 776
ni Pi
(4)=(2)(3) 75 116 85 29 305
ni
(5) 241 315 175 58 789
niPi
(6)=(2)(5) 51 145 115 42 353
26
原发性骨质疏松症标准化患病比 原发性骨质疏松症标准化患病比SPR 标准化患病比
21
(一)直接法
选择人口数作标准 Ni:标准年龄别 人口数 选择人口构成比作标准 Pi:实际年龄别 Ni ××率 ××率 ' P = ∑ P i N:标准人口总数 : N
22
∑Ni P i P = N
'
选择治疗人数之和作标准
直接法计算标准化治愈率( ) 直接法计算标准化治愈率(%)
病型 (1) ) 普通型 重 型 合计 标准治 疗人数 (Ni) (2) ) 400 400 800(N) 甲疗法 原治愈率 (pi) (3) ) 60.0 35.0 —
18
第三节 率的标准化法
19
一,标准化法的意义和基本思想
表 5-4 甲,乙两种疗法治疗某病的治愈率比较 病 型 普通型 重 型 合 计 甲疗法 病人数 治愈数 治愈率 治愈率(%) 300 100 400 180 35 215 60.0 35.0 53.8 病人数 100 300 400 乙疗法 治愈数 65 125 190 治愈率(%) 治愈率 65.0 41.7 47.5
24
1998 年某省城乡女性原发性骨质疏松症患病率比较
年龄组 (岁) (1) ) 50~ 60~ 70~ 80 及以上 合计 调查人数 (2) ) 354 251 130 41 776 城市 患病人数 (3) ) … … … … 322 患病率( ) 患病率(%) (4) ) … … … … 41.5 调查人数 (5) ) 241 315 175 58 789 农村 患病人数 (6) ) … … … … 335 患病率( ) 患病率(%) (7) ) … … … … 42.5
20
二,标准化率的计算
标准化方法 1.直接法(被标化组有年龄别××率) 直接法(被标化组有年龄别××率 直接法 ×× 2.间接法(被标化组缺乏年龄别××率) 间接法(被标化组缺乏年龄别××率 缺乏年龄别×× 间接法 标准构成选择 1. 某一组的人口数或人口构成比; 某一组的人口数或人口构成比; 2. 两组之和的人口数或人口构成比; 两组之和的人口数或人口构成比; 3. 通用的或便于比较的标准. 通用的或便于比较的标准.
14
三,相对比(relative ratio) 相对比(relative
概念: 是两个有关的指标之比, 概念 : 是两个有关的指标之比 , 说明两者 的对比水平, 以倍数或百分数表示. 的对比水平, 以倍数或百分数表示. 计算公式: 计算公式:
甲指标 (×100% ) × 相对比= 乙指标
15
某年某医院出生婴儿中, ● 例:某年某医院出生婴儿中,男性婴儿为 370人, 女性婴儿为 人 女性婴儿为358人, 则出生婴儿性别 人 比例: 比例 女:男=1:370/358=1:1.03 : : ● 1978年国家卫生部颁布的综合性医院 年国家卫生部颁布的综合性医院 床位数与工作人员之比) 床工比 (床位数与工作人员之比): 1:1.3 张床位) : (≤300张床位) 张床位 1:1.4~1.5(300~450张床位) 张床位) : ~ ( ~ 张床位 1:1.6~1.7(≥450张床位) 张床位) : ~ ( 张床位
6
一,强度相对数—率 (rate) 强度相对数—
概念: 说明某现象在其可能发生的范围内 概念: 实际发生的频率或强度,又称率. 实际发生的频率或强度,又称率. 计算公式: 计算公式:
实际发生某现象的观察单位数 率= ×比例基数 可能发生某现象的观察单位总数
7
1999年某幼儿园有 名儿童患了腮腺炎, 年某幼儿园有36名儿童患了腮腺炎 年某幼儿园有 名儿童患了腮腺炎, 该幼儿园有200名儿童(其中 名儿童以 该幼儿园有 名儿童(其中25名儿童以 名儿童 前患过腮腺炎),该幼儿园儿童1999年腮 前患过腮腺炎),该幼儿园儿童 ),该幼儿园儿童 年腮 腺炎发病率是多少? 腺炎发病率是多少?
9
汉族不同年龄组孕妇携带HBsAg情况 情况 汉族不同年龄组孕妇携带
年龄 (岁) 岁 ≤20 21- - 26- - 31- - 36- - 合计 受检人数 36 985 999 263 44 2327 HBsAg 阳性人数 4 60 52 6 1 123 阳性构 成比(% 成比 %) 3.2 48.8 42.3 4.9 0.8 100.0 阳性率 (%) % 11.1 6.1 5.2 2.3 2.3 5.3