第3章 定性资料的统计描述
定性资料的统计描述(公式整理)
频数分布表和频数分布图 直接法:均数加权法:直接法:几何均数加权法: 直接法中位数 频数表法 极差 (全距)R直接法 当nx%=INT (nx%)时百分位数 当nx%>INT(nx%)时, P x =x INT(nx%)+1四分位数间距 频数表法四分位数间距 Q u -Q L P 25 ,P 50, P 75总体方差 样本方差直接法加权法比较计量单位不同比较均数相差悬殊对称型(正态分布) 集中位置在中间,左右两侧的频数大致对称分布 类 正偏态:集中位置偏向数值小的一侧(左侧) 型 不对称型(偏态分布)负偏态:集中位置偏向数值大的一侧(右侧)方差 标准差 变异系数 主要用途 定性资料的统计描述集中趋势离散程度分布特征集中描述 适用离散趋势适用均数 单峰对称分布资料 方差和标准差 越大,越离散 单峰对称分布资料 几何均数G对数正态分布, 观察组之间等比 变异系数CV越大,越变异不同计量单位 均数相差较大 中位数M 各种分布 不对称分布, 两端无确切值 分布不明确四分位数间距①偏态分布资料 ②两端无确切值 ③分布不明确资料概念:随机变量X 取各种值的概率称为概率分布规律,简称分布 正态分布就是一种重要的连续型随机变量的分布类型形态:呈对称钟形,在均数处最高,两侧不断降低,逐渐与横轴接近,但不与横轴相交正态分布曲线 密度函数为,分布函数,表示随机变量X 取小于或等于x 的概率①正态曲线在横轴上均数处最高。
②正态分布以均数为对中心,左右对称③正态分布有两个参数,即位置参数μ和形态参数。
特征 若固定,改变μ,曲线沿x 轴平行移动,其形态不变,若固定μ,越小,曲线越陡峭 正态分布 越大,曲线越低平,但中心在x ④正态曲线下的面积分布有规律密度函数标准正态分布(Z 分布) 分布函数标准化变换 估计总体变量值的频数分布查表过高过低均异常→双侧 应用 确定取单侧或双侧参考值 过高异常→上限 过低异常→下限 制定医学参考值范围 主要目的为减少假阳性(确诊)→99%主要目的为减少假阴性(初筛)→95% 服从正态→正态分布法不服从→百分位数法参考值范围正态分布法百分位数法确定适当的百分界限选择制定医学参考值范围方法标态 正态 面积或P -1~168.27% -1.64~1.6490% -1.96~1.96 95% -2.58~2.5899%双侧单侧双侧单侧只有上限只有下限只有上限只有下限95 P2.5~P72.5P5P9599 P0.5~P99.5P1P99。
卫生统计学 定性资料的统计描述
度。速率具有量纲,取值范围是[0, +∞),计算公式如
下:
观察时期内某现象的发生数 强度 = K 可能发生某现象的观察人时数
公式中的比例基数K同频率计算公式。
例3 某企业2003年有2839名职工,该企业每年都对
职工进行体检,这一年新发生高血压病人5例,2003 年的高血压发病率为:
新发生高血压病人数 1000 1000 可能发生高血压的人数1年 5人 = 1000 1000 2839 1年 =1.76人 /1000人年
两个比较指标可以性质相同或不同。
相对比分为:
关系指标:
指两个有关的非同类事物的指标,如医护人员与病
床数之比,住院日数与床位数之比等。 对比指标: 指同类事物的两个指标之比,以达到比较的目的。 如2000年我国出生性别比为116.9。
例8 某市乙型脑炎的发病率1990年为4.48/10万, 2000年为0.88/10万,试计算相对比。
在时间概念上,“时点”没有明确的时间长度,通 根据具体的目的不同,类似患病率的指标还有检出 患病率适用于病程较长的疾病或发病时间不易确定 在一定的人群和时间内,发病率与患病率有着密切 常应该在一个较短的观察时间内,一般不超过一个 率、感染率、带菌率、阳性率等。 的疾病的统计研究,反映疾病在人群中的流行规模 的关系。两者与病程的关系是: 月为宜。而期间患病率是指特定的一段时间,多超 和水平,如慢性病的研究。 患病率=发病率X 病程 过一个月。
一项重要指标。
④ 孕产妇死亡率
该年由于妊娠和分娩及并发症造成的 孕产妇 孕产妇死亡数 = ×10万/10万 某年活产总数 死亡率
国际疾病分类第 10版(ICD-10)对孕产妇死亡定义 该指标不仅可以评价妇女保健工作,而且间接反 2 、间接产科原因:妊娠之前已存在的疾病,由 “与妊娠有关的原因”分为两类: 为:妇女在妊娠期至产后 42天以内,由于任何与 映一个国家的卫生水平。据卫生部公布的资料, 1、直接产科原因:包括对妊娠合并症 (妊娠期、 于妊娠使病情恶化引起的死亡。 分娩期及产褥期 )的疏忽、治疗不正确。 妊娠有关的原因所致的死亡称为孕产妇死亡。 我国孕产妇死亡率已由 2003年的51.3/10万下降到 2007年的36.6/10万。
定性资料的统计描述
25
三、相对比
相对比是互不包含的两个有联系指标之比。 对比的两个指标可以性质相同,也可以性质 不同。 公式为:相对比型指标=A指标 / B指标
注意:在计算相对比中,甲、乙两个指标可 以是绝对数,也可以是相对数或平均数,可 以有不同的量纲,但是互不包含。
27
例: 某年某医院出生婴儿中,男性婴儿为 370人, 女性婴儿为358人,则出生婴儿的 性别比为多少? 性别比为:370 / 358 ×100﹪=103﹪ 说明该医院年每出生100名女婴儿,就有103 名男婴儿出生。
30
2.相对危险度(relative risk,RR)表示在两种相同 条件下某疾病发生的概率之比。即暴露组发病率 与非暴露组发病率的比值。 某地某年男性吸烟和非吸烟的冠心病死亡资料 分组 死亡人数 观察人年数 死亡率 (1/10万人年) 43248 10673 240.5 112.4
吸烟组 104 非吸烟组 12
36
某医院某年住院病人中胃癌患者占5%,则() A 5%是强度指标 B 5%是频率指标 C 5%是相对比指标 D 5%说明胃癌在住院病人 中的比重
37
2.使用相对数时分母不宜过小 某药物 甲治疗100人,50人有效,有效 率为50﹪。药物乙治疗5人,3人有效, 我们能否说乙药有效率为60 ﹪?能否说 乙药比甲药治疗效果好。
9
分娩方式 顺产 助产 顺产 顺产 顺产 剖宫产 顺产 剖宫产 顺产 顺产
妊娠结局 足月 足月 足月 早产 足月 足月 死产 足月 足月 足月
按年龄(2岁一组)与职业整理
年龄 18 20 22 24 26 28 30 32 34 36 38 40 合计 工人 2 9 28 50 50 34 11 14 4 2 3 0 207 管理人员 0 2 7 34 43 35 14 2 2 1 1 0 141 农民 0 6 10 28 25 10 11 3 5 1 1 2 102 商业服务 0 10 24 52 45 34 22 14 3 4 0 0 208
定性资料的统计描述
1. 直接法
选择人口数作标准
P' NiPi N
选择人口构成比作标准
P'
Ni N
Pi
Ni:标准年龄别 人口数
Pi:实际年龄别 ××率
N:标准人口总数
23
选择治疗人数之和作标准
直接法计算标准化治愈率(%)
病型
(1) 普通型 重型 合计
标准治 疗人数 (Ni) (2)
400 400 800(N)
38
6.已知男性的钩虫感染率高于女性。欲比较甲、乙两乡居 民的钩虫总感染率,但甲乡人口女多于男,而乙乡男多 于女,适当的比较方法是( )。
A.分性别进行比较 B.两个率比较的2检验 C.不具可比性,不能比较 D.对性别进行标准化后再比较 E.作两个总率差别的假设检验
39
7.要比较甲乙两厂某工种工人某种职业病患病率的高低, 采取标准化法的原理是( )。
p' 427 100% 53.4% 47.5% 800
24
2. 间接法(以死亡率为例)
选择年龄别死亡率作标准
P' P r P SMR n i Pi
P: 标准总死亡率 ΣniPi: 预期总死亡数
r: 实际总死亡数
r/ΣniPi (SMR) :
ni: 实际组别人口数 标准化死亡比(Standard
n i Pi
(6)=(2)(5) 51 145 115 42 353
27
原发性骨质疏松症标准化患病比SPR
城市
实际患病人数 预期患病人数
322 305
1.05
农村
实际患病人数 预期患病人数
335 353
0.95
原发性骨质疏松症标准化患病率 p’
定性资料的统计描述
同年内死亡人数 粗死亡率= 1000 0 00 当年平均人口数 1年
强度型指标(近似)
同年<1周岁死亡人数 婴儿死亡率= 1000 0 00 当年活产儿总数
频率型指标近似
同年孕产妇死亡数 孕产妇死亡率= 10万/10万 当年活产儿总数
相对比型指标
统计图表
人口统计指标
例:某医生治疗了4例支气管哮喘病患者, 其中3例有效,即报告有效率为75。
请问该说法是否正确?
某医院统计1985-1990年儿科住院病人疾病种类分 布情况见表:
表 某医院儿科住院病人疾病种类分布情况 疾病种类 先天性心脏病 病人数 250 % 23.8
风湿性心脏病
其它
750
2. 人时资料的描述—强度
流行病学随访研究中,不同个体被观察的时间长度各 不相同,常用人时总和表示被观察的人和时间的总和。 “强度”是流行病学、统计学术语。 ——单位时间内(如年、月、日等)某事件发 生的频率。
某事件发生的个体数 强度型指标 K ( 可能发生某事件的个体 数 时间)
强度型指标通常是指一段时间内的平均概率。如人 时发病率的分子是新发生的事件数,分母是人时 数(观察人数乘以时间)的总和,多用于大人群 长时间随访的资料。
常用的相对数指标大致有三种类型:
频率(relative frequency or proportion)
强度(intensity or rate) 相对比(relative ratio)
主要内容
1. 分类资料的描述—频率和频率分布
2. 人时资料的描述—强度
3. 复合指标—相对比 4. 相对数应用中需注意的问题
新发病例数 人时发病率 观察的人时总数 新发病例数 (折合的观察人数 ( )单 位 时 间 的 个 数 ) 院的院内感染调查中,5031名病 人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,请计算院内感染率。
CH03
n +1
B. n +1 a 0 a1 a n D.
n
an C. a 0
n
an 1 a0
E.
n
an a n 1
某部队夏季拉练,发生中暑21 21例 5. 某部队夏季拉练,发生中暑21例,其中北方籍战士为南方籍战士的 2.5倍 2.5倍,则结论为 C . A. 北方籍战士容易发生中暑 B. 南方籍战士容易发生中暑 C. 尚不能得出结论 D. 北方,南方籍战士都容易发生中暑 E. 北方籍战士中暑频率比南方籍战士高 6. 定基比与环比指标是 E . A. 构成比 B.平均数 C. 频率 D.绝对数 E. 相对比
二,描述人口学特征的常用指标
常 用 指 标 人 口 总 数
第二节
医学人口统计常用指标
意 义
根 据 资 料 整 理 的 特 点 , 人 口 总 数 分 为 时 点 人 口 数 : 指 一 个 国 家 或 地 区 在 某 一 特 定 时 间 的 人 口 数 ; 时 期 人 口 数 : 指 某 一 时 期 (或 某 一 年 )的 平 均 人 口 数 . 平 均 人 口 数 常 用 作 计 算 出 生 率 , 死 亡 率 , 发 病 率 等 指 标 的 分 母 . 是 将 人 口 的 性 别 和 年 龄 资 料 结 合 起 来 , 以 图 形 的 方 式 表 达 人 口 的 性 别 和 年 龄 构 成 . 它 以 年 龄 为 纵 轴 , 人 口 构 成 作 为 横 轴 , 左 侧 为 男 , 右 侧 为 女 而 人 口 金 字 塔 绘 制 的 两 个 相 对 应 的 直 方 图 . 人 口 金 字 塔 形 象 直 观 地 反 映 了 现 有 男 女 性 别 人 口 的 年 龄 构 成 , 而 且 也 可 以 分 析 过 去 人 口 的 出 生 死 亡 情 况 以 及 今 后 人 口 的 发 展 趋 势 . 指 老 年 人 口 系 数 及 老 化 的 程 度 . 可 作 为 划 分 人 口 类 型 的 尺 度 . 指 14 岁 及 以 下 少 年 儿 童 人 口 占 总 人 口 的 比 重 , 从 另 一 侧 面 反 映 人 口 老 化 程 少 年 儿 童 人 口 系 数 度 的 指 标 . 其 大 小 主 要 受 生 育 水 平 的 影 响 . 指 每 负 担 系 数 100 名 劳 动 年 龄 人 口 所 负 担 的 非 劳 动 年 龄 人 口 数 , 反 映 了 劳 动 年 龄 人 1 5 -6 4 岁 者 为 劳 动 人 口 , 0 -1 4 岁 65 岁 ( 或 60 岁 ) 及 以 上 人 口 占 总 人 口 的 比 重 , 用 于 反 映 人 口 是 否 老 化
统计学第34章知识点与习题(含答案).446
A. 和各组次数分布多少无关
B.仅受各组标志值大小的影响
C. 受各组标志值和次数共同影响
D.不受各组标志值大小的影响
5、( )时,加权算术平均数等于简单算术平均数
A.当各组次数相等 B.当各组次数不等 C.仅当各组次数都等于 1D.当各组变量值不等
6、四分位数实际上是一种
A 算术平均数
B 几何平均数
4、当一组数据属于左偏分布时,平均数、中位数与众数的大小关系为________。
5、已知 4 个水果店苹果的单价和销售额,要求计算 4 店的平均单价,应用________平均
数。
二、单选题
1、两个总体的平均数不相等,标准差相等,则( )
A.平均数大,代表性大
B.平均数小,代表性大
C.两个总体的平均数代表性相同
C 位置平均数
D 数值平均数
7、已知某局所属 12 个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,
应该采用________
A 简单算术平均法 B 加权算术平均法 C 加权调和平均法 D 几何平均法
8、某公司下属 5 个企业,已知每个企业某月产值计划完成百分比和实际产值,要求计算该
公司平均计划完成程度,应采用加权调和平均数的方法计算,其权数是
第三章 数据资料的统计描述:统计表和统计图
第一节 定性资料的统计描述 知识点: 1、 统计分组就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分
的一种统计方法。 2、 定性数据的频数、频率、百分数、累计频数、累积频率的概念及计算。 3、 定性数据频数分布表示方法主要有条形图、扇形图。
六、计算题
1、2006 年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:
定性资料的统计描述
an: 报告期指标 a0:基期指标
增长速度:表示的是净增长量。
增长速度=发展速度-1
定基增长速度=定基发展速度-1
环比增长速度=环比发展速度-1
三、平均发展速度和平均增长速度
平均发展速度:各环比发展速度的几何均数, 说明某事物在一个较长时期中逐年平均增长 的程度。
平均发展速度=
n
an a0
平均增长速度:各环比增长速度的平均数, 说明某事物在一个较长时期中逐年平均增长 的程度。
如某专业杂志发文 “252例病毒性肝炎分析”
②不能用构成比的动态分析代替率的动态分析。 表 某市1980年和1990年5种传染病情况
疾病 痢疾 肝炎 流脑 麻疹 1980年
病例数 构成比(%) 病例数
1990年
构成比(%)
3604 1203 698 890 902
49.39 16.49 9.65 12.20 12.36
1、疾病统计资料来源:p40 2、疾病与死因分类 疾病命名: 第三 是给疾病起一个特定的名字,使之可区别 节 于其它疾病。(ICD-10)
疾病 统计 常用 指标
疾病分类:疾病分类是根据疾病的某些特征,按 照一定的编码规则对疾病进行统计分类的方法。
ICD是国际疾病分类英文 (International Classification
合
计
150
100.00
1
0%
33.33
20 40%
13.33 60%
26.67 80%
循环系统疾病
6.67 100%
传染病
20%
恶性肿瘤
呼吸系统疾病
消化系统疾病
某医院2001年住院病人5类疾病的死亡情况
3定性资料统计描述
• 例、对某大学学生吸烟状况进行调查,结 果显示该校男性大学生吸烟率为35.12%, 女性大学生吸烟率为1.58%,则该校男女 学生吸烟率之3比5.为12%: 22.23
1.58%
• 即该校男大学生吸烟率是女大学生吸烟率
的22.23倍。
第15页/共45页
• 例、体质指数(BMI)
急性传染 各区急性传染病 各区急性传染病 病发生数 发生数构成比(%) 发病率(1/万)
(3)
(4)
(5)
2433
18.9
38.21
3033
23.5
77.86
1650
12.8
23.58
1503
11.6
45.77
1282
10.0
44.67
1853
14.4
58.36
1130
8.8
73.45
12884
100.0
组的年龄构成比Ni/N乘以被标化组的组别率pi称为事 件分配发生率,分配发生率的累计就是标准化率。
第36页/共45页
三、标准组的选择
• 标准组应选择有代表性的、较稳定的、来自数量较大的人群 的指标作为标准。
• 例如世界的、全国的、全省的、本地区的或本单位历年累计的数据等;
• 也可选择相互比较的人群之一或比较人群的合并人群作为标 准。
• 例、某病两种治疗方法治愈率比较。总治
愈率的差别是由两种疗法内部的病情轻重
构成不一致造成的,而不是疗法本身有差
别。
病情 病人数
轻型
40
重型
60
合计 100
甲疗法 治愈数
36 42 78
治愈率 0.90 0.70 0.78
统计学:定性资料的统计描述
老年负担系数
发达国家较高
总负担系数
14岁及以下人口数 65岁及以上人口数 100% 15 ~ 64岁人口总数
发达国家较低
(3)老少比
65岁及以上的人口数 100% 14岁及以下人口数
老少比
发达国家较高
(4)性别比
性别比
男性人口数 100 女性人口数
不同年龄时期的性别比
(1)人口系数
老年(人口)系数 65岁及以上的人口数 100% 人口总数 14岁及以下人口数 100% 人口总数
发达国家较高
少儿(人口)系数
发达国家较低
(2)负担系数
少儿负担系数 14岁及以下人口数 100% 15 ~ 64岁人口总数 65岁及以上人口数 100% 15 ~ 64岁人口总数
定性资料的统计描述
( qualitative data statistical description 要求: )
1.掌握常用相对数的适用条件及应用
2.掌握医学人口常用统计指标和疾病统计常用指标 3.了解动态数列分析指标及特点
第一节
一、定性资料的构成比
定性资料的分布特征
表3-1 某医院2001年住院病人5类疾病的死亡情况
第二节
医学人口统计常用指标
一、 医学人口资料的来源 (medical population information )
(一)人口普查
人口普查是收集资料、整理和分析一个国家或地区在某一特定时间的人口、经济和社 会资料的全过程。通常由国家政府主持,每隔5~10年进行一次。 建国以来,我国先后进 行了5次人口普查: 1953年、1964年、1982年、1990年、2000年。
1.计算相对数的分母不宜过小 2.分析时不能以构成比代替率(见表) 3.不能用构成比的动态分析代替率的动态分析(见表)
第三章 定性资料的统计描述
病人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,则 院内感染率=596/127859=0.0047人/人日 意味着平均每天有0.47%的病人将在医院获得感染。
(三) 相对比型指标
相对比型指标是A、B两个有联系的指标之比。
对比的两个指标可以性质相同,也可以性质不同。
公式为:相对比型指标=A指标 / B指标
30.86 37.04 24.69 6.17 0 0 1.24
71.43 46.15 166.67 16.67 0 0 10.00
合计
1621
81
100.00
49.97
第二节 死亡率的标准化 P305
一、死亡率标准化的意义和思想
比较两个总率时,若两组资料内部各小组的率有明显差
别,而且各小组内部构成也明显不同时,则不能直接比较。
动态数列的常用分析指标:
一、 绝对增长量 说明事物在一定时期所增加的绝
对数量。可分别计算累计增长量和逐年增长量。 1. 累计增长量:报告年的指标与某一固定年(基 期水平)指标之差。 2. 逐年增长量:报告年的指标与前一年指标之差。
表3-9 某大学1992~2002年本科专业招生动态变化
学生 人数 (3) 4200 4500 4800 4900 5150 5320 绝对增长量 累计 (4) 300 600 700 950 1120 逐年 (5) 300 300 100 250 170 发展速度% 定基比 (6) 100.0 107.1 114.3 116.7 122.6 126.7 环比 (7) 100.0 107.1 106.7 102.1 105.1 103.3 增长速度% 定基比 (8) 7.1 14.3 16.7 22.6 26.7 环比 (9) 7.1 6.7 2.1 5.1 3.3
医学统计学定性资料的统计描述
卡方检验在医学领域应用
疾病与基因型关联分析
01
通过比较不同基因型在疾病组和对照组中的分布差异,判断基
因型与疾病是否有关联。
临床试验效果评价
02
比较不同治疗方法在患者中的疗效差异,如药物疗效、手术效
果等。
医学影像学诊断准确性评估
03
通过比较影像学诊断结果与金标准诊断结果的一致性,评估影
像学诊断方法的准确性。
非数值性
定性资料不以数值形式表示,而是用 文字、符号等描述。
类别性
定性资料通常按照不同的类别或属性 进行分类。
主观性
定性资料的收集和分析往往涉及主观 判断和解释。
常见定性资料类型
分类资料
按照某种特征或属性将数据分成不同的组别,如性别、 血型等。
顺序资料
除了分类外,还具有一定程度的顺序或等级关系,如 病情严重程度、治疗效果评价等。
数分布表。
图表展示技巧与规范
选择合适的图表类型
根据数据的性质和特点,选择合适的图表类 型,如直方图、条形图等。
数据点标识
在图表中标识出重要的数据点,如最大值、 最小值、平均值等。
图表标题和坐标轴标签
为图表添加标题和坐标轴标签,以便读者理 解图表内容。
图例和颜色使用
使用图例说明不同数据系列的含义,并合理 运用颜色以增强图表的可读性。
整性。
02
Fisher确切概率法计算
根据研究目的和假设,选择合适的统计软件或编程语言实现Fisher确切
概率法的计算过程。
03
结果解读与报告
对计算结果进行解读和分析,将结果以图表或文字形式呈现,并结合专
业知识对结果进行解释和讨论。同时,需要注意结果的可靠性和可重复
第3章 定性资料的统计描述
某事件发生的平 均强度
二、应用相对数的注意事项
(一)计算相对数的分母不宜过小 一般来讲,观察单位数足够大时,计算的相对数 比较稳定,能够正确反映实际情况。如果观察单位太 少,直接用绝对数表示。
(二)分析时不能以构成比代替率,也不能以构成比 的动态分析代替率的动态分析。 构成比和率都是相对数,但两者又属不同的概念, 用时应注意两者的区别。
(三)计算观察单位不等的几个率的平均率时,不能将几
个率直接相加求其平均率。正确算法是将几个组的患者数
除以总检查人数。
(四)资料的对比应注意可比性 除了被研究的因素不同外,其余的因素应相同或相近, 应在相同条件下进行率和比的对比。 1. 观察对象同质、研究方法相同,观察时间等保持一 致,以保证资料的可比性。 2. 当两个总率进行比较时,如果内部构成不同,需要
第三章 定性资料的统计描述
一、相对数
相对数是两个有联系的指标之比。
常用的相对数指标:率、构成比、相对比
1、率-频率指标
定 义 公 式 常见率的计算
率的意义
(1)定义:它表示某现象发生的频率和强度。 说明某现象实际发生的例数占可能发生某现 象总数的比值。 (2)公式
率 某现象实际发生的例数 K 可能发生某现象的总数
2)人口抽样调查:与人口普查相比,人口抽样调查相对 省时省力,可以多次进行,也可以一次调查较多的项
目,或者对一个问题进行深入研究。可以在短时间内
得到调查资料和研究结果,根据样本特征推断总体的 相应特征。人口抽样调查是研究者常采用的方法之一。 3)人口登记:是指人口事件发生后随即进行登记。按照 登记人口资料的性质可以分为三类:生命事件登记、 人口迁移变动登记和户口登记。
死亡率:是指某人群在一定时间内死于某病的人
卫生统计学定性资料的统计描述
100%
例7 2004年某研究人员研究了相同年龄段的吸毒者与 非吸毒者的职业构成。
将两组人群各种职业的人数作为分子,分别除以两组 人群的调查总数,得到各种职业的构成比。
表 吸毒与非吸毒人群职业构成对比分析
构成比有两个特点:
①. 各构成比的构成总和为100%; ②. 某一部分所占比重的增减,会相应地影响其它部
卫生统计学定性资料的统计描 述
复习
资料的两种类型 定量变量资料 定性变量资料
统计分析的内容 统计描述 统计推断
统计分析
统计描述:是用统计图(表)、统计指标来描述资 料的分布规律及其数量特征。
统计推断:在医学科学研究中通常应用抽样研究 的方法,即对总体中随机抽取的部分观察单位(样 本)进行研究,然后用样本信息推断总体特征,即 统计推断。
=1.76人 / 1000人年
例4 为探讨EB病毒与鼻咽癌发病的关系, 研究者在某市进 行了EB病毒感染的抽样调查,共检查了25-57岁居民41471 人,其中38550人EB病毒抗体阴性,2921人阳性。以EB病毒 抗体阴性和阳性者分成两组,进行为期12年的队列研究,两 组分别随访了437579人年和20477人年,EB病毒抗体阴性 组发生鼻咽癌54例,阳性组57例。计算两组的累积发病率。
甲地麻疹病率 240 100% 12% 2000
乙地麻疹病率 200 100% 20% 1000
常用的相对数有率、构成比和相对比等。
1. 率
率又称频率指标或强度指标,指某现象实际发生数与 某时间点或某时间段可能发生该现象的观察单位总数 之比,用以说明某现象发生的频率或强度。
根据计算公式中分母的观察单位数是否引入时间因素, 率包括频率型和强度型/速率两类指标。
第三章定性资料的统计描述
一、强度相对数
意义:说明某现象发生的频率或强度,又称为率。常以
百分率(%)、千分率(‰)、万分率(1/万)、十 万分率(1/10万)等表示。
计算:
某时期内发生某现象的观察单位数
率=
×比例基数
同期可能发生某现象的观察单位总数
2020年4月2日星期四
比例基数的选择主要根据习惯用法和 使计算的结果能保留1~2位整数。
可用相邻两年年末(12月31日)人口数的平均值计算年平均 人口数;也可用年中(7月1日零时)人口数代表全年的平均人 口数。
2020年4月2日星期四
徐州医学院卫生事业管理教研室
12
(二) 人口构成及其统计指标
人口学的基本特征包括年龄、性别、文化、职业等,其中 最常用来描述人口构成情况的是性别和年龄。
表3-2 人口学特征指标
指标
分子
分母
基数 指标类型
老年(人口)系数 ≥65岁人口数 人口总数
100% 频率型
少儿(人口)系数 ≤14岁人口数 人口总数
100% 频率型
总负担系数 少儿负担系数
≤14岁人口数 +≥65岁人口数
≤14岁人口数
15~64岁人口数 100% 15~64岁人口数 100%
频率型 相对比型
3、年龄组生育率(age-specific fertility rate,ASFR)又称年 龄别生育率,消除了育龄妇女内部年龄构成不同对生 育水平的影响。
2020年4月2日星期四
徐州医学院卫生事业管理教研室
21
4、终生生育率(life-time fertility rate, LTFR)说明 一批经历过整个育龄期的同龄妇女一生的实际生 育水平。
徐州医学院卫生事业管理教研室
卫生统计学第7版 方积乾主编 课件第三章 定性资料的统计描述
为年龄别生育率;Lx为女性寿命表中各年龄组平均存活率。
NRR>1,表明未来人口将增加,NRR<1,表明未来人 口将减少。
2018/3/7 24
9.婴儿死亡率(infant mortality rate , IMR)
同年 1周岁死亡人数 IMR 1000/ 1000 同年活产儿总数
活产的世界卫生组织(WHO)定义为:新生儿分娩 后有呼吸、心跳、脐动脉搏动等生命现象者称为活产。婴
个月内某病发生84人,月发病率=84/10000×3=28/万
2018/3/7
7
三、相对比
相对比( relative ratio )简称为比( ratio ),是 A , B 两个有关指标之比,说明A是B的若干倍或百分之几,通常 用倍数或分数表示。计算公式为
A 比 (或× 100%) B
两个比较指标可以性质相同,也可以性质不同。如相 对危险度(RR)、变异系数(CV)等;A、B两个指标 可以是绝对数、相对数或平均数等。
分为时点人口数和平均人
时点人口数:7月1日零时人口数。
平均人口数:相邻两年年末人口数的平均值。常用于 计算出生率、死亡率、发病率等指标的分母。
2.人口构成及其统计指标 (1)人口金字塔(population pyramid) 人口金字塔是以图形的方式表达人口的性别和年龄构成。
2018/3/7
13
2018/3/7
儿死亡率被公认为是反映居民健康水平、社会经济及卫生
服务水平,特别是妇幼卫生服务质量的敏感指标。它不受 人口构成的影响,不同的国家和地区可直接进行比较。同
时婴儿死亡率是编制寿命表的重要指标,直接影响到预期
寿命的高低。
2018/3/7 25
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表36 测量生育水平的统计指标
指标
分子
分母
基数
指标类型
粗出生率
同年活产数
同年平均人口数×1年
1000/千 强度型(近似)
总生育率 年龄别生育率
总和生育率
同年活产数
同年15~49岁妇女数
同年某年龄组活产数
同年某年龄组平均妇女数×1 年
是1549岁年龄别生育率的总和
1000/千 1000/千
相对比型 强度型(近似)
n医学人口统计不仅是制定卫生工作计划及确定卫生政策的重要依据,也 是了解人群健康水平及评价卫生工作效果的重要依据。
2
(一)医学人口统计资料的来源
n 1、日常工作记录(报告单、卡、册) n 2、统计报表 n 3、人口调查(抽查和普查)
3
(二)描述人口学特征的常用指标
1、人口总数
一般指一个国家或地区在某一特定时间的人口数 一般采用一年的中点,即7月1日零时为标准时点进行统计 统计人口数的方法:实际制 和 法定制
4
2、人口学特征指标
人口学的基本特征包括性别、年龄、文化、职业等,其中最常用来描
述人口结构的是年龄和性别。常用人口学指标如下:
表35 人口学特征指标
指标 老年(人口)系数 少儿(人口)系数 总负担系数
少儿负担系数 老年负担系数 老少比 性别比
分子
≥65 岁人口数 ≤14 岁人口数 ≤14 岁人口数 + ≥65 岁人口数 ≤14 岁人口数 ≥65 岁人口数 ≥65 岁人口数 男性人口数
9
n 5岁以下儿童死亡率(child mortality rate under age 5)是近些年来国 际组织推荐并应用较多的综合反映儿童健康水平和变化的主要指标。
n 死因别死亡率(causespecific death rate,CSDR)指某种原因(疾病) 所致的死亡率,也称某病死亡率。死因别死亡率是死因分析的重要指 标,它反映各类病伤死亡对居民生命的危害程度。
284
100.0
2
表3-1的第(1)栏“职业”是一个四分类变量,第(3) 栏显示本次调查的1381名被访者不同职业的频率分布,其 中, 被访农民的频率最高, 为 53.4%;表3-1的第(5)栏 是本次调查得到的慢性病患者不同职业的频率分布,其中 农民患者的频率最高,为51.4%。
频率分布的特点是,定性变量各类别的频率之和为 100%。
分母 年平均人口数×1年 同年某年龄组平均人口数×1年 同年活产儿总数 同年活产儿总数 同年围生期死胎数+死产数+活产 数 同年活产儿总数 同年活产儿总数 同年平均人口数×1年 同年患该病总数 同年内死亡总数
基数 1000/千 1000/千 1000/千 1000/千 1000/千
1000/千 10万/10万 10万/10万 100% 100%
n 婴儿死亡率(infant mortality rate , IMR),指某年活产儿中未满1周岁 婴儿的死亡频率,是反映社会卫生状况、婴儿保健工作以及人群健康 状况的重要指标之一,也是死亡统计指标中较敏感的指标。
n 围生儿死亡率(perinatal mortality rate)是衡量孕前、孕期、产期、 产后保健工作质量的敏感指标之一。
n 净再生育率(net reproduction rate,NRR)是在粗再生育率的基础 上扣除了母亲一代所生的女儿中049岁的死亡数,剩下的即为真正能 取代母亲一代的女儿数。
7
3、死亡统计指标
死亡统计主要研究人群的死亡水平、死亡原因及其变动规律。
表37 人口死亡统计指标
指标 粗死亡率 年龄别死亡率 婴儿死亡率 新生儿死亡率
n 病死率(fatality rate, FR)指在某一期间内(1年)患某病者因该病 死亡的百分比,可说明一种疾病的严重程度,也可反映一个医疗单位 医疗水平和质量。
10
(2)死因构成及死因顺位的指标
n 死因构成比(proportion of dying of a specific cause),也称比例死亡 比(proportionate mortality rate, PMR)或相对死亡比,指全部死亡人 数中,死于某死因者所占的百分比,说明各种死因的相对重要性。
9
5、统计地图(statistical map)
主要用于表示某种现象在地域空间上的分布,根据不同地方 某种现象的数值大小,采用不同密度的线条或不同颜色绘在地图 上,有助于分析该现象的地理分布特征。
10
(四)小结
u 1、医学中的定性资料可通过频率分布进行全面的统计描述。 u 2、根据资料的性质和分析目的选择最合适的统计图形来进行描
分母 人口总数 人口总数 15~64 岁人口数
基数 100% 100% 100%
15~64 岁人口数 15~64 岁人口数 ≤14 岁人口数 女性人口数
100% 100% 100% 100%
指标类型 频率型 频率型 相对比型
相对比型 相对比型 相对比型 相对比型
5
(三)生育和人口死亡的常用指标
1、测量生育水平的统计指标
n 死因顺位是指按各类死因构成比的大小由高到低排列的位次,说明各 类死因的相对重要性。 当死者患有多种疾病和损伤时,必须从中选出一种最重要的致死原因
作为死者的死因,称基本死因(underlying death cause)。
11
(四)小结
1、医学人口统计资料主要来源为日常工作记录(报告单、卡、册)、统 计报表和人口调查三个方面。 2、描述人口学特征的常用指标有人口总数和人口学特征指标(年龄、性 别)。 3、有关生育的常用指标有出生率、生育率和人口再生产指标。 4、常用的死亡统计指标有粗死亡率、年龄别死亡率等。
7
(3) 计算相对数时分母应有足够数量 例 甲医院治疗某类患者100人,40人有效;
乙医院治疗同类患者5人,2人有效。 有效频率均为40% !
如果资料的总例数过少,计算得到的相对数偏差可能会很大,直 接报告原始数据更为可取:
甲医院有效率 40/100 乙医院有效率 2/5
8
(4)正确计算合计频率
围生儿死亡率
5岁以下儿童死亡率 孕产妇死亡率 死因别死亡率 某病病死率 死因构成比
分子 同年内死亡人数 同年某年龄组死亡人数 同年<1周岁死亡人数 同年<28天死亡人数 同年围生期死胎数+死产数+<7天死亡人 数 同年5岁以下儿童死亡数 同年孕产妇死亡数 同年内某原因死亡人数 同年某病死亡人数 同年某死因死亡数
类型 强度型(近似) 强度型(近似) 频率型(近似) 频率型(近似) 频率型(近似)
相对比 相对比 强度型(近似) 频率型(近似) 频率型(近似)
8
(1)测量死亡水平的指标
n 粗死亡率(crude death rate,CDR), 简称死亡率(mortality rate), 指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。
频率型、强度型和相对比型 u 实践中要注意每个指标的定义和性质, 不可简单地望文生
义。
12
第三章 定性资料的统计描述
三、医学人口统计常用指标
1
n 医学人口统计(medical demography)是从卫生保健的角度研
究和描述人口数量、分布、结构、变动及其规律,研究人口与卫生事业发 展的相互关系,是卫生统计学的重要组成部分。
6
2、测量人口再生育的统计指标
测量人口再生育的情况必须从出生及死亡两方面考虑,常用的统计 指标有自然增长率、粗再生育率和净再生育率。
n 自然增长率(natural increase rate,NIR)是粗出生率(CBR)与粗 死亡率(CDR)之差,即NIR=CBR-CDR。
n 粗再生育率(gross reproduction rate,GRR)是指每个妇女一生平 均生育的女儿数,GRR = 总和生育率×女婴占出生婴儿的比例。
表 31 2010 年某地区被访者和慢性病患者按职业分组的频率分布
职业 (1)
被访者
例数
频率 (%)
(2)
(3)
例数 (4)Leabharlann 患者频率(%) (5)
农民
738
53.4
事业职员
348
25.2
企业工人
180
13.1
146
51.4
71
25.0
36
12.7
商业人员
115
8.3
31
10.9
合计
1381
100.0
例 甲医院治疗某类患者150人,治愈30人,治愈率为20%;
乙医院治疗同类患者100人,治愈30人,治愈率30%; 两医院合计治愈率为:
治愈率 = 30 + 30 ´100% = 24% 150 + 100
不可将两个频率相加除以2: 治愈率 ¹(20% + 30%)2 = 25%
9
(5)注意资料的可比性
强度
=
发生某事件的观察单位数
å(可能发生某事件的单位数 ´ 观察时长)´
K
其中,K可以是100%、1000/1000、105/105等。
3
例 :某企业2003年有2839名职工,该企业每年都对职工进
行体检,这一年新发生高血压病人5例,2003年的高血压 发病率为
新发生高血压病人数
å 可能发生高血压的人数´1年 ´1000 /1000
6
2、百分条图(percent bar chart)
用于表示事物内部各部分的比重或所占比例。
7
3、圆图(pie chart)
圆图的用途与百分条图相同。它用圆的面积表示事物 的全部,用各扇形的面积表示各个组成部分所占比例。
8
4、线图(line chart)