(优选)定性变量的统计描述.

合集下载

定性数据的统计描述

定性数据的统计描述
pipininipipi选择某地更大样本的各年龄组患病率选择某地更大样本的各年龄组患病率pipi作为标准作为标准p为标准化率为标准化率pipi为各组原死亡率为各组原死亡率nini为各标准组的人口数为为标准组总人口数总人口数p为标准化率为标准化率为实际死亡率为实际死亡率人数ninipipi根据根据标准标准死亡死亡率率pipi推算推算的的预期死亡死亡率甲乙两校35岁以上知识分子的高血压患病率年龄检查人数病人数患病率检查人数病人数患病率352361667847833690453752772037928739553843899023524102165402591468157241529合计139714010021249109873直接法计算甲乙两校的高血压患病标化率年龄标准组原患病率预患病数原患病率预患病数357146784869049457547205473956556199906110216365559146882152985合计26461002245873253甲校高血压患病标化率pninipipinn2452646926乙校高血压患病标化率pninipipinn2532646956直接法计算甲乙两校的高血压患病标化率口构成比原患病率分配患病率原患病率分配患病率350269867818292690186164502850720205207392106255023399902315610212388165021131468310191529323081000010029298787395867甲校高血压患病标化率ppninipipi9298乙校高血压患病标化率ppninipipi9587间接法计算甲乙两校的高血压患病标化率年龄标准组高血压患病率人数预患病数人数预患病数356902361647833459453753537936551516384582353665247940210015739合计16321397209124914410914407569甲校标化患病率prn1632066991093乙校标化患病率prn三个条件缺一不可1两组资料内部各小组的率明显不同2且各小组观察单位的构成比也明显不同3需要比较两组资料的总率病情治疗人数治愈率治疗人数治愈率40015010020010050400100按不同标准用同一方法对同一资料计算出来的标准化率是不同的

定性变量的统计描述 (2)

定性变量的统计描述 (2)

精品课件
第一节 定性变量频率分布
精品课件
一、多分类变量的频率分布
定性资料 频率分布表/图 分布特征
相对数指标ຫໍສະໝຸດ 频率型指标 强度型指标 相对比指标
频率分布表/图特点:能描述一个全面的分布特征,即 把所有各种可能性的特征都给描述出来。
相对数指标特点:从某个侧面来描述定性变量,尽管不 一定能全面的描写某分布,但有助于统计描述和推断。
分类资料的统计描述常用相对数
往往先统计具有某种属性的个体数,进而 用相对数来描述和比较这类变量。
精品课件
相对数(Relative number)的概念:是两
个具有内在联系的指标之比。
包括
频率 ( Frequency or Proportion) 强度 ( Intensity )
相对比 ( Relative ratio )
精品课件
患病率(%)
男性 女性 30 20 10 0
农民 事业职员 企业工人 商业人员
图3-4 某地区1381例被访者按职业和性别分组的慢性病患病率(%)
精品课件
第二节 常用相对数指标
精品课件
一、频率型指标(Frequency)
指某现象发生的频率,或表示事物内部某个 组成成分所占的比重或分布。
答:
HB 人 P年发 可 病能 率 新 发 发 生 生 高 高 观 血 血 察 压 压 时 1 的 0 人 间 /0 人 1数 00数 0
2835人 9人1年100/01000 1.76人/100人 0 年
即:2003年的高血压发病率为1.76人/1000人年。 据此推测2003年观察人群发生高血压的概率是
精品课件
表3-1 某课题组为了解城乡居民慢性病的患病情况,于 2010年对某地区城乡25个社区的居民进行了调查。课题组 对资料进行了整理,将1381例被访者和284例慢性病患者 按职业分组制成频数表见表3-1

定性数据的图表描述分析

定性数据的图表描述分析

定性数据的图表描述分析内容摘要:数据的整理是为下一步对数据描述和分析打好基础。

实际上在企业管理中有很多问题和现象无法通过数值直接表示出来,因此人们经常使用定性数据来反映对应的定类或定序变量的值。

下面我们介绍如何用图表对定类和定序变量的定性数据值进行整理和描述。

本文通过对单变量和多变量定型数据的图形描述来实现对定性数据图表的全面分析。

首先,我们简单介绍一下定性数据的整理;其次我们从单变量定性数据的图标描述着眼,具体可分为条形图、饼图、累积频数分布表和帕累托图。

最后我们从多变量定性数据的图形描述着眼,具体可分为环形图、交叉表和多重条形图。

这就是本文的全部内容介绍。

关键词:定性数据;单变量;多变量;图表描述Content abstract: the data of the data for the next step is described and analyzed. Actually has a lot of problems and phenomena in the enterprise management can't directly by numerical representation, so people often use qualitative data to reflect the corresponding nominal or ordinal variable's value. We introduce how to use the chart below for nominal and ordinal variables in order and description about the qualitative data values. Based on univariate and multivariate finalize the design of the data graph description to achieve comprehensive analysis of the qualitative data chart. First, we make a brief introduction of qualitative data sorting; Secondly we from single variable on the basis of the icon description of qualitative data, the concrete can be divided into bar chart, pie chart, cumulative frequency distribution table and pareto chart. We finally on the basis of the graph description of qualitative data from multiple variables, concrete can be divided into circular diagram, cross table and multiple bar chart. This is the entire contents of the introduced in this paper.Keywords: qualitative data; Single variable; Many variables; The chart description目录一、定性数据的图表描述 ..................................... - 1 -二、单变量定型数据的图形描述 ............................... - 1 -(一)条形图 ............................................ - 1 -1.组数 ............................................... - 1 -2.组宽度 ............................................. - 2 -3.组限 ............................................... - 2 -(二)饼图 .............................................. - 2 - (三)累积频数分布图 .................................... - 2 -1.排列图法 ........................................... - 2 -2.因果分析图法 ....................................... - 3 -3.事故树分析法 ....................................... - 3 -4.事件树分析法 ....................................... - 3 -5.统计图表分析法 ..................................... - 3 -(四)帕累托图 .......................................... - 3 - 三、多变量定型数据的图形描述 ............................... - 4 -(一)环形图 ............................................ - 4 - (二)交叉表 ............................................ - 4 - (三)多重条形图 ........................................ - 5 - 参考文献................................................... - 5 -一、定性数据的图表描述数据的整理是为下一步对数据描述和分析打好基础。

定性变量的统计描述

定性变量的统计描述

第三节 医学人口统计常用指标
2020/7/1
• 医学人口统计:是从卫生保健的角度研 究和描述人口数量、分布、结构、变动 及其规律,研究人口与卫生事业发展的 关系,是卫生统计学的重要组成部分。
2020/7/1
一、医学人口统计资料的来源
(一)人口普查资料 人口普查(census)是收集、整
理和分析一个国家或一定地区在某一特 定时间的人口、经济和社会资料的全过 程,
即每天医院内发生院内感染的频率是0.47人/100人 日,据此推测平均每天100人中有0.47个患者将在医院 内发202生0/7/1感染。
三、相对比 (relative ratio)
是两个有关联的指标 A与 B,实际应用中简称比( ratio),说明二者的对比水平。
计算公式: 相对比A10% 0 B
K 某 事 件 发 生 的 观 察 单 位 数
折 合 的 可 能 发 生 某 事 件 的 观 察 单 位 数 单 位 时 间
≈ 单位时间内新发生的概率
式中的K为比例基数,可以为100%、1000‰、 10 000/万、100 000/10万等。
2020/7/1
例3-2 某企业2003年有2839名职工,该企业每年都对职工 进行体检,这一年新发生高血压病人5例,试求2003年的 高血压发病率:
(2)所以对这样一个二项分类来说,用一个 20.6%就能描述整个资料的频率分布。
2020/7/1
表3-3 2010年某地区1381例被访者按职业分组的慢性病患病率
➢ 二分类资料,对1381名被访者中,农民患病的频
率占19.8%,不患病的占80.2%。
2020/7/1
30
25
患 20 病 15 率 10 (%) 5

定量变量的统计描述

定量变量的统计描述

定量变量
变 量
定性变量
研 究 内 容
统计描述 统计推断
从资料中获取信息最基本的方法 统计描述:
把握资料基本的特征 为统计分析打下基础
表2-2 120名18-35岁健康男性居民血清铁含量(umol/L)
7.42 20.38 18.36 14.27 14.89 24.52 17.14 14.77 21.75 12.65 8.65 8.4 23.04 17.4 18.37 19.26 13.77 14.37 19.47 18.48 23.02 17.32 24.22 22.55 19.5 26.13 12.5 24.75 15.51 19.83 21.61 29.64 24.13 17.55 17.08 16.99 20.4 12.73 10.86 23.12 21.31 19.69 21.53 16.1 18.12 18.89 20.3 17.25 27.81 19.22 21.46 21.69 11.09 17.98 26.02 18.46 19.38 19.09 21.65 19.22 9.97 23.9 18.89 20.13 11.34 20.87 23.11 16.79 16.32 16.72 22.73 17.45 18.26 21 13.81 17.51 12.67 17.19 20.75 27.9 14.94 19.08 23.29 14.56 10.25 13.12 23.02 19.32 22.11 11.74 20.18 20.52 17.67 19.89 15.94 11.75 24.36 19.59 13.17 24.66 21.62 24.14 15.38 19.82 15.83 17.4 25.61 19.12 17.55 14.18 23.07 23.77 18.61 17.48 18.54 21.36 19.53 15.31 19.26 16.52

定性数据统计描述、统计图表

定性数据统计描述、统计图表
⑴ 0~
人口数 ⑵
82920
死亡 总数 ⑶
其中恶性肿 瘤死亡数 ⑷
4
恶性肿瘤死 亡占总死亡
的% ⑸
2.90
恶性肿瘤死 年龄别死
亡率(1/10 亡率(‰)
万)


20~
63
19.05
25.73
40~ 28161 172
42
60及以
32

合计 167090 715
90
12.59
年龄 (岁)

人口数 ⑵
胃癌 食管癌 肝癌 肺癌
无 无 0.34/10万 无
1.13/10万 0.1/10万 1.64/10万 0.41/10万
19.92/10 万 2.18/10万
25.30/10 万 20.21/10 万
150/10万
35.20/10 万 97.51/10 万 125.10/10 万
313.44/10 万
单选题
已知男性的钩虫感染率高于女性。今欲比较甲乙两 乡居民的钩虫感染率, 但甲乡人口女多于男, 而乙乡 男多于女, 适当的比较方法是( )。
A. 分别进行比较 B. 两个率比较的χ2检验 C. 不具备可比性, 不能比较 D. 对性别进行标准化后再比较
单选题
▪ 已知238名健康人发汞含量的频数分布, 若 用图形进行描述, 则选择( )
▪ 比较不同年代心脏病的发病率的情况, 这就要求正确计算 各年代的发病率。根据率的计算公式, 分子是各年代心脏 病人数, 分母应当是所研究地区和时间内所有的受检人数。
案例分析3
请按照统计表编制的要求修改下表。
表4 1976~1979年吉林市各型恶性肿瘤的死亡率
年龄组

定性资料的统计描述解读

定性资料的统计描述解读

围产儿死亡率(perinatal mortality) 围生期是指从妊娠满28周至出生后7天以内的时期。 是衡量孕前、孕期、产期、产后保健工作质量的敏感指 标之一。
围产儿死亡率
同年围产期死胎数 死产数 7天死亡人数 同年围产期死胎数 死产数 活产数
1000
/千
5岁以下儿童死亡率(child mortality under age 5) 是综合反映儿童健康水平和变化的主要指标。
定性资料的统计描述
定性变量的分布特征 医学人口统计常用指标 疾病统计常用指标Biblioteka 第一节 定性变量的分布特征
定性资料的频数分布 常用的相对数指标 应用相对数应注意的事项
一、定性资料的频数分布
清点不同类别的频数、计算每一类别所占的比重,列于 统计表中,即可反映一个定性变量的频数(频率)分布。
表 某医院2001年住院病人5类疾病的死亡情况
(2)反映死因构成及死因顺位的指标
人口普查(census)是收集、整理和分析、 一个国家或一定 地区、在某一特定时间的人口、 经济和社会资料的全过程。
(二)人口抽样调查资料 (三)人口登记资料
1.生命事件登记 2.人口迁移变动登记 3.户口登记
二、描述人口学特征的常用指标 1.人口总数(population size)
一般指一个国家或地区在某一特定时间的人口数。
指标
分子
分母
基数 指标类型
老年人口系数 少儿人口系数 总负担系数
少儿负担系数 老年负担系数 老少比 性别比
≥65岁人口数 ≤14岁人口数 ≤ 14岁人口数+ ≥ 65岁人口数 ≤ 14岁人口数 ≥ 65岁人口数 ≥ 65岁人口数
男性人口数
人口总数

医学统计学第3版 第5章_定性资料的统计描述讲解

医学统计学第3版 第5章_定性资料的统计描述讲解

1 甲县
经济困难
1 乙县
没有必要
2 甲县
经济困难
2 乙县
经济困难
3 甲县
经济困难
3 乙县
经济困难
4 甲县
没有必要
4 乙县
经济困难
5 甲县
经济困难
5 乙县
没有时间
6 甲县
Байду номын сангаас经济困难
6 乙县
经济困难
7 甲县 8 甲县 9 甲县 10 甲县
经济困难 没有时间 没有时间 其它
7 乙县 8 乙县 9 乙县 10 乙县
[0,1]
常见率的实质
• 频率(frequency)
– 发生比例,即发生某事件的对象所占的比重 – 说明某事件在群体中的发生频度
• 速率(rate)
– 是单位时间内事件的发生频率 – 说明事件在群体中某时期内的发生强度
相对数的分类
• 根据含义或用途不同可以分为:
– 构成比(Proportion) –率
333
6
306
19
639
• 将观察对象按两个定性变量的类别交叉分 组,统计相应的频数形成的频数表,也叫 R×C表
– 行变量,有R个类别,一般存放处理因素 – 列变量,有C个类别,一般存放观测指标
绝对数
• 该变量某个类别在群体中的发生次数
– 与基数有关:观察总次数(或观察对象数)
• 不便于相互比较分析
– 构成比:将事物每个部分的构成比结合在一起, 说明事物的内部构成情况
–率
• 频率(发生比例):说明事物发生频度 • 速率:说明事物单位时间的发生强度或速度
– 比:说明事物间的对比关系或密度情况
应用相对数应注意的问题

定性变量的统计描述

定性变量的统计描述
老少比 :指65岁及以上的老年人口与14岁及以下的 少年儿童人口之比,表示每100名少年儿童对应 多少老年人,是划分人口类型的标准之一。
性别比(sex ratio): 指男性人口与女性人口的比值
表3-5 人口学特征指标
指标
分子
老年(人口)系数 ≥65岁人口数
分母 人口总数
基数 100%
少儿(人口)系数 ≤14岁人口数
“人时”:人×观察时间(年、月)
举例:单位“人年”
➢1个人观察1年
1人年
➢1个人观察10年
10个人观察1年
10人年
➢有3个人,第1个人观察10年
第2个人观察 5年 第3个人观察 1年
16人年
相当于16个人观察了1年
∴ 观察人时的总和=单位时间×折合的观察人数
强度
某事件发生的观察单位数
可能发生某事件的观察单位数 时间
答:
HBP 人年发病率
新发生高血压人数 可能发生高血压的人数 观察时间
1000
/1000
5人 2839 人 1年
1000
/1000
1.76人 /1000 人年
即:2003年的高血压发病率为1.76人/1000人年。 据此推测2003年观察人群发生高血压的概率是1.76‰。
【举例】:在某医院院内感染调查中,5031个病人共观察 了127859人日(人均25.4日,也相当于127859人各观察1 日),其中有596人在医院发生感染,试求其院内感染率?
【举例】 某市1977~1979年肺癌死亡率城区
为19.39/10万,郊区为9.99/10万,比较二者 的严重程度。
答: R= 19.39/9.99=1.94
即城区肺癌死亡率为郊区的1.94倍。

第三章 定性资料的统计描述

第三章  定性资料的统计描述

病人共观察了127859人日(例均25.4日),其中 有596人在医院发生感染,则 院内感染率=596/127859=0.0047人/人日 意味着平均每天有0.47%的病人将在医院获得感染。
(三) 相对比型指标
相对比型指标是A、B两个有联系的指标之比。
对比的两个指标可以性质相同,也可以性质不同。
公式为:相对比型指标=A指标 / B指标
30.86 37.04 24.69 6.17 0 0 1.24
71.43 46.15 166.67 16.67 0 0 10.00
合计
1621
81
100.00
49.97
第二节 死亡率的标准化 P305
一、死亡率标准化的意义和思想
比较两个总率时,若两组资料内部各小组的率有明显差
别,而且各小组内部构成也明显不同时,则不能直接比较。
动态数列的常用分析指标:
一、 绝对增长量 说明事物在一定时期所增加的绝
对数量。可分别计算累计增长量和逐年增长量。 1. 累计增长量:报告年的指标与某一固定年(基 期水平)指标之差。 2. 逐年增长量:报告年的指标与前一年指标之差。
表3-9 某大学1992~2002年本科专业招生动态变化
学生 人数 (3) 4200 4500 4800 4900 5150 5320 绝对增长量 累计 (4) 300 600 700 950 1120 逐年 (5) 300 300 100 250 170 发展速度% 定基比 (6) 100.0 107.1 114.3 116.7 122.6 126.7 环比 (7) 100.0 107.1 106.7 102.1 105.1 103.3 增长速度% 定基比 (8) 7.1 14.3 16.7 22.6 26.7 环比 (9) 7.1 6.7 2.1 5.1 3.3

卫生统计 3 定性变量的统计描述

卫生统计 3 定性变量的统计描述

()
K =⨯⨯∑某事件发生的观察单位数强度可能发生某事件的观察单位数时间K =⨯⨯某事件发生的观察单位数折合的可能发生某事件的观察单位数单位时间
≈ 单位时间内新发生的概率
二、疾病统计指标
•发病率(incidence rate,IR)表示一定时期内,在可能发生某病的一定人群中新发生某病的强度。

•患病率(prevalence rate, PR)又称为现患率,指某时点上受检人数中现患某种疾病的频率,患病率分为时点患病率
(point prevalence rate)和期间患病率(period prevalence rate)。

•治愈率(cure rate)表示受治病人中治愈的频率。

•有效率表示受治病人中治疗有效的频率。

•生存率(survival rate):指病人能活到某一时点的概率
二、发展速度和增长速度
1. 定基发展速度:统一用某个时间的指标做基数,以各时间的指
标与之相比。

2. 环比发展速度:以前一个时间的指标做基数,以相临的后 一时间的指标与之相比。

3.增长速度=发展速度-1。

医学统计学4. 定性数据的统计描述

医学统计学4. 定性数据的统计描述
计算题
已知健康男童体重近似服从正态分布,某年某地 150名12岁健康男童体重的均数为35kg,标准差为 6kg,试估计
1)该地12岁健康男童体重在50kg以上者占该地12岁健康男 童总数的百分比;
2)该地12岁健康男童体重30-40公斤占该地12岁健康男童的 百分比;
3)该地80%的12岁健康男童集中在哪个范围;
应用相对数的注意事项
例如,某医师对口腔门诊不同年龄龋齿患病情况 (表5-3)进行了分析,得出40~49岁组患病率高, 0~9岁组和70岁及以上组患病率低的错误结论。
年龄组(岁)
0~ 10~ 20~ 30~ 40~ 50~ 60~ 70~ 合计
表 5-3 口腔门诊龋齿患者年龄构成
患者人数
患者构成比(%)
一、统计学指标
绝对数:反应实际水平 相对数----两个数值的比,包括: 率 构成比 相对比
(一)率
率:
说明某现象或某事物在它可能发生的范围内实际发 生的频率或强度,又称频率指标或强度指标。
常以百分率(%)、千分率(‰)、万分率(1/ 万)、十万分率(1/10万)等表示,计算公式为:

某时期内实际发生某现象的观察单位数 同时期可能发生某现象的观察单位总数
比例基数
需要注意的是,分母中所规定的平均人口是指可 能会发生该病的人群。
2.患病率: 也称现患率,表示某一时点某人群人口 中患某病的频率,通常用来表示病程较长的慢性
病的发生或流行情况,其计算公式为
某病患病率
某地某时点某病患病例数 该地同期内平均人口数
比例基数
以上比例基数可为100%、1000‰、10000/万、 100000/10万,实际中患病率的分母通常为调查 的总人数,分子为患病的人数。

03定性变量描述性统计

03定性变量描述性统计

患病人数 0 15 94
372 726 1329 689 3225
患病率(‰) 0
4.94 22.12 69.77 192.89 270.23 342.11

某年某市不同年龄居民高血压患病情况
年龄 <20 20~ 30~ 40~ 50~ 60~ ≥70 合计
调查人数 4046 3037 4250 5332 3764 4918 2014 27361
可分为频率型与速率型两大类
11
频率型指标(frequency)—累积率
含义:近似反映某一事件出现的机会(概率)大小 计算公式:
频率型指标= 发生某现象的个体数 比例基数K
观察对象包含的个体总数
K 可以根据具体情况取%、0 00、1万、110万等。
特点:无量纲、无时间概念、在0~1间取值、反映构成 或概率
季节 畸胎例数 百分比(%)

10
10.00

10
10.00

20
20.00

20
20.00

30
30.00

30
30.00

40
40.00

40
Hale Waihona Puke 40.00计算相对数分母应有足够例数
分母过小,相对数波动大
通常对于小样本不计算相对数,直接用绝 对频数表示;或即使计算相对数,也需要 附上总体率的可信区间
时间)
K
K 可以根据具体情况取%、0 00、1万、110万等;时间通常取一年。
特点:多来源于随访性资料、分母中含有时间定义、反映频率密 度、取值有时会超过1(时间取半年、半月)
常用指标有:发病率、死亡率、出生率等
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算公式: 相对比 A 100% B
意义:表示相对于B 的一个单位,A 有多少个单位,
或A为B的若干倍或百分之几。
注意:
1. A和B是绝对数,也可是相对数、平均数。 2. A和B可是同性质的指标,也可是不同性质的指
标,即其量纲可以相同,也可以不同。 3. 但 A 和 B应互不包含。
【举例】
➢ 人口调查中使用的男女性别比例比。 ➢ 某病年龄组发病率之比。 ➢ 甲乙两地亩产量之比 ➢ 医院管理中“医护人员与病床数”之比
定性变量的 统计描述
引 子:
统计学
卫生统计学
变量
定量 变量
定性 变量
多分类 两分类
研 统计描述 究 方 法 统计推断
【举例】
某年甲乙两地发生麻疹流行,甲地发病人 数为300人,乙地发病人数为250人, 甲地发病人数比乙地多50人,能否据此 认为甲地麻疹发病比乙地严重呢? .
目的:比较甲、乙两地麻疹的发病情况。
患病率(%)
男性 女性 30 20 10 0
农民 事业职员 企业工人 商业人员
图3-4 某地区1381例被访者按职业和性别分组的慢性病患病率(%)
第二节 常用相对数指标
一、频率型指标(Frequency)
指某现象发生的频率,或表示事物内部某个组成成 分所占的比重或分布。
计算公式:
频率
发生某现象的观察单位 数 可能发生某现象的观察 单位总数
➢ 二分类资料,对1381名被访者中,农民患病的频
率占19.8%,不患病的占80.2%。
30
25
患 20 病 15 率 10 (%) 5
0
农民
事业职员 企业工人 商业人员
图3-3 2010年某地区1381例被访者不同职业的慢性病的患病率(%)
表3-4 2010年某地区1381例被访者按职业和性别分组的慢性 病患病率
k
频率的特征:
➢分子是分母的一部分; ➢无量纲,在0~1之间取值。
麻疹患者 300人
甲地 30000人
二、强度(intensity)
强度是流行病学、统计学术语,指单位时间内某现 象发生的频率。
计算公式:
强度
某事件发生的观察单位数
可能发生某事件的观察单位数时间
K
特点:
➢ 分母含有时间,指单位时间内的频率; ➢ 其统计学本质为频率强度,即概率强度的近似值。
答:院内感染率 新发病例数 × K
观察人数总和
596人 127859人×1日
× 100%
0.47人/100人日
即每天医院内发生院内感染的频率是0.47人/100人 日,据此推测平均每天100人中有0.47个患者将在医院 内发生感染。
三、相对比 (relative ratio)
是两个有关联的指标 A与 B,实际应用中简称比 (ratio),说明二者的对比水平。
【举例】 某市1977~1979年肺癌死亡率城区
为19.39/10万,郊区为9.99/10万,比较二者 的严重程度。
答: R= 19.39/9.99=1.94
问题1.甲地麻疹发病比乙地严重吗?
绝对数
问题2.该怎样表示两地麻疹发病强度?
相对数
分类资料的统计描述常用相对数
往往先统计具有某种属性的个体数,进而 用相对数来描述和比较这类变量。
相对数(Relative number)的概念:是两个
具有内在联系的指标之比。
包括
频率 ( Frequency or Proportion) 强度 ( Intensity )
表3-2 2010年某地区1381例被访者是否慢性病患者的频率分布
➢ 患慢性病的频率占:284/181=20.6% ➢ 不患病的频率占:1-20.6%=79.4%
(2)所以对这样一个二项分类来说,用一个 20.6%就能描述整个资料的频率分布。
表3-3 2010年某地区1381例被访者按职业分组的慢性病患病率
“人时”:人×观察时间(年、月)
举例:单位“人年”
➢1个人观察1年
1人年
➢1个人观察10年
10个人观察1年
10人年
➢有3个人,第1个人观察10年
第2个人观察 5年 第3个人观察 1年
16人年
相当于16个人观察了1年
∴ 观察人时的总和=单位时间×折合的观察人数
强度
某事件发生的观察单位数
可能发生某事件的观察单位数 时间
相对比 ( Relative ratio )
第一节 定性变量频率分布
一、多分类变量的频率分布
定性资料 频率分布表/图 分布特征
频率型指标
相对数指标 强度型指标
相对比指标
频率分布表/图特点:能描述一个全面的分布特征,即把 所有各种可能性的特征都给描述出来。 相对数指标特点:从某个侧面来描述定性变量,尽管不 一定能全面的描写某分布,但有助于统计描述和推断。
K
某事件发生的观察单位数 折合的可能发生某事件的观察单位数
单位时间
K
≈ 单位时间内新发生的概率
式中的K为比例基数,可以为100%、1000‰、 10 000/万、100 000/10万等。
例3-2 某企业2003年有2839名职工,该企业每年都对职工 进行体检,这一年新发生高血压病人5例,试求2003年的 高血压发病率:
答:
HBP 人年发病率
新发生高血压人数 可能发生高血压的人数 观察时间
1000
/1000
5人 2839பைடு நூலகம்人 1年
1000
/1000
1.76人 /1000 人年
即:2003年的高血压发病率为1.76人/1000人年。 据此推测2003年观察人群发生高血压的概率是1.76‰。
【举例】:在某医院院内感染调查中,5031个病人共观察 了127859人日(人均25.4日,也相当于127859人各观察1 日),其中有596人在医院发生感染,试求其院内感染率?
被访者
53.4
25.2 13.1 8.3
0%
20%
40%
60%
80% 100%
农民 事业职员 企业工人 商业人员
图3-1 2010年某地区调查的被访者和慢性病患者的职业分布
商业人员 11%
企业工人 13% 农民 51% 事业职员 25%
图3-2 2010年某地区慢性病患者的职业分布
二、二分类变量的频率分布
表3-1 某课题组为了解城乡居民慢性病的患病情况,于 2010年对某地区城乡25个社区的居民进行了调查。课题组 对资料进行了整理,将1381例被访者和284例慢性病患者 按职业分组制成频数表见表3-1
表3-1 2010年某地区被访者和慢性病患者按职业分组的频率分布
患者
51.4
25 12.7 10.9
相关文档
最新文档