人群健康研究的统计学方法共223页
人群健康调查与统计分析
人群健康调查与统计分析近年来,随着生活水平的提高,人们越来越重视健康问题。
然而,如何进行全面、科学的调查和分析,从而制定合理的健康政策,仍然是一个值得研究的问题。
一、调查方法人群健康调查有很多方法,如门诊、问卷、面谈等等。
其中,问卷调查是最常用的一种方法。
通过问卷调查我们可以得出小样本人群的信息,从而了解他们的健康状况、饮食习惯、运动情况等方面的情况。
在编制问卷时,需要充分考虑到问卷内容的科学性和可行性,避免出现问题导致数据的不准确性。
二、调查重点在制定调查重点时,需要考虑到不同阶段的人群有不同的健康需求,而且不同阶段的人群可能有不同的健康风险因素。
因此,我们可以将调查重点分为以下几个方面:1、儿童和青少年的健康问题:儿童和青少年是国家的未来和希望,他们的健康问题需要引起足够的重视。
在调查中,需要关注他们的生长发育情况、营养状况、体育锻炼和心理健康等方面的问题。
2、成年人和老年人的健康问题:成年人和老年人面临的健康问题更加复杂和多样化。
在调查中,需要关注他们的慢性病患病率、心血管疾病风险、骨质疏松等老年人特有的健康问题等方面的问题。
3、特殊人群的健康问题:特殊人群包括孕妇、残疾人和重大疾病患者等。
在调查中,需要关注他们的孕期保健、残疾人康复和护理、重大疾病的治疗和康复等方面的问题。
三、统计分析方法在获得了足够的数据后,需要进行统计分析。
常用的统计分析方法包括描述性统计和推论性统计等。
1、描述性统计:描述性统计旨在对已有的数据进行整理和归纳,包括计算平均数、中位数、众数、标准差等指标,从而对人群的健康状况进行描述和总结。
通过描述性统计,可以分析人群的健康问题的发生率、患病率、死亡率等,从而为制定政策提供依据。
2、推论性统计:推论性统计旨在对未知的总体参数进行推断和估计,包括假设检验、方差分析、回归分析等方法。
通过推论性统计,可以分析不同因素与健康问题的相关性,从而为制定政策提供更为具体和深入的依据。
第九章 人群健康研究的统计学方法-统计表与统计图
描述分类资料的各类别所占的构成比。
图10-1 2002年某医院1402例孕妇分娩结果
3. 线图(line graph)
用线段的升降表示某事物动态变化,或某现象随另一
现象变化的趋势。适用于连续性资料 纵轴:统计指标,算术尺度,以“0”为起点 横轴:连续性变量(时间、年龄等),算术尺度
3、统计表的种类
简单表 只有一个分组标志(主语只有一个层次) 组合表 有两个以上分组标志(主语有两个以上层次)
表 2 不同年龄农村儿童男女舒张压测定结果 年 龄 男 6岁 10 岁 14 岁 175 210 132 人数 女 172 197 140
舒张压(kPa) ( X S )
男 7.49 1.12 7.91 1.20 8.47 1.17
“0”之间的间距过大时,可以采取折断的符号将纵轴折断
各矩形条之间不留空隙,矩形的高度为频数或频率,宽度为 组距
µ ý ¨Ë ý © Æ Ê £ È Ê £
10 15 20 25 0 5
3. 20 « ¡ « ¡ « ¡ « ¡ « ¡ 70 5. 5. 5. 5. 90 « ¡ 00 30 60 6. « ¡ « ¡ « ¡ « ¡ 20 50 80 10 40 3. 3. 4. 4. 4.
复式条图(clustered bar chart ) : 多个分组标志、一个统计指标
180
死亡率( 1 / 1 0 万)
150 120 90 60 30 0 肺结核 心脏病 恶性肿瘤
1972 1952
图1 2 - 6 某地两年三种死因别死亡率(1/10万)比较
绘制条图的注意事项
纵轴的刻度必须从“0”开 始,否则会改变各对比组 间的比例关系。
《预防医学》人群健康研究的统计方法 ppt课件
统计学
医 学 统 计 学 的 基 本 概 念 和 步 骤
计 量 资 料 的 统 计 描 述
计 量 资 料 的 统 计 推 断
计 数 资 料 的 统 计 描 述
计 数 资 料 的 统 计 推 断
相 关 与 回 归
医学统计学简介
一、医学统计学的定义
统计学是一门研究数据的科学。它指导人们在科学实践中 如何有效地获取数据、正确地分析数据以及合理地解释所 得到的结果。 医学统计学是统计学的一个分支。它是把概率论和数理统计
偶然因素的影响,导致同一研究对象在多次测定中结果
不一致的情况。应控制在允许范围内。
3.抽样误差 由于抽样而使某变量值的统计量与总体参数不相同。 抽样误差不可避免,但它可以用统计学方法处理。
五、概率
概率(probability)
描述随机事件发生可能性大小的数值,常用P表示。
小数或百分数。
P值的范围:介于0和1之间。
五、医学统计学的应用
返回 目录
第二章 计量资料的统计描述
第一节
计量资料的频数分布
例 某农村地区 2001年 14岁女孩的身高资料如下,请编制频数表 和观察频数分布情况。 表 某农村地区2001年14岁女孩的身高资料(cm)
一、频数分布表及其制作
1.计算极差或全距(range) 常用R表示
•
4. 专题调查或实验
要求:及时、完整、准确 参与搜集资料人员的选择是关键。 高素质、有相关专业基础、以往曾有类似研究经历 严格培训和管理
三、资料整理(data sorting)
目的:将搜集到的原始资料系统化、条理化,便于进一 步计算统计指标和深入分析。 整理前:要对资料再次检查与核对,发现缺项或错项较 多的调查表,须补查或剔除。 审查无误后,设计分组
第4章人群健康研究
(五)概 率
概率 (probability) 是描述某事件或某现象发生的 可能性大小的一个度量,用符号P来表示 。根据事件 发生可能性的大小,将所有事件分为三类:在一定条 件下,肯定发生的事件称为必然事件,肯定不发生的 事件称为不可能事件, 可能发生也可能不发生的事件, 称为随机事件或偶然事件。必然事件的概率等于1, 不 可能事件的概率等于0,随机事件的概率介于0与1之间。
(二)总体和样本
总体(population)是根据研究目的所确定的同 质的观察单位的全体。 样本(sample)是从总体中随机抽出的部分有代 表性的个体。 所谓随机,即总体中的每一个个体均有同等的 机会被抽取。这种从总体中抽取部分个体的过程称 为抽样(sampling)。 样本所包含的个体数目,称为样本含量或样本 大小,用n表示。
6.36 4.60 5.09 4.47 3.56 4.23 4.34 5.18 5.69 4.25 6.30 3.95 4.03 5.38 5.21 7.22 4.31 4.71 5.21 3.97
5.12 4.55 4.90 3.05 5.20 4.74 5.54 3.93 3.50 6.38
(1)求全距: 全距(range)又称极差,是观察值中最大值与最小值 之差,用R表示。即: R=Xmax-Xmin (公式4-1) 式中:R—全距Xmax—最大值Xmin—最小值 本例最大值Xmax=7.22mmol/L, 最小值Xmin=2.70mmol/L,R=7.22-2.70=4.52(mmol/L)。 (2)定组段数、组距: 组段数一般分8~15个组为宜,根据全距和组段数确 定组距(i)。组距可用公式4-2进行估算。 i=R/k (公式4-2) 本 例 i=4.52/10=0.452(mmol/L) , 为 方 便 计 算 , 取 0.5mmol/L作为组距。
人群健康研究的统计学方法定量资料的统计描述、正态分
6
图3.2 不同均数μ、不同标准差σ的正态分布示意图
பைடு நூலகம்
x 1.96s
表3.1 110名7岁男童身高频数实际分布与理论分布的比较
xs x 1.64s x 1.96s x 2.58s
身高范围(cm)
121.95 1(4.72) 121.95 1.64(4.72) 121.95 1.96(4.72) 121.95 2.58(4.72)
116.5 121.95
u1
4.72
1.15
u2
119.0 121.95 4.72
0.63
正态分布的应用
临床参考值范围的制定
1.选取适当数量的“正常”人 2.控制测量误差 3.确定单、双侧 4.确定适当的范围大小 5.确定正确的统计方法—正态分布法
百分位数法
统计分析—统计描述 统计推断—参数估计 假设检验
117.23~126.67 114.21~129.69 112.70~131.20 109.77~134.13
估计频数比例% (频率)
68.27 90.90 95.00 99.00
实际频数 实际频率 %
75 68.18 99 90.00 104 94.55 109 99.10
标准正态分布
-3
-2
t 分布
f(x)
0.40
0.30
ν ─>∞ (标准正态曲线) ν =5
ν =1
0.20
0.10
0.00
-5.0
-4.0
-3.0
-2.0
-1.0
0.0
1.0
2.0
3.0
4.0
5.0
t
人群健康研究的统计方法2009
三类资料间关系
例:一组2040岁成年人的血压值
<8 低血压
等 级 资 料
8
12
正常血压
轻度高血压
计量资料
15
17
中度高血压
重度高血压
计数资料
以12kPa为界分为正常与异常两组,统计每组例数
实例数据
第八章 数值变量资料的 统计描述
一、计量资料的统计描述
平均指标(算术均数、几何均数、中位数)
人之一,英国人K . Pearson(1857-1936)于1900
年提出的一种具有广泛用途的统计方法,此方法
以χ 2分布为理论依据,可用于两个或多个率间的
比较,计数资料的关联度分析等等。
1、四格表资料的卡方检验
表 组 别 两组降低颅内压有效率的比较 有效 无效 合计 有效率 (%)
试验组
对照组 合 计
3.相对比
相对比:反映两个指标(指标可为绝对数、相对数;性质 相同或不同)相比的倍数或百分数。
甲指标 相对比 (倍数或百分数%) 乙指标
例:某医院出生性别比=男性婴儿数/女性婴儿数 =370/358=1.03(或 103%) 医护比=医生人数/护士人数
第十一章 分类变量资料 的统计推断
χ 2检验(Chi-square test)是现代统计学的创始
2.单、双侧问题:
双侧 :
血清总胆固醇无论过低或过高均属异常
白细胞数无论过低或过高均属异常
单侧上限 :
如:血清转氨酶、体内有毒物质过高异常 单侧下限 : 如:肺活量过低异常 单双侧常依据医学专业知识而定。
3. 医学参考值范围有90%、95%、99% 等, 最常用的为95% 。 计算医学参考值范围的常用方法:
人群健康研究的以学统计学方法 PPT课件
第三篇 第十三章
概 率probability
第三篇
人群健康研究的统计方法
内 容
1 3 2 概述 统计学中的几个基本概念
3 4
统计资料的类型
统计工作的基本步骤
第三篇 第十三章
案例1
某小儿科教授通过多年的观察,发现他治疗的 小儿巨结肠病人中,天门市占的比例最大。 该教授据此认为天门市小儿巨结肠发病率最高
问:此结论是否正确?
第三篇 第十三章
案例2
两种疗法治疗脑血管梗塞效果比较 疗 法 甲疗法 乙疗法 合 计 有效 25 29 54 无效 6 3 9 合计 31 32 63 有效率(%) 80.65 90.63 85.71
问:乙疗法的效果真的比甲疗法好吗?
第三篇 第十三章
案例3
甲乙两校 35 岁及以上知识分子的高血压患病率 甲校
年龄(岁) 检查人数 病人数 患病率(%)
十堰市全部 十岁男童
部分 10岁 男童
第三篇 第十三章
第一节 统计学中的几个基本概念
参数 parameter 统计量 statistic
描述总体特征的统 计指标,用希腊字 母表示
由样本的信息所计 算的统计指标,用 拉丁字母表示。
第三篇 第十三章
例3 参数与统计量 十堰市所有10岁男孩平均身高就 是一个参数( ) ,而根据样本 所计算出的平均身高值则是一个 统计量( X )。
拓宽医学研究思路
使医学科研设计科学合理,达到低耗高效的目的
任务
获得准确可靠的资料
科学分析、评价、解释研究结果
第三篇 第十三章
一、概述
提高其医学研究与实践成果的可靠性与可信性 确保科学研究工作的质量
作用
人群健康研究的统计学方法(预防医学课件)
处理 通过实验设计加以控制
5. 变量及变量值
研究者对每个观察单位的某项特征 进行观察和测量,这种特征称为变 量,变量的测得值叫变量值 (也叫观察值)。 统计上习惯用大写拉丁字母表示变 量 ,如X、Y 、Z、… 。 变量值习惯用小写拉丁字母表示 , 如性别x1=1 (男) 、x2 =1 (男)、x3 =0 (女) 、…。
3. 参数与统计量 parameter and statistic
参数:总体的统计指标,如总体均数、标准差,采
用希腊字母分别记为μ、σ。 (为固定的常数)
统计量:样本的统计指标,如样本均数、标准差,采用拉
丁字母分别记为 X、S 。 (参数附近波动的随机变量 )
总体
抽取部分观察单位 样本
参数
统计量
推断inference
本节导言
第三节 数值变量资料的统计分析
无论何种类型的资料,其统计分析都是从两个层面上进行的,即统计描述与统计推 断。数值变量资料的统计描述又是从两个角度进行的,即集中趋势和离散趋势。
学习目标
1. 知道集中趋势和离散趋势的描述。 2. 简述均数的抽样误差及其表达、总体均数估计。 3. 应用:定量资料假设检验。
平均数 μ
本节导言
第二节 统计工作的基本步骤
医学统计工作的步骤类似于科研工作的步骤,一般分为四个:设计、搜集资料、整 理资料和分析资料。任何一个步骤的缺陷,都会影响统计分析结果的真实性和结论的可 靠性。
第十章 人群健康研究的统计学方法
或 lg G
lg 2 lg 2 lg 4 lg 4 lg 8 lg 8 lg 8 lg 8 lg 32 lg 32 0.845 10 G lg 1 0.845 7
故其平均滴度为1﹕7。
33
几何均数的应用 # 几何均数各观察值呈倍数关系或服 从对数正态分布的资料,如抗体平均 滴度、血清平均效价。
3.80~ 4.00~ 4.20~
— — 正
4、归纳计数,列出频数。
23
某地140名正常成年男子红细胞数(1012/L)频数表
组段 3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~ 6.00 合计 组中值 3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90 - 频数 2 6 11 25 32 27 17 13 4 2 1 140 频率(%) 1.4 4.3 7.9 17.9 22.9 19.3 12.1 9.3 2.9 1.4 0.7 100.0
21~30
77 34 55 45 70 42 38 06 45 18 60 75 86 90 68 22 00 27 69 85 91 51 67 62 44
患者编号 随机数字 分组
1 9 甲
2 5 甲
3 8 乙
4 4 乙
5 2 乙
6 9 甲
7 4 乙
8 9 甲
9 4 乙
10 1 甲
9
(三)抽样研究和抽样误差
1
推导过程
31
几何均数计算公式推导过程
32
例 10 人的血清滴度为 1∶2 , 1∶2 , 1∶4 , 1∶4 , 1∶ 8 , 1∶8 , 1∶8 , 1∶8 , 1∶32 , 1∶32 ,求其平均滴度 。G 2 2 4 4 8 8 8 8 32 32 7
人群健康的研究方法
医学统计方法的基本内容:1、试验设计与调查设计2、总体参数的估计3、显著性检验4、联系关系的测定5、多因素分析(多元线性回归、逐步回归、判别分析、聚类分析、因子分析、主成分分析)6、健康统计(寿命表、生存分析、死因分析和人口预测)统计资料:计量资料(t检验、方差分析、相关与回归)、计数资料(卡方检验)、等级资料(秩和检验)。
三个资料之间可以相互转化。
误差主要有三种:系统误差(可校正)、随机测量误差和抽样误差随机方式:抽签、摸球、掷硬币和使用随机数字表条形图适用于按性质分组的计数资料,各组之间没有量的连续型,各自独立。
折线图适用于按数量标志分组,各组具有量的连续性的资料散点图(表示两个变量之间的相关性)构成图适用于计数资料的构成指标和等级资料T检验用于两样本均数的比较时,标准误需要用合并标准误。
公式见171页当量样本含量较大时,可用u检验法(n>100),单侧检验u=1.64,P=0.05,u=2.33,P=0.01;双侧检验时,u=1.96时,P=0.05,u=2.58,P=0.01。
公式见173页两几何平均数均数的比较(等比),小样本变量需要取对数在进行T分布比较,大样本变量需要取对数在进行u分布比较,使用简捷法计算加权平均,公式见154页不给出均值做T检验对比处理效果时需要选取中位数利用简捷法计算加权平均。
单侧双侧的选择,比较新药旧药的疗效,事先不知道差别,双侧检验;若知道新药比旧药好,则使用单侧检验,t分布单侧检验0.025相当于双侧检验0.05。
在计数资料中,常用的相对数为率,构成比和相对比。
治愈率一般用百分率,出生率和死亡率一般用千分率,某病死亡专率习惯用十万分率。
定基比统一用某个时期(如初期)的数据作为基数,以各时期的数据与之对比,反映各时期相对于基数的变化趋势。
可以用来观察总体趋势环比用前一个时期的数据作为基数,以相邻后一时期的数据与之对比,是循环比较,反映动态数列的逐期变化趋势。
人群健康状况的调查方法
2.深入调查
是在初步调查的基础上,收集更充分的资料来证实或否 定已提出的假设。
主要内容有: (1)病例调查:根据制订的调查表或调查提纲对此次爆
发中的全部病例进行调查,查明病例的实际发生数,以及发 病的时间、单位与人群分布,要注意首发病例。
(2)对照调查:在病例调查的同时,对同一人群内未患 病的人进行调查,以便与病例组作比较。
据,将调查表设计成编码式
第九页,共101页
表5-2 吸烟调查表举例
第十页,共101页
三、培训调查人员
流行病学调查的成败与调查员工作质量的好坏有直 接关系。调查工作是复杂细微的工作,在正式实施调查 前,应对调查人员进行培训,使其具备一定的流行病学 知识,充分了解调查问题的重要性,调查的目的和要求, 调查方法的原理与调查项目的意义等。具体培训内容包 括:明确调查目的和意义、掌握调查的基本要求和技巧, 统一调查方法和标准。例如,对血压的测定方法,就要 统一器械,统一测量方法,统一判断标准。
5.确定调查方式 6.确定实施方案
第五页,共101页
二、编制调查表
流行病学调查研究计划确定后,要根据调查目的及项 目,编制能实施计划要求的调查表。其主要内容有校核项目(
包括被调查者姓名、地址等)、调查项目(统计分析项目)、 调查者项目(为调查者的姓名、日期、单位等)。调查表
分为一览表和单一表。前者一张表可填写多个调查对象, 适用于项目较少的调查;后者为一人一表,适用于项目较
断。
7.调查员签名及调查日期。
第二十二页,共101页
(四)调查方法
个案调查主要通过询问和现场观察来收集资料,必要时还 应采集标本送检。
1.询问 即向病人、家属、护理人员或周围能提供 情况的其他人进行询问,以获取必要的资料。