第十章 人群健康研究的统计学方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10
或 lg G
lg 2 lg 2 lg 4 lg 4 lg 8 lg 8 lg 8 lg 8 lg 32 lg 32 0.845 10 G lg 1 0.845 7
故其平均滴度为1﹕7。
33
几何均数的应用 # 几何均数各观察值呈倍数关系或服 从对数正态分布的资料,如抗体平均 滴度、血清平均效价。
3.80~ 4.00~ 4.20~
— — 正
4、归纳计数,列出频数。
23
某地140名正常成年男子红细胞数(1012/L)频数表
组段 3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~ 6.00 合计 组中值 3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90 - 频数 2 6 11 25 32 27 17 13 4 2 1 140 频率(%) 1.4 4.3 7.9 17.9 22.9 19.3 12.1 9.3 2.9 1.4 0.7 100.0
21~30
77 34 55 45 70 42 38 06 45 18 60 75 86 90 68 22 00 27 69 85 91 51 67 62 44
患者编号 随机数字 分组
1 9 甲
2 5 甲
3 8 乙
4 4 乙
5 2 乙
6 9 甲
7 4 乙
8 9 甲
9 4 乙
10 1 甲
9
(三)抽样研究和抽样误差
1
推导过程
31
几何均数计算公式推导过程
32
例 10 人的血清滴度为 1∶2 , 1∶2 , 1∶4 , 1∶4 , 1∶ 8 , 1∶8 , 1∶8 , 1∶8 , 1∶32 , 1∶32 ,求其平均滴度 。G 2 2 4 4 8 8 8 8 32 32 7
又称计数资料
14
(三)有序分类变量
指将观察单位按某种属性的不同
程度分组,并清点各组观察单位个数 ,所得资料称之。
又称等级资料
15
数值变量
有序分类
无序分类
血红蛋白(g/dl)
等级
<6 6~ 9~12
重度贫血 中度贫血 轻度贫血
16
某医师观察两种药物对某病疗效,在进
行临床试验设计时,考虑观察病人的年 龄(实际岁数)、性别、文化程度(文 盲、小学、初中、高中、大学等)、病 情(轻、中、重)、病程(天)、血常 规(血红蛋白、白细胞等)、治疗结果 (治愈、显效、好转、无效)。
27

某地140名正常成年男子红细胞均数为:
⑵ 加权法:适用于大样本(n≥30)。
f1 X 1 f 2 X 2 f 3 X 3 f k X k fX X f1 f 2 f 3 f k n
X为组中值=(本组段下限+上限)/2 , f 为相应组段的频数,k 为组段数。
30
2、几何均数(geometric mean)
⑴ 直接法:
G n X1 X 2 X 3 X n
为方便运算,写成对数形式
lg X 1 lg X 2 lg X 3 lg X n G lg n 1 lg X lg n
24
频数表的用途
1、揭示计量资料的分布类型。
对称分布
偏态分布
2、揭示计量资料频数分布的特征。 集中趋势和离散趋势
25
(二)
集中趋势的统计描述
26
1、算术均数(mean)
简称均数 总体均数——μ 样本均数—— 均数的计算: ⑴ 直接法:适用于小样本,n<30。
X 1 X 2 ....... X n X X n n
6
(二)总体与样本
1 、总体 (population) :根据研究目的 确定的同质个体的全体。(同质研究 对象某种变量值的集合)
7
2、样本(sample):从总体中随机抽取部
分有代表性的个体进行研究,这部分个体
即为样本。
样本含量(n)——观察单位个数 随机化——抽样时要使总体中每个个体都
有同等的机会被抽作样本。
WBC(双侧)
0
95%
100%
P
P
2.5
97.5
37
尿铅含量的95%参考值范围(单侧)
5%

95%

肺活量的95%参考值范围(单侧)
5%
P95

95%

P5
38
问题:以何指标描述该组资料的集中趋势?
39
潜伏期(天) 0~ 12~ 24~ 36~ 48~ 60~ 72
频数 23 56 38 20 10 3
11
三、统计资料的类型
观察单位
测量 观察
某项特征
定量 数值变量 定性 分类变量
12
(一)数值变量
是指用 定量的方法测定 观察单位某
项指标数值的大小,所得资料称之,一般
有度量衡单位。
又称计量资料
13
(二)无序分类变量
是指将观察单位按某种属性或类别 分组,并清点各组观察单位的个数,所得 资料称之。
1 、抽样研究:指从确定的同质总体中 随机抽取样本进行研究,用样本信息推 断总体特征的研究方法。
2 、抽样误差:指由于抽样而造成的样 本指标与总体指标之间以及样本指标之 间的差别。
(四)统计量与参数 样本指标:统计量 总体指标:参数
10
(五)概率
概率(probability) 是描述某事件发
生可能性大小的数值,用 P 表示, 介于0~1之间。 小概率事件:P ≤0.05
29
将表中数据代入公式得
2 3.90 6 4.10 11 4.30 1 5.90 X 4.78 ( 1012 / L ) 140
均数的应用
⑴ 对同质事物求均数才有意义,才能 反映事物的特征。 ⑵ 均数最适用于描述对称分布,特别 是正态分布计量资料的集中趋势。
判断所观察指标的资料类型?
17
四、医学统计工作的内容
(一)统计设计
(二)搜集资料
(三)整理资料 (四)分析资料
18
第三节 数值变量的统计分析
19
一、数值变量的统计描述
组段
(一)频数表
频数
20
某地140名成年男性红细胞数(×1012/L)
4.76 5.00 5.24 4.33 4.95 4.81 5.05 4.52 4.76 4.62 4.48 4.71 5.26 4.73 4.97 4.83 5.07 4.54 4.40 4.64 4.88 4.73 4.59 5.21 5.61 4.47 4.71 4.56 4.80 3.82 4.14 4.37 4.61 4.47 5.09 4.94 5.95 5.34 4.44 5.44 5.30 4.01 5.01 4.87 3.97 4.58 5.20 4.68 4.46 4.70 4.94 4.79 4.65 4.89 4.37 4.60 4.08 4.70 5.32 5.17 4.57 4.81 5.05 4.91 4.77 4.62 5.24 4.72 4.58 4.81 5.05 4.91 4.31 4.93 4.78 4.26 4.50 5.12 4.60 4.83 4.31 4.55 4.41 5.02 5.18 5.04 4.52 4.38 5.37 4.85 4.71 5.33 4.05 4.28 4.52 4.76 4.92 4.40 4.63 4.87 5.49 4.59 4.82 4.68 4.16 4.78 4.64 4.27 5.27 5.51 4.99 5.22 5.08 4.94 4.80 5.04 4.51 4.75 4.77 4.63 5.24 5.60 4.58 4.82 5.05 4.15 5.15 4.63 4.49 4.88 5.50 4.98 4.46 5.07 4.93 4.79 4.65 4.50 4.36 4.22
# 中位数常用于描述偏态 分布,当分布末端无确定数值 或分布不明的资料。 # Px用于描述一组观察值在 某百分位置的水平。
36
# Px常用于确定医学参考值范围
医学参考值范围是指特定健康状况的人群 (排除了有关疾病和因素对所研究指标有影响的 所谓“正常人”)的解剖、生理、生化等各种数 据的波动范围。习惯上是确定只包括95%参照总体 的范围。
28
例、 用加权法求某地140名正常成年男子红细胞均数
组段 3.80~ 4.00~ 4.20~ 4.40~ 4.60~ 4.80~ 5.00~ 5.20~ 5.40~ 5.60~ 5.80~ 6.00 合计 组中值 3.90 4.10 4.30 4.50 4.70 4.90 5.10 5.30 5.50 5.70 5.90 - 频数 2 6 11 25 32 27 17 13 4 2 1 140 频率(%) 1.4 4.3 7.9 17.9 22.9 19.3 12.1 9.3 2.9 1.4 0.7 100.0
8
随机数字表
编号
1 2 3 4 5
1~10
88 56 53 27 59 09 72 95 84 29 12 96 88 17 31 85 94 57 24 16 38 64 43 59 93
11~20
33 35 72 67 47 49 41 31 06 70 65 19 69 02 83 92 09 84 38 76 98 77 87 68 07
第十章 人群健康研究的 统计学方法
1
第一节 概述
2
一、统计学的意义
是运用统计的理论和方法结合医疗、 卫生和医学科研的实际,研究数字资料
如何收集、整理、分析和推断的一门学
科,也是认识人群健康与疾病数量特征 的一个重要工具。
3
学习统计分析方法的重要性
实例: 某中学两个年级近视眼患病率比较
累计频数 23 79 117 137 147 150
累计频率(%) 15.33 52.67 78.00 91.33 98.00 100.00
问题:以何指标描述该组资料的集中趋势?
40
(三) 离散趋势的统计描述
有3组同龄男孩体重(kg)如表1,请对该资料 的特征作出描述。
1、极差 (range)
平均偏差
XX 平均偏差= n
离均差平方和SS
“n-1”称为自由度 简写为 d f 或ν
3、标准差(standard
deviation)
常用方差的平方根——标准差SD(或S)
X 总体标准差 n
2
X X 样本标准差 S n1
2
标准差的意义:
当两组(或几组)资料均数相近、度量 衡单位相同时,标准差大表示变量值的变异 程度大,均数的代表性较差;
意义:全距大说明变异程度大;反之说明变异 程度小。 常用于描述样本含量较小的资料的变异程度36-24=12kg R丙=34-26=8kg
2、方差 (mean of square)
(X ) ( X 1 ) ( X 2 ) ( X n ) ( X 1 X 2 X n ) n X n=0 X = X n n
年级 初一 初二 近视 2 5 非近视 26 9 合计 近视率(%) 28 14 7.14 35.71
35.71% > 7.14%
(初二 > 初一) ?
假设检验
4
二、
统计学中的 基 本 概 念
5
(一)同质和变异 1、同质(homogeneity) :观察单位间 被研究指标的影响因素相同或相近。 2、变异(variation) :指同质观察单位 间研究指标存在的个体差异。 统计的研究任务是在同质分组的基 础上,研究个体变异。
21
频数表的编制
1、求全距(R):R=最大值-最小值 =5.95-3.82=2.13(1012 /L) 2、划分组段: ①确定组距(i):i =R/预分组数 =2.13/10=0.213≈0.2
②确定组数:
组数=R/i=2.13/0.2=10.65,取11组
③确定组段:
22
3、列表划记:
组段 划记 频数
#
#
观察值不能有0。
观察值不能同时有正值和负值。
34
3、中位数(median)和百分位数
将一组观察值从小到大按顺序排列,位 次居中的观察值就是中位数。 记为M
M
百分位数(percentile)是一种位置指标,以Px表示。百 分位数是一个界值。
P50=M x% Px 1 -x %
35
中位数和百分位数的应用
相关文档
最新文档