课件:人群健康研究的统计学方法

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
28 2020/4/27
观察单位 observations
个体individuals
Units;elements
变量 variables
年龄 身高 体重 住院天数
住院号 岁 cm kg
d
职业
文化程度 分娩方式 妊娠结局
2025655 27 165 71.5
5

中学
顺产
足月
2025653 22 160 74.0
特点:观察值系统性、方向性、周期性的偏 离真值。
可以通过严格的实验设计和技术措施消除。
22 2020/4/27
2随机测量误差 (random error of
measurement )或称偶然误差,是指排除 了系统误差后尚存的误差。它受多种因素的 影响,使观察值不按方向性和系统性而随机 地变化。 ➢随机测量误差服从正态分布,可以用概率统 计方法处理。
19
4 女 71 下 中分化 Ⅱ 阳性 78
5
5 男 59 上 高分化 Ⅲ 阴性 85
35
…… … … … … …


34 2020/4/27
实例数据2
体重指数 身高 班制 劳动强度 紧张程度 心率 嗜肥肉史 收缩压 舒张压 中风家族史
(1) (2)(3) (4) (5) (6) (7) (8) (9) (10) 12.24 1.62 1 1 3 70 1 146 90 有 16.47 1.63 3 1 3 72 0 110 70 无 15.19 1.64 1 2 2 72 0 100 70 无 15.59 1.63 1 1 3 84 1 114 70 无 12.60 1.64 3 1 3 68 1 116 68 无 … …… … … … … … … …
用定量 方法测定观察单位(个体)某项指 标数值的大小,所得的资料,称数值变量资料 。也叫定量资料Quantitative data或计量资料
特点:有计量单位,如患者的身高(cm)、体 重(kg)、血压(mmHg)、脉搏(次/分)、 红细胞计数(1012/L);资料之间具连续性。
30 2020/4/27
第七章
人群健康研究的统计学方法
2020/4/27
1
“统计”一词,对一般人来说并不陌生。 在报刊上常见用来说明我们工作、事业成 绩的数字、表、图,称为统计数字、统计 表和统计图。
在西方,统计学(statistics)一词, 源出于state(国家、情况),专指有关“国 情”的学问,最初多用于文字记叙,后发展 为数量比较,随着概率论思想与方法的引 入,逐渐形成今天在理论与应用方面都已相
35 2020/4/27
(三) 变量间的转化
例:一组2040岁成年人的血压
<8 低血压
等 8 正常血压
数值变量资料
级 资 料
12 15
轻度高血压 中度高血压
分类变量资料
17 重度高血压
以12kPa为界分为正常与异常两组,统计每组例

36 2020/4/27
▪ 又如在计量诊断中,将某些阳性体 征根据确诊病人的概率赋予分数,分 数的多少代表量的大小,这样原来的 计数资料就转化为计量资料。
23 2020/4/27
3抽样误差 ( sampling error)
我们从同一总体中随机抽取若干个例数 相同的样本,其样本统计量之间会有所不同 。这种由于随机抽样所引起的样本统计量与 总体参数之间的差异以及各样本统计量之间 的差异,统计上称为抽样误差。
抽样误差在医学生物实验中最主要的来 源是个体的变异。所以这是一种难以控制的 、不可避免的误差。但抽样误差是有一定规 律的。
8 2020/4/27
例:某杂志中一篇文章报导,用某种 中草药治疗玫瑰糠疹,有效率为78%,平 均疗程为三周左右。问此药治疗玫瑰糠疹 的确有效吗?由于玫瑰糠疹具有自然治愈 的情况,一般不服药,多喝水,到三周左 右有些患者也会自愈。所以,此药的78% 疗效有待探讨。 这就要求设立具有可比性的对照组。
样本的实际发生率称为频率。设在相同 条件下,独立重复进行N次试验,事件A出 现n次,则事件A出现的频率为f=n /N。
频率与概率间的关系: ➢概率是参数,频率是统计量; ➢频率总是围绕概率上下波动; ➢样本含量n越大,波动幅度越小,频率越 接近概率。
27 2020/4/27
三 统计资料的类型
(一) 数值变量资料 (二) 分类变量资料 (三) 变量间转化
实例数据1
胆管癌患者部分指标
编号 性别 年龄(岁)部位 分化程度 分期 肝转移 PCNA 指数 生存时间(月)
(1)(2) (3) (4) (5) (6) (7) (8)
(9)
1 男 61 上 低分化 Ⅰ 阳性 52
14
2 女 58 中 高分化 Ⅱ 阴性 89
20
3 女 63 上 高分化 Ⅳ 阴性 93
10 2020/4/27
一些现象既有规律性又有随 机性,肺癌患者中(主动或被动) 吸烟的比例较大,这体现了规律 性,而绝非每个吸烟的人都会患 肺癌,这体现了随机性;
再如,一般来说,白种人身材 比黄种人要高些,这就是规律性 ,但对于具体的一个白人和一个 黄种人,就很难说谁高谁矮了, 这体现随机性。
(二)分类变量资料 categorical variable data
将观察单位按某种属性或类别分组,然后 清点各组的观察单位数,所得的资料称分类变 量资料也叫定性资料(Qualitative data)
特点:无固有计量单位,如肤色(黑、白)、 血型(ABO)、职业(工农兵)、性别(男女)
31 2020/4/27
概率:随机事件发生的可能性大小,用大
写的P表示;取值[0,1]。
25 2020/4/27
小概率事件
必然事件 不可能事件 随机事件
P=1 P=0 0<P<1
P ≤ 0.05(5%)或P ≤ 0.01(1%)
称为小概率事件(习惯),统计学上认为不大 可能发生。
26 2020/4/27
频率 frequency
32 2020/4/27
2、有序分类资料(ordinal category data)
各类别之间有性质上的差别,且排 列有序,给人以“半定量”的概念,所以
也叫等级资料 Rank data。 ①癌症分期:早、中、晚。 ②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++
33 2020/4/27
1、无序分类(unordered categories)
各类别之间有性质上的不同,而无程度上的差别。 ①二项分类 如临床某些检验结果用阳性或阴性反
应表示,对一批某病患者检验完毕后,清点呈阳性 或阴性反应的各有若干例。 ②多项分类 调查某人群的血型分布,按照A、B 、AB、O四型分组。清点所得该人群的各血型组 的人数是计数资料;
20 2020/4/27
(四) 误差 error
误差:泛指实验数据的实测值与真实值之差
1 系统误差 2 随机测量误差 3抽样误差
21 2020/4/27
系统误差 systematic error
在实际观测过程中,由受试对象、研究者、 仪器设备、研究方法、非实验因素影响等原因 造成的有一定倾向性或规律性的误差。流行病 学称之为偏倚(bias)。
15 2020/4/27
(二) 总体与样本 population and sample
总体:根据研究目的所确 定的同质观察单位某项变 量值的集合(全体)。
分有限总体与无限总体
2020/4/27
样本:从总体中随机抽 取的部分观察单位变量 值的集合。
18
随机抽样 random sampling
为了保证样本的可 靠性和代表性,需 要采用随机的抽样 方法(在总体中每 个个体具有相同的 机会被抽到)。
(乌贼骨3钱,白芨3钱,川贝3钱, 甘草3钱, 共研细末过120目筛,冲服)治疗胃溃疡病 出血107例,有效101例,有效率为94.4% 。那么如果别的医院,其它大夫使用“乌 贝散”来治疗胃溃疡病出血,其有效率也 一定是94.4%吗?显然,不一定恰为94.4% ,那么是多少呢?比它高还是比它低?这 就是一个求可信区间的问题。
“医学统计学是处理医学资料中的同质性( homogeneity)和变异性(variation)的科学与艺术”
12 2020/4/27
二、统计学中的几个基本概念
(一) 同质与变异 (二) 总体与样本 (三) 参数与统计量 (四) 误差 (五) 概率
13 2020/4/27
(一)同质与变异
homogeneity and variation
如何学习医学统计学
1、掌握基本概念、基本原理和基本方法。培 养统计思维能力。
2、掌握常用统计分析方法。对统计公式,要 求了解其用途、适用条件和注意事项。切忌 死记硬背,关键是灵活运用。
3、重视习题课。联系实际,紧密结合专业知 识,多做练习题。
5 2020/4/27
例: 北京某医院某大夫使用“乌贝散”
24 2020/4/27
(五) 概率probability
确定性现象:在一定条件下,一定会发生或一定不会发 生的现象。其表现结果为两种事件:肯定发生某种结果的 叫必然事件;肯定不发生某种结果的叫不可能事件。
随机现象:在同样条件下可能会出现两种或多种结果, 究竟会发生哪种结果,事先不能确定。其表现结果称为随 机事件。 随机事件的特征:①随机性;②规律性:每次发 生的可能性的大小是确定的。
11 2020/4/27
第一节 统计学方法概述
一、统计学的意义 统计学是运用数理统计的原理和方法,研究数据资料的
搜集、整理、分析与推断的科学,是认识社会和自然现 象客观规律的数量特征的重要工具。 医学统计学 是认识医学现象数量特征的重要工具, 是运用数理统计的原理和方法,结合医学实际,来研究 医学科研的实验设计和数据处理的一门科学。
5

小学
助产
足月
2025830 25 158 68.0
6
管理员 大学
顺产
足月
2022543 23 161 69.0
5

中学
剖宫产
足月
2022466 25 159 62.0 11
商业
中学
剖宫产
足月
2024535 27 157 68.0
2

小学
顺产
早产
2025834 20 158 66.0
4

中学
助产
早产
▪ 由于计量资料可以得到较多的信息, 所以凡能计量的,尽量采用计量资料。
37 百度文库020/4/27
统计资料的几种类型:
变量类型
变量值表现
实例
资料类型
数量变量
定量(具体数值) 身高(cm) 计量资料
2019464 24 158 70.5
3

中学
助产
足月
n2u02m57e83ri2c9 al154va57r.0iab7le
干部
中学
剖宫产
足月
Categorical variable
data 数值变量资料 data 分类变量资料
29 2020/4/27
(一)数值变量资料 numerical variable data
当完备的独立学科。
2 2020/4/27
思考题
1. 某年级甲班、乙班各有男生50人。从 两个班各抽取10人测量身高,如果甲班的平 均身高大于乙班,能否推论甲班所有同学的 平均身高也大于乙班?为什么?
2.用A,B两种药物分别治疗同病患者各 50人,如果A药的治愈率(60%)高于B药( 50%),证明A药的疗效优于B药。这种说法 对吗?为什么?
9 2020/4/27
再譬如,用某药治某病,治一例有效, 能说100%有效吗?治疗二例有效,能说明 100%有效吗?治十例,其中九例有效,能 说90%有效吗?显然,观察的例数将是个 重要因素,例数太少不足以说明问题。观 察例数太多,将费时,加重科研经济负担 。那么观察多少例能说明问题?这是一个 样本可靠性问题。
同质:指观察单位(研究个体)间被 研究指标的影响因素相同。
个体:即观察单位,是统计研究中的 最基本单位。
变量:观察单位的研究特征 变量值:变量的观察结果 变异:指同质的个体之间的差异 。 14
2020/4/27
同质与变异的例子
例1 调查2019年淄博市7岁男童的身 高和体重
同质:2019年、淄博市、7岁男童 变异:身高和体重各不相同 例2 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同
19 2020/4/27
(三) 参数与统计量
parameter and statistic
参数:总体的统计指标,
总体
抽取部分观察单位 样本
如总体均数、标准差,采
用希腊字母分别记为μ、
参 数 推断inference 统计量 σ。固定的常数
统计量:样本的统计指标,如样本均数、标准差,采用拉
丁字母分别记为 X、。S 参数附近波动的随机变量 。
相关文档
最新文档