医学统计学第1章绪论
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.研究设计
包括资料收集、整理和分析全过程总 的设想和安排
实验设计(第十二章) 调查设计(第十三章)
2.收集资料
资料的三个来源: ①统计报表:法定传染病报表、职 业病报表、医院工作报表 ②经常性工作记录:卫生监测记录、 健康检查记录、门诊病历、住院病历 ③专题调查或实验: 实验设计(第十二章) 调查设计(第十三章)
同质和变异
当一批观察单位的主要条件(对 研究指标有影响的主要因素)相同时 称该批观察单位同质。同质基础上观 察单位间的差异称为变异。变异是由 不可控制的因素产生。
总体与样本
总体( population )根据研究目的所确定 的同质观察单位(某项特征观测值) 的集合。总体分有限总体和无限总体 样本( sample )从总体所对应的全部观察 单位中随机抽取的部分观察单位(某 项特征观测值)的集合。
变量与资料
变量
每个观察单位被测量和观察的某项特征。
变量值
对变量的测得值,亦称为资料。
数值变量(numerical variable)资料
又称定量资料或计量资料。用定量 的方法对每个观察单位的某项指标测 得对应的数据,一般有度量衡单位。
分类变量(categorical variable)资料
又称定性资料或计数资料。根据观察
统计描述:统计表与统计图,数值变量的统计 描述,分类变量的统计描述,参考值范围 参数估计:总体均数的估计,总体率的估计, 回归模型参数的估计,总体相关系数的估计 假设检验 :两组数值变量或等级资料平均值 的比较,多组数值变量或等级资料平均值的 比较,分类变量的率或构成比的比较,回归 方程的假设检验,相关系数的假设检验,重 复测量设计资料均数间的比较
例:瓶中有50片药,其中3片次品
一次取一片,取得次品的概率: 3/50=0.06 一次取5片, 5片中有2片是次品的概率:
CC C
3 5 50
2
3 47
9 0.023 362
三、概率的运算
1.加法定理
⑴互斥事件的加法定理 若事件A与B互斥,则P(A+B)=P(A)+P(B)。 证明:设试验的全部结果包含n个基本事件,而事件A 包含其中m1个基本事件,事件B包含其中m2个基本事件。 由于A与B互斥,故A+B包含的基本事件数为m1+m2,按 古典定义有P(A+B)=m1/n+m2/n=P(A)+P(B). 若n个事件互斥,则P(A1+A2+┄+An) =P(A1)+ P(A2)+ ┄+P(An) 若n个事件构成互斥完备群,则
(二)按统计学方法的层次划分
1. 基本统计方法
绪论(一章) 统计图表(二章) 定量资料的统计描述(三章) 定性资料的统计描述(四章) 参数估计(五章) 假设检验的基本概念 (六章)
两组样本均值比较的t检验(七章) 多组样本均值比较的方差分析(八章) 定性资料的统计推断 (九章) 非参数检验 (十章) 两变量间直线相关与回归分析(十一章) 实验设计(十二章) 调查设计(十三章) 样本含量的估计 (十八章) 生命统计的常用指标(二十章)
附:
事件与概率
一、随机事件及其运算
1. 随机事件 必然现象:确定性现象 随机现象:不确定性现象,也称偶然现象 随机试验:对随机现象的观察 特征:⑴在相同条件下可重复进行;⑵各次试 验结果可不同,不能预先判断;⑶预先可明确所
有可能的结果,每次试验各结果必居其一。 随机事件:随机试验观察的结果,可能出现也可能 不可能出现的事件。 必然事件:Ω 不可能事件:Ф
2. 高级统计方法
多因素对某定量指标 的影响分析——多重线 性回归 (十四章) 多因素对某定性指标 的影响分析—— Logistic回归 (十五 章)
糖尿病人的血清总胆固 醇X1、甘油三脂X2、空 腹胰岛素X3、糖化血红 蛋白X4与空腹血糖测量 值Y的关系
研究吸烟、饮酒 与食道癌关系的 病例-对照研究
现代实用卫生统计学
第一章 绪论
卫生统计学的作用和地位
卫生统计学的定义和内容
统计学中的几个基本概念
第一节 卫生统计学的作用和地位
案例:某疾控中心开展了一项研究,以了解当地肺 癌的患病情况,从10万人口中随机抽取2000人进 行调查,调查内容包括流行病学资料和临床实验室 检查资料。其中男性1100人,患肺癌者6人,女性 900人,患肺癌者3人。由此,研究者计算得出,男 性肺癌发病率为0.55%,女性肺癌发病率为0.33%, 并认为男性肺癌的发病率高于女性。 ①该研究者所选择的统计指标正确吗?应选用患病 率 ② “男性肺癌的发病率高于女性”的结论是否可 靠? 存在抽样误差,不能仅根据数据的大小直接下结论。
3.整理资料
净化原始数据,使其系统化、条理化 统计表与统计图(第二章) 频数与频数分布(第三章第一节) 常用相对数(第四章第一节) 统计软件
4.分析资料
统计分析
统计描述 (二、三、四章) 参数估计 统计推断
(五、十一、十四、 十章、十六)
假设检验
(六、七、八、九、十、 十一、十四、十五、十 六章)
P(A1+A2+┄+An)=P(Ω)=1
例:20片外观一样的药片中,有黄连素 15片,穿心莲5片,随机抽取3片,求至 少有1片穿心莲的概率。
无论是统计设计、资料收集、数据整理、 统计分析,只要某一个环节存在缺陷就有可 能导致整个研究的失败! 卫生统计学在卫生及其相关领域研究中 的地位举足轻重,是卫生工作者从事科学研 究必须掌握的一门基本技能。
第二节
卫生统计学的定义和内容
一、卫生统计学的定义
统计学的根本任务是揭露隐藏在偶 然现象背后的规律性,是认识世界 的重要工具。
源自文库
样本中所包含的观察单位的个数称为样 本含量(sample size) 随机抽样是指按随机原则从总体中获 取样本,(等概率抽样)总体中的每个个 体都有同等机会被抽取。
参数和统计量
参数 总体的指标称为参数,是指根据总体个
体值按有关统计公式计算出来的描述总 体特征量的统计指标。 统计量 根据样本数据按有关统计公式计算出 的用来描述样本的统计指标。 由样本信息来推断总体特征的方法 叫做抽样研究。
随访时间资料的生存分析(十六章) 判别分析——观察对象的分类分析(十六章) 重复测量定量资料均数间的比较(八章) Meta分析(第十九章)
第二节
统计学中的几个基本概念
观察单位(observed
unit)
根据研究目的所确定的卫生统计学研 究对象中的基本研究单位,可以是一个人 一头动物,一群人(如一个县,一个乡, 一个村,一所学校,一个家庭等);可 以是一个器官,一个细胞,一个采样点等
等级。血清反应:― 、±、+
各类别间无程度差别。
各类之间有程度差别,又称等级资料
各类变量之间的转化
定量资料
分类资料
等级资料
分正常、偏低两类
Hb (g/l)
贫血程度:重度、中度、 轻度、正常
二分类资料赋值:0、1 等级资料赋值:0、1、2、3、…… 非等级资料,禁止赋值:0、1、2、3、……
频率和概率
0≤P≤1, 当P=0时称为不可能事件, 当P=1时称为必然事件。
概率推断 是按一定的概率用样本信息 推断总体的特征。即统计推断含有一定 概率。
小概率事件:P<0.05或P<0.01, 小概率事件原理:即小概率事件在一次 抽样中一般认为不会发生。
第四节 学习卫生统计学应注意的问题
1.重点应放在卫生统计学基本概念和基本 原理的理解和掌握上。 2.重点应放在基本统计方法的适用条件、 用途及注意事项的理解和掌握上。 3.重点应放在运用卫生统计学知识解决实 际问题能力的培养上。
卫生工作中有关科研的统计 设计,数据的收集、整理、
分析的科学。
第 二 节 医 学 统 计 学 的 定 义 和 内 容
二、卫生统计学的主要内容
(一)按卫生统计工作的 基本步骤划分:
统计设计 (statistical design) 搜集资料(co11ection of data) 整理资料(sorting data) 分析资料(analysis of data)
中国出生性别比(国际1.02~1.07:1): 82:1.085:1;90:1.118:1; 95:1.166:1;02:1.301:1; 已有两女孩家庭下一孩子性别比: 3.342:1
第 二 节 卫 生 统 计 学 的 定 义 和 内 容
卫生统计学 一门运用统
计学尤其是数理统计学的原
理和方法,研究医学科研及
频率 将随机试验重复n次,n次试验中 随机事件 A 共发生 m 次,则 n/m 表示随 机事件A发生的频率。
频率和概率
概率 是描述随机事件发生的可能性大小,用P表示,
0 p 1
⑴概率的统计定义 当试验次数n趋向于 无穷的大时,频率m/n的极限值即为概率, m 即 。 P lim
n
n
2. 事件之间的关系及运算
⑴包含:如果事件A发生必然导致事件B发生,则事 件A包含于事件B ,或事件B包含事件A,记作A B或 B A ⑵等价:若事件A包含事件B ,事件B也包含事件A,称事件A与B 等价(或相等),记作A=B。 ⑶并事件:若事件C={A或B至少有一个发生},则称C为A、B两 事件的并事件,记作C=A+B。n个事件的并 n 事件记为 A
n i j i=1 i
例:治疗某患者的结果,{痊愈}、{显效}、{微 效}、{无效}4事件构成互斥完备群。 ⑹对立事件: A与B不能同时发生,也不能同时不 发生,即: A+B=Ω且AB=Φ,称事件A与B对立, 记作
A B, 或A B( A为A的对立事件)
例:治疗某患者的结果, {有效}、{无效}2事件 构成对立事件。 对任一事件A,有: AA , A+ A , A A
A
i 1
i
举例:两个开关K1和K2并联后接入电路,设A={电路接通}, A1={K1闭合},A2={K2闭合},则 A= A1+ A2
⑷交事件:若事件C={A与B同时发生},则称C为A、B 两事件的交事件,记作C=AB。n个事件的交事件A记为: A=A1A2„An 例:两个开关K1和K2串联后接入电路,设A={电路接 通}, A1={K1闭合},A2={K2闭合},则 A= A1A2 ⑸互不相容事件:事件A与B不能同时发生,称A与B为 互不相容事件,也称互斥事件,记作AB=Ф。n个事件 互斥,是指它们两两互斥。 互斥完备群:若n个互斥事件的并事件是必然事件, 即 ,则称这n个事件构成 互斥完备群。 A A (1 i j n), 且 A
历史上许多科学家都做过投硬币实验: 次数n 正面朝上的次数nH 德.摩根 2048 1061 蒲丰 4040 2048 K.皮尔逊 12000 6019 K.皮尔逊 24000 12012
频率f 0.5181 0.5064 0.5016 0.5005
⑵概率的古典定义 一个随机试验,有n种 等可能的结果数,其中有利于事件A发生的 结果数为m,则事件A发生的概率等于m/n。
A B
A+B A B A与B对立 A A
AB
AB
B
A
B
A与B互斥
A
B
B
互斥完备群 A2 A1 A4 A 3 A5
二、事件的概率
1. 频率:进行条件相同的n次试验,事件A发生m次, m为事件A发生的频数,m/n称为事件A发生的频率。 2. 概率的统计定义: m P lim 3. 古典概率: n n 基本事件:如果构成互斥完备群的各事件具有等可 能性,则称这些事件为基本事件。 概率的古典定义:如果互斥完备群由有限的n个基 本事件构成,而事件A包含m个基本事件,则事件A 的概率P(A)=m/n.
单位某项特征(指标)的不同性质或类别, 将观察单位分成若干组,各组的观察单位 数称为计数资料。
分类变量 分类变量
二分类变量 多分类变量 多 分 类 有 序 变 量 多 分 类 无 序 变 量
无 序 变 量
多分类资料
无序分类资料
有序分类资料
定义 对个体的分类特征的描述,分 类别 特点
类别是客观存在的,各类间无秩序, 可任意排列;类和类之间界线清楚, 不会错判。 级别是主观划分的,各级间有秩序, 必须自低 ( 或弱 ) 到高 ( 或强 ) 或自高到 低排列,级和级之间界线模糊,可能 错判。 是对个体的等级特征的描述,分