医学统计学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
有些资料具有计数资料的特性,同时兼有半定量的性质。 尿蛋白: - + ++ +++ ; 问卷调查常对某事情的满意程度: 极不满意 有点满意 中度满意 很满意 极满意。
实践
Байду номын сангаас
观察单位 observations
个体individuals 住院号 年龄 身高 体重 住院天数
2025655 27 165 71.5
样本:从总体中随机抽取具有代表性的部分个体。
三、抽样(sampling)
抽样(sampling):从总体中抽取部分个体的过程。 抽样时必须遵循随机化原则,即总体中每个个体都有
相同的机会被抽取为样本 。 随机抽样
总体
唐山市12岁健康 男生身高
样本
n=120
随机≠随便
医学统计中常用的抽样方法:
单纯随机抽样 先对总体中全部观察单位编号,然后用抽签、随机数字表或计算机产生
计数资料(二项分类 、无序多分类)
定性资料 有序分类:如血清反应、疗效划分等。 (分类资料)
等级资料(有序多分类 )
(一)计量资料 (定量资料、测量资料)
计量资料:变量值是定量的,有单位的,表示为数值的大小。
对每个观察对象的观察指标用定量方法测定其数值 大小所得的资料,一般有度量衡单位。
身高值 (m) :1.65,1.70 1.58 ….. 住院天数(天): 15,18,10….. 脉搏数(次/分):72,66,80 …..
表 三种不同带教方式护理考核结果的比较(分)
编号
传统带教法
标准化病人法
临床路径法
1
85
93
90








50
82
95
91
三、 2检验
适用于构成比、率等资料间的比较
包括:四格表的2检验 配对四格表的2检验 四格表的Fisher确切概率法 行乘列表的2检验 多个样本率间的多重比较 有序分组资料的线性趋势检验
随机数字等方法从中抽取一部分观察单位组成样本。 系统抽样
如要在1000名新生中抽取200人,其抽样间隔为1000/200=5, 若随机抽取的第一号为2,则抽取的个体号依次为2、7、12、17、22、27…… 分层抽样
一项研究欲调查某农村妇女下生殖道感染情况,可按乡镇分层(好、中、 差三层),在各层中再进行随机抽样。 整群抽样
医学统计学
华北理工大学附属医院 评审办 陈 超
绪论
1.医学统计学的定义。
了解
什么是统计学,统计学能够做什么?
2.医学统计工作的基本步骤。
熟悉
研究设计、搜集资料、整理资料、分析资料
3.医学统计学的若干概念。
掌握
同质与变异、总体与样本、抽样与误差、概率
4.临床常用的医学统计学方法
介绍
第一节 统计学的定义及应用
假设检验基本思想:
小概率反证法思想。 小概率思想是指小概率事件(P<0.01或P<0.05)
在一次试验中基本上不会发生。反证法思想是先提 出假设(检验假设H0),再用适当的统计方法确定假 设成立的可能性大小,如可能性小,则认为假设不 成立,若可能性大,则还不能认为假设不成立。
假设检验的基本步骤
5
2025653 22 160 74.0
5
2025830 25 158 68.0
6
2022543 23 161 69.0
5
2022466 25 159 62.0
11
2024535 27 157 68.0
2
2025834 20 158 66.0
4
2019464 24 158 70.5
3
2025783 29 154 57.0
……
四、误差(error)
泛指观测值与真实值,以及样本指标与总体指标之间的差值。
误差
系统误差 随机误差
随机测量误差 抽样误差
动脉内血压值
血压计测量值
观 察


随机测量误差
系统误差
80
90
舒张压(mmHg)
系统误差与随机误差之间的关系
五、概率(probability) ★
描述某一事件发生的可能性大小的一个量度。
医学统计学的用途 指导人们如何对科研问题进行严密的设计、获取可靠 的数据、正确的归纳、分析与推理判断,帮助揭示疾 病或现象的发生、发展规律,为预防疾病、促进健康 提供客观依据。
在卫生决策制定、基金申请、药物开发、科研论文 撰写与审稿等方面,都需要应用到统计学的知识。
第二节 医学统计工作的基本步骤
计量资料
计数资料
一组20-40岁成人的血压值 8.2 7.6 9.4 10.5 11.5 13.0 18 17 19 21 13.6 …
<8 8~ 12~ 15~ 17~
低血压 正常血压 轻度高血压 中度高血压 重度高血压
计量资料 等 级 资 料
计数资料
以12kPa为界限分为正常与异常两组,分别统计两组的例数
同质基础上的个体差异称为变异(variation)。
同质与变异的例子
例 调查2014年唐山市7岁男童身高和体重 同质因素:2014年、唐山市、7岁男童 变异因素:身高和体重各不相同
二、总体(population)和样本(sample)
总体:根据研究目的确定的同质个体所构成的全体。 例如:研究唐山市区居民的健康状况,则所有唐山 市区居民就构成一个总体。
参数:总体的统计指标,如总体均数、标准差,采用希腊
字母分别记为μ、σ。固定的常数
统计量:样本的统计指标,如样本均数、标准差,采用拉 丁字母分别记为 X S 。 参数附近波动的随机变量 。
总体参数是固定的常数,统计量是在总体参数 附近波动的随机变量。
第四节 医学统计学的资料类型
定量资料(计量资料)
资料的类型
第一步:提出检验假设(又称无效假设null hypothesis, H0) 和备择假设(alternative hypothesis, H1)。
H0:假设两总体均数相等,即样本与总体或样本与样本 间的差异是由抽样误差引起的。
H1:假设两总体均数不相等,即两样本与总体或样本与 样本间存在本质差异。
要注意只能由高级向低级转化。
连续型
有序
分类
二值
假设 检验 方法
常用的统计学方法
比较差别:2、t、F、q、log-rank 、 秩和检验等
联系:相关、回归分析 分类:回归分析、判别分析 推测:回归分析 筛选影响因素:回归分析 综合变量信息:主成分分析 寻找潜在支配因素:因子分析
统计分析常用软件
SPSS (可视化便于操作,鼠标操作,易入门) SAS (Statistical Analysis System,需编程基础) Stata R (方法新、提供源程序、免费)
4.拉丁方设计的方差分析
多个独立样本比较 Kruskal-Wallis H 检验
5.重复测量资料的方差分析
两两比较:Nemenyi 检验
例 为了比较三种不同护理带教方式的效果,将150名实 习护士随机分成三组,每组50人,甲组为传统带教法,乙组 为标准化病人法,丙组为临床路径法。带教结束后进行综合 考核并打分,结果见下表,请比较三种护理带教方式的效果 是否不同?
(二)计数资料 (定性资料)
计数资料:变量值是定性的,没有单位,表示为互不相容的类别。
二项分类资料: 性别:男、女; 疗效:有效、无效 各种检验结果:阴性、阳性; 多项分类资料: 血 型:A、B、AB、 O; 婚姻状况:未婚、已婚、离婚、丧偶。
(三)等级分组资料
等级资料:变量取值不仅表示互不相容的类别而且表示各类的 不同程度的等级顺序,
(三)整理资料
过程:按研究设计的要求,使原始数据系统化、条理化, 便于进一步计算统计指标和进行统计分析。
原始资料
分析资料
1、资料的逻辑检查 2、一致性检查 3、原始数据的加工
表1 数据的Excel输入格式(原始记录)
表2 数据的Excel输入格式(数据整理)
(四)分析资料
过程:按研究设计的要求,计算有关指标, 阐明事物的内在关系和规律。
概率的范围在0与1之间。
当某事件不可能发生时,概率为0;必然发生时概率为1。
小概率事件:在统计学上,习惯将P<0.05或P < 0.01称 为小概率事件,表示该事件在一次抽样(试验中)发生 的可能性很小,几乎为零。
常以P < 0.05作为差异有统计学意义;
P<0.01作为差异有高度统计意义的界限。
六、参数与统计量 parameter and statistic
7
变量 variables
职业 无 无
管理员 无
商业 无 无 无
干部
文化程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩方式 顺产 助产 顺产 剖宫产 剖宫产 顺产 助产 助产 剖宫产
妊娠结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
Quantitative data Qualitative data
预先设定的检验水准(size of test )α为0.05。 选择单双侧检验
第二步:选定统计方法,计算出统计量的大小。 根据资料的类型和特点,可分别选用t检验,则计算t值, u检验则计算u值, 或其他检验方法:秩和检验和卡 方检验等。
第三步:根据统计量的大小及其分布确定检验假设成立 的可能性P值的大小并判断结果。
一、t检验
条件: 1.相互独立的随机样本; 2.样本来自正态分布的总体; 3.两总体方差相等--齐(两样本均数比较时)。 用一句话来概括就是:独立、正态、方差齐,同样适用于方差分析 用途 1.一个未知总体均数与已知总体均数比较。 2.两个未知总体均数的比较。 类型 配对t检验(配对资料或自身对照的比较) 成组t检验(两组独立样本t检验)
1、统计学(statistics) 是以社会现象总体数量为对象的方法论学科,是
研究如何有效地收集、整理与分析受随机影响的数据, 面对不确定数据作出科学的推断,从而发现偶然现象 背后规律性的科学。 2、医学统计学(health statistics)
是运用概率论和数理统计的原理和方法并结合医 学实践来研究资料的搜集、整理、分析与推断的一门 方法学科。
不满足正态分布或方差不齐:采用t‘检验或Wilcoxon秩和检验
适用于配对t检验的资料
例 用两种方法测定12份血清样品中Mg2+(mmol/L)的结果 见表5-2,试问两种方法测定结果有无差异?
适用于独立样本t检验的资料
例 分别测得15名健康人和13名Ⅲ度肺气肿患者痰中α1抗胰 蛋白酶含量(g/L)如表5-3所示,问健康人与Ⅲ度肺气肿患 者α1抗胰蛋白酶含量是否不同?
(1)两组完全随机设计
N 40 且 T 5
6
(二)收集资料
过程:按研究设计的要求,及时取得准确、完整的原始数据。
医学统计资料的来源主要有三个方面: 1)统计报表:如传染病报表、职业病报表、医院工作 年报表等,报表应做到完整、准确、及时。 2)工作记录:如医院的病案首页,各种化验 单,检测单,出生、死亡登记卡。 3)专项调查表:实验研究,调查研究等。
(一) 研究设计(experiment design) (二) 收集资料(collecting data) (三) 整理资料(sorting data) (四) 分析资料(analyzing data)
(一)研究设计
定义:是在保证科学性、可重复性和高效性的前提下,为验证 研究假说而制定周密的医学研究计划。是对资料收集、整理和 分析全过程的总设想和安排。 实验设计是整个工作中最重要的环节。
二、方差分析
应用条件
与t检验相同,要求样本独立、正态、方差齐性。
用途
用于分析比较多组均数间的差别
类型
1.完全随机设计的方差分析 完全随机设计 服从正态分布、方差齐性
2.随机区组设计的方差分析 完全随机设计方差分析
3.析因设计的方差分析
两两比较:LSD、 SNK-q 、Dunnett-t检验 不服从正态分布或方差不齐性
统计方法
统计描述
统计推断
参数估计
假设检验
第三节 医学统计学的基本概念
一、同质与变异 二、总体与样本 三、抽样 四、误差 五、概率 六、参数与统计量
一、同质(homogeneity)与变异(variance)
同质(homogeneity)是针对被研究指标来讲,其 影响因素相同。简单地理解同质就是指对研究指标影 响较大的,可以控制的主要因素应尽可能相同。如研 究方法相同,观察时间相等,以及民族、地区、年龄、 性别等客观条件一致。
p值指:在由H0所规定的总体中做随机抽样时,获得等 于及大于(或等于及小于)现有统计量的概率。
若P值小于预先设定的检验水准α,即P<0.05 , 则H0成立的可能性小,即拒绝H0;
若P值不小于预先设定的检验水准α,即P≥0.05, 则H0成立的可能性还不小,还不能拒绝H0。
P值的大小一般可通过查阅相应的界值表得到
相关文档
最新文档