医学统计学绪论
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
“非常痛心地看到,因为数据分析的缺陷和错误,那么 多好的生物研究工作面临着被葬送的危险” 。
-- F. Yates,M.J.R. Healy 撰写论文:报告自己观 察或实验的研究结果。 统计知识 的运用 阅读论文:吸收新知识, 了解学术进展。
1996年,有机构对申报科技成果的4586篇科研论文分 析,统计方法使用率为76%。 医学论文中统计运用错误,除了影响论文的科学性, 为 什 还可能导致严重的伦理学问题。 么 要 60年代到80年代,国外医学杂志调查表明:20%~72%的论文有 学 统计错误。 医 1984年对《中华医学杂志》、《中华内科杂志》、《中华外科 学 杂志》、《中华妇产科杂志》、《中华儿科杂志》595篇论文的调查 统 结果为:相对数误用占 11.2%,抽样方法误用占15.9%,统计图表误 计 用占11.7% 学 1996年对4586篇论文统计(中华医学会系列杂志占6.9%),数 ? 据分析方法误用达55.7%。
(1)、同质(homogeneity):根据研究目的给研 究单位确定的相同性质。
研究太原市2012年7岁男孩身高的正常值范围?
同质:同太原市、同7岁、同男孩、同无影响身高的疾病。
ห้องสมุดไป่ตู้
二、统计学中的几个基本概念
(2)、变异 (variation):同质研究单位中变 量值间的差异。
例如:1)太原市2012年7岁男孩身高有高有矮 2)相同的药方治疗相同的疾病的病人,
三、统计资料的类型
1. 概述
数值变量…………………………..构成定量资料
• 变量
分类变量
无序分类变量………...构成计数资料 有序分类变量………...构成等级资料
三、统计资料的类型
2. 数值变量与定量资料
1). 数值变量(numerical variable) :变量值是定量的,表现 为数值大小,一般有度量衡单位。 如:身高(cm)、体重(kg)、血压(pa)、坐高/身高。 2). 定量资料(measurement data) :由一群个体的数值变量 值构成的资料,即一群变量值。 如:太原市2012年7岁男孩身高值 (120.2cm,118.6cm,121.8cm…)
(3)变量值(value of variable):
变量的观察结果。
二、统计学中的几个基本概念
例如:研究7岁男孩身高 变量值:测得的身高值 (120.2cm,118.6cm,121.8cm,…) 研究某人群性别构成 变量值:男、女。
二、统计学中的几个基本概念
2、同质(homogeneity)和变异 (variation)
二、统计学中的几个基本概念
总体参数一般是不知道的 统计学抽样研究的目的就是: 样本统计量→总体参数
二、统计学中的几个基本概念
5、系统误差(systematic error) 、非系统误差 (nonsystematic error) 、抽样误差(sampling error)
误差(error)是指实际观察值与观察真值 之差、样本指标与总体指标之差。
•1) 18岁男孩身高有高有矮 •2) n=100 , 平均身高=169.5cm 95%的太原市7岁男孩的身高在 160.20cm~179.20cm之间
二、统计学中的几个基本概念
1、研究单位(观察单位、unit)和 变量 (variable)、变量值(value of variable) (1)研究单位(unit) :研究中的个体 (individual),是根据研究目的确定的。
设在相同条件下,独立地重复n次试验, 随机事件A出现 f 次,则称 f n 为随机事件 A出现的频率。当n逐渐增大时, 频率 f n 趋 向于一个常数,则称该常数为随机事件A的 概率,可记为 P(A) 。 0≤ P(A)≤1
二、统计学中的几个基本概念
0< P(A) <1 随机事件 必然事件
医学统计学
Medical Statistics
医学统计学讲授内容
第一章 第二章 第三章 第四章 第五章 第六章 第七章 第八章 第九章 第十章 绪论 定量资料的统计描述 总体均数的估计与假设检验 多个样本均数比较的方差分析 计数资料的统计描述 几种离散型变量的分布及其应用 卡方检验 秩转换的非参数检验 双变量回归与相关 统计表与统计图
正常值范围
2)无限总体(infinite population):
研究单位数是无限的
例如:高血压患者←无时间、空间限制。
二、统计学中的几个基本概念
(2)样本(sample): 是总体中抽取的有代表性的一部分。 注意:随机抽样(无主观性) 样本含量( sample size): 样本中包含的研究单位数。
P(A)=1
P(A)=0
不可能事件。
二、统计学中的几个基本概念
频率是就样本而言的,而概率从总体 的意义上说的,m/n是概率 p(A)的估计 值。试验次数越多,估计越可靠。
二、统计学中的几个基本概念
(3)小概率事件:统计分析中的很多结论都基于一
定置信程度下的概率推断,习惯上将
P( A) 0.05或 P( A) 0.01 称为小概率事件,我
2001年《中华预防医学杂志》:中华医学会系列杂志误用约54% (1995)。
绪论 Introduction
讲授内容: 一、医学统计学的意义 二、统计学中的几个基本概念 三、统计资料的类型 四、医学统计工作的基本步骤 五、学习医学统计学应注意的问题
一、医学统计学的意义
1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。 2.医学统计学( statistics of medicine ):统 计学的原理与方法应用于医学科研与实践。
二、统计学中的几个基本概念
实验者 投掷次数 Hu Pingcheng 1 Hu Pingcheng 2 Hu Pingcheng 3 Hu Pingcheng 4 Hu Pingcheng 5 Hu Pingcheng 6 Hu Pingcheng 7 Buffon 4040 K.Pearson 12000 K.Pearson 24000 出现“正面”次数 1 0 2 3 3 2 4 2048 6019 12012 频率 1.0000 0.0000 0.6667 0.7500 0.6000 0.4000 0.5714 0.5069 0.5016 0.5005
二、统计学中的几个基本概念
(1)系统误差(systematic error): 由于仪器未校正、测量者感官的某种障碍、 医生掌握疗效标准偏高或偏低等原因,使观察值 不是分散在真值两侧,而是有方向性、系统性或 周期性地偏离真值。 例如:测量血糖,有斑氏法和葡萄糖氧化法,斑氏法的
测量结果偏高←易受体内还原性物质的影响。
三、统计资料的类型
3.无序分类变量与计数资料
1). 无序分类变量(unordered categories variable): 变量值是定性的,有类别。 特点:类别是客观存在的,各类无秩序,可任意排列; 类与类之间界限清楚,(理论上)不会错判。 如:性别:男、女 。 血型:O、A、 B、AB。 2). 计数资料(enumeration data): 一群个体按无序分类变量的类别清点每类有多少个个体, 即分类个体数。 如: 某科室性别构成:男:6, 女:7。 某人群血型构成: O :20 A :35 B :30 AB:10
一、医学统计学的意义
3.统计学方法的特点: (1)用数量反映质量
1)体格检查(量血压、脉搏…)→个体健康质量 2)考试分数→个体学习质量 3)期望寿命→反映人群健康状况的指标 4) 婴儿死亡率→反映卫生服务质量的指标
………….
一、医学统计学的意义
(2)用群体归纳个体
请大家回答: 2012年太原市18岁男孩身高是多少?
三、统计资料的类型
研究单位:一个人 变量:红细胞数
同质:同某地、同2012年、同成年男子、同正常。
总体:1)某地所有的正常成年男子
2)某地所有的正常成年男子的红细胞数
二、统计学中的几个基本概念
1)有限总体(finite population):
研究单位数是有限的
例如:调查某地2012年正常成年男子的红细胞数的
第十一章 第十二章 第十三章 第十四章 第十五章 第十六章 第十七章 第十八章 第十九章
多元线性回归分析 logistic回归分析 生存分析 协方差分析 析因设计资料的方差分析 重复测量资料的方差分析 判别分析 聚类分析 量表研制与量表资料的统计分析方法
为 什 么 要 学 医 学 统 计 学 ?
二、统计学中的几个基本概念
可见,在相同条件下重复试验,试验结果
为“正面”或“反面”虽不能事先断定,但我们
知道试验的所有可能结果只有两种。 在重复多次后,出现“正面” 或“反面” 这个结果的比例称之为频率。
二、统计学中的几个基本概念
(2)概率(probability):
概率是度量随机事件发生可能性大小的一个数值。
产生原因: 个体差异(生物变异)
n=100 X =118.6cm
二、统计学中的几个基本概念
6、频率(relative frequency)、概率 (probability)、小概率事件 (1)频率(relative frequency):
一次随机试验有几种可能结果,在重复进 行试验时,个别结果看来是偶然发生的,但当重 复试验次数相当多时,将显现某种规律性。例如, 投掷一枚硬币,结果不外乎出现“正面”与“反 面”两种,现在,我们看一掷币模拟试验:
二、统计学中的几个基本概念
这类误差可以通过实验设计和技术措 施来消除或使之减少。 观察性研究由于组间不可比性产生的 系统误差称为偏倚(bias),如吸烟组的 平均年龄大于吸烟组,两组死亡率的差异 包含年龄偏倚。
二、统计学中的几个基本概念
(2)非系统误差(nonsystematic error) 由于研究者偶然失误而造成的误差。 例如:仪器失灵、抄错数据、点错小数点、写错单位等,
们认为小概率事件在一次试验中不可能发生。
三、统计资料的类型
变量与统计资料的分类方法
1.概述 2.数值变量(numerical variable)和定量资料 (measurement data) 3.无序分类变量(unordered categories variable ) 和计数资料 (enumeration data) 4.有序分类变量(ordinal categories variable)和等 级资料(ranked data)
疗效有好有坏
二、统计学中的几个基本概念
3、总体(population)和样本(sample)
(1)、总体(population):是根据研究目的 确定的同质研究单位的全体。更确切地说是同 质研究单位某种变量值的集合。 例如:调查某地2012年正常成年男子的红细胞数的
正常值范围
二、统计学中的几个基本概念
二、统计学中的几个基本概念
例如:研究7岁男孩身高的正常值范围 研究大学生视力 研究水污染情况 研究细胞变性 研究肝癌的地区分布 一个人 一只眼睛 一毫升水 一个细胞 一个地区
二、统计学中的几个基本概念
(2)变量(variable): 研究单位的研究特征。
例如:研究7岁男孩身高的正常值范围 变量: 身高
例如:某药治疗高血压患者30名
样本含量(n)为30
二、统计学中的几个基本概念
4、参数(parameter)和统计量(statistic)
(1)参数(parameter):
根据总体个体值统计计算出来的描述总体的特征量。
(2)统计量(statistic):
根据样本个体值统计计算出来的描述样本的特征量。
亦称过失误差(gross error)
这类误差应当通过认真检查核对予以清除,否 则将会影响研究结果的准确性。
二、统计学中的几个基本概念
(3)抽样误差(sampling error):
由于抽样所造成的样本统计量与总体参数的差别。
例如: N=5万 =120.0cm 特点:1)不可避免性 2)有统计规律性