医学统计_绪论 20170831

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
♣ 特点:观察值有系统性、方向性、周期性的偏 离真值。
♣ 控制:可以通过严格的实验设计和技术措施消 除。
(2)随机误差(random error) ♣ 概念:排除上述误差后尚存的误差,受多种无
法控制的偶然因素的影响。 ♣ 特点:大小方向不一的随机变化。 ♣ 种类:
测量误差( measurement error) 抽样误差( sampling error)
Qualitative data 计数资料
定性资料:按某种属性分类,然后清点每类的数
据,称计数资料(count data)或(enumeration data)。也
叫定性数据(Qualitative data) 。包括无序分类资料和有
序分类资料。
♣ 无序分类变量(categorical variable)资料:或名义变量 (nominative variable)变量只能定性的划分成两类或少数 几个互相排斥的类别。有二分类(binary variable) ,多分
统计设计的几个关键问题
1.如何进行抽样?如何安排干预措施? – 随机化原则:随机抽样和随机分配。
2.要达到研究目的至少应观测多少受试者? – 重复原则:确定样本含量。
3.如何排除非研究因素的影响,分离出研究因素对 实验结果的效应? – 对照原则:在实验组与对照组中,除研究因素 外,其它影响实验结果的非研究因素都尽可能 相同。
♣ 抽样误差
第一章 绪论
一、统计学(statistics)的定义 Webster国际大辞典
A science dealing with the collection, analysis, interpretation and presentation of masses of numerical data.
– 统计学好比总体和样本间的桥梁 : – 帮助人们设计和实施从总体中科学地抽取样本,使
样本中的个体不多也不少,信息丰富,代表性好; – 帮助人们挖掘样本中的信息,推断总体的规律性; – 帮助人们确切地描述样本中观察到的现象,恰当地
解释总体中可能存在的规律性。
(三)参数与统计量
、 参数(parameter) :描述总体特征的指标,常用 希腊字母表示。
分娩方式 顺产 助产 顺产
剖宫产 剖宫产
顺产 助产 助产 剖宫产
妊娠结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
观察单位 observations
个体 individuals
住院号 年龄 身高 体重 2025655 27 165 71.5 2025653 22 160 74.0 2025830 25 158 68.0 2022543 23 161 69.0 2022466 25 159 62.0 2024535 27 157 68.0 2025834 20 158 66.0 2019464 24 158 70.5 2025783 29 154 57.0
住院天数 5 5 6 5 11 2 4 3 7
Quantitative data 计量资料
变量 variables
职业 无 无 管理员 无 商业 无 无 无 干部
文化程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
分娩方式 顺产 助产 顺产
剖宫产 剖宫产
顺产 助产 助产 剖宫产
妊娠结局 足月 足月 足月 足月 足月 早产 早产 足月 足月
统计学的分类


理论统计学
统 计

更注重资 料收集
卫医医经
概率论
数理统计

其 他
学学学学
原理与方法
方法的应用
卫生统计学(Medical Statistics):是应用概率 论和数理统计的原理和方法,研究公共卫生领 域中有关数据的搜集、整理、分析的一门应用 科学。
(四)变量的类型(数据的类型)
卫生统计学中把所有的医学资料分为两大类: 定性资料和定量资料。
某医院产科住院产妇基本信息
住院号 2025655 2025653 2025830 2022543 2022466 2024535 2025834 2019464 2025783
年龄 27 22 25 23 25 27 20 24 29
随机现象:在同样条件下,可能会出现两种或多 种结果,究竟会发生哪种结果,事先不能确定。 其表现结果称为随机事件。 随机事件的特征:① 随机性;②规律性:每次发生的可能性的大小是 确定的。
概率(probability ) :描述随机事件发生可能 性大小的指标。常用P表示。0 ≤ p ≤ 1。
小概率事件 : 发生的可能性小于等于0.05 ( P ≤ 5%)或0.01(P ≤ 1%)称为小概率事 件(习惯),统计学上认为一次抽样过程中不大 可能发生。
Last JM
The science and art of dealing with variation in data through collection and analysis in such a way as to obtain reliable results.
统计学:是一门处理数据中变异性的科 学与艺术,内容包括收集、整理、分析、 解释和表达数据,目的是求得可靠的结 果。
♣ 统计推断(inferential statistics)是用 样本信息估计或推断总体特征 ,包括参 数估计和假设检验。
(1)参数估计 (estimation of parameters) – 如何由样本统计量推断总体参数。
(2)假设检验 (hypothesis test) – 如何由样本差异来推断总体之间是否不 同。
– 例如,同性别、同年龄的小学生属于同一个总体, 但他们的身高、体重又存在变异。变异性是统计学 的根本需要。
统计学的任务就是在变异的背景上描述同一总 体同质性,揭示不同总体异质性 (heterogeneity) 。
(二)总体和样本
总体 (population):根据研究目的所确定的同质 研究对象某项观测值的集合。如一个国家的所有 成年人(身高值);某地的所有小学生(身高 值) 。
卫生统计学教研室 任艳峰
教务号:07027
目的和要求
了解卫生统计学与软件的关系、统计学的内容
熟悉卫生统计学的概念
掌握统计工作的基本步骤
掌握资料/数据的类型
掌握重要的统计学概念
♣ 统计描述-统计推断 ♣ 总体-样本
♣ 参数-统计量
♣ 概率-小概率事件
♣ 定性资料-定量资料(计数资料-计量资料)
卫生统计 学内容
研究 设计
观察性研究(调查)
动物实验 实验性研究
临床试验
数据 处理
统计描述 统计推论
参数估计 假设检验
三、几个重要的统计学概念
(一)同质与变异
同质性(homogeneity) :处于同一总体的个体之 间存在共性,称为同质性。
– 例如,同性别、同年龄的小学生具有同质性。
变异性(variation) :同一总体内的个体间大小不 等,存在差异,称为变异性。
(六)误差
误差:实际观察值与客观真实值之差。 ♣ (1)系统误差 ♣ (2)随机误差
(1)系统误差(systematic error)
♣ 概念:由人为因素造成的有一定倾向性或规律 性的误差。(在实际观测过程中,由受试对象、 研究者、仪器设备、研究方法、非实验因素影响 等原因造成)。流行病学称之为偏倚(bias)。
例数。
变量转化:变量只能由高级向低级转化。
连续型
有序
二值
离散型变量常常通过适当的变换或连续性校正 后借用连续型变量或有序变量的方法来分析。
(五)概率( probability )
确定性现象:在一定条件下,一定会发生或一定 不会发生的现象。其表现结果为两种事件:肯定 发生某种结果的叫必然事件;肯定不发生某种结 果的叫不可能事件。
样本 (sample):从研究总体中随机抽取的一部分 有代表性的个体( individuals )的观察值的集合。
抽样(sampling):从研究总体中抽取一部分有 代表性的个体的方法;
数据(data):对样本中个体进行深入的观察与 测量,获取的测量值。
样本含量:抽取的观察单位的个数。
统计学的用途:
实验设计
– 实验研究设计 (experiment design)
以动物或生物材料为研究对象,在研究过程中 对研究对象施加干预。
– 临床试验设计 (clinical trial design)
以人为研究对象,在研究过程中对研究对象施 加干预。
统计设计的内容
(1)研究目的和假说。 (2)研究总体、研究对象、观察单位。 (3)是否施加干预,如何施加干预? (4)需搜集那些资料,如何搜集? (5)设置观察指标。 (6)资料的整理和汇总,计算有关统计量。 (7)控制误差。 (8)预期结果。 (9)时间和经费的安排等。
(1) 净化:对原始数据的清理、检查、 核对和纠正错误等。
(2)系统化和条理化:根据研究目的将原
始数据合理分组并归纳汇总等。
4、分析资料(analysis of data):
♣ 统计描述(descriptive statistics)利用 统计指标、统计图表等,对资料的数量 特征及其分布规律进行测定和描述。
身高 165 160 158 161 159 157 158 158 154
体重 71.5 74.0 68.0 69.0 62.0 68.0 66.0 70.5 57.0
住院天数 5 5 6 5 11 2 4 3 7
职业 无 无 管理员 无 商业 无 无 无 干部
文化程度 中学 小学 大学 中学 中学 小学 中学 中学 中学
♣连续型变量(continuous variable) :变量可以在 实数轴上连续变动。例如,血压、身高、体重 等。
例:一组2040岁成年人的血压(舒张压)
<8 低血压
等 8 正常血压
级 资 料
12 15
轻度高血压 中度高血压
17 重度高血压
计量资料 计数资料
以12kPa(90mmHg)为界分
为正常与异常两组,统计每组
2、收集资料(collection of data):采取措施取 得准确可靠的原始数据。 要求:准确、及时 来源:(1)统计报表 (2)经常性工作记录 (3)专题调查或实验 (4)统计年鉴和统计数据专辑
3、整理资料(sorting of data):对数据 进行清理、改错、数量化,为后续研究 奠定基础。
二、统计工作的基本步骤
1、统计设计(design):包括观察性、实验性设 计。对资料收集、整理和分析全过程进行的总 体设想和安排 。 统计设计是影响研究能否成 功的最关键环节,是提高观察或实验质量的重 要保证。
调查设计 (survey design)
– 客观描述研究总体,不对研究对象施加任何 干预,目的在于摸清某一事物的水平和分布 状态。
必然事件:必然会发生的事件(P = 1 )。
不可能事件 :必然不会发生的事件(P=0 )
频率 frequency
样本的实际发生率称为频率。设在相同条件下 ,独立重复进行n次试验,事件A出现f 次,则 事件A出现的频率为f / n。
频率与概率间的关系: ♣ 样本频率总是围绕概率上下波动 ♣ 样本含量n越大,波动幅度越小,频率越接 近概率。
统计量(statistic) :描述样本特征的指标。常用
拉丁字母表示。统计量是参数附近波动的随机
变量 。 抽样误差
总体
XS
抽取部分观察单位 样本
μ?
推断inference X
抽取部分观察单位
总体
样本
μ?
推断inference X
抽样误差(sampling error):由抽样和变异引 起的样本统计量与总体参数的差异,样本统计 量之间的差异。
类等等。例如,性别(男女)、疾病(有无) 和结局(生死)等。
♣ 有序分类变量(ordinal variable)资料:变量值之间存在 程度上的差别。例如,问卷调查常问对某件事情的满 意程度:极不满意、有点满意、中度满意、很满意、 极满意。有些临床体检或实验室检验常用–、±、+、 ++和+++来表示测量结果
定量资料:用仪器、工具等测量(measure) 方法 获得的数据,即为计量资料(measurment data)。 变量值是定量的,表现为数值的大小,一般有 度量衡单位。可分为离散型变量和连续型变量。
♣离散型变量(discrete variable) :变量值只能取整 数。例如,一月中的手术病人数,一年里的新 生儿数。
相关文档
最新文档