卫生统计学复习笔记
卫生统计学知识点整理

卫生统计学知识点整理1.数据类型:卫生统计学包括两种主要类型的数据,即定量数据和定性数据。
定量数据是数值型数据,如身高、体重等,可以使用各种统计方法进行分析。
定性数据是非数值型数据,如性别、职业等,可以使用描述性统计方法进行分析。
2.数据收集方法:卫生统计学使用多种方法收集数据,其中包括调查、观察、实验和文献研究等。
调查是最常用的数据收集方法,通过设计问卷或面对面访谈等手段收集信息。
观察是观察和记录事件或行为,以获取相关数据。
实验是通过对照组和干预组进行比较来确定原因和效果的方法。
文献研究是通过分析已有的文献、报告和统计数据来获取相关信息。
3.数据描述和总结:在数据收集完成后,卫生统计学需要对数据进行描述和总结。
这包括计算各种统计指标,如平均数、中位数、众数和标准差等,以了解数据的分布和变异程度。
4.假设检验:卫生统计学中常用的方法之一是假设检验,用于判断一些变量是否与其他变量有显著关联或差异。
假设检验基于统计学原理,通过计算样本数据与预期数据之间的差异,评估是否拒绝或接受一些假设。
5.相关分析:相关分析是研究两个或多个变量之间关系的统计方法。
它可以确定变量之间的相关性大小和方向,并计算相关系数来度量相关性的强弱。
6.回归分析:回归分析是用来预测和解释一个或多个因变量与一个或多个自变量之间关系的方法。
它可以估计自变量对因变量的影响程度,并评估其统计显著性。
7.生存分析:生存分析是研究个体在一定时间内生存或发生一些事件的概率的统计方法。
它通常用于研究疾病的生存率和治疗效果。
8.抽样方法:抽样方法是在卫生调查中常用的一种方法,它可以通过选择一部分样本来代表整体群体。
常见的抽样方法包括随机抽样、系统抽样、分层抽样和整群抽样等。
9.统计软件:卫生统计学使用各种统计软件来进行数据分析和统计计算。
常用的统计软件包括SPSS、SAS、R和STATA等,它们提供了丰富的统计功能和图形展示方式。
10.数据伦理:卫生统计学中数据伦理是一个重要的问题,主要涉及数据的保密性、隐私保护和知情同意等方面。
卫生统计学笔记整理

卫生统计学笔记整理第1章绪论1、卫生统计学的概念:2、统计工作的基本步骤:3、卫生统计学的几个基本概念(attention:资料的分类)第2章调查研究设计1、调查研究的特点:2、调查研究的类型,按调查抽样比例划分.第3章实验设计1、实验设计的特点.2、实验设计的三要素四原则。
3、常用的实验设计方案:(attention:正确区别完全随机设计和配对设计)第4章定量资料的统计描述1、频数表的编制步骤和频数表的用途2、集中趋势的描述。
(P55知识点4-2)3、离散趋势的描述。
(P58知识点4-3)4、正态分布的特征5、制定医学参考值范围第5章定性资料的统计描述1、相对数是对定性资料进行统计描述的一类指标。
2、常用相对数(率、构成比、相对比)的定义3、应用相对数需要注意的问题[知识点5-3] P694、标准化法的意义和基本思想5、标准化率的计算方法与注意事项[知识点5-5] P74补充:1、该方法便于比较,但不能反映实际情况。
2、并非所有资料都可以计算标准化率,若各组间出现交叉,不宜用该方法。
3、两样本做标准化率后应做假设检验第6章总体均数和总体率的估计1、抽样误差的概念。
2、标准误的概念。
[知识点6-2] P793、t分布(了解)(一)t分布的概念与计算公式(二)t分布的特征与t界值表4、可信区间的概念。
5、总体均数的估计方法:[知识点6-3] P83第7章假设检验1、假设检验的基本思想及基本步骤[知识点7-1] P922、Ⅰ型错误与Ⅱ型错误。
[知识点7-2] P933、单侧检验与双侧检验区分。
[知识点7-3] P954、假设检验应该注意的问题。
[知识点7-3] P97第8章 t检验第一节样本与总体均数的比较1.检验步骤2.[知识点8-1] P1003.当样本数量n≧50或总体均数已知时用z检验[知识点8-2] P102第二节配对设计均数的比较1.检验步骤2.[知识点8-3] P103第三节两样本均数的比较1.检验步骤2.z检验的适用条件第9章方差分析第一节方差分析的基本思想和应用条件(1)总变异、组间变异、组内变异的定义与公式(2)条件:符合定量资料,具有独立性正态分布方差齐性的特征,多样本(3或3个以上)间的比较第二节完全随机设计的方差分析(1)检验步骤(2)注意事项:[知识点9-2] P120第四节多个样本均数的两两比较1.q检验适用范围:当方差分析得出结论拒绝H0接受H1假设时需进行q检验2.掌握检验步骤第10章 X2检验第一节2x2表的X2 检验(一)完全随机设计X2 检验1.检验步骤及公式2.注意事项:[知识点10-2] p141(二)配对设计X2 检验1.检验步骤及公式2.[知识点10-3] p142第二节RⅹC表的X2 检验1.注意事项:[10-4] p143第11章非参数检验适用条件:(1)总体分布形式未知或分布类型不明(2)偏态分布的资料(3)等级资料不能精确测定,只能以严重程度优劣等级次序先后等表示(4)不满足参数检验条件资料各组方差明显不齐(5)数据的一端或两端为不确定数值的资料、等级资料(6)[知识点11-1] p153第一节秩和检验1.检验步骤:详读p154 (2)(3)3.第二节两样本比较的秩和检验1.掌握编秩的方法2.注意条件详看p157的3第12章双变量关联性分析第一节直线相关1、直线相关的概念:又称简单相关,是用来描述具有直线关系的两变量x、y相互关系的统计方法,要求两变量均来自双变量正态分布的随机变量,且两变量不分主次,处于同等地位。
医学统计学重点笔记一复习必备

正态分布及其应用
2024/1/26
正态分布概念
一种概率分布,具有钟型曲线特点,由均数和标准差决定 其分布形状。
正态分布在医学中的应用
许多医学指标如身高、体重、血压等服从或近似服从正态 分布;在估计医学参考值范围、质量控制等方面有广泛应 用。
正态性检验方法
图形法(直方图、P-P图、Q-Q图)、计算法(偏度系数 和峰度系数检验、Shapiro-Wilk检验、KolmogorovSmirnov检验等)。
任务
揭示医学领域中的数量规律,为 医学研究和临床实践提供科学的 方法和手段。
4
医学统计学发展简史
01
02
03
古典统计学时期
以描述性统计为主,关注 数据的收集和整理。
2024/1/26
推断统计学时期
以概率论为基础,发展出 假设检验、参数估计等推 断性统计方法。
现代统计学时期
引入计算机技术和复杂数 学模型,推动统计学向更 高层次发展。
2024/1/26
26
2024/1/26
06
卡方检验
27
四格表资料卡方检验
2024/1/26
适用条件
四格表资料,即2×2列联表,用于分析两个二分类变量之间的关联 。
检验统计量
卡方值,计算公式为χ2=(ad-bc)2N/(a+b)(c+d)(a+c)(b+d),其 中N为样本总量。
拒绝域
根据自由度和显著性水平确定拒绝域,自由度为1。
20
多重比较方法
多重比较方法是在方差分析的基础上 ,进一步比较各组均值之间的差异是 否显著的方法。
常用的多重比较方法有LSD法、S-NK法、Tukey法等,其中LSD法是一种 较为简单的方法,适用于各组样本量 相等的情况;S-N-K法是一种基于学 生化极差的方法,适用于各组样本量 不等的情况;Tukey法是一种基于t分 布的方法,适用于多组比较的情况。
卫生统计学知识点汇总

卫生统计学知识点汇总卫生统计学知识点汇总卫生统计学是一门研究如何收集、整理、分析和解释与人类健康相关的统计数据的学科。
以下是一些卫生统计学的知识点汇总:1. 健康指标和健康统计数据卫生统计学研究的核心是健康指标和健康统计数据。
健康指标是用来衡量人类健康状况的指标,如死亡率、发病率、存活率等。
健康统计数据是指收集和整理的与人类健康相关的数据信息。
2. 健康调查和流行病学研究卫生统计学包括健康调查和流行病学研究。
健康调查是通过问卷调查、面访和体检等方式,对人群的健康状况进行评估和监测。
流行病学研究是研究疾病在人群中分布、发生和传播规律的学科。
3. 死因统计学死因统计学是研究人口死亡原因及其统计方法的学科。
通过对死亡证明和其他相关资料的分析,可以得到不同死因的死亡率和死因结构,为公共卫生和医疗健康政策制定提供依据。
4. 卫生服务利用统计卫生服务利用统计研究人群对卫生服务的需求,以及卫生服务的提供情况。
包括统计各类卫生机构的数量、位置和服务范围,以及人群对卫生服务的需求和利用情况。
5. 卫生经济学指标卫生经济学指标是研究卫生经济学相关问题的统计指标。
包括卫生资源投入和产出指标,如医疗卫生总费用、卫生人力资源和医疗服务产出等。
6. 因素分析和回归分析因素分析是研究多个相关变量之间关系的统计方法,可以用于探索影响健康的各种因素。
回归分析是通过建立数学模型,研究一个或多个自变量对因变量的影响程度和方向。
7. 卫生统计学软件与工具卫生统计学的研究除了基本的统计学知识外,还需要掌握一些卫生统计学软件和工具的使用。
如SPSS、R、EpiInfo等数据处理和分析软件。
以上是一些卫生统计学的知识点汇总,这门学科涵盖了众多的知识领域,为研究人类健康提供了重要的数据支持和决策依据。
卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。
可分为目标总体和研究总体。
若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。
需要谨慎的是,就研究总体所下的结论未必适用于目标总体。
3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。
获取样本的过程称为抽样(sampling)。
抽样研究的目的是用样本数据推断总体的特征。
需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。
4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。
5.▲变异(variation)是指同质的个体之间存在的差异。
6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。
8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。
统计学的任务就是依据样本统计量来推断总体参数。
9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。
当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。
2023年医学统计学总结重点笔记复习资料

第一章2选1总体:总体(population)是根据研究目的拟定的同质观测单位(研究对象)的全体,事实上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都可以标记者为有限总体,反之为无限总体。
总体population根据研究目的而拟定的同质观测单位的全体。
样本:从总体中随机抽取部分观测单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观测单位,其实测值的集合。
3选1小概率事件:我们把概率很接近于0(即在大量反复实验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的也许性大小。
记录学根据显著性检查方法所得到的P 值反映结果真实限度,一般以P ≤ 0.05 认为有记录学意义, P ≤0.01 认为有高度记录学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观测样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观测到的(实例的) 显著性水平。
4) 表达对原假设的支持限度,是用于拟定是否应当拒绝原假设的另一种方法。
小概率原理:一个事件假如发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不也许性原理。
记录学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观测单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观测单位某项指标的大小,而获得的资料。
卫生统计学重点笔记

医师资格考试蓝宝书-预防医学医学统计学方法第一节基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。
总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。
总体的指标为参数。
实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。
样本的指标为统计量。
由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。
抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。
某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。
二、变量的分类变量:观察单位的特征,分数值变量和分类变量。
第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布。
2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。
对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。
3.中位数一组按大小顺序排列的观察值中位次居中的数值。
可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。
不能求均数和几何均数,但可求中位数。
百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。
二、描述计量资料的离散趋势的指标1.全距和四分位数间距。
2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。
均为数值越小,观察值的变异度越小。
3.变异系数多组间单位不同或均数相差较大的情况。
变异系数计算公式为:CV=s/X×100%,公式中s为样本标准差,X为样本均数。
卫生统计学的重点归纳

卫生统计学的重点归纳卫生统计学的重点归纳一、卫生统计学的定义卫生统计学是以统计理论和方法为基础,应用数学、物理、化学、计算机等学科技术,研究卫生和医疗问题的数据分析方法。
它以收集,处理,分析和解释卫生和医疗等领域的统计数据为基础,以定量分析和定性分析卫生数据,研究卫生和应用流行病学方法,识别患病危险因素,以及制定卫生与医疗保健的政策与措施,为医学和公共卫生提供科学依据的一门学科。
二、卫生统计学的基本原理(1)基本理论卫生统计学的基本理论包括:(1)数理统计学:数理统计学是以统计学的数据处理方法为工具,探讨多变量间相互关系的学科;(2)社会科学统计学:社会科学统计学是以统计学的方法为工具,研究社会判断和实证研究的学科;(3)中国统计学:中国统计学是以中国传统的统计学理论和方法为基础,研究社会发展进程中社会变迁的学科;(4)应用统计学:应用统计学是以统计学的方法来解决实际问题,如实验设计与分析、生态学分析、经济学分析等。
(2)基本方法卫生统计学的基本方法包括:(1)分类法:分类法是按照实际问题的性质,将被研究对象进行科学的定性分类;(2)测度法:测度法是按照实际问题的性质,将被研究对象进行科学的定量测度;(3)统计方法:统计方法是利用统计技术处理数据,以处理、描述、分析和预测实证问题;(4)流行病学方法:流行病学方法是指在全面调查的基础上,利用统计技术,研究病因、流行病学及其预防控制等方面的方法。
三、卫生统计学的应用1、卫生统计学用于事件分析。
事件分析包括:病原体检测、医疗并发症监测、病因研究、新药研发、疾病控制等研究;2、卫生统计学用于政策分析,为卫生政策、医疗政策、公共卫生政策的制订、实施和评价,提供科学依据;3、卫生统计学用于质量控制。
对质量控制体系中的质量指标进行定量分析、定性分析和评价;4、卫生统计学用于教育考试。
有助于改进教育评价,提高客观能力,开发判断及决策技能;5、卫生统计学用于职业卫生领域,可以指导职业卫生政策的制定和促进各种职业病的预防。
卫生统计学复习笔记

卫生统计学复习笔记一、概述1、卫生统计学的概念(熟练掌握)统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。
卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。
由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科.这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。
作为统计学的应用者应充分认识到这一点。
卫生统计学的内容(了解):1)健康统计:医学人口统计、疾病统计和生长发育统计等;2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。
2、卫生统计学的工作步骤(熟练掌握)统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤:1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计.设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。
其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。
设计是整个研究工作中最关键的一环,也是指导以后工作的依据2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料.及时、准确、完整是收集统计资料的基本原则。
卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。
如法定传染病报表,职业病报表,医院工作报表等。
②经常性工作记录:如卫生监测记录、健康检查记录等。
卫生统计知识点总结

卫生统计知识点总结1. 卫生统计学的基本概念卫生统计学主要包括了一些基本的概念,比如卫生数据的来源、收集、整理和分析方法等。
卫生数据的来源通常包括了临床记录、流行病学调查、专门调查、统计报表等。
在数据收集方面,卫生统计学强调了数据的质量和准确性,以及避免数据偏倚和错误。
数据整理方面,卫生统计学的方法包括了数据清理、归并和分类等,以确保数据的有效性和可分析性。
而在数据分析方面,卫生统计学的方法包括了描述性统计、推断性统计、假设检验、回归分析、生存分析等。
2. 卫生调查和流行病学卫生统计学与卫生调查和流行病学密切相关。
卫生调查是指对于个人和集体的健康状况、卫生问题和医疗服务等进行调查的活动。
流行病学则是研究人群中疾病的发病规律和传播特点的学科。
卫生调查和流行病学的知识点包括了调查设计、样本选择、问卷设计、调查实施、数据分析和结论推断等。
在卫生调查和流行病学中,卫生统计学的方法和技巧是非常重要的。
3. 生物统计学和生物信息学生物统计学是统计学在生物学领域的应用,包括了基因组学、蛋白质组学、代谢组学等领域的统计方法。
在卫生统计学中,生物统计学的知识点包括了遗传分析、基因关联研究、基因组关联分析、蛋白质质谱分析等。
而生物信息学则是应用计算机和统计学方法进行生物学数据的处理和分析,包括了序列比对、基因结构预测、蛋白结构预测、基因表达分析等。
在当今的医学和卫生领域,生物统计学和生物信息学的知识是非常重要的。
4. 健康统计学健康统计学是研究人群健康状况、卫生问题和医疗服务等的统计学方法和理论。
健康统计学的知识包括了健康指标的计算、健康数据的分析、健康状况的评估、卫生问题的研究和医疗服务的评价等。
在健康统计学中,常用的指标包括了死亡率、发病率、患病率、健康质量等。
健康统计学的知识对于评价和改善人群健康状况具有非常重要的意义。
5. 卫生经济学和医疗统计学卫生经济学是研究卫生服务的经济问题的学科,主要包括了卫生支出、卫生保险、医疗机构的效率和成本、医疗资源的配置等。
职称考试卫生统计学重点学习笔记

卫生统计学第一章统计学的基本内容第一节医学统计学的含义1、医学统计学定义医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析的普遍原理和方法。
2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学规律。
3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。
第二节、统计学的几个重要概念一.资料的类型1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。
一般有度量衡单位,每个对象之间有量的区别。
2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。
每个对象之间没有量的差异,只有质的不同。
3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间又有程度的差别。
注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。
二、总体根据研究目的所确定的同质的所有观察对象某项变量值的集合1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。
2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的三、样本从总体中随机抽取部分观察对象,其某项变量值的集合。
从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。
四、随机事件可以发生也可以不发生,可以这样发生也可以那样发生的事件。
亦称偶然事件。
五、概率描述随机事件发生可能性大小的数值,记作P,其取值范围0≤P≤1,一般用小数表示。
P=0,事件不可能发生必然事件(随机事件的特例);P=1,事件必然发生;P→0,事件发生的可能性愈小;P→1,事件发生的可能性愈大六、小概率事件习惯上将P≤0.05或P≤0.01 的随机事件称小概率事件。
表示某事件发生的可能性很小。
七、参数和统计量参数:总体指标,如总体均数、总体率,一般用希腊字母表示统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示八、学习医学统计学的方法1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法;2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。
卫生统计学知识点整理(一)

卫生统计学考点整理(一)2017年11月24日一、绪论:1、什么是卫生统计学:卫生统计学是运用数理统计的基本原理和方法对预防医学和公共卫生领域中的科学研究进行设计,以及研究资料的收集、整理和分析的一门应用科室。
2、卫生统计学的基本内容包括哪些?①卫生统计学的基本理论和方法,包括研究设计和数据分析中的统计理论和方法。
②健康统计,包括医学人口统计、疾病统计和生长发育统计等。
③卫生服务统计,包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等的统计问题。
3、什么是计量资料?用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得到的数据(即测量值)成为计量资料(计量资料含有单位)4、什么是计数资料?将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样得到的数据成为计数资料(也称分类资料)(不含单位)5、什么是等级资料?将全体观察单位按照某种性质的不同程度分为若干组,分别清点各组中观察单位的个数。
6、什么是总体?根据研究目的的确定的同质观察单位的全体。
(是同质的所有观察单位某种变量值的集合)7、什么是同质?研究对象具有相同的背景、条件、属性统计学所研究的对象是以同质为基础,具有变8、什么是变异?同一性质的事物,其个体观察值(变量值)之间的差异。
异的事物或现象。
9、什么是样本?从总体中随机抽取具有代表性的一部分个体,其测量值(或观察值)的集体成为样本。
10、什么是抽样研究?对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。
11、抽样研究的目的是什么?通过用样本资料计算的指标去推论总体。
12、什么是参数?参数是指总体指标。
(如:总体均数μ、总体率π、总体标准差σ等)13、什么是统计量?统计量是指样本指标。
(如:样本均数、样本率p、样本标准差S等)14、什么是统计描述?用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征15、什么是统计推断?根据样本资料的特性对总体的特性作估计或者推论的方法。
卫生统计学重点笔记

医师资历测验蓝宝书-预防医学医学统计学办法第一节根本概念和根本步调(异常重要)一.统计工作的根本步调设计(最症结.决议成败).汇集材料.整顿材料.剖析材料.总体:依据研讨目标决议的同质研讨对象的全部,确实地说,是性质雷同的所有不雅察单位某一变量值的聚集.总体的指标为参数.现实工作中,经常是从总体中随机抽取必定命量的个别,作为样本,用样本信息来揣摸总体特点.样本的指标为统计量.因为总体中消失个别变异,抽样研讨中所抽取的样本,只包含总体中一部分个别,这种由抽样引起的差别称为抽样误差.抽样误差愈小,用样本揣摸总体的精确度愈高;反之,其精确度愈低.小概率事宜.二.变量的分类变量:不雅察单位的特点,分数值变量和分类变量.第二节数值变量数据的统计描写(重要考点)一.描写计量材料的分散趋向的指标有1.均数均数是算术均数的简称,实用于正态或近似正态散布.2.几何均数实用于等比材料,尤其是对数正态散布的计量材料.对数正态散布即原始数据呈偏态散布,经对数变换后(用原始数据的对数值lgX代替X)屈服正态散布,不雅察值不克不及为0,同时有正和负.3.中位数一组按大小次序分列的不雅察值中位次居中的数值.可用于描写任何散布,特殊是偏态散布材料的分散地位,以及散布不明或散布末尾无肯定命据材料的中间地位.不克不及求均数和几何均数,但可求中位数.百分位数是个界值,将全部不雅察值分为两部分,有X%比小,剩下的比大,可用于盘算正常值规模.二.描写计量材料的离散趋向的指标1.全距和四分位数间距.2.方差和尺度差最为经常运用,适于正态散布,既斟酌了离均差(不雅察值和总体均数之差),又斟酌了不雅察值个数,方差使本来的单位变成了平方,所以开方为尺度差.均为数值越小,不雅察值的变异度越小.3.变异系数多组间单位不合或均数相差较大的情形.变异系数盘算公式为:CV=s/X×100%,公式中s为样本尺度差,X为样本均数.三.尺度差的运用暗示不雅察值的变异程度(或离散程度).在两组(或几组)材料均数邻近.器量单位雷同的前提下,尺度差大,暗示不雅察值的变异度大,即各不雅察值离均数较远,均数的代表性较差;反之,暗示各不雅察值多分散在均数四周,均数的代表性较好.(常考!)四.医学参考值的盘算办法,单双侧问题,医学为95%医学参考值是斧正常人体或动物体的各类心理常数,因为消失变异,各类数据不但因人而异,并且统一小我还会随机体表里情形的转变而转变,因而须要肯定其摇动的规模,即正常值规模.医学参考值的盘算公式:①正态散布材料95%医学参考值:X±1.96s(双侧);X X-1.645s(单侧),s为尺度差.②百分位数法P和P(双侧);P5或P95(单侧).第三节数值变量数据的统计揣摸(重要考点)一.尺度误,尺度误与尺度差和样本含量的关系尺度差和尺度误的差别.样本尺度误等于样本尺度差除以根号下样本含量.尺度误与尺度差成正比;与样本含量的平方根成反比.是以.为削减抽样误差,应尽可能包管足够大的样本含量.样本尺度差与样本尺度误是既有接洽又有区此外两个统计量,二者的接洽是公式:二者的差别在于:样本尺度差是反应样本中各不雅测值X1,X2,……,X n变异程度大小的一个指标,它的大小说清楚明了对该样本代表性的强弱.样本尺度误是样本平均数1,2,……的尺度差,它是抽样误差的估量值,其大小说清楚明了样本间变异程度的大小及精确性的高下.(控制!)二.t散布和尺度正态u散布关系均以0为中间阁下两侧完整对称的散布,只是t散布曲线顶端较u散布低,两头翘.(v逐渐增大,t散布逐渐逼近u散布).正态散布的特色:①以均数为中间阁下两侧完整对称散布;②两个参数,均数u(地位参数)和s(变异参数);③对称均数的两正面积相等.三.总体均数的估量样本统计量推算总体均数有两个重要方面:区间估量和假设磨练.样本均数估量总体均数称点估量.总体均数区间估量(可托区间)的概念:按必定的可托度估量未知总体均数地点规模.其统计上习习用95%(或99%)可托区间暗示总体均数μ有95%(或99%)的可能在某一规模.可托区间的两个要素,一为精确度,反应在可托度1-α的大小,即区间包含总体均数的概率大小,当然愈接近1愈好;二是精度,反应在区间的长度,当然长度愈小愈好.在样本例数肯定的情形下,二者是抵触的,须要统筹.总体均数可托区间的盘算办法:1.当n小按t散布的道理用式盘算可托区间为:X±tαv S X/2,2.当n足够大因n足够大时,t散布逼近μ散布,按正态散布道理.用式估量可托区间为:X±μα/2SX可托区间与医学参考值规模的差别:二者的意义和算法不合.四.假设磨练的步调1.树立假设:H0(无效,两样本代表的总体均数雷同),H1(备择,两样本来自不合总体),当谢绝H0就接收H1,不谢绝就不接收H1.2.肯定明显性程度:区分精确率和小概率事宜的尺度,平日取α=0.05.3.盘算统计量:依据材料类型和剖析目标选择恰当的公式盘算.4.肯定概率P值:将盘算得到的t值或u值查界值表得到P 值和α值比较.5.做出揣摸结论.|t|值.P值与统计结论五.两均数的假设磨练(常考!)1.样本均数与总体均数比较 u磨练和t磨练用于样本均数与总体均数的比较.理论上请求样本来自正态散布总体现实中,只要样本例数n较大,或n小但总体尺度差σ已知,就选用u磨练.n 较小且σ未知时,用于t磨练.两样本均数比较时还请求两总体方差等.以算得的统计量t,按表所示关系作断定.2.配对材料的比较在医学研讨中,经常运用配对设计.配对设计重要有四种情形:①统一受试对象处理前后的数据;②统一受试对象两个部位的数据;③统一样品用两种办法(仪器等)磨练的成果;④配对的两个受试对象分离接收两种处理后的数据.情形①的目标是揣摸其处理有无感化;情形②.③.④的目标是揣摸两种处理(办法等)的成果有无不同.v=对子数-1;如处理前后或两法无不同,则其差数d的总体均数应为0,可看作样本均数d和总体均数0的比较.d为差数的均数;d S 为差数均数的尺度误,S d 为差数的尺度差;n 为对子数.因盘算的统计量是t,按表所示关系作断定.3.完整随机设计的两样本均数的比较 亦称成组比较.目标是揣摸两样本各自代表的总体均数μ1与μ2是否相等.依据样本含量n 的大小,分u 磨练与t 磨练.t 磨练用于两样本含量n 1.n 2较小时,且请求两总体方差相等,即方差齐.若被磨练的两样本方差相差明显则需用t ′磨练.u 磨练:两样本量足够大,n>50.21X X S -=)(21212C n n n n S + v =(n 1-1)+(n 2-1)=n 1+n 2-2 式中21X X S -,为两样本均数之差的尺度误,Sc 2为归并估量方差(combined estimate variance ).算得的统计量为t,按表所示关系做出断定.4.Ⅰ型错误和Ⅱ型错误 弃真,谢绝精确的H 0为Ⅰ型错误α暗示,若明显性程度α定为0.05,则犯Ⅰ型错误的概率0.05;接收错误的H 0为Ⅱ型错误,概率用β暗示,β值的大小很难确实估量.当样本含量一准时,两者反比,增大n,当α一准时,可削减β.1-β称为磨练效能或掌控度,其统计意义是若两总体确有不同,按α水准能检出其差此外才能.客不雅现实谢绝H 0 不谢绝H 0H 0成立 Ⅰ型错误(α) 揣摸精确1-αH 0不成立揣摸精确(1-β) Ⅱ型错误(β)5.假设磨练留意事项 包管组间可比性;依据研讨目标.材料类型和设计类型选用恰当的磨练办法,熟习各类磨练办法的运用前提;“明显与否”是统计学术语,为“有无统计学意义”,不克不及懂得为“不同是不是大”;结论不克不及绝对化.第四节 分类变量材料的统计描写(一般考点)相对数是两个有接洽关系事物数据之比.经常运用的相对数指标有构成比.率.相比较等.一.构成比暗示事物内部各个构成部分所占的比重,平日以100为例基数,故又称为百分比.其公式如下: 构成比=个体数总和事物内部各构成部分的的个体数事物内部某一构成部分×100% 该式可用符号表达如下: 构成比=⋯⋯+++C B A A ×100% 构成比有两个特色:(1)各构成部分的相对数之和为100%.(2)某一部分所占比重增大,其他部分会响应地削减.二.率用以解释某种现象产生的频率或强度,故又称频率指标,以100,1000,10000或100000为比例基数(K )均可,原则上以成果至少保存一位整数为宜,其盘算公式为:率和构成比不合之处:率的大小仅取决于某种现象的产生数和可能产生该现象的总数,不受其他指标的影响,并且各率之和一般不为1. 率=可能发生某现象的总数某现象实际发生例数×K 该式亦可用符号表达如下 阳性率=)()()(-+++A A A ×K (若算阴性率则分子为A (-))式中A (+)为阳性人数,A (-)为阴性人数.三.相比较暗示有关事物指标之比较,常以百分数和倍数暗示,其公式为:相比较:甲指标/乙指标(或×100%)或用符号暗示为:A/B ×K四.留意事项①构成比和率的不合,不克不及以比代率;②盘算相对数时,不雅察例数不宜过小;③率的比较留意可比性,特殊是混淆身分的问题,有的话,可用尺度化法和分层剖析清除;④不雅察单位不合的几个率的平均率不等于几个率的算术均数;⑤样本率或构成比的比较应做假设磨练.第五节 分类变量材料的统计揣摸(异常重要)一.率的抽样误差用抽样办法进行研讨时,必定消失抽样误差.率的抽样误差大小可用率的尺度误来暗示,盘算公式如下:σp=n π)π(1+式中:σp为率的尺度误,π为总体阳性率,n为样本含量.因为现实工作中很难知道总体阳性率π,故一般采取样本率P来代替,而上式就变成S p=n P)P(1-二.总体率的可托区间因为样本率与总体率之间消失着抽样误差,所以也需依据样本率来推算总体率地点的规模,依据样本含量n和样本率P的大小不合,分离采取下列两种办法:(一)正态近似法(常考!)当样本含量n足够大,且样本率P和(1-P)均不太小,如nP 或n(1-P)均≥5时,样本率的散布近似正态散布.则总体率的可托区间可由下列公式估量:总体率(π)的95%可托区间:p±p总体率(π)的99%可托区间:p±p(二)查表法当样本含量n较小,如n≤50,特殊是P接近0或1时,则按二项散布道理肯定总体率的可托区间,其盘算较繁,读者可依据样本含量n和阳性数x参照专用统计学介绍的二项散布中95%可托限表.三.u磨练(异常重要!)当样本含量n 足够大,且样本率P 和(1-P )均不太小,如nP 或n (1-P )均≥5时,样本率的散布近似正态散布.样本率和总体率之间.两个样本率之间差别的断定可用u 磨练.1.样本率和总体率的比较公式 u=|P-π|/σP =|P-π|/n π)/π(1-;2.两样本率比较公式 u=|P 1-P 2|/Sp 1-P 2=|P 1-P 2|/)1/)(1/(121n n p p c c +-也可用χ2磨练,两者相等.四.χ2磨练(异常重要!)可用于两个及两个以上率或构成比的比较;两分类变量相干关系剖析.其数据构成,必定是互相对峙的两组数据,四格表材料自由度v 永久=1.四格表χ2磨练各类公式实用前提,n>40且每个格子T>5,可用根本公式或专用公式,不必校订.根本公式:χ2=∑(A-T )2/T专用公式:χ2=∑(ad-bc )2n/(a+b )(c+d )(a+c )(b+d )只要有一个格子T 在1~5之间,需校订.校订公式:根本公式:χ2=∑(|A-T |-0.5)2/T专用公式:χ2=∑(|ad-bc |-n/2)2n/(a+b )(c+d )(a+c )(b+d )n<40或T<1,用确实概率法.五.行×列表χ2磨练当行数或列数超出2时,称为行×列表.行×列表χ2磨练是对多个样本率(或构成比)的磨练.实用前提:一般以为行×列表中不宜有1/5以上格子的理论数小于5,或有小于1的理论数.1.当理论数太小可采纳下列办法处理①增长样本含量以增大理论数;②删去上述理论数太小的行和列;③将太小理论数地点组与性质邻近的组归并,使从新盘算的理论数增大.因为后两法可能会损掉信息,伤害样本的随机性,不合的归并方法有可能影响揣摸结论,故不宜作通例办法.别的,不克不及把不合性质的现实数归并,如研讨血型时,不克不及把不合的血型材料归并.2.如磨练成果谢绝磨练假设,只能以为各总体率或总体构成比之间总的来说有不同,但不克不及解释它们彼此之间都有不同,或某两者间有不同.3.关于单向有序行列表的统计处理在比较遍地理组的效应有无不同时,宜用秩和磨练法,如作χ2磨练只解释遍地理组的效应在构成比上有无差别.六.配对计数材料的χ2磨练统一样品用两种办法处理,不雅察阳性和阴性个数.断定两种处理办法是否雷同.当b+c>40时,χ2=(b-c)2/b+c;b+c<40时,校订公式:χ2=(|b-c|-1)2/b+c第六节直线相干和回归(一般考点)一.直线相干剖析的用处.相干系数及其意义相干剖析是研讨事物或现象之间有无关系.关系的偏向和亲密程度.相干系数:是定量暗示两个变量(X,Y)之间线性关系的偏向和亲密程度的指标,用r暗示,r=lxy/lxxlxy,其值在-1至+1间,r 没有单位.r呈正值,两变量间呈正相干,即两者的变更趋向是同向的,r=1时为完整正相干;如r呈负值,两变量呈负相干,即两者的变更趋向是反向的,r=-1时为完整负相干.r的绝对值越接近1,两变量间线性相干越亲密;越接近于0,相干越不亲密.当r=0时,解释X和Y两个变量之间无直线关系.二.直线回归剖析的感化.回归系数及其意义直线回归剖析的义务在于找出两个变量有依存关系的直线方程,以肯定一条最接近于各实测点的直线,使各实测点与该线的纵向距离的平方和为最小.这个方程称为直线回归方程,据此方程描写的直线就是回归直线.直线同归方程式的一般表达式Y=a+bX式中a为回归直线在Y轴上的截距,即a>0暗示直线与Y轴的交点在原点上方,<0在原点下方,a=0过原点.b为样本回归系数,即回归直线的斜率,暗示当X变动一个单位时,Y平均变动b个单位.b>0:暗示Y随X增大而增大b<0:暗示Y随X增大而削减b=0:暗示Y不随X变更而变更第七节统计表和统计图(重要考点)一.统计表原则:构造简略.层次分明.内容安插合理.重点凸起.数据精确.1.标题简洁表达表的中间内容,地位在表的上方.2.标目有横标和纵标目,横标目平日位于表内左侧;纵标目列在表内上方,其表达成果与主辞呼应.3.线条力图简洁,一般为三线表.4.用阿拉伯数暗示,如很多据或暂缺材料,也可用“-”或“…”来暗示.5.备注一般不列入表内,解释在表下.内容分列:一般按事物产生频率大小次序来分列,比较光鲜,重点凸起.二.统计图1.线图(line diagram)(常考!)材料性质:实用于持续变量材料.剖析目标:用线段的起落表达某事物的动态(差值)变更.2.半对数线图(semilogarithmic line graph)材料性质:实用于持续变量材料.剖析目标:用线段的起落表达事物的成长速度变更趋向.3.直方图(histogram)材料性质:实用于数值变量,持续性材料的频数表材料.剖析目标:直方图是以直方面积表达各组段的频数或频率.4.直条图(bar chart)材料性质:实用于彼此自力的材料.剖析目标:直条图是用等宽直条的和长短来暗示各统计量的大小,进行比较.5.百分条图(percentchart)材料性质:构成比.剖析目标:用长条各段的长度(面积)表达内部构成比.6.圆形图(circulargraph)(常考!)材料性质:构成比.剖析目标:用圆的扇形面积表达内部构成比.7.散点图(scatterdiagram)材料性质:双变量材料.剖析目标:用点的密集度和趋向表达两变量间的相干关系.8.统计地图(statistical map)材料性质:地区性材料.剖析目标:用不合纹线或色彩代表指标高下,解释地域散布.。
(完整word版)卫生统计学知识点汇总

(完整word版)卫⽣统计学知识点汇总1、卫⽣统计学是应⽤概率论和数理统计学的基本原理和⽅法,研究居民卫⽣状况以及卫⽣服务领域中数据的收集、整理和分析的⼀门科学,是卫⽣及其相关领域研究中不可缺少的分析问题和解决问题的重要⼯具。
2、统计⼯作的基本步骤:①设计;②收集资料;③整理资料;④分析资料3、分析资料是根据研究⽬的计算有关指标描述数据的基本特征,选择适当统计⽅法对资料进⾏分析,阐明事物的内在联系和规律的过程。
统计分析包括:①统计描述:是指选⽤统计指标、统计表或统计图等对资料的数量特征及其分布规律进⾏测定和描述②统计推断:是指选择恰当的统计⽅法由已知的样本信息推断总体的特征,包括参数估计和假设检验4、(1)①同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性②变异:我们将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异(2)①总体:根据研究⽬的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种特征或属性的观察值或测量值的集合。
若总体明确了特定的时间和空间范围且包含有限个观察单位,称为有限总体。
若总体没有特定的时间和空间范围的限制,且包含的观察单位个数是⽆限的或⼏乎是不可能准确计数的,称该总体为⽆限总体②样本:从总体中随机抽取的具有代表性的部分观察单位的集合(3)①参数:反映总体特征的指标称为参数②统计量:根据样本观察值计算出来的指标称为统计量(4)①变量:确定总体之后,研究者需要对每个观察单位的某项特征或属性进⾏观察或测量,这种特征或属性称为变量。
变量的观察值或测量值称为变量值或观察值②资料:变量值的集合称为资料。
资料可分为定量资料(⼜称计量资料)和定性资料(⼜称分类资料)两类。
定性资料⼜可分为计数资料和等级资料(5)①抽样研究:从总体中随机抽取样本,通过样本信息推断总体特征的研究⽅法称为抽样研究②抽样误差:由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差产⽣抽样误差的根源在于个体变异,由于个体变异是普遍存在的,因此在抽样研究中抽样误差是不可避免的,但它具有⼀定的规律性,可以⽤统计学⽅法估计其⼤⼩(6)概率:随机事件发⽣可能性⼤⼩的数值度量当某事件发⽣的概率P≤0.05时,统计学中习惯上称该事件为⼩概率事件,表⽰在⼀次实验或观察中该事件发⽣的可能性很⼩,可以视为很可能不发⽣。
卫生统计学重点笔记

医师资格考试蓝宝书—预防医学医学统计学方法第一节基本概念和基本步骤(非常重要)一、统计工作的基本步骤设计(最关键、决定成败)、搜集资料、整理资料、分析资料。
总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合.总体的指标为参数。
实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。
样本的指标为统计量.由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。
抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低.某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,〈0.05或0.01为小概率事件。
二、变量的分类变量:观察单位的特征,分数值变量和分类变量。
第二节数值变量数据的统计描述(重要考点)一、描述计量资料的集中趋势的指标有1.均数均数是算术均数的简称,适用于正态或近似正态分布。
2。
几何均数适用于等比资料,尤其是对数正态分布的计量资料。
对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。
3。
中位数一组按大小顺序排列的观察值中位次居中的数值。
可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。
不能求均数和几何均数,但可求中位数。
百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。
二、描述计量资料的离散趋势的指标1。
全距和四分位数间距.2。
方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。
均为数值越小,观察值的变异度越小.3.变异系数多组间单位不同或均数相差较大的情况.变异系数计算公式为:CV=s/X ×100%,公式中s为样本标准差,X为样本均数.三、标准差的应用表示观察值的变异程度(或离散程度)。
卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。
可分为目标总体和研究总体。
若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。
需要谨慎的是,就研究总体所下的结论未必适用于目标总体。
3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。
获取样本的过程称为抽样(sampling)。
抽样研究的目的是用样本数据推断总体的特征。
需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。
4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。
5.▲变异(variation)是指同质的个体之间存在的差异。
6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。
8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。
统计学的任务就是依据样本统计量来推断总体参数。
9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。
当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学复习笔记一、概述1、卫生统计学的概念(熟练掌握)统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。
卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。
由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。
这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。
作为统计学的应用者应充分认识到这一点。
卫生统计学的内容(了解):1)健康统计:医学人口统计、疾病统计和生长发育统计等;2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。
2、卫生统计学的工作步骤(熟练掌握)统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤:1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。
设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。
其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。
设计是整个研究工作中最关键的一环,也是指导以后工作的依据2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。
及时、准确、完整是收集统计资料的基本原则。
卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。
如法定传染病报表,职业病报表,医院工作报表等。
②经常性工作记录:如卫生监测记录、健康检查记录等。
③专题调查或实验。
3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。
整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。
其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。
4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。
统计分析包括统计描述和统计推断。
前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行描述;后者是指如何抽样,以及如何用样本信息推断总体特征。
进行资料分析时,需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。
统计工作的四个步骤紧密相连、不可分割,任何一步的缺陷,都将影响整个研究结果。
3、基本概念:1)、同质与变异。
严格地讲,同质是指被研究指标的影响因素完全相同。
但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。
所以,在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。
例如研究儿童的身高时,要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。
同质基础上的个体差异称为变异。
如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。
事实上,客观世界充满了变异,生物医学领域更是如此。
哪里有变异,哪里就需要统计学。
若所研究的同质群体中所有个体一模一样,只需观察任一个体即可,无须进行统计研究。
2)、总体与样本任何统计研究都必须首先确定观察单位,亦称个体。
观察单位是统计研究中最基本的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。
总体是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。
例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩,观察单位是每个7岁健康男孩,变量是身高,变量值(观察值)是身高测量值,则山东省2002年全体7岁健康男孩的身高值构成一个总体。
它的同质基础是同地区、同年份、同性别、同为健康儿童。
总体又分为有限总体和无限总体。
有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个,如上例;无限总体是抽象的,无时间和空间的限制,观察单位数是无限的,如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质基础是缺碘性甲状腺病患者,同用碘盐防治;该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间范围的限制,因而观察单位数无限,该总体为无限总体。
在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。
样本是按照随机化原则,从总体中抽取的有代表性的部分观察单位的变量值的集合。
如从上例的有限总体(山东省2002年7岁健康男孩)中,按照随机化原则抽取100名7岁健康男孩,他们的身高值即为样本。
从总体中抽取样本的过程为抽样,抽样方法有多种。
抽样研究的目的是用样本信息推断总体特征。
统计学好比是总体与样本间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数(亦称样本含量)恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。
3)、资料与变量及其分类总体确定之后,研究者应对每个观察单位的某项特征进行测量或观察,特征称为变量。
如“身高”、“体重”、“性别”、“血型”、“疗效”等。
变量的测定值或观察值称为变量值或观察值,亦称为资料。
按变量的值是定量的还是定性的,可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。
在处理资料之前,首先要分清变量类型。
1)数值变量:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。
如身高(cm)、体重(kg)、血压(mmHg kPa)、脉搏(次/min)和白细胞计数(×10 9 /L)等。
这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料。
大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。
2)分类变量:其变量值是定性的,表现为互不相容的类别或属性。
分类变量可分为无序变量和有序变量两类:(1)无序分类变量是指所分类别或属性之间无程度和顺序的差别。
它又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。
对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。
(2)有序分类变量各类别之间有程度的差别。
如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。
对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。
变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。
例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高分为五个等级时,可按等级资料分析。
有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。
4、随机事件与概率医学研究的现象,大多数是随机现象,对随机现象进行实验或观察称为随机试验。
随机试验的各种可能结果的集合称为随机事件,亦称偶然事件,简称事件。
例如用相同治疗方案治疗一批某病的患者,治疗转归可能为治愈、好转、无效、死亡四种结果,对于一个刚入院的患者,治疗后究竟发生哪一种结果是不确定的,可能发生的每一种结果都是一个随机事件。
对于随机事件来说,在一次随机试验中,某个随机事件可能发生也可能不发生,但在一定数量的重复试验后,该随机事件的发生情况是有规律可循的。
概率是描述随机事件发生的可能性大小的数值,常用P表示。
例如,投掷一枚均匀的硬币,随机事件A表示“正面向上”,用 n表示投掷次数;m表示随机事件A发生的次数;f表示随机事件A发生的频率(f=m/n),0≤m≤n, 0≤f≤1。
用不同的投掷次数n作随机试验,结果如下:m/n=8/10=0.8, 7/20=0.35,…… , 249/500=0.498,501/1000=0.501, 10001/2000=0.5000,由此看出当投掷次数n足够大时,f=m/n→0.5,称P(A)=0.5,或简写为:P=0.5。
当n足够大时,可以用f估计P。
随机事件概率的大小在0与1之间,即0<P<1,常用小数或百分数表示。
P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。
P=1表示事件必然发生,P=0表示事件不可能发生,它们是确定性的,不是随机事件,但可以把它们看成随机事件的特例。
若随机事件A的概率P(A)≤a,习惯上,当a=0.05时,就称A为小概率事件。
其统计学意义是小概率事件在一次随机试验中不可能发生。
例如,某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万,但大街上仍有行人,这是因为“被撞”事件是小概率事件,所以行人认为自己上街这“一次试验”中不会发生“被撞”事件。
“小概率”的标准a是人为规定的,对于可能引起严重后果的事件,如术中大出血等,可规定a=0.01,甚至更小。
误差是指测定结果与真实结果之间的差值。
对任何一个物理量进行的测量都不可能得出一个绝对准确的数值,即用测量技术所能达到的最完善的方法,测出的数值也和真实值存在差异,这种测量值和真实值的差异称为误差。
误差的分类误差分为绝对误差和相对误差。
也可以根据误差的来源分为系统误差(又称偏性)和随机误差(又称机会误差)。
1、绝对误差是测量值对真值偏离的绝对大小,因此它的单位与测量值的单位相同。
2、相对误差则是绝对误差与真值的比值,因此它是一个百分数。
一般来说,相对误差更能反映测量的可信程度。
相对误差等于测量值减去真值的差的绝对值除以真值,再乘以百分之一百。
3、系统误差是由一些固有的因素(如测量方法的缺陷)产生的,理论上总是可以通过一定的手段来消除。
如天平的两臂应是等长的,可实际上是不可能完全相等的;天平配置的相同质量的砝码应是一样的,可实际上它们不可能达到一样。
4、随机误差是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差(也称为偶然误差和不定误差)。