卫生统计学知识点总结
(完整版)卫生统计学知识点总结

卫生统计学统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。
★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。
a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。
b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。
变量资料可分为定性变量、定量变量。
不同类型的变量可以进行转化,通常是由高级向低级转化。
资料按性质可分为计量资料、计数资料和等级资料。
定量资料的统计描述1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。
离散型定量变量的频率分布图可用直条图表达。
2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。
★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
《卫生统计学》考试重点复习资料

卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。
总体:根据研究目的确定的同质(大同小异)的观察单位的全体。
分为目标总体和研究总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体。
变量:表现出个体变异性的任何特征或属性。
分定型变量和定量变量。
定型变量:1)分类变量或名义变量:最简单的是二分类变量。
0-1变量也常称为假变量或哑变量。
2)有序变量或等级变量。
定量变量:分离散型变量和连续型变量。
变量只能由高级向低级转化:定量→有序→分类→二值。
常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。
2)计数资料或分类资料,如性别、血型等。
3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。
累计频数为该组及前面各组的频数之和。
累计频率表示各组累计频数在总例数中所占的比例。
可用直条图表达。
2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。
2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。
3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。
4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。
分:直接法和频率表法。
即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。
卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。
可分为目标总体和研究总体。
若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。
需要谨慎的是,就研究总体所下的结论未必适用于目标总体。
3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。
获取样本的过程称为抽样(sampling)。
抽样研究的目的是用样本数据推断总体的特征。
需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。
4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。
5.▲变异(variation)是指同质的个体之间存在的差异。
6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。
8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。
统计学的任务就是依据样本统计量来推断总体参数。
9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。
当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。
卫生统计学6版重点总结

第一章绪论一,名词解释参数:根据总体分布的特征而计算的总体统计指标。
总体:研究目的确定的同质观察单位的全体。
同质:总体中个体具有相同的性质。
变异:同质基础上的个体差异。
样本:从总体中随机抽取的有代表性的一部分观察单位,其实测值的集合。
统计量:由总体中随机抽取样本而计算的相应样本指标。
概率:描述随机事件发生的可能性大小的数值。
(概率的统计定义:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n 逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
)抽样误差:由个体变异的存在和抽样引起样本统计量与相应的总体参数间以及各样本统计量之间的差别。
二,问答题。
统计学的基本步骤有哪些?答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。
总体与样本的区别与关系?答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。
抽样误差产生的原因有哪些?可以避免抽样误差吗?答:一,个体差异引起;二,抽样方法引起。
抽样误差不能避免,但可以随着样本含量的增大而减小。
何为概率及小概率事件?答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A 在该条件下发生的概率。
小概率事件是指习惯上将P<=0.05或P<=0.01称为小概率事件,表示某事件发生的可能性很小。
第二章定量资料的统计描述一、名词解释频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。
方差:用来度量随机变量和数学期望(即均值)之间的偏离程度。
标准差:也称均方差,是各数据偏离平均数的距离的平均数。
中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。
几何均数:变量对数值的算数均数的反对数。
四分位数间距:百分位数P75和百分位数P25之差。
卫生统计学重点总结

第一章绪论1.卫生统计学的概念P1卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生情况以及卫生服务领域中数据的收集、整理和分析的一门科学。
2.卫生(医学)统计学的主要步骤P3设计;收集资料;整理资料;分析资料3.(选择、判断)卫生统计学的基本概念P4同质(homogeneity):统计学中,若某些观察对象具有相同的特征或属性,称之为同质或具有同质性。
变异(variation):将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异。
总体(population):是根据研究目的确定的的所有观察单位某种特征或属性的观察值或测量值的集合。
样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数称为样本含量。
参数(parameter):反映总体特征的指标称为参数,一般是未知的,常用希腊字母表示。
统计量(statistic):根据样本观察值计算出来的指标称为统计量,常用拉丁字母表示。
变量(variable):每个观察单位的某项特征或属性称为变量。
抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究。
抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差。
资料(data):变量值的集合称之为资料。
★4.资料的分类P4(1)定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
(2)定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可进一步细分为两种资料:1)计数资料:指将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。
包括:①二项分类资料;②无序多项分类资料2)等级资料:亦称有序多分类资料,是将观察单位按某特征或属性的程度或等级顺序分组,清点各组观察单位数所得的资料。
卫生统计学-重点整理资料

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
卫生统计知识点总结

卫生统计知识点总结1. 卫生统计学的基本概念卫生统计学主要包括了一些基本的概念,比如卫生数据的来源、收集、整理和分析方法等。
卫生数据的来源通常包括了临床记录、流行病学调查、专门调查、统计报表等。
在数据收集方面,卫生统计学强调了数据的质量和准确性,以及避免数据偏倚和错误。
数据整理方面,卫生统计学的方法包括了数据清理、归并和分类等,以确保数据的有效性和可分析性。
而在数据分析方面,卫生统计学的方法包括了描述性统计、推断性统计、假设检验、回归分析、生存分析等。
2. 卫生调查和流行病学卫生统计学与卫生调查和流行病学密切相关。
卫生调查是指对于个人和集体的健康状况、卫生问题和医疗服务等进行调查的活动。
流行病学则是研究人群中疾病的发病规律和传播特点的学科。
卫生调查和流行病学的知识点包括了调查设计、样本选择、问卷设计、调查实施、数据分析和结论推断等。
在卫生调查和流行病学中,卫生统计学的方法和技巧是非常重要的。
3. 生物统计学和生物信息学生物统计学是统计学在生物学领域的应用,包括了基因组学、蛋白质组学、代谢组学等领域的统计方法。
在卫生统计学中,生物统计学的知识点包括了遗传分析、基因关联研究、基因组关联分析、蛋白质质谱分析等。
而生物信息学则是应用计算机和统计学方法进行生物学数据的处理和分析,包括了序列比对、基因结构预测、蛋白结构预测、基因表达分析等。
在当今的医学和卫生领域,生物统计学和生物信息学的知识是非常重要的。
4. 健康统计学健康统计学是研究人群健康状况、卫生问题和医疗服务等的统计学方法和理论。
健康统计学的知识包括了健康指标的计算、健康数据的分析、健康状况的评估、卫生问题的研究和医疗服务的评价等。
在健康统计学中,常用的指标包括了死亡率、发病率、患病率、健康质量等。
健康统计学的知识对于评价和改善人群健康状况具有非常重要的意义。
5. 卫生经济学和医疗统计学卫生经济学是研究卫生服务的经济问题的学科,主要包括了卫生支出、卫生保险、医疗机构的效率和成本、医疗资源的配置等。
卫生统计学知识点汇总

● 表示符号:G
● 计算方法:直接法和加权法
(1)直接法:
适用范围:小样本资料
方法:将 n 个观察值(X1,X2,3,……Xn)直接相乘再开 n 次方。 公式:G n X1X2 Xn
用对数形式表示为: 举例:设有 5 份血清样品,滴度分别为: 1:1, 1:10, 1:100, 1:1000, 1:10000
G=lg-1 (Σf lgX/Σf ) 举例:有 95 名麻疹易感儿童,接种麻疹疫苗一个月后,血凝抑制抗体滴度见下表,试求平
均滴度(例)。 G=lg-1 (Σf lgX/Σf )=lg-195) =
即 95 名易感儿童接种疫苗一个月后,血凝抑制抗体的 平均滴度为 1:。
计算几何均数(G )注意事项:
(1)观察值不能为 0;
(2)观察值不能同时有正有负;
(3)同一组资料求得的几何均数小于算术均数。
练习:
1.有 8 份血清的抗体效价分别为:1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640
G lg 1[(lg5 lg10 lg 640) / 8]
,,, , 求平均身高
178. 4 X
10
适用范围:小样本资料,n<30
169. 7
( cm )
方法:将观察值 X1、X2、X3、……、Xn 直接相加,再除以观察值的个数 n。
n
公式: X X X1 X 2 X n i1
n
n
(2)加权法:
适用范围:大样本含量的分组资料或频数表资料。
该研究方法叫抽样研究。 统计推断:样本的现象推断所研究总体的特征。即分析样本数据,获得关于总体的知识。 同质(homogeneity):指研究对象在一定范畴的各种可能影响主要观察指标的其它因素处
卫生统计学总结

卫生统计学总结王玉林石河子大学医学院预防医学系(一)简答题一.方差分析的基本思想是什么?方差分析的基本思想就是把全部观察值间的变异(总变异)按设计和需要分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义,总自由度也分解成相应的几个部分,再做分析。
分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。
二.标准差和标准误的区别与联系?标准差和标准误都是变异指标,但它们之间有区别,也有联系。
1.区别:①概念不同:标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同:当样本含量n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。
2.联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
三.假设检验的原理是什么?假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异。
假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。
1.两类假设对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。
一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。
备则假设:因变量的变化、差异确实是由于自变量的作用往往是我们对研究结果的预期,用H1表示。
虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示。
2.小概率原理小概率原理:小概率事件在一次试验中几乎是不可能发生的至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显著性水平α。
公卫执业医师-卫生统计学知识点整理

①②③④⑤第一章绪论1、统计工作的基本步骤:研究设计-搜集资料-整理资料-分析资料设计是整个研究过程中最关键的一环;研究设计是统计工作的基础和关键。
统计推断包括参数估计和假设检验。
2.计量资料(定量资料):是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。
其变量值是定量的,表现为数值大小,一般具有度量衡单位。
可分为离散型变量(如现有子女数、儿童龋齿数、胎次)和连续型变量(身高、体重、血红蛋白)。
计数资料(定性资料、分类资料):是把观察单位按某种属性(性质)或类别进行分组、清点各组观察单位数所得资料。
各观察数值是定性的,一般无度量衡单位。
各属性之间互不相容(只有“阴、阳”性或···)例:性别、职业、血型。
等级资料:是把观察单位按属性程度或等级顺序分组,清点各组观察单位所得资料。
医学领域的三类资料可以相互转换。
3、同质:是指所研究的观察对象具有某些相同的性质或特征。
变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。
总体:是根据研究目的确定的同质研究对象的全体(或全部同质观察单位)。
观察单位优先的总体称为有限总体;无法确定数量的总体称为无限总体。
样本:从总体中具有代表性的一部分个体。
抽样误差:由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异称为抽样误差。
抽样误差的根源在于个体变异,在抽样研究中是不可避免的。
概率(P):是随机事件发生的可能性大小的数值度量。
P=1的事件称为必然事件;P=0的事件为不可能的事件;0<P<1的事件称为随机事件;P≤0.05的随机事件称为小概率事件。
第二章计量资料的统计描述1、频数表和频数分布图的用途:①揭示计量资料的分布类型;②揭示计量资料分布的重要特征——集中趋势与离散趋势;③便于发现特大或特小的可疑值;④作为陈述资料的形式。
例数大时可以频率估计概率;⑤便于资料的进一步统计分析。
2、集中趋势:①(算数)均数:总体均数μ和样本均数x ;用于计量资料的正态分布或近似正态分布资料②几何均数G:应用于对数正态分布或近似正态分布资料,也可用于呈倍数关系的等比资料。
卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。
可分为目标总体和研究总体。
若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。
需要谨慎的是,就研究总体所下的结论未必适用于目标总体。
3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。
获取样本的过程称为抽样(sampling)。
抽样研究的目的是用样本数据推断总体的特征。
需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。
4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。
5.▲变异(variation)是指同质的个体之间存在的差异。
6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。
8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。
统计学的任务就是依据样本统计量来推断总体参数。
9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。
当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。
卫生统计学知识点汇总

1、卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题和解决问题的重要工具。
2、统计工作的基本步骤:①设计;②收集资料;③整理资料;④分析资料3、分析资料是根据研究目的计算有关指标描述数据的基本特征,选择适当统计方法对资料进行分析,阐明事物的内在联系和规律的过程。
统计分析包括:①统计描述:是指选用统计指标、统计表或统计图等对资料的数量特征及其分布规律进行测定和描述②统计推断:是指选择恰当的统计方法由已知的样本信息推断总体的特征,包括参数估计和假设检验4、(1)①同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性②变异:我们将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异(2)①总体:根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种特征或属性的观察值或测量值的集合。
若总体明确了特定的时间和空间范围且包含有限个观察单位,称为有限总体。
若总体没有特定的时间和空间范围的限制,且包含的观察单位个数是无限的或几乎是不可能准确计数的,称该总体为无限总体②样本:从总体中随机抽取的具有代表性的部分观察单位的集合(3)①参数:反映总体特征的指标称为参数②统计量:根据样本观察值计算出来的指标称为统计量(4)①变量:确定总体之后,研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特征或属性称为变量。
变量的观察值或测量值称为变量值或观察值②资料:变量值的集合称为资料。
资料可分为定量资料(又称计量资料)和定性资料(又称分类资料)两类。
定性资料又可分为计数资料和等级资料(5)①抽样研究:从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究②抽样误差:由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差产生抽样误差的根源在于个体变异,由于个体变异是普遍存在的,因此在抽样研究中抽样误差是不可避免的,但它具有一定的规律性,可以用统计学方法估计其大小(6)概率:随机事件发生可能性大小的数值度量当某事件发生的概率P≤0.05时,统计学中习惯上称该事件为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。
卫生统计学知识点汇总

1、卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题和解决问题的重要工具。
2、统计工作的基本步骤:①设计;②收集资料;③整理资料;④分析资料3、分析资料是根据研究目的计算有关指标描述数据的基本特征,选择适当统计方法对资料进行分析,阐明事物的内在联系和规律的过程。
统计分析包括:①统计描述:是指选用统计指标、统计表或统计图等对资料的数量特征及其分布规律进行测定和描述②统计推断:是指选择恰当的统计方法由已知的样本信息推断总体的特征,包括参数估计和假设检验4、(1)①同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性②变异:我们将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异(2)①总体:根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种特征或属性的观察值或测量值的集合。
若总体明确了特定的时间和空间范围且包含有限个观察单位,称为有限总体。
若总体没有特定的时间和空间范围的限制,且包含的观察单位个数是无限的或几乎是不可能准确计数的,称该总体为无限总体②样本:从总体中随机抽取的具有代表性的部分观察单位的集合(3)①参数:反映总体特征的指标称为参数②统计量:根据样本观察值计算出来的指标称为统计量(4)①变量:确定总体之后,研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特征或属性称为变量。
变量的观察值或测量值称为变量值或观察值②资料:变量值的集合称为资料。
资料可分为定量资料(又称计量资料)和定性资料(又称分类资料)两类。
定性资料又可分为计数资料和等级资料(5)①抽样研究:从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究②抽样误差:由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差产生抽样误差的根源在于个体变异,由于个体变异是普遍存在的,因此在抽样研究中抽样误差是不可避免的,但它具有一定的规律性,可以用统计学方法估计其大小(6)概率:随机事件发生可能性大小的数值度量当某事件发生的概率P≤0.05时,统计学中习惯上称该事件为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。
卫生统计学总结

卫生统计学总结卫生统计学是一门应用广泛的学科,它在医学、公共卫生、生物医学研究等领域发挥着至关重要的作用。
通过收集、整理、分析和解释数据,卫生统计学帮助我们揭示健康和疾病的规律,评估卫生干预措施的效果,为制定卫生政策和决策提供科学依据。
一、数据的类型在卫生统计学中,我们首先要了解数据的类型。
数据可以分为定量数据和定性数据。
定量数据又分为离散型和连续型。
离散型数据通常是计数数据,比如某医院一天内接诊的患者人数。
连续型数据则是可以在一定范围内取任意值的数据,例如身高、体重等。
定性数据则包括分类数据和有序数据。
分类数据如性别(男、女),有序数据如疾病的严重程度(轻、中、重)。
二、数据的收集准确的数据收集是进行有效统计分析的基础。
常用的数据收集方法包括问卷调查、医疗记录审查、实验研究和观察性研究等。
在收集数据时,要确保样本具有代表性,能够反映总体的特征。
同时,要注意数据的准确性和完整性,避免遗漏和错误。
三、数据的整理收集到的数据往往是杂乱无章的,需要进行整理和归纳。
这包括对数据进行编码、录入和核对。
在整理数据的过程中,要检查数据的逻辑一致性,例如年龄和出生日期是否相符。
对于异常值和缺失值,要进行适当的处理。
四、描述性统计描述性统计是对数据的基本特征进行概括和总结。
常用的描述性统计指标包括集中趋势指标(如均值、中位数、众数)和离散程度指标(如标准差、方差、极差)。
均值适用于正态分布的数据,中位数则适用于偏态分布的数据。
对于定性数据,可以使用频率和百分比来描述。
例如,我们研究某地区居民的血压情况,通过测量得到一组数据。
计算出均值和标准差可以让我们了解血压的平均水平和离散程度。
如果数据呈现正态分布,我们可以用均值和标准差来估计总体的血压情况。
五、概率分布概率分布是卫生统计学中的重要概念。
常见的概率分布有正态分布、二项分布、泊松分布等。
正态分布是最常见的分布,许多生理指标如身高、体重等都近似服从正态分布。
二项分布适用于只有两种可能结果的独立重复试验,例如药物治疗的有效和无效。
卫生统计学总结

卫生统计学总结王玉林石河子大学医学院预防医学系(一)简答题一.方差分析的基本思想是什么?方差分析的基本思想就是把全部观察值间的变异(总变异)按设计和需要分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义,总自由度也分解成相应的几个部分,再做分析。
分解的每一部分代表不同的含义,其中至少有一部分代表各均数间的变异情况,另一部分代表误差。
二.标准差和标准误的区别与联系?标准差和标准误都是变异指标,但它们之间有区别,也有联系。
1.区别:①概念不同:标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同:标准差与均数结合估计参考值范围,计算变异系数,计算标准误等。
标准误用于估计参数的可信区间,进行假设检验等。
③它们与样本含量的关系不同:当样本含量n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。
2.联系:标准差,标准误均为变异指标,当样本含量不变时,标准误与标准差成正比。
三.假设检验的原理是什么?假设检验:统计学中的一种推论过程,通过样本统计量得出的差异作为一般性结论,判断总体参数之间是否存在差异。
假设检验的实质是对可置信性的评价,是对一个不确定问题的决策过程,其结果在一定概率上正确的,而不是全部。
1.两类假设对于任何一种研究而言,其结果无外乎有两种可能,即是否符合我们预期。
一般来说证伪一件事情比证实一件事容易,在行为科学的研究中,由于我们无法了解总体中除样本以外的个体情况,因此尝试拒绝虚无假设的方法优于证明备择假设。
备则假设:因变量的变化、差异确实是由于自变量的作用往往是我们对研究结果的预期,用H1表示。
虚无假设:实际上什么也没有发生,我们所预计的改变、差异、处理效果都不存在观察到的差异只是随机误差在起作用,用H0表示。
2.小概率原理小概率原理:小概率事件在一次试验中几乎是不可能发生的至于什么就算小概率事件,那就是我们在计算前明确的决策标准,也就是显著性水平α。
卫生统计学知识点整理一

卫生统计学考点整理(一)2017年11月24日一、绪论:1、什么就是卫生统计学:卫生统计学就是运用数理统计的基本原理与方法对预防医学与公共卫生领域中的科学研究进行设计,以及研究资料的收集、整理与分析的一门应用科室。
2、卫生统计学的基本内容包括哪些?①卫生统计学的基本理论与方法,包括研究设计与数据分析中的统计理论与方法。
②健康统计,包括医学人口统计、疾病统计与生长发育统计等。
③卫生服务统计,包括卫生资源、医疗卫生服务的需求与利用、医疗保健制度与管理等的统计问题。
3、什么就是计量资料?用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得到的数据(即测量值)成为计量资料(计量资料含有单位)4、什么就是计数资料?将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样得到的数据成为计数资料(也称分类资料)(不含单位)5、什么就是等级资料?将全体观察单位按照某种性质的不同程度分为若干组,分别清点各组中观察单位的个数。
6、什么就是总体?根据研究目的的确定的同质观察单位的全体。
(就是同质的所有观察单位某种变量值的集合)7、什么就是同质? 研究对象具有相同的背景、条件、属性 8、什么就是变异? 同一性质的事物,其个体观察值(变量值)之间的差异。
9、什么就是样本?从总体中随机抽取具有代表性的一部分个体,其测量值(或观察值)的集体成为样本。
10、什么就是抽样研究?对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。
11、抽样研究的目的就是什么?通过用样本资料计算的指标去推论总体。
12、什么就是参数?参数就是指总体指标。
(如:总体均数μ、总体率π、总体标准差σ等)13、什么就是统计量?统计量就是指样本指标。
(如:样本均数、样本率p 、样本标准差S 等)14、什么就是统计描述?用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征15、什么就是统计推断?根据样本资料的特性对总体的特性作估计或者推论的方法。
卫生统计学-重点整理资料东大

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN卫生统计学统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。
★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。
a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。
b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。
变量资料可分为定性变量、定量变量。
不同类型的变量可以进行转化,通常是由高级向低级转化。
资料按性质可分为计量资料、计数资料和等级资料。
定量资料的统计描述1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。
离散型定量变量的频率分布图可用直条图表达。
2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。
★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。
定性资料的统计描述1定性资料的基础数据是绝对数。
描述一组定性资料的数据特征,通常需要计算相对数。
定性变量可以通过频率分布表描述其分布特征。
2指标频率型指标强度型指标相对比型指标概念近似反映某一时间出现概率单位时间内某现象的发生率两个有关联的指标A和B之比计算公式A/B有无量纲无有可有、可无取值范围【0,1】可大于1无限制本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的似值表示相对于B的一个单位,A有多少位A和B可以是绝对数、相对数和平均相对比:A、B两指标可以是绝对数、相对数或平均数。
最常见的相对比是人口学中的男女性别比,流行病学中的相对危险度RR=P1/P0也是相对比指标。
3应用相对数应该注意:①防止概念混淆,避免以比代率的错误现象;②计算相对数时分母应有足够数量,如果例数较少会使相对数波动较大,应该使用绝对数;③正确的计算频率(或强度)指标的合计值。
当分组的资料需要合并起来估计频率(或强度)时,应将各组频率的分子相加作为合并估计的分子,各组的分母相加作为合并估计的分母;④频率型指标的解释要紧扣总体和属性;⑤相对数间比较要具备可比性:要注意观察对象是否同质、研究方法是否相同、观察时间是否一致、观察对象内部结构是否一致、对比不同时期资料应注意客观条件是否相同;⑥正确进行相对数的统计推断:在随机抽样的情况下,从样本估计值推断总体相对数应该考虑抽样误差,因此要进行参数估计和假设检验。
4医学人口统计资料主要来源为日常工作记录(报告单、卡、册)、统计报表、人口调查(普查和抽样调查)。
5描述人口学特征的常用指标一般有人口总数和反映人口学基本特征的某些指标。
人口学的基本特征包括性别、年龄、文化、职业等,最常用来描述人口结构的是性别和年龄。
人口学特征指标:老年人口系数、少儿人口系数、负担系数、老少比、性别比。
6有关生育的常用指标有出生率、生育率和人口再生产指标。
测量生育水平的统计指标:粗出生率、总生育率、年龄别生育率、总和生育率。
测量人口再生育的统计指标:自然增长率、粗再生率和净再生率。
7常用的死亡统计指标有:粗死亡率、年龄别死亡率、婴儿死亡率、新生儿死亡率、围生儿死亡率、死因别死亡率、某病病死率和死因构成等。
8疾病统计资料主要来源于:疾病报告和报表材料、医疗卫生工作记录、疾病专题调查资料。
9⑴标准化:两个率或多个率之间进行比较时,为消除内部构成不同的影响,采用统一的标准,对两组或多组资料进行校正(调整),计算得到标准化率后再做比较的方法,称为~。
其目的是统一内部构成,消除混杂因素,是资料具有可比性。
⑵应用标准化法的注意事项:①标准化法的应用范围很广。
当某个分类变量在两组中分布不同时,这两个分类变量就成为两组频率比较的混杂因素,标准化的目的是消除混杂因素。
②标准化后的标准化率,已经不再反映当时当地的实际水平,只表示相互比较的资料间的相对水平。
③标准化法实质是找一个标准,使两组得意在一个共同的平台上进行比较。
选择不同的标准,算出的标准化率也会不同,比较的结果也未必相同,因此报告比较结果时必须说明所选用的标准和理由④两样本标准化率是样本值,存在抽样误差。
比较两样本标准化率,当样本含量较小时,还应作假设检验。
10常用的动态数列分析指标有:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
(1)绝对增长量:是说明事物在一定时期增长的绝对值,可分为:累计增长量(报告期指标与基线期指标之差)和逐年增长量(报告期指标与前一期指标之差)。
(2)发展速度与增长速度:均为相对比,说明事物在一定时期的变化,可计算定基比(即报告期指标与基线期指标的比:a n/a0)和环比(报告期指标与其前一期指标之比:a n/a n-1)。
增长速度表示的是净增长速度,增长速度=发展速度-100%。
(3)平均发展速度与平均增长速度:用于概括某现象在一段时期中的平均变化。
平均发展速度是发展速度的几何平均数,平均发展速度=naan,平均增长速度=平均发展速度-100%。
11统计表和统计图是描述资料特征、呈现统计分析结果的重要工具。
统计表结构标题、标目、线条、数字和备注。
12常用统计图用途:①条图:适用于相互独立的资料(资料有明确分组、不连续);②百分条图、圆图适用于构成比资料;③线图适用于连续性资料,表达事物的动态变化(绝对差值);半对数线图适用于连续性资料,表达事物的发展速度(相对比);④直方图用于描述连续变量的频数分布;⑤散点图适用于双变量资料,用点的排列趋势和密集度表示两变量的相关关系。
常用概率分布1正态分布(连续型随机变量的概率分布)(1)正态概率密度曲线特点:①关于x=μ对称;②在x=μ处取得该概率密度函数的最大值,在x=μ±σ处有拐点;③曲线下面积为1;④正态分布有两个参数:位置参数μ(决定曲线在横轴上的位置)和变异参数σ(决定曲线的形状);⑤μ±σ面积为90%,μ±σ面积为95%,μ±σ面积为99%。
(2)Z 变换与标准正态分布:对于任意一个服从正态分布N (μ,σ2)的随机变量,可作Z 变:Z=σμ-x ,变换后的z 值仍然服从正态分布,且其总体均数为0、总体标准差为1,称此为标准正态分布,用N (0,1)表示。
Φ(z )为标准正态分布Z 变量的累积面积,-∞→Z 的面积,即下侧累计面积。
★(3)正态分布的应用:①确定医学参考值范围:是指特定的“正常”人群(排除了对所研究的指标有影响的的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在范围,习惯用该人群的95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。
方法:a 百分位数法:适用于任何分布类型的资料;b 正态分布法。
②质量控制图:如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布。
控制图共有7条水平线,中心线位于总体均数μ处,警戒限位于μ±2σ处,控制限位于μ±3σ处,此外还有两条位于μ±σ处。
★(4)确定医学参考值的步骤:①从“正常人”总体中抽样,明确研究总体;②用统一和准确的方法测定相应的指标;③根据不同的用途选定适当的百分界限,常用95%;④根据此指标的实际意义,决定单侧范围还是双侧范围;⑤根据此指标的分布决定计算方法,常用的计算方法:正态分布法、百分位数法。
2二项分布:(1)是一种离散型随机变量的分布类型。
如果每个观察对象阳性结果的发生概率为π,阴性结果的发生概率为(1-π);而且每个观察对象的结果是相互对立的,那么,重复观察n 个人,发生阳性结果的人数X 的概率分布为而二项分布,记作B (n ,π)。
二项分布的概率函数P (X )=x n C πX (1-π)n-x , x n C =)!(!n!X n X - ⑵适用条件:①每次实验只有两种互斥的结果;②各次实验互相独立;③发生成功事件的概率恒定。
⑶分布特征:二项分布的特征由二项分布的参数π以及观察的次数n 决定。
①图形分布特征:二项分布图的高峰在μ=n π处或附近;π=时,图形对称;π≠时,分布不对称,且对同一n ,π离愈远,对称性愈差。
对于同一π,随着n 的增大,分布趋于对称。
当n →∞时,只要π不太靠近0或1(特别是当n π和n (1-π)均大于5时),二项分布趋于对称。
②二项分布的均数和标准差:若X 服从二项分布B (n ,π),则X 的总体均数为μ=n π,总体方差为σ2=n π(1-π),总体标准差为σ=π)π(-1n ;若将出现阳性结果的频率记为:P=nX ,则样本率P 的总体均数为μP =π,总体方差为σ2p =nπ)π(-1,总体标准差为σp =n π)π(-1,σp 是频率P 的标准差,又称频率的标准误,反映阳性频率的抽样误差大小。
⑷累积概率计算:①二项分布出现阳性的次数至多为k 次的概率为:P (X ≤k )=X X X n X n -=--∑n x k 0)1()!(!!ππ ②出现阳性的次数至少为k 次的概率为:P (X ≥k )=X k X X n X n -=--∑n x n )1()!(!!ππ。
3 Poisson 分布:⑴是一种离散型随机变量的分布类型,是二项分布的特例,用以描述单位时间、空间、面积等的罕见事件发生次数的概率分布。
一般记作P (λ),λ是Poisson 分布的唯一参数。
总体均数为λ=n π。