卫生统计学重点整理资料东大
卫生统计学知识点整理
卫生统计学知识点整理1.数据类型:卫生统计学包括两种主要类型的数据,即定量数据和定性数据。
定量数据是数值型数据,如身高、体重等,可以使用各种统计方法进行分析。
定性数据是非数值型数据,如性别、职业等,可以使用描述性统计方法进行分析。
2.数据收集方法:卫生统计学使用多种方法收集数据,其中包括调查、观察、实验和文献研究等。
调查是最常用的数据收集方法,通过设计问卷或面对面访谈等手段收集信息。
观察是观察和记录事件或行为,以获取相关数据。
实验是通过对照组和干预组进行比较来确定原因和效果的方法。
文献研究是通过分析已有的文献、报告和统计数据来获取相关信息。
3.数据描述和总结:在数据收集完成后,卫生统计学需要对数据进行描述和总结。
这包括计算各种统计指标,如平均数、中位数、众数和标准差等,以了解数据的分布和变异程度。
4.假设检验:卫生统计学中常用的方法之一是假设检验,用于判断一些变量是否与其他变量有显著关联或差异。
假设检验基于统计学原理,通过计算样本数据与预期数据之间的差异,评估是否拒绝或接受一些假设。
5.相关分析:相关分析是研究两个或多个变量之间关系的统计方法。
它可以确定变量之间的相关性大小和方向,并计算相关系数来度量相关性的强弱。
6.回归分析:回归分析是用来预测和解释一个或多个因变量与一个或多个自变量之间关系的方法。
它可以估计自变量对因变量的影响程度,并评估其统计显著性。
7.生存分析:生存分析是研究个体在一定时间内生存或发生一些事件的概率的统计方法。
它通常用于研究疾病的生存率和治疗效果。
8.抽样方法:抽样方法是在卫生调查中常用的一种方法,它可以通过选择一部分样本来代表整体群体。
常见的抽样方法包括随机抽样、系统抽样、分层抽样和整群抽样等。
9.统计软件:卫生统计学使用各种统计软件来进行数据分析和统计计算。
常用的统计软件包括SPSS、SAS、R和STATA等,它们提供了丰富的统计功能和图形展示方式。
10.数据伦理:卫生统计学中数据伦理是一个重要的问题,主要涉及数据的保密性、隐私保护和知情同意等方面。
《医学统计学》复习重点总结
计量数据比较的统计公式
X 0 t Sx
样本均数与标准值的比较 *配对数据的比较(不做方 差齐性检验 *两样本均数的比较,例数 较小时(做方差齐性检验)
d d t Sd
X1 X 2 t S x1 x2
t检验与可信区间公式小结
X1 X 2 t , SX1X 2
两独立样本均数的t n1 n2 2 检验公式
病变性质
肿瘤
恶性
1.层次不清,结构混乱,难于理解 2.线条过多,不符要求
修改后:
表 10 病变性质 良性肿瘤 恶性肿瘤﹡ 囊肿 瘤样病变 合 计
口腔颌面部不同病变构成情况 例 数 674 558 192 168 1592 构成比(%) 42.34 35.05 12.06 10.55 100.00
﹡包括癌437例,肉瘤101例,果用统计表表达。
统计表类型:
简单表和组合表
统计图: 要求掌握图形选择. 如线图、直条图、直方图、构成图
例: 简单表格式
某地1980年男女HBsAg阳性率的比较 性别 调查例数 男 4234 女 4530 合计 8764 阳性数 303 181 484 阳性率% 7.16 4.00 5.52
第14章基于秩次的统计方法
掌握概念: 1)何为非参数统计? 2) 什么样数据适合采用秩和检验,以及秩和 检验的优缺点。 3)秩和检验有那几种检验方法?
注意:结果(y)数据为等级时,两组比较采 用秩和检验效率高于χ2检验,应首选秩和检验.
表 某病两组疗效的比较 比较组 无效 有效 显效 痊愈 合计 试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57 对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45 Total 39 33 23 7 102
卫生统计学笔记整理
卫生统计学笔记整理第1章绪论1、卫生统计学的概念:2、统计工作的基本步骤:3、卫生统计学的几个基本概念(attention:资料的分类)第2章调查研究设计1、调查研究的特点:2、调查研究的类型,按调查抽样比例划分.第3章实验设计1、实验设计的特点.2、实验设计的三要素四原则。
3、常用的实验设计方案:(attention:正确区别完全随机设计和配对设计)第4章定量资料的统计描述1、频数表的编制步骤和频数表的用途2、集中趋势的描述。
(P55知识点4-2)3、离散趋势的描述。
(P58知识点4-3)4、正态分布的特征5、制定医学参考值范围第5章定性资料的统计描述1、相对数是对定性资料进行统计描述的一类指标。
2、常用相对数(率、构成比、相对比)的定义3、应用相对数需要注意的问题[知识点5-3] P694、标准化法的意义和基本思想5、标准化率的计算方法与注意事项[知识点5-5] P74补充:1、该方法便于比较,但不能反映实际情况。
2、并非所有资料都可以计算标准化率,若各组间出现交叉,不宜用该方法。
3、两样本做标准化率后应做假设检验第6章总体均数和总体率的估计1、抽样误差的概念。
2、标准误的概念。
[知识点6-2] P793、t分布(了解)(一)t分布的概念与计算公式(二)t分布的特征与t界值表4、可信区间的概念。
5、总体均数的估计方法:[知识点6-3] P83第7章假设检验1、假设检验的基本思想及基本步骤[知识点7-1] P922、Ⅰ型错误与Ⅱ型错误。
[知识点7-2] P933、单侧检验与双侧检验区分。
[知识点7-3] P954、假设检验应该注意的问题。
[知识点7-3] P97第8章 t检验第一节样本与总体均数的比较1.检验步骤2.[知识点8-1] P1003.当样本数量n≧50或总体均数已知时用z检验[知识点8-2] P102第二节配对设计均数的比较1.检验步骤2.[知识点8-3] P103第三节两样本均数的比较1.检验步骤2.z检验的适用条件第9章方差分析第一节方差分析的基本思想和应用条件(1)总变异、组间变异、组内变异的定义与公式(2)条件:符合定量资料,具有独立性正态分布方差齐性的特征,多样本(3或3个以上)间的比较第二节完全随机设计的方差分析(1)检验步骤(2)注意事项:[知识点9-2] P120第四节多个样本均数的两两比较1.q检验适用范围:当方差分析得出结论拒绝H0接受H1假设时需进行q检验2.掌握检验步骤第10章 X2检验第一节2x2表的X2 检验(一)完全随机设计X2 检验1.检验步骤及公式2.注意事项:[知识点10-2] p141(二)配对设计X2 检验1.检验步骤及公式2.[知识点10-3] p142第二节RⅹC表的X2 检验1.注意事项:[10-4] p143第11章非参数检验适用条件:(1)总体分布形式未知或分布类型不明(2)偏态分布的资料(3)等级资料不能精确测定,只能以严重程度优劣等级次序先后等表示(4)不满足参数检验条件资料各组方差明显不齐(5)数据的一端或两端为不确定数值的资料、等级资料(6)[知识点11-1] p153第一节秩和检验1.检验步骤:详读p154 (2)(3)3.第二节两样本比较的秩和检验1.掌握编秩的方法2.注意条件详看p157的3第12章双变量关联性分析第一节直线相关1、直线相关的概念:又称简单相关,是用来描述具有直线关系的两变量x、y相互关系的统计方法,要求两变量均来自双变量正态分布的随机变量,且两变量不分主次,处于同等地位。
(完整版)卫生统计学知识点总结
卫生统计学统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。
★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。
a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。
b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。
变量资料可分为定性变量、定量变量。
不同类型的变量可以进行转化,通常是由高级向低级转化。
资料按性质可分为计量资料、计数资料和等级资料。
定量资料的统计描述1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。
离散型定量变量的频率分布图可用直条图表达。
2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。
★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。
(1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。
算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。
(2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。
四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。
方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。
卫生统计学知识点汇总
卫生统计学知识点汇总卫生统计学知识点汇总卫生统计学是一门研究如何收集、整理、分析和解释与人类健康相关的统计数据的学科。
以下是一些卫生统计学的知识点汇总:1. 健康指标和健康统计数据卫生统计学研究的核心是健康指标和健康统计数据。
健康指标是用来衡量人类健康状况的指标,如死亡率、发病率、存活率等。
健康统计数据是指收集和整理的与人类健康相关的数据信息。
2. 健康调查和流行病学研究卫生统计学包括健康调查和流行病学研究。
健康调查是通过问卷调查、面访和体检等方式,对人群的健康状况进行评估和监测。
流行病学研究是研究疾病在人群中分布、发生和传播规律的学科。
3. 死因统计学死因统计学是研究人口死亡原因及其统计方法的学科。
通过对死亡证明和其他相关资料的分析,可以得到不同死因的死亡率和死因结构,为公共卫生和医疗健康政策制定提供依据。
4. 卫生服务利用统计卫生服务利用统计研究人群对卫生服务的需求,以及卫生服务的提供情况。
包括统计各类卫生机构的数量、位置和服务范围,以及人群对卫生服务的需求和利用情况。
5. 卫生经济学指标卫生经济学指标是研究卫生经济学相关问题的统计指标。
包括卫生资源投入和产出指标,如医疗卫生总费用、卫生人力资源和医疗服务产出等。
6. 因素分析和回归分析因素分析是研究多个相关变量之间关系的统计方法,可以用于探索影响健康的各种因素。
回归分析是通过建立数学模型,研究一个或多个自变量对因变量的影响程度和方向。
7. 卫生统计学软件与工具卫生统计学的研究除了基本的统计学知识外,还需要掌握一些卫生统计学软件和工具的使用。
如SPSS、R、EpiInfo等数据处理和分析软件。
以上是一些卫生统计学的知识点汇总,这门学科涵盖了众多的知识领域,为研究人类健康提供了重要的数据支持和决策依据。
《卫生统计学》考试重点复习资料
②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。
卫生统计学-重点整理资料东大
1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的根本原理和方法,研究居民卫生状况以及卫生效劳领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的 4 个根本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个根本概念(P4):⑴ 同质:在统计学中,假设某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵ 变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶ 总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷ 样本:从总体中随机抽取的具有代表性的局部观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸ 参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹ 统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数x 、样本率 等。
⑺ 变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻ 定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼ 定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料2、常用抽样方法〔名称、原理〕:⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取 n 〔样本大小〕个编号,由这 n 个编号所对应的 n 个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成 n 〔样本大小〕个局部,每一局部内含 m 个观察单位;然后从第一局部开始,从中随机抽出第 i 号观察单位,依此用相等间隔 m 机械地在第 2 局部、第 3 局部直至第 n 局部内各抽出一个观察单位组成样本。
⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成假设干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。
卫生统计学知识点(笔记)
第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。
可分为目标总体和研究总体。
若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。
需要谨慎的是,就研究总体所下的结论未必适用于目标总体。
3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。
获取样本的过程称为抽样(sampling)。
抽样研究的目的是用样本数据推断总体的特征。
需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。
4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。
5.▲变异(variation)是指同质的个体之间存在的差异。
6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。
8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。
统计学的任务就是依据样本统计量来推断总体参数。
9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。
当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。
卫生统计学-重点整理资料东大
卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
医学统计学重点重点知识总结
医学统计学重点一.选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为µ1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与ɑ的关系,ɑ是人为规定的,它们之间没有关系; P值↑,ɑ↑(×)4.方差分析自由度v的计算,v总=n-1;v组间=组数(k)-1;v组间=v总-v组间5.理论秩和(n(n+1)/2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(×);有95%的总体参数在该区间内(×);该区间包含95%的总体参数(x);该区间有95%的可能包含总体参数。
(x);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(×);回归系数↑,相关系数↑(×);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。
这个范围称作可信度为1-α的可信区间,又称置信区间。
3.P值:拒绝H0时所冒的风险(或“作出拒绝H0 而接受H1 ”结论时冒了P风险)4.ɑ(第一类错误):H0真实时被拒绝(或H0真实时,拒绝H0,接受H1)5.β(第二类错误):H0不真实时不拒绝(或H0不真实时,不拒绝H0)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异; 引进回归方程后, Y方面的变异。
三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。
分辨一个样本是否属于某特定总体等。
区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。
卫生统计学知识点整理一
卫生统计学考点整理(一)2017年11月24日一、绪论:1、什么就是卫生统计学:卫生统计学就是运用数理统计的基本原理与方法对预防医学与公共卫生领域中的科学研究进行设计,以及研究资料的收集、整理与分析的一门应用科室。
2、卫生统计学的基本内容包括哪些?①卫生统计学的基本理论与方法,包括研究设计与数据分析中的统计理论与方法。
②健康统计,包括医学人口统计、疾病统计与生长发育统计等。
③卫生服务统计,包括卫生资源、医疗卫生服务的需求与利用、医疗保健制度与管理等的统计问题。
3、什么就是计量资料?用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得到的数据(即测量值)成为计量资料(计量资料含有单位)4、什么就是计数资料?将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样得到的数据成为计数资料(也称分类资料)(不含单位)5、什么就是等级资料?将全体观察单位按照某种性质的不同程度分为若干组,分别清点各组中观察单位的个数。
6、什么就是总体?根据研究目的的确定的同质观察单位的全体。
(就是同质的所有观察单位某种变量值的集合)7、什么就是同质? 研究对象具有相同的背景、条件、属性 8、什么就是变异? 同一性质的事物,其个体观察值(变量值)之间的差异。
9、什么就是样本?从总体中随机抽取具有代表性的一部分个体,其测量值(或观察值)的集体成为样本。
10、什么就是抽样研究?对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。
11、抽样研究的目的就是什么?通过用样本资料计算的指标去推论总体。
12、什么就是参数?参数就是指总体指标。
(如:总体均数μ、总体率π、总体标准差σ等)13、什么就是统计量?统计量就是指样本指标。
(如:样本均数、样本率p 、样本标准差S 等)14、什么就是统计描述?用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征15、什么就是统计推断?根据样本资料的特性对总体的特性作估计或者推论的方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。
⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组成,随机抽取一部分群,调查抽中群的全部次级观察单位。
第三章实验设计★1、实验设计的特点(注意与调查研究的特点的区别):⑴研究者可人为设置处理因素;⑵受试对象接受何种处理因素或处理因素的何种水平是随机的。
★2、实验设计的三要素、四原则:⑴基本要素:①处理因素②受试对象③实验效应⑵基本原则:①对照原则②随机原则③重复原则④均衡原则4、实验设计的基本步骤:⑴明确实验目的;⑵确定研究对象;⑶确定可比的实验组和对照组;⑷确定把受试对象分配到各处理组中的原则;⑸确定样本含量;⑹确定方法和指标;⑺偏倚及其控制5、常用的实验设计方案:主要掌握完全随机设计和配对设计。
第四章定量资料的统计描述★1、频数表的编制:①求极差②确定组数和组距(一般8~15组)③确定组段(上限=下限+组距)④归组计数,整理成表★2、频数表的用途:⑴揭示资料的频数分布特征和频数分布类型①频数分布的特征:集中趋势和离散趋势;②频数分布的类型:对称分布和偏态分布(高峰位置偏向数值小的一侧——正/右偏态分布;高峰位置偏向数值大的一侧——负/左偏态分布)⑵便于发现某些特大或特小的可疑值⑶便于进一步计算指标和统计处理3、连续型的定量资料,其频数图中各长方形是相连的,又称直方图;离散型的定量资料,其频数图是非连续的,其频数图中各长方形是又间隔的,称直条图。
4、定量资料集中趋势的描述,常用平均数——表达一组同质定量数据的平均水平或集中位置。
(结合书本的例题加深理解)⑴算术均数:适用于对称分布特别是正态分布资料;⑵几何均数:适用于①对数正态分布②等比级数资料;观察值中不能有⑶中位数:是一种位置平均数,适用于偏态分布资料、一端或两端无确切值、总体分布不明的资料;百分位数:一组数据某一百分位置的水平;确定非正态分布资料的医学参考值范围。
平均数意义应用场合均数平均数量水平对称分布,尤其正态分布几何均数平均增减倍数等比、对数正态分布中位数位次居中的观察值水平偏态、分布不明确、分布末端无确定值5、离散趋势是频数分布的另一特征,反映了观察值之间的变异情况。
离散趋势指标意义应用极差反映一组数据的变异范围资料不限★6、正态分布的特征:⑴ 正态曲线在横轴上方均数处最高;并以均数为中心,左右对称;两端与横轴永不相交,呈钟形的曲线。
⑵ 正态分布有两个参数,即位置参数μ和形状参数σ;σ固定不变时,μ越大,曲线沿横轴越向右移动;μ固定不变时,σ越大,曲线越平阔。
⑶ 正态曲线下面积的分布有一定的规律:①正态曲线与横轴之间的面积恒等于1或100%;②对称分布,对称轴两侧的面积各为50%;③在(μ-σ,μ+σ)区间的面积为68.27%;在(μ-1.96σ,μ+1.96σ)区间的面积为95.00%;在(μ-2.58σ,μ+2.58σ)区间的面积为99.00%7、医学参考值范围:⑴正态分布法:适用于正态或近似正态分布的资料双侧界值:单侧界值:常用z 值表 ⑵ 百分位数法:偏态分布资料以及资料中一端或两端无确切数值参考值范围(%) 单侧 双侧 800.842 1.282 901.282 1.645 ★95★1.645 ★1.960 992.3262.576 /2x z S α±x z S α+x z S α-双侧界值:P2.5~P97.5单侧界值:上界为:P95下界为:P5第五章定性资料的统计描述1、常用相对数:⑴率是指某现象实际发生数与可能发生某现象总数之比,用以说明某现象发生的频率或强度。
常以百分率,千分率,万分率,十万分率等表示。
⑵构成比是事物内部某一观察单位数与事物内部各组成部分观察单位的总数之比,说明事物内部各部分所占的比重。
常以百分数表示。
⑶相对比是两个有关的指标之比,用以描述两者的对比水平。
两个指标可以是绝对数、相对数或平均数;可以性质相同,也可以性质不同。
★2、应用相对数注意的事项:⑴计算相对数分母不宜过小;⑵不能以构成比代替率。
率反映事物发生的频率,构成比表示事物内部各组分所占的比重,二者性质不同。
各个组成部分的构成比之和应为100%,事物内部各组成部分之间呈此消彼长的关系;⑶计算合计率时,不能简单地相加求平均;⑷率的比较时应注意可比性。
3、标准化法是在一个指定的标准构成条件下进行率的对比的方法。
意义:用统一的“标准”消除资料由于内部构成不同而对所比较的总率产生的影响。
标准化法的基本思想:确定一个标准的人口年龄构成,男、女人口都按该标准的人口年龄构成,计算年龄别发病情况,最后计算出男、女的合计发病率。
4、应用标准化法应注意的问题:⑴标准化率便于比较,但不能反映实际水平;⑵比较几个标准化率时,应在采用同一标准标化的情况下进行;⑶若各组间的率出现明显交叉时,不宜采用标准化法比较,可直接比较各组的率;⑷两样本标化率的比较应作假设检验。
第六章总体均数和总体率的估计1、抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。
不可避免、可以控制。
表现:样本统计量与总体参数之间的差异样本统计量之间的差异。
产生原因:个体变异+抽样。
2、标准误:样本统计量的标准差称为标准误;样本均数的标准差称为均数的标准误。
均数的标准误表示样本均数的变异度 : 总体标准差未知时,用样本标准差代替: ★3、标准差与标准误的区别:⑴标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小。
⑵标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假设检验。
4、t 分布的特征:⑴以0为中心,左右对称;⑵自由度ν 越小,t 值越分散,曲线越平阔,尾部越高;⑶当ν 趋于∞时, t 分布逼近标准正态分布;⑷t 分布曲线下面积为1.5、从界值表可看出:(1)自由度ν 相同时,t 界值越大其对应的P 值越小(2)概率P (或尾部面积)相等时,ν 越大,t 界值越小(3)t 值相等时,双侧概率为单侧概率的两倍(4) ν = ∞ 时,t 界值即为z 界值6、总体均数可信区间的计算:z 分布法:⑴当σ已知,服从标准正态分布 ,则可信区间为: ⑵σ未知但n 足够大(n >50): t 分布法:当σ未知n 较小: 7、常用单双侧u 值 n X σσ=n S S X =x z (0,1)N )22,x xx z αασ+()22,x x x z S x z S αα-+()2,2,,x x x t S x t S αναν-+α单侧双侧0.10 1.282 1.6450.05 1.645 1.9600.02 2.054 2.3260.01 2.326 2.5788、可信区间的涵义:从总体中作随机抽样,每个样本可以算得一个可信区间。
如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。
可信区间的两个要素:一是准确度: 反映在可信度的大小二是精密度: 反映在区间的长度第七章假设检验★1、假设检验的基本思想:应用反证法和小概率原理,先对总体的参数或分布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。
★2、假设检验的基本步骤:⑴建立检验假设,确定检验水准⑵选定检验方法和计算检验统计量⑶确定P值,作出推断结论★3、Ⅰ型错误与Ⅱ型错误:Ⅰ型错误:拒绝了实际上成立的,犯“弃真”的错误。
其概率大小用α表示,α可取单侧亦可取双侧。
Ⅱ型错误:不拒绝了实际上不成立的H0,犯“存伪”的错误。
其概率大小用β表示。
β只取单侧,其大小一般未知,只有在已知两总体差值δ,α及n时,才能估算出来。
实际情况检验结果拒绝H不拒绝H成立第一类错误(α)结论正确(1-α)推断结论与两类错误注:当样本含量固定时,α增大,β减小;反之亦然。
若欲同时减小α与β,则只有增加样本含量。
若重点减小Ⅰ型错误,α可取小一些,如α=0.01;若重点减小Ⅱ型错误,α可取大一些,如α=0.1或α=0.2★4、检验效能:若两总体确有差别,按照α水准能够发现这种差别的能力。
它的大小用(1-β)表示。
检验效能的影响因素:容许误差 δ、总体标准差 σ、Ⅰ型错误 α、样本含量n★5、假设检验应注意的事项:⑴ 应有严密的研究设计:总体中的每个研究个体应具有同质性、样本的获取必须遵循随机化原则、比较的组间应具有可比性。
⑵ 正确理解α水准和P 值的意义:α是人为预先设定的一个概率值,可有多个 ; P 是假定 成立,得到实际观测数据的可能性的大小 ,一个样本按某一方法只能得出一个。