卫生统计学考试重点总结复习

合集下载

卫生统计学综合复习汇总

卫生统计学综合复习汇总

统计学复习基本概念部分总体和样本观察单位随机样本和非随机样本的随机化变量、随机变量;变量的类型连续变量:有单位,理论上变量值可以充满区间。

分类变量:属性。

无序分类变量,虽可以用数值表示第几类,但数值无意义,只是代号。

有序分类变量,虽可以用数值量化,但数值的大小无意义,意义在于数值之间的间距和顺序关系。

计数变量:特点是离散、有序。

某些情况下可以按连续变量处理。

实际频数分布观察单位个数的分布。

连续变量要按变量值分组段,总结各组段观察单位的个数。

计数变量要按观察时间单位、面积单位总结计数变量值本身。

分类变量要按类别总结观察单位的个数。

实际上,后面两种变量在只有一次抽样时无法完成实际频数分布的刻画。

数据的集中趋势和离散趋势集中趋势连续变量对称分布:算术平均数(简称均数)+中位数。

连续变量非对称分布:中位数。

分类变量:具有所关心特征(类别)的观察单位的个数(频数)。

百分构成(比例)、率、比。

计数变量:单位时间、单位面积内所关心事件的发生数。

求和问题。

离散趋势:衡量距集中趋势远近的程度连续变量对称分布:离均差平方和、方差、标准差。

连续变量非对称分布:百分位数间距。

抽样变异和抽样分布抽样变异:反复抽样后,每个样本都是不同的。

反复抽样指每次抽样的样本量相同。

抽样分布:反复抽样后,样本集中趋势的分布。

对于连续变量样本标准差当然也是有分布的,但本处不考虑。

连续变量:样本均数的分布—按样本均数值分组段,总结各组段样本的个数。

分类变量:具有所关心特征(类别)的观察单位的个数(频数)的分布—按观察单位的个数总结样本的个数。

计数变量:单位时间、单位面积内所关心事件的发生数的分布—按发生数总结样本的个数。

抽样分布的集中趋势和离散趋势连续变量:反复抽样样本均数的均数—集中趋势;反复抽样样本均数的标准差(标准误)—离散趋势。

分类变量:反复抽样样本具有所关心特征(类别)的观察单位的个数(频数)的均数—集中趋势;具有所关心特征(类别)的观察单位的个数(频数)的标准差(标准误)--离散趋势。

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。

总体:根据研究目的确定的同质(大同小异)的观察单位的全体。

分为目标总体和研究总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

抽样:从研究总体中抽取少量有代表性的个体。

变量:表现出个体变异性的任何特征或属性。

分定型变量和定量变量。

定型变量:1)分类变量或名义变量:最简单的是二分类变量。

0-1变量也常称为假变量或哑变量。

2)有序变量或等级变量。

定量变量:分离散型变量和连续型变量。

变量只能由高级向低级转化:定量→有序→分类→二值。

常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。

2)计数资料或分类资料,如性别、血型等。

3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。

累计频数为该组及前面各组的频数之和。

累计频率表示各组累计频数在总例数中所占的比例。

可用直条图表达。

2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。

2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。

3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。

4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用X表示。

适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。

分:直接法和频率表法。

即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。

卫生统计学第八版重点

卫生统计学第八版重点

卫生统计学第八版重点1、统计工作的基本步骤:统计工作全过程可分为:统计设计、搜集资料、整理资料和分析资料四个步骤。

2、卫生统计资料一般分为计量资料与计数资料两大类,介于其中的还有等级资料,不同类型的资料应采用不同的分析方法。

因此,搞清楚下面的定义对以后学习具体的统计方法很重要。

①计量资料:对每个观察单位的各样项指标用定量的方法,通过测量得到的数值,我们把这样的资料称为计量资料,一般有度量衡等单位。

如调查某地10岁女童的身体发育状况,以人为观察单位,每个人的身高(cm)、体重(kg)和血压(mmHg)等;又如以每个采样点为观察单位,测得不同采样点的二氧化碳浓度(mg/L)。

②计数资料:先将观察单位按某种属性或类别分组,然后清点所得各组的观察单位数,称为计数资料。

例如对某小学全体学生进行蛔虫卵粪检,每个学生是一个观察单位,将每个学生按粪检结果阳性与阴性分组,得每组人数;又如调查某人群的血型分布,按A、B、AB、O四型分组,得各血型组的人数。

③等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。

例如用某药治疗若干痢疾病人,其中治愈、显效、有效、无效人数。

这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半计量资料。

对分辨计量资料和计数资料,原则上并不困难。

通常凡是用仪器测得的数据都是计量资料,如身高、体重、肺活量、红细胞数、白细胞数、等属计量资料。

通常按性质、类别分组后清点得到的数目,如男性人数、女性人数,阳性人数,阴性人数,对动物实验的各种结果的例数等都是计数资料。

按等级分组资料不难确认,凡是按程度不同分多个组后清点数目,一般都属等级资料了。

3、卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学。

4、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之。

卫生统计学6版重点总结

卫生统计学6版重点总结

第一章绪论一,名词解释参数:根据总体分布的特征而计算的总体统计指标。

总体:研究目的确定的同质观察单位的全体。

同质:总体中个体具有相同的性质。

变异:同质基础上的个体差异。

样本:从总体中随机抽取的有代表性的一部分观察单位,其实测值的集合。

统计量:由总体中随机抽取样本而计算的相应样本指标。

概率:描述随机事件发生的可能性大小的数值。

(概率的统计定义:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n 逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。

)抽样误差:由个体变异的存在和抽样引起样本统计量与相应的总体参数间以及各样本统计量之间的差别。

二,问答题。

统计学的基本步骤有哪些?答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。

总体与样本的区别与关系?答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。

抽样误差产生的原因有哪些?可以避免抽样误差吗?答:一,个体差异引起;二,抽样方法引起。

抽样误差不能避免,但可以随着样本含量的增大而减小。

何为概率及小概率事件?答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A 在该条件下发生的概率。

小概率事件是指习惯上将P<=0.05或P<=0.01称为小概率事件,表示某事件发生的可能性很小。

第二章定量资料的统计描述一、名词解释频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。

方差:用来度量随机变量和数学期望(即均值)之间的偏离程度。

标准差:也称均方差,是各数据偏离平均数的距离的平均数。

中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。

几何均数:变量对数值的算数均数的反对数。

四分位数间距:百分位数P75和百分位数P25之差。

卫生统计学重点总结

卫生统计学重点总结

第一章绪论1.卫生统计学的概念P1卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生情况以及卫生服务领域中数据的收集、整理和分析的一门科学。

2.卫生(医学)统计学的主要步骤P3设计;收集资料;整理资料;分析资料3.(选择、判断)卫生统计学的基本概念P4同质(homogeneity):统计学中,若某些观察对象具有相同的特征或属性,称之为同质或具有同质性。

变异(variation):将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异。

总体(population):是根据研究目的确定的的所有观察单位某种特征或属性的观察值或测量值的集合。

样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。

样本中包含的观察单位个数称为样本含量。

参数(parameter):反映总体特征的指标称为参数,一般是未知的,常用希腊字母表示。

统计量(statistic):根据样本观察值计算出来的指标称为统计量,常用拉丁字母表示。

变量(variable):每个观察单位的某项特征或属性称为变量。

抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究。

抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差。

资料(data):变量值的集合称之为资料。

★4.资料的分类P4(1)定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。

(2)定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。

可进一步细分为两种资料:1)计数资料:指将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。

包括:①二项分类资料;②无序多项分类资料2)等级资料:亦称有序多分类资料,是将观察单位按某特征或属性的程度或等级顺序分组,清点各组观察单位数所得的资料。

职称考试卫生统计学重点

职称考试卫生统计学重点

卫生统计学要点笔记第一章统计学的基本内容第一节医学统计学的含义1、医学统计学定义医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析的普遍原理和方法。

2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学规律。

3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。

第二节、统计学的几个重要概念一.资料的类型1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。

一般有度量衡单位,每个对象之间有量的区别。

2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。

每个对象之间没有量的差异,只有质的不同。

3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间又有程度的差别。

注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。

二、总体根据研究目的所确定的同质的所有观察对象某项变量值的集合1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。

2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的三、样本从总体中随机抽取部分观察对象,其某项变量值的集合。

从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。

四、随机事件可以发生也可以不发生,可以这样发生也可以那样发生的事件。

亦称偶然事件。

五、概率描述随机事件发生可能性大小的数值,记作P,其取值范围0≤P≤1,一般用小数表示。

P=0,事件不可能发生必然事件(随机事件的特例);P=1,事件必然发生;P→0,事件发生的可能性愈小;P→1,事件发生的可能性愈大六、小概率事件习惯上将P≤0.05或P≤0.01 的随机事件称小概率事件。

表示某事件发生的可能性很小。

七、参数和统计量参数:总体指标,如总体均数、总体率,一般用希腊字母表示统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示八、学习医学统计学的方法1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法;2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。

卫生统计学的重点归纳

卫生统计学的重点归纳

卫生统计学的重点归纳卫生统计学的重点归纳一、卫生统计学的定义卫生统计学是以统计理论和方法为基础,应用数学、物理、化学、计算机等学科技术,研究卫生和医疗问题的数据分析方法。

它以收集,处理,分析和解释卫生和医疗等领域的统计数据为基础,以定量分析和定性分析卫生数据,研究卫生和应用流行病学方法,识别患病危险因素,以及制定卫生与医疗保健的政策与措施,为医学和公共卫生提供科学依据的一门学科。

二、卫生统计学的基本原理(1)基本理论卫生统计学的基本理论包括:(1)数理统计学:数理统计学是以统计学的数据处理方法为工具,探讨多变量间相互关系的学科;(2)社会科学统计学:社会科学统计学是以统计学的方法为工具,研究社会判断和实证研究的学科;(3)中国统计学:中国统计学是以中国传统的统计学理论和方法为基础,研究社会发展进程中社会变迁的学科;(4)应用统计学:应用统计学是以统计学的方法来解决实际问题,如实验设计与分析、生态学分析、经济学分析等。

(2)基本方法卫生统计学的基本方法包括:(1)分类法:分类法是按照实际问题的性质,将被研究对象进行科学的定性分类;(2)测度法:测度法是按照实际问题的性质,将被研究对象进行科学的定量测度;(3)统计方法:统计方法是利用统计技术处理数据,以处理、描述、分析和预测实证问题;(4)流行病学方法:流行病学方法是指在全面调查的基础上,利用统计技术,研究病因、流行病学及其预防控制等方面的方法。

三、卫生统计学的应用1、卫生统计学用于事件分析。

事件分析包括:病原体检测、医疗并发症监测、病因研究、新药研发、疾病控制等研究;2、卫生统计学用于政策分析,为卫生政策、医疗政策、公共卫生政策的制订、实施和评价,提供科学依据;3、卫生统计学用于质量控制。

对质量控制体系中的质量指标进行定量分析、定性分析和评价;4、卫生统计学用于教育考试。

有助于改进教育评价,提高客观能力,开发判断及决策技能;5、卫生统计学用于职业卫生领域,可以指导职业卫生政策的制定和促进各种职业病的预防。

卫生统计学-重点整理资料

卫生统计学-重点整理资料

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。

2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。

⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。

⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。

⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。

样本中包含的观察单位个数成为样本含量。

⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。

⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。

⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。

可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。

⑵系统抽样:又称机械抽样或等距抽样。

事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。

卫生统计学期末复习重点

卫生统计学期末复习重点

卫生统计学期末复习重点《卫生统计学》期末复习提要一、期末考试有关问题的说明<一>出题的指导思想、原则及题目类型出题的指导思想是:全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。

出题的原则是:不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占80─90%,稍难或灵活的题目占10─20%。

凡自学的章节不考。

<二>答题要求选择题:要求选择无误,每题只选一个最佳答案。

计算分析题:要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。

二、期末复习范围和重点绪言<一>重点复习的名词:计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。

计数资料亦称定性资料或分类资料。

总体(population):表示大同小异的对象(某个测量值)全体。

样本(sample):从研究总体中随机抽取的一部分有代表性的个体变异(variation):同一总体内的个体间存在差异。

抽样误差:消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。

概率: 某事件出现机会大小的量。

<二>重点复习的问题:1、根据计量、计数、等级资料的概念正确识别统计资料的类型。

等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data),等级资料又称有序变量。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

2、统计工作的步骤及搜集资料的来源和要求。

(完整版)医学统计学重点总结

(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。

总体是研究目的确定的所有同质观察单位的全体。

样品是从研究总体中抽取部分有代表性的观察单位。

2.简述参数和统计量的定义,并且举例说明。

描述总体特征的指标称为参数,描述样本特征的指标称为统计量。

3.变量的类型有哪几种?举例说明各种类型变量有什么特点。

①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。

②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。

③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。

4.请举例说明一种类型的变量如何变换为另一种类型的变量。

定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。

≤6.举例说明什么是配对设计。

配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。

①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。

7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。

8.简述P 25 P 50 P 75的统计学意义。

(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。

9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。

10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。

卫生统计学重点

卫生统计学重点

卫生统计学1.医学统计学:是运用概率论与数理统计的原理及方法,研究居民健康状况以及卫生服务领域中数字资料的搜集、整理分析与推断的一门学科。

2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。

3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

4.样本的特征:(1)代表性(2)随机性(3)可靠性(4)可比性(comparable)5.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。

6.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。

7.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。

8.减少抽样误差的方法:9.(1)改进抽样方法,增加样本的代表性。

(2)增加样本量n 。

(3)选择变异程度较小的研究指标。

10.统计工作的步骤:设计、收集资料、整理资料、分析资料。

11.发病率:表示一定时期内,在可能发生某病的一定人群中,新发生的某病的频率(强度)。

12. 患病率:又称为现患率,指某时点检查时可能发生某病的一定人群中现患某种疾病的频率。

患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。

13.治愈率(cure rate):表示受治病人中治愈的频率。

14.生存率(survival rate):指病人能活到某一时点的概率。

15.标准化率:标准化法就是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。

16.二项分布的图形特征(1)0.5时,图形是对称的,如图5-1。

(2)0.5愈远,对称性愈差,但随着n的增大,分布趋于对称。

当n太靠近0或1,当nP和n(1-P)都大于5时,二项分布近似于正态分布。

医学统计学重点重点知识总结

医学统计学重点重点知识总结

医学统计学重点一.选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为µ1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与ɑ的关系,ɑ是人为规定的,它们之间没有关系; P值↑,ɑ↑(×)4.方差分析自由度v的计算,v总=n-1;v组间=组数(k)-1;v组间=v总-v组间5.理论秩和(n(n+1)/2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(×);有95%的总体参数在该区间内(×);该区间包含95%的总体参数(x);该区间有95%的可能包含总体参数。

(x);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(×);回归系数↑,相关系数↑(×);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。

这个范围称作可信度为1-α的可信区间,又称置信区间。

3.P值:拒绝H0时所冒的风险(或“作出拒绝H0 而接受H1 ”结论时冒了P风险)4.ɑ(第一类错误):H0真实时被拒绝(或H0真实时,拒绝H0,接受H1)5.β(第二类错误):H0不真实时不拒绝(或H0不真实时,不拒绝H0)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异; 引进回归方程后, Y方面的变异。

三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。

分辨一个样本是否属于某特定总体等。

区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。

(完整word版)医学统计学考试重点(人卫第七版)

(完整word版)医学统计学考试重点(人卫第七版)

1、同质:是指观察单位或观察指标受共同因素制约的部分2、观察单位:亦称个体,是统计研究中最基本的单位3、变异:在同质的基础上个体间的差距4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体无限总体:理论上其观察单位数是无法穷尽的6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合7、抽样:从总体中抽取部分个体的过程称为抽样8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被抽取到9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的10、参数:描述总体特征的量11、统计量:根据样本个体值计算得到的描述样本特征的量12、总体参数是常数,而样本统计量可随样本不同而不同13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差16、过失误差:指各种失误所导致的误差17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件18、概率:反映某一随机事件发生可能性大小的量,用符号P表示19、小概率事件:统计学上一般把P≤0。

05的事件称为小概率事件,表示某事件发生的可能性很小20、变量:观察单位的某个特征21、变量值:变量的观察结果或测定值22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料24、分类变量又称定性变量,其变量值是用定性方法测得的25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)25、医学统计工作的基本步骤:一、设计;二、收集资料;三、整理资料;四、分析资料26、统计表和统计图是描述统计资料的重要工具27、统计表的结构:①标题位于统计表的上中方②标目用来说明表内各纵横数字的含义,注意标明指标的单位。

医学统计学考试重点整理知识讲解

医学统计学考试重点整理知识讲解

医学统计学考试重点整理一、基本概念1.总体与样本总体:所有同质观察单位某种观察值(即变量值)的全体样本:是总体中抽取部分观察单位的观察值的集合2.普查与抽样调查普查:就是全面调查,即调查目标总体中全部观察对象抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查3.参数与统计量参数:总体的某些数值特征统计量:根据样本算得的某些数值特征4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0H0正确Ⅰ型错误(ɑ) 推断正确(1−ɑ)H0不正确推断正确(1−β) Ⅱ型错误(β)Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误Ⅱ型错误(β错误): H0为假时却被接受,取伪错误5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。

(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。

安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。

(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。

安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)6.误差与标准误(区分率与均数)㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。

标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π(1-π)/n7.方差分析方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、绪论1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。

2.样本:从总体中随机抽取部分观察单位所组成的集合。

3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。

4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。

5.变量的类型及其转换:①定性变量:a.分类变量(计数资料)i.二分类变量ii.多项无序分类b.有序变量(等级资料)②定量变量:a.连续型变量b.离散型变量变量只能由“高级”向“低级”转化:定量→有序→分类→二值。

6.概率:是描述随机事件发生的可能性大些的数值。

7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。

9.卫生统计学的研究对象:有变异的事物。

10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。

11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。

12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。

13.误差可分为:系统误差、随机测量误差、抽样误差。

14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。

二、定量资料的统计描述1.频率分布表的编制步骤:①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。

2.频率分布表的用途:①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。

②便于进一步计算统计指标和进行统计分布处理。

③便于发现某些特大和特小的可疑值。

④当样本含量比较大时,可用各组段的频率作为概率的估计值。

3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。

4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。

5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。

6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。

三、定性资料的统计描述1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。

=某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:①频率型指标:近似的反映某一事件出现的机会大小,如发病率、死亡率。

=某事件发生的个体数/可能发生某事件的个体数×K②强度型指标:反映单位时间段内某现象发生的频率,多用于大人群长时间随访的资料,如人时发病率、人时感染率。

=某事件发生的个体数/∑(可能发生某事件的个体数×时间)×K③相对比型指标:是AB两个有联系的指标之比,对比的两个指标可以性质相同,也可以不同。

=A指标/B指标(常见男女性别比)3.应用相对数时的注意事项:①防制概念混淆。

②计算相对数时,分母应有足够的数量。

③正确的合并估计频率型指标。

④相对数的对比应注意可比性。

⑤对样本相对数的统计推断,应进行参数估计和假设检验。

⑥注意率和构成比之间的差别。

4.标准化法的基本思想:标准化法是指当比较两个或多个总率时,若比较的两组或多组内部构成明显不同,需按统一指标进行调整,使之具有可比性的方法。

基本思想:采用统一标准构成以消除某因素的内部构成不同对总率的影响,使通过标准化后的标准化率具有可比性。

四、统计表和统计图1.统计表的种类:简单表、复合表。

2.统计图的分类:①条图:用等宽直条的长度来表示参与比较的指标的大小,分为单式和复式两种。

表示指标数值的坐标尺度必须从0点开始。

②百分条图:用于表示事物中各部分的比重或构成。

③圆图:同上。

④线图:用线段的升降来表示统计指标的变化趋势,或某现象随另一现象的变迁情况,适用于连续型变量资料。

纵横的尺度可以不从0开始,一般纵横比例5:7。

⑤对半数线图:用于表示事物的发展速度(相对比)。

⑥散点图:用点的密集程度、趋势表示两变量间的相对关系,⑦直方图:常用于表示连续型变量资料的频数或频率分布。

纵轴的刻度必须从0点开始。

⑧统计地图:主要用于表示某种现象在地域空间上的分布,根据不同地方某种现象的数值大小,采用不同密度的线条或不同颜色绘在地图上,有助于分析该现象的地理分布特征,为进一步研究提供线索。

⑨箱式图:用于描述连续型变量资料的分布特征,它表现连续型变量资料的5个百分位数,即P2.5、P25、P50、P75、P97.5。

3.统计表的构成:标题、标目、线条、数字和备注。

五、常用的概率分布:1.二项分布的图形特征:①高峰在μ=nπ处或附近。

②π为0.5时,图形是对称的。

π离0.5愈远,对称性愈差。

③对同一π,随着n的增大,分布趋于对称。

当n→∞时,只要π不太靠近0或者1,二项分布趋于对称。

2.Poisson分布的特性:①Poisson分布的总体均数与总体方差相等,均为λ。

②Poisson分布的观察结果有可加性。

3.正态分布的图形特点:①关于x=μ对称。

②在x=μ处取得该概率密度函数的最大值,在x=μ±σ处有拐点。

③曲线下面积为1。

④μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ越小,曲线沿横轴向左移。

⑤σ决定曲线的形状,当μ均衡定时,σ越大,数据越分散,曲线越“矮胖”;σ越小,数据越集中,曲线越“瘦高”。

4.正态分布的应用:①概率估计②确定医学参考值范围③实验误差的质量控制④统计处理方法的理论基础5.95%医学参考值范围:指特定的“正常”人群的解剖、生理、生化指标及组织代谢产物含量等数据中95%个体的取值所在的范围。

6.二项分布的应用:概率估计、累积概率计算。

7.Poisson的应用:概率估计、累积概率计算。

8.二项分布、Poisson分布、正态分布的区别与联系:二项分布、Poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。

Poisson分布可以视为n很大而π很小的二项分布。

当n很大而π和1-π都不是很小的时候二项分布渐近正态分布,但λ≥20的时候Poisson分布渐近正态分布。

六、参数估计基础1.抽样误差:由于生物固有的个体变异的存在,从某一总体中随机抽取一个样本,所得样本统计量与相应的总体参数往往是不同的,这种差异称为抽样误差。

2.标准误:用于表示均数抽样误差的指标叫样本均数的标准差,也称样本均数的标准误。

3.参数估计:统计学中通过抽样来估计总体参数,称为参数估计。

4.样本均数的标准误与原变量的标准差的区别:样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。

样本均数的标准误与原变量的标准差的区别在于:前者是表示均数变异的指标,后者是表示观察值变异的指标。

两者的联系是,当样本量n一定时,标准误随标准差的大小而变化。

5.t分布是总体均数的区间估计和假设检验的基础。

6.t分布图形的特征:①单峰分布,以0为中心,左右对称。

②ν越小,t值越分散,曲线的峰部越矮,尾部越高。

③随着ν逐渐增大,t分布逐渐接近标准正态分布。

④t分布不是一条曲线,而是一簇曲线,当n确定时,t分布为一条曲线。

7.置信区间:按预先给定的概率1-α,估计总体参数的可能范围,该范围就称为总体参数的1-α置信区间。

8.区间估计:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。

9.CI的两个要素:①准确度:反映置信度1-α的大小,即区间包含总体均数的概率大小。

②精度:反映区间的长度,在置信区间确定的情况下,提高样本例数可以提高精度。

七、假设检验基础1.假设检验:由样本信息对相应总体进行推断时,对所估计的总体首先提出假设,然后通过样本数据去推断是否拒绝这一假设,称为假设检验,即检验样本指标与总体指标或样本指标与样本指标之间有无差别。

2.假设检验的原理:①反证法思想:首先提出假设,用适当的统计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立,拒绝它,如果可能性大,还不能认为它不成立。

②小概率原理:是指小概率事件在一次随机试验中基本不会发生。

3.假设检验的步骤:①建立检验假设,确定检验水准②选择检验方法,计算统计量③确定P值④做出推断4.假设检验应注意的问题:①要有严密的研究设计。

②应用检验方法必须符合其适用条件。

③适当选择检验水准α。

④正确理解P值的意义。

⑤做结论不能绝对化。

⑥统计结论与专业结论相结合。

5.Ⅰ类错误:如果实际情况与H。

一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝了原本正确的H。

,导致推断结论错误,这样的错误称为Ⅰ类错误。

6.Ⅱ类错误:如果实际情况与H。

不一致,仅仅由于抽样的原因,使得统计量的观察值落到接受域,接受了原本错误的H。

,导致推断结论错误,这类错误称为Ⅱ类错误。

7.t检验的应用条件:①来自正态分布总体。

②两独立样本。

③均数比较时要求两总体方差相等。

④定量资料。

8.配对设计的种类:异体配对、自身配对。

9.小概率事件:在一次观察或实验中某事件发生的可能性很小,可以看作很可能不发生,通常取P≤0.05。

10.P值:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。

11.假设检验功效:1-β称为假设检验的功效,其意义是,当所研究的总体与H。

确有差别时,按检验水平α能够发现它(拒绝H。

)的概率。

12.检验水准的确定:需要根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。

八、方差分析1.方差分析的基本思想:根据资料的设计类型及研究目的,即按变异的不同来源将全部观察值间的总变异分为两部分或多个部分,其自由度也分解为相应的部分,除随机误差外,其余每个部分的变异也可由某个因素的作用加以解释,通过比较可能由某因素所致变异的均方与随机误差的均方,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。

2.方差分析的应用条件:①各样本是相互独立的随机样本。

②各样本来自正态总体。

③个处理组总体方差相等。

3.方差分析是用于研究定量变量数据的统计方法。

九、卡方检验1.卡方检验的主要应用:常用于分类变量资料的统计推断。

推断两个或对个样本率及构成比之间有无差别,检验分类变量配对设计下的卡方检验,以及频数分布的拟合优度。

2.卡方检验的注意事项:拟合优度:a.一般要求分组时每组中的理论频数不小于5;b.需要有足够的样本含量,不够时须经连续性校正。

相关文档
最新文档