《卫生统计学》考试重点复习资料

合集下载

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。

总体:根据研究目的确定的同质(大同小异)的观察单位的全体。

分为目标总体和研究总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

抽样:从研究总体中抽取少量有代表性的个体。

变量:表现出个体变异性的任何特征或属性。

分定型变量和定量变量。

定型变量:1)分类变量或名义变量:最简单的是二分类变量。

0-1变量也常称为假变量或哑变量。

2)有序变量或等级变量。

定量变量:分离散型变量和连续型变量。

变量只能由高级向低级转化:定量→有序→分类→二值。

常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。

2)计数资料或分类资料,如性别、血型等。

3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。

累计频数为该组及前面各组的频数之和。

累计频率表示各组累计频数在总例数中所占的比例。

可用直条图表达。

2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。

2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。

3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。

4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用X表示。

适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。

分:直接法和频率表法。

即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。

卫生统计学复习资料

卫生统计学复习资料

科研方法第三章实验设计的基本要素:实验设计的基本要素包括处理因素、受试对象和实验效应三个组成部分。

实验设计的四原则:对照原则均衡原则随机原则重复原则随机原则:使实验组和对照组非处理因素趋于一致或均衡的主要手段是随机化。

随机化的方法有多种,最常使用的是利用随机数字表和随机排列表(或称随机化分组表)。

拉丁方设计:用r个拉丁字母排成r行r列的方阵,使每行及每列中每个字母都只出现一次,这样的方阵称为r阶拉丁方,或r×r拉丁方正交设计正交设计:正交设计是一种高效、快速的多因素试验方法。

它是利用一套规格化的正交表,使每次试验的因素及水平得到合理安排,通过试验结果的分析,获得有用的信息。

除了分析主因素外,还可分析交互作用。

非条件logistic回归的公式,目的,用途统计学第一章统计学家用总体这个术语来表示大同小异的对象全体。

我们试图就某个总体下结论,这个总体便称为目标总体。

资料常来源于目标总体中的一个部分,它称为研究总体。

科学的办法是从研究总体中抽取少量有代表性的个体,称为抽样。

一些个体处于同一总体,就是指他们大同小异,具有同质性。

同一总体内的个体间存在差异又是绝对的,这种现象称为变异。

本书把变量分成定性与定量两种类型。

定性变量中最常见的是分类变量或名义变量。

最简单也最常用的分类变量是二分类变量。

另一类定性变量是有序变量或等级变量。

定量变量可以分为两种类型,离散型变量和连续型变量。

离散型变量只能取整数值。

连续型变量可以取实数轴上的任何数值。

变量只能由“高级”向“低级”转化:定量→有序→分类→二值;不能作相反方向的转化。

在定量变量中,离散型变量常常通过适当的变换或连续性校正后借用连续型变量的方法来分析。

理论上,正态分布有两个参数:总体均数和总体方差。

这种由观察资料计算出来的量称为统计量。

第二章对连续型定量变量,频率分布表的编制步骤如下:(1)计算极差(R),也称为全距,即数据最大值与最小值之差。

(2)确定组段数与组距,变量值个数较多时,组段数一般取10左右。

《卫生统计学》课程复习资料

《卫生统计学》课程复习资料

《卫生统计学》课程复习资料一、名词解释:1.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

2.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。

计数资料亦称定性资料或分类资料。

其观察值是定性的,表现为互不相容的类别或属性。

3.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。

等级资料又称有序变量。

4.总体:总体指特定研究对象中所有观察单位的测量值。

5.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

6.变异:同质个体间研究因素的差异。

7.频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。

8.算术均数:描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用X表示。

9.中位数:将一组观察值由小到大排列,位次居中的那个数。

10.极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

11.方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

12.标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

13.变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14.正态分布:若资料X的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。

通常用记号),(2σμN表示均数为μ,标准差为σ的正态分布。

15.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2(0,1)N。

16.统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。

17.抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。

卫生统计学客观题复习资料4

卫生统计学客观题复习资料4



A.n≥50

B.P 不接近与 0

C.np 或 n(1-p)大于 5

D.np 与 n(1-p)均大于 5
标准答案:D
16、欲描述鼻咽癌患者的血型分布,宜绘制

A.直条图

B.圆图

C.线图

D.直方图
标准答案:B 17、以学生为观察单位,检查学生大便中蛔虫卵的有无属于

A.定量资料

B.二项分类资料

A.35%-60%

B.37%-63%

C.30%-70%

D.40%-60%
标准答案:D
第二大题:多项选择题(总分:40 分)
1、下列属于相对比的指标是:( )

A.相对危险度 RR

B.比值比 OR

C.病死率

D.变异系数

E.性比例
标准答案:A, B, D, E
2、对于服从双变量正态分布的资料,如果直线相关分析算出的 r 值越大,则经回归分析得的相应的 b 值,下列说法不正确的是( )
A.两变量呈正相关关系

B.两变量呈负相关关系

C.两变量不存在相关关系

D.两变量间相关关系密切程度不高
标准答案:A 11、下列分布中,均数等于方差的是:( )

A.X2

B.u 分布

C.二项分布

D.Poisson 分布
标准答案:D 12、在同一正态总体中随机抽样,总体均数有 90%的可能在:( )

A.分布为单峰分布

卫生统计学知识点(笔记)

卫生统计学知识点(笔记)

第一章绪论1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。

可分为目标总体和研究总体。

若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。

需要谨慎的是,就研究总体所下的结论未必适用于目标总体。

3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。

获取样本的过程称为抽样(sampling)。

抽样研究的目的是用样本数据推断总体的特征。

需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。

4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。

5.▲变异(variation)是指同质的个体之间存在的差异。

6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总体均数μ,总体标准差σ。

8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。

统计学的任务就是依据样本统计量来推断总体参数。

9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。

当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。

卫生统计学-重点整理资料东大

卫生统计学-重点整理资料东大

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。

2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。

⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。

⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。

⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。

样本中包含的观察单位个数成为样本含量。

⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。

⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。

⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。

可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。

⑵系统抽样:又称机械抽样或等距抽样。

事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。

卫生统计学重点

卫生统计学重点

卫生统计学1.医学统计学:是运用概率论与数理统计的原理及方法,研究居民健康状况以及卫生服务领域中数字资料的搜集、整理分析与推断的一门学科。

2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。

3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

4.样本的特征:(1)代表性(2)随机性(3)可靠性(4)可比性(comparable)5.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。

6.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。

7.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。

8.减少抽样误差的方法:9.(1)改进抽样方法,增加样本的代表性。

(2)增加样本量n 。

(3)选择变异程度较小的研究指标。

10.统计工作的步骤:设计、收集资料、整理资料、分析资料。

11.发病率:表示一定时期内,在可能发生某病的一定人群中,新发生的某病的频率(强度)。

12. 患病率:又称为现患率,指某时点检查时可能发生某病的一定人群中现患某种疾病的频率。

患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。

13.治愈率(cure rate):表示受治病人中治愈的频率。

14.生存率(survival rate):指病人能活到某一时点的概率。

15.标准化率:标准化法就是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。

16.二项分布的图形特征(1)0.5时,图形是对称的,如图5-1。

(2)0.5愈远,对称性愈差,但随着n的增大,分布趋于对称。

当n太靠近0或1,当nP和n(1-P)都大于5时,二项分布近似于正态分布。

卫生统计学_自考_练习题

卫生统计学_自考_练习题

复习资料一《卫生统计学》第一大题:单项选择题(总分:60分)1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()A.样本B.有限总体C.无限总体D.个体2、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )A.会变小B.会变大C.不变D.会出现负值3、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )A.概率B.构成比C.发病率D.相对比4、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:A.越大B.越小C.比r 小D.可能较大也可能较小5、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()A.-3.5,3.5B.-3.5,-3.5C.3.5,3.5D.-3,46、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。

本题中资料类型与设计类型分别为:A.定量资料成组设计B.定量资料配对设计C.分类资料成组设计D.分类资料配对设计7、在某农村地区随机抽取100名儿童,进行蛔虫感染情况粪检,结果50名儿童蛔虫卵粪检为阳性,则该地儿童蛔虫卵粪检总体阳性率的95%的置信区间为:()A.35%-60%B.37%-63%C.30%-70%D.40%-60%8、某研究欲了解男性高血压患者与女性高血压患者血脂是否有差异,从某市6家医院随机调查了400人,测量血脂水平,经t 检验,得P<0.05,有统计学差异,由此推断该地男、女高血压患者血脂总体均数有差别,这里所谓有统计学差异是指:( )A.两样本均数差别有统计学差异B.两总体均数差别有统计学差异C.两样本均数和两总体均数的差别有统计学差异D.其是有一个样本均数和总体均数有统计学差异9、假设某地35岁以上正常成年男性收缩压的总体均数为120.2mmHg,标准差为11.2mmHg,后者反映的是:()A.个体变异的大小B.抽样误差的大小C.系统误差的大小D.总体的平均水平10、Wilcoxon两样本比较的秩和检验在编秩时,若遇到两组中有相同数值,应:()A.不计秩次B.依次序编秩C.取其平均秩次D.以平均秩次的整数为秩11、下列关于样本含量的叙述,正确的是: ( )A.样本含量越大越好B.以实际可以收集到的样本例数为准C.时间、财力、人力等条件允许下的最大样本例数D.一定的推断精度和检验效能下的最少样本例数12、两样本均数比较,经t 检验,差别有显著性时,P 越小,说明:()A.两个样本均数差别越大B.两总体均数差别越大C.越有理由认为两总体均数不同D.越有理由认为两样本均数不同13、成组设计的方差分析中,有( )A.MS组间=MS组内B.SS组内=SS组间C.MS总=MS组间+MS组内D.SS总=SS组间+SS组内14、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数=1,则有: ( )A.SS总=SS残B.SS残=SS回C.SS总=SS回D.SS总>SS回15、正态分布曲线下,横轴上,从均数到+1.96S S的面积为:()A.95%B.45%C.97.5%D.47.5%16、下列关于新生儿特征的变量中,属于定量资料的一组数据为A.头围、性别、身高B.头围、性别、胎次C.头围、性别、体重D.头围、身高、体重17、某地区9岁男童肺活量的分布类型通常是A.正态分布B.对数正态分布C.正偏态分布D.负偏态分布18、两组定量资料的比较,若已知n1、n2 均小于30,总体方差齐且呈正分布,宜采用A.t检验B.tt检验t’C.Z检验D.秩和检验19、对于3×4行列表的X2检验,其自由度计算公式为A.3-1B.4-1C.3×4-1D.(3-1)(4-1)20、某研究者欲比较两种血红蛋白检测方法是否相同,从健康人中招募了24名志愿者,每名志愿者采集10ml血样分装在2个试管中,分别用两种方法进行检测,对检测结果用配对检验进行统计分析,则其自由度为A.11B.12C.22D.2321、关于假设检验,下面说法正确的是A.检验水准只能取0.05B.假设检验是统计推断的内容之一C.假设检验的结论不会犯错误D.假设检验就是t检验22、同一两独立样本均数比较的资料,进行方差分析的结果与t 检验的结果A.完全等价,且t=FB.完全等价,且=FC.完全等价,且=FD.不同,方差分析的结果更可靠23、随机事件发生概率P的变化范围为A.P>0B.P>1C.0≤P≤1D.0≤P<124、反映一组两端有不确切值资料的离散水平,最适宜的指标是A.RB.Qu-QLC.SD.25、下列关于配伍组设计方差分析变异分解的式子正确的是A.SS总=SS配伍+SS误差B.SS总=SS处理+SS误差C.SS总=SS配伍+SS处理+SS误差D.MS总=MS配伍+MS处理+MS误差26、对直线回归方程=0.635x ,下列说法正确的是A.所有实测点都在回归直线上B.所绘回归直线不过点()C.回归直线经过原点D.x的取值范围为27、若3个样本率比较,得到0.05,2,P<0.05,按照0.05检验水准,下列说法正确的是A.可以认为3个总体率都不相同B.可以认为3个总体率不全相同C.可以认为3个总体率相同D.可以认为3个样本率相同28、描述2000~2010年成都市女性居民子宫颈癌发病率的时间变化趋势,宜绘制A.条图B.普通线图C.直方图D.散点图29、已知某药物治疗糖尿病有效率为60%,根据纳入标准和排除标准选取200例糖尿病患者,采用新药A进行治疗,结果140例患者有效。

卫生统计学复习资料

卫生统计学复习资料

科研方法第三章实验设计的基本要素:实验设计的基本要素包括处理因素、受试对象和实验效应三个组成部分。

实验设计的四原则:对照原则均衡原则随机原则重复原则随机原则:使实验组和对照组非处理因素趋于一致或均衡的主要手段是随机化。

随机化的方法有多种,最常使用的是利用随机数字表和随机排列表(或称随机化分组表)。

拉丁方设计:用r个拉丁字母排成r行r列的方阵,使每行及每列中每个字母都只出现一次,这样的方阵称为r阶拉丁方,或r×r拉丁方正交设计正交设计:正交设计是一种高效、快速的多因素试验方法。

它是利用一套规格化的正交表,使每次试验的因素及水平得到合理安排,通过试验结果的分析,获得有用的信息。

除了分析主因素外,还可分析交互作用。

非条件logistic回归的公式,目的,用途统计学第一章统计学家用总体这个术语来表示大同小异的对象全体。

我们试图就某个总体下结论,这个总体便称为目标总体。

资料常来源于目标总体中的一个部分,它称为研究总体。

科学的办法是从研究总体中抽取少量有代表性的个体,称为抽样。

一些个体处于同一总体,就是指他们大同小异,具有同质性。

同一总体内的个体间存在差异又是绝对的,这种现象称为变异。

本书把变量分成定性与定量两种类型。

定性变量中最常见的是分类变量或名义变量。

最简单也最常用的分类变量是二分类变量。

另一类定性变量是有序变量或等级变量。

定量变量可以分为两种类型,离散型变量和连续型变量。

离散型变量只能取整数值。

连续型变量可以取实数轴上的任何数值。

变量只能由“高级”向“低级”转化:定量→有序→分类→二值;不能作相反方向的转化。

在定量变量中,离散型变量常常通过适当的变换或连续性校正后借用连续型变量的方法来分析。

理论上,正态分布有两个参数:总体均数和总体方差。

这种由观察资料计算出来的量称为统计量。

第二章对连续型定量变量,频率分布表的编制步骤如下:(1)计算极差(R),也称为全距,即数据最大值与最小值之差。

(2)确定组段数与组距,变量值个数较多时,组段数一般取10左右。

卫生统计学考前复习材料.doc

卫生统计学考前复习材料.doc

基本概念总体(population):根据研究目的确定同质观察单位(亦称个体)的全体。

样本(sample):从总体中随机抽取部分观察单位,其实测值的集合。

抽样:必须遵循随机化原则,从总体中抽取有代表性的部分观察值,使样本具有代表性。

目的是为了用样本的信息(或统计量)推断总体的特征(或参数)。

同质与变异homogeneity & variation:统计学要求研究对象具有同质性,即研究对象的观察值具有相同属性。

同一总体内的个体存在差异,这种现象称为变异,变异是绝对存在的。

概率(probability):是描述随机事件发生的可能性大小的数值,常用P表示,范围在0与1之间。

P越接近1,标明某事件发生的可能性越大;P越接近0,表明某事件发生的可能性越小;PW0.05 的事件称为小概率事件。

统计资料的类型:1 .定量资料(measurement data)用定量方法测量观察对象的某项指标所得的数值资料。

一般有度量衡单位。

如身高、体重、浓度。

2,分类资料(enumeration data)将观察单位按某种属性或类别分组所得各组的观察单位数。

(1)二项分类:阳性、阴性。

(2)多项分类:A、B、0、AB血型。

3,等级资料(rankeddata)将观察单位按某种属性的不同程度分组所得各组的观察单位数。

如血清反应分为一,+, + + , + + + , + + + +五级。

资料可以由高级向低级转化计量资料:个体的血红蛋白(g/dl)计数资料:正常人数、异常人数(按正常异常分组)等级资料:0〜,重度贫血6〜,中度贫血9〜,鞍度贫血12〜,正常16〜,增高(按血红蛋白量的多少分组)统计工作的基本步骤:1.设计,design2,资料收集,collection data3.资料整理,sorting data4,资料分析,analysis data统计描述、参数估计、假设检验、统计结论。

统计表:基本要求:1 .标题概括表达中心内容,简练、确切、必要时注明资料来源、事件,位于表的上方。

职称考试卫生统计学重点

职称考试卫生统计学重点

卫生统计学要点笔记第一章统计学的基本内容第一节医学统计学的含义1、医学统计学定义医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析的普遍原理和方法。

2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学规律。

3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。

第二节、统计学的几个重要概念一.资料的类型1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。

一般有度量衡单位,每个对象之间有量的区别。

2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。

每个对象之间没有量的差异,只有质的不同。

3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间又有程度的差别。

注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。

二、总体根据研究目的所确定的同质的所有观察对象某项变量值的集合1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。

2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的三、样本从总体中随机抽取部分观察对象,其某项变量值的集合。

从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。

四、随机事件可以发生也可以不发生,可以这样发生也可以那样发生的事件。

亦称偶然事件。

五、概率描述随机事件发生可能性大小的数值,记作P,其取值范围0≤P≤1,一般用小数表示。

P=0,事件不可能发生必然事件(随机事件的特例);P=1,事件必然发生;P→0,事件发生的可能性愈小;P→1,事件发生的可能性愈大六、小概率事件习惯上将P≤0.05或P≤0.01 的随机事件称小概率事件。

表示某事件发生的可能性很小。

七、参数和统计量参数:总体指标,如总体均数、总体率,一般用希腊字母表示统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示八、学习医学统计学的方法1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法;2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。

其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。

总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

抽样:从研究总体中抽取少量有代表性的个体,称为抽样。

概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。

0﹤P(A)﹤1。

频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。

当试验重复很多次时P(A)= m/n。

变量:表现出个体变异性的任何特征或属性。

随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。

随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。

系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。

系统误差可以通过实验设计和完善技术措施来消除或使之减少。

随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。

它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。

卫生统计学综合复习汇总

卫生统计学综合复习汇总

统计学复习基本概念部分 总体和样本 观察单位 随机样本和非随机样本的随机化 变量、随机变量;变量的类型 连续变量:有单位,理论上变量值可以充满区间。

分类变量:属性。

无序分类变量,虽可以用数值表示第几类,但数值无意义,只是代号。

有序分类变量,虽可以用数值量化,但数值的大小无意义,意义在于数值之间的间距 和顺序关系。

计数变量:特点是离散、有序。

实际频数分布 观察单位个数的分布。

连续变量要按变量值分组段, 计数变量要按观察时间单位、 分类变量要按类别总结观察单位的个数。

实际上,后面两种变量在只有一次抽样时无法完成实际频数分布的刻画。

数据的集中趋势和离散趋势集中趋势 连续变量对称分布:算术平均数(简称均数) 数。

分类变量:具有所关心特征(类别)的观察单位的个数(频数) 率、比。

计数变量:单位时间、单位面积内所关心事件的发生数。

求和问题。

离散趋势:衡量距集中趋势远近的程度连续变量对称分布:离均差平方和、方差、标准差。

连续变量非对称分布:百分位数 间距。

抽样变异和抽样分布 抽样变异:反复抽样后,每个样本都是不同的。

反复抽样指每次抽样的样本量相同。

抽样分布:反复抽样后,样本集中趋势的分布。

对于连续变量样本标准差当然也是有分 布的,但本处不考虑。

连续变量:样本均数的分布 — 按样本均数值分组段,总结各组段样本的个数。

分类变量:具有所关心特征(类别)的观察单位的个数(频数)的分布 — 按观察单位 的个数总结样本的个数。

计数变量: 单位时间、 单位面积内所关心事件的发生数的分布 — 按发生数总结样本的 个数。

抽样分布的集中趋势和离散趋势 连续变量:反复抽样样本均数的均数 — 集中趋势;反复抽样样本均数的标准差(标准 误) —离散趋势。

分类变量:反复抽样样本具有所关心特征(类别)的观察单位的个数(频数)的均数 —集中趋势;具有所关心特征(类别)的观察单位的个数(频数)的标准差(标准误)某些情况下可以按连续变量处理。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。

其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。

总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。

总体可分为有限总体与无限总体。

总体中得所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。

样本应具有代表性。

所谓有代表性得样本,就是指用随机抽样方法获得得样本。

抽样:从研究总体中抽取少量有代表性得个体,称为抽样。

概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。

0﹤P(A)﹤1。

频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。

当试验重复很多次时P(A)= m/n。

变量:表现出个体变异性得任何特征或属性。

随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。

随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。

系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。

系统误差可以通过实验设计与完善技术措施来消除或使之减少。

随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。

它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。

误差变量一般服从正态分布。

随机误差可以通过统计处理来估计。

变异:在自然状态下,个体间测量结果得差异称为变异(variation)。

变异就是生物医学研究领域普遍存在得现象。

严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。

抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。

分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。

第二章定量资料得统计描述名词解释算术均数:描述一组数据在数量上得平均水平。

总体均数用μ表示,样本均数用X表示。

几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。

记为G。

中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

众数:众数原指总体中出现机会最高得数值。

样本众数则就是在样本中出现次数最多得数值。

极差:亦称全距,即最大值与最小值之差,用于资料得粗略分析,其计算简便但稳定性较差。

四分位数间距:就是由第3四分位数与第1四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料得分布特征,较极差稳定。

方差:方差表示一组数据得平均离散情况,由离均差得平方与除以样本个数得到。

标准差:就是方差得正平方根,使用得量纲与原量纲相同,适用于近似正态分布得资料,大样本、小样本均可,最为常用。

变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度得比较,用CV 表示。

问答题常见得描述集中趋势得指标有哪些,概念分别就是什么?答:常见得描述集中趋势得指标有算数均数、几何均数、中位数与众数。

概念见名解。

常见得描述离散趋势得指标有哪些,概念分别就是什么?答:常见得描述离散趋势得指标有极差、四分位数间距、方差、标准差与变异系数。

概念见名解。

第三章 定性资料得统计描述名词解释相对数:就是两个有联系得指标之比,就是分类变量常用得描述性统计指标,常用相对数有率、构成比、比等。

标准化法:就是常用于内部构成不同得两个或多个率比较得一种方法。

标准化法得基本思想就就是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来得影响。

问答题常用得相对数指标有哪些?它们得意义与计算上有何不同?答:常用得相对数指标有:率、构成比与相对比。

意义与计算公式如下:① 率又称频率指标,说明某现象发生得频率或强度,常以100%、1000‰等表示。

②构成比又称构成指标,说明某一事物内部各组成部分所占得比重或分布。

常以百分数表示。

③比又称相对比,就是A 、B 两个有关指标之比,说明两者得对比水平,常以倍数或百分数表示,其公式为:相对比=甲指标 / 乙指标(或100%)甲乙两个指标可以就是绝对数、相对数或平均数等。

应用相对数时应注意哪些问题?答:应用相对数时应注意得问题有:⑴ 计算相对数得分母一般不宜过小。

⑵ 分析时不能以构成比代替率。

⑶ 不能用构成比得动态分析代替率得动态分析。

⑷ 对观察单位数不等得几个率,不能直接相加求其总率。

⑸ 在比较相对数时应注意可比性。

⑹ 对样本率(或构成比)得比较应随机抽样,并做假设检验。

应用标准化法得注意事项有哪些?答:应用标准化法时应注意得问题有:1) 标准化法得应用范围很广,其主要目得就就是消除混杂因素得影响。

2) 标准化后得标准化率,已经不再反反映当时当地得实际水平,它只就是表示相互比较得资%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比料间得相对水平。

3) 报告比较结果时必须说明所选用得“标准”与理由。

4) 两样本标准化率就是样本值,存在抽样误差。

当样本含量较小时,还应作假设检验。

第四章 统计表与统计图名词解释统计表:将统计资料及其指标以表格形式列出,称为统计表(statistical table)。

狭义得统计表只表示统计指标。

统计图:统计图(statistical graph)就是将统计指标用几何图形表达,即以点得位置、线段得升降、直条得长短或面积得大小等形式直观得表示事物间得数量关系。

问答题 常用统计图得定义与制图要求。

名 称定 义 制 图 要 求 条 图 用等宽直条得长短来表示相互独立得各统计指标得数值大小起点为0得等宽直条,条间距相等,按高低顺序排列。

普通线图 适用于连续性资料。

用线段得升降来表示一事物随另一事物变化得趋势。

纵横两轴均为算术尺度,相邻两点应以折线相连。

图内线条不宜超过3条。

半对数线图 用线段得升降来表示一事物随另一事物变化得速度。

横轴为算术尺度,纵轴为对数尺度。

余同普通线图。

圆 图 以圆面积表示事物得全部,用扇形面积表示各部分得比重 以圆面积为100%,将各构成比分别乘以3、6度得圆心角度数后再绘扇形面积。

通常以12点为始边依次绘图。

直方图 用矩形得面积来表示某个连续型变量得频数分布常以横轴表示连续型变量得组段(要求等距),纵轴表示频数或频率,其尺度从“0”开始,各直条间不留空隙。

散点图 以点得密集程度与趋势表示两种事物间得相关关系 绘制方法同线图,只就是点与点之间不连接。

第五章 常用概率分布名词解释正态分布:若指标X 得频率曲线对应于数学上得正态曲线,则称该指标服从正态分布(normal distribution)。

通常用记号),(2σμN 表示均数为μ,标准差为σ得正态分布。

标准正态分布:均数为0、标准差为1得正态分布被称为标准正态分布(standard normal distribution),通常记为2(0,1)N 。

问答题正态概率密度曲线得位置与形状具有哪些特点?答:正态概率密度曲线得位置与形状具有以下特点:1) 关于x=μ对称。

2) 在x=μ处取得该概率密度函数得最大值,在x=μ±σ处有拐点。

3) 曲线下面积为1。

4) μ决定曲线在横轴上得位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。

5) σ决定曲线得形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”;σ越小,数据越集中,曲线越“瘦高”。

第六章 参数估计基础名词解释抽样误差:由个体变异产生得,抽样造成得样本统计量与总体参数得差异,称为抽样误差。

标准误及X σ:通常将样本统计量得标准差称为标准误。

许多样本均数得标准差X σ称为均数得标准误,它反映了样本均数间得离散程度,也反映了样本均数与总体均数得差异,说明均数抽样误差得大小。

点估计:就是直接利用样本统计量得一个数值来估计总体参数。

区间统计:用统计量X 与x S 确定一个有概率意义得区间,以该区间具有较大得可信度包含总体均数。

可信区间:按预先给定得概率确定得包含未知总体参数得可能范围。

该范围称为总体参数得可信区间。

它得确切含义就是:可信区间包含总体参数得可能性就是1-α,而不就是总体参数落在该范围得可能性为1-α。

第七章 假设检验基础名词解释I 型与II 型错误:I 型错误(type I error),指拒绝了实际上成立得H 0,这类“弃真”得错误称为I 型错误,其概率大小用α表示;II 型错误(type II error),指接受了实际上不成立得H 0,这类“存伪”得误称为II 型错误,其概率大小用β表示。

检验效能:1-β称为检验效能(power of test),它就是指当两总体确有差别,按规定得检验水准α所能发现该差异得能力。

问答题假设检验得基本步骤就是什么?答:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P 值并作出推断结论。

假设检验与区间估计得关系式什么?答:①置信区间具有假设检验得主要功能②置信区间课提供假设检验没有提供得信息。

置信区间在回答差别有无统计学意义得同时,还可以提示差别就是否具有实际意义。

③假设检验比置信区间多提供得信息:假设检验可以报告确切得P 值。

应用假设检验需要注意得问题有哪些?答:①应用检验方法必须符合其适用条件。

②权衡两类错误得危害以确定α得大小。

③正确理解P 值得意义,如果P<α,宜说差异“有统计学意义”。

第八章 方差分析名词解释总变异:样本中全部实验单位差异称为总变异。

其大小可以用全部观察值得均方(方差)表示。

组间变异:各处理组样本均数之间得差异,受处理因素得影响,这种变异称为组间变异,其大小可用组间均方表示。

组内变异:各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。

随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则就是各区组内得受试对象得特征相同或相近,且受试对象数与处理因素得水平数相等。

相关文档
最新文档