卫生统计学最好的复习资料

合集下载

卫生统计学知识点整理

卫生统计学知识点整理

卫生统计学知识点整理1.数据类型:卫生统计学包括两种主要类型的数据,即定量数据和定性数据。

定量数据是数值型数据,如身高、体重等,可以使用各种统计方法进行分析。

定性数据是非数值型数据,如性别、职业等,可以使用描述性统计方法进行分析。

2.数据收集方法:卫生统计学使用多种方法收集数据,其中包括调查、观察、实验和文献研究等。

调查是最常用的数据收集方法,通过设计问卷或面对面访谈等手段收集信息。

观察是观察和记录事件或行为,以获取相关数据。

实验是通过对照组和干预组进行比较来确定原因和效果的方法。

文献研究是通过分析已有的文献、报告和统计数据来获取相关信息。

3.数据描述和总结:在数据收集完成后,卫生统计学需要对数据进行描述和总结。

这包括计算各种统计指标,如平均数、中位数、众数和标准差等,以了解数据的分布和变异程度。

4.假设检验:卫生统计学中常用的方法之一是假设检验,用于判断一些变量是否与其他变量有显著关联或差异。

假设检验基于统计学原理,通过计算样本数据与预期数据之间的差异,评估是否拒绝或接受一些假设。

5.相关分析:相关分析是研究两个或多个变量之间关系的统计方法。

它可以确定变量之间的相关性大小和方向,并计算相关系数来度量相关性的强弱。

6.回归分析:回归分析是用来预测和解释一个或多个因变量与一个或多个自变量之间关系的方法。

它可以估计自变量对因变量的影响程度,并评估其统计显著性。

7.生存分析:生存分析是研究个体在一定时间内生存或发生一些事件的概率的统计方法。

它通常用于研究疾病的生存率和治疗效果。

8.抽样方法:抽样方法是在卫生调查中常用的一种方法,它可以通过选择一部分样本来代表整体群体。

常见的抽样方法包括随机抽样、系统抽样、分层抽样和整群抽样等。

9.统计软件:卫生统计学使用各种统计软件来进行数据分析和统计计算。

常用的统计软件包括SPSS、SAS、R和STATA等,它们提供了丰富的统计功能和图形展示方式。

10.数据伦理:卫生统计学中数据伦理是一个重要的问题,主要涉及数据的保密性、隐私保护和知情同意等方面。

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。

其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。

总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。

总体可分为有限总体与无限总体。

总体中得所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。

样本应具有代表性。

所谓有代表性得样本,就是指用随机抽样方法获得得样本。

抽样:从研究总体中抽取少量有代表性得个体,称为抽样。

概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。

0﹤P(A)﹤1。

频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。

当试验重复很多次时P(A)= m/n。

变量:表现出个体变异性得任何特征或属性。

随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。

随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。

系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。

系统误差可以通过实验设计与完善技术措施来消除或使之减少。

随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。

卫生统计学(案例版)复习资料

卫生统计学(案例版)复习资料

卫⽣统计学(案例版)复习资料卫⽣统计学复习整理⼀、统计⼯作基本步骤1、设计2、收集资料3、整理资料4、分析资料⼆、调查研究的特点1、不能⼈为施加⼲预措施2、不能随机分组3、很难控制⼲扰因素4、⼀般不能下因果结论三、常⽤的基本抽样⽅法1、单纯随机抽样先将调查总体的全部观察单位统⼀编号,然后采⽤随机数字表、统计软件或抽签等⽅法之⼀随机抽取n(样本⼤⼩)个编号,由这n个编号所对应的n个观察单位构成研究样本。

2、系统抽样⼜称机械抽样或等距抽样。

事先将总体内全部观察单位按某⼀顺序号等距分隔成n(样本⼤⼩)个部分,每⼀部分内含m个观察单位;然后从第⼀部分开始,从中随机抽出第i号观察单位,依此⽤相等间隔m机械地在第⼆部分、第三部分直⾄第n部分内各抽出⼀个观察单位组成研究样本。

3、分层抽样先按对观察指标影响较⼤的某项或某⼏项特征,将总体分成若⼲层(strata),该特征的测定值在层内变异较⼩、层间变异较⼤,然后分别从每⼀层内随机抽取⼀定数量的观察单位结合起来组成样本。

4、整群抽样将总体划分为群(初级观察单位),各群由次级观察单位组成。

随机抽取⼀部分群,调查抽中群的全部次级观察单位。

5、多阶段抽样抽样误差⽐较:分层抽样<系统抽样<单纯随机抽样<整群抽样四、实验设计的特点1、研究者可⼈为设置处理因素2、受试对象接受何种处理因素或处理因素的何种⽔平是随机的五、实验设计的三个基本要素1、处理因素(或研究因素)2、受试对象3、实验效应六、实验设计的基本原则对照原则随机原则重复原则均衡原则七、常⽤的实验设计⽅案完全随机设计配对设计随机区组设计⼋、定量资料集中趋势的描述指标:描述数据分布中⼼位置(平均⽔平)的指标。

算术均数适⽤于对称分布特别是正态分布资料。

⼏何均数⼏何均数适⽤①对数正态分布②等⽐级数资料观察值中不能有0中位数和百分位数应⽤:中位数:适⽤于偏态分布、分布不明确或分布末端⽆确定数据的资料。

百分位数:百分位数:⾮正态分布资料九、描述离散趋势指标:描述数据分布的离散程度(变异程度)的指标。

卫生统计学考前复习材料.doc

卫生统计学考前复习材料.doc

基本概念总体(population):根据研究目的确定同质观察单位(亦称个体)的全体。

样本(sample):从总体中随机抽取部分观察单位,其实测值的集合。

抽样:必须遵循随机化原则,从总体中抽取有代表性的部分观察值,使样本具有代表性。

目的是为了用样本的信息(或统计量)推断总体的特征(或参数)。

同质与变异homogeneity & variation:统计学要求研究对象具有同质性,即研究对象的观察值具有相同属性。

同一总体内的个体存在差异,这种现象称为变异,变异是绝对存在的。

概率(probability):是描述随机事件发生的可能性大小的数值,常用P表示,范围在0与1之间。

P越接近1,标明某事件发生的可能性越大;P越接近0,表明某事件发生的可能性越小;PW0.05 的事件称为小概率事件。

统计资料的类型:1 .定量资料(measurement data)用定量方法测量观察对象的某项指标所得的数值资料。

一般有度量衡单位。

如身高、体重、浓度。

2,分类资料(enumeration data)将观察单位按某种属性或类别分组所得各组的观察单位数。

(1)二项分类:阳性、阴性。

(2)多项分类:A、B、0、AB血型。

3,等级资料(rankeddata)将观察单位按某种属性的不同程度分组所得各组的观察单位数。

如血清反应分为一,+, + + , + + + , + + + +五级。

资料可以由高级向低级转化计量资料:个体的血红蛋白(g/dl)计数资料:正常人数、异常人数(按正常异常分组)等级资料:0〜,重度贫血6〜,中度贫血9〜,鞍度贫血12〜,正常16〜,增高(按血红蛋白量的多少分组)统计工作的基本步骤:1.设计,design2,资料收集,collection data3.资料整理,sorting data4,资料分析,analysis data统计描述、参数估计、假设检验、统计结论。

统计表:基本要求:1 .标题概括表达中心内容,简练、确切、必要时注明资料来源、事件,位于表的上方。

医学统计复习资料

医学统计复习资料

医学统计复习资料
以下是一些医学统计学的复习资料:
1. 《医学统计学》(作者:杨晓丽、徐菲、马健等)
这是一本医学统计学的教材,内容全面,包含了医学统计学的基本概念、方法和应用等方面的知识。

2. 《医学统计学与SPSS应用》(作者:陈建华、李晓红、刘静等)
这本书介绍了医学统计学的基本概念和原理,并详细介绍了如何使用SPSS 软件进行医学统计分析。

3. 《医学统计学与临床研究设计》(作者:王伟)
这本书主要介绍了医学统计学在临床研究设计中的应用,包括研究设计的选择、样本量计算、数据收集和分析等方面的内容。

4. 《医学统计学》(作者:梁家全)
这本书详细介绍了医学统计学的基本概念和方法,包括描述统计学、推断统计学、生存分析和回归分析等方面的内容。

此外,还可以参考一些医学统计学的课件和教学视频,如Coursera上的《医学统计学》课程和YouTube上的《医学统计学基础》系列视频等。

同时,还可以参加一些医学统计学的培训班或研讨会,与专业人士交流学习经验和方法。

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。

总体:根据研究目的确定的同质(大同小异)的观察单位的全体。

分为目标总体和研究总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

抽样:从研究总体中抽取少量有代表性的个体。

变量:表现出个体变异性的任何特征或属性。

分定型变量和定量变量。

定型变量:1)分类变量或名义变量:最简单的是二分类变量。

0-1变量也常称为假变量或哑变量。

2)有序变量或等级变量。

定量变量:分离散型变量和连续型变量。

变量只能由高级向低级转化:定量→有序→分类→二值。

常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。

2)计数资料或分类资料,如性别、血型等。

3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。

累计频数为该组及前面各组的频数之和。

累计频率表示各组累计频数在总例数中所占的比例。

可用直条图表达。

2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。

2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。

3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。

4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用X表示。

适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。

分:直接法和频率表法。

即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。

《医学统计学》复习资料

《医学统计学》复习资料

统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。

统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。

二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。

变异是同质基础上的观察单位(亦称为个体)之间的差异。

(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。

样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。

(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。

变量值:变量的测得值。

如身高150cm,体重50Kg等。

(四)参数与统计量参数是指总体特征的统计指标。

如某地健康成年男性的平均血红蛋白值。

统计量是指样本特征的统计指标。

如从某地健康成年男性中抽取一部分人的平均血红蛋白值。

(五)误差误差泛指测量值与真实值之差。

根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。

1.系统误差:测量结果有倾向性。

查明原因,可以避免。

特点:①测量结果有倾向性。

如仪器、试剂、判定标准等。

②查明原因,可以避免。

2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。

特点:①随机误差没有大小和方向。

②不可避免。

3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。

特点:变异是绝对的,抽样误差不可避免。

原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。

(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。

随机事件的概率在0~1之间,即0≤P≤1。

小概率事件:P≤0.05或P≤0.01的事件。

卫生统计学-重点整理资料

卫生统计学-重点整理资料

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。

2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。

⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。

⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。

⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。

样本中包含的观察单位个数成为样本含量。

⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。

⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。

⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。

可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。

⑵系统抽样:又称机械抽样或等距抽样。

事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。

卫生统计学最好的复习资料

卫生统计学最好的复习资料

卫生统计学最好的复习资料一、名词解释1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data )。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data )。

计数资料亦称定性资料或分类资料。

其观察值是定性的,表现为互不相容的类别或属性。

3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data )。

等级资料又称有序变量。

4. 总体:总体(population )指特定研究对象中所有观察单位的测量值。

5. 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。

6. 抽样误差:抽样误差(sampling error )是指样本统计量与总体参数的差别。

在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

7. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。

8. 算术均数:描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用X 表示。

9. 中位数:将一组观察值由小到大排列,位次居中的那个数。

10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14. 正态分布:若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。

通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。

卫生统计学复习资料

卫生统计学复习资料

卫⽣统计学复习资料2007级预防⾏政班卫⽣统计学复习资料第三节统计⼯作的基本步骤统计设计收集资料整理资料分析资料⼀、统计设计1、调查设计2、实验设计(详见第⼗三章)⼆、收集资料资料来源(1)统计报表(2)⽇常医疗⼯作原始记录和报告卡(3)专题调查三、整理资料1.⽬的将收集的原始资料系统化、条理化,便于进⼀步计算和分析2.整理分组⽅式(1)性质分组(2)数量分组三、分析资料1、统计描述2、统计推断第四节统计图表⼀、统计表1、统计表的作⽤代替冗长的⽂字叙述,便于计算、分析和对⽐。

2、统计表的结构1)标题2)标⽬横标⽬(主语):说明表各横⾏数字的涵义,通常列在表的左侧纵标⽬(谓语):说明表各纵栏数字的涵义主语和谓语连贯起来能读成⼀句完整⽽通顺的话3、统计表的种类:1)简单表:只按单⼀变量分组2)组合表:按两个或两个以上变量分组某地1980年男、⼥HBsAg阳性率━━━━━━━━━━━━━━━━性别调查数阳性数阳性率(%)────────────────男4234 303 7.16⼥4530 181 4.00──────────────合计8764 484 5.52━━━━━━━━━━━━━━━━4、列表原则:重点突出,简单明了;主谓分明,层次分明5、统计表的基本要求:1)标题:概括地说明表的内容,必要时注明资料的时间和地点,写在表上⽅。

常见的缺点:过于简略,甚⾄不写标题;或过于繁琐;或标题不确切。

2)标⽬:⽂字简明扼要,有单位的标⽬要注明单位。

常见的缺点:标⽬过多,层次不清3)线条:不宜过多,除上⾯的顶线,下⾯的底线,纵标⽬与合计之间的横线外,其余线条⼀般均省去。

表的左上⾓不宜有斜线。

4)数字:A、数字⼀律⽤阿拉伯数字表⽰B、同⼀指标的⼩数位数应⼀致,位次对齐C、表内不宜留空格,暂缺或未记录,⽤“…”表⽰,⽆数字,⽤“—”表⽰,数字为0,填写0D、绝对数太⼩⽽⽆法计算指标,则⽤“…”代替。

5)备注:⼀般不列⼊表内,必要时可⽤“*”号标出,写在表的下⾯。

卫生统计学客观题复习资料4

卫生统计学客观题复习资料4



A.n≥50

B.P 不接近与 0

C.np 或 n(1-p)大于 5

D.np 与 n(1-p)均大于 5
标准答案:D
16、欲描述鼻咽癌患者的血型分布,宜绘制

A.直条图

B.圆图

C.线图

D.直方图
标准答案:B 17、以学生为观察单位,检查学生大便中蛔虫卵的有无属于

A.定量资料

B.二项分类资料

A.35%-60%

B.37%-63%

C.30%-70%

D.40%-60%
标准答案:D
第二大题:多项选择题(总分:40 分)
1、下列属于相对比的指标是:( )

A.相对危险度 RR

B.比值比 OR

C.病死率

D.变异系数

E.性比例
标准答案:A, B, D, E
2、对于服从双变量正态分布的资料,如果直线相关分析算出的 r 值越大,则经回归分析得的相应的 b 值,下列说法不正确的是( )
A.两变量呈正相关关系

B.两变量呈负相关关系

C.两变量不存在相关关系

D.两变量间相关关系密切程度不高
标准答案:A 11、下列分布中,均数等于方差的是:( )

A.X2

B.u 分布

C.二项分布

D.Poisson 分布
标准答案:D 12、在同一正态总体中随机抽样,总体均数有 90%的可能在:( )

A.分布为单峰分布

实用卫生统计学复习资料(汇总)

实用卫生统计学复习资料(汇总)

《实用卫生统计学》一、名词解释1.变异:同一性质的事物.其观察值(变量值)之间的差异.统计上称为变异。

2.抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究.抽样研究的目的是通过用样本资料计算的指标去推论总体。

3.统计描述:用统计图表或计算统计指标的方法表达一个特定群体(这个群体可以是总体也可以是样本)的某种现象或特征.称统计描述。

4.统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断.常用方法是参数估计和假设检验。

5.均数:是反映计量资料全部观察值平均水平的统计指标.适用于对称分布尤其是正态分布资料.公式如下:6.标准差:是反映计量资料全部观察值离散程度的统计指标.用于描述对称分布资料.尤其正态分布资料的离散趋势.公式如下:7.标准正态变换:将服从正态分布的原始变量x~n(μ.σ)进行变量变换.这种变换叫标准正态变换(或M变换)。

8.构成比:又称构成指标.它表示事物内部各组成部分所占的比重或分布。

9.动态数列:是一系列按时间顺序排列起来的统计指标.包括绝对数、相对数或平均数.用以说明事物在时间上的变化和发展趋势。

计指标.它是对资料进行统计描述时的一种常用手段。

(如点、线、面或立体)显示数据的大小、升降、分布以及关系等.它也是对资料进行统计描述时的一种常用手段。

12.抽样误差:在同一总体中随机抽取样本含量相同的若干样本时.样本指标之间的差异以及样本指标与总体指标的差异.称为抽样误差。

13.均数的抽样误差:在同一总体中随机抽取样本含量相同的若干样本时.样本指标之间的差异以及样本指标与总体指标的差异.称为抽样误差。

统计学上.对于抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差。

14.率的抽样误差:在同一总体中随机抽取样本含量相同的若干样本时.样本指标之间的差异以及样本指标与总体指标的差异.称为抽样误差。

统计学上.对于抽样过程中产生的同一总体中率之间的差异称为率的抽样误差。

卫生统计学复习提纲

卫生统计学复习提纲

绪论一、卫生统计学的定义根据统计学的原理和方法,研究医学数据的收集、表达和分析的一门应用学科。

二、统计工作的步骤1、设计2、搜集资料3、整理资料4、分析资料三、统计资料的类型1、定量资料:可通过对观察单位测量取得数值,一般有度量衡单位。

如身长(cm)、血压(kPa)、脉搏( 次/ 分)。

虽然如脉搏、白细胞计数等测量值只能是正整数(不连续),但为研究方便习惯上也视为连续变量。

2、分类资料:分类变量的可能取值是离散的。

表现为互不相容的类别。

如性别、血型、民族、职业等。

(1)无序分类unordered categories(或名义变量nominal variable)表现为变量的不同取值间没有大小、强弱、优劣等程度之别。

如性别、血型等。

无序分类资料称为计数资料。

A.二项分类:如性别分为男、女;虫卵化验结果分为阴性、阳性等。

B.多项分类:如人群血型的A、B、O、AB等。

(2)有序分类:表现为变量的不同取值间有大小、强弱、优劣等程度之别。

如疗效可分为治愈、显效、好转、无效,尿蛋白化验结果分为一、±、++、+++等。

各类之间有程度上的差别。

有序分类变量资料称为等级资料(ranked data)。

(3)各类变量间的互相转化根据研究分析的需要,各类资料可相互转化。

分类变量转化为数值是将具有属性的事物,按其顺序、轻重、大小、主次标以数码。

A.对于有序分类变量有时可通过给各类别赋值,如治愈为3、显效为2、好转为l、无效为0,作为数值变量处理。

B.数值变量也可转化为分类变量:如按血压测量值大小将血压分为低血压、正常、高血压,从而按分类变量处理。

四、基本概念1、总体:根据研究目的确定的同质观察单位的全体。

有限总体?无限总体?2、样本:从总体中随机抽取部分观察单位实测值的集合。

3、同质:是指具有某些相同因素的个体,而这些因素会对研究指标产生影响(如同一地区、同一年份、同一性别等)。

4、变异是指在同质的基础上各观察值之间的差异。

卫生统计学复习资料

卫生统计学复习资料

科研方法第三章实验设计的基本要素:实验设计的基本要素包括处理因素、受试对象和实验效应三个组成部分。

实验设计的四原则:对照原则均衡原则随机原则重复原则随机原则:使实验组和对照组非处理因素趋于一致或均衡的主要手段是随机化。

随机化的方法有多种,最常使用的是利用随机数字表和随机排列表(或称随机化分组表)。

拉丁方设计:用r个拉丁字母排成r行r列的方阵,使每行及每列中每个字母都只出现一次,这样的方阵称为r阶拉丁方,或r×r拉丁方正交设计正交设计:正交设计是一种高效、快速的多因素试验方法。

它是利用一套规格化的正交表,使每次试验的因素及水平得到合理安排,通过试验结果的分析,获得有用的信息。

除了分析主因素外,还可分析交互作用。

非条件logistic回归的公式,目的,用途统计学第一章统计学家用总体这个术语来表示大同小异的对象全体。

我们试图就某个总体下结论,这个总体便称为目标总体。

资料常来源于目标总体中的一个部分,它称为研究总体。

科学的办法是从研究总体中抽取少量有代表性的个体,称为抽样。

一些个体处于同一总体,就是指他们大同小异,具有同质性。

同一总体内的个体间存在差异又是绝对的,这种现象称为变异。

本书把变量分成定性与定量两种类型。

定性变量中最常见的是分类变量或名义变量。

最简单也最常用的分类变量是二分类变量。

另一类定性变量是有序变量或等级变量。

定量变量可以分为两种类型,离散型变量和连续型变量。

离散型变量只能取整数值。

连续型变量可以取实数轴上的任何数值。

变量只能由“高级”向“低级”转化:定量→有序→分类→二值;不能作相反方向的转化。

在定量变量中,离散型变量常常通过适当的变换或连续性校正后借用连续型变量的方法来分析。

理论上,正态分布有两个参数:总体均数和总体方差。

这种由观察资料计算出来的量称为统计量。

第二章对连续型定量变量,频率分布表的编制步骤如下:(1)计算极差(R),也称为全距,即数据最大值与最小值之差。

(2)确定组段数与组距,变量值个数较多时,组段数一般取10左右。

《卫生统计学》考试重点复习资料

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。

其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。

总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

抽样:从研究总体中抽取少量有代表性的个体,称为抽样。

概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。

0﹤P(A)﹤1。

频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。

当试验重复很多次时P(A)= m/n。

变量:表现出个体变异性的任何特征或属性。

随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。

随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。

系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。

系统误差可以通过实验设计和完善技术措施来消除或使之减少。

随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。

它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。

卫生统计学客观题复习资料2

卫生统计学客观题复习资料2

复习资料《卫生统计学》(课程代码02867)第一大题:单项选择题(总分:60分)1、欲了解某市8岁小学生的身高情况,该市某小学二年级8岁小学生是:()• A.样本• B.有限总体• C.无限总体• D.个体标准答案:A2、在计算方差时,若将各观察值同时减去某一常数后求得的方差:( )• A.会变小• B.会变大• C.不变• D.会出现负值标准答案:C3、某地2006年肝炎发病人数占当年传染病发病人数的10.1%,该指标为( )• A.概率• B.构成比• C.发病率• D.相对比标准答案:B4、对于服从双变量正态分布的资料,如果直线相关分析算出的值越大,则经回归分析得的相应的b 值:• A.越大• B.越小• C.比r 小• D.可能较大也可能较小标准答案:D5、在比较甲、乙两种监测方法测量结果是否一直时,若采用配对设计秩和检验,甲、乙两法测量值之差中有-0.02、0.02,若差值绝对值的位次为3、4,则这两个差值的秩次分别为:()• A.-3.5,3.5• B.-3.5,-3.5• C.3.5,3.5• D.-3,4标准答案:C6、某卫生局对其辖区内甲、乙两医院医疗技术人员的业务素质进行考核,在甲医院随机抽取100人,80人考核结果为优良;乙医院随机抽取150人,100人考核结果为优良。

本题中资料类型与设计类型分别为:• A.定量资料成组设计• B.定量资料配对设计• C.分类资料成组设计• D.分类资料配对设计标准答案:C7、在某农村地区随机抽取100名儿童,进行蛔虫感染情况粪检,结果50名儿童蛔虫卵粪检为阳性,则该地儿童蛔虫卵粪检总体阳性率的95%的置信区间为:()• A.35%-60%• B.37%-63%• C.30%-70%• D.40%-60%标准答案:D8、某研究欲了解男性高血压患者与女性高血压患者血脂是否有差异,从某市6家医院随机调查了400人,测量血脂水平,经t 检验,得P<0.05,有统计学差异,由此推断该地男、女高血压患者血脂总体均数有差别,这里所谓有统计学差异是指:( )• A.两样本均数差别有统计学差异• B.两总体均数差别有统计学差异• C.两样本均数和两总体均数的差别有统计学差异• D.其是有一个样本均数和总体均数有统计学差异标准答案:B9、假设某地35岁以上正常成年男性收缩压的总体均数为120.2mmHg,标准差为11.2mmHg,后者反映的是:()• A.个体变异的大小• B.抽样误差的大小• C.系统误差的大小• D.总体的平均水平标准答案:A10、Wilcoxon两样本比较的秩和检验在编秩时,若遇到两组中有相同数值,应:()• A.不计秩次• B.依次序编秩• C.取其平均秩次• D.以平均秩次的整数为秩标准答案:C11、下列关于样本含量的叙述,正确的是: ( )• A.样本含量越大越好• B.以实际可以收集到的样本例数为准• C.时间、财力、人力等条件允许下的最大样本例数• D.一定的推断精度和检验效能下的最少样本例数标准答案:D12、两样本均数比较,经t 检验,差别有显著性时,P 越小,说明:()• A.两个样本均数差别越大• B.两总体均数差别越大• C.越有理由认为两总体均数不同• D.越有理由认为两样本均数不同标准答案:C13、成组设计的方差分析中,有( )• A.MS组间=MS组内• B.SS组内=SS组间• C.MS总=MS组间+MS组内• D.SS总=SS组间+SS组内标准答案:D14、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数=1,则有: ( )• A.SS总=SS残• B.SS残=SS回• C.SS总=SS回• D.SS总>SS回标准答案:C15、正态分布曲线下,横轴上,从均数到+1.96S S的面积为:()• A.95%• B.45%• D.47.5%标准答案:D16、下列关于新生儿特征的变量中,属于定量资料的一组数据为• A.头围、性别、身高• B.头围、性别、胎次• C.头围、性别、体重• D.头围、身高、体重标准答案:D17、某地区9岁男童肺活量的分布类型通常是• A.正态分布• B.对数正态分布• C.正偏态分布• D.负偏态分布标准答案:A18、两组定量资料的比较,若已知n1、n2均小于30,总体方差齐且呈正分布,宜采用• A.t检验• B.t t检验t’• C.Z检验• D.秩和检验标准答案:A19、对于3×4行列表的X2检验,其自由度计算公式为• A.3-1• B.4-1• C.3×4-1• D.(3-1)(4-1)标准答案:D20、某研究者欲比较两种血红蛋白检测方法是否相同,从健康人中招募了24名志愿者,每名志愿者采集10ml血样分装在2个试管中,分别用两种方法进行检测,对检测结果用配对检验进行统计分析,则其自由度为• A.11• B.12• C.22标准答案:D21、关于假设检验,下面说法正确的是• A.检验水准只能取0.05• B.假设检验是统计推断的内容之一• C.假设检验的结论不会犯错误• D.假设检验就是t检验标准答案:B22、同一两独立样本均数比较的资料,进行方差分析的结果与t 检验的结果• A.完全等价,且t=F• B.完全等价,且=F• C.完全等价,且=F• D.不同,方差分析的结果更可靠标准答案:C23、随机事件发生概率P的变化范围为• A.P>0• B.P>1• C.0≤P≤1• D.0≤P<1标准答案:C24、反映一组两端有不确切值资料的离散水平,最适宜的指标是• A.R• B.Qu-QL• C.S• D.标准答案:B25、下列关于配伍组设计方差分析变异分解的式子正确的是• A.SS总=SS配伍+SS误差• B.SS总=SS处理+SS误差• C.SS总=SS配伍+SS处理+SS误差• D.MS总=MS配伍+MS处理+MS误差标准答案:C26、对直线回归方程=0.635x ,下列说法正确的是• A.所有实测点都在回归直线上• B.所绘回归直线不过点()• C.回归直线经过原点• D.x的取值范围为标准答案:C27、若3个样本率比较,得到0.05,2,P>0.05,按照0.05检验水准,下列说法正确的是• A.可以认为3个总体率都不相同• B.可以认为3个总体率不全相同• C.可以认为3个总体率相同• D.可以认为3个样本率相同标准答案:B28、描述2000~2010年成都市女性居民子宫颈癌发病率的时间变化趋势,宜绘制• A.条图• B.普通线图• C.直方图• D.散点图标准答案:B29、已知某药物治疗糖尿病有效率为60%,根据纳入标准和排除标准选取200例糖尿病患者,采用新药A进行治疗,结果140例患者有效。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、名词解释1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data )。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data )。

计数资料亦称定性资料或分类资料。

其观察值是定性的,表现为互不相容的类别或属性。

3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data )。

等级资料又称有序变量。

4. 总体:总体(population )指特定研究对象中所有观察单位的测量值。

5. 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample )。

6. 抽样误差:抽样误差(sampling error )是指样本统计量与总体参数的差别。

在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

7. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频数)。

8. 算术均数:描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用X 表示。

9. 中位数:将一组观察值由小到大排列,位次居中的那个数。

10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14. 正态分布:若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。

通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。

15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为2(0,1)N 。

16. 统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。

17. 抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的差异,称为抽样误差。

18. 标准误:通常将样本统计量的标准差称为标准误。

19. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。

20. 参数估计:指用样本统计量估计总体参数。

参数估计有两种方法:点估计和区间估计。

21. 假设检验中P 的含义:指从H 0规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。

22. I 型和II 型错误:I 型错误指拒绝了实际上成立的H 0,这类“弃真”的错误称为I 型错误,其概率大小用α表示;II 型错误,指接受了实际上不成立的H 0,这类“存伪”的错误称为II 型错误,其概率大小用β表示。

23. 检验效能:1-β称为检验效能,它是指当两总体确有差别,按规定的检验水准α所能发现该差异的能力。

24. 检验水准:是预先规定的,当假设检验结果拒绝H 0,接受H 1,下“有差别”的结论时犯错误的概率称为检验水准,记为α。

25. 方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。

通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对观测指标有无影响。

26. 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数相等。

然后再将每个区组内的观察对象随机地分配到各处理组,这种设计叫做随机区组设计。

27. 相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。

28. 标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。

标准化法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。

29. 二项分布:若一个随机变量X ,它的可能取值是0,1,…,n ,且相应的取值概率为k n k n k k X P --==)1()()(ππ, 则称此随机变量X 服从以n 、π为参数的二项分布。

30. Yates 校正:英国统计学家Yates F 认为,由于2χ分布理论上是一连续性分布,而分类资料是间断性的,由此计算出的2χ值不连续,尤其是自由度为1的四格表,求出的概率P 值可能偏小,此时需对2χ值作连续性校正(correction of continuity ),这一校正即所谓的Yates 校正(Yates ’correction )。

31. 非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。

由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics ),或称为不拘分布(distribution-freestatistics )的统计分析方法,又称为无分布型式假定(assumption freestatistics )的统计分析方法。

32. 直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。

直线回归是回归分析中最基本、最简单的一种,故又称简单回归。

33. 直线相关:是用来描述具有直线关系的两变量x 、y 间的相互关系。

34. 相关系数:又称积差相关系数,以符号r 表示样本相关系数,ρ表示总体相关系数。

它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。

35. 回归系数: 为直线的斜率,其统计学意义是自变量x 改变一个单位时,应变量y 平均变化b 个单位。

36. 人口总数:人口总数(population)是指一个国家或地区在某特定时间点上存活人口的总和。

国际上统计人口数有两种办法:① 实际制(de facto):即只统计标准时刻某地实际存在的人口数(包括临时在该地的人)。

② 法定制(de jure):只统计某地的常住人口。

37. 老年人口系数:是指65岁及以上老年人口数占总人口数的比重。

65100%=⨯岁及以上的人口数老年人口系数人口总数。

老年人口系数用于表明一个国家或地区的人口老龄化程度,其大小受社会经济发展水平、生活水平、卫生保健水平等因素的影响。

38. 围产儿死亡率:围产期是指胎儿体重达到1000克及以上、或孕期满28周,至出生后7天以内的时期。

在此期间的死亡称为围产儿死亡。

计算式为:%产数+活产数某年围产期死胎数+死天内的新生儿死亡数产数+出生同年围产期死胎数+死围产儿死亡率=10007⨯ 。

围产儿死亡率是衡量孕期、产前、产后保健工作质量的敏感指标,它不能从出生报告及死亡报告直接计算,需要利用妇产科病例资料分析计算。

39. 新生儿死亡率:新生儿死亡率(neonatal mortality rate, NMR) 指某地平均每千名活产数中未满28天的新生儿死亡数。

计算式:100028⨯=某年活产总数天的新生儿死亡数同年未满新生儿死亡率‰新生儿死亡在婴儿死亡中占很大的比重。

死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制的疾病。

40. 婴儿死亡率:指某年平均每千名活产中不满1周岁(婴儿)的死亡数。

计算式为:10001⨯=某年活产总数岁婴儿死亡数同年未满婴儿死亡率‰ 41. 孕产妇死亡率:指某年由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生活产数之比,常以万分率或十万分率表示,计算式为:1000010=⨯同年孕产妇死亡数孕产妇死亡率(或万)某年活产数42. 死因顺位:指按各类死因构成比从高到低排列的位次,说明死因的重要性,反映了各种死亡原因导致死亡的严重程度。

43. 人口金字塔:将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人口数或年龄构成比为横轴,按男左女右绘制的直方图,其形态如金字塔,故称为人口金字塔。

人口金字塔是对人口年龄、性别构成综合反映的特殊统计图,指示了不同时期人口年龄、性别构成的变化情况,是长期人口出生、死亡、迁入、迁出而形成的,反映了历史的痕迹和变动的趋势。

44.灵敏度:是诊断试验将实际有病的人正确诊断为病人的百分率。

45.特异度:是诊断试验将实际无病的人正确诊断为非病人的百分率。

46.误诊率:是诊断试验将实际无病的人错误诊断为病人的百分率。

47.漏诊率:是诊断试验将实际有病的人错误诊断为非病人的百分率。

48.阳性似然比:是诊断试验中灵敏度与误诊率的比值,即正确判定病人的概率是错判病人概率的倍数,它反映诊断试验判断正确的概率程度。

LR+的取值范围为(0,∞),其值越大则该试验确诊疾病能力越强。

49.阴性似然比:是诊断试验中漏诊率与特异度的比值,即错判非病人的概率是正确判定非病人概率的倍数,它反映诊断试验判断错误的概率程度,LR-的取值范围为(0,∞),其值越小则该试验排除疾病的能力越好。

50.Youden指数:是诊断试验中灵敏度和特异度之和减去基数(1或100%),表示诊断试验发现真正的患者和非患者的总的能力。

Youden指数的取值范围在(-1,1)之间,其值越接近1,诊断价值越大。

51.ROC曲线:即受试者工作特征曲线,是确定临界点较为理想的一种方法。

它是以不同临界点的同一种试验连续(至少5组)测定的灵敏度为纵坐标,1-特异度(误诊率)为横坐标,标出各工作点,然后将得到的多个工作点连接绘制而成的曲线,统计图:是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。

1.连续性资料1.1 两组独立样本比较1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。

1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。

1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。

1.2 两组配对样本的比较1.2.1 两组差值服从正态分布,采用配对t检验。

1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。

1.3 多组完全随机样本比较1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。

相关文档
最新文档