卫生统计学期末复习重点
《卫生统计学》考试重点复习资料
![《卫生统计学》考试重点复习资料](https://img.taocdn.com/s3/m/6e350a3ff705cc17542709a1.png)
《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。
其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。
总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。
总体可分为有限总体与无限总体。
总体中得所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。
样本应具有代表性。
所谓有代表性得样本,就是指用随机抽样方法获得得样本。
抽样:从研究总体中抽取少量有代表性得个体,称为抽样。
概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。
0﹤P(A)﹤1。
频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性得任何特征或属性。
随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。
随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。
系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计与完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。
《卫生统计学》考试重点复习资料
![《卫生统计学》考试重点复习资料](https://img.taocdn.com/s3/m/e8689dfdd4bbfd0a79563c1ec5da50e2524dd1bd.png)
卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。
总体:根据研究目的确定的同质(大同小异)的观察单位的全体。
分为目标总体和研究总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体。
变量:表现出个体变异性的任何特征或属性。
分定型变量和定量变量。
定型变量:1)分类变量或名义变量:最简单的是二分类变量。
0-1变量也常称为假变量或哑变量。
2)有序变量或等级变量。
定量变量:分离散型变量和连续型变量。
变量只能由高级向低级转化:定量→有序→分类→二值。
常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。
2)计数资料或分类资料,如性别、血型等。
3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。
累计频数为该组及前面各组的频数之和。
累计频率表示各组累计频数在总例数中所占的比例。
可用直条图表达。
2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。
2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。
3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。
4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。
分:直接法和频率表法。
即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。
卫生统计学重点总结
![卫生统计学重点总结](https://img.taocdn.com/s3/m/c575f31f02d276a200292ee1.png)
第一章绪论1.卫生统计学的概念P1卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生情况以及卫生服务领域中数据的收集、整理和分析的一门科学。
2.卫生(医学)统计学的主要步骤P3设计;收集资料;整理资料;分析资料3.(选择、判断)卫生统计学的基本概念P4同质(homogeneity):统计学中,若某些观察对象具有相同的特征或属性,称之为同质或具有同质性。
变异(variation):将同质个体的某项特征或属性的观察值或测量值之间的差异称为变异。
总体(population):是根据研究目的确定的的所有观察单位某种特征或属性的观察值或测量值的集合。
样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数称为样本含量。
参数(parameter):反映总体特征的指标称为参数,一般是未知的,常用希腊字母表示。
统计量(statistic):根据样本观察值计算出来的指标称为统计量,常用拉丁字母表示。
变量(variable):每个观察单位的某项特征或属性称为变量。
抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的研究方法称为抽样研究。
抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异称为抽样误差。
资料(data):变量值的集合称之为资料。
★4.资料的分类P4(1)定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
(2)定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可进一步细分为两种资料:1)计数资料:指将观察单位按某种类别或属性进行分组,清点各组观察单位数所得的资料。
包括:①二项分类资料;②无序多项分类资料2)等级资料:亦称有序多分类资料,是将观察单位按某特征或属性的程度或等级顺序分组,清点各组观察单位数所得的资料。
卫生统计学的重点归纳
![卫生统计学的重点归纳](https://img.taocdn.com/s3/m/178f0c1e3069a45177232f60ddccda38366be154.png)
卫生统计学的重点归纳卫生统计学的重点归纳一、卫生统计学的定义卫生统计学是以统计理论和方法为基础,应用数学、物理、化学、计算机等学科技术,研究卫生和医疗问题的数据分析方法。
它以收集,处理,分析和解释卫生和医疗等领域的统计数据为基础,以定量分析和定性分析卫生数据,研究卫生和应用流行病学方法,识别患病危险因素,以及制定卫生与医疗保健的政策与措施,为医学和公共卫生提供科学依据的一门学科。
二、卫生统计学的基本原理(1)基本理论卫生统计学的基本理论包括:(1)数理统计学:数理统计学是以统计学的数据处理方法为工具,探讨多变量间相互关系的学科;(2)社会科学统计学:社会科学统计学是以统计学的方法为工具,研究社会判断和实证研究的学科;(3)中国统计学:中国统计学是以中国传统的统计学理论和方法为基础,研究社会发展进程中社会变迁的学科;(4)应用统计学:应用统计学是以统计学的方法来解决实际问题,如实验设计与分析、生态学分析、经济学分析等。
(2)基本方法卫生统计学的基本方法包括:(1)分类法:分类法是按照实际问题的性质,将被研究对象进行科学的定性分类;(2)测度法:测度法是按照实际问题的性质,将被研究对象进行科学的定量测度;(3)统计方法:统计方法是利用统计技术处理数据,以处理、描述、分析和预测实证问题;(4)流行病学方法:流行病学方法是指在全面调查的基础上,利用统计技术,研究病因、流行病学及其预防控制等方面的方法。
三、卫生统计学的应用1、卫生统计学用于事件分析。
事件分析包括:病原体检测、医疗并发症监测、病因研究、新药研发、疾病控制等研究;2、卫生统计学用于政策分析,为卫生政策、医疗政策、公共卫生政策的制订、实施和评价,提供科学依据;3、卫生统计学用于质量控制。
对质量控制体系中的质量指标进行定量分析、定性分析和评价;4、卫生统计学用于教育考试。
有助于改进教育评价,提高客观能力,开发判断及决策技能;5、卫生统计学用于职业卫生领域,可以指导职业卫生政策的制定和促进各种职业病的预防。
卫生统计学-重点整理资料
![卫生统计学-重点整理资料](https://img.taocdn.com/s3/m/39897074e518964bcf847ca1.png)
卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
《卫生统计学》考试重点复习资料
![《卫生统计学》考试重点复习资料](https://img.taocdn.com/s3/m/cb943b17312b3169a451a48f.png)
②权衡两类错误的危害以确定α的大小。 ③正确理解 P 值的意义,如果 P<α,宜说差异“有统计学意义”。
第八章 方差分析
名词解释
总变异:样本中全部实验单位差异称为总变异。其大小可以用全部观察值的均方(方差)表 示。 组间变异:各处理组样本均数之间的差异,受处理因素的影响,这种变异称为组间变异,其 大小可用组间均方表示。 组内变异: 各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象 的特征相同或相近,且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对 象随机地分配到各处理组,这种设计叫做随机区组设计。
构成比
某一组成部分的观察单 位数 同一事物各组成部分的 观察单位总数
100 %
③比又称相对比,是 A、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表
示,其公式为:相对比=甲指标 / 乙指标(或 100%)
甲乙两个指标可以是绝对数、相对数或平均数等。
应用相对数时应注意哪些问题?
答:应用相对数时应注意的问题有:
相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、
构成比、比等。
标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就
是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使
之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。
料间的相对水平。 3) 报告比较结果时必须说明所选用的“标准”和理由。 4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。
卫生统计学期末复习重点
![卫生统计学期末复习重点](https://img.taocdn.com/s3/m/afeb8f10cfc789eb162dc820.png)
《卫生统计学》期末复习提要一、期末考试有关问题的说明<一>出题的指导思想、原则及题目类型出题的指导思想是:全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。
出题的原则是:不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占80─90%,稍难或灵活的题目占10─20%。
凡自学的章节不考。
<二>答题要求选择题:要求选择无误,每题只选一个最佳答案。
计算分析题:要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。
二、期末复习范围和重点绪言<一>重点复习的名词:计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
总体(population):表示大同小异的对象(某个测量值)全体。
样本(sample):从研究总体中随机抽取的一部分有代表性的个体变异(variation):同一总体内的个体间存在差异。
抽样误差:消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。
概率: 某事件出现机会大小的量。
<二>重点复习的问题:1、根据计量、计数、等级资料的概念正确识别统计资料的类型。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data),等级资料又称有序变量。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。
2、统计工作的步骤及搜集资料的来源和要求。
1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。
卫生统计学期末复习重点
![卫生统计学期末复习重点](https://img.taocdn.com/s3/m/28ddc66ea5e9856a5712602e.png)
卫生统计学期末复习重点《卫生统计学》期末复习提要一、期末考试有关问题的说明<一>出题的指导思想、原则及题目类型出题的指导思想是:全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。
出题的原则是:不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占80─90%,稍难或灵活的题目占10─20%。
凡自学的章节不考。
<二>答题要求选择题:要求选择无误,每题只选一个最佳答案。
计算分析题:要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。
二、期末复习范围和重点绪言<一>重点复习的名词:计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
总体(population):表示大同小异的对象(某个测量值)全体。
样本(sample):从研究总体中随机抽取的一部分有代表性的个体变异(variation):同一总体内的个体间存在差异。
抽样误差:消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。
概率: 某事件出现机会大小的量。
<二>重点复习的问题:1、根据计量、计数、等级资料的概念正确识别统计资料的类型。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data),等级资料又称有序变量。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。
2、统计工作的步骤及搜集资料的来源和要求。
《卫生统计学》期末复习指导.doc
![《卫生统计学》期末复习指导.doc](https://img.taocdn.com/s3/m/ac8cf9f869dc5022aaea00bb.png)
《卫生统计学》期末复习指导一、期末考试有关问题的说明(一)出题的指导思想全面考核学生对本课程的基本概念、基木方法、基木技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。
出题难度适中但覆盖面较广,基木知识占85%左右。
(二)题目类型及答题要求名词解释:15分。
要求按统计术语准确叙述概念。
是非题:10分。
要求对题目的叙述判断正确与否,不说明理由。
填空题:25分。
要求按划线的根数准确填写内容,不得似是而非。
选择题:2()分。
要求选择无误,每题只选择一个最佳答案。
简答题:10-15分。
根据问题的不同提问方式回答问题。
一种是直接根据问题进行叙述;另一种是根据问题说明正确与否,若否,需说明错误所在及正确的解决方法。
注意答出要点及答题的逻辑性。
问答题:15・20分。
包括对资料的计算和进行分析。
计算要求写出完整的步骤(包括计算公式),对计算所得结果做出和应的分析结论。
二、期末复习范围和重点第一章绪论一、重点复习的内容名词:总体、样本、数值变量资料、分类变量资料、变异、抽样误差、概率问题:1. 正确识别统计资料的类型。
2. 统计工作的步骤。
3. 抽样研究的原因及目的,产生抽样误差的原因。
二、一般复习的内容名词:变量、抽样硏究、同质、频率、小概率事件问题:1. 学习卫生统计学的童义。
2. 卫生统计学包括的基本内容。
3. 卫生统计工作各个步骤的基本内容和关系。
三、习题(-)判断题1. 统计工作的步骤中,设计是最关键的一步,搜集资料是基础。
2. 抽样研究的目的是为了描述样本的分布特征。
3. 某医师用国产异搏定治疗心率失常的临床疗效观察,共治疗8例病人,其中4例冇效,故冇效率为50% o(二)选择题1. 对某地200名16岁中学生口腔检查,发现54人患有踊齿,该资料属于。
A.数值变量资料B.分类变量资料C.分类变量资料频数表D.数值变量资料频数表2. 欲研究某药治疗高血压病的疗效,临床观察了80名高血压病人的血压值,其研究的总体是OA.这80名高血压病患者B.所冇高血压病患者C.所有高血压病患者的血压值D.用该药治疗的所有高血压病患者的血压值(三)填空题1. 统计工作的基本步骤包括___________ 、_____________ 、____________ 、___________ 。
《实用卫生统计学》期末复习二
![《实用卫生统计学》期末复习二](https://img.taocdn.com/s3/m/1a12e632a8956bec0875e359.png)
《实用卫生统计学》期末复习二二、简答题1.卫生事业管理专业与卫生统计学的关系是什么。
卫生事业管理的研究对象也存在许多不确定性,因此,要利用卫生统计这个有效工具,充分发挥卫生统计的信息、咨询、监督的整体功能,为满足决策管理和卫生服务研究的需要。
2.总体和样本的关系是什么。
样本是从总体中随机抽取的一部分有代表性的个体组成,除了数量比总体少,其他构成均与总体一样,是总体具体而微的缩影。
3.收集资料时,对统计资料的要求是什么?要做到①资料必须完整、正确和及时;②要有足够的数量;③注意资料的代表性和可比性。
6.正态分布有哪些参数?为什么说正态分布是很重要的连续性分布?总体均数卢和总体标准差a被称为正态分布参数。
卢为位置参数,它描述了正态分布集中趋势的位置;a为变异度参数,反映正态分布的离散程度。
若已知某数值变量服从正态分布或近似正态分布,如同年龄、同性别儿童及同性别健康成人身高、体重等,可按正态分布的规律估计其个体变量值所在范围,如95%的医学参考值的估计。
同时正态分布是很多统计分析方法的基础。
4.标准正态曲线下横轴上下侧尾部面积为O.5 %、2.5%、5%时所对应的u值?标准正态曲线下横轴上下侧尾部面积的0.5%、2.5%、5%时所对应的u值分别为-2.58、-1.96、-1.64。
5.了解正态曲线下面积分布规律有何用处?根据正态曲线下面积的分布规律,可以估计观察值的频数分布情况,通常用于估计95%的观察值所在范围和99%的观察值所在范围,临床医学常用以估计医学参考值范围。
7.应用相对数时有哪些注意事项?(1)构成比与率是意义不同的两个统计指标,应用时不能相互混淆。
构成比说明事物内部各组成部分所占的比重,而率则说明某事物或现象的发生频率或强度,不能以构成比代替率来说明问题。
(2)样本含量太小时,不宜计算相对数,最好用绝对数来表示。
(3)对各组观察例数不等的几个率,不能直接相加求其总率。
(4)在比较相对数时应注意资料的可比性。
卫生统计学重点
![卫生统计学重点](https://img.taocdn.com/s3/m/dee80b31580216fc700afd70.png)
卫生统计学1.医学统计学:是运用概率论与数理统计的原理及方法,研究居民健康状况以及卫生服务领域中数字资料的搜集、整理分析与推断的一门学科。
2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。
3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
4.样本的特征:(1)代表性(2)随机性(3)可靠性(4)可比性(comparable)5.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。
6.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
7.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
8.减少抽样误差的方法:9.(1)改进抽样方法,增加样本的代表性。
(2)增加样本量n 。
(3)选择变异程度较小的研究指标。
10.统计工作的步骤:设计、收集资料、整理资料、分析资料。
11.发病率:表示一定时期内,在可能发生某病的一定人群中,新发生的某病的频率(强度)。
12. 患病率:又称为现患率,指某时点检查时可能发生某病的一定人群中现患某种疾病的频率。
患病率分为时点患病率(point prevalence rate)和期间患病率(period prevalence rate)。
13.治愈率(cure rate):表示受治病人中治愈的频率。
14.生存率(survival rate):指病人能活到某一时点的概率。
15.标准化率:标准化法就是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。
16.二项分布的图形特征(1)0.5时,图形是对称的,如图5-1。
(2)0.5愈远,对称性愈差,但随着n的增大,分布趋于对称。
当n太靠近0或1,当nP和n(1-P)都大于5时,二项分布近似于正态分布。
《实用卫生统计学》期末复习题及参考答案
![《实用卫生统计学》期末复习题及参考答案](https://img.taocdn.com/s3/m/b3d4f5df240c844769eaeebb.png)
《实用卫生统计学》期末复习题及参考答案《实用卫生统计学》期末复习题一一、名词解释1、卫生统计学:2、随机抽样:3、构成比:4、频率:5、非参数检验:6、概率7、变异系数名词解释答案1. 卫生统计学:是运用数理统计的基本原理和方法,通过数据的收集,整理和分析,研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。
2. 随机抽样:就是按照随机的原则获得样本,保证总体中每个个体都有同等机会被抽取,使样本对总体有较好的代表性。
3. 构成比:又称构成指标,它表示事物内部各组成部分所占比重或分布。
常用百分数表示。
4. 频率:若随机事件在n次重复中出现m次,则n/m比值成为随机事件出现的频率。
5.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。
6.概率是描述随机事件发生的可能性的大小的数值,常用P表示。
7.变异系数常记为CV,它被定义为标准差与算术均数之比。
《实用卫生统计学》期末复习题二单选题1.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种错误属于()。
A. 系统误差B. 随机测量误差C. 抽样误差D. 随机误差2.医学人口统计应属于卫生统计学中的哪部分内容( )。
A. 卫生统计学基本原理B. 卫生统计学基本方法C. 健康统计D.卫生服务统计3. 原始数据分布不明时,表示其集中趋势易采用( ) 。
A. 算数均数B. 几何均数C. 中位数D. 标准差4.描述一组偏态分布资料的变异度时,最适宜选择的指标是( ) 。
A.极差B.标准差C.四分位数间距D.变异系数5.下面哪一种图要求纵轴必需从0开始,中间不可以有折断( )。
A. 百分条图B. 直条图C.直方图D. 线图6.统计表中资料暂缺或未记录时,其空缺处通常用()表示。
A、—B、…C、0D、什么也不写7.表示均数抽样误差大小的统计指标是( )。
A 标准差B 均数标准误C 方差D 变异系数8.下面哪一个不是问卷的顺序()。
卫生统计学期末复习
![卫生统计学期末复习](https://img.taocdn.com/s3/m/ebe92de15acfa1c7ab00cc43.png)
第一章绪论统计学(statistics):就是收集数据、整理数据、分析数据,并由这些数据得到结论的原则和方法。
是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。
总体(population):根据研究目的确定的同质研究对象的全体。
样本(sample):是指从研究总体中抽取的一部分有代表性的个体,这些个体组成样本。
抽样(sampling):是从研究总体中抽取少量有代表性的个体。
同质(homogeneity):总体中的个体具有相同的性质,它是进行统计分析的前提。
变异(variation):因个体差异引起的现象。
同一总体中不同个体间存在的差异。
计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。
等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。
将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料。
统计量(statistic):在科研工作中,通过对样本中的观察单位的变量值进行统计分析所得到的统计指标。
参数(parameter):是反映总体特征的统计指标。
概率(probability):表示一个事件发生的可能性大小的数。
(概率的统计定义:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。
第二章定量资料的统计描述计量资料:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。
频数:对一个随机变量做出重复的观察,其中某变量值出现的次数。
频数表:当变量值个数较多时,对各变量值出现的频率列表即为频率分布表(frequency distribution table),简称频率表。
对称分布:频数集中位置在正中,左右两侧频数分布大体对称。
偏峰分布:集中位置偏向一侧,频数分布不对称。
(完整word版)医学统计学考试重点(人卫第七版)
![(完整word版)医学统计学考试重点(人卫第七版)](https://img.taocdn.com/s3/m/1e551f65680203d8cf2f249b.png)
1、同质:是指观察单位或观察指标受共同因素制约的部分2、观察单位:亦称个体,是统计研究中最基本的单位3、变异:在同质的基础上个体间的差距4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体无限总体:理论上其观察单位数是无法穷尽的6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合7、抽样:从总体中抽取部分个体的过程称为抽样8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被抽取到9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的10、参数:描述总体特征的量11、统计量:根据样本个体值计算得到的描述样本特征的量12、总体参数是常数,而样本统计量可随样本不同而不同13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差16、过失误差:指各种失误所导致的误差17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件18、概率:反映某一随机事件发生可能性大小的量,用符号P表示19、小概率事件:统计学上一般把P≤0。
05的事件称为小概率事件,表示某事件发生的可能性很小20、变量:观察单位的某个特征21、变量值:变量的观察结果或测定值22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料24、分类变量又称定性变量,其变量值是用定性方法测得的25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)25、医学统计工作的基本步骤:一、设计;二、收集资料;三、整理资料;四、分析资料26、统计表和统计图是描述统计资料的重要工具27、统计表的结构:①标题位于统计表的上中方②标目用来说明表内各纵横数字的含义,注意标明指标的单位。
卫生统计学综合复习汇总
![卫生统计学综合复习汇总](https://img.taocdn.com/s3/m/7355619acf84b9d529ea7a1a.png)
统计学复习基本概念部分 总体和样本 观察单位 随机样本和非随机样本的随机化 变量、随机变量;变量的类型 连续变量:有单位,理论上变量值可以充满区间。
分类变量:属性。
无序分类变量,虽可以用数值表示第几类,但数值无意义,只是代号。
有序分类变量,虽可以用数值量化,但数值的大小无意义,意义在于数值之间的间距 和顺序关系。
计数变量:特点是离散、有序。
实际频数分布 观察单位个数的分布。
连续变量要按变量值分组段, 计数变量要按观察时间单位、 分类变量要按类别总结观察单位的个数。
实际上,后面两种变量在只有一次抽样时无法完成实际频数分布的刻画。
数据的集中趋势和离散趋势集中趋势 连续变量对称分布:算术平均数(简称均数) 数。
分类变量:具有所关心特征(类别)的观察单位的个数(频数) 率、比。
计数变量:单位时间、单位面积内所关心事件的发生数。
求和问题。
离散趋势:衡量距集中趋势远近的程度连续变量对称分布:离均差平方和、方差、标准差。
连续变量非对称分布:百分位数 间距。
抽样变异和抽样分布 抽样变异:反复抽样后,每个样本都是不同的。
反复抽样指每次抽样的样本量相同。
抽样分布:反复抽样后,样本集中趋势的分布。
对于连续变量样本标准差当然也是有分 布的,但本处不考虑。
连续变量:样本均数的分布 — 按样本均数值分组段,总结各组段样本的个数。
分类变量:具有所关心特征(类别)的观察单位的个数(频数)的分布 — 按观察单位 的个数总结样本的个数。
计数变量: 单位时间、 单位面积内所关心事件的发生数的分布 — 按发生数总结样本的 个数。
抽样分布的集中趋势和离散趋势 连续变量:反复抽样样本均数的均数 — 集中趋势;反复抽样样本均数的标准差(标准 误) —离散趋势。
分类变量:反复抽样样本具有所关心特征(类别)的观察单位的个数(频数)的均数 —集中趋势;具有所关心特征(类别)的观察单位的个数(频数)的标准差(标准误)某些情况下可以按连续变量处理。
医学统计学期末考试重点
![医学统计学期末考试重点](https://img.taocdn.com/s3/m/a40b337c52ea551810a68782.png)
一、总体:是根据研究目的确定的同质观测单位的集合。
样本:是从统计总体中随机抽取的、具有代表性的部分观测单位的集合。
同质:即构成总体的各个观测单位在某一方面或几方面的性质相同或基本相同。
变异:是指在同质基础上各观测单位之间的差异。
离散型变量:指只能取可数的或有限个数的变量。
特点只是取顺序整数值连续性变量:指可以取各整数区间的一切实数值的变量。
特点是在两个连续的整数值之间还可以用小数或分数连接起来的非整数值。
二、统计的含义1.统计工作:指搜集、整理、分析和研究统计数据的工作,是统计数据与统计理论的基础和源泉。
2.统计数据:指统计工作研究的主体及成果。
3.统计学:是对研究对象的数据进行搜集、整理、分析和研究,以揭示其总体特征和规律性的方法论科学。
三、统计学的主要内容1.研究设计:是按照研究目的和统计学要求制定具有针对性、具体性、专业性的工作方案。
2.统计描述:用统计指标、统计图、统计表等方法描述样本资料的数据特征及其分布规律,是整个统计学的基础。
3.统计推断:用样本信息推论总体特征的归纳过程,它有两个重要领域。
四、误差及其分类误差指实际观测值与真值之差或样本指标与总体指标之差。
误差分为非随机误差和随机误差,非随机误差:粗差-粗心大意,无规律性,可以避免;系统误差-仪器、方法、等条件的差异,感官、理论和实验方法的差异。
随机误差:测量误差-由一系列实验或观测条件的随机波动造成的实测值与真值之差;抽样误差-随机抽样引起的统计量与参数之间的差异。
五、统计工作的基本步骤研究设计、搜集资料、整理资料、分析资料中医统计资料的搜集与整理一、中医统计资料的类型1.计量资料:是由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所得资料,变量值大多有度量衡单位;2.计数资料:是由分类变量产生的资料,即对每个观察单位按某种属性分组计数得到的资料,变量值变现为互不相容的属性或类别,无度量衡单位。
统计描述一、频数分布:是指观测值按大小分组,各个组段内观测值个数的分布,它是了解数据分布形态特征与规律的基础。
《卫生统计学》考试重点复习资料
![《卫生统计学》考试重点复习资料](https://img.taocdn.com/s3/m/7b383fd8168884868762d6c7.png)
《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
卫生统计学期末复习重点Revised as of 23 November 2020《卫生统计学》期末复习提要一、期末考试有关问题的说明<一>出题的指导思想、原则及题目类型出题的指导思想是:全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。
出题的原则是:不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占80─90%,稍难或灵活的题目占10─20%。
凡自学的章节不考。
<二>答题要求选择题:要求选择无误,每题只选一个最佳答案。
计算分析题:要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。
二、期末复习范围和重点绪言<一>重点复习的名词:计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
总体(population):表示大同小异的对象(某个测量值)全体。
样本(sample):从研究总体中随机抽取的一部分有代表性的个体变异(variation):同一总体内的个体间存在差异。
抽样误差:消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。
概率: 某事件出现机会大小的量。
<二>重点复习的问题:1、根据计量、计数、等级资料的概念正确识别统计资料的类型。
等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data),等级资料又称有序变量。
等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。
等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。
2、统计工作的步骤及搜集资料的来源和要求。
1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。
设计是整个研究中最关键的一环,是今后工作应遵循的依据。
2.收集资料:应采取措施使能取得准确可靠的原始数据。
3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。
4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。
分析资料包括统计描述和统计推断。
3、抽样研究的原因及目的,产生抽样误差的原因。
<三>一般复习的名词:同质:一些个体处于同一总体么就是指他们大同小异,具有同质性。
参数::参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
随机化抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
样本含量:<四>一般复习的问题:1、卫生统计学的内容及学习卫生统计学的意义。
2、统计工作各个步骤的基本内容和关系。
集中趋势与离散趋势<一>重点复习的名词:频数分布表:当变量值个数较多时,对各变量值出现的频率列表即为频率分布表(frequency distribution table)。
中位数(median ,M):将原始观察值从小到大或者从大到小排序后,位次居中的那个数。
<二>重点复习的问题:1、对频数分布特征的描述。
频数分布分为集中趋势(central tendency)和离散趋势(tendency of dispersion)。
常用描述定量变量集中趋势的统计指标包括算数均数、几何均数、中位数。
算数均数适用于对称分布,特别是正态分布的资料;几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分布资料,常用于描述偏峰分布的资料。
常用的描述定量变量离散趋势的统计指标包括极差、四分位数间距、方差、标准差和变异系数。
极差只利用最大值和最小值的信息,易受样本含量的影响,很不稳定;四分位数间距适用于各种分布资料;方差和标准差适用于对称分布,特别是正态分布的资料;变异系数常用于量纲不同时,或均数相差较大时变量间变异程度的比较。
实际应用中,常将算数均数和标准差结合对正态分布资料进行统计描述;常将中位数和四分位数间距结合对偏峰分布资料进行统计描述。
2、平均指标:算术均数、几何均数、中位数的意义及应用条件,算术均数的计算。
3、变异指标:全距、标准差、变异系数的意义及应用条件,标准差和变异系数的计算。
4、正态分布的两个参数及正态曲线下面积的分布规律。
正态分布的特征:服从正态分布的变量的频数分布由μ、σ完全决定。
(1) μ是正态分布的位置参数,描述正态分布的集中趋势位置。
正态分布以x = μ为对称轴,左右完全对称。
正态分布的均数、中位数、众数相同,均等于μ。
(2) σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。
σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。
正态曲线下面积的分布规律:如果用其标准差作为衡量单位,则以均数为中心,正负1个标准差内,即(μ-σ,μ+σ)区间内,正态分布曲线下的面积为总面积的%;正负2个标准差内,即(μ-2σ,μ+2σ)区间内,面积为%;正负3个标准差,即(μ-3σ,μ+3σ)区间内,面积为%。
这是由正态分布的性质所决定的。
<三>一般复习的问题:1、除<二>4外,正态分布的其余特点。
2、u变换的形式和作用。
3、查阅标准正态曲线下面积表的方法。
均数的抽样误差及标准误<一>重点复习的名词:均数的抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。
标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
总体均数的可信区间:用统计量 X 和Sx确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。
<二>重点复习的问题:1、标准误的意义、计算及应用。
标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
⏹ 标准误的计算公式:⏹ 在实际应用中可通过增加样本含量n 来减小样本均数的标准误,从而降低抽样误差。
对于任意分布,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,均数的标准误由公式 ⏹ 计算。
2、 标准差与标准误的区别与联系。
样本均数标准误的大小与标准差成正比,与样本含量n 的平方根成反比,即在同一总体中随机抽样,样本含量n 越大,抽样误差越小。
3、 总体均数可信区间的意义和计算。
根据总体标准差 是否已知及样本含量n 的大小,总体均数置信区间的计算有t 分布和Z 分布(标准正态分布)两种方法。
1. t 分布方法 当总体标准差未知时,正态总体N (, 2)的样本均数的t 变换结果服从 t 分布,若“砍去”t 分布双侧尾部面积 = = 5%,故有95%的t 值满足不等式:2, < < 2, 2, < < + 2, :( 2, , + 2, )总体均数 的(1- ) 可信区间置信区间的一般计算式为 t /2, 均数的单侧置信区间为 > t /2, 或 < + t /2,2正态分布近似方法 (1)当总体标准差 已知时,总体均数的双侧置信区间为Z /2(2)当 未知但n 足够大时(n 50),t 分布的极限分布是标准正态分布,可用z /2代替公式(5-9)中的t /2, ,则总体均数的双侧置信区间为 Z /2同理, 与(5-8)和(5-9)式相对应, 单侧置信区间则为 z 或 z + z 或 + z Xs =X s X X s X X X s X s X Xs X X s X X s X X σX X s X X X X X σX σXs X s1、抽样误差的规律。
2、提高对总体均数可信区间估计精度的办法。
均数的假设检验<一>重点复习的名词:检验假设H0:零假设(null hypothesis),又称原假设。
检验水准α:根据问题的背景,规定一个“小”的概率α,若P值小于α,就认为“P值较小”,若P值不小于α,就认为“P值较大”。
通常取α=或以保证犯假阳性错误的概率不超过或。
这个α称为检验水准。
假设检验中的P值:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。
可比性:第Ⅰ类错误和第Ⅱ类错误::假阳性错误称为第I 类错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用a 表示;假阴性错误称为第II 类错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用b 表示。
<二>重点复习的问题:1、t值;t分布与标准正态分布的关系。
2、假设检验的基本思想和步骤。
基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。
步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P 值并作出推断结论。
3、样本均数与总体均数比较的t检验。
4、两大样本均数比较的u检验。
5、配对设计三种形式的特点及t检验的H。
、H1。
配对设计三种形式的特点:1)异体配对:两个受试对象。
2)自身配对:同一受试对象的两个部位分别接受两种处理。
3)统一受试对象接受某种处理之前和之后的数据,也可以视为自身配对。
6、假设检验时需注意的问题。
(重点是可比性和犯第Ⅰ类及第Ⅱ类错误的含义与概率) 可比性:I 类错误: H0为真(实际无差别),假设检验结果拒绝H,接受H1(推论有差别)所犯的错误称为I 类错误(type I error),I 类错误的概率记作a 。
II 类错误: H1为真(实际有差别),假设检验结果拒绝H 1 ,接受H(推论无差别)所犯的错误称为II 类错误(type II error),II 类错误的概率记作β。
1- β称为检验效能,过去称把握度(power of test ),即两总体确有差别,按a水准能发现该差别的能力。
<三>一般复习的名词:自由度、假设检验。