《卫生统计学》考试重点复习资料

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

卫生统计学Statistics

第一章绪论

统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。

总体:根据研究目的确定的同质(大同小异)的观察单位的全体。分为目标总体和研究总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。

抽样:从研究总体中抽取少量有代表性的个体。

变量:表现出个体变异性的任何特征或属性。分定型变量和定量变量。

定型变量:1)分类变量或名义变量:最简单的是二分类变量。0-1变量也常称为假变量或哑变量。2)有序变量或等级变量。

定量变量:分离散型变量和连续型变量。

变量只能由高级向低级转化:定量→有序→分类→二值。

常见的三种资料类型

1)计量或测量或数值资料,如身高、体重等。

2)计数资料或分类资料,如性别、血型等。

3)等级资料,如尿蛋白含量-、+、++、+++、…

第一章定量变量的统计描述

此章节x即为样本均数(X拔)

1.离散型定量变量的取值是不连续的。累计频数为该组及前面各组的频数之和。累计频率表示各组累计频数在总例数中所占的比例。可用直条图表达。

2.编制频数表的步骤与要点

步骤:1确定极差2确定组数3确定各组段的上下限4列表

要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。

3.频率分布表(图)的用途

1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。

4.描述平均水平的统计指标

算术均数(mean):描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示。适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。分:直接法和频率表法。即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。 X0k=(第k组段上限+第k组段下限)/2

几何均数(G):适用于原始观察值分布不对称,但经对数转换后呈对称分布的变量。,如正态分布或数据呈倍数变化的资料。公式:直接法和频率表法。

中位数(M):将原始观察值按由小到大顺序排列后,位次居中的那个数值,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的和的平均值。适用于各种分布的变量,尤其是偏锋分布的变量。

众数(mode):总体中出现机会最高的数值。样本众数是指在样本中出现次数最多的数值。

5.描述变异程度的统计指标

极差(R):亦称全距,即最大值与最小值之差。用于资料的粗略分析,其计算简便但稳定性较差。样本量接近时,极差越大数据越离散。

四分位数间距(Q):是上四分位数P75和下分位数P25之差。常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。同类资料比较,Q越大数据间变异越大,适用于各种分布资料,特别服从偏锋分布的变量。

方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。反应每个观察值的离散程度。总体方差用σ2表示,样本方差用S2表示。

标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。标准差越大意味着观察值的离散程度越大,或者变异度越大。总体标准差用σ表示,样本用S表示。

变异系数(CV):用于观察指标单位不同或均数相差较大时两组资料变异程度的比较,尤其是量纲不同的变量间比较。意义为变异的大小(S)相对于其平均水平的百分比。没有单位,消除了量纲影响。越大表示相对于均数而

言,变异程度越大。

6.描述分布形态的统计指标

偏度系数(SKEW ):为0时,分布对称;取正值,正偏锋;取负值,负偏锋。

峰度系数(KURT ):正态分布的总峰度系数为0;取负值时较正态分布的峰平阔低矮,取正值时较正态分布的峰尖俏高耸。

第三章 定性资料的统计描述

相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、比等。

标准化法:是常用于内部构成不同的两个或多个率比较的一种方法。标准化法的基本思想就是指定一个统一“标准”(标准人口构成比或标准人口数),按指定“标准”计算调整率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。

问答题

常用的相对数指标有哪些?它们的意义和计算上有何不同?

答:常用的相对数指标有:率、构成比和相对比。意义和计算公式如下:

率又称频率指标,说明某现象发生的频率或强度,常以100%、1000‰等表示。

②构成比又称构成指标,说明某一事物内部各组成部分所占的比重或分布。常以百分数表示。

③比又称相对比,是A 、B 两个有关指标之比,说明两者的对比水平,常以倍数或百分数表示,其公式为:相对比=甲指标 / 乙指标(或100%)

甲乙两个指标可以是绝对数、相对数或平均数等。

应用相对数时应注意哪些问题?

答:应用相对数时应注意的问题有:

⑴ 计算相对数的分母一般不宜过小。

⑵ 分析时不能以构成比代替率。

⑶ 不能用构成比的动态分析代替率的动态分析。

⑷ 对观察单位数不等的几个率,不能直接相加求其总率。

⑸ 在比较相对数时应注意可比性。

⑹ 对样本率(或构成比)的比较应随机抽样,并做假设检验。

应用标准化法的注意事项有哪些?

答:应用标准化法时应注意的问题有:

1) 标准化法的应用范围很广,其主要目的就是消除混杂因素的影响。

2) 标准化后的标准化率,已经不再反反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。

3) 报告比较结果时必须说明所选用的“标准”和理由。

4) 两样本标准化率是样本值,存在抽样误差。当样本含量较小时,还应作假设检验。

第一章

统计表和统计图

名词解释

统计表:将统计资料及其指标以表格形式列出,称为统计表(statistical table )。狭义的统计表只表示统计指标。 统计图:统计图(statistical graph)是将统计指标用几何图形表达,即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。

问答题

常用统计图的定义和制图要求。

名 称 定 义 制 图 要 求

条 图 用等宽直条的长短来表示相互独立的各统计指标的数值大小

起点为0的等宽直条,条间距相等,按高低顺序排列。 普通线图

适用于连续性资料。用线段的升降来表示一事物随另一事物变化的趋势。 纵横两轴均为算术尺度,相邻两点应以折线相连。图内线条不宜超过3条。 半对数线用线段的升降来表示一事物随另横轴为算术尺度,纵轴为对数尺度。余同普%100⨯=单位总数可能发生某现象的观察数发生某现象的观察单位率%100⨯=观察单位总数同一事物各组成部分的位数某一组成部分的观察单构成比

相关文档
最新文档