《卫生统计学》课程复习资料

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

《卫生统计学》课程复习资料

一、名词解释

1.计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料。计量资料亦称定量资料、测量资料。其变量值是定量的，表现为数值大小，一般有度量衡单位。

2.计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。

3.等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料。等级资料又称有序变量。

4.总体：总体指特定研究对象中所有观察单位的测量值。

5.样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample ）。

6.变异：同质个体间研究因素的差异。

7.频数表：用来表示一批数据各观察值在不同取值区间出现的频繁程度（频数）。

8.算术均数：描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。 9.中位数：将一组观察值由小到大排列，位次居中的那个数。

10.极差：亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。 11.方差：方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。

12.标准差：是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大样本、小样本均可，最为常用。

13.变异系数：用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

14.正态分布：若资料X 的频率曲线对应于数学上的正态曲线，则称该资料服从正态分布。通常用记号

),(2σμN 表示均数为μ，标准差为σ的正态分布。

15.标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布，通常记为2

(0,1)N 。 16．统计推断：通过样本指标来说明总体特征，这种通过样本获取有关总体信息的过程称为统计推断。 17.抽样误差：由个体变异产生的，由于抽样造成的样本统计量与总体参数的差异，称为抽样误差。 18.标准误：通常将样本统计量的标准差称为标准误。

19.可信区间：按预先给定的概率确定的包含未知总体参数的可能围。

20.参数估计：指用样本统计量估计总体参数。参数估计有两种方法：点估计和区间估计。

21.假设检验中P 的含义：指从H 0规定的总体随机抽得等于及大于（或等于及小于）现有样本获得的检验统计量值的概率。

22.I 型和II 型错误：I 型错误指拒绝了实际上成立的H 0，这类“弃真”的错误称为I 型错误，其概率大小用α表示；II 型错误，指接受了实际上不成立的H 0，这类“存伪”的错误称为II 型错误，其概率大小用β表示。

23.检验效能：1-β称为检验效能，它是指当两总体确有差别，按规定的检验水准α所能发现该差异的能力。 24.检验水准：是预先规定的，当假设检验结果拒绝H 0，接受H 1，下“有差别”的结论时犯错误的概率称为检验水准，记为α。

25.方差分析：就是根据资料的设计类型，即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分，除随机误差外，其余每个部分的变异可由某个因素的作用（或某几个因素的交互作用）加以解释。通过各变异来源的均方与误差均方比值的大小，借助F 分布作出统计推断，判断各因素对观测指标有无影响。

26.随机区组设计：事先将全部受试对象按自然属性分为若干区组，原则是各区组的受试对象的特征相同或相近，且受试对象数与处理因素的水平数相等。然后再将每个区组的观察对象随机地分配到各处理组，这种设计叫做随机区组设计。

27.相对数：是两个有联系的指标之比，是分类变量常用的描述性统计指标，常用相对数有率、构成比、相对比。

28.标准化法：是常用于部构成不同的两个或多个总率比较的一种方法。标准化法的基本思想就是选定一个统一“标准”（标准人口构成比或标准人口数），然后按选定“标准”计算调整率，使之具备可比性以后再比较，

以消除由于部构成不同对总率比较带来的影响。

29.构成比（proportion ）：表示事物部某一部分的个体数与该事物各部分个体数的总和之比，用来说明各构成部分在总体中所占的比重或分布。常以100%为比例基数。计算公式为

100%=

⨯某一组成部分的观察单位数

构成比

同一事物各组成部分的观察单位总数

30.Yates 校正：英国统计学家Yates F 认为，由于2χ分布理论上是一连续性分布，而分类资料是间断性的，由此计算出的2χ值不连续，尤其是自由度为1的四格表，求出的概率P 值可能偏小，此时需对2χ值作连续性校正（correction of continuity ），这一校正即所谓的Yates 校正（Yates’ correction）。

31.非参数统计：针对某些资料的总体分布难以用某种函数式来表达，或者资料的总体分布的函数式是未知的，只知道总体分布是连续型的或离散型的，用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制，故称非参数统计法（non-parametric statistics ），或称为不拘分布（distribution-free statistics ）的统计分析方法，又称为无分布型式假定（assumption free statistics ）的统计分析方法。

32.直线回归：建立一个描述应变量依自变量变化而变化的直线方程，并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种，故又称简单回归。

33.相关系数：又称积差相关系数，以符号r 表示样本相关系数，ρ表示总体相关系数。它是说明具有直线关系的两个变量间，相关关系的密切程度与相关方向的指标。

34.统计图：是将统计指标用几何图形表达，即以点的位置、线段的升降、直条的长短或面积的大小等形式直观的表示事物间的数量关系。

35.回归系数b ：是直线的斜率（slope ），其统计意义是当X 变化一个单位时Y 的平均改变的估计值。0b >时直线从左下方走向右上方，Y 随X 的增大而增大；0b <时直线从左上方走向右下方，Y 随X 的增大而减小；

0b =时直线与X 轴平行，Y 与X 无直线关系。b 的计算公式为

2

()()

()XY XX X X Y Y l b l X X --==

-∑∑

二、单项选择题

1.观察单位为研究中的( D )。

A.样本

B.全部对象

C.影响因素

D.个体 2.总体是由（ C ）。

A.个体组成

B.研究对象组成

C.同质个体组成

D.研究指标组成 3.抽样的目的是（ B ）。

A.研究样本统计量

B.由样本统计量推断总体参数

C.研究典型案例研究误差

D.研究总体统计量 4.参数是指（ B ）。

A.参与个体数

B.总体的统计指标

C.样本的统计指标

D.样本的总和 5.关于随机抽样，下列那一项说法是正确的（ A ）。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体，以使样本更能代表总体

C.随机抽样即随意抽取个体

D.为确保样本具有更好的代表性，样本量应越大越好 6.各观察值均加（或减）同一数后（ B ）。

A.均数不变，标准差改变

B.均数改变，标准差不变

C.两者均不变

D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用（ A ）。

A.变异系数

B.方差

C.极差

D.标准差 8.以下指标中（）可用来描述计量资料的离散程度。( D )

A.算术均数

B.几何均数

C.中位数

D.标准差