卫生统计学最好的复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释
1. 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的
资料称为计量资料(measurement data )。计量资料亦称定量资料、测量
资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。
2. 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计
数资料(count data )。计数资料亦称定性资料或分类资料。其观察值是
定性的,表现为互不相容的类别或属性。
3. 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组
的观察单位数,称为等级资料(ordinal data )。等级资料又称有序变量。
4. 总体:总体(population )指特定研究对象中所有观察单位的测量值。
5. 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本
(sample )。
6. 抽样误差:抽样误差(sampling error )是指样本统计量与总体参数的差
别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数
附近波动的随机变量。
7. 频数表:用来表示一批数据各观察值在不同取值区间出现的频繁程度(频
数)。
8. 算术均数:描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。
9. 中位数:将一组观察值由小到大排列,位次居中的那个数。
10. 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算
简便但稳定性较差。
11. 方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个
数得到。
12. 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态
分布的资料,大样本、小样本均可,最为常用。
13. 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的
比较。
14. 正态分布:若资料X 的频率曲线对应于数学上的正态曲线,则称该资料服
从正态分布。通常用记号),(2σμN 表示均数为μ,标准差为σ的正态分布。
15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,
通常记为2(0,1)N 。
16. 统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信
息的过程称为统计推断。
17. 抽样误差:由个体变异产生的,由于抽样造成的样本统计量与总体参数的
差异,称为抽样误差。
18. 标准误:通常将样本统计量的标准差称为标准误。
19. 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
20. 参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计
和区间估计。
21. 假设检验中P 的含义:指从H 0规定的总体随机抽得等于及大于(或等于及
小于)现有样本获得的检验统计量值的概率。
22. I 型和II 型错误:I 型错误指拒绝了实际上成立的H 0,这类“弃真”的错
误称为I 型错误,其概率大小用α表示;II 型错误,指接受了实际上不成
立的H 0,这类“存伪”的错误称为II 型错误,其概率大小用β表示。
23. 检验效能:1-β称为检验效能,它是指当两总体确有差别,按规定的检验
水准α所能发现该差异的能力。
24. 检验水准:是预先规定的,当假设检验结果拒绝H 0,接受H 1,下“有差别”
的结论时犯错误的概率称为检验水准,记为α。
25. 方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总
的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每
个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。
通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推
断,判断各因素对观测指标有无影响。
26. 随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各
区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平数
相等。然后再将每个区组内的观察对象随机地分配到各处理组,这种设计
叫做随机区组设计。
27. 相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,
常用相对数有率、构成比、相对比。
28. 标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。标准
化法的基本思想就是选定一个统一“标准”(标准人口构成比或标准人口
数),然后按选定“标准”计算调整率,使之具备可比性以后再比较,以
消除由于内部构成不同对总率比较带来的影响。
29. 二项分布:若一个随机变量X ,它的可能取值是0,1,…,n ,且相应的取值
概率为k n k n k k X P --==)
1()()(ππ, 则称此随机变量X 服从以n 、π为参数的二项分布。
30. Yates 校正:英国统计学家Yates F 认为,由于2χ分布理论上是一连续性
分布,而分类资料是间断性的,由此计算出的2χ值不连续,尤其是自由
度为1的四格表,求出的概率P 值可能偏小,此时需对2χ值作连续性校
正(correction of continuity ),这一校正即所谓的Yates 校正(Yates ’
correction )。
31. 非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资
料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型
的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方
法。由于这类方法不受总体参数的限制,故称非参数统计法
(non-parametric statistics ),或称为不拘分布(distribution-free
statistics )的统计分析方法,又称为无分布型式假定(assumption free