【孙振球第三版】医学统计学复习重点(第一至第十章)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释:
1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。检验水平,就是预先规定的允许犯I型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。
14、率:强度相对数,说明某现象发生的频率或强度。
15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。
16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。
17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。
18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。
19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。
20、相关系数:又称Pearson积差相关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。
21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。
22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。
23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。
24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。
26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。
27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。
28、样本含量:样本中包含观察单位数称为该样本的样本含量。
29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,成为变量。
30、变量值:对变量的观测值称为变量值或观察值。
31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差②非系统误差。32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。
33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。
34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。
35、概率:概率是描述随机事件发生可能性大小的一个度量。
36、医学参考值:是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故医学参考值范围作为判定正常和异常的参考标准。
37、正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。
38、偏态分布:指集中位置偏向一侧,频数分布不对称。(1)正偏态分布:集中位置偏向数值小的一侧。(2)负偏态分布:集中位置偏向数值大的一侧。
39抽样:在医学研究中,为节省人力、物力、财礼和时间,一般都采取从总体中抽取样本,根据样本信息来推断总体特征的方法,即抽样研究的方法来实现,这种从总体种随机抽取部分观察单位的过程称为抽样。为保证样本的代表性,抽样时必须遵循随机化原则。
二、填空题
1、医学统计工作的基本步骤:设计、搜集资料、整理资料、分析资料。
2、医学统计资料的主要来源的四个方面:统计报表、经常性工作记录、专题调查、统计年鉴和数据库专集。
3、正态分布的规律的应用:估计频数分布情况、质量控制、统计处理方法的理论基础、估计医学参考值范围。
4、计量资料统计描述的方法:频数分布表、频数分布图、统计指标。
5、CV(变异系数):常用于度衡量单位不同和均数相悬殊的多组资料变异度的比较。
6、统计推断是从总体中随机抽样本,由样本信息推断总体特征的过程,包括参数估计和假设检验两方面内容。参数估计包括点估计和区间估计。
7、可信区见估计的优劣取决于两要素:(1)可信度1-α(准确度),即区间包含总体均数µ的理论概率大小,可信度愈接近1愈好。(2)区间宽度β(精密度),即区间的长度,区间愈窄愈好。
8、变量变换的方法有:对数变换、平方跟变换、倒数变换、平方根反正弦变换。
9、常用的相对数:率、构成比、相对比。
10、动态数列常用指标有:绝对增长量、发展速度与增长速度、平均发展速度、平均增长速度。
11、二项式分布的参数是n和π。n,n次独立重复实验数目;π,每次实验的“阳性”概率。
12、二项式分布在n很大,而π很小,且nπ=λ为常数时,二项式分布近似Poisson分布。
13、总体均数λ与总体方差σ2相等是Poisson分布的重要特征。
14、Poisson分布具备可加性。
15、当λ(总体率)增大时,Poisson分布渐近正态分布。16、四格表中四格子基本数值为两对实测的实际频数和理论频数。
17、R*C表的卡方检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表,当等级数大于3时,如检验各处理组各等级下的构成比有无差别时采用Χ2检验,如检验各处理组各等级下的程度上有无差别时采用非参数检验。
18、配对比较秩和检验,以正秩或负秩的和(T)为检验统计量,其中T越小则P的值小于相应的检验水平。
19、正态分布的两个参数µ和σ2,前者决定分布的位置,后者决定分布的形态(形状、变异度)。
20、四格表Χ2的校正条件为n≥40而且1<T<5。
21、R*C表资料Χ2检验,如果有T<1,应该采取的措施有:(1)增加样本含量,使理论频数增大;(2)根据专业知识考虑能否删除理论频数太小的行或列,能否将理论频数太小的行或列与性质相近的行或列合并。(3)改用双向无序R*C表资料的Fisher确切概率法。
22、Poisson分布中,总体的方差与均数的关系是λ=σ2,当均数较大时,Poisson分布趋近于正态分布。
23、要分析某个资料是否属于二项分布,可用频数分布的拟合优度的Χ2检验。
24、r是相关系数,表示具有直线关系的两变量间相关密切程度和相关方向。
25、变异系数的应用条件是均数相差较大、观察指标单位不同。
26、Χ2表示理论频数与实际频数的符合程度。
27、常用相对数的指标有强度相对数字(率)、结构相对数(构成比)、相对比(比)。
28、常用的描述构成比的统计图有圆图和百分比条图。
29、方差分析的应用条件为相互独立的随机样本、来自正态总体、方差齐性。
30、实验设计的基本原则随即机原则、对照原则、重复原则。
31、常用的几种统计图有直条图、圆图和百分比条图、线图、直方图、统计地图、其它特殊分析图。
32、写出四种变量变换的方法:倒数变换、平方根变换、平方反正弦变换、对数变换。
33、在F检验中如有各比较组方差不齐时应用变量变换、近似t 检验、Wilcoxon秩和检验的方法。
34、四格表资料Χ2适用条件:(1)n≥40且T≥5时用Χ2检验的基本公式,当P≈α时,改用四格资料表的Fisher的确切概率法;(2)n≥40且1<T<5时用,用四格资料表Χ2检验的校正公式,或改用四格资料表的Fisher的确切概率法;(3)n<40,或T<1时,改用四格资料表的Fisher的确切概率法。
35、当总体率λ很小时,当n很大时,二项分布可用泊松分布来近似。
36、率的标准化的计算方法有直接标准化方法和间接标准化方法。
37、Χ2检验的用途:(1)推断两个总体率或构成比之间有无差别;(2)多个总体率或构成比之间有无差别;(3)两分类变量间有无