医学统计学名词解释名解复习资料

合集下载

医学统计学名解

医学统计学名解

医学统计学名解一.名词解释1.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

2..统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。

3.参数估计:指用样本指标值(统计量)估计总体指标值(参数)。

参数估计有两种方法:点估计和区间估计。

4.假设检验:亦称显著性检验,是用来判断样本与样本,样本与的总体之间的差异是由抽样误差引起还是本质差别造成的统计推断方法。

5.同质与变异:同质是指所研究的观察对象具有某些相同的性质或特征。

变异是同质个体的某项指标之间的差异,即个体变异或个体差异性。

6.总体与样本:总体是根据研究目的确定的同质的研究对象的全体(或全部同质观察单位)。

从总体中随机抽取的部分研究对象称为样本。

7.抽样研究与抽样误差:通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体特征的研究方法称为抽样研究。

由随机抽样造成的样本指标与总体指标之间、样本与样本指标之间的差异称为抽样误差。

8.参数与统计量:反映总体特征的指标称为参数,确定的研究总体的参数是常数。

而通过样本资料计算出来的相应指标称为统计量。

9.概率:随机事件发生可能性大小的数值度量。

10.计量资料:(或定量资料)计量指标也称数值变量或定量变量。

计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

一般具有度量衡单位,如身高(cm)、体重(kg)等。

11.计数资料;(或定性资料,或分类资料)把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。

一般无度量衡单位,如性别、职业、血型等。

12.等级资料:把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。

各属性之间有程度的差别,互不相容。

14.正态分布和正态曲线:又称高斯分布,频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布。

医学统计学名词解释

医学统计学名词解释

医学统计学名词解释总体:根据研究目的确定的同质的全部研究单位的观测值,即某个随机变量X可取值的全体。

样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。

变量:观察对象个体的特征或测量的结果。

由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。

统计量:由样本所算出的统计指标或特征值。

分层抽样:先按对主要研究指标影响较大的某种特征,将总体分为若干类别再从每一层随机抽取一定数量的观察单位,合起来组成样本。

随机抽样:总体中的每一个观察单位都有同等机会进入样本。

整群抽样:是以个体自然集结的或人为划分的群体作为抽样单元,总体中含有K个群,从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体构成调查样本。

系统抽样:又称为等间隔抽样或机械抽样。

首先必须确定总体的范围和样本例数n,将总体等分为n份,每一份k个个体,再从第一份中随机抽取第r号个体,然后依次等间隔地从每份中均抽第r个观察单位组成样本。

抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以及样本统计量和总体参数之间的差异。

(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)标准差:是描述个体值变异程度的指标,为方差的算术平方根。

标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。

系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。

标准化法:采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,称为标准化法。

调整后的率未标准化率,简称标化率,亦称调整率。

Ⅰ类错误:拒绝了实际上成立的HO,这类弃真的错误称为Ⅰ类错误。

Ⅱ类错误:指接受了实际上不成立的HO,这类存伪的错误称为Ⅱ类错误。

参数:反应总体统计学特征的数字。

计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。

医学统计学考试必会名词解释

医学统计学考试必会名词解释

,更确切地说,就是同质的所有观察单位某种观察值(变量值)的集合。

,观察单位数无限。

,其实测值的集合。

样本应具有代表性。

研究者则应对每个观察单位的某项特征进行测量与观察,这种特征称为变量。

,亦称为资料。

,可以控制的主要因素尽可能相同。

,就是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料,一般用度量衡单位。

,就是先将观察对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料。

,常用P表示。

(用希腊字母代表),如总体均数μ,总体率л,总体标准差σ等。

,称为统计量。

(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。

(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素就是测量仪器或方法的灵敏度。

,表示观察值在各组内出现的频繁程。

,即为频数分布表,简称频数表。

,左右两侧的频数基本对称。

,集中位置偏向一侧。

若集中位置偏向数值小的一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),,在医学领域中常用的平均数有算术均数、几何均数及中位数。

,描述一组同质计量资料的平均水平。

统计学中常用希腊字母μ表示总体均数,用x表演示样本均数。

,但经过对数变换后呈正态分布或近似正态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描,即全部观察值中最大值与最小值之差,用符号R表示。

极差大,说明变异程度大;反之,说明变异程度小。

x百分位置上的数值,用符号表示为P x。

简记为CV),亦称离散系数,为标准差与均数之比。

写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2),也称正常值。

,生物医学数据并非常数,而就是在一定范围内波动。

,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。

样本均数的标准差称为标准误 ,其计算公式为。

,就是统计推断的一个重要方面。

,称为点值估计。

,指按预先给定的概率估计未知总体均数的可能范围。

,用α表示,就是预先规定的概率值,在实际工作中一般取α=0、05。

医学统计学名词解释及问答题汇编

医学统计学名词解释及问答题汇编

1、总体(population):是根据研究目的确定的同质研究对象的全体。

2、样本(sample):从总体中抽取的一部分有代表性的个体。

3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。

4、变异(variation):指同质个体的某项指标之间的差异。

5、参数(parameter):反映总体特征的指标称为参数。

6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。

7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

8、概率(probability):某事件发生的可能性大小。

9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。

10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。

11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。

12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。

13、方差(variance):是各个数据与平均数之差的平方的平均数。

14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。

15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。

16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。

17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。

医学统计学 名词解释

医学统计学 名词解释

29、统计表:是以表格的形式列出统计分析的事物及其指标,它可避免长篇文字叙述,并具体列出数据。
30、统计图:是用点的位置、线段的升降、直条的长短或面积的大小等形式表达统计资料,它可直观醒目地反映出事物间的数量关系。
31、正态分布:靠近均数分布的频数最多,两边频数逐渐减少并且近似对称,这种两头低中间高、略呈钟形、左右近似对称的连续性分布称为~。
4、分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料 称之为~,无固有度量单位。
5、有序分类/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、同质:是指事物的性标准差:方差是指样本观察值的离均差平方和的均值,方差的正平方根为标准差,表示一组数据的平均偏离程度。
24、变异系数:是指标准差与均数之比,常用百分数表示,没有单位,主要用于度量衡单位不同或均数相差悬殊的几组资料间的比较。
25、相对比:是指A、B两个有联系的指标之比,用于说明A为B的若干倍或百分之几,是对比的最简单形式。
20、平均数:是反应一组观察值的集中趋势、中心位置或平均水平的指标体系,常用的指标有均数、几何均数、中位数。
21、中位数:是将一组观察值从小到大按顺序排列,位次居中的观察值就是中位数,适用于任何分布、开口资料、偏态分布。
22、百分位数:是指一种位置指标,用Px表示,一个百分位数将按大小顺序排列的变量值分为100份,旦论上有x%的变量值比它小,有(100-x)%的变量值比它大,对应x%位次的数值。
7、变异:是指同质的个体之间的差异。
8、总体:是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)

医学统计学复习资料(名解+简答)一、名词解释1.统计量 (statistic):统计量是统计理论中用来对数据进行分析、检验的变量。

2.同质 (homogeneity):是指观察单位(研究个体)间被研究指标的影响因素相同。

3. 抽样误差 (sampling error):由于随机抽样造成的样本均数与总体均数的差别。

4. 总体 (population):根据研究目的而确定的同质观察单位的全体称为总体,更确切的说,它是同质的所有观察单位某种观察值的集合。

5. 变异 (variation):变异就是标志在同一总体不同总体单位之间的差别。

6. 参数 (parameter):参数,也叫参变量,是一种变量。

7. 样本 (sample):研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体。

8. 概率 (probability):概率是对随机事件发生的可能性的度量,一般以一个在0到1之间的实数表示一个事件发生的可能性大小。

越接近1,该事件更可能发生;越接近0,则该事件更不可能发生。

1. 正态分布 (normal distribution):靠近均数分布的频数最多,离开均数越远,分布的数据越少,左右两侧基本对称,这种中间多、两侧逐渐减少的基本对称的分布,称为正态分布2. 中位数 (median):一组数据按从小到大(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数,注意:和众数不同,中位数不一定在这组数据中)3. 方差 (variance):是各个数据与其算术平均数的离差平方和的平均数,通常以σ2表示。

4. 四分位数间距 (quartile interval):是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小。

5. 正偏态分布 (positively skewed distribution):为统计学概念,即统计数据峰值与平均值不相等的频率分布。

如果频数分布的高峰向左偏移,长尾向右侧延伸称为正偏态分布,也称右偏态分布。

医学统计学名词解释

医学统计学名词解释

统计学名词解释1.医学统计学(statistics of medicine):是一门用统计学原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。

2.总体(population):根据研究目的而确定的同质观察单位的全体。

3.样本(sample):从总体中随机抽得的部分观察单位,其实测值的集合。

4.抽样(sampling):从总体中抽取部分个体的过程。

5.变量(variable):确定总体之后,研究者应对每个观察单位的某项特征进行观察和测量,这种特征能表现观察单位的变异性。

对变量的观测称为变量值(value of variable)或观察值。

6.计量资料(measurements data):又称定量资料或数值变量。

对每个观察单位的某项指标用定量方法测定其数值大小所得的资料。

7.计数资料(enumeration data):又称定性资料或无需分类变量资料。

将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。

8.等级资料(ranked data):又称半定量资料或有序分类变量资料。

将观察单位按照某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。

9.误差(error):泛指实测值于真实值之差,按其产生原因和性质可粗分为随机误差与非随机误差两大类,后者可分为系统误差与非系统误差两类。

10.抽样误差(sampling error):抽样过程中由于抽样的偶然性而出现的误差。

11.参数(parameter):表总体特征的指标。

12.均数(mean):可用于反映一组呈对称分布的变量值在数量上的平均水平。

13.几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。

14.中位数(median)将n个变量值从小到大排列,位置居于中间的那个数。

15.极差(range):也称全距,即最大值和最小值之差。

16.方差(variance):又称均方差,反映一组数据的平均离散水平。

医学统计学考试必会名词解释

医学统计学考试必会名词解释

P表示。

,如总体均数μ,总体率л,总体标准差σ等。

(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。

,称为正偏态;若集中位置偏向数值大的一侧(右x表演示样本均数。

R表示。

极差大,说明变异程度大;反之,说明变异程度小。

x百分位置上的数值,用符号表示为P x。

CV),亦称离散系数,为标准差与均数之比。

写成公式为:CV=S/X×100%,常用于(1)比较计量单位不同的几组资料的离样本均数的标准差称为标准误,其计算公式为。

=0.05。

H0,即“弃真”的错误。

Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为H0,即“存伪”的错误。

Ⅱ型错误的概率用β表示。

H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。

N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。

X,它的可能取值是0,1,……n,且相应的取值概率P 叫随机变量服从以n,л为参数的二项分布,记X,它的可能取值为0,1,……n,,且相应取值概率为称随机变量X服从μ为参数M-Friedman在符号检验的基础上提出来的,常称为Friedman检验,又称M检验。

SS e表示。

反映组间变异。

b表示,b的统计意义为自变量x改变一个单位时,应变量y平均变化b个单位。

x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中无法用x与y的线性关系所能解释的部分y的随机误差。

x,y间的相互关系。

Pearson积矩相关系数,说明具有直线关系的两变量间相关方向与密切程度。

以符号r表示样本相关系数,ρ表示总体相r2表示,它反映应变量y的总变异中,可用回归关系解释的比例,其公式为r2= 。

医学统计学名解和简答

医学统计学名解和简答

医学统计学(名词解释和简答题)1.总体:是同质的个体所构成的全体。

2.样本:从总体中抽取部分个体的过程为抽样,所抽得的部分为样本。

3抽样误差:样本的数据构成的统计指标与总体的统计指标有误差,这种差异是由抽样引起的。

4. 平均数(算术均数)适用于:对称分布或偏斜度不大的资料,尤其适合正态分布资料。

5.几何均数多用于:血清和W学中,有些明显呈偏态分布的资料经过对数变换后呈对称分布。

如:抗体滴度,细菌计数,血清凝集效价,某物质浓度等,其数据特点是观察值间按倍数关系变化。

6.中位数适用于:在频数分布明显偏态,或频数分布的两端无确定数值时。

7.百分数适用于:可用来描述资料的观察值序列在某百分位置的水平。

8.极差:也叫全距,即观察值中最大值和最小值之差,用符号R表示,是变异指标中最简单的一种。

9.极差使用于:说明传染病食物中毒的最短,最长潜伏期等。

10.方差:将离均差平方和再取平均其结果。

11.标准差:总体观察值中个体值的变异强度。

12.正态分布:标准差与均数结合能够完整地概括一个正态分布。

13. 双侧:有些指标如白细胞数过高或过低均属异常,故其参考值范围需要分别确定下限和上限。

14.单侧:有些指标如24小时尿糖含量仅在过高,肺活量仅在过低时为异常,只需确定其上限或下限。

15.标准误:标本均数的标准差6-,又称(简写SE)。

16.P值:指从H0规定的总体随机抽得等于或大于现有样本统计量值的概率。

17标准差:是一组观察值变异程度的指标。

18总变异=组间变异+组内变异。

19. 率:是表示某种现象发生的频率和强度。

20.构成比:表示事物内部各个组成部分所占整体的比重。

21.相对比:是两个有关联指标之比,用以描述两者的对比水平,常用R表示。

22. 相对数:指为了使计数资料具有可比性,取原始两个资料之比所得。

23. 确定组距:将全距除以组数可得到组距的近似值。

24.确定组限:实际组限在每组中只包含下限而不包含上限。

25.算术平均数:说明一组观察值的平均水平或集中趋势,是描述计量资料的一种常用方法。

医学统计学名词解释

医学统计学名词解释
6.完全随机设计:将实验对象完全随机的分配到实验组与对照组或几个对比组中
随机区组设计:将几个受试对象按一定条件配成区组,再将每一区组的受试对象随机分配到各个处理组中
7.二项分布:对指具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布
泊松分布:是一种常见的离散型分布,用来描述单位面积、体积、时间、人群内等稀有或罕见事件发生数的分布
14.无效假设:记为Ho,表示差别是由抽样误差引起,无统计学意义
备择假设:记为H1,表示差别是由处理因素引起,有统计学意义
15.频率:指某种现象发生的次数。对于随机事件A,在相同条件下进行n次实验,事件A发生的次数为m,比值m/n为频率,记为fn(A)
概率:描述随机事件A发生的可能性的大小,记为P(A),P值范围0≤P≤1
1.统计:包括三种内涵,统计工作,统计数据,统计学。
统计学:是对研究对象的研数据进行搜集、整理、分析和研究,以揭示其总体特征和规律性的方法论科学。
2.总体:根据研究目的确定的同质观测单位的集合。
样本:从统计总体中随机抽取的、具有代表性的部分观测单位的集合。
3.计量资料:有数值变量产生的资料,即对每个观察单位用计量方法测的某项指标数值大小所获得的资料。
抽样误差:有个体差异和抽样造成的样本与总体、样本与样本相应统计指标之间的差异
13.率的标准化法:采用统一标准计算各率的标准化率,使各率具有可比性,目的是在比较各率时消除混杂因素的影响
假设检验:又称显著性检验,是利用样本信息,根据一定的概率水准,推断样本指标与总体指标、不同样本指标之间的差别又无意义的统计分析方法
Ⅱ型错误:组间差异确实不存在,而统计推断结果却错误地认为存在组间差异,又称假阴性错误

医学统计学 名词解释

医学统计学 名词解释

1、总体:指所有同质观察单位某种观察值的全体。

分为有限总体和无限总体。

2、样本:是从总体中抽取部分观察单位的观测值的集合。

误差:泛指实测值与真实值之差。

统计量:根据样本算得的某些数值特征。

3参数:是关于总体的某些数值特征。

4、抽样误差:即便采用概率抽样方法抽取样本,但样本只是总体的一部分,这就存在着误差,统计学上将其称为抽样误差。

小概率事件原理:当某事件发生概率小于等于0.05时,统计学习惯上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不能发生。

普查:就是全面调查即调查目标总体中全部调查对象。

抽样调查:是一种非全面调查即从总体中抽取一定数量的观察单位组成样本对样本进行调查。

5、常用的概率抽样方法:单纯随机抽样、系统抽样、整群抽样、分层抽样、具体抽样。

非概率抽样方法:偶遇抽样、立意抽样、定额抽样、雪球抽样等。

6、偶遇抽样:又称便利抽样,是指研究者根据实际现实情况,使用最便利的方法来选取样本,可以抽取偶然遇到的人或选择那些距离最近的、最容易找到的人作为调查对象。

7、根据受试对象的不同,实验可分为动物实验、临床试验和现场试验三类。

8、实验设计的基本原则:对照原则、随机化原则和重复原则。

9随机化原则:是指采用随机的方式,使每个受试对象均有同等机会被抽取或分配到实验组和对照组。

10、重复原则:指在相同实验条件下进行多次实验或观察,以提高实验结果的可靠性。

重复原则主要包括:(1)对多个受试对象进行实验。

(2)对同一受试对象进行重复观测。

准确度:指观察值与真值的接近程度,主要受系统误差的影响。

精密度:指在相同条件下对同一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。

灵敏度:反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应比较敏感地显示出来。

特异度:反映鉴别真阴性的能力,特异度高的指标不易受混杂因素的干扰。

11、完全随机设计:是采用完全随机化的方法将同质的受试对象分配到各处理组,然后观察各组的实验效应,是一种考察单因素两水平或多水平效应的实验设计方法。

医学统计学考试必会名词解释

医学统计学考试必会名词解释

观察单位某种观察值(变量值)的集合。

这种特征称为变量。

大小所得的资料,一般用度量衡单位。

进行分组,然后计数各组该观察指标的数目所得的资料。

P表示。

,如总体均数μ,总体率л,总体标准差σ等。

(用拉丁字母代表)如相本均数x,样本率p,样本标准差s等。

(变量取值为一定范围内的任意值)的资料,其结果表达的限制因素是测量仪器或方法的灵敏度。

一侧(左侧),称为正偏态;若集中位置偏向数值大的一侧(右侧),称为负偏态。

用的平均数有算术均数、几何均数及中位数。

母μ表示总体均数,用x表演示样本均数。

态分布的资料,如血清抗体滴度、细菌计数等,宜采用几何均数描述其集中趋势。

即全部观察值中最大值与最小值之差,用符号R表示。

极差大,说明变异程度大;反之,说明变异程度小。

x百分位置上的数值,用符号表示为P x。

CV),亦称离散系数,为标准差与均数之比。

写成公式为:CV=S/X ×100%,常用于(1)比较计量单位不同的几组资料的离散程;(2)比较均数相差悬殊的几组资料的离散程度。

及生化指标常数,也称正常值。

波动。

称为抽样误差。

本均数的标准差称为标准误,其计算公式为。

面。

般取α=0.05。

H0,即“弃真”的错误。

Ⅰ型错误的概率用а表示,若确立检验水准为а=0.05,则犯第一类错误的概率为0.05。

H0,即“存伪”的错误。

Ⅱ型错误的概率用β表示。

H0所规定的总体中随机抽样,获得等于及大于(或等于及小于)现有样本统计量的概率。

到样本中来)获取样本,以避免误差和偏倚对研究结果有所影响。

组观察单位数。

等级资料又称为有序资料。

或偏低。

取值服从特定的概率分布。

X服从正态分布N(u,б2),经变换后,u服从均数为0,标准差为1的正态分布,这种正态分布称为标准正态分布。

构成比、相对比。

频率或强度,又称频率指标。

常用百分率、千分率、万分率或十万分率等表示。

比,说明事物内部各部分所占的比重。

常用百分数表示。

倍或几分之几。

两个指标可以是绝对数、相对数或平均数;或以性质相同,也可以性质不同。

医学统计学复习资料

医学统计学复习资料

医学统计复习资料一、名词解释[1].总体:根据研究目得确定得同质观察单位得全体。

就是同质所有观察单位得某种变量值得集合。

总体可分为有限总体与无限总体。

总体中得所有单位都能够标识者为有限总体,反之为无限总体。

[2].样本:从总体中随机抽取部分观察单位,其实测值得集合。

[3].计量资料:又称定量资料或数值变量资料。

为观测每个观察单位得某项指标得大小,而获得得资料。

其变量值就是定量得,表现为数值大小,一般有度量衡单位。

根据其观测值取值就是否连续,又可分为连续型或离散型两类。

[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,就是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到得资料。

其变量值就是定性得,表现为互不相容得性或类别。

分两种情形:(1)二分类:两类间相互对立,互不相容。

(2)多分类:各类间互不相容。

[5].等级资料:又称半定量资料或有序分类变量资料,就是将观察单位按某种属性得不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到得资料。

其变量值具有半定量性质,表现为等级大小或属性程度。

[6].随机误差(偶然误差):就是一类不恒定得、随机变化得误差,由多种尚无法控制得因素引起,观察值不按方向性与系统性变化,在大量重复测量中,它可呈现或大或小,或正或负得规律性变化。

[7].概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。

0﹤P(A)﹤1。

频率:在相同得条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现得频率(freqency)。

当试验重复很多次时P(A)= m/n。

[8].平均数:描述一组变量值得集中位置或水平。

常用得平均数有算术平均数、几何平均数与中位数。

[9].算术均数(arithmetic mean)描述一组数据在数量上得平均水平。

医学统计学复习题(名词解释和简答)

医学统计学复习题(名词解释和简答)

一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。

是同质所有观察单位的某种变量值的集合。

2、有限总体:是指空间、时间范围限制的总体。

3、无限总体:是指没有空间、时间限制的总体。

4、样本:从总体中随机抽取部分观察单位,其实测值的集合。

5、@计量资料:又称定量资料或数值变量资料。

为观测每个观察单位的某项指标的大小,而获得的资料。

其变量值是定量的,表现为数值大小,一般有度量衡单位。

根据其观测值取值是否连续,又可分为连续型或离散型两类。

6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。

其变量值是定性的,表现为互不相容的性或类别。

分两种情形:(1)二分类:两类间相互对立,互不相容。

(2)多分类:各类间互不相容。

7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。

其变量值具有半定量性质,表现为等级大小或属性程度。

8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。

9、平均数:描述一组变量值的集中位置或水平。

常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。

11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。

检验水平,就是预先规定的允许犯I型错误概率的最大值。

I型错误概率大小也用α表示,α可取单尾亦可取双尾。

12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。

其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。

医学统计学名词解释

医学统计学名词解释

医学统计学名词解释 Company number【1089WT-1898YT-1W8CB-9UUT-92108】1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。

3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示4.同质:是指事物的性质、影响条件或背景相同或相近。

5.变异:是指同质的个体之间的差异6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。

总体参数是固定的常数。

多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。

9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。

样本统计量可用来估计总体参数。

总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。

变异是生物医学研究领域普遍存在的现象。

严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。

卫统名词解释

卫统名词解释

1、总和生育率:假定同时出生的一代妇女,按照某年的年龄别生育率度过其一生的生育阶段,则各年龄别生育率之和乘以年龄组的组距,就是这一代妇女平均每人可能生育的总数2、检验效能:1-β即为检验效能,其意义是当所研究的总体与H0确有差别时,按检验水准α能发现它(拒绝H0)的概率3、总体(population):根据研究目的确定的同质的研究对象,其某项变量值的全体,按研究对象来源分为目标总体和研究总体。

4、统计描述:利用统计表、图以及统计指标描述资料的数量特征及其分布规律5、假设检验:也称显著性检验,是利用小概率反证法的思想,先对总体特征作出两种对立的假设H0和H1,然后再H0成立的条件下计算检验统计量,以获得概率P值,并与事先规定的概率值α(检验水准)相比较,来间接判断H1是否成立的过程7、概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A), P(A)越大,说明A事件发生的可能性越大,0< P(A)<18、变量:根据研究目的,对研究对象的某个或某些特征(研究指标或项目)实施观测,这些特征(指标或项目)称为变量(variable)9、参数(parameter):是描述总体特征的指标,其大小是客观存在的,然而往往是未知的。

10、统计量(statistic):由观察资料计算出来的量,描述样本特征的指标。

11、抽样(sampling):从研究总体中随机抽取一部分有代表性的个体的方法。

13、医学统计学:是一门应用概率论和数理统计学的原理和方法研究医药卫生领域中数据的收集、分析、解释和表达的学科。

14、样本(sample):从研究总体中随机抽取的一部分有代表性的个体(其某项变量值的全体)。

15、同质(homogeneity):一个总体中有许多个体大同小异,存在共性,这些个体处于同一总体16、变异:同质的个体之间存在的差异,统计学的任务是在变异的背景上描述同一总体的同质性,揭示不同总体的异质性17、变异系数(CV):主要用于量纲不同的变量间,或均属差别较大的变量间变异程度的比较,CV=S/X18、统计图:将统计指标用几何图形表达,即以点的位置,线段的升降,直线的长短,或面积的大小等直观地表示事物的数量关系19、负担系数:又称抚养比或抚养系数,是指人口中非劳动年龄人数与劳动年龄人数之比,其中劳动年龄人数指15~64岁的人口数20、动态数列(dynamic series):按时间顺序将一系列统计指标(可以是绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势,常用的分析指标有绝对增长量,发展速度与增长速度,平均发展速度与平均增长速度21、生存率(survival rate):病人能活到某一时点的概率,常用于慢性病如恶性肿瘤及心血管病等的治疗效果评价或预后估计,计算生存率的数据由随访获得,分直接法和寿命表法两种计算方法23、医学参考值范围(reference range):特定的正常人群(排除了对所研究的指标有影响的疾病和有关因素的特定人群)的解剖生理生化指标及组织代谢产物含量等数据中大多数个体的取值所在范围24、标准误:是样本统计量的标准差,反映统计量的变异程度是统计上用来衡量抽样误差大小的指标25、频率:独立重复n次试验,事件A出现m次,则m/n称为随机事件A在n次实验中出现的频率,n愈大,m/n 越接近P(A),频率是对样本而言的26、等级资料:将观察单位的观察结果按某种属性的程度或等级分组,分别统计各组的观察单位数所得到的资料27.、参数估计:用样本统计量估计总体指标(参数),分为点估计和区间估计28、点估计:直接用随机样本均数X作为总体均数μ的估计值,或用样本频率P作为总体概率π的估计值的方法,没有考虑抽样误差29、区间估计:用已知样本统计量和标准误确定一个有概率意义的并具有较大置信度包含总体参数的区间的参数估计方法30、置信区间(confidence interval,CI):按预先给定的概率确定包含未知总体参数的可能范围,其确切含义是随机变化的置信区间包含总体参数的可能性是1-α31、Ⅰ型错误:拒绝了实际成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α表示32、Ⅱ型错误:接受了实际不成立的H1,这类“存伪”的错误称为Ⅱ型错误,其概率大小用β表示33、检验水准:假设检验中预先设定的允许犯Ⅰ型错误的概率的最大值,称为检验水准,用α表示34、X2分布:是一种连续型随机变量分布,其分布的形状依赖于自由度的大小,如果Z服从标准正态分布35、拟合优度检验:是根据样本的频率分布检验其总体分布是否等于给定的理论分布36、NNT:需治疗人数是比较两种药物的临床治疗效果的指标,NNT=(两种药物有效率之差)-1,NNT说明了增加1例有效者需要改变治疗的人数,NNT越小越好37、计划生育率:指某地区某时期内符合计划生育要求出生的所有活产婴儿数与该地同时期内出生的活产婴儿总数之比,是反映该地期内计划生育工作成效的重要指标。

医学统计学

医学统计学

一、名词解释:定量数据:用仪器、工具等方法获得的数据。

定性数据:按某种属性分类,然后清点每类的数据。

有序分类资料:半定性或半定量的观察结果,有大小顺序。

统计学:是收集、分析、解释与呈现数据资料的一门科学。

同质:指事物的性质、影响条件或背景相同或非常相近。

变异:指同质的个体之间的差异。

参数:总体的统计指标。

统计量:样本的统计指标。

总体:根据研究目的而确定的同质单位。

样本:从总体中随机抽取部分观察单位某变量值的集合。

变量:是观测单位的某种特征或属性,变量的观测值就是变量值。

概率:是度量随机事件发生可能性大小的数值。

分类变量:其变量值是用定性方法得到的,通常将观察单位按某种属性或类别分组然后汇总各组个数所得到的数值。

数值变量:其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位,所得资料称为计量资料。

普查:就是全面调查,即调查目标总体中全部观察对象。

抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查。

极差:及全距,是全部数据中最低值与最小值之差。

上下限:每个组段的起点称为该组的下限,终点称为该组的上限。

平均数:反映资料的集中趋势的指标。

几何均数:变量对数值的算术平均数的反对数。

中位数:是一个位置指标,它是将一组观察值按大小顺序排列后位次居中的数值。

百分位数:是指将观察值从小到大排列后处于第X百分位置上的数值。

方差:样本观察值的离均差平方和的均值,表示一组数据的平均离散情况。

标准差:将方差开方即得到标准差。

变异系数:是极差和方差一样都是反映数据离散程度的绝对值。

正态分布:就是一种重要的连续型随机变量的分布类型。

率:是指某种现象实际发生数与某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。

构成比:即比例,是指事物内部某一组成部分观察单位数与同一事物各组成分的观察单位总数之比。

相对比:简称比,是两个有关联的指标之比值,用以说明一个指标是另一个指标的几倍或几分之几。

医学统计学名词解释名解复习资料

医学统计学名词解释名解复习资料

1. 总体(population):根据研究目的所确定的同质观察单位的全体。

只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。

假想的,无时间和空间概念的,称为无限总体(infinite population)。

2. (总体)参数(parameter):总体的统计指标或特征值。

总体参数是事物本身固有的、不变的。

3. 样本(sample):从总体中随机抽取的部分个体。

4. 样本含量(sample size):样本中所包含的个体数。

5. 变量(variable):观察对象个体的特征或测量的结果。

由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。

变量的取值称为变量值或观察值(observation)。

根据变量的取值特性,分为数值变量和分类变量。

6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。

对每个观察单位用定量的方法测定某项指标的数值,组成的资料。

7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。

2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。

等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。

8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1. 总体(population):根据研究目的所确定的同质观察单位的全体。

只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体(finite population)。

假想的,无时间和空间概念的,称为无限总体(infinite population)。

2. (总体)参数(parameter):总体的统计指标或特征值。

总体参数是事物本身固有的、不变的。

3. 样本(sample):从总体中随机抽取的部分个体。

4. 样本含量(sample size):样本中所包含的个体数。

5. 变量(variable):观察对象个体的特征或测量的结果。

由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量(random variable),简称变量(variable)。

变量的取值称为变量值或观察值(observation)。

根据变量的取值特性,分为数值变量和分类变量。

6. 数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。

对每个观察单位用定量的方法测定某项指标的数值,组成的资料。

7. 计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。

分类变量(categorical variable):或称定性变量,其取值是定性的,表现为互不相容的类别或或属性,有两种情况:1)无序分类(unordered categories):包括①二项分类,如上述“性别”变量,表现为互相对立的结果;②多项分类,如上述“血型”变量,表现为互不相容的多类结果。

2)有序分类(ordered categories):各类之间有程度上的差别,或等级顺序关系,有“半定量”的意义,亦称等级变量。

等级资料:介于计量资料和计数资料之间的一种资料,通过半定量方法测量得到。

8. 抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。

9. 抽样误差(sampling error):由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。

10. 误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。

主要有以下二种:系统误差和随机误差 。

11. 可信区间(confidence interval, CI ):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间,又称置信区间。

12. 总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。

常用的可信度为95%和99%,故常用95%和99%的可信区间。

13. 变异(variation):同质事物间的差别。

由于观察单位通常即为观察个体,故变异亦称为个体变异(individual variation)。

14. 组间变异(variation between group):用各组均数与总均数的离均差平方和表示∑-=i 2i i )x x (n S 组间S ν组间=k -1,k 为实验分组数,组间均方为MS 组间=SS 组间/( k -1)15. 组内变异(variation within group):用各组均数与总均数的离均差平方和表示 ∑∑∑-=-=i 2i i i j 2i ij )s (n )x (x S 1组内S ,各组自由度为n i -1,则组内自由度为ν组内=N -k ,组内均方为MS 组内=SS 组内/( N -k ) 16. 平均数(average):也叫平均值,是一组(群)数据典型或有代表性的值。

这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数(arithmetic mean)、几何平均数(geometric mean)、中位数(median)等。

17. 中位数(median):将一组观察值按升序或降序排列,位次居中的数,常用M 表示。

适用于偏态分布资料或不规则分布资料和开口资料。

所谓“开口”资料,是指数据的一端或两端有不确定值。

当n 为奇数时,M=X (n+1)/2;当n 为偶数时,M=[X n/2+ X n/2+1]/2。

18. 百分位数(percentile):是一种位置指标,以P x 表示,一个百分位数Px 将全部观察值分为两个部分,理论上有x%的观察值小于Px 小,有(1-x%)的观察值大于Px 。

19. 变异系数(coefficient of variance, CV):亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。

100%X s/CV ⨯=, 变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。

20. 统计表(statistical table):统计表就是以表格的形式,表达被研究对象的特征、内部构成及研究项目分组之间的数量关系。

21. 频率(relative frequency):在n 次随机试验中,事件A 发生了m 次,则比值 试验的总次数发生的试验次数A ==n m f 称为事件A 在n 次试验中出现的频率(relative frequency)。

m 称为出现的频数(frequency)。

在实际工作中,当观察单位的例数足够多时,可以用频率来代替概率。

频率是概率的估计值。

22. 概率(probability):在重复试验中,事件A 的频率,随着试验次数的不断增加将愈来愈接近一个常数p ,这个常数p 就称为事件A 出现的概率(probability),记作P(A)或P 。

描述随机事件发生的可能性大小的数值,常用P 来表示。

23. 统计量(statistic):由样本所算出的统计指标或特征值。

24. 相关系数(correlation coefficient):用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数(coefficient of product-moment correlation),总体相关系数用希腊字母ρ表示,而样本相关系数用r 表示,取值范围均为[-1, 1]。

25. 回归系数(regression coefficient):直线回归方程Y ˆ= a+b X 的系数b 称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。

26. 参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的某指标值范围称为该指标的正常值范围。

绝大多数:可以是90%、95%、99%等等,最常用的是95%。

正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。

又称参考值范围,是指特定健康人群的解剖、生理、生化等各种数据的波动范围。

习惯上是确定包括95%的人的界值。

27. 正偏态和负偏态分布:频数分布可分为对称分布和非对称分布两种类型。

非对称分布又称为偏态分布,是指观察值偏离中央的分布。

当尾部偏向数轴正侧(或右侧)时,称正偏态(或右偏态)分布,如人体中一些重金属元素的分布等。

反之,尾部偏向数轴负侧(或左侧)时,则称为负偏态(或左偏态)分布。

28. 统计推断(statistic inference):从总体中随机抽取一定含量的样本进行研究,目的是通过样本的信息判断总体的特征,这一过程称为统计推断。

29. 标准误(standard error, SE):在统计理论上将样本统计量的标准差称为标准误,用来衡量抽样误差的大小。

据此,样本均数的标准差Xσ称为标准误。

30. 参数估计(parameter estimation):由样本信息估计总体参数。

它包括两种:点估计(point estimation)和区间估计(interval estimation)。

31. 点估计(point estimation):直接用样本统计量作为对应的总体参数的估计值。

32. 区间估计(interval estimation):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度1-α的可信区间(confidence interval, CI ),又称置信区间。

这种估计方法称为区间估计。

33. 95%可信区间含义:如果重复若干次样本含量相同的抽样,每个样本均按同一方法构建95%可信区间,则在这些可信区间中,理论上有95个包含了总体参数,还有5个未估计到总体均数。

34.Ⅰ类错误(type Ⅰerror):统计学上规定,拒绝了实际上成立的H 0,这类“弃真”的错误称为Ⅰ型错误或第一类错误,Ⅰ型错误的概率用α表示。

35.Ⅱ类错误(type Ⅱerror):统计学上规定,不拒绝实际上不成立的H 0,这类“存伪”的错误称为Ⅱ型错误或第二类错误,Ⅱ型错误的概率用β表示。

36. 检验效能(power of a test):又称把握度,即两总体确有差别,按α水准能发现它们有差别的能力。

37. 参数检验:总体分布已知,对其中一些未知参数进行估计或检验。

这类统计推断的方法叫参数统计或参数检验。

参数检验:假定比较数据服从某分布,通过参数的估计量(x , s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametric test)。

如t 、u 检验、方差分析。

38. 非参数检验:适用于任意分布(distribution free)的统计方法,这种方法称为非参数统计。

这种假设检验方法,比较的是分布而不是参数,故称为非参数检验。

非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布进行统计检验的方法,称为非参数检验(nonparametric test).39. 率(rate):又称频率指标,用以说明某现象发生的频率或强度。

常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。

其计算公式为:(K)比例基数单位总数可能发生某现象的观察单位数实际发生某现象的观察率⨯= 40. 构成比(proportion):又称构成指标,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为:100%⨯=的观察单位总数同一事物内各组成部分位数某一组成部分的观察单构成比 41. 比(ratio):又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百分之几,它是对比的最简单形式。

其计算公式为:比=A/B 。

统计学(Statistics ):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达 的科学。

总体(population ):大同小异的研究对象全体。

相关文档
最新文档