统计学名词解释04666

合集下载

统计学名词解释(超全)

统计学名词解释(超全)

统计学名词解释(超全)统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。

总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。

参数:是描述总体数量特征的指标,又称总体指标。

样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。

变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。

总体参数:描述总体数量特征的指标,又称总体指标。

样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。

普查:为某一特定目的而专门组织的一次性全面调查。

抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。

统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。

统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。

时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。

时点指标:反应现象整体在某一的点(瞬间)上所处状况的总量指标。

众数:是一组数据中出现次数最多的变量值。

时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。

发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。

均匀发展水平:将不同时间的发展水平加以均匀而得到的均匀数。

发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。

环比发展速度:是时间序列中敷陈期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。

定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。

统计学名词解释

统计学名词解释

1、总体与总体单位:总体亦称统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。

构成总体的这些个别单位称为总体单位。

2、变异与变量:数量标志就是变量,指标志表现由一种状态到另一种状态称为变异。

3、重点调查:是指在全体调查对象中选择一部分重点单位进行调查,以取得统计数据的一种非全面调查方法。

4、统计分组:是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。

5、分配数列:在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分配数列,也称分布数列或次数分布。

6、总量指标:是反映某种社会经济现象在一定时间、空间和条件下的总规模、总水平或工作总量的综合指标。

7、平均指标:又称平均或均值,反映的是现象在某一空间或时间上的平均数量状况。

8、时期数列和时点数列:时期数列是指每一指标所反映的是某种社会经济现象在某一定时期内发展过程及其发展水平的绝对数动态数列。

时点数列是指每个指标所反映的都是某种社会经济现象在某一时点(或时刻)上的状态及发展水平时折绝对数动态数列。

9、发展水平:P13610、发展速度:P14811、总指数:是反映全部现象总体(即复杂现象总体)数量变动的相对数。

12、综合指数:是两个总量指标对比形成的指数,在总量指标中包含两个或两个以上的因素,将其中被研究因素以外的一个或一个以上的因素固定下来,仅观察被研究因素的变动,这样编制的指数,称为综合指数,它的特点是先综合后对比。

13、抽样平均误差:是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。

即它反映了抽样指标与总体指标的平均离差程度。

14、样本:按一定方法从总体中随机抽取的部分个体。

15、相关系数:是变量之间相关程度的指标。

简答题12:回归分析:对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间数量变动关系的数学表达式,以便对因变量进行估计或预测的统计分析方法。

统计学名词解释 简答

统计学名词解释 简答

5、时期指标和时点指标的区别
时期指标:(1)连续记数,其值可以相加 (2)具有时间长度,与时间长短有关 (3)是流量
时点指标:(1)间断记数,其值不可以相加,相加无实际意义 (2)不具有时间长度,与时间长短无关 (3)是存量
6、抽样技术的特点
(1)在调查单位的抽取上,遵循随机原则。
两者的联系:(1)指标是指标的汇总和综合。
(2)根据研究目的的不同,两者有时可以互换。
2、统计总体的特点
(1)同质性。即总体单位都必须具有某些共同的品质标志属性或数量标志属性。这是构成总体的前提。
(2)大量性。即构成总体的总体单位数目要足够多。这是形成总体的充分条件。
(3)差异性。即总体单位必须具有一个或若干个可变的品质标志或数量标志。这是形成总体的必要条件。
13、点估计和区间估计
点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。
14、统计指数
广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。
(3)按所采用的基期不同分:定基指数和环比指数。
(4)按表现形式不同分:综合法总指数和平均法总指数。
12、相关关系的种类
(1)从涉及的因素多少来分,可分为单相关和复相关。只研究两个因素之间的相关关系叫单相关。两个以上的为复相关。
(2)从相关关系所呈现形态来分,可分为直线相关和曲线相关。
(3)直线单相关按呈现相关关系的方向划分,又可分为正相关和负相关。正相关表明两个因素的变动方向是相同的,负相关表明两个因素的变动方向是不同的。

统计名词解释

统计名词解释

统计学(statistics):是运用概率论、数理统计的原理和方法,研究数据资料的收集、整理、分析、推断的一门应用科学。

是处理数据变异的方法学、工具学。

总体Population:根据研究目的所确定的同质观察单位的全体样本Sample:从总体中随机抽取部分观察单位,其实测值的集合。

参数(parameter):由总体计算出来的量,刻画了总体特征,如总体均数、总体标准差;统计量(statistics) :由样本计算出来的量,反映了样本的特征,如样本均数、样本标准差;概率描述了随机事件发生的可能性的大小。

同质(homogeneity):指同一总体中个体的性质、影响条件或背景相同或非常相近。

变异(va riation):在自然状态下,个体间测量结果的差异称为变异。

变量Variable:可以测量的任何特征或属性(不同个体结果可能不同),能表现观察单位变异性的某种特征随机变量random variable:在概率论中称变量为随机变量。

指取值事先不能确定的结果。

从理论上讲,每个随机变量的取值服从特定的概率分布。

定量变量Quantitative variable:其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位。

定性变量Qualitative variable:定性方法得到的,通常将观察单位按某种属性或类别分组,不同的属性或类别即定性变量。

定量资料(Quantitative data):定量资料是以数字形式表现出来的研究资料。

定性资料(Qualitative Data):定性资料是以文字、图形、录音、录象等非数字形式表现出来的研究资料。

频率(frequency):在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率。

当试验重复很多次时P(A)= m/n。

概率Probability:描述了随机事件发生的可能性的大小。

0≤P ≤1频数(frequency):在一批样本中,相同情形出现的次数称该情形的频数。

统计学名词解释

统计学名词解释

统计学:一门认识方法论科学,具体说它是研究如何搜集数据、整理数据并分析数据,以便从中作出正确推断的认识方法论科学。

标志:是反映总体各单位属性和特征的名称。

指标:是反映统计总体数量特征的概念及其数值。

普查:专门组织的、一次性的全面调查。

抽样调查:运用一定方法在调查对象中抽取一部分单位作为样本,并通过观察的样本的结果来推断总体数量特征。

标准差:总体所有单位标志值与其平均数的离差的方根均值;标准差系数:标准差与均值之比
抽样平均误差:样本均值或比例的标准差反映统计量与相应参数间的平均误差程度;统计分组:根据研究目的和要求,按某个标志将总体划分为若干个不同性质的组。

统计推断:按照随机原则从总体中抽取部分单位抽成样本,在一定可靠程度下,根据样本的数量特征对总体的数量特征加以推断的方法。

指数体系:广义的指经济上有联系的若干个统计指数构成的整体,其包含多个指数,由研究问题的需要而定。

狭义的指经济上有一定的联系,数量上能够形成相等关系的三个或三个以上的指数所构成的整体。

相关分析:研究具有相关关系的变量的变动方向和密切程度的统计分析方法。

回归分析:在相关分析的基础上根据变量的相关关系的形态,寻求一个数学模型,来近似的表达变量间的平均变化关系。

发展速度:是报告期水平与基期水平的比,反映现象发展变动的方向和程度。

增长速度:是报告期增长量与基期水平的比,反映现象增长变动的方向和程度。

统计学 名词解释

统计学 名词解释

1.统计报表:是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。

2.长期趋势:是指现象在一段相当长的时期内所表现的沿着某一方向的持续发展变化。

3.同度量因素:是指在总指数编制中,使原来不能直接相加的现象的量过渡到可以相加的那个因素。

4.统计指数:广义上,指数是用以测定某个变量在时间或空间上变动程度和方向的相对数 狭义上,指数是一种特殊的相对数,用来表明复杂经济现象总体数量的综合变动。

5.统计分组:是数据整理中的一项重要工作,它足根据统计研究的需要,将数据按照某种特征或标准分成不同的组别。

6.抽样调查:是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面调查方法。

7.区间估计:就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。

8.无偏性:估计量抽样分布的数学期望等于被估计的总体参数。

9.有效性:对同一总体参数的两个无偏估计量,有更小估计差得估计量更有效。

10.一致性:随着样本量的增大,点估计量的值越来越接近被估总体的参数。

11.原假设:提出一个或两个参数是否等于或大于、小于某个特殊值的命题。

12.备择假设:与原假设逻辑相反的假设。

13.点估计:就是用样本统计量的某个取值直接作为总体参数的估计值。

14.区间估计:在点估计的基础上给出总体参数估计的一个区间范围,该区间通常由样本统计量加减误差得到。

15.置信水平:将构造置信区间的步骤重复很多次,置信区间包括总体参数真值的次数所占的比例。

16.方差分析:就是通过检验个总体的均值是否相等来判断分类自变量对数值型因变量是否有相助影响17.假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。

18.显著性水平:是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险19.单因素方差分析:研究一个分类型自变量同数值型自变量之间关系的一种统计方法。

完整版)统计学名词解释

完整版)统计学名词解释

完整版)统计学名词解释统计学名词解释第一章绪论在统计学上,随机变量指的是取值之间不能预料到的变量。

总体,又称母全体或全域,是指具有某种特征的一类事物的全体。

构成总体的每个基本单元称为个体。

从总体中抽取的一部分个体称为样本。

次数指的是某一事件在某一类别中出现的数目,又称为频数。

频率,又称相对次数,指某一事件发生的次数被总的事件数目除,即某一数据出现的次数被这一组数据总个数去除。

概率指某一事物或某一情在某一总体中出现的比率。

一旦确定了某个值,就称这个值为某一变量的观测值。

参数,又称为总体参数,是描述一个总体情况的统计指标。

样本的那些特征值叫做统计量,又称特征值。

第二章统计图表统计表是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。

一般由表号、名称、标目、数字、表注组成。

统计图一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。

纵轴表示事物出现的次数或因变量,称为数值轴。

一般由图号及图题、图目、图尺、图形、图例、图组成。

简单次数分布表适合数据个数和分布范围比较小的时候用,它是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。

而分组次数分布表适合数据个数和分布范围比较大的时候用。

数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来。

分组次数分布表的编制步骤包括求全距、定组距和组数、列出分组组距、登记次数和计算次数。

相对次数分布表用频数比率或百分数来表示次数,而累加次数分布表则把各组的次数由下而上或由上而下加在一起。

最后一组的累加次数等于总次数。

双列次数分布表用同一个表表示有联系的两列变量的次数分布。

而不等距次数分布表则适用于像工资级别和年龄分组这样的不等距数据。

需要注意的是,归组效应是分组次数分布表的缺点之一,因为原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差。

统计学名词解释

统计学名词解释

统计学名词解释1.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学2.描述统计:研究数据收集、处理、汇总、图标描述、概括与分析等统计方法3.推断统计:研究如何利用样本数据来推断总体特征的统计方法4.分类数据:只能归于某一类别的非数字型数据5.顺序数据:只能归于某一有序类别的非数字型数据6.数值型数据:按数字尺度测量的观察值7.观察数据:通过调查或观测收集到的数据8.实验数据:实验中控制实验对象而收集到的数据9.截面数据:在相同或近似相同的时间点上收集的数据10.时间序列数据:在不同时间收集的数据11.样本:从总体中抽取的一部分元素的集合12.样本量:构成样本元素的数目13.参数:用来描述总体特征的概括性数字度量14.统计量:用来描述样本特征的概括性数字度量15.变量:说明现象某种特征的概念16.离散型变量:只能取可数值的变量17.连续性变量:可以在一个或多个区间中取任何值的变量18.概率抽样:(随机抽样)遵循随机原则进行的抽样,总体中每个单位都有一定机会被选入样本19.抽样框:包括所有形体单位信息20.分层抽样:将抽样单位按某种特征或者某种规则划分为不同的层,从不同层中独立、随机抽取样本21.整群抽样:将总体中若干单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查22.系统抽样:将总体中所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位23.非概率抽样:抽取样本时根据研究目的对数据的要求采取某种方式从总体中抽取部分单位对其实施调查24.抽样误差:抽样的随机性引起的样本结果与总体真值之间的误差25.累积频数:将各有序类别或组的频数逐级累加起来得到的频数26.集中趋势:一组数据向某一中心值靠拢的程度27.自由度:样本个数减128.统计量:样本构造函数,不依赖于任何未知参数,此函数为一个统计量29.次序统计量:30.充分统计量:对样本加工处理过程中信息部损失的统计量31.抽样分布:在总体分布类型已知时,若对任一自然数n都能到处统计量的分布数学表达式32.中心极限定理:33.估计量:用来估计总体参数的统计量34.估计值:根据一个具体的样本计算出来的估计量的数值35.点估计:用样本统计量的某个取值直接作为总体参数的估计值36.区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到37.置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间38.置信水平:(置信系数)若果将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例。

统计学名词解释

统计学名词解释

名词解释1.统计学:是应用概率论和数理统计的基本原理和方法,研究数据的收集、整理、分析、表达和解释的一门科学.2.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集整理、分析、表达和解释的一门科学.3.抽样:是从研那个研究总体抽取少量有代表性的个体,称为抽样.4.统计推断:是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验.5.总体:是根据研究目的确定的同质研究对象的全体.6.概率:是随机事件发生可能性大小的数值度量.7.同质:是指所研究的观察对象具有某些相同的性质或特征.8.变异:是同质个体的某项指标之间的差异,即个体差异.9.正态分布:频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布.10.医学参考值范围:又称正常值范围,医学上常将包括绝大多数正常人的某指标值的波动范围称为该指标的正常值范围.11.动态数列dynamic series:是按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数.12.人口金字塔:将人口的性别与年龄资料结合起来以图形的方式表达人口的性别与年龄结构,以年龄为纵轴,人口百分比为横轴,左侧为男,右侧为女,两个对应的直方图,其形似金字塔.13.负担系数dependency ratio:又称抚养比或抚养系数,是指人口中非劳动年龄人数与劳动年龄人数之比.14.标准化死亡比SMR:实际死亡人数与期望死亡人数之比称为标准化死亡比.15.统计图:是用点的位置、线段的升降、直条的长短和面积的大小等来表达数据的一种形式.16.半对数线图semi-logarithmic linear chart:横轴是算数尺度,纵轴是对数尺度,使线图上的数量关系变为对数关系.适用于描述某项指随某个连续型数值变量变化而变化的速度相对变化趋势.17.直方图histogram:一般用横轴表示连续性数值变量,纵轴表示表示频数或频率,每个矩形的宽度等于各组段的组距,高度等于相应组段的频数或频率.常适用于描述连续性数值变量的频数或频率分布了解一组数据的分布类型和分布特征.18.散点图scatter plot:是用直角坐标上点的密集程度或趋势表示两变量间的相关关系.19.箱式图box plot:箱式图用于描述练箱连续型变量的分布特征,它表现连续型变量的5个特征值,即最小值、下四分位数、中位数、上四分位数、最大值.20.统计地图statistical map:是运用统计数据反应制图对象数量特征的一种图形,主要用于某种现象的数量在地域空间上的分布.21.随机抽样random sampling:是指按照随机化的原则总体中每一个观察单位都有同等的机会被选入到样本中,从总体中抽取部分观察单位的过程.随机抽样是样本具有代表性的保证.22.抽样误差sampling error of mean:是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数与总体均数之间的差异.23.统计推断statistical inference:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断.24.四分位数间距inter-quartile range, IQR:是由第三上四分位数减去第一下四分位数所得,常常与中位数一起使用,用来描述偏态分布资料的分布特征,较极差稳定.25.变异系数coefficient of variation:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较.用CV 表示.24.第Ⅰ类错误typeⅠerror:是指拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误,其概率大小用α表示.25. II 型错误type II error:是指接受了实际上不成立的H0,这类“存伪”的错误称为II 型错误,其概率大小用β表示,未知.26. 检验效能:1- β称为检验效能power of test,也称把握度,它是指当两总体确有差别,按规定的检验水准a 能发现它们有差异的能力.27. 随机区组设计randomized block design:是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组block,使每一区组内的受试对象例数与处理因素的分组数相等,使每个实验组从每一区组得到一例受试对象.28.完全随机设计completely random design:是采用完全随机化的分组方法,将全部试验对象分配到g个处理组水平组,各组分布接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应.29.配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组,或者比较受试者实验前后的变量值改变情况,甚至比较同一标本接受两种不同测定方法的检查结果的差别.29.析因设计factorial design实验:凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计factorial design实验.30.方差分析analysis of variance ANOVA的基本思想:是把全部观察值的总变异按设计和需要分解成两个或多个组成部分,再进行分析.31 . LSD-t检验:即最小显着性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较.32. SNKstudent-Newman-Keuls法:又称q检验,是根据q 值的抽样分布作出统计推论,适用于多个样本均数两两之间的全面比较.33.Dunnett-t检验:适用于g-1个实验组与一个对照组均数差别的多重比较.34. 二项分布binorminal distribution:是指每次试验有且仅有两个可能结果如“阳性或“阴性“之一的n次独立重复试验中,每次试验的发生”阳性“概率“π保持不变,出现”阳性“数x=0,1,2,3…,n的一种概率分布.35.率的抽样误差standard error of rate:由于个体差异的存在,在抽样研究中表现出来的样本率与总体率或样本率的之间的差异称为率的抽样误差.分布:是一种离散型分布,二项分布的一种极限情况,用于描述单位时间、空间、面积等小概率事件发生次数的概率分布.它是由法国人首先提出来.37. 2χ分布:是一种以2χ分布为基础的连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符等问题,以2χ值为检验统计量的计数资料的假设检验方法.标准正态分布:对任意一个服从正态分布U,的随机变量,可经Z变换后的Z值仍然服从正态分布,且其总体均数为0、总体标准差为1.我们称此正态分布为标准正态分布,用N0,1表示.statistics:非参数检验,针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法.由于该方法不受总体参数的限制,故称为非参数检验,或称为不拘分布的统计分析方法,又称为无分布形式假定的统计分析方法.39.参数检验parametric text:通常要求样本来自总体分布型是已知的如正态分布,在这种假设的基础上,对总体参数如总体均数进行估计和检验,称为参数检验.两样本秩和检验的基本思想:如果Ho成立,则两样本来自分布相同的总体,两样本的平均秩次T1/n1与T2/n2应相等或接近,含量n1的样本的秩和T1应在n1N+1/2的左右变化.若T值偏离此值太远,H0成立的可能性就很小.若偏离出给定值所确定的范围时,则P<,拒绝H0.的M检验的基本思想:在H0成立的条件下,各区组内观察值取秩次为1,2,…,k的概率相等,则各处理组的秩和应接近R平均=nk+1/2,而M值反映了实际获得的k个处理组的秩和与偏离的程度.M值越大,越有理由怀疑各处理组的总体分布不同.随着b和k的增大,M值近似服从自由度为k-1的2χ分布.42.直线相关:是分析服从正态分布的两个随机变量x与y有无线性相关关系的一种统计分析方法.43.相关系数:是描述两个变量间线性相关关系的密切程度与方向的统计指标.44.直线回归linear regression:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小.直线回归是回归分析中最基本、最简单的一种,故又称简单回归.45. 回归系数regression coefficient :即回归直线的斜率slope,表示自变量x每改变一个单位时,应变量y平均变化b个单位.46.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围.该范围称为总体参数的可信区间confidence interval,CI.它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α .47.四分位数间距inter-quartile range, IQR:是由第三上四分位数减去第一下四分位数所得,常常与中位数一起使用,用来描述偏态分布资料的分布特征,较极差稳定.48.标准正态分布:均数为0,标准差为1的正态分布被称为标准正态分布standard normal distribution,通常记为N0, 12.49.偏回归系数:多元线性回归中的偏回归系数表示在其他自变量固定不变的情况下,自变量Xj每改变一个单位时,单独引起应变量Y的平均改变量.50.系统抽样systematic sampling:又称机械抽样和等矩抽样,现将总体的观察单位按照某一顺序分成n个部分,再从第一部分随机抽取第k号观察单位,依次用相等的间隔,从每一部分抽取一个观察单位组成样本.51.分层抽样stratified sampling:又称分类抽样,先按影响观察值变异较大的某种特征将总体分为若干层,再将从每层内随机抽取一定数量的观察单位组成的样本.r称为决定系数coefficient of determination,表示由x与y的直线关系导致的y的变异SS回在总变异SS总中所占的比重,即回归效果的好坏,rr越接近1,即回归的效果越好.53.抽样调查sampling survey:是从总体中随机抽取一部飞的研究对像组成样本,对样本进行调查,然后根据样本信息来推断总体特征.54.典型调查typical survey:典型调查又称案例调查,是有目的的选着典型的人和单位进行调查.55.变异系数coefficient of variation用于观察指标单位不同或均数相差较大时两组资料变异程度的比较.用CV 表示.analysis:残差分析,旨在通过残差深入了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识别异常点等.57.最小二乘原则least squares method:所有的数据点到回归直线的纵线距离的平方和最小.58.拟合优度检验:是判断样本实际频数分布与拟合的理论频数分布是否符合,或者说判断此样本是否来自某种分布.59.回归直线的置信带confidence band:以相应的X为横坐标,Y为纵坐标,将置信区间的上下线分别连接起来形成的两条弧形线的区域,称为回归直线的置信带.60.标准化残差standardized residual:将每个残差值减去所有残差值的均数,再除以所有残差值的标准差,便得标准化残差.·61.随机化:是采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组或对照组.62.双盲double blind:指受试对象和研究者均不知道受试对象在哪一组,称为双盲.63.定群寿命表cohort life table:亦称队列寿命表,它是对某特定人群中的每一个人,从进入该特定人群直到最后一个人死亡记录的实际死亡过程.由于人的生命周期很长,如果用现时寿命表方法研究人群的生命或死亡过程.不仅随访人数要很多,而且随访时间要上百年.1.算术均数arithmetic mean描述一组数据在数量上的平均水平.总体均数用μ表示,样本均数用X 表示.2.几何均数geometric mean用以描述对数正态分布或数据呈倍数变化资料的水平.记为G.3.中位数medianMd将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值.反映一批观察值在位次上的平均水平.4.极差range亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差.5.方差variance:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到.6.标准差standard deviation是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用.7.构成比proportion又称构成指标,说明某一事物内部各组成部分所占的比重或分布.。

统计学 名词解释

统计学  名词解释

1.统计工作: 又称统计实践。

是对社会经济现象存在的现实数量方面进行搜集、整理和分析的工作过程。

2.统计资料:指在统计实践过程中,取得的数学资料和其它实际资料的总称。

3.统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。

4.统计学的研究对象:是指社会经济现象总体的数量特征和数量关系,且通过这些数量方面反映社会经济现象规律性的表现。

社会性:是研究人们从事社会生产的条件、过程和结果,是社会活动的产物。

总体性:是以社会经济现象总体作为研究对象的。

变异性:是指总体内各单位存在着不同的差异。

5.总体:又称统计总体。

是由客观存在的、具有某种共同性质的许多个个别事物所组成的整体。

6.总体单位:构成总体的个体单位或基本单位。

通常将所要研究的事务的全体构成的总体称为全及总体。

从全及总体中抽取出来作为代表这一总体的部分单位的集合体被称为样本。

单位标志7.简称标志:是总体中各单位所共同具有的属性和特征,或是说明总体单位属性和特征的名称。

8.总体单位:标志的直接承担者,标志依附于单位。

9.标志的分类:品质标志:表明总体单位属性方面的特征。

数量标志:表明总体单位数量方面的特征。

10.标志表现:标志特征在各单位的具体表现。

11.品质标志表现:只能用文字描述的标志表现。

12.数量标志表现:具体的数值,又称为标志值、变量值13.不变标志:在一个总体中,不论是品质标志还是数量标志,它们的具体表现都是相同的。

14.可变标志:在一个总体中,一个标志在各个单位的具体表现不尽相同时,又称为变异标志。

15.连续变量:变量的取值连续不断,既可用整数又可用小数表示。

16.离散变量:变量按一定顺序取值,但必须为整数。

17.指标:全称为统计指标。

是指反映客观存在的,社会经济现象总体某一综合数量特征的经济范畴。

18.指标与标志的区别(1)标志是说明总体单位特征的,不具备综合性,指标是说明总体综合数量特征的,具有综合性特点。

(2)标志分为数量标志和品质标志,品质标志只能用文字表示,指标分为数量指标和质量指标,全用数量表示。

统计学名词解释、简答

统计学名词解释、简答

名词解释统计总体:指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。

统计总体的特征:同质性、差异性、大量性。

总体单位:个体,指构成总体的各个单位。

统计指标:简称指标,用来反映社会经济现象总体的数量特征的概念及其数值。

任一概念都包含指标名称和指标数值。

特征有总体性、数量性、综合性、具体性。

统计标志:在统计中,总体单位所具有的属性或特征的名称。

标志是统计研究的起点,总体单位是标志的载体,是标志的承担者,统计研究是从登记标志开始的,并通过对标志的综合来反映总体的数量特征。

可分为品质标志和数量标志,或不变标志和变异标志。

统计调查:就是根据统计研究的预定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地搜集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的原始资料的工作过程。

统计调查是整个统计工作的基础环节。

统计调查的好坏,将影响统计资料的正确与否,从而影响统计质量。

统计调查的要求:准确性、及时性、全面性、系统性。

普查:是根据统计任务的特定目的而专门组织的一次性全面调查。

调查范围:1.属于一定时点的社会经济现象的总量(如人口普查)。

2.反映一定时期现象的总量(如出生人口总数)。

优点:所获资料更详细,有较高的准确性和时效性。

缺点:工作量大,花费时间长,耗费大量的人力、物力和财力。

主要作用:在于掌握某些关系国计民生、国情国力的数据,获得比较准确的信息。

抽样调查:指从所要研究的总体中,按照随机原则,抽取部分单位进行调查,并将调查整理得出的数量特征,用以推断总体综合数量特征的一种非全面调查组织形式。

特点:随机性、推断性。

优点:经济性、时效性、准确性、灵活性。

应用范围:①对总体不可能或不必要进行全面调查,但要掌握总体某些现象的全面数值②用抽样调查资料修正全面调查资料。

作用:①承担全面调查无法或很难承担的调查任务。

如气象调查。

②与全面调查结合,可以发挥相互补充、校对的作用。

③进行生产过程的质量控制。

统计学的名词解释

统计学的名词解释

统计学的名词解释统计学是一门关于数据收集、分析和解释的学科。

它提供了一种研究和理解事物之间关系的方法,通过收集、整理和分析数据来推断出可能的规律和趋势。

统计学的应用范围广泛,涵盖了各个领域,包括社会科学、自然科学、工程学以及商业领域等。

数据是统计学的基础,它可以是数字、文字或符号等形式的观察结果。

统计学通过对数据的收集和整理,将其转化为有意义的信息。

数据可以分为两种类型:定性数据和定量数据。

定性数据是一种描述性数据,不用数字表示,比如人类的性别、颜色偏好等。

而定量数据则是用数字表示的数据,可以进行数值计算和统计分析。

抽样是统计学中常用的一种数据收集方法。

由于很难收集到全部的数据,统计学中常采用抽样方法来代表整体。

简单随机抽样和系统抽样是其中两种常用的方法。

简单随机抽样是指从总体中随机选择个体,而系统抽样是指按照一定的规则从总体中选择个体。

通过抽样,统计学家可以通过对样本进行观察和分析,推断出总体的特征。

描述统计是统计学中重要的一个分支,它的目标是对收集到的数据进行总结和描述。

描述统计常用的几个概念包括中心趋势和离散程度。

中心趋势是用来描述数据集中、典型或平均的值的指标,最常见的包括平均数、中位数和众数。

而离散程度用来描述数据集中的变异程度,最常见的指标包括标准差和方差。

统计推断是统计学中另一个重要的分支,它通过从样本中推断总体的特征。

统计推断主要包括参数估计和假设检验。

参数估计是通过样本数据,对总体参数的值进行估计。

常见的参数估计方法包括置信区间估计和最大似然估计。

而假设检验是通过对样本数据进行统计推断,对某个假设的真实性进行检验。

假设检验常用的方法包括t检验和方差分析等。

回归分析是统计学中一种重要的方法,它用来研究变量之间的关系。

回归分析通过建立数学模型,来揭示自变量和因变量之间的关系。

简单线性回归分析是一种最基本的回归分析方法,它研究的是一个自变量和一个因变量之间的关系。

而多元回归分析则是研究多个自变量和一个因变量之间的关系。

[管理]统计学名词解释整理

[管理]统计学名词解释整理

第一章:绪论第一节统计的产生与发展1.统计—总括地计算;对某一现象有关的数据进行搜集、整理、计算和分析等;统计学概括地说统计就是用数字作为语言表述事实。

它有三层含义即:统计资料、统计工作、统计学2统计资料是反映一定社会经济现象或科学技术内容的统计数字和相联系的文字分析报告。

3统计工作是在一定理论指导下,采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。

3统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。

其目的就是探索数据内在的数量规律性(为什么?)。

P8三者之间的关系:统计工作和统计资料是过程与成果的关系;统计工作和统计学是实践与理论的关系,理论源于实践,理论又高于实践,反过来又指导实践。

统计学是统计工作的经验概括和总结,是系统化了的知识体系。

第二节统计的基本问题1.统计的作用认识世界的有力武器是治国和管理的重要手段是科学研究的有效工具P42.统计的特点数量性总体性(综合性)具体性3.统计工作过程统计设计→统计调查→统计整理→统计分析4、统计设计就是根据统计活动的目的,结合研究对象的性质、特点,对统计范围、统计指标、分类目录、资料搜集整理方法、分析要求及有关组织工作等方面所作出的整体规划。

5、统计调查就是根据统计活动的目的所确定的统计指标,把研究对象中各总体单位的某些必须了解的特征记录下来。

6、统计整理就是根据统计设计的要求,将调查资料进行审核、分组、汇总、编制统计表等科学加工处理的过程,以便清晰地反映研究总体的综合特征。

7、统计分析就是根据统计研究的任务,以统计数据为基础,结合具体情况,运用静态和动态分析方法进行研究,肯定成绩,发现问题,找出原因,根据事物的本质及其规律性,提出解决问题的方法,更好地为社会主义现代化建设服务。

第三节统计学的若干基本概念1、总体:指在某种共性的基础上由许多个别事物结合起来的整体。

简言之总体是同质个体所组成的整体。

统计学 名词解释

统计学  名词解释

1.统计学:是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考2.统计总体:根据统计研究目的确定的所研究对象的全体3.总体单位:构成总体的个别单位4.统计指标:是反映同类社会经济现象总体综合数量特征的范畴及其数值5.描述统计学:是研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工梳理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征的一门学科6.推断统计:研究如何利用样本数据来推断总体特征的统计学分支7.统计调查:根据统计活动的目的所确定的统计指标,把研究对象中各总体单位的某些必须了解的特征记录下来8.抽样调查:是从全部调查研究对象中,抽选一部分单位进行调查并据以对于全部调查研究对象做出估计和推断的一种调查方法9.重点调查:是指在全体调查对象中选择一部分重点单位进行调查,以取得统计数据的一种非全面调查方法10.普查:是为了某种特定的目的而专门组织的一次性的全面调查11.典型调查:根据调查目的和要求,在对调查对象进行初步分析的基础上,有意识的选取少数具有代表性的典型单位进行深入细致的调查研究,捷以认识同类事物的发展变化规律及本质的一种非全面调查12.样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量13.统计整理:根据统计研究的任务与要求,对统计调查所搜集到的原始资料进行分组、汇总、使其条理化、系统化的工作过程14.统计资料:是统计部门或单位进行工作所搜集、整理、编制的各种统计数据资料的总称15.复杂现象总体:各单位的标志值和单位数不可以相加的总体16.简单现象总体:各单位的标志值何单位数可以相加的总体17.统计分布:在统计分组的基础上,把总体的所有单位按组归排列18.全距:用来表示统计资料中的变异数量,其最大值与最小值之间的差距19.组中值:是上下限之间的中点数值,以代表各组标志值的一般水平20.统计表:统计调查所得来的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格中,就形成“统计表”21.总量指标:是用来反映社会经济现象在一定条件下的总规模,总水平或工作总量的统计指标22.相对指标:是质量指标的一种表现形式23.平均指标:反映同质总体内某一数量标致在具体时间、地点、条件下到达的一般水平的综合指标24.中位数:代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分25.标准差:总体各单位标准值与其平均数离差平方的算数平均数的平方根26.动态数列:将某种现象在时间上变化发展的一系列同类的统计指标,按照时间先后顺序排列,就形成一个动态数列27.时期数列:在绝对数时间数列中,如果每一指标是反映某现象在一段时间内发展过程的总量28.发展速度:反映社会经济发展程度的相对指标,他是现象的报告期水平与基期水平之商29.增长速度:反映社会现象在时间上的增长程度的相对数,用百分率或倍数表示30.指数:根据某些采样股票或债券的价格所设计并计算出来的统计数据31.抽样误差:是指用样本统计值与被推断的总体参数出现的偏差。

统计学名词解释完整版

统计学名词解释完整版

统计学名词解释HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】名词解释●统计工作:是从数量方面对社会经济现象做调查研究的一种工作,是人们为认识客观事物而进行的搜集、整理、分析和提供统计资料的工作过程。

●统计资料:是统计工作的成果,是指在统计实践活动中所取得的,反映统计研究对象有关特征的各种综合性的数字资料和分析报告。

●统计学:是阐述统计理论与方法的系统性科学,是统计工作实践的理论概括和科学总结,是研究、整理、分析统计资料的理论和方法的科学。

●总体:是指客观存在的,在某一相同性质基础上结合起来的许多个别事物的整体●总体单位:构成总体的个别事物●样本:从总体当中抽取出来,用从代表这一总体的部分个体组成的集合●标志:是说明总体单位属性或特征的名称●统计指标:说明总体数量特征的,简称指标。

有俩种理解,一是指反映现象总体数量特征的概念。

二是指反映现象总体数量特征的概念及其数量表现。

●普查:是专门组织的一次性的全面调查。

这种调查,主要用来搜集一些比较全面而又不能或不宜从经常调查中得出的统计资料。

●重点调查:是一种非全面调查,它是从所要调查的单位中选择一部分重点单位进行调查●抽样调查:也是一种非全面调查,它是按照随机原则从被研究总体中抽取出一定数量的单位(样本)进行调查,根据样本指标数值来推算总体指标数值的一种调查●典型调查:是一种十分重要的、行之有效的非全面调查方法。

它是从研究总体中有意识地选取若干具有代表性单位(典型单位)进行调查,用来了解总体的详细情况●统计调查:根据统计工作任务和统计设计的要求,用科学的方法,有计划有组织地向调查单位搜集调查资料的过程●统计分组:根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法●分配数列:又称分布数列、次数数列,是在统计分组的基础上形成的,用来反映总体单位在各组中分布状况的统计数列●总量指标:是反映社会经济现象的总体规模和水平的统计指标。

《统计学》名词解释及公式

《统计学》名词解释及公式

第1章统计与统计数据一、学习指导统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。

本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。

本章各节的主要内容和学习要点如下表所示。

二、主要术语1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。

2. 描述统计:研究数据收集、处理和描述的统计学分支。

3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。

4. 分类数据:只能归于某一类别的非数字型数据。

5. 顺序数据:只能归于某一有序类别的非数字型数据。

6. 数值型数据:按数字尺度测量的观察值。

7. 观测数据:通过调查或观测而收集到的数据。

8. 实验数据:在实验中控制实验对象而收集到的数据。

9. 截面数据:在相同或近似相同的时间点上收集的数据。

10. 时间序列数据:在不同时间上收集到的数据。

11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。

12. 普查:为特定目的而专门组织的全面调查。

13. 总体:包含所研究的全部个体(数据)的集合。

14. 样本:从总体中抽取的一部分元素的集合。

15. 样本容量:也称样本量,是构成样本的元素数目。

16. 参数:用来描述总体特征的概括性数字度量。

17. 统计量:用来描述样本特征的概括性数字度量。

18. 变量:说明现象某种特征的概念。

19. 分类变量:说明事物类别的一个名称。

20. 顺序变量:说明事物有序类别的一个名称。

21. 数值型变量:说明事物数字特征的一个名称。

22. 离散型变量:只能取可数值的变量。

23. 连续型变量:可以在一个或多个区间中取任何值的变量。

四、习题答案1. D2. D3. A4. B5. A6. D7. C8. B9. A10.A11.C、12.C13.B14.A15.C16.D17.C18.A19.C20.D21.A22.C23.C24.B25.D26.C27.B28.D29.A30.D31.A32.B33.C34.A35.A36.A37.D38.B39.B40.C41.C42.D43.C44.D45.A46.B47.C48.A49.C50.D51.A52.C53.D54.A55.B第2章数据的图表展示一、学习指导数据的图表展示是应用统计的基本技能。

统计学名词解释汇总

统计学名词解释汇总

统计学名词解释汇总1.统计学是一门科学,它涉及到收集、处理、分析和解释数据,并从数据中得出结论的过程。

统计方法可分为描述统计和推断统计两类。

2.统计数据可分为分类、顺序和数值型数据。

分类数据只能归于某一类别的非数字型数据,顺序数据只能归于某一有序类别的非数字型数据,而数值型数据则是按数字尺度测量的观察值。

此外,统计数据还可按采取计量尺度、收集方法和被描述对象与时间关系等不同方式进行分类。

3.总体是指研究对象的全体,样本是从总体中抽取的一部分,参数是描述总体特征的数值,而统计量则是描述样本特征的数值。

变量则是用来说明现象某种特征的概念,比如灯泡的寿命就是一个变量。

4.有限总体指总体的范围能够明确确定,而且元素的数目是有限可数的;无限总体则指总体包括的元素是无限不可数的。

5.变量可分为分类变量、顺序变量和数值型变量。

变量也可以分为随机变量和非随机变量,经验变量和理论变量。

6.离散型变量只能取有限个值,取值以整数位断开,比如企业数;连续型变量则取之连续不断,不能一一列举,比如温度。

数据的预处理包括数据审核、数据筛选和数据排序等内容。

3.抽样方法可以分为重复抽样和不重复抽样。

重复抽样是从总体中抽取一个元素后,将其放回到总体中再抽取下一个元素,直至抽取n个元素。

不重复抽样是一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取下一个元素,直到抽取n个元素为止。

4.抽样分布是指重复选取容量为n的样本时,由每一个样本算出的统计量数值的相对频数分布或概率分布。

它是一种理论分布,与总体分布有密切关系。

以样本均值为例,如果原有总体是正态分布,那么,无论样本容量的大小,样本均值也服从正态分布。

其分布的数学期望为总体均值,方差为总体方差的1/n。

如果原有总体的分布不是正态分布,就要看样本容量的大小了。

当n为大样本时(n≥30),根据中心极限定理可知,当样本容量n增大时,不论原来的总体是否服从正态分布,样本均值的抽样分布都将趋于服从正态分布。

统计学名词解释

统计学名词解释

统计学名词解释统计学是一门研究数据收集、整理、分析和解释的科学方法的学科。

它可以帮助我们理解和掌握数据,并从中获得有关群体和现象的知识。

以下是一些常见的统计学名词及其解释。

1. 总体(Population):指研究对象的全体,可以是人群、事物或过程等。

例如,全国所有成年人的收入水平就构成了一个总体。

2. 样本(Sample):总体的一个子集,用来代表总体,通常在实际研究中可以通过抽样获得。

例如,从全国所有成年人中抽取1000个人的收入数据作为样本。

3. 描述性统计(Descriptive Statistics):对数据进行整理、概括和描述的方法,包括测量中心趋势(如均值、中位数和众数)和离散程度(如标准差和方差)等。

4. 探索性数据分析(Exploratory Data Analysis):通过可视化和统计方法来分析数据,并发现其中的模式、关联和异常值等。

这有助于提供初步的见解,并指导后续的推断统计分析。

5. 推断统计学(Inferential Statistics):根据样本数据对总体进行推断的方法。

通过推断统计学,我们可以从样本的一部分数据中推断出总体的特征并作出相应的结论。

6. 参数(Parameter):总体的数值特征,如总体均值和总体比例等。

由于通常无法直接观察到总体参数,我们需要通过样本的统计量来估计总体参数。

7. 统计量(Statistic):样本的数值特征,如样本均值和样本比例等。

统计量是从样本中计算得到的,用来估计总体参数,并且可以用来做关于总体的推断。

8. 假设检验(Hypothesis Testing):用来进行统计推断的方法。

在假设检验中,我们提出一个关于总体的假设,并根据样本数据对其进行检验,判断其是否成立。

9. 显著性水平(Significance Level):假设检验中的一个事先指定的阈值,用来判断检验结果是否具有统计显著性。

通常使用的显著性水平是0.05,表示有95%的把握我们的结论是正确的。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

名词解释:医学统计学:用统计学的原理和方法研究生物医学问题的一门学科.变量(variable):观察单位的某项特征变量值(value of variable):变量的观察结果(测量值)总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。

样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。

随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。

同质(homogeneity):是针对被研究指标来讲,其影响因素相同。

简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。

变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。

等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡。

有序变量(定性变量的一种)。

概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大,0〈P(A)<1,小概率事件。

频率(frequency):在相同的条件下,独立重复做n次实验,事件A出现了m次,比值m/n称为随机事件A在n次实验中出现的频率。

随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计。

系统误差(system error):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。

随机变量(random variable):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。

参数(parameter):根据总体分布特征而计算的总体统计指标。

统计量(statistic):由总体中随机抽取样本而计算的相应样本指标。

频数表(frequency table):将各变量值及其相应的频数列出表格形式,用来表示一批数据各观察值出现的频繁程度。

算术均数(arithmetic mean):描述一组数据在数量上的平均水平。

总体均数用µ表示,样本均数用X表示。

几何均数(geometric mean):描述对数正态分布或数据呈倍数变化资料的水平,记为G.中位数(median),将一组观察值由小到大排列,n为奇数时取位次居中的变量值,为偶数时,取位次居中的两个变量的平均值。

极差(range):又称全距,为最大值与最小值之差,用于资料的粗略分析,计算简便但稳定性较差.符号R.百分位数(percentile):将n个观察值从小到大依次排列,再把它们的位次转化为百分位.四分位数间距(inter quarnle range):表示百分位数P75和百分位数P25之差,定义为Q=P75-P25。

方差(variance):表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

标准差(standard deviation):是描述反映正态分布计量资料离散程度的指标。

是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大小样本均可,最为常用。

变异系数(coeffi cie nt o f varia tion ):用于量纲不同和变量间或均数相差较大的变量间变异程度的比较,其计算公式为: CV=100%⨯XS 正态曲线(normal cur ve)是函数f (X)=222)(21σμπσ--x e 对应的曲线,此曲线是一条高峰位于中央,两侧逐渐下降并完全对称,曲线两端永远不与横轴相交的钟形曲线。

正态分布(normal distr ibu tion ):若指标X 的频率曲线对应于正态曲线,则称该指标服从正态分布,通常用记号N(µ,σ2)表示均数为标准差为的正态分布。

标准正态分布(s ta ndard no rmal dis tr ibut ion):均数为0标准差为1的正态分布为标准正态分布,记为N(0,1)。

标准化转换(sta nda rd ized trans formation ):若随机变量X服从正态分布N(µ,σ2),经过标准化转换Z=σμ-X ,就服从标准正态分布。

统计推断(st atis tical infer en ce):通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程为统计推断。

抽样误差(s amp lin g error ):由个体差异产生,由于抽样而造成的样本统计量与样本统计量及样本统计量与总体参数之间的差异称为抽样误差,无倾向性,不可避免。

均数的标准误(sta ndard er ror of me an S EM):用于表示均数抽样误差的指标,反映样本均数之间的离散程度和样本均数抽样误差的大小。

可信区间(confidenc e int er val CI ):为按预先给定的概率确定的包含未知总体参数的可能范围,含义是包含总体参数的可能性是1-a 。

自由度:n 个变量中,可自由取值的变量的个数。

参数估计:用样本指标(统计量)估计总体指标(参数),有点估计和区间估计两种。

假设检验中P 的含义:指从H 0规定的总体随机抽得的等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。

I 类错误:拒绝了实际上成立的H0这类弃真的错误称为I 类错误,概率大小用alfa 表示。

I I类错误:接受了实际上不成立的H0这类存伪的错误称为I I类错误,概率大小用β表示。

检验效能:是指当两总体确有差别,按规定的检验水准所能发现该差异的能力.数值表示:1-β检验水准:是预先规定的,当假设检验结果拒绝H 0接受H1下有差别的结论时犯错误的概率称为检验水准,记为α均方:有离均差平方和被自由度相除而得。

方差分析:根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个或某几个因素的作用加以解释,通过各变异来源地均方与误差均方比值的大小,借助F分布做出统计推断,判断各因素对观测指标有无影响。

总变异:样本中全部实验单位差异称为总变异,其大小可用全部观察值的均方表示. 组间变异:各处理组间观察值大小不等,这种变异称为组间变异,可用组间均方表示. 组内变异:各处理组内部观察值大小不等,这种变异称为组内变异,可用组内均方表示。

完全随机设计:只考虑一个处理因素,将全部受试对象随机分配到各处理组,然后观察实验效应.随机区组设计:事先将全部受试对象按自然属性分为若干区组,原则是各区组内的受试对象的特征相同或相近,且受试对象数与处理因素的水平相等,然后将每个区组内的观察对象随机地分配到各处理组。

相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有“率,构成比,比”等。

率:频率指标,说明一定时期内某现象发生的频率或强度,计算公式为发生某现象的观察单位数除以可能发生某现象的观察总体值*100% 表示方式有百分率%,千分率。

构成比:构成指标。

说明某一事物内部的各组成部分所占的比重或分布,计算公式为:某一组分的观察单位数除以同一事物各组分的观察单位总数*100%,表示方法有百分数等. 比相对比。

是A B两个有关指标之比,说明A是B 的若干倍或百分之几,计算公式为比等于BA . 标准化法:常用于内部构成不同的两个或多个率比较的一种方法,基本思想是指定一个统计标准,按指定标准计算调制率,使之具备可比性以后再比较,以消除由于内部构成不同对总率比较带来的影响。

定基比:统一用某个时间的指标作为基数,其它各时间的指标与之相比。

ﻫ环比:以前一个时间的指标作基数,以相邻的后一个时间的指标与之相比.平均增长速度:用于概括某一时期的平均速度变化,即该时期环比的几何均数减1。

计算公式为平均增长速度=平均发展速度-1=10n n a a 粗死亡率(crude death r ate CDR ):或死亡率(morta lity rat e),指某地某年平均每千人口中的死亡数,它反映居民总的死亡水平。

发病率(incid ence rat e IR):表示一定时期内,可能发生某病的一定人群中新发生某病的强度.患病率(prevale nce rat e PR):又称现患率,指某时刻点上受检人群中现患某种疾病的频率,通常用于描述病程较长或发病时间不明确的疾病的患病情况。

动态数列(dy nami c ser ies )按一定的时间顺序,将一系列描述事物的统计指标依次排列起来,就可以观察和比较该事物在时间上的变化和发展趋势。

标化死亡率(stand ardiz ed mort ality rat e SM R):寻找一个统一的分布作为标准组,然后每个比较组均按照该分布标准计算相应的死亡率,所得到的死亡率是相对于标准组的,故称为标化死亡率,由于采取了统一的标准,消除了内部分布不同对总死亡率的影响,使算得的标化死亡率具有可比性。

二项分布(Binomi al distrib ution):如果每一次实验只有阳性或阴性两种可能的结果,每次实验阳性结果的发生概率均为π,阴性结果均为1—π,每次实验结果是相互独立的,那么重复n次实验,发生阳性结果次数X 的概率分布称为二项分布。

拟合优度:指一种度量某事物的频数分布是否符合某一理论分布或数据是否与模型吻合的方法。

非参数统计:不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验。

参数统计:通常要求样本来自总体分布型是已知的,在这种假设的基础上,对总体参数进行估计和检验.秩次:变量值按从小到大顺序所编的秩序号。

秩和:各组秩次的合计称为秩和,是非参数检验的基本统计量.直线回归:建立一个描述应变量依自变量而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小.回归系数:即直线的斜率,直线回归方程中用b表示,其统计意义为X每增减一个单位,Y平均改变b个单位。

直线相关:用于双变量正态分布资料,有正相关,负相关和零相关等关系。

零相关表示两变量之间美欧直线相关系数。

相关系数或积差相关系数:以符号γ表示样本相关系数,p表示总体相关系数,它是说明具有直线关系的两个变量间相关关系的密切程度与相关方向的指标。

秩相关或等级相关:用双变量等级数据作直线相关分析,适用于1,不服从双变量正态分布而不宜作积差相关分析,2,总体分布型未知,3,用等级表示原始数据。

统计图:将统计指标用几何图形表达,即以点的位置,线段的升降,直条的长短和面积的大小等形式直观的表示事物间的数量关系。

相关文档
最新文档