统计学名词解释汇总

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1什么就是统计学?统计方法可分为哪两大类?统计学就是收集、处理、分析、解释数据并从数据中得出结论的科学。方法有描述统计与推断统计两类

2统计数据可分为哪几种类型?不同类型数据各有什么特点?按采取计量尺度,分类、顺序、数值型数据;按统计数据收集方法,观测、实验数据;按被描述对象与时间关系,截面、时间序列数据

统计数据;按所采用的计量尺度不同分;

(定性数据)分类数据:只能归于某一类别的非数字型数据,它就是对事物进行分类的结果,数据表现为类别,用文字来表述;

(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也就是有类别的,但这些类别就是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;

观测数据:就是通过调查或观测而收集到的数据,这类数据就是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;

截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

3举例说明总体、样本、参数、统计量、变量这几个概念:对一千灯泡进行寿命测试,那么这千个灯泡就就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就就是样本,这一千个灯泡的寿命的平均值与标准差还有合格率等描述特征的数值就就是参数,这一百个灯泡的寿命的平均值与标准差还有合格率等描述特征的数值就就是统计量,变量就就是说明现象某种特征的概念,比如说灯泡的寿命。

4什么就是有限总体与无限总体?举例说明

有限总体指总体的范围能够明确确定,而且元素的数目就是有限可数的,如若干个企业构成的总体,一批待检查的灯泡。无限总体指总体包括的元素就是无限不可数的,如科学实验中每个试验数据可瞧做就是一个总体的一个元素,而试验可无限进行下去,因此由试验数据构成的总体就是无限总体

5变量可分为哪几类?

变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量与非随机变量。经验变量与理论变量。6举例说明离散型变量与连续型变量

离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”

连续型变量,取之连续不断,不能一一列举,比如“温度”。

1数据的预处理包括哪些内容?

数据审核(完整性与准确性;适用性与实效性),数据筛选与数据排序。

2直方图与条形图有什么区别?

①条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,②直方图各矩形连续排列,条形图分开排列,③条形图主要展示分类数据,直方图主要展示数值型数据。

3饼图与环形图有什么不同?

饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。

4茎叶图与直方图相比有什么优点?

茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。

5使用图标应注意哪些问题?

①合理安排统计表结构②表头一般包括表号,总标题与表中数据的单位等内容③表中的上下两条横线一般用粗线,中间的其她用细线④在使用统计表时,必要时可在下方加注释,注明数据来源。

1、一组数据的分布特征可以从哪几方面进行测度。

一就是分布的集中趋势,反映数据向其中心靠拢或聚集的程度;二就是分布的离散程度,反映各数据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。

2、简述四分位数的计算方法:首先对数据进行排序,然后确定四分位数所在的位置,该位置上的数值就就是四分位数。(设25%的四分位数为Q25%,75%四分位数为Q75%,根据四分位数定义有:Q 25%位置=n/4,Q75%位置=3n/4。

3、对于比率数据为什么采用几何平均。

在实际应用中,对于比率数据的平均采用几何平均要比算数平均更合理。从公式∏+=+=n 1i i n G G 11)()(中也可瞧出,G就就是平均增长率。

4、简述众数、中位数、与平均数的特点与应用场合。

众数就是一组数据分布的峰值,不受极端值的影响,缺点就是具有不唯一性。众数主要作为分类数据的集中趋势测度值。

中位数就是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其她分位数主要适合于作为顺序数据的集中趋势测度值。

均值就是就数值型数据计算的,具有优良的数学性质,缺点就是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。

5、 为什么要计算离散系数。

第一,极差、平均差、方差与标准差等都就是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。第二,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低与计量单位不同对离散程度的测度值的影响,需要计算离散系数。

6.简述异众比率、四分位差、方差或标准差的适用场合

对于顺序数据,但主要使用四分位差来测量其离散程度;对于数值型数据,虽然可以计算异众比率与四分位差,但主要使用方差或标准差来测量其离散程度。

7、标准分数有哪些用途?

标准分数给出了一组数据中各数值的相对位置。在对多个具有不同量纲的变量进行处理时,常需要对各变量进行标准化处理。它还可以用来判断一组数据就是否有离群数据。

1、抽样推断的含义:就是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性作出具有一定可靠程度的估计判断。

2、简单随机抽样:①含义:从含有N个元素的总体中,抽取n个元素作为样本,使得每一个容量为n的样本都有相同的机会被抽中,这样的方式称为简单随机抽样。②特点:简单随机抽样就是其她抽样方法的基础。有两种抽取元素的方式:重复臭氧与不重复抽样。分层抽样:①含义:在抽样之前先将总体的元素划分为若干层,然后从各个层中抽取一定数量的元素组成一个样本,这样的样本抽样方式称为分层抽样,也成分类抽样。②特点:⑴除了可以对总体进行评估外,还可以对各层的子总体进行评估。⑵可以按自然区域或行政区域进行分层,使抽样的组织与实施都比较方便。⑶分层抽样的样本分布在各个层内,从而使样本在总体中的分布比较均匀。⑷可以提高估计的精度。

系统抽样:①含义:先将总体个元素按照某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。②特点:⑴简单易行⑵在总体中的分布一般也比较均匀,由此估计的误差通常要小于简单随机抽样。

整群抽样:①含义:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察。②特点:不需要有总体元素的具体名单而只要有群的名单就

相关文档
最新文档