05 离中趋势测量法

合集下载

描述离中趋势的测定内容

描述离中趋势的测定内容

描述离中趋势的测定内容离中趋势是指一个数据集或样本中的数据点偏离中心或均值的趋势。

在统计学和机器学习中,离中趋势的测定是非常重要的,可以用于评估数据集中的数据分布、检测异常值、预测趋势等。

以下是几种常见的离中趋势测定方法:1. 中心度测定 (Centrality Determination):中心度是指一个数据点在网络中的重要性。

在社交网络分析中,中心度可以用于测定一个节点在网络中的中心地位。

在图论中,节点的中心度是指该节点在网络中的度数总和。

在统计学中,中心度可以用于测定数据的中心度。

2. 分布测定 (Distribution Determination):分布是指数据集或样本的分布情况。

在统计学中,分布测定可以用于评估数据的分布形状、对称程度、峰度等。

常用的分布测定方法包括正态分布测定 (Normal Distribution Determination)、偏态分布测定 (Unimodal Distribution Determination)、双态分布测定 (Bimodal Distribution Determination) 等。

3. 异常值检测 (Outlier Detection):异常值是指数据集或样本中偏离正常范围的数据点。

在统计学和机器学习中,异常值检测可以用于检测数据集中的异常值、预测趋势等。

常用的异常值检测方法包括离群值检测 (Outlier Detection)、异常点检测 (Outlier Detection)、离中趋势测定 (Centrality Determination) 等。

4. 趋势测定 (Trend Determination):趋势是指数据集或样本在一定时间内的变化趋势。

在统计学和机器学习中,趋势测定可以用于评估数据的变化情况、预测未来趋势等。

常用的趋势测定方法包括时间序列分析 (Time SeriesAnalysis)、回归分析 (Regression Analysis) 等。

离中趋势分析法

离中趋势分析法

离中趋势分析法
离散度分析法是测度一组数据分散程度的方法。

. 分散程度反映了一组数据远离其中心值的程度,因此也称为离中趋势。

. 从集中趋势和分散程度两个方面才能完整的说明一组数据的变动趋势。

. 集中趋势的测度值是对数据水平的一个概括性度量,它对一组数据的代表程度取决于该组数据的离散水平。

. 数据的分散程度越小,集中趋势的测度值对这组数据的代表性就越好,反之,分散程度越大,代表性就越好 [1] 。

. 中文名. 离散度分析法. 外文名. Discrete analysis method.
中文名: 离散度分析法
别名: 离中趋势
外文名: Discrete analysis method
所属学科: 数学(统计学)
相关概念: 异众比例、方差、离散系数等。

第四章 离中趋势的测量

第四章  离中趋势的测量

第二节 方差和标准差

平均差AD:差异量数的指标。
方差(variance):指离差平方的算术平均数 定义公式:


2
2 ( X ) i i 1
N
N
分组数据的样本方差
f (M
i
分组数据
s
2
i
x)
2
n 1
2 i
一般数据
s
2
(x x ) n 1

0.25 Q1
0.25
0.25 Q2
0.25 Q3
计算第p百分位步骤
第一步:从小到大排列原始数据 第二步:计算指数i i=(p/100)×n, n为项数,p为所求的百分位的位置 第三步:若i不是整数,将i向上取整;若i是整数,则第p百分位数是第i项 与第 i+1 项数据的平均值 例:有12个职员薪金的数据,求第85和第50百分位数。 解:(1)将12个数据从小到大排序如下: 2210 2225 2350 2380 2380 2390 2420 2440 2450 2550 2630 2825 (2) i=(p/100)×n=(85/100)×12=10.2 (3) 由于i=10.2不是整数, 向上取整,所以第85百分位数对应的是 第11项, 其值为2630。 同理,计算第50百分位(中位数)。i=(50/100) ×12=6,是整数, 第50百分位数是第6项和第7项的平均值,即(2390+2420)/2=2405。
0 1 1 4 0 4
N=6
x 0
x
2
10
X
2 i
226
X
2
i
36
10 S 2 5
10 S 1.414 5

第五章 离中趋势测量法

第五章 离中趋势测量法

Σ( x − x ) f σ= Σf
2
…………(5.6) ( )
例4,仍以例 的资料为例说明加权标 ,仍以例2的资料为例说明加权标 准差的计算,见表5- 。 准差的计算,见表 -4。(FJ5-5)
在实际应用中, 在实际应用中,标准差和方差的计算 可采用下列简单公式计算。 可采用下列简单公式计算。 在资料未分组时,简单公式为: 在资料未分组时,简单公式为:
Z分数的数学性质: 分数的数学性质: 分数的数学性质
分数之和等于零, ⑴Z分数之和等于零,因为: 分数之和等于零 因为: (x − x ) 1 ΣZ = Σ = Σ( x − x ) = 0LLL (5.13) σ σ 分数的算术平均数等于零, ⑵Z分数的算术平均数等于零,因为: 分数的算术平均数等于零 因为: ΣZ Z= = 0LLL (5.14) n 分数的标准差等于1, 分数的方差也等于 分数的方差也等于1,因为: ⑶Z分数的标准差等于 ,Z分数的方差也等于 ,因为: 分数的标准差等于
Σ( Z − Z ) 2 ΣZ 2 1 x−x 2 Z 分数的标准差 = = = Σ( ) n n n σ 1 Σ( x − x ) 2 = = 1LLL (5.15a) 2 σ n
Z分数的方差=1 分数的方差= 分数的方差
……………(5.15b) ( )
(五)是非标志与成数 是非标志是指能将统计总体的全部 单位划分为具有某种属性和不具有 某种属性的两组的分组标志。 某种属性的两组的分组标志。 成数就是总体中具有某种属性的 单位数占全部单位数的比重, 单位数占全部单位数的比重,一 般用英文字母p或 表示 表示。 般用英文字母 或q表示。
(总标准差)σ = 209.98 = 14.49(分)
(四)标准分 标准分是离差与标准差的比值, 标准分是离差与标准差的比值,即:

离中趋势的测定

离中趋势的测定

离中趋势的测定
离中趋势是统计学中用于描述数据集中趋势的一种指标。

常见的离中趋势测定方法包括以下几种:
1. 平均值:计算数据集的算术平均值,即将所有数据相加后除以数据的个数。

2. 中位数:将数据集按照大小的顺序排列,然后找出中间位置的数值。

如果数据个数为奇数,则中位数是中间的数值;如果数据个数为偶数,则中位数是中间两个数值的平均值。

3. 四分位数:将数据集按照大小的顺序排列,然后将数据集分成四个等分,每个等分包含25%的数据。

第一个四分位数(Q1)是数据集的25%位置处的数值,第二个四分位数是数据集的50%位置处的数值(即中位数),第三个四分位数(Q3)是数据集的75%位置处的数值。

4. 极差:计算数据集的最大值与最小值之间的差值。

5. 方差:计算数据集中每个数据与平均值的差值的平方的平均值。

6. 标准差:方差的平方根。

这些测定方法可以帮助我们了解数据集的离散程度和分布情况,从而揭示出数据集的离中趋势。

选择合适的测定方法取决于数据集的特点以及我们希望得到的信息。

离中趋势的测度演示文稿

离中趋势的测度演示文稿
z)2 n
(zi 0)2 z2
n
n
1
n
(xi x)2 s2
s2 s2
1
第32页,共53页。
标准分数(性质)
z分数只是将原始数据进行了线性变换,它并没 有改变一个数据在改组数据中的位置,也没有改变该 组数分布的形状,而只是将该组数据变为均值为0, 标准差为1。
第33页,共53页。
第15页,共53页。
极差(range)
1. 一组数据的最大值与最小值之差
2. 离散程度的最简单测度值
3. 易受极端值影响
4. 未考虑数据的分布
5. 计算公式为
6.
R = max(xi) - min(xi)
第16页,共53页。
2、从波动大小进行分析。观察折线图, 你 能发现两人射击成绩的波动差异吗?
比例
频率 (%)
别克 福特 马自达 标志 现代 吉利
112 0.560 56.0 51 0.255 25.5 9 0.045 4.5 16 0.080 8.0 10 0.050 5.0 2 0.010 1.0
合计
200 1 100
解:
Vr
200 112 112
1 112 200
0.44 44%
1、 从变化范围的大小进行分析,谁参加比赛更合适呢?
通常,一组数据中的最大值减去最小值所得的差,叫做这组数 据的极差(range)
极差=数据中的最大值-数据中的最小值
小结:极差表示了一组数据变化范围的大小,但由于只考虑了它 的两个极端数据的变化,而没有考虑其它数据,因此用它来表示 一组数据的波动情况还比较粗略.
s i1
75.56 8.69(小时)
n 1
第23页,共53页。

第五章-离中趋势测量法

第五章-离中趋势测量法

⑴简单标准差 对于未分组资料计算标准差时可 采用简单法,其计算公式为:

(x x ) n
2
例,求26,45,88,62,74这些数字的标准差
⑵加权标准差 按照分组资料(变量数列)计算标准差时可采 用加权法。由组距数列计算标准差时,还应先 求出组中值(开口组的组中值以邻近组的组距 确定),再按加权法计算。其计算公式为:
AD x x n
…………(5.1)
例1,有两个参赛篮球队队员身高(单位:cm)如下: 甲队:185 191 195 202 217 乙队:190 197 199 200 204 以上述资料为例,计算简单平均差。
⑵加权平均差 在资料已经分组时,平均差采用加 权平均法计算,其计算公式为:
AD
第五章 离中趋势测量法 离中趋势测量法
离中趋势是指变量数列中变量值 之间的差异程度或离散程度。
本章重点: 1、平均差 2、方差与标准差 3、离散系数 本章难点: 1、方差与标准差 2、是非标志的方差
变异指标的概念和作用
一、变异指标的概念 变异指标又称标志变动度,是反映总体各单位标志值之间差异程度的 综合指标。 二、变异指标的作用 1、是衡量平均指标代表性的尺度 2、可用来研究现象的稳定性和均衡性 3、在抽样调查和相关分析中有着重要作用 变异指标用以反映总体各单位标志值的变动范围或参差程度,与平 均指标相对应,从另一个侧面反映了总体的特征。变异指标不仅可以 综合地显示变量值的离中趋势,还可以用来判别平均数的代表性。
(1)当 x M
e
M 0时 , 对 称 分 布 ;
,右偏分布; <Me < Mo时,左偏分布。
(三) 偏态系数
我们在前面讨论统计图时已经对频数分布的正态和 偏态有所认识。我们又看到了算术平均数与中位数、众 数之间存在的关系:当总体呈对称分布时,X 、 M 、 M 三者完全相等;当总体呈不对称的偏态分布时,它们之 间存在着数量(位置)的差异。因此,偏态可由 X 与 M o 的差来表示,即

离中趋势的测度

离中趋势的测度

2552.8(7 元)
i1
k
(xi x)2 fi
电话费用的标准差为: s
i1 k
2552.87 50.53(元)
( fi) 1
i1
第二十五页,共56页。
平均差
(mean deviation)
1. 各变量值与其均值(jūn zhí)离差绝对值的平均数 2. 能全面反映一组数据的离散程度 3. 数学性质较差,实际中应用较少
合计
200 1 100
解:
Vr
200 112 112
1 112 200
0.44 44%
在所调查的200人当中,关注非 别克的人数占44%,异众比率还是 比较大。因此,用“别克”来反映 城市居民对汽车品牌的一般趋势, 其代表性不是很好
第八页,共56页。
四分(sì fēn)位差(quartile deviation)
4. 计算公式为
未分组数据 (shùjù)
组距分组数据 (shùjù)
n
xi x
M d i1 n k Mi x fi
M d i1 n
第二十六页,共56页。
平均差 (例题(lìtí)分析)
某电脑公司销售量数据平均差计算表
按销售量分组
140—150 150—160 160—170 170—180 180—190 190—200 200—210 210—220 220—230 230—240
只有n-1个数据可以自由取值,其中必有一个数据则 不能自由取值 3. 例如,样本有3个数值,即x1=2,x2=4,x3=9,则
x = 5。当 x = 5 确定后,x1,x2和x3有两个数据 可以自由取值,另一个则不能自由取值,比如x1=6, x2=7,那么x3则必然取2,而不能取其他(qítā)值 4. 样本方差用自由度去除,其原因可从多方面来解释, 从实际应用角度看,在抽样估计中,当用样本方差去 估计总体方差σ2时,它是σ2的无偏估计量

离中趋势的量度:变异指标

离中趋势的量度:变异指标

第五章离中趋势测量法平均指标对总体的共性和一般水平作了概括,以此来说明总体标志值分布的集中趋势。

但是总体作为统计对象,还有其变异性的一面。

变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。

变异指标不仅可以综合地显示变量值的离中趋势,还可以用来判别平均数的代表性。

所谓离中趋势,是指数列中各变量值之间的差距和离散程度。

离势小,平均数的代表性高;离势大,平均数代表性低。

变异指标的种类较多,如按计算的基准来分有以下两类:(1)以两数之差来表达的有全距和四分位差等。

(2)以对平均数偏差来表达的有平均差、标准差等。

变异指标如按数量关系来分有以下两类;(1)凡用绝对数来表达的变异指标,统称绝对离势,主要有极差、平均差、四分位差、标准差等。

(2)凡用相对数来表达的变异指标,统称相对离势,主要有异众比率、标准差系数、平均差系数和一些常用的偏态系数。

第一节全距与四分位差1.全距全矩是最大变量值与最小变量值之差,用R来表示。

对未分组资料,计算全距用原始式。

由于全距是一组数据中两个极端值之差,所以它又称极差。

全距的最大优点是:计算简单,便于直观。

缺点是;①受极端值影响大,遇含开口组的资料时将无法计算;②由于没有量度中间各个单位间的差异性,所以数据利用率很低,信息丧失严重;③受抽样变动影响很大。

一般说来,大样本全距要比小样本全距大些,因为大样本有较多的机会包含最极端的变量值。

2.四分位差四分位是用第三四分位数和第一四分位数的半距作为测定离中趋势的一种变异指标,它可以避免全距测量离中趋势受极端值影响大这个缺点。

但由于它仅以两数之差为基准,全距的另两个缺点依然无法避免。

第二节平均差要测定变量值的离中趋势,尤其是要测定各变量值相对于平均数的差异情况,一个很自然的想法就是计算各变量值与算术平均数的离差。

但由于算术平均数的性质,各变量值与其算术平均数离差的代数和恒为零,所以用这个性质无法构造出能够测定离中趋势的变异指标。

第五章 离散趋势测量法

第五章  离散趋势测量法

第五章离散趋势测量法第二节、全距与四分位差? 一、全距???? min(Xi)1、未分组资料计算公式全距又称极差,是一组数据的最大值与最小值之差,用表示。

计算公式为:R?max(Xi)?min(Xi)式中,X i、max() 分别表示为一组数据的最大值与最小值。

由于全距是根据一组数据的两个极值表示的,所以全距表明了一组数据数值的变动范围。

越大,表明数值变动的范围越大,即数列中各变量值差异大,反之,越小,表明数值变动的范围越小,即数列中各变量值差异小。

2、分组资料计算公式R=最高组上限- 最低组下限????? R=最高组组中组-最低组组中值R=最高组组中组-最低组下限R=最高组上限-最低组组中值如果资料经过整理,并形成组距分配数列,全距可近似表示为:R≈最高组上限值-最低组下限值3、优缺点:优点:计算简单,易于理解。

缺点:(1)受极端值影响大,遇含开口组的资料时无法计算;(2)数据利用率低,信息丧失严重;(3)受抽样变动影响大(一般大样本的全距会比小样本的全距大)。

二、四分位差(inter-quartile range)上四分位数与下四分位数之差的平均数,称为四分位差,亦称为内距或四分间距。

四分位差的计算方法:Q·D=(Q3-Q1) /2四分位差反映了中间50%数据的离散程度,其数值越小,说明中间的数据越集中;数值越大,说明中间的数据越分散。

此外,由于中位数处于数据的中间位置,因此,四分位差的大小在一定程度上也说明了中位数对一组数据的代表程度。

四分位差主要用于测度顺序数据的离散程度。

当然,对于数值型数据也可以计算四分位差,但不适合于分类数据。

优缺点:主要是避免了全距受极端值影响的缺点,其他优缺点同全距:数据利用率低,信息丧失严重;受抽样变动影响大。

第三节、平均差??? 平均差是各变量值与其算术平均数离差绝对值的平均数,用A.D表示。

根据掌握资料的不同,平均差有以下两种计算方法:1. 简单平均法对于未分组资料,采用简单平均法。

第五章离散趋势的测量

第五章离散趋势的测量
庭人均月收入的四分位差为:
• QU—QL=?
• 上四分位数 下四分位数: • 数值型分组数据的四分位数(计算公式)
• 四分位差主要用于测度顺序数据的离散程
度。当然,对于数值型数据也可以计算四 分位差,但不适合于分类数据。
• 优缺点:主要是避免了全距受极端值影响
的缺点,其他优缺点同全距:数据利用率 低,信息丧失严重;受抽样变动影响大。
第五章 离散趋势测量法
本章主要内容:
离散趋势的测定方法(重、难点) 各种离散趋势测量指标的比较
第一节 变异指标相关概念
• 一、变异指标含义
• 平均指标是统计总体中各单位某一数量标志的
一般水平,反映了总体分布的集中趋势。集中 趋势只是数据分布的一个特征,它所反映的是 各变量值向其中心值聚集的程度。而这种聚集 的程度显然有强弱之分,这与各变量值的差异 有着密切的联系。变量值的差异越大,数值的 集中趋势越弱,变量值的差异越小,数据的集 中趋势越强。因此,要全面描述数据的分布特 征,除了要对数据集中趋势加以度量外,还要 对数据的差异程度进行度量。数据的差异程度 就是各变量值远离其中心值的程度,因此也称 为离中趋势。
特征值,因此,它在统计分析、统计推断 中具有很重要的作用。具体可以概括为以 下几点:
• 1.反映总体各单位变量值分布的均衡性
• 一般来说,标志变异指标数值越大,总体
各单位变量值分布的离散趋势越高、均衡 性越低,反之,变量值分布的的离散趋势 越低、均衡性就越高。
• 2.判断平均指标对总体各单位变量值代表性的高
• QU的位置=
3(n+1) 4
=
3

(9+1) 4
=7.5
,即QU在第7个数值
(1500)和第8个数值(1630)之间0.5的

社会统计学课件:第4章 离中趋势的测量

社会统计学课件:第4章 离中趋势的测量
(2)它将总体中各单位标志值的差异全包括在内,受 抽样变动影响小。但在受极端值影响以及处理不确定组 距方面,缺点同算术平均数。
f
190
1090750 5740.79 190
2 x2 x 2
5740 .79 74.47 2 195 .01
13.96
成绩
x
人数 f
50 以下 45
10
50—60 55
20
60—70 65
40
70—80 75
50
80—90 85
40
90 以上 95
30
合计
190
标准差的作用
用来比较分析两个或两个以上同类现象平均数相等时平均 数的代表性:即
第四章 离中趋势测量法
二、标志变异指标的作用
1、用标志变异指标衡量和比较平均指标 的代表性。
2、用标志变异指标反映经济活动过程的 均衡性、稳定性和节奏性。
3、标志变异指标在相关分析和抽样调查 中的应用。
甲乙丙三车间都有7个工人,生产的零件 数如下:
甲:72 73 74 75 76 77 78 乙:30 50 65 75 90 100 115 丙:75 75 75 75 75 75 75 平均数都为75件。但代表性谁好。
R =Xmax– Xmin
[例] 求74,84,69,91,87,74,69这些数字 的全距。
[解] 把数字按顺序重新排列:69,69,74, 74,84,87,91,显然有
R =Xmax– Xmin =91—69=22
对分组资料,不能确知最大值和最小值,求全距: (1)用组值最大组的组中值减去最小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限;

离中趋势的度量中小学PPT教学课件

离中趋势的度量中小学PPT教学课件

那为什么平均数被固定后会限制数据的自由变化?
假设一个样本有两个数值,X1=10,X2=20,我们现在要用这个 样本估计总体的方差,则样本的平均数是:
Xm= X/n=(10+20)/2=15 现在假设我们已知Xm=15,X1=10,根据公式Xm= X/n,则有:
X2=2Xm-X1=2×15-10=20 由此我们可以知道在有两个数据样本中,当平均数的值和其中
使用 统计量 范围
方差(2 )
总体 标准差()
定义公式 (X-)2/n
√(X-)2/n
计算公式 (X2-(X)2/n)/n
√(X2-(X)2/n)/n
方差(S2 ) 样本 标准差(S)
(X-Xm)2/(n-1)
√(X-Xm)2/(n-1)
(X2-(X)2/n)/(n-1)
√(X2-(X)2/n)/(n-1)
如果从总体中随机抽取一个样本,样本包含有无限多 个个体,则计算样本平均数的公式为:
Xm= X/n
这就是总体平均数的无偏估计值。这样我们就可以 将下列公式中的用Xm替代,作为样本估计总体方
差的无偏估计值。
2= (X-)2/n
2=S2= (X-Xm)2/n
但是,统计学家发现用这样的公式求出来的方差 低估了总体的变异,因此使用(X-Xm)2/n来估 计总体的方差时,分母的n必须改为(n-1)才不 会低估总体的方差,这里(n-1)就叫做样本的 自由度。
水稻是世界第二大粮食作物,播种面积和总产量仅次 于小麦。我国播种面积占粮食作物播种面积的30%左右, 而稻谷产量占粮食总产的40%以上,播种面积和总产量均 居粮食作物之首。全国约有2/3的人口以稻米为主食。
2021/2/12
35
(二)水稻生产重要的原因

离中趋势和集中趋势的度量 PPT

离中趋势和集中趋势的度量 PPT
中位数就是指将总体 各单位标志值按照大 小顺序排列后,处于中 间位置得那个标志值, 用Me表示。
第三节 位置平均数
中位数将变量数列分为相等得两部分,
一部分得标志值小于中位数,另一部分得标
志值大于中位数。
如何确定中位数?
1、由未分组得数据确定中位数 2、由单项数列确定中位数 3、由组距数列确定中位数
1
2
f
x ......
2
n
f
n
f f ...... f
1
2
n
(x1
x
2
......
x
)
n
f
nf
x1 x 2 ...... x n
n
第二节 数值平均数
(五)算术平均数得数学性质 ⒈各变量值与算术平均数得离差之 和为零。这一性质说明算术平均数 就是一组数据得重心。
(x x) 0或 (x x) f 0
上述三个指标带有计量单位,而且其离中 趋势大小与变量平均水平得高低有关。
要比较数据平均水平不同得两组数据得 离中程度得大小,就有必要计算她们得相对 离中程度指标,即离散系数。
常用得离散系数指标就是标准差系数。
第二节 数值平均数
几何平均数
几何平均数就是n个变量值连乘积得n次方根,适应于 计算平均比率和平均速度。根据掌握得资料不同,有 简单几何平均数和加权几何平均数两种。
简单几何平均数适应于已知每个比率或每个速度求 平均数得情况。
x x x x n ...... n x
G
12
n
第二节 数值平均数
2、如果就是单项式数列或未分组得数 据,出现次数最多得那一个标志值就就 是众数。
3、由组距式数列确定众数,先根据次数 得多少确定众数组,然后可按下述公式 之一计算:

第五章-离中趋势测量法-版演示课件-精选.ppt

第五章-离中趋势测量法-版演示课件-精选.ppt
避免全距受极端值影响大的缺点。
请大家计 算下,看 能否算对
求下列两组成绩的四分位差: A: 78 80 82 85 89 87 90 86 79 88 84 81 B: 55 68 78 88 99 100 98 90 85 83 84 81
精品
第二节 平均差(Mean absolute deviation)
即克服平均差带有绝对值的缺点,又保留其综合 平均的优点。
1. 对于未分组资科
精品
求72、81、8681 86 69 57 365
(X X)
-1 8
13 -4 -16
0
(X X )2
1 64 169 16 256 506
精品
X2
5184 6561 7395 4761 3249 27151
1. 变异系数
绝对离势统计量与其算术平均数的比率,用 V表示。变异系数是最具有代表性的相对离势。
精品
全距系数 全距系数是众数据的全
距与其算术平均数之比,其计 算公式是 平均差系数
平均差系数是众数据的平 均差与其算术平均数之比,其 计算公式是 标准差系数
标准差系数是众数据的标 准差与其算术平均数之比,其 计算公式是
或最大组的上限减去最小组的组中值
运用上述方 法计算左边 数列的全距
精品
优点:
计算简单、直观。
缺点:
(1)受极端值影响大; (2) 没有量度中间各个单位间的差 异性,数据利用率低,信息丧失严重;
(3)受抽样变动影响大,大样本全距 比小样本全距大。
精品
2. 四分位差(Quartile deviation) 第三四分位数和第一四分位数的半距。
(2)它将总体中各单位标志值的差异全包括在内,受 抽样变动影响小。但在受极端值影响以及处理不确定组 距方面,缺点同算术平均数。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第五章离中趋势测量法
一、填空
1.对收集来的数据,数值最大者和最小者之差叫作(全距),又称之为(极差)。

2.各变量值对其算术平均数(或中位数)离差绝对值的算术平均数。

称之为(平均差)。

3.全距由于没有度量(中间各个单位)之间的变异性,所以数据资料的利用率很低。

4.用绝对离势除以均值得到的相对指标,即为(离散系数)。

5.所谓(异众比率),是指非众数的频数与总体单位数的比值
6.偏斜系数是以标准差为单位的算术平均数与众数的离差,其取值一般在(0)之间。

偏斜系数为0表示(土),偏斜系数为3
-则表示极右或极左偏态。

+或3
二、单项选择
1.下面资料中哪个厂子的平均工资代表性意义最大(),哪个厂子最小()。

平均工资(元)职工人数工资标准差(元)A甲厂108 346 9.80
B 乙厂96 530 11.40
C 丙厂128 210 12.10
D 丁厂84 175 9.60
2.变异指标中,以两数之差为计算基准的是()
A全距 B 平均差 C 标准差 D 方差
3.比较两个性质不同的变量数列的平均数的代表性大小,必须计算()A标准差 B 平均差
C 全距
D 标准差系数
4.设有甲乙两个变量数列,甲数列的平均数和标准差分别为20和2.5,乙数列的平均数和标准差分别为50和5.2 ,这些数据说明()
A甲数列的稳定性高于乙数列
B 甲数列的稳定性低于乙数列
C 甲乙两数列的稳定性相同
D 甲乙两数列的稳定性无法比较
5.某企业1994年职工平均工资为5200元,标准差为110元,1998年职工平均工资增长了40%,标准差扩大到150元。

职工平均工资的相对变异()
A增大 B 减小 C 不变 D 不能比较
三、多项选择
1.凡用绝对数来表达的变异指标,统称绝对离势,主要有()
A极差 B 平均差 C 四分位差 D 标准差 E 标准分
2.凡用相对数来表达的变异指标,统称相对离势,主要有()
A标准差 B 异众比率 C 标准差系数D 平均差系数E 偏态系数。

3 不同总体间的标准差,不能进行简单对比的原因是()。

A平均数不一致 B 总体单位数不一致
C 标准差不一致
D 计量单位不一致
E 离差平方和不一致 4.平均差的性质是( )
A 易受极端值的影响
B 要采取绝对值进行运算
C 数据信息利用率很低
D 以算术平均数为基准求出的平均差,其值最小
E 受抽样变动影响大。

5.若甲X <乙X ,甲σ>乙σ,由此可推断:( ) A 乙组X 的代表性好于甲组; B 乙组的标志均衡性比甲组好; C 甲组X 的代表性好于乙组; D 甲组的标志均衡性比甲组好; E 甲组的标志变动度比乙组大。

6.下面易受极端值影响的指标有()
A 平均差
B 标准差
C 算术平均数
D 全距
7.比较不同企业的同种产品平均质量水平的稳定性时,可选用( )
A 极差
B 标准差
C 平均数
D 平均计划完成程度
E 标准差系数 8.对比两个计量单位不同的变量数列标志值的离散程度,应使用( ) A 平均数 B 全距 C 均方差系数 D 标准差 E 平均差系数
四、简答题
1.Z 分数的性质有哪些? 2.简述平均差的性质。

五、计算题
1.某工厂50名职工每周工资数分配情况如下表,试求:
1)平均差;2)第1及第3四分位数;
2.已知一数列为2,3,5,7及8,试求其平均差。

4.有一自然数列
=
N , 10=X ,2=S , 从中删去一数为5,试求新的数列分布的
算术平均数和标准差为多少?
5.某车间职工工资分布情况如下表,求该车间职工的平均工资,职工工资 的中位数以及标准差。

6.求下列数字的全距、平均差、标准差和标准差系数。

26 37 43 21 58
7.已知算术平均数等于12,各变量值平方的平均数为169,试问标准差系数为多少? 8.根据下表,求四分位差。

某少教所少年犯入所前的作案次数
9.某车间两个小组开展劳动竞赛,每人日产量如下(件):
甲组:12,15, 17,10, 12, 20, 18, 16, 19, 14
乙组: 8, 16,10, 9 ,24, 23, 25, 10, 11, 20 试计算两组职工平均日产量及其标准差系数。

10.某社区2口之家有8户,3口之家有25户,4口之家有20
户,5口之家有12户,6口之家8户,7口之家3户,8口之家2户。

(1)求居民户人口的标准差;(2)标准差系数。

参考答案
一、填空题
1.全距,极差2.平均差3.中间各个单位4.离散系数5.异众比率6.0与土3,对称分布
二、单项选择
1.A,B 2.A3.D 4.B 5.B
三、多项选择
1.ABCD 2.BCDE 3.AD 4.ABE
5.ABE 6.ABCD 7.ABE 8.CE
四、简答题
1.①Z分数之和等于0
②Z分数的算术平均数等于0
③Z分数的标准差等于1,Z分数的方差也等于1
2.平均差以及接下来要讨论的标准差,虽都是变异指标,但就其计算的数学方法来看,仍属于算术平均数。

所以,平均差在受抽样变动影响、受极端值影响和处理不确定组距这三方面,它的性质均同于算术平均数。

与此同时,平均差由于计算时采用了取绝对值来消除正负号的影响的方法,它不便于代数运算,而且平均差的意义在理论上也不容易作出阐述。

所以,平均差作为变异指标,其运用比下面的标准差要少得多。

五、计算题
1.平均差2.316;第一四分位数65.35 第三四分位数69.54
2.2.16
3.全距45 标准差系数0.158
4.算术平均数10.26 标准差1.68
5.平均工资146.67 中位数148 标准差23.14
6.全距32 标准差13.07 标准差系数0.35
7.0.417
8.2.10
9.第一组:平均日产量15.3 标准差系数0.20
第二组:平均日产量15.6 标准差系数0.41
10.1.43;0.35。

相关文档
最新文档