离中趋势测量法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

全距(R):最大值和最小值之差。也叫极差。全 距越大,表示变动越大。
R =Xmax– Xmin
[例] 求74,84,69,91,87,74,69这些数字 的全距。
[解] 把数字按顺序重新排列:69,69,74, 74,84,87,91,显然有
R =Xmax– Xmin =91—69=22
2019/9/29
(1)受极端值影响大; (2) 没有量度中间各个单位间 的差异性,数据利用率 低,信息丧
失严重;
(3)受抽样变动影响大,大样 本全距比小样本全距大。
2019/9/29
6
2.四分位差(Quartile deviation) 第三四分位数和第一四分位数的半距。
避免全距受极端值影响大的缺点。
请大家 计算一下, 看能否算对
准差与其算术平均数之比,其 计算公式是
2019/9/29
19
2. 异众比率
所谓异众比率,是指非众数的频数与总体单位数 的比值,用V·R来表示
其中: 为众数的频数; 是总体单位数
异众比率能表明众数所不能代表的那 一部分变量值在总体中的比重。
2019/9/29
20
3. 偏态系数
我们在前面讨论统计图时已经对频数分布的正态和 偏态有所认识。我们又看到了算术平均数与中位数、众 数之间存在的关系:当总体呈对称分布时, 、 、 三者完全相等;当总体呈不对称的偏态分布时,它们之 间存在着数量(位置)的差异。因此,偏态可由 与 的差来表示,即
计算左 边数列的 平均差
2019/9/29
9
第三节 标准差(standard deviation)
各变量值对其算术平均数的离差平方 的算术平均数的平方根,均方差,又称
用S表示。
即克服平均差带有绝对值的缺点, 又保留其综合平均的优点。
1. 对于未分组资科
2019/9/29
10
求72、81、86、69、57这些数字的标准差。
为了使不同数列的偏态值可比,同样可计算偏态的相 对数,即偏态系数,用α来表示
2019/9/29
21
偏斜系数是以标准差为单位的算术平均数与众 数的离差,其取值一般在0与土3间。偏斜系数为0表 示对称分布,偏斜系数为或则表示极右或极左偏态。
年龄
15-25 25-35 35-45 45-55 55-65
(3)Z分数实际表达了变量值距总体均 值有几个标准差。
2019/9/29
16
Z分数也有标准正态变量之称。按Z值大小编制 出的正态分布表,其用途十分广泛。
Z分数的性质: Z分数之和等于0
Z分数的算术平均数等于0
Z分数的标准差等于1,方差也等于1
2019/9/29
17
第四节 相对离势
上述各种反映离中趋势的变异指标,都具有和原 资料相同的计算单位,称绝对离势。但欲比较具有不 同单位的资料的参差程度,或比较单位虽相同而均值 不相同的资料的参差程度,离势的绝对指标则很可能 导致某些错误结论。所以,我们还得了解和学习相对 离势。
1. 变异系数
绝对离势统计量与其算术平均数的比率,用V 表示。变异系数是最具有代表性的相对离势。
2019/9/29
18
全距系数 全距系数是众数据的全
距与其算术平均数之比,其计 算公式是 平均差系数
平均差系数是众数据的平 均差与其算术平均数之比,其 计算公式是
标准差系数 标准差系数是众数据的标
1.对于未分组资料
2.对于分组资料
3.平均差的性质
在受抽样变动、极端值影响,
处理不确定组距方面均同于算术平 均数;不适于代数运算,其理论意 义不易阐述。
2019/9/29
8
[例1] 试分别以算术平均数为基准,求85,69, 69,74,87,91,74这些数字的平均差。
[例2] 试以算术平均数为基准,求下表所示数据 的平均差。
4
对分组资料,不能确知最大值和最小值,求全距: (1)用组值最大组的组中值减去最小组的组中值 (2)用组值最大组的上限减去最小组的下限 (3)用组值最大组的组中值减去最小组的下限; 或最大组的上限减去最小组的组中值
运用上 述方法计 算左边数 列的全距
2019/9/29
5
优点:
计算简单、 直观。
缺点:
X
(X X)
(X X )2
72
-1
1
81
8
64
86
13
169
69
-4
16
57
-16
256
365
0
506
X2
5184 6561 7395 4761 3249 27151
2019/9/29
11
2. 对于分组资料
2019/9/29
计算左 边数列的 标准差
12
[例] 调查大一男生60人的身高情况如下表所示,求 他们身高的标准差。
求下列两组成绩的四分位差: A: 78 80 82 85 89 87 90 86 79 88 84 81 B: 55 68 78 88 99 100 98 90 85 83 84 81
2019/9/29
7
第二节 平均差(Mean absolute deviation)
要测定变量值的离中趋势,尤其是要测定各变量值 相对于平均数的差异情况,一个很自然的想法就是计算 各变量值与算术平均数的离差。平均差是离差绝对值的 算术平均数。
变异指标如按数量关系来分有以下两类; 凡用绝对数来表达的变异指标,统称绝对离势;
主要有极差、平均差、四分位差、 标准差等。
凡用相对数来表达的变异指标,统称相对离势;
主要有异众比率、标准差系数、平均差 系数和一些常用的偏态系数。
2019/9/29
3
第一节 全距与四分位差
1.全距(Range)
— 各变量值对算术平均数的离差的平方和,必定小于他们 对任何其他数偏差的平方和。
(2)它将总体中各单位标志值的差异全包括在内,受 抽样变动影响小。但在受极端值影响以及处理不确定组 距方面,缺点同算术平均数。
值得注意的是,在推论统计中我们将发现,方差是 比标准差更有理论价值的概念。所谓方差,即标准差的 平方,它直接写成 。 也常被称为变异数。
A组:60 ,60,60,60,60 B组:58,59,60,61,62 C组:40,50,60,70,80 D组:80,80,80,80,80 数据显示,平均数相同,离势可能不同;平均
数不同,离势可能相同。
2019/9/29
2
变异指标用以反映总体各单位标志值的变动范围或参 差程度,与平均指标相对应,从另一个侧面反映了总体的 特征。
计算 左边数 列的标 准差
2019/9/29
13
[解] 因为是分组资料,计算标准差运用加权式,并 参见下表
2019/9/29
14
3. 标准差的性质
标准差是反映总体各单位标志值的离散状况和差异 程度的最佳测度。
(1)以算术平均数为基准计算的标准差比以其他任 何数值为基准计算的标准差要小。“最小二乘方”性质—
2019/9/29
15
4.标准分(standard score)
以离差和标准差的比值来测定变量 与 的相 对位置。使原来不能直接比较的离差标准化,可以相 互比较,加、减、平均。
(1)Z是和X一一对应的变量值; (2)Z分数没有单位,是一个不受原资
料单位影响的相对数,所以可以用于不同单 位资料的比较;
第五章 离中趋势测量法
主要内容:(1)变异指标; (2)全距和四 分位差; (3)平均差、标准差和标准分; (4) 绝对离势和相对离势;(5)偏度(及峰度)。
2019/9/29
1
所谓离中趋势,是指数列中各变量值 之间的差距和离散程度。离势小,平均数 的代表性高;离势大,平均数代表性低。
例如有A、B、C、D四组学生各5人的成绩如下:
人数
3 7 12 1来自百度文库 10
讨论左 边数列关 于年龄的 偏态和偏 态系数.
2019/9/29
22
相关文档
最新文档