统计学变异指标

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

季度总供货计 划执行结果
一月 二月 三月
甲厂 100
32 34 34
乙厂 100
20 30 50
观察:哪个厂供货比较均衡?
三、变异指标的计算方法
(一)变异指标的种类(数值) 绝对指标(与原变量值名数相同)
全距 平均差 标准差
相对指标(表现为无名数)
全距 系数
平均差 系数
标准差 系数
分类:全距 平均差 标准差 变异系数
根据表: 试问A、C 课程平均考分哪个更有代表性?
学生 考分(分) 平均数离差 离差平方 平均数离差 离差平方
序号
xA xC xA xA (xA xA)2 xC xC (xC xC)2
标准差
标准差 (standard deviation):各
单位标志值对其算术平均数的离差的平方的 算术平均数的平方根,反映的是各标志值对 其平均数的平均差异程度。标准差是描述数 据离散程度的最常用的差异量。
分类:简单标准差 加权标准差
公式: 简单平均差:σ=
加权平均差:σ=
简捷计算:标志值数值较大、平均值未知,以 A为假定平均数(一般取靠近中间的标志值或组 中值)
xx
-19.5 -9.5 0.5 10.5 20.5

表4-33
2
xx
2
xx f
380.25 90.25 0.25 110.25 420.25

7605 3610
20 5512.5 4202.5
20950
σ (xx)2 f 2095010.23(个)
f
200
例、某企业工人日产量的标准差计算表(A=85,d=10)
在实际工作中运用最为广泛的是标准差系数指标。
注意:标准差与标准差系数的不同应用条件:
在比较两个不同数列(总体)标志变异程度大小 (或说明其平均数代表性大小)时,当其平均水平相 同时,可直接计算标准差进行比较;当其平均水平不 相同(或其计量单位不同)时,需消除平均水平不同 或计量单位不同的影响,计算标准差系数进行比较。
数据1: 1、 2、 3、 4、 5 数据2: 10、20、 30、40、50
显然,这两组数据的差别程度相同,而它们水平不同或平 均数不同,这时就不能用绝对指标(标准差)比 较它们的差异程度大小。
这时就要计算离散系数指标来比较它们之间的差别程度 大小。
变异系数
如果两个数列平均水平不同,或两个数列标志值 的计量单位不同时,要比较其数列的变动度(即比较 其数列平均数的代表性大小),怎么办?
全距的特点
全距是测定标志变动度的一种粗略方法。 优点:计算简单,含义明确,对于测定对称分 布的数列具有特殊优点。 缺点:它主要取决于极端数值,带有较大的偶 然性,往往不能充分反映现象的实际离散程度。
全距的作用
1、经常应用于生产过程的质量控制;
2、用于比较不同总体数值的均衡性或 平均数的代表性;
在两个总体或两组数据平均数相等时,要比较其平 均数代表性大小,这时: 全距较大的总体,其标志变异程度也较大,平均数的 代表性较小,或社会经济活动过程的均衡性或稳定性 较差;反之,则相反。
四、变异指标
一、变异指标的概念
概念:综合反映总体各单位标志值的差异程度
或离散程度。变异指标越大,表明数据越分散、 不集中;变异指标越小,表明数据越集中, 变动范围越小。变异指标反映现象总体总单位变
量分布的离中趋势。
一、变异指标的概念
变异指标(标志变动度), 它是反映总体中各单位标 志值差异程度的综合指标。
平均指标说明总体各单位变量值分布的集中趋势; 变异指标说明总体各单位变量值分布的离中趋势或分散程度。
离中趋势的概念: 指总体中各单位标志值背离分布中心(平均数)的
程度,也就是总体各单位标志值之间差异程度,用标志 变异指标反映其大小。
平均数
表 学生 序号
甲 乙 丙 丁 戊
各课程考分(分)
xA
xB
xC
甲、乙两组工人的平均产量都为70件。 通过观察可以看出,甲组数据的变异程度较大, 乙组数据的变异程度较小。 也可以用图示的方法观察产量的变异情况:
甲组
产量差异 程度较大
70
结论: 标志变异程度和平均数的代表性呈反比关系。
乙组
产量差异
70
程度较小
举例:反映社会经济活动过程的均衡性

钢厂
供货计划完成百分比(%)
按日产量
分组(公斤)
60 以下 60—70 70—80 80—90 90—100 100—110 110 以上 合计
工人数 (人) f
10 19 50 36 27 14 8
164
组中 值X
55 65 75 85 95 105 115

X 85
10 -3 -2 -1 0 1 2 3

X 85 f 10
全距
全距 R (range) : 测定标志变异程度的最
简单的指标,它是标志的最大值和最小值之差,反 映总体标志值的变动范围。 公式:全距=最大标志值-最小标志值
R=Xmax-Xmin
评价: 从计算可知,全距仅取决于两个极端 数值,不能全面反映总体各单位标志值变异的程度, 也不能拿来评价平均指标的代表性。
平均指标是说明总体各单位某一数量标志一般水平的综合指 标。但是,平均指标将总体各单位标志值的差异抽象化了,是 总体各单位标志值的代表水平,它不能反映总体各单位标志值 的差异情况。例如,
工人姓名 甲 奖金额(元) 460 数量标志
乙 丙 丁戊 520 600 700 850 平均奖金
标志值(变量值) = 626(元)
解:
σA
(xx)2
306 61.27.82分
n
5
σB (xx)2 136 27.25.07分
n
5
因为B课程标准差较小,所以B课程平均分比A课程平均分代表性大。
根据变量数列资料计算
【例】根据某车间200名工人加工零件的资料,计算工 人的生产零件标准差。 表
按零件数 职工人 分组(个) 数(人)f
-30 -38 -50 0 27 28 24
-39
X
85
2
X
85 2
f
10 10
9
90
4
76
1
50
0
0
1
27
4
56
9
72

371
σ
XA d f
2f
XA d
f
f
2
d
371 392 d 14.85(公斤) 165 164
3.标准差的作用
1、反映某总体各单位某种标志值的离散程度;
学生 考分(分) 平均数离差 离差绝对值 平均数离差 离差绝对值
序号
xA xB
xA xA xA xA xB xB xB xB
甲 65 68 -10
10
-7
7
乙 70 70
-5
丙 75 76
0
5
-5
5
0
1
1
丁 80 80
5
5
戊 85 81
10
10
5
5
6
6
合计 375 375

30

24
试问A、B 两课程的平均考分更有代表性?
65 68 79 70 70 85 75 76 90 80 80 95 85 81 100
(1)试计算A、B、C三门课程 的平均考分。
(2)试问A、B两门课程平均 考分哪个更有代表性?
(3)试问A、C 两门课程平均 考分更有代表性?
合 计 375 375 449
例如,
A课程考分: 65 70 75 80 85
2.它可以反映社会经济活动过程的均衡性或稳定 性程度。
3.它还是抽样分析和相关分析的重要指标。
注意:标志变异指标的作用是在与平均指标结合中产生 的,离开了平均指标,它就失去了意义。而它与平均指标 相结合,则可全面反映总体的特征,并对平均指标的代表 性做出评价。
举例:衡量平均数代表性
例:某车间两个生产小组各人日产量(件)如下: 甲组:20 40 60 70 80 100 120 乙组:67 68 69 70 71 72 73
未分组 σ资 X 料 nA2: X nA 2
分组σ 资 料 X fA : 2f X fA f 2
组距σ 数 列 Xd A: 2f
2
Xd Af d
f f
【例2】根据未经分组的资料 表
学生 课程(分) 平均数离差 离差平方 平均数离差 离差平方
序号
40~50
20
50~60
40
60~70
80
-
70~80
50
80~90
10
合计
200
标准差计算表
按零件数分 组(个)
40~50 50~60 60~70 70~80 80~90
合计
职工人数 (人)f
20 40 80 50 10
200
组中 值x
45 55 65 75 85

将表中计算结果代入公式,得到:
注意:这时需消除平均水平不同或计量单位不 同的影响,计算标志变异系数。
变异系数(V): 是总体中变异指标与其算术平均 数之比,以反映标志值差异的相对水平。
变异 系 变数 异(指 σ或标 DA 或 R)
算术平 ( x均 )数
离散系数指标的种类
VR
R X
100%
VADAX D10﹪ 0
标准差系数
V
X
10﹪ 0
B课程考分: 68 70 76 80 81
A组
65
75




B组
●●

●●
xA 7( 5 分)
xB 7( 5分 )
85

变异大
变异小
二、标志变异指标的作用
1.它是衡量平均数代表性的尺度。
标志变异指标与平均数的代表性成反比,表明总体各单位 标志值的分散程度。即标志变异指标数值越大,平均数的代 表性越小。例
平均差
平均差A.D (average deviation):是总体
各单位标志对其算术平均数的离差绝对值的算术 平均数。它综合反映了总体各单位标志值的变动 程度。平均差越大,则表示标志变动度越大,反 之则表示标志变动度越小。
简单平均差:A.D= x x
N
xx f
加权平均差A.D=
f
根据未分组资料计算 表
3.平均差的特点
优点:不易受极端数值的影响,能较好地反映全
部单位标志值的实际差异程度;平均差弥补了全距 之不足,它考虑了所有的标志值。
缺点:用绝对值的形式消除各标志值与算术平均数离
差的正负值问题,不便于数学处理和参与统计分析运算。
( x x ) 0 或 ( x x ) f 0
评价:平均差意义明确,计算容易, 反应灵敏。但计算时要用绝对值,不适合 代数运算,因此在进一步统计分析中应用 较少。
50—60
5
60—70
35
70—80
45
80—90
15
55
275 -17
85
65
2275
-7
245
75
3375
3
135
85
1275
13
195
合 计 100

7200

660
算术X 平 均 X f7 数 2 0 7 : (0 公 2 )斤 f 100
平均 A .D 差 . : X fXf
666 0.6(公)斤 100
2、用于比较不同总体数值的均衡性或平均数的 代表性;
在两个总体或两组数据平均数相等时,要比较其平均 数代表性大小,这时:
标准差较大的总体,其标志变异程度也较大, 平均数的代表性较小,或社会经济活动过程的 均衡性或稳定性较差;反之,则相反。
评价:标准差是表示一组数据离散程度的最好指 标,是统计分析中最常用的差异量。 标准差具备一个良好的差异量应具备的条件,如: 反应灵敏,有公式严密确定,简明易懂,适合代数运 算等等。 标准差表示一组数据的离散程度,须注意必须是 同一类数据(即同一种测量工具的测量结果),而且 被比较样本的水平比较接近。
xA
xB
xA xA (xA xA)2 xB xB (xB xB)2
甲 65 68
-10
100
-7
49
乙 70 70
-5
25
-5
25
丙 75 76
0
0
1
1
丁 80 80
5
81
5
25
戊 85 81
10
100
6
36
合计 375 375

306

136
75 问A、B 那一门课程的平均考分更有代表性? xA xB
计划完成程度 组中值 企业数 计划产值
(﹪) 90以下
(﹪)X (个) (万元) f
85
2
800
90~100
95
3
2500
100~110
105
10
17200
Fra Baidu bibliotek
110以上
115
3
4400
合计

18
24900
解 R : X m ax X m in 11 10 0 9 0 10 12 80 0 4﹪ 0
全距
计算: R=Xmax–Xmin
例、甲同学成绩全距R=93 – 70=22(分) 乙同学成绩全距R=98 – 51=47(分)
特点:计算方便,易于理解; 易受极端数值的影响。
对于组距数列,全距计算公式为: R≈最高组的上限值—最低组的下限值
【例2】某季度某工业公司18个工业企业产值计划完成情 况如下,计算全距。 表
解:xA xB A.DA
xA xA
n
30 6( 分 / 人 )
5
A.DBxBxB
n
24 4.8(分/人)∵ A.DA>A.DB 5
故,学生B 课程平均考分比A 课程平均考分更有代表性。
例、某纺织厂工人日产棉纱资料计算表
单位:公斤
按日产 量分组
工人数 f (人)
组中值 X
Xf
X X | X X |f
相关文档
最新文档