统计学课件_统计学 第6章 变异指标

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

集中趋势反映了统计数据聚集的中 心所在,但是变异是统计数据天然 的特性,各个数据总是以不同的程 度偏离它们的分布中心。对于一组 数据,不仅要研究其分布的中心位 置,概括反映这组数据的整体水平 高低,还要测度数据的离散程度, 反映数据之间的差异程度,测度离 散程度的指标称为变异指标。
第一节 变异指标的基本理论
两个随机变量方差的和
2 ( x y)
2 x
2 y
(三)变量线性变换的方差等于变量的方差
乘以变量系数的平方
y
a
bx,
2 y
b2
2 x
标准差系数
V
X
100﹪
应用:
用来对比不同水平的同类现象,特别是不同 类现象总体平均数代表性的大小
——标准差系数小的总体,其平均数的代表 性大;反之,亦然。
大象 500 kg 可比 免子 0.5kg
X 甲 X乙 70件
供货计划完成百分比(%)
季度总供 货计划执 1月 2月 3月
行结果
甲 厂
100


乙 厂
100
32 34 34 20 30 50
二、变异指标的种类
以标志值之间相互比较说明变异情况
全距 分位差
以平均数为比较标准来说明标志的变异情况 平均差 方差 标准差
平均差系数
标准差系数
以正态分布为标准说明分配数列偏离情况的指标
一、离中趋势的涵义 指总体中各单位标志值背离
离中趋势 分布中心的规模或程度,用 标志变异指标来反映。
反映统计数据差异程度的综
合指标,也称为标志变动度
从另一个侧面说明集中趋势测度值的代表程度。 不同类型的数据有不同的离散程度测度值.
定类数据:异众比率 定序数据:四分位差 定距数据(数值型数据):
方差和标准差
R X max X min 750 440 310 元
全距的特点 优点:计算方法简单、易懂;
缺点:
①仅取决于两个极端值的水平,不能反映其 间的变量分布情况;
②受个别极端值的影响过于显著,不符合稳 健性和耐抗性的要求。
二、分位差
从变量数列中,剔除了一部分极端值后
计算的类似于极差的指标。
四分位差 十六分位差
5.异众 比率
概念
非众数组的频 数占总频数的 比例
计算
特点
vr
fi fm fi 衡量众数的代表
1 fm

fi
数据分布特征
集中趋势
离散程度
分布形状
众数
异众比率
偏态系数
中位数
四分位差
峰态系数
平均数
极差
平均差
方差或标准差
离散系数
End of Chapter 6
由同一资料计算的标准差的结果一般要略大于平均差。
方差与标准差用于测度数据的离散 程度,其作用实质上是一样的,但 标准差的计量单位于所测度数据的 计量单位相同,计算结果的实际意 义要比方差更容易理解。
因此,在社会经济现象的统计分析 中,标准差比方差的应用更为普遍 ,经常被用作测度数据与均值差距 的标准尺度。
N
2
Xi X
i 1
N
第 i 个单位
的变量值
总体单 位总数
总体算术 平均数
【例A】某售货小组5个人,某天的销售额分别 为440元、480元、520元、600元、750元,求该 售货小组销售额的标准差。
解:
X
440
480
520
600
750
2790
558元
5
5
N
2
Xi X
i 1
440 5582 750 5582
总体算术 平均数
⑵ 加权平均差——适用于分组资料
m
A D
X1 X
f1 X m X f1 fm
fm
i 1
Xi X
m
fi
fi
i 1
第 i 组的变量 第 i 组变量值 总体算术
值或组中值 出现的次数 平均数
平均差的特点
优点:不易受极端数值的影响,能综合反映 全部单位标志值的实际差异程度;
企业编号 1
产品销售额(万元 )
x1 170
销售利润(万元) x2
8.1
2
220
12.5
3
390
18.0
4
430
22.0
5
480
26.5
6
650
40.0
7
950
64.0
x1 536.25(万元) x2 32.5215(万元)
1 309.19(万元) 2 23.09(万元)
v1=
309.19 536.25
统计学
第六章 变异指标
【学习目标】通过本章的学习和习题演算,掌握变异 指标的意义和作用;标准差和标准差系数的计算和应用。 了解变异指标的分布特性;极差、平均差和四分位差的概 念、计算公式和特点;分布的偏度与峰度。
第一节 变异指标的基本理论 第二节 全距、分位差和平均差 第三节 标准差和标准差系数 第四节 偏度与峰度 第五节 变异指标的应用
是非标志总体
是非标志
指总体中全部单位只具有“是”或
“否”、“有”或“无”两种表现形
式的标志,又叫交替标志
为研究是非标志总体的数量特征,令
分组 具有某一属性 不具有某一属性
合计
单位数
N1 N0 N
变量值 1 0 —
是非标志总体的指标
成数
指是非标志总体中具有某种表现或不具有 某种表现的单位数占全部总体单位总数的 比重。
解: 己知N 400件,N1 380件,N0 20件,
则P N1 380 95﹪,Q N0 20 5﹪,
N 400
N 400
所以有: X P P 0.95
p PQ 0.95 (1 0.95) 0.218
1.极差 (R)
概念
计算
特点
优点:容易理解,
数列中最大值 R=最大值-最小值 计算方便
300~400
350
314
400~500
450
382
500~600
550
456
600~700
650
305
700~800
750
237
800~900
850
78
900以上
950
20
合计

2 000
解: X 250 208 950 20 1045900 522.95元
2000
2000
250 522.952 208 950 522.952 20
缺点:用绝对值的形式消除各标志值与算术 平均数离差的正负值问题,不便于作数学处 理和参与统计分析运算。实际应用较少。
第三节 标准差和标准差系数
标准差 是各个数据与其算术平均数的离差平方的
算术平均数的开平方根,用 来表示;标准
差的平方又叫作方差,用 来表2 示。 计算公式:
⑴ 简单标准差——适用于未分组资料
八分位差 三十二分位差
十分位差 百分位差
反映了中间50%数据的离散程度; 不受极端值的影响
三、平均差
是各个数据与其算术平均数的离差绝对 值的算术平均数,用 A.D表示。
计算公式:
⑴ 简单平均差——适用于未分组资料
N
A D
X1 X X N X
Xi X i1
N
N
第 i 个单位
的变量值
总体单 位总数
050??统一冰红茶百事可乐汇源果汁露露1196902201801201822181218合计501100统一冰红茶百事可乐汇源果汁露露1196902201801201822181218合计501100是非标志总体指总体中全部单位只具有是或否有或无两种表现形式的标志又叫两种表现形式的标志又叫交替标志是非标志分组单位数变量值具有某一属性不具有某一属性1100合计分组单位数变量值具有某一属性不具有某一属性1100合计为研究是非标志总体的数量特征令0n1nn是非标志总体的指标具有某种标志表现的n指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重
x大象 3500 kg
x免子 2.5kg
变异系数指标
身高
x身高
可 比
体重
x体重
身高的差异水平:cm
用变异系数可以相互比较
体重的差异水平:kg
【例】某年级一、二两班某门课的平均成绩分别
为82分和76分,其成绩的标准差分别为15.6分和
14.8分,比较两班平均成绩代表性的大小。
解:
V 1
1
X1
=0.577
v2=
23.09 32.5215
=0.710
结论: 计算结果表明,v1<v2,说明产品销售额 的离散程度小于销售利润的离散程度
异众比率
1. 对定类数据离散程度的测度
2. 非众数组的频数占总频数的比例
3. 计算公式为
vr
fi fm 1 fm
fi
fi
4. 用于衡量众数的代表性
不同品牌饮料的频数分布
具有某种标志表现的 单位数所占的成数
P N1 N
不具有某种标志表现 的单位数所占的成数
Q N0 N
且有P Q
N1
N
N0
N
N1 N0 N
N N
1
是非标志总体的指标
均 值
XP
Xf 1 N1 0 N0 N1 P
f
N
N
标 准
p
(X X )2 f
1 P2 N1 0 P2 N0
100﹪
15.6 82
100﹪ 19.02﹪
二班成绩的标准差系数为:
V 2
2
X2
100﹪
14.8 76
100﹪ 19.47﹪
因为 V 1 V 2,所以一班平均成绩的代表性比二班大。
【 例 】某管理局抽查了所属的8家企业,其产品销售数 据如表。试比较产品销售额与销售利润的离散程度
某管理局所属8家企业的产品销售数据
二、变异指标的作用 衡量和比较平均数代表性的大小;
变异指标值越大,平均指标的代表性越小; 变异指标值越小,平均指标的代表性越大。
是进行质量控制的基础;
衡量现象的均衡性、稳定性
是衡量风险程度的尺度。
例如:某车间有两个生产小组,各有7名 工人,各人日产量如下: 甲组:20,40,60,70,80,100,120 乙组:67,68,69,70,71,72,73
f
N1 N0
差 Q2P P2Q PQQ P PQ
是非标志总体的指标
方差
2 PQ P1 P
当P
Q
0.5时,有
2 max
0.25
标准差系数
V
P
XP
P1 P
P
1 P P
Q P
是非标志总体的指标
【例】某厂某月份生产了400件产品,其中合格品 380件,不合格品20件。求产品质量分布的集中趋 势与离中趋势。
N
5
60080 109.62元
5
标准差
⑵ 加权标准差——适用于分组资料
m
2
X i X fi
i 1
m
fi
i 1
第i 组的变量 第i 组变量值 总体算术
值或组中值
出现的次数
平均数
【例B】计算下表中某公司职工月工资的标准差。
月工资(元) 组中值(元) 职工人数(人)
300以下
250
208
饮料品牌
频数
比例
百分比 (%)
可口可乐
15 0.30 30
统一冰红茶 11 0.22 22
百事可乐
9 0.18 18
汇源果汁
6 0.12 12
露露
9 0.18 18
合计
50
1
100
解:
50 15 vr 50
1 15 50
0.7 70%
在所调查的50人当中,购 买其他品牌饮料的人数占 70%,异众比率比较大。因 此,用“可口可乐”代表消 费者购买饮料品牌的状况, 其代表性不是很好
峰度 偏度
定类数据:异众比率 定序数据:四分位差 定距数据:方差和标准差
第二节 全距、分位差和平均差
一、全距
指所研究的数据中 m ax X m in
最大变量值或最 最小变量值或最
高组上限或开口 低组下限或开口
组假定上限
组假定下限
【例A】某售货小组5人某天的销售额分别 为440元、480元、520元、600元、750 元,则
标准差的简捷计算
目的: 避免离差平方和计算过程的出现
变量值平方 的平均数
X2 X 2
变量值平均 数的平方
简单标准差 加权标准差
X
N
2
X
N
2
X2f f
Xf f
2
标准差的数学性质:
(一)变量的方差等于变量平方的平均数减
变量平均数的平方 2 X 2 X 2
(二)两个独立随机变量和的方差,等于这
2000
56386595.01 167.9元
2000 即该公司职工月工资的标准差为167.9元。 (比较:其工资的平均差为138.95元)
标准差的特点
不易受极端数值的影响,能综合反映全部 单位标志值的实际差异程度; 用平方的方法消除各标志值与算术平均数 离差的正负值问题,可方便地用于数学处理 和统计分析运算.
与最小值之差
缺点:不能反映全
部数据分布状况
各标志值与 2.平均差 均值离差绝 (A.D) 对值的算术
平均
简单:A D Xi X
n
优点:反映全部 数据分布状况
缺点:取绝对值 , 加权:A D Xi X fi 数字上 不尽合理
fi
3.方差 (σ2) 和 标准差
(σ)
概念
计算
特点
各标志值与均 值离差平方的
简单: 2 Xi X 2 n
平均。
方差的平方根 (取正根)
加权: 2
X X f
2 f
2
优点:反映全部 数据分布状况, 数字上合理。
缺点:受计量单 位和平均水平影 响,不便于比较
4.标准 标准差与均值 差系 数 之商,是无量 (Vσ) 纲的系数
V X
优点:适宜不同 数据集的比较
缺点:对数据结 构变化反应不灵 敏
相关文档
最新文档