第4章 综合指标分析法(二)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
由组距分布数列计算中位数
月工资 (元)
600以下
工人 向 上 累 计 人数(人) 人数
f
6
6
向下累 计人数
60
600-800
14
20
54
800-1000
26
1000-1200
10
46
40
56
14
1200以上
4
60
4
排序:向上累计人数 或向下累计人数;
确定中间位置: (60+1)/2=30.5位
中间位置在第3组,可 认为该组的组中值900 即为中位数。
一般
21 42 36 72 ? ?
满意
8
非常不满
意
6
16 44 12 50
88 100
合计
50 100 —
—
解:这里的向下 累积为各变量值 的顺序排列,中 间位置是第25为 位,居于第3组, 因此中位数为“ 一般”这一类别 ,即
Me=一般
数值型数据中位数的确定
未分组数据中位数的确定:
15位同学的某课程考试成绩为(分):56 69 85 90 72 84 65 78 85 92 76 75 85 78 96 。他们成绩的中位数是多少? 1.排序: 56 65 69 72 75 76 78 78 84 85 85 85 90 92 96 2.确定中间位置:(15+1)/2=8位 3.确定中位数:第八位是78,故他们成绩的中位 数是78分 。
ຫໍສະໝຸດ Baidu
2 4851
= 319 20
15.95(件)
18
1
18
合计
20
319
由单项数列计算算术平均数(相对数权数)
日产 量(件)
x 14
人数比 重 f/∑f
0.1
15
0.2
16
0.4
17
0.25
18
0.05
合计
1.00
X.f/ ∑f
1.4 3.0 6.4 4.25 0.9 15.95
人均日产量
x.
f
f
14 0.115 0.2 16 0.4 17 0.25 18 0.05 15.95(件)
响,而简单算术平均数的变动只受标志值变动的影响; 5.由相对数和平均数计算算术平均数时,要正确地选
择权数。
4.1.5 调和平均数(倒数平均数)
有简单调和和加权调和平均数两种。 例:见74、85页 若已知算术平均数的分子,用调和平均
方法计算平均数; 若已知算术平均数的分母时,用算术平 均方法计算平均数。
数的情况。
未分组数据众数的确定
无众数 原始数据:
10 5 9 12 6 8
一个众数 原始数据:
659855
多于一个众数 原始数据: 25 28 28 36 42 42
分类数据的众数
(例题分析)
不同品牌饮料的频数分布
饮料品牌
可口可乐 旭日升冰 茶 百事可乐 汇源果汁 露露
频数
15 11 9 6 9
4.2.2 极差
也称全距,是一组数据的最大值与最小值之差, 用R表示。
优点:计算简便。 缺点:只从两端数值考察,忽略了中间数据的
变异情况,不能说明总体的差异情况,尤其是 存在极端值的情况下,使用极差往往会造成错 误的结论。
极差的计算
在某城市随机抽取21人,每天的收入(元)分别为: 17、18、20、20、25、25、28、29、30、35、35、 36、38、39、40、50、60、60、65、65、70,则:
则下四分位数为:(25+25)/2=25元,上四分位数为 (50+60)/2 =55元。在下四分位数和上四分位数之间包 含了50%的数据,因此,我们可以说有一半人的收入在25 元到55元之间。
4.1.4 算术平均数( x )
算术平均数是最常用的一种平均指标,又称为均值。
适用于数值性数据。
根据掌握的资料不同有两种具体计算方法: 简单算术平均 加权算术平均
作用:1.表明平均数的代表性大小。 2.表明现象的均衡性和稳定性。
反映离中趋势的度量指标 有:
❖异众比率、极差、四分 位差
❖平均差、标准差和方差、 离散系数(变异系数)
4.2.1 异众比率
异众比率是非众数组的次数占总次数的比率。计算公
式:
V t
f fm
f
式中fm是众数组的次数。
用于衡量众数对一组数据的代表程度。异众比率越大, 说明非众数组的次数占总次数的比重大,众数的代表 性就越差,反之,代表性就越强。
不受极端值影响 具有不唯一性 据分布偏斜程度较大时应用
中位数 不受极端值影响
数据分布偏斜程度较大时应用
均值
易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用
众数、中位数和均值的关系
均值<中位数<众数 均值 = 中位数 = 众数
众数< 中位数< 均值
左偏分布
对称分布
右偏分布
小结:集中趋势的度量
比例
百分比 (%)
0.30 30 0.22 22 0.18 18 0.12 12 0.18 18
合计
50
1 100
解:这里的变量为“饮料 品牌”,这是个分类变量 ,不同类型的饮料就是变 量值
在所调查的50人中, 购买可口可乐的人数最多 ,为15人,占总被调查 人数的30%,因此众数为 “可口可乐”这一品牌, 即
由组距数列计算算术平均数:
某企业60个工人的月工资分组资料如下:
月工资 (元)
600以下
600-800
800-1000
10001200 1200以上
工人
组中
人数(人) 值(元)
f
x
6
500
14
700
26
900
10
1100
4
1300
人均月工资
= xf f
=500 6 70014 900 26 110010 1300 4 6 14 2610 4
满意”这一类别,
10
即
合计
300
100.0
Mo=不满意
某印染厂职工工资分组统计(等距式)
按月工资分组
人数
频率(%)
500以下
5
1.3
500-750
10
2.7
750-1000
61
16.6
1000-1250
72
19.6
1250-1500
120
1500-1750
86
1750以上
14
合计
368
32.6
23.4 3.8 110.0
某印染厂职工家庭人口分组统计(单项式)
按家庭人口数分组
职工户数
频率(%)
1
7
2.9
2
38
15.2
3
105
41.3
4
54
20.5
5
31
12.1
6
20
8.0
合计
255
100.00
4.1.2 中位数(Me)
概念:将各变量值顺序(升序或降序)排列, 居于中间位置的变量值即为中位数。
不适合分类数据。 确定方法:
1. 算术平均数(AVERAGE) 2. 调和平均数(HARMEAN) 3. 几何平均数(GEOMEAN) 4. 众数(MODE) 5. 中位数(MEDIAN) 6. 四分位数(QUARTILE) 7. 众数、中位数和算术平均数与总体分布的关系
4.2 离中程度(趋势)的度量
离中程度及度量的作用
离中程度就是各变量值偏离中心值的程度。 反映离中程度的指标叫标志变动度,也称 标志变异指标。
可用于顺序数据和数值型数据。
四分位数位置的确定方法:
QL的位置=(n+1)/4=(21+1)/4=5.5
QU的位置=3(n+1)/4 =3(21+1)/4=16.5
例:在某城市随机抽取21人,每天的收入(元)分别为: 17、18、20、20、25、25、28、29、30、35、35、36、 38、39、40、50、60、60、65、65、70。
Mo=可口可乐
顺序数据的众数
(例题分析)
甲城市家庭对住房状况评价的频数分布 解:这里的数据为
回答类别
甲城市
顺序数据。变量为
户数 (户) 百分比 (%) “回答类别”
非常不满意
24
不满意
108
一般
93
满意
45
非常满意
30
8
甲城市中对住
36 31
房表示不满意的户 数最多,为108户 ,因此众数为“不
15
4.1.6 几何平均数
1.计算公式
xg n x1.x2.x3......xn
2.适用场合:已知的变量值为比例,且各比例 之乘积为总比例,如求复利条件下的平均本利 率、特殊条件下的平均合格率、平均发展速度。
几何平均数的计算
某企业生产某产品要经过三个连续作业车间才能完成, 若某月份第一车间粗加工的合格率为95%,第二车间精 加工的合格率为93%,第三车间最后装配的合格率为 90%,则该产品的合格率为多少?
集中趋势的度量指标有: 众数、中位数、四分位数 算术平均数、调和平均数、几何平均数
各类指标的适用性
数据类型
分类数据 顺序数据 数值数据
适用指标
众数 众数、中位数 众数、中位数、均值、调和 平均数、几何平均数
4.1.1 众数(M0)
一组数据中出现次数最多的变量值称为众数。 特点:非唯一性。可能出现无众数、单众数或多众
计算公式:
x xf f
适用场合:经过分组而形成的单项数列或组距 数列。
由单项数列计算算术平均数(绝对数权数)
日产 量(件)
x 14
工人 人数 (人)
2f
15
4
16
8
17
5
总产量 (件)
xf 28
60
128
85
人均日产量
xf f
14 2 15 4 16 8 17 5 18 1
1) 简单算术平均数
1)计算公式
x x n
2)适用场合:没有分组的原始资料。 例:在某城市随机抽取21人,每天的收入(元)分别 为:17、18、20、20、25、25、28、29、30、35、35、 36、38、39、40、50、60、60、65、65、70。问:平 均每人每天的收入为多少?
2)加权算术平均数
=52400 60
=873.3(3 元)
根据组距数列计算的结果 只是一个近似值。想一 想:为什么?
合计
60
-
关于算术平均数的一些问题
1.次数又称为权数,权数起权衡轻重的作用; 2.权数有绝对数权数和相对数权数两种; 3.各组权数相等时,加权平均与简单平均的计算结果
相同。 4.加权算术平均数的变动受各组水平和次数变动的影
单项分布数列:求20名工人日产量的中位数
日 产量 (件) 14 x
15
16
17
18
合计
工 人人数 (人)
2f
4
8
5
1
20
向上累计 向下累计
人数
人数
2
20
6
18
14
14
19
6
20
1
-
-
排序:向上累计人数或向 下累计人数;
确定中间位置:(20+1)/2 =10.5位
确定中位数:第10.5位在 第三组,故他们日产量的 中位数是16件。
异众比率主要适合测度分类数据的离散程度,当然, 对于顺序数据和数值型数据也可以计算异众比率。
异众比率的计算
饮料品牌 频数
可口可乐 15
旭 日 升 冰 11 茶 百事可乐 9
汇源果汁 6
露露
9
合计
50
频率 (%) 30
22
18
12
18
100
异众比率=
(50-15)/50=70%
这说明在所调查的50人中, 购买其它品牌的人占70%, 异众比率较大,因此,用可 口可乐来代表消费者购买饮 料品牌的状况,代表性不是 很好。
极差=70-17=53(元) 表明这21人的日收入最大差距为53元。
4.2.3 四分位差
上四分位数与下四分位数之差就是四分位差,也称
为内距或四分间距,用Qd表示。计算公式: Qd = Qu - Ql
第4章 综合指标分析法(二)
主要内容
一、集中趋势的度量指标 二、离中程度的度量指标 三、偏态与峰态的度量指标
数据分布特征的测度
数据特征的测度
集中趋势
众数 中位数 四分位数
调和平均数 几何平均数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰态
4.1 集中趋势的度量
合计
60
-
-
4.1.3 四分位数
概念:一组数据由小到大顺序排列后,处于25%和75% 位置上的值,称为四分位数。
四分位数是通过3个点将全部数据等分为4个部分,其 中每部分包含25%的数据。很显然,中间的点就是中 位数,处在25%位置上的数值是下四分位数QL,处在 75%位置上的数值是上四分位数Qu。
1.排序 2.计算中间位置(n+1)/2 3.确定中间位置的变量值--中位数 。
顺序数据的中位数
(例题分析)
甲城市家庭对住房状况评价的频数分布 解:这里的数据为
满意程度
甲城市
顺序数据。变量为
户数 (户) 百分比 (%) “满意程度”
非常不满意
24
不满意
108
一般
93
满意
45
非常满意
30
8
该城市中对住
36 31
房表示不满意的户 数最多,为108户 ,因此众数为“不
15
满意”这一类别,
10
即
合计
300
100.0
Mo=不满意
顺序数据的中位数 (例题分析)
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 (户)
百分 比
(%)
向上累积 户数 百分比 (户) (%)
向下累积
非常满意
3
6
3
6
满意
12 24 15 30
x n x .x .x ......x
g
123
n
3 95% 93% 90%
92.64%
各类指标的适用性
数据类型
分类数据 顺序数据 数值数据
适用指标
众数 众数、中位数 众数、中位数、均值、调和 平均数、几何平均数
4.1.7 众数、中位数和算术平均数的比较
众数、中位数和均值的特点和应用
众数