第五章 统计分布特征的描述:集中趋势和离散趋势
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
各组次数或频率,又称权数。
加权算术平均数有两种变形:
当权数用相对数时
当f1=f2=f3=……=fn时,权数的作用消失,加权平 均数 = 简单平均数
xf f x x f f
( 3 )组距数列计算加权算术平均数时,假 定该组标志值是完全均匀分布的,以各组的 组中值为各组变量值,计算的平均数是近似 值。
分组 组中值
人数(人) 4 6 4 4 2 20
频数
比重(%) 20 30 20 20 10 100
频率
求学生的平均身高 解:(1)绝对权数
X
X
i 1 n i 1
n
i
fi
i
f
1.45 4 1.55 6 1.65 4 1.75 4 1.85 2 46442 1.62(米)
xf x f
xf xf m X f 1 xf m x X
Xh
(2)简单调和平均数实际上是加权调和平均数的一种特例,即各组标志总量 相等时出现阶的一种特殊情况.
上一页
下一页
返回本节首页
(四)相对指标的平均数
算术平均数与调和平均数不仅可以用于计算严格 意义上的静态平均指标(单位标志平均数),而 且常可用来计算其它相对指标或时间数列的平均 数。这时平均数仅仅是种计算形式,计算的结果 并不要求它们符合平均指标的基本规定(总体标 志总量/总体单位总量)。 相对指标平均数的计算形式应该根据相对指标的 对比关系来确定。
(2)相对权数
X Xi
i 1 n
fi
f
i 1
n
i
20 25% 21 25% 22 10% 23 40% 21.65
例2:组距式数列(等距数列) 某班学生身高情况表
按身高分组(米) 组中值 1.45 1.4-1.5 1.55 1.5-1.6 1.65 1.6-1.7 1.75 1.7-1.8 1.85 1.8-1.9 —— 合计
h
说明
(1)社会经济统计中所应用的调和平均数通常是加权算术平均数的变形, 已知各组变量值 xi 和(xi fi)而缺乏 fi 时,加权算术平均数通常可变形为 调和平均数形式来计算。
在已知每种价格x、销售量f时,求平均价格用加权算术平均数。
在已知每种价格x、销售额m时,求平均价格用加权调和平均数。
xf x f
0.5 1 0.4 1 0.25 1 111
0.5 0.4 0.25 3 0.38 元
在例2中,先求早、中、晚购买的斤数。
早 1/0.5=2(斤)中 1/0.4=2.5(斤)晚 1/0.25=4(斤)
m 111 3 x m 0.35 元 1 1 1 xi fi 1 8.5 0.5 0.4 0.25 x i 1 i 1 xi i
五、众数 六、中位数
七、各种平均数之间的相互关系
上一页
下一页
返回本章首页
一、平均指标的概念和作用
㈠概念:平均指标是指将同质总体内各 单位的数量差异抽象化,反映总体一般 水平或集中趋势的统计指标 所谓集中趋势,指一组数据向某一中心 值靠拢的倾向,测度集中趋势,也就是 寻找数据的一般水平的代表值或中心值。
(2)相对权数
X Xi
i 1 n
fi
f
i 1
n
i
1.45 20% 1.55 30% 1.65 20% 1.75 20% 1.8510% 1.62(米)
例3:某班英语成绩整理如下,求学生英语平均成绩.
成绩 90以上 80~90 70~80 60~70 60以下 合计
适用条件:已知各组的 代表变量值x和标志总 量xf,且各组的标志总 量恰好相等.
式中: X H 为调和平均数; m为变量值 X i 为第 i 个变量值。 的个数;
计算举例1:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、 晚上为0.25元/斤。现早、中、晚各买1斤,求平均价格。 例2:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为 0.25元/斤。现早、中、晚各买1元,求平均价格。 在例1中,用简单算术平均数
张庄有个张千万, 九个邻居穷光蛋; 平均起来算一算, 个个都是张百万。
去掉一个最高分 去掉一个最低分 三号选手最后得 分…..
三、调和平均数(Harmonic Mean)
㈠调和平均数:是总体各单位标志值倒数的 算术平均数的倒数,又叫倒数平均数. (二)简单调和平均数 计算公式:
m XH 1 1 1 1 X X1 X 2 Xm m
(四).算术平均数的数学性质:
⒈变量值与其算术平均数的离差之 和衡等于零,即:
( x x ) 0
或( x x ) f 0
⒉变量值与其算术平均数的离差平 方和为最小,即:
( x x ) min
2
或( x x ) f min
2
算术平均数的缺点:易受极端值的影响
适用条件: 分组资料
例1:单项式数列
某班学生年龄情况表
人数(人) 5 5 2 8 20
频数
按年龄分组(岁) 20 21 22 23 合计
分组
比重(%) 25 25 10 40 100
频率
求学生的平均年龄 解:(1)绝对权数
X
X
i 1 n i 1
n
i
fi
i
f
20 5 21 5 22 2 23 8 21.65(岁) 55 28
上一页
下一页
返回本节首页
2、作用
(1)使范围不同的总体具有可比性。 (2)反映总体各单位的一般水平这一综合特征,抽 象掉了个体差异。 (3) 反映总体分布的集中趋势。 即如果以总体单位某一标志的平均数为中心线, 则总体各单位的标志值主要分布于中心线及其上下 附近,而远离中心线的标志值较少。
第五章 统计分布特征的描述: 平均指标和变异指标
安徽财经大学统计与应用数学学院
第五章 统计分布特征的描述
第一节 集中趋势的测度:平均指标 第二节 离散趋势的测度:变异指标
第一节 集中趋势的测定:平均指标
一、平均指标的概念和作用
二、算术平均数 三、调和平均数
四、几何平均数
n 1700 1900 1500 1850 2200 5 1830(元)
x x
例2: 某某班学生基本情况调查表
姓名 张三 李四 王五 贾六 刘七 杨小 孙非 王继 赵可 武思 兰第 拉达 向乐 项于 可人 梁草 保安 马宝 姜清 林可 性别 男 女 男 女 男 男 男 男 女 男 女 女 男 女 男 女 男 男 女 男 民族 汉 汉 回 汉 汉 回 回 满 汉 汉 汉 汉 回 汉 汉 回 汉 汉 满 满 年龄 21 21 23 23 22 21 20 23 23 21 23 23 22 21 23 23 20 20 20 20 身高 1.52 1.43 1.58 1.51 1.69 1.75 1.81 1.65 1.65 1.76 1.48 1.43 1.58 1.61 1.71 1.52 1.46 1.82 1.58 1.73 政治面貌 中共党员 中共党员 团员 团员 团员 中共党员 团员 团员 中共党员 团员 中共党员 团员 中共党员 团员 团员 团员 中共党员 团员 中共党员 团员
(2)计算方法不同。
(3)计量单位表示不同。
(二)、算术平均数的计算 1.简单算术平均数 计算公式:
X 1 X 2 X N X N
X
i 1
N
i
N
适用条件:未分组的原始资料
例1:
某企业一生产班组共 5 人,他们在 2000 年 9 月的月工 资分别为1700元,1900元,1500元,1850元,2200 元。则他们的月平均工资为:
i
分析如下:
( 1 )平均什么什么就是标志值,标志值出 现的次数即为权数 (2)影响算术平均数大小的因素有二:
变量值x的大小。
变量值越大平均数越大 权数越大的标志值对平均数影响越大,实际上权 数的大小反映了标志值的重要性,因此权数也称 为权重系数。 各组频率也即相对权数更能体现权衡轻重的本质。
某班英语成绩 人数f(人) 频率(%) 5 10 13 26 16 32 11 22 5 10 50 100
组中值 95 85 75 65 55 —
解(1)绝对权数
X
X
i 1 n
n
i
fi
i 1
7 5.4(分)
fi
(2)相对权数
X Xi
i 1 n
fi
f
i 1
n
75.4(分)
(三)平均指标的种类 数值平均数:根据统计数列中的各项数据计 算出的平均数。主要有:算术平均数、 调 和平均数、几何平均数。 位置平均数:将各单位标志值排序后,取得 某一位置的标志值作为反映一般水平的代表 值。有:众数、中位数。
二、算术平均数(Arithmetic Mean)
㈠基本公式
总体标志总量 算术平均数 总体单位总量 例如:
i 1 m i i
x f
m
实际上,例2是用下列公式计算:
m Xh 1 X
这就是简单调和平均数的公式。
上一页 下一页 返回本节首页
(三)加权调和平均数
计算公式:
XH
m m1 m2 mm mm 1 m1 m2 m X X1 X 2 Xm
mi 为第 i 式中:X i 为第 i 组的变量值; 组的标志总量。
平均工资=企业工资总额/工人数, 平均成绩=成绩总分/学生人数
注意区分算术平均数和强度相对数;
上一页
下一页
返回本节首页
算术平均数和强度相对指标的区别: (1)含义和作用不同:
强度相对指标表明现象程度发展的强度、密度或普遍程 度; 而平均指标则表明同类现象在一定时间、地点条件下所 达到的一般水平。 强度相对指标的分子与分母分别来自不同的总体,一般 没有直接的依存关系,且有的强度相对指标分子分母可 以对换,即强度相对指标可以计算正指标或逆指标; 而平均指标的分子是总体总量指标,分母则是同一总体 内的总体单位总量,两者具有密切的关系,且平均指标 的分子分母不能互换。 强度相对指标一般为复名数,有时为无名数;平均指标 则为单名数。
例1,设有某行业150个企业一季度的有关产值和 利润资料如下表:
³ Ð Ò Ä µ ² ú Ö µ Í º À û È ó Ç é ¿ ö ± í » ¼ Ò ¾ ¶ È ú µ ² Ö À û È ó Â Ê £ ¨%© £ ×Ö é Ð Æ Ò ó µ Ê ý £ ¨· ö £ © Ê µ ¼ Ê ² ú Ö µ £ ¨Í ò ª Ô © £ 5~10 30 5700 10~20 70 20500 20~30 50 22500 Ï º ¼ Æ 150 48700 µ £ Ö ¨%© £ 7.5 15 25 ª ¡
X
i 1 m i 1 m i
Leabharlann Baidu
X f X 2 f 2 X m f m X 1 1 f1 f 2 f m
fi
i
f
Xi
i 1
m
fi
f
i 1
m
i
式中:X为算术平均数; f i为第 i 组的次数; 为 m 组数; X i为第 i组的标志值或组中值。
求该行业平均产值利润率。
产值利润率的其本公式 为: 实际利润 产值利润率 100% 实际产值 则: 一季度平均 产值利润率 xf f 0.075 5700 0.15 20500 0.25 22500 5700 20500 22500 9127.5 48700 18.47%
适用条件:分组资料,且已知各组的代表变量值(x)和 标志总量(xf).
上一页 下一页 返回本节首页
计算举例: 例3:某种蔬菜价格早上为0.5元/斤、中午 为0.4元/斤、晚上为0.25元/斤。现早、中、 晚各买2元、3元、4元,求平均价格。
23 4 9 X 0.33元 2 3 4 27.5 0.5 0.4 0.25
班级平均年龄:
X
X
i 1
N
i
N
21 21 23 20 20 21.65(岁) 20
班级平均身高:
X
X
i 1
N
i
N
1.52 1.43 1.58 1.58 1.73 1.6135 (米) 20
㈢加权算术平均数 计算公式: