第五章 统计分布特征的描述:集中趋势和离散趋势
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
m XH 1 1 1 1 X X1 X 2 Xm
m
式中: H 为调和平均数; m为变量值 X X 的个数; i 为第 i 个变量值。
适用条件:已知各组的代表变量值和标志总量,且各 组的标志总量恰好相等.
计算举例1:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、 晚上为0.25元/斤。现早、中、晚各买1斤,求平均价格。 例2:某种蔬菜价格早上为0.5元/斤、中午为0.4元/斤、晚上为 0.25元/斤。现早、中、晚各买1元,求平均价格。 在例1中,用简单算术平均数
X
i 1 m i 1 m i
X f X 2 f 2 X m f m X 1 1 f1 f 2 f m
fi
i
f
Xi
i 1
m
fi
f
i 1
m
i
式中:X为算术平均数; f i为第 i 组的次数; 为 m 组数; i为第 i 组的标志值或组中值。 X
班级平均年龄:
X
X
i 1
N
i
N
21 21 23 20 20 21.65(岁) 20
班级平均身高:
X
X
i 1
N
i
N
1.52 1.43 1.58 1.58 1.73 1.6135 米) ( 20
㈢加权算术平均数 计算公式:
适用条件: 分组资料
例1:单项式数列
某班学生年龄情况表
人数(人) 5 5 2 8 20
频数
按年龄分组(岁) 20 21 22 23 合计
分组
比重(%) 25 25 10 40 100
频率
求学生的平均年龄 解:(1)绝对权数
X
X
i 1 n i 1
n
i
fi
i
f
20 5 21 5 22 2 23 8 21.65(岁) 55 28
算术平均数的缺点:易受极端值的影响
张庄有个张千万, 九个邻居穷光蛋; 平均起来算一算, 个个都是张百万。
去掉一个最高分 去掉一个最低分 三号选手最后得 分…..
小案例:有一种无聊叫平均工资
国家统计局二十九日宣布,前三季度中国城镇单位在岗职工平均工资为19731元人民币,比上年同 期增加3056元,同比增长18.3%,其中,北京(39663元)、上海(39004元)、西藏(32436元) 位列前三位。 每次统计局一公布平均工资,接着便是质疑数据失真的一片争议,这几乎已经成为一种惯例,这次 自然也不会例外。平均工资的统计数据为何如此偏离公众切身感受?对此,统计专家非常清楚,赶 忙向公众解释说一是因为所公布的数据是“平均数”,二是因为统计口径上不包括私企员工和农民 工。 有网络民谣曰:张家有财一千万,九个邻居穷光蛋,平均起来算一算,个个都是张百万。这种在收 入差距上不做如何区分统计的简单平均,本身已经毫无科学性可言;加之在统计口径上又不包括基 本处在收入水平最底层的私企员工和农民工,“顶级富人参与平均、底层穷人不参与平均”的平均 工资,无论在任何经济困难时期大概也会呈现出可喜的大幅增长状态。 依据不同人群之间明显的收入差距,做更为细致的平均工资统计,其实纯粹只是一个数学问题,基 本没有什么技术含量;将私企员工、农民工的工资数据纳入统计呢,事实上工作都已经完成了,却 因为“考虑到数据的敏感性”,而粗暴剥夺了公众的知情权,没有向社会公布。 现在的情形就是这样的:谁都明白统计平均工资的巨大漏洞在哪里,谁都知道现在的平均工资统计 数据严重偏离公众感受,但这种失真的统计工作却照旧进行不误,并且乐此不疲地接连公布“成 果”。那么我们不禁要问:明知失真却照旧统计不误的平均工资,究竟是为了什么?是为了让数据 反映社会现实,还是只为了要一个好看的数据?或者,只是为了逗公众玩?拜托,纳税人都不富裕, 还享受不起这种昂贵的“娱乐”,更何况,这其实一点都不好玩。 原本十分严肃的平均工资统计,公众却必须以娱乐事件的眼光来看到,这既很无奈,也很无聊。我 们理解,统计工作应该是很辛苦的,但辛苦工作换来的如果只是一种“数字上涨、感觉没涨”的普 遍质疑,统计专家还得一遍又一遍向公众解释“为何感觉不到涨工资”,那这项统计工作的意义是 需要打问号的。尤其是,依据这样的统计数据来指导决策,是很容易误事的。 知道不足就应该马上改进,知道了统计漏洞就应该马上着手改革,这才是正途所在。否则,前期该 做的辛苦统计工作也许一样没少,却在最后数学计算的时候如此粗糙,“不精确”也好,“敏感” 也罢,在民众看来实际都意味着“统计失败”。而且,经过公众连续不断的质疑和批评仍然我行我 素不思改进,那么我们真的只能摇头感叹:有一种无聊叫统计平均工资。
平均工资=企业工资总额/工人数, 平均成绩=成绩总分/学生人数
注意区分算术平均数和强度相对数;
上一页
下一页
返回本节首页
算术平均数和强度相对指标的区别: (1)含义不同: 强度相对指标是指两个性质不同但有一定联系的 总量指标之比; 而平均指标则用来反映同质总体内各单位某一数 量标志的一般水平。 (2)作用不同: 强度相对指标表明现象程度发展的强度、密度或 普遍程度; 而平均指标则表明同类现象在一定时间、地点条 件下所达到的一般水平。
(3)加权算术平均数有两种变形: 当权数用相对数时
xf x f x f f
当f1=f2=f3=……=fn时,权数的作用消失,加 权平均数 = 简单平均数 (4)组距数列计算加权算术平均数时,假定 该组标志值是完全均匀分布的,以各组的组 中值为各组变量值,计算的平均数是近似值。
上一页
下一页
返回本节首页
2、作用
(1)使范围不同的总体具有可比性。 (2)反映总体各单位的一般水平这一综合特征,抽 象掉了个体差异。 (3) 反映总体分布的集中趋势。 即如果以总体单位某一标志的平均数为中心线, 则总体各单位的标志值主要分布于中心线及其上下 附近,而远离中心线的标志值较少。
i
分析如下:
(1)平均什么什么就是标志值,标志值出现的次 数即为权数 (2)影响算术平均数大小的因素有二: 变量值x的大小。变量值越大平均数越大 各组次数,但非次数绝对数,而是次数的相对数。 次数结构或比重、频率 f
f
权数越大的标志值对平均数影响越大,实际上权 数的大小反映了标志值的重要性,因此权数也称 为权重系数。
Xh
n
1 X
这就是简单调和平均数的公式。
上一页 下一页 返回本节首页
(三)加权调和平均数
计算公式:
XH
m1 m2 mm m mm 1 m1 m2 X m X1 X 2 Xm
(三)平均指标的种类 数值平均数:根据统计数列中的各项数据计 算出的平均数。主要有:算术平均数、 调 和平均数、几何平均数。 位置平均数:将各单位标志值排序后,取得 某一位置的标志值作为反映一般水平的代表 值。有:众数、中位数。
二、算术平均数(Arithmetic Mean)
㈠基本公式
总体标志总量 算术平均数 总体单位总量 例如:
五、众数 六、中位数
七、各种平均数之间的相互关系
上一页
下一页
返回本章首页
一、平均指标的概念和作用
㈠概念:平均指标是指将同质总体内各 单位的数量差异抽象化,反映总体一般 水平或集中趋势的统计指标 所谓集中趋势,指一组数据向某一中心 值靠拢的倾向,测度集中趋势,也就是 寻找数据的一般水平的代表值或中心值。
第五章 统计分布特征的描述: 平均指标和变异指标
安徽财经大学统计与应用数学学院
第五章 统计分布特征的描述
第一节 集中趋势的测度:平均指标 第二节 离散趋势的测度:变异指标
第一节 集中趋势的测定:平均指标
一、平均指标的概念和作用
二、算术平均数 三、调和平均数
四、几何平均数
(四).算术平均数的数学性质:
⒈变量值与其算术平均数的离差之 和衡等于零,即:
( x x ) 0
⒉变量值与其算术平均数的离差平 方和为最小,即:
( x x ) min
2
三、调和平均数(Harmonic Mean)
㈠调和平均数:是总体各单位标志值倒数的 算术平均数的倒数,又叫倒数平均数. (二)简单调和平均数 计算公式:
(3)计算方法不同。 强度相对指标的分子与分母分别来自不同的总体, 一般没有直接的依存关系,且有的强度相对指标 分子分母可以对换,即强度相对指标可以计算正 指标或逆指标; 而平均指标的分子是总体总量指标,分母则是同 一总体内的总体单位总量,两者具Hale Waihona Puke Baidu密切的关系, 且平均指标的分子分母不能互换。
(4)计量单位表示不同。 强度相对指标一般为复名数,有时为无名数;平 均指标则为单名数。
(二)、算术平均数的计算 1.简单算术平均数 计算公式:
X 1 X 2 X N X N
X
i 1
N
i
N
适用条件:未分组的原始资料
例1:
某企业一生产班组共5人,他们在2000年9月的月工 资分别为1700元,1900元,1500元,1850元,2200 元。则他们的月平均工资为:
0.5 0.4 0.25 x 0.38元 n 3
x
在例2中,先求早、中、晚购买的斤数。
早 1/0.5=2(斤)中 1/0.4=2.5(斤)晚 1/0.25=4(斤)
x 111 3 0.35元 1 1 1 8.5 0.5 0.4 0.25
实际上,例2是用下列公式计算:
(2)相对权数
X Xi
i 1 n
fi
f
i 1
n
i
1.45 20% 1.55 30% 1.65 20% 1.75 20% 1.8510% 1.62(米)
例3:某班英语成绩整理如下,求学生英语平均成绩.
成绩 90以上 80~90 70~80 60~70 60以下 合计
(2)相对权数
X Xi
i 1 n
fi
f
i 1
n
i
20 25% 21 25% 22 10% 23 40% 21.65
例2:组距式数列(等距数列) 某班学生身高情况表
按身高分组(米) 组中值 1.45 1.4-1.5 1.55 1.5-1.6 1.65 1.6-1.7 1.75 1.7-1.8 1.85 1.8-1.9 —— 合计
分组 组中值
人数(人) 4 6 4 4 2 20
频数
比重(%) 20 30 20 20 10 100
频率
求学生的平均身高 解:(1)绝对权数
X
X
i 1 n i 1
n
i
fi
i
f
1.45 4 1.55 6 1.65 4 1.75 4 1.85 2 46442 1.62(米)
某班英语成绩 人数f(人) 频率(%) 5 10 13 26 16 32 11 22 5 10 50 100
组中值 95 85 75 65 55 —
解(1)绝对权数
X
X
i 1 n
n
i
fi
i 1
7 5.4(分)
fi
(2)相对权数
X Xi
i 1 n
fi
f
i 1
n
75.4(分)
n 1700 1900 1500 1850 2200 5 1830(元)
x x
例2: 某某班学生基本情况调查表
姓名 张三 李四 王五 贾六 刘七 杨小 孙非 王继 赵可 武思 兰第 拉达 向乐 项于 可人 梁草 保安 马宝 姜清 林可 性别 男 女 男 女 男 男 男 男 女 男 女 女 男 女 男 女 男 男 女 男 民族 汉 汉 回 汉 汉 回 回 满 汉 汉 汉 汉 回 汉 汉 回 汉 汉 满 满 年龄 21 21 23 23 22 21 20 23 23 21 23 23 22 21 23 23 20 20 20 20 身高 1.52 1.43 1.58 1.51 1.69 1.75 1.81 1.65 1.65 1.76 1.48 1.43 1.58 1.61 1.71 1.52 1.46 1.82 1.58 1.73 政治面貌 中共党员 中共党员 团员 团员 团员 中共党员 团员 团员 中共党员 团员 中共党员 团员 中共党员 团员 团员 团员 中共党员 团员 中共党员 团员