第四章 集中趋势测量法_社会统计学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
33
第四节 几何平均数、调和平均数(了解)
1. 几何平均数Mg (geometric mean )
N个变量值连乘积的N次方根。(不能有变量值为
0)。适用于:(1) 计算某种比率的平均数;(2) 计算大 致具有几何级数关系的一组数字的平均数,如经济指标 的平均发展速度。 (1)简单几何平均数
对数式:
合计
50
1.00
31
求下表中的众数
32
3. 众数的性质
(1) 众数仅受上下相邻两组频数大小的影响,不受极 端值影响,对开口组仍可计算众数; (2) 受抽样变动影响大; (3) 众数不唯一确定。 (4) 众数标示为其峰值所对应的变量值,能很容易区 分出单峰、多峰。因而具有明显偏态集中趋势的频数分 布,用众数最合适。
12
2. 对于分组资料
fX X PX f
注意:对求和符号,此时流动脚标的变动范围是1,2,3 … ,n, n是组数,而不是总体单位数。
很显然,算术平均数不仅受各变量值(X)大小的影 响,而且受各组单位数(频数)的影响。由于对于总体的影 响要由频数( f )大小所决定,所以 f 也被称为权数。值得 注意的是,在统计计算中,权数不仅用来衡量总体中各标 志值在总体中作用,同时反映了指标的结构,所以它有两 种表现形式:绝对数(频数)和相对数(频率)。这样一 来,在统计学中,凡对应于分组资料的计算式,都被称为 加权式。
34
(2) 加权几何平均数
对数式:
应该指出,用以计算几何平均数的各项数值必须 大于0,否则就不能计算几何平均数或计算结果无实 际意义。
35
N
X
[例] 求3,9,27,81,243这些数字的几何平均 数。 [解 ]
N
X
( 1) ( 2)
36
[例] 某产品需经三个车间连续加工,已知 三个车间制品的合格率分别为95%、90%、 98%,求三个车间平均合格率。
11
1. 对于未分组资料
X X N
注意:对求和符号,此时流动脚标的变动范围是1, 2, 3, … ,N ,
N是总体单位数。
[例] 求74、85、69、9l、87、74、69这些数字的 算术平均数。 [解]
X X = N
74 85 69 91 87 74 69 =78.4 7
8
萨姆:每周100元又是怎么回事呢? 吉斯莫:那称为众数,是大多数人挣 的工资。 吉斯莫:老弟,你的问题是出在你不 懂平均数、中位数和众数之间的区别。 萨姆:好,现在我可懂了。我……我 辞职!
9
第一节 算术平均数(MEAN)
用总体标志总量除以总体单位数即得 算术平均数(Arithematic mean)。
吉斯莫先生有一个小工厂,生产超级小 玩意儿。 管理人员由吉斯莫先生、他的弟弟、六 个亲戚组成。工作人员由5个领工和10个 工人组成。工厂经营得很顺利,现在需 要一个新工人。 现在吉斯莫先生正在接见萨姆,谈工作 问题。
6
吉斯莫:我们这里报酬不错。平均薪金 是每周300美元。你在学徒期间每周得75 美元,不过很快就可以加工资。 萨姆工作了几天之后,要求见厂长。
25
请从下表中指出第一四分位数和第三四分 位数
26
求出下表中的第一四分位数和第三四分数
27
第三节 众数(Mode)
众数是在一组资料中,出现次数(或频 数)呈现出“峰”值的那些变量值,用Mo表示。 众数只与次数有关,可以用于定类、定序、 定距、定比资料。
28
1. 对于未分组资料 直接观察 首先,将所有数据顺序排列;然后,只要 观察到某些变量值(与相邻变量值相比较)出现 的次数(或频数)呈现“峰”值,这些变量值就 是 众数。
算术平均数是反映集中趋 势最常用、最基本的平均指标, 也被称为均值。它只适用于定 距以上的变量。
10
1190 350
例:某小区350户家庭共有居民1190人。在 这个例子中,家庭总数350户是总体单位数,居 民总数1190人是该总体的标志总量。根据算术 平均数的定义
1190 户均人口= = 3.4(人) 350
48
49
在上述计算平均价格的过程中,早、中、 晚三个时段购买蔬菜所花费的现金是计算 平均价格的权数,这种方法我们称为加权 调和平均法。 由以上分析过程得出调和平均数的定义:
调和平均数是各个变量值倒数的算术平均 数的倒数,习惯上用(H)表示。
50
51
3. 各种平均数的关系
(1) 当总体呈正态分布时: (2)当总体呈偏态分布时:中位数总在均数和众数之间 正偏: 负偏: (注: 和 合称位置平均数) (3) 皮尔逊发现 ,在钟形分布的偏态不大显著时, 、
按中位数所在组的上限:
21
[例]某年级学生身高如下,求中位数
22
100 / 2 37 25
[解] 第一种方法
100 / 2 37 =168+ ×6 25
=171.12(厘米) 请你用第二种方法 来做一下
23
3. 中位数的性质
(1)各变量值对中位数之差的绝对值总和, 小于它们对任何其他数的绝对值总和。 (2)中位数不受极端值的影响。 (3)分组资料有不确定组距时,仍可求得 中位数。 (4)中位数受抽样变动的影响较算术平均 数略大。
37
38
[例] 某地区GDP 1991~1995年平均发展速度 为107.2%,1996~1998年平均发展速度为 108.7%,1999~2000年平均发展速度为110%, 求该地区1991~2000年间的平均发展速度。
39
40
2. 调和平均数Mh ( harmonic mean)
N个变量值倒数算术平均数的倒数, 也称倒数平均数。适用于:掌握的情况 是总体标志总量而缺少总体单位数的资 料时。
我们有三种方法选择集中趋势: (1)根据频数:哪个变量值出现次数越 多,就选择哪个变量值,比如民主决策的表决 机制。 (2)根据居中:比如一个城镇居民的生活 水平,居中的是小康家庭,那么就用小康家庭 来代表该城镇的生活水平。 (3)根据平均:用平均数来代表变量的 平均水平。
5
关于集中趋势的一个故事
2
下面是一个小故事: 一个人到某公司求职,经过调查,得出关 于该公司工资的一些数据,如果是你,应 该如何选择?
3
挠头的数值
公司员工的月薪如下:
(元)
经理 副经 职员 职员 职员 职员 职员 职员 职员 A B C D E F G 员工 理 月薪 6000 4000 1700 1300 1200 1100 1100 1100 500
13
[例] 求下表(单项数列)所示数据的算术平 均数 。
人口数(X)
2 3 4 5 6 7 8
户数(f)
5 8 16 10 6 4 1
频率(P)
0.10 0.16 0.32 0.20 0.12 0.08 0.02
合计
50
1.00
14
对于组距数列,要用每一组的组中值权充该 组统一的变量值。 [例] 求下表所示数据的的算术平均数
24
4. 四分位数
中位数所有单位被等分为两部分,因而被称为二分 位数。类似于求中位数,我们还可求出四分位数、十分 位数、百分位数。 将总体中的各单位分割成相等的四部分,则这三个 分割的变量值就是四分位数。若以Q1、Q2、Q3分别代表 第一、第二、第三四分位数。Q2 即中位数,Q1、Q3的算 法分别是
你会吗?
19
2. 对于分组资料 (1)单项数列
根据N/2在累计频数分布中找到中位数所在组, 该组变量值就是Md 。
中 位 数
20
(2)组距数列
当根据组距数列求中位数时,要采用所谓的比 例插值法:先根据N/2在累计频数分布中找到中位 数所在组,然后假定该组中各变量值是均匀分布的, 再用以下任何一种方法求出中位数(注意:此处用 的是向上累计)。 按中位数所在组的下限:
、
三者大致构成一个比较固定的关系:
(4) 、 和 合称数值平均数
52
53
54
55
41
为了方便调和平均数的概念和计算方法的 说明,我们先看一个简单的例子。
42
[例3.6] 市场上早、中、晚蔬菜的价格分别 是早晨: 0.67元/公斤,中午0.5元/公斤, 晚上0.4元/公斤。现在,我们分别按四种方 法在购买蔬菜,分别计算平均价格(不管 按什么方法购买,平均价格都应该等于花 费的现金除所买蔬菜的数量):
fX X f
间距
148―152 152―156 156―160 160―164 164―168 168―172 172―176 176―180 180―184 184―188 188―192 192―196
合计
频数(f)
1 2 5 10 19 25 17 12 5 3 0 1
100
组中值(X)
150 154 158 162 166 170 174 178 182 186 190 194
43
44
45
第三种买法:早、中、晚各买一元
在这种情况下,计算蔬菜平均价格比上述 两种方法稍微复杂一些,我们得先计算出 一元钱所购买蔬菜的数量,然后再计算蔬 菜的平均价格。 要计算蔬菜的平均价格,首先应该计算出 早、中、晚各花费1元钱所购买蔬菜的数量:
46
47
这种计算平均指标的方法同算术平均法有 很大的不同,由于资料中缺乏总体单位总 量,所以,就不可能直接用算术平均的方 法计算平均指标。为了达到计算目的,首 先要用变量值的倒数计算出总体单位总量 来,然后再计算平均指标,调和平均数法 因此而得名,也正是由于这个原因,调和 平均数又称为倒数平均数。
第四章 集中趋势测量法
算术平均数
主 要 内 容
中位数 众数 几何平均数和调和平均数
1
统计分析首先要解决的问题,就是寻求 一个简单数值以代表搜集所得的资料。 平均指标就是表明同质总体在一定条件 下某一数量标志所达到的一般水平。 平均指标把总体各单位之间的差异加以 抽象概括,其中个别标志值的偶然性被 相互抵消,从而反映出总体分布的集中 趋势。
——
15
3. 算术平均数的性质
各变量值与算术平均数的离差之和等于0。 各变量值对算术平均数的平方和,小于它们对任 何他数偏差的平方和 算术平均数受抽样变动影响较小。 受极端值影响较大。
分组资料如遇有开放组距时,不经特殊处理 不能进行算术平均数的计算。
16
第二节 中位数(Median)
把总体单位某一数量标志的各个数值按大小 顺序排列,位于正中处的变量值,即为中位数, 用Md表示。 Md可用于定序、定距、定比资料。
29
2. 对于分组资料
单项式:观察频数分布 (或频率分布 )
组距式:
Lo为众数组下限; Δ1为众数组频数与前一组频数之差; Δ2为众数组频数与后一组频数之差; ho为众数组组距。
30
求下表中的众数
人口数(X) 众 数
2 3 4 5 6 7 8
户数(f)
5 8 16 10 6 4 1
频率(P)
0.10 0.16 0.32 0.20 0.12 0.08 0.02
萨姆;你欺骗我!我已经找其他工人核 对过了,没有一个人的工资超过每周100 元。平均工资怎么可能是一周300元呢? 吉斯莫:啊,萨姆,不要激动。平均工 资是300元。我要向你证明这一点。
7
吉斯莫:这是我每周付出的酬金。我得 2400元,我弟弟得1000元,我的六个亲 戚每人得250元,五个领工每人得200元, 10个工人每人100元。总共是每周6900元, 付给23个人,对吧? 萨姆:对,对,对!你是对的,平均工 资是每周300元。可你还是蒙骗了我。 吉斯莫;我不同意!你实在是不明白。 我已经把工资列了个表,并告诉了你, 工资的中位数是200元,可这不是平均工 资,而是中等工资。
17
1Fra Baidu bibliotek 对未分组资料
(1)、先把所有数据按大小顺序排 列,如果总体单位数为奇数,则取 第(N+1)/2 位上的变量值为中位 数; (2)、如果总体单位数为偶数。 因为居中的数值不存在,按惯例, 取第 N/2位和第(N+1)/2 位上的 两个变量值的平均作为中位数。
18
例 求54,65,78,66,43这些数字的中位 数。 例、求54,65,78,66,43,38 这些数字的 中位数。