第四章 统计学(集中趋势 )

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表4-1 资料
按零件数分组
组中值(
x)
i
频数(
f

i
x f
i
i
105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计
107.5 112.5 117.5 122.5 127.5 132.5 137.5 —
3 5 8 14 10 6 4 50

(三)分位数

分位数一般用(Q)表示。中位数能够将 全部总体单位按标志值的大小等分为两 个部分。与中位数性质相似的还有四分 位数、八分位数、十分位数和百分位数 等。它们分别用3个点、7个点、9个点和 99个点将总体数据分为4等份、8等份、 10等份和100等份。这里介绍四分位数的 计算。

四分位数也称四分位点,它是总体数据排序后处 于25%、50%和75%位置上的数值。四分位数通 过3个点将总体数据等分为4个部分。其中,中间 位置的数值就是中位数,也称四分之二分位数, 通常用 Q 2 表示;处于25%位置上的数值称为下 四分位数,也称四分之一分位数,通常用 Q 1 表示; 处于75%位置上的数值称为上四分位数,也称为 Q3 四分之三分位数,通常用 表示。与中位数的 计算方法类似,四分位数的计算通常也需要考虑 未分组数据和分组数据两种情形。
算术平均数= 总体标志总量 总体单位总量

算术平均数按照计算方法的不同可分为 简单算术平均数和加权算术平均数两种。
1.简单算术平均数

根据未分组的数据,将总体各单位的标 志值简单加总形成总体标志总量,然后 除以总体单位总量,称为简单算术平均 法。计算公式为:
x x1 x 2 ....... x n n
1. 由未分组数据确定中位数 对于未分组数据,需要先将各变量值按大小顺 序排列,并按公式 n 1 确定中位数的位置。
2

当总体单位数为奇数时,则处于序列中间位置 的变量值就是中位数。




当总体单位数为偶数时,则应取中间位置的两 个数的中点值作为中位数,即取中间两个变量 值的算术平均数为中位数。 2. 由单项数列确定中位数 根据单项数列确定中位数与根据未分组数据确 定中位数方法基本一致。它是先计算各组的累 f 计次数(或频数),再按公式 确定中 2 位数的位置,并对照累计次数确定中位数。

1.根据未经分组的原始数据资料计算几 何平均数时,可采用简单几何平均数, 计算公式为:
G
n
x 1 x 2 ...... x n
n

i 1
n
xi

2.根据分组整理的数据计算几何平均数 时,可采用加权几何平均数,计算公式 为:
f 1 f 2 ...... f n
G
x1 x 2
f1
f2
...... x n
fn

f
i 1
n
i
x
i 1
n
fi i


【例4.5】某种彩电生产需要经过六道工 序,每道工序的合格率分别为98%、 91%、93%、98%、98%、91%,求这 六道工序的平均合格率。 解:根据题意可知,该种彩电的合格率 等于各道工序产品合格率的连乘积,所 以要用几何平均数来计算这六道工序的 平均合格率。即:



解:表4-4为单项数列,该班同学年龄 50 中位数的位置为 25,说明中位数是第 2 25位同学的年龄,而根据累计频数可知, 该位置所对应的变量值为19岁,因此, 中位数为第三组的变量值19岁。


3. 由组距式变量数列确定中位数 根据组距式变量数列确定中位数,应从变量 数列的累计频数栏中找出中位数所在组,然 后利用公式计算出中位数的近似值。计算公 式如下: n
二、数值平均数的计算


数值平均数是同质总体内各个个体某一 数量标志在一定时间、地点、条件下所 达到的一般水平,是反映现象总体综合 数量特征的重要指标。 数值平均数有三种形式:算术平均数、 调和平均数和几何平均数。
(一)算术平均数

算术平均数是集中趋势中最主要的测度 值,是最常用的一种平均指标。其基本 公式是:
5
三、位置平均数的计算


(一)众数 众数是指总体中出现次数最多的那个变 量值,通常用表示。一般只有当总体单 位比较多,且存在明显集中趋势的数列 中才用众数作为总体的代表值。 众数的确定要根据掌握的资料而定。未 分组资料或单项数列资料众数的确定比 较容易,不需要计算,可直接观察确定。


根据组距数列确定众数比较复杂。公式 如下: f f 下限公式: M L f f f f d
f 1 , f 2 , f 3 ,......, fn

计算公式为:
x
x 1 f 1 x 2 f 2 ...... x n f n f 1 f 2 ...... f n
x

i 1
n
i
fi

n
fi
i 1
【例4.2】根据表4-1中的数据,计算50名工人 日加工零件数的平均数。 表4-1 50名工人日加工零件平均数计算表
x
3782元
2.加权算术平均数




根据分组整理所形成的变量数列来计算算 术平均数的方法,称为加权算术平均数。 根据分组整理所形成的变量数列来计算算 术平均数的方法,称为加权算术平均数。 设原始数据被分为 k 组,各组的组中值分 别用 x 1 , x 2 , x 3 ,......, x n 表示 各组变量值出现的频数分别用 :
322.5 562.5 940.0 1715.0 1275.0 975.0 550.0 6160.0


解:表4-1的数据为等距分组资料,而 120~125这一组出现的频数最大,为14。 因此,该组为众数所在组。将表4-1的数 据资料代入分组数据计算中位数的公式可 得: 按下限公式(4-7)计算:

fi s m 1 d fm

下限公式
M
e
i 1
L
2
Βιβλιοθήκη 上限公式:Me
n
fi s m 1 d fm
i 1
U
2
其中:L为中位数所在组的下限; U为中位数所在组的上限; 1 s m 为向上累计至中位数所在组前一组止的次数; s m 1为向下累计至中位数所在组后一组止的次数; f m 为中位数所在组的次数; d 为中位数所在组的组距。
60
70 85 合计
1080
700 170 2960
18
10 2 50

解:根据题意,应采用加权调和平均数 来进行计算,依据4-5式得:
(三)几何平均数

几何平均数是几何级数(等比级数)的 平均数,是n项标志值乘积的n 次方根。 一般用G 表示。几何平均数主要是用来 计算有序过程的平均比率、平均发展速 度或平均增长速度等。


n
1
1

1

1
i 1
x
0 . 25
i
0 .2
0 .1
该种蔬菜当天平均价格为每500克0.158元。
【例 4.4】已知某企业职工工资和工资总额资料 如表4-2,要求:计算该企业职工的平均工资:

表4-2 企业职工工资计算表
工资(x) 46 52 工资总额(m) 230 780 职工人数(m/x) 5 15

计算过程如表4-1所示。 根据4-2公式得:

x
n
xi fi fi
i 1
6160 50

n
123 . 2
i 1


从上面的计算可以看出,次数f的作用:当变量 值比较大的次数多时,平均数就接近于变量值大 的一方;当变量值比较小的次数多时,平均数就 接近于变量值小的一方。可见,次数对变量值在 平均数中的影响起着某种权衡轻重的作用,因此 被称为权数。 但是,如果各组的次数(权数)均相同时,即:
G
6
98 % 91 % 93 % 98 % 98 % 91 % 94 . 78 %

【例4.6】某省份从1993年以来的14年, 各年的GDP的增长率资料如表4-3,试 计算14年的GDP的平均增长率。
表4-3 GDP增长率几何平均数计算表
时间
1993-1996年 1997-2001年 2002-2006年 合 计
n i i 1


【例4.8】 某校旅游管理班同学按年龄分组资料如 表4-4所示,求中位数。 表4-4 某校旅游管理班同学年龄分组资料
年龄(岁) 学生人数 17 18 19 20 21 5 8 26 9 2 向上累计频数 5 13 39 48 50 向下累计频数 50 45 37 11 2
合计
50
年数
4 5 5 14
GDP的增长率 %
10.2 8.7 9.6 —

解: 计算平均发展速度:
f 1 f 2 ...... f n
G
x1 x 2
4
f1
f2
...... x n
5
fn
455
110 . 2 % 108 . 7 % 109 . 6 % 109 . 45 %
按零件数分组
组中值(
x)
i
频数(
f

i
x f
i
i
105~110 110~115 115~120 120~125 125~130 130~135 135~140 合计
107.5 112.5 117.5 122.5 127.5 132.5 137.5 —
3 5 8 14 10 6 4 50
322.5 562.5 940.0 1715.0 1275.0 975.0 550.0 6160.0
x

i 1
n
i
n



【例4.1】 在某公司中有10个家庭,每 个家庭的人均月收入数据如下(单位: 元)。要求计算平均家庭人均月收入。 1360 1780 2100 5400 7680 900 2600 9000 1600 6300 解:根据(4-1)式得:
1360 1780 1600 6300 10
m m 1 m o m m 1 m 1

上限公式:
M
o
U
f m f m 1
fm
f m 1 f m f m 1
d


其中:L为众数所在组的下限; U为众数所在组的上限; d 为众数所在组的组距; f m 为众数所在组的次数; f m 1 为众数所在组前一组的次数; f m 1 为众数所在组后一组的次数。
f 1 f 2 f 3 ....... f n

时,则权数的权衡轻重作用也就消失了。这时, 加权算术平均数会变成简单算术平均数。即:

x
n
xi fi fi
f
i 1

n
xi
i 1

n
xi
i 1

n
f n
n
i 1
(二)调和平均数

与算术平均数类似,调和平均数也有简 单调和平均数和加权调和平均数两种形 式。其计算公式分别为:
一、平均指标的概念和作用


平均指标亦称平均数,在统计学中占有重要的 地位。它反映同类现象在一定时间、地点、条 件下所达到的一般水平。 对于不同类型的数据,从不同的角度考察其一 般水平时,往往需要运用不同形式的平均指标。 依据各种统计平均数的具含义和计算方式的不 同,可以将其归纳为“数值平均数”和“位置 平均数”两大类。其中,常用的数值平均数有 算术平均数、调和平均数和几何平均数,常用 的位置平均数有众数、中位数和四分位数等。
H n 1 x1 1 x2 ...... 1 xn n

n
1 xi
i 1
H
m 1 m 2 ...... m n m1 x1 m2 x2 ...... mn xn
m

i 1 n
n
i

mi xi
i 1


【例4.3】设市场销售某种蔬菜价格,早市 每500克0.25元,中午每500克0.2元,晚上 每500克0.1元。现早、中、晚各卖100元, 问平均每500克价格多少? 解:根据题意,应按简单调和平均数计算, n 3 则: H 0 . 158
第四章 数据分布特征的描述
第一节 数据分布集中趋势的测定
第一节 数据分布集中趋势的测定


学习目的: 要全面把握数据分布的特征,需要使用各类 代表数值。数据分布的特征可以从集中趋势、 离散程度、偏态与峰度几个方面进行测定和 描述。通过本章学习,掌握数据分布集中趋 势和离散程度的测度,重点掌握分组数据的 算术平均数和标准差及变异系数的计算,并 能灵活运用,了解数据分布形态(即偏态与 峰度)及其测度。
M
o
120
14 8
14
8 14 10
5 123

按上限公式(4-8)计算:
M
o
125
14 10
14
8 14 10
5 123
(二)中位数


中位数是将总体各单位变量值按大小顺序排列 后,处于数列中间位置的那个变量值,通常用 M e 表示
相关文档
最新文档