以Excel和SPSS为工具的管理统计第1章

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1995 244.2
2
7
3.使用 Excel 求几何平均数
可以使用 Excel 统计函数中的 GEOMEAN 函数返 回几何平均数。
语法规则: 格式:GEOMEAN(<区域或数组1>,<区域或数组 2>,…) 功能:返回所有参数中数据的几何平均数。
8
二.位置平均数
位置平均数是根据总体标志值所处的特殊位置确 定的一类平均指标。包括中位数和众数两种。
Me
L
1 2
f fm
Sm1
d
其中:L — 中位数所在组的下限;
Sm-1 — 中位数所在组前一组的累计频数; fm — 中位数所在组的频数; d — 中位数所在组的组距。
11
例:计算下表数据的中位数
分组 0-5 5-15 15-25 25-35 35-45 >45
各组频数 2 6 20 15 8 4
13
1.未分组数据众数的确定
在数据量很大的时候,可以使用 Excel 统计函数 中的 MODE 函数返回众数。
格式:MODE(<区域或数组1>,<区域或数组 2>,…)
功能:返回所有参数中数据的众数。
14
2.分组数据众数的确定
对于分组数据的统计资料,众数也要用插值法来 估算。
(1)确定众数所在的组
2
1 fi
(Xi
X
)2
fi ,
1 fi
(Xi
X )2
fi
S2
1 fi
1 ( X i
X )2
fi ,
S
1 fi
1 ( X i
X
)2
fi
其中 Xi 是第 i 组的组中值或标志值。
27
4.是非标志的平均数和标准差(增加)
在对社会经济现象进行分析时,经常要将总体的 所有单位按是否具有某种属性划分为两组,即“是” 与“非”的两组。
对于等距分组,众数组是频数最高的组;
(2)使用以下插值公式计算
M0
L
1 1 2
d
其中:
Δ1
Δ2
L — 众数组的下限
Δ1— 众数组与前一组的频数之差 Δ2 — 众数组与后一组的频数之差 d — 众数组的组距
d
L 众数
15
例:计算下表数据的众数
分组 0-5 5-15 15-25 25-35 35-45 >45
6
例:某公司原料成本随时间增长的情况如下表
成本 年增长率(%)
1992 200
1993 228 14
1994 239.4
5
求原料成本的平均年增长率。 解一: xG 3 1.141.051.02 1.0688 解二: xG 3 244.2 / 200 1.0688
年平均增长率 = 1.0688 - 1 = 6.88%
3.频数分布为左偏态 时,众数大于中位数, 算术平均数小于中位数。
f
0
M0 Me X
x
f
0
X Me M0 x 17
补充习题
补充题3:某地区私营企业注册资金分组资料如 下,求该地区私营企业注册资金的平均数、中位数 和众数。
注册资金 (万元)
50以下
50~100 100~150 150~200 200~250 250以上
如将学生按性别分组,将产品按合格与否分组。 又如在民意调查中,将被调查者按是否支持某位 侯选人或是否赞成某项政策分为两组等等。
28
(1)比例的概念
——比例是指具有某种性质或属性的单位数占总 体全部单位数的比重,记为 P。
P N1 N
N1——总体中具有某一属性的单位数; N ——总体单位总数。 如产品中的次品率; 全部人口或某单位职工中男、女的比率; 某地区全部家庭中高(如月收入≥10000元)、中、低 (月收入≤1000元)收入家庭各占的比重等。
记为 2,总体标准差记为。
2
1 N
(Xi
X )2
1 N
(Xi
X
)2
24
2.样本方差与样本标准差
样本方差记为 S 2,样本标准差记为 S,在推断统 计中,它们分别是总体方差和标准差的优良估计。
S
2
1 n 1(Xi
X
)2
S
n
1 1
(
X
i
X
)2
其中:n 为样本容量,Xi 为样本观察值
X 为样本均值。
25
未分组数据方差和标准差的计算
方差和标准差的手工计算非常烦琐,只要求掌握以 下两种方法。
⑴使用计算器的统计功能(SD或STAT功能)
⑵使用 Excel 的统计函数
①VARP(<区域或数组1>,<区域或数组2>,…)
功能:返回所有参数中数据的总体方差。
②STDEVP(<区域或数组1>,<区域或数组2>,…)
1 N1 0 N0 N
N1 N
P
可知,比例的平均数就是其本身。 30
(3)比例的方差和标准差
记比例的方差为
2 P
,由分组数据方差的计算公式:
2 P
(xi x)2 fi
fi
(1 P)2 N1 (0 P)2 N0 N
(1 P)2 N1 P2 N0 (1 P)2 P P2 (1 P)
第2章 统计综合指标
本章主要介绍以下 3类综合统计指标: 度量中心(集中)趋势的平均指标 度量离散程度的指标 度量偏斜程度的指标
1
§2.1 度量集中趋势的平均指标
平均指标是说明社会经济现象一般水平的统计指 标,反映标志值分布的集中趋势。
平均指标按计算方式可分为数值平均数和位置平 均数两大类。
2
一.数值平均数
Σf/2=143/2=71.5,中位数所在组为“100~150”的组,
Me
L
f
/ 2 Sm1 fm
d
100
71.5 55 42
50
119 .64(万元)
众数组为“100~150”的组,
M0
L 1 1 2
d
100
42 35
50 115 22
(42 35) (42 26)
(万元) 19
§2.1 度量离散程度的指标
要分析总体的分布规律,仅了解中心趋势指标是不 够的,还需要了解数据的离散程度或差异状况。几个总 体可以有相同的均值,但取值情况却可以相差很大。
频 数
x
x
变异指标就是用来表示数据离散程度特征的。变 异指标主要有:极差、平均差、标准差和变异系数。
20
【案例】道格拉斯公司应如何选择供应商
各组频数 2 6 20 15 8 4
解:众数组是“15-25”的组,则
M0
L
1 1 2
d
15
20 6
10 22.37
(20 6) (20 15)
16
三.算术平均数和位置平均数间的关系
1.频数分布呈完全对
f
称的单峰分布,算术平
均数、中位数和众数三
者相同。
0
X (Me,M0) x
2.频数分布为右偏态 时,众数小于中位数, 算术平均数大于中位数。
9
1.使用 Excel 的统计函数返回未分组数据的中位数 可以使用 Excel 统计函数中的 MEDIAN 函数返回
未分组数据的中位数。 格式:MEDIAN(<区域或数组1>,<区域或数组
2>,…) 功能:返回所有参数中数据的中位数。
10
2.分组数据中位数的确定
对于分组数据的统计资料,中位数要用插值法来估算。 (1)计算各组的累计频数; (2)确定中位数所在的组 ——是累计频数首次包含中位数位次Σf /2的组。
功能:返回所有参数中数据的总体标准差。
③VAR(<区域或数组1>,<区域或数组2>,…)
功能:返回所有参数中数据的样本方差。
④STDEV(<区域或数组1>,<区域或数组2>,…)
功能:返回所有参数中数据的样本标准差。
26
3.分组数据的方差与标准差
如果得到的是分组的频数分布数据,则方差与标 准差的公式如下:
企业数 20
35
42
26
15
5
18
补充题3 答案
注册资金(万元) 企业数
50以下
20
50~100
35
100~150
42
150~200
26
200~250
15
250以上
5
累计企业数 20 55 97 123 138 143
组中值 25 75 125 175 225 275
x xi fi 123 .6(万元) fi
A.D
1 N
|
Xi
X
|
平均差越大,反映数据间的差异越大。
但由于使用了绝对值,其数学性质很差,因而很 少使用。
23
三.方差和标准差
方差和标准差是应用得最为广泛的变异指标。标 准差是方差的算术平方根,也称均方差或根方差。
应注意总体方差、标准差与样本方差、标准差是 有区别的。
1.总体方差和总体标准差
总体方差是各总体数据与其均值离差平方的均值,
极差是最简单的变异指标,它广泛应用于产品质 量管理中控制质量的差异,一旦发现超过控制范围, 就采取措施加以纠正,以保证产品质量的稳定。
但极差有很大的局限性,它仅考虑了两个极端的 数据,没有利用其余数据的信息,因而是一种比较 粗糙的变异指标。
22
二.平均差
平均差是各数据与其均值离差绝对值的算术平均 数,通常记为A.D。
累计频数 2 8 28 43 51 55
解:Σf/2 = 27.5,中位数在“15-25”的组中,
Me
L
1 2
f Sm1 d
fm
15 27.5 8 10 20
24.75
12
(二)众数
——是总体中出现次数最多的标志值,记为M 0。 众数明确反映了数据分布的集中趋势,也是一种 位置平均数,不受极端数据的影响。但并非所有数 据集合都有众数,也可能存在多个众数。 在某些情况下,众数是一个较好的代表值。 例如在服装行业中,生产商、批发商和零售商在 进行生产和存货决策时,更感兴趣的是最普遍的尺 寸而不是平均尺寸。 又如,当要了解大多数家庭的收入状况时,也要 用到众数。
——是根据总体各单位所有标志值计算出的平均数。
包括算术平均数、几何平均数。
(一)算术平均数 1.算术平均数的基本公式
算术平均数
总体单位标志总量 总体单位总数
3
2.算术平均数的计算
(1)简单算术平均数
x
1 n
n
xi
i 1
n —总体单位总数;xi —第 i 个单位的标志值。 (2)加权算术平均数
x xi fi fi
5
(二)几何平均数
当统计资料是各时期的发展速度等前后期的两两 比环数据,要求每时期的平均发展速度时,就需要 使用几何平均数。
几何平均数是 n 个数连乘积的 n 次方根。
1. 简单几何平均数
xG n x1 x2 xn
2. 加权几何平均数
xG
f
x f1 1
x f2 2
xnfn
f i — 各比率出现的频数
xi —第 i 组的代表值(组中值或该组变量值); f i —第 i 组的频数。
4
使用 Excel 函数求加权算术平均数
利用 Excel“数学和三角函数”中的 SUMPRODUCT 函数可以方便地计算出分组数据的 加权算术平均数。
语法规则: 格式:SUMPRODUCT(<区域1>,<区域2>,…) 功能:返回两个或多个区域中对应元素乘积之和。 例:利用比特啤酒公司各销售点分组频数分布数 据,求各销售点的平均销售量。
29
(2)比例的平均数
要计算比例的平均数,需要将是非标志的标志表现 进行量化处理。记
1—代表具有某种属性的标志表现
0—代表不具有该属性的标志表现
N1——总体中具有该属性的单位数 N0——总体中不具有该属性的单位数 N ——总体单位总数
则由加权算术平均数的计算公式,成数的平均数为
xp
xi fi fi
(一)中位数 ——将总体各单位标志值按由小到大的顺序排列后
处于中间位置的标志值称为中位数,记为Me 。 中位数是一种位置平均数,不受极端数据的影响。
当统计资料中含有异常的或极端的数据时,中位数比算 术平均数更具有代表性。
比如有 5 笔付款:9元,10元,10元,11元,60元 付款的均值为 20 元,显然这并不是一个很好的代表 值,而中位数 Me = 10 元则更能代表平均每笔的付款数。
N
N
P(1 P)(1 P P)
P(1 P)
成数的标准差:P P(1 P)
当 P = 0.5时,成数的标准差达到最大值,即
P 0.5 0.5 0.5
31
§2.3 度量离散程度的指标
总体分布的特征不仅与均值和变异指标有关,而且与分 布的偏斜程度有关,如对称分布、右偏分布和左偏分布。这 种分布形态上的数量特征,往往具有重要的社会经济意义。 偏度系数是度量偏斜程度的指标,主要有以下两种计算方法:
一、用标准差为单位计量的偏度系数 该偏度系数记为SK,计算公式为
表明SK偏是斜无程量度纲越的S大量K。,当取X分值布通M呈常0右在偏-3态~+时3之,间SK,>0其,绝故对也值称越正大,
偏态;当分布为左偏态时,SK<0,故也称负偏态。但除非 是分组频数分布数据,否则SK公式中的众数M0有很大的随
道森公司和克拉克公司是道格拉斯公司的两家供货 商。两家供货商都表示大约需要10个工作日交付定货。 下表是两家供应商定货交付时间的历史数据。今后道 格拉斯公司应选择哪家供应商供货?
道森公司:
克拉克公司:
交货天数 次数
交货天数
次数
9
2
7
1
10
6
8
2
11
2
9
3
10
4
11
3
12
2
13
1
21
一.极差
极差也称全距,是一组数据的最大值和最小值之 差,通常记为R。显然,一组数据的差异越大,其极 差也越大。
相关文档
最新文档