商务统计学第四章课件
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
从总体各单位变量值中抽象出具 有一般水平的量,这个量不是各 个单位的具体变量值,但又要反 映总体各单位的一般水平。
先将总体各单位的变量值按一定 顺序排列,然后取某一位置的变 量值来反映总体各单位的一般水 平。
算术平均数、中位数与众数间的关系
如果数据的分布是对称的,则算术平均数、中位数与众数必定相等。
设一组数据为: x1 ,x2 ,… ,xn
各组的组中值为: m1 ,m2 ,… ,mk
相应的频数为: f1 , f2 ,… ,fk
简单均值 加权均值
x m1 f1 m2 f2 f1 f2
n
xi
x i1 n
k
M k fk fk
mi fi
i 1 k
fi
k i 1
fk
k
k
mi imi
4
890 4
80200 100
802
SUMPRODUCT函数的功能是在给定的几组数组中,将数组间对 应的数据相乘,并返回乘积之和。SUM函数的功能是返回一组数据的 和。SUMPRODUCT函数、SUM函数的语法结构分别为:
SUMPRODUCT(array1,[array2],...) SUM(number1,[number2],…)
分位数
QUARTILE函数的功能是返回一组数的四分位数。PERCENTILE函数 的功能是返回一组数据的和。QUARTILE函数、PERCENTILE函数的语法 结构分别为:
QUARTILE(array,quart) PERCENTILE(array,k)
其中:array表示要求分位数值的数组或数字型单元格区域;quart表示返 回第几个四分位数(取值为0,1,2,3,4);k表示分析数据中小于返 回分位数值的数据比例(取值为0至1之间的数)。
1.36
1.28
1.50
简单算术平均数(例题)
解 AVERAGE函数的功能是返回一组数据的算术平均数。语法结构为:
AVERAGE(number1,[number2],…) 其中:number1必选,表示要计算平均值的第一个数字、单元格引用或 单元格区域;number2,…可选,表示要计算平均值的其他数字、单元 格引用或单元格区域。
表 淘宝双十一购物节顾客消费额中位数计算表
消费额/元 700~720 720~740 740~760 760~780 780~800 800~820 820~840
840~860 860~880 880~900
合计
顾客数 3 7 8 9 15 26
17
6 5 4 100
向上累积频数 向下累积频数
3
100
算术平均数
1. 算术平均数的计算 2. 算术平均数的性质
算术平均数(mean)
1. 也称为均值,集中趋势测度中最重要的一种统计量 2. 计算公式:
算术平均数=数据取值之和/数据的个数
3. 通常用x 表示平均数。
x
x
算术平均数(mean)
3. 通常用x 表示平均数。
x
x
简单算术平均数与加权算术平均数
2. 数值容易受极大值或极小值的影响,当一组资料存在极端值时,均值 的代表性就会受很大影响,这种情况统计上称为不稳健。
x
x
小结
1. 算术平均数的计算
简单算术平均数、加权算术平均数
2. 算术平均数的性质
思考练习
用算术平均数计算一个国家或一个地区居民的年平 均收入时,能说明大多数人真实的年收入情况吗?
x Me Mo
思考练习
阐述算术平均数、中位数和众数的主要特点 和适用场合。
数据离中趋势
1. 全距与四分差 2. 方差与标准差 3. 离散系数
x Me Mo
算术平均数、中位数与众数间的关系
如果数据是右偏分布,说明数据存在极大值,必然拉动算术平均数向 极大值一方靠拢,而中位数与众数由于是位置平均数,不受极值的影响, 因此三者之间的关系表现为:
Mo Me x
算术平均数、中位数与众数间的关系
如果数据是左偏分布,说明数据存在极小值,必然拉动算术平均数 向极小值一方靠拢,此时三者之间的关系表现为:
加权算术平均数(例题)
【例】为了解淘宝双十一购物节顾客消费的情况,阿里 巴巴集团数据分析部门随机抽取了100名顾客的消费额 数据,进行了数据整理得到频数分布数据,据此计算顾 客的平均消费额。
加权算术平均数(例题)
表 淘宝双十一购物节顾客消费额平均数计算表
消费额/元 700~720 720~740 740~760
fi
i 1
i 1
i 1
简单算术平均数(例题)
【例】一小区的便利店盘点过去一年利润,整理得到每个月的 利润额,计算该便利店的月平均利润。
表 便利店月利润额
万元
1.32 1.86 1.52 1.33 1.45 1.38 1.32 1.81 1.72 1.65 1.36 1.28
解
x
1.32
1.86
... 12
9 11
9
20
811
众数 (mode)
1. 性质简单明了,不受极端值影响的 2. 没有利用所有观测值、缺乏敏感性和不适合代数运算的缺点 3. 有时不存在或存在多个众数值
mo
小结
1. 中位数
未分组数据、分组数据 四分位数、十分位数等分位数
2. 众数
未分组数据、分组数据
思考练习
利用淘宝双十一购物节顾客消费额的数据,借助MEDIAN 函数、 QUARTILE函数、PERCENTILE函数、 MODE函数等计 算中位数、四分位数和众数等离中趋势测度值。
10
97
18
90
27
82
42
73
68
58
85
32
91
15
96
9
100
4
—
—
中位数(分组数据例题)
解
k
依据
fk
i 1
2
100 2
50
, 确定中位数所在组: 800~820
Me
800
50 42 26
20
806.15
或
Me
820
50 32 26
20
806.15
分位数
分位数的位置公式为:
Q
的位置
x x1 f1 x2 f2 ... xk fk k
f1 f2 ... fk
i 1
fk
k
k
xi i xi
fi
i 1
i 1
算术平均数(mean)
1. 从统计思想上看,算术平均数是一组数据的重心所在,是数据误差 相互抵消后的必然性结果。其计算充分利用了所有的数据资料,敏 感性强,便于数学运算。
760~780 780~800 800~820
820~840
840~860
860~880 880~900
合计
顾客数 fk 3 7 8 9 15 26
17
6 5 4 100
组中值 mk 710 730 750
770 790 810
830
850
870 890 —
相关分析(例题)
解
x
710 3
7307 3 7 ...
n 2
1
n为奇数 n为偶数
中位数(未分组数据)
MEDIAN函数的功能是返回一组数据的中位数。语法结构 为:
MEDIAN(number1,[number2],…) 其中, number1,[number2] ,...,是用来计算中位数的数 值、单元格引用或单元格区域。
中位数 (分组数据)
确定中位数所在组:
算术平均数、中位数与众数间的关系
1. 集中趋势、数值平均数和位置平均数 2. 算术平均数、中位数与众数间的关系
集中趋势(central tendency)
取得一组数据集中趋势代表值的方法通常有两种: 一是从该组数据取值中抽象出具有一般水平的量,这个量不是某个 数据的具体取值,这种代表值称为数值平均数。数值平均数有算术平均 数、调和平均数、几何平均数等形式。 二是先将该组数据的取值按一定顺序排列,然后取某一位置的数据 值来反映该组数据的一般水平,把这个特殊位置上的数值看作是代表值, 这种代表值称作位置平均数。位置平均数有中位数、四分位数、众数等 形式。
中位数与众数
1. 中位数 2. 众数
中位数(median)
中位数是将一组数据按大小顺序进行排列后,处 于中间位置上的数据取值。
50%
50%
Me
中位数(未分组数据)
原始数据: x1 、x2 、…、xn 排序数据:x(1)、x(2) 、…、x(n)
Me
1 2
x n1 2
x
n
2
x
MODE函数的功能是返回一组数据的众数。语法结构为: MODE(number1,[number2],…)
众数(未分组数据)
众数组:频数最大的组
则中位数为:
Mo
LM o
1 1 2
dMo
说明: 为众数组下限
为众数组下限
Mo
UMo
2 1 2
dMo
为众数组的频数与紧邻的较小数据取值组的频数之差
为众数组的频数与紧邻的较大数据取值组的频数之差
集中趋势(central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
集中趋势(central tendency)
数值平均数 集中趋势代表值
位置平均数
算术平均数 几何平均数 调和平均数
众数 中位数 四分位数
(mi x ) fi 0
i 1
算术平均数(数学性质)
2. 任一分析数据的各数据取值与其算术平均数的离差平方之 和为最小值。
n
(xi x )2 min
i 1 k
(mi x )2 fi min
i 1
算术平均数(数学性质)
3. 若有k 组数据,各组的算术平均数和个数分别为 ( f1, x1) 、( f2, x2 ) 、…、( fk , xk ) ,则将组数据合并后的算术平均数为:
则中位数为:
k
fi
2
F Me
M e U Me i1
fMe
dMe
说明: 为中位数所在组下限
为中位数所在组下限
为小于中位数所在组下限的向上累积频数
为大于中位数所在组上限的向下累积频数
为中位数所在组的频数 为中位数所在组的组距
中位数(未分组数据例题)
【例】一小区的便利店盘点过去一年利润,整理得到每个月的
j
(n
1)
j m
其中: j 为所求分位数的排序(取值为1至 m 1
间的一整
数);m 为数据的个数;n 为数据等分的份数(常为2,4,
10,100)
分位数
例如,四分位数中的第一个四分位数 Q1,一组数据中有25%的数据比它 小,有75%的数据比它大;第三个四分位数 Q3 则将一组数据分割为75% 的数据比它小,25%的数据比它大。第一个四分位数、第三个四分位数也 可称为上四分位数、下四分位数,因此也可将它们分别记为 QL 、QU,第 二个四分位数就是中位数。
760~780 780~800 800~820
820~840
840~860
860~880 880~900
合计
顾客数 3 7 8 9 15 26
17
6 5 4 100
中位数(分组数据例题)
解 组频数最大为26,对应的众数组为800~820
11 Mo 800 11 9 20 811
或
Mo
Hale Waihona Puke 820利润额,计算该便利店的月平均利润。
表 便利店月利润额
万元
原始 数据
1.32 1.86 1.52 1.33 1.45 1.38
1.32
1.81
1.72
1.65
1.36
1.28
排序 数据
1.28 1.32 1.32 1.33 1.36 1.38
1.45
1.52
1.65
1.72
1.81
1.86
解
数据个数12为偶数,则中位数由处于第
12 2
与
12 2
1
位置
上来的两个数据取值决定。
Me
1.38
1.45 2
1.415
中位数(分组数据例题)
【例】为了解淘宝双十一购物节顾客消费的情况,阿里巴巴 集团数据分析部门随机抽取了100名顾客的消费额数据,进行 了数据整理得到频数分布表,据此计算顾客消费额的中位数。
中位数(分组数据例题)
为众数组的组距
众数(分组数据例题)
【例】为了解淘宝双十一购物节顾客消费的情况,阿里巴巴 集团数据分析部门随机抽取了100名顾客的消费额数据,进行了 数据整理得到频数分布表,据此计算顾客消费额的众数。
众数(分组数据例题)
表 淘宝双十一购物节顾客消费额中位数计算表
消费额/元 700~720 720~740 740~760
其中,array1,[array2],...,表示需要计算乘积之和的各组数据所在 区域。加权算术平均数的计算中,可用它们分别计算各组组中值与频 数的乘积之和、各组的频数之和。
算术平均数(数学性质)
1. 任一分析数据的各数据取值与其算术平均数之差(称为离差) 的和恒为零。
n
(xi x ) 0
i 1 k
众数(mode)
1. 一组数据中出现次数最多的变量值 2. 适合于数据量较多时使用 3. 不受极端值的影响 4. 一组数据可能没有众数或有几个众数
mo
众数(mode)
(a)无众数
(b)单众数
图 众数示意图
(C)多众数
众数(未分组数据)
未分组数据确定众数时,只需通过计数找到出现次数最多 的数据即为众数。