商务与经济统计学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
集中趋势(Central tendency)
一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据一般水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值 低层次数据的集中趋势测度值适用于高层次的测量数据, 反过来,高层次数据的集中趋势测度值并不适用于低层 次的测量数据 选用哪一个测度值来反映数据的集中趋势,要根据所掌 握的数据的类型来确定
表3-3 某车间50名工人日加工零件数分组表
按零件数分组 105~109 110~114 115~119 120~124 125~129 130~134 135~139
合计
N Sm1 2 Me ; L i fm
N: 数据总数 L: 中位数所在组区间下限 Sm-1: 中位数以前的累积频数 i: 中位数所在组的组距 fm: 中位数所在组的频数
案例----SMALL FRY DESIGN公司
在最近对应收账款的总结中,使用了下列描述性统计两来衡 量未付款发票的帐龄: 均值--------------------------40天 中位数------------------------35天 众数--------------------------31天 对这些统计量的解释表明,一张发票的平均帐龄是40天; 而中位数显示一半的发票已经超过35天没有付账;31天的 众数表示最高频率的发票帐龄,即一张未付款发票的最普通 时间长度是31天。统计汇总还显示出应收账款总价值中只 有3%超过了60天。基于这些统计信息,管理者可以感到满 意,因为应收账款和收入现金流都处于控制之下。
36900 0.769 (元) 48000
48000
HM
几何平均数(概念要点)
1. 2. 3. 4. 5. 集中趋势的测度值之一 N 个变量值乘积的 N 次方根 适用于特殊的数据 主要用于计算平均发展速度 计算公式为
GM N X 1 X 2 ... X N N X i
表3-4 甲城市用户对冰箱使用状况评价的频数分 布
回答类别
甲城市 用户数 (人) 累计频数
解:中位数的位置为:
300/2=150
从累计频数看,中位数 的在“一般”这一组别 中。因此 Me=一般
非常不满意 不满意 一般 满意 非常满意
合计
24 108 93 45 30
24 132 225 270 300 —
合计
定序数据的众数(算例)
【例3.2】根据第2讲表2-2中的数据,计算众数
表3-2 甲城市用户对冰箱使用状况评价的频数分布
回答类别
甲城市 用户数 (人) 百分比 (%)
非常不满意 不满意 一般 满意 非常满意
合计
24 108 93 45 30 300
8 36 31 15 10 100.0
解:这里的数据为定 序数据。变量为“回 答类别”。甲城市中 对该冰箱表示不满意 的 户 数 最 多 , 为 108 户,因此众数为“不 满意”这一类别,即
定类数据的众数(算例)
【例3.1】根据第2讲表2-1中的数据,计算众数
表3-1 某城市居民关注广告类型的频数分布 广告类型 人数(人) 频率 百分比 (%)
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
112 51 9 16 10 2
200
0.560 0.255 0.045 0.080 0.050 0.010
均值(Mean)(概念要点)
1. 集中趋势的测度值之一
2. 最常用的测度值 3. 一组数据的均衡点所在 4. 易受极端值的影响 5. 用于数值型数据,不能用于定类 数据和定序数据
均值(计算公式)
设一组数据为:X1 ,X2 ,… ,XN 简单均值的计算公式为 N
X1 X 2 X N X N
1
56.0 25.5 4.5 8.0 5.0 1.0
100
解:这里的变量为“广告类型 ”,这是个定类变量,不同类 型的广告就是变量值。我们看 到,在所调查的 200 人当中, 关注商品广告的人数最多,为 112 人 , 占 总 被 调 查 人 数 的 56%,因此众数为“商品广告 ”这一类别,即
Mo=商品广告
第3 讲
统计描述的数值方法
案例----SMALL FRY DESIGN公司
Small Fry Design公司成立于1997年,是一家设计和进口婴儿用品 的公司,主要经营玩具和附属用品。公司产品包括泰德熊、玩具汽 车、音乐玩具等,公司特长是设计强调颜色、材质和声音高质量的 柔软玩具。公司的产品在美国设计,而在中国生产。 在这个公司的日常运营中,现金流量管理是最重要的经营活动之一。 现金流量管理的一个关键因素是对应收账款的分析和控制。通过度 量未付款发票的平均帐龄和价值,经理能够预测可用现金和监视应 收账款状态的变化。公司设置的目标是:未付款发票的平均帐龄不 应超过45天,超过60天的未付款发票的价值不应超过所有应收账款 价值的5%。
f-1
Mo Mo
f+1
L Mo
4. 该公式假定众数组的频数在众数组内均匀分布
M0 ; L
f f 1 i ( f f 1 ) ( f f 1 )
数值型分组数据的众数(算例)
【 例 3.3】 根据第2 讲中的数 据,计算 50 名工人 日加工零 件数的众 数
表3-3 某车间50名工人日加工零件数 分组表
按零件数分组 105~109 110~114 115~119 120~124 125~129 130~134 135~139 合计 频数(人) 3 5 8 14 10 6 4 50 累积频数 3 8 16 30 40 46 50 —
14 8 M 0 ; 120 5 123(个) (14 8) (14 10)
表3-9 蔬菜 名称 甲 乙 丙 某日三种蔬菜的批发成交数据 成交额(元) Xi Fi 18000 12500 6400 成交量(公斤) Fi(非原始数据) 15000 25000 8000 批发价格(元) Xi 1.20 0.50 0.80
合计
—
X F X F X
i i i i i
36900
10 5 1
5 6 2
9 12 6 8 8 9 10 12 3 4 5 6
1 XN XN 1 2 2 2
8+9 中位数 8.5 2
数值型分组数据的中位数(要点
及计算公式)
根据位置公式确定中位数所在的组 采用下列近似公式计算:
N Sm1 Me ; L 2 i fm
定序数据:中位数和分位数
中位数(Median) (概念要点)
1. 2. 集中趋势的测度值之一 排序后处于中间位置上的值
50%
3. 不受极端值的影响
50%
Me
4. 主要用于定序数据,也可用数值型数据,但不能用于定 类数据 5. 各变量值与中位数的离差绝对值之和最小,即
X
i 1
n
i
M e min
i 1
N
6. 可看作是均值的一种变形
1 log GM (log X 1 log X 2 ... log X N ) N
log X
i 1
N
i
N
几何平均数(算例)
【例 3.10】一位投资者持有一种股票, 1996年、1997年、1998年和1999年收益率 分别为 4.5% 、 2.0% 、 3.5% 、 5.4% 。计算 该投资者在这四年内的平均收益率。
HM
X F X F X
i i i
集中趋势的测度值之一 均值的另一种表现形式 易受极端值的影响 用于定比数据 不能用于定类数据和定序数据 计算公式为
i i
Hale Waihona Puke 原来只是计算 时使用了不同 的数据!
X F F
i i
i
调和平均数(算例)
【例 3.9】某蔬菜批发市场三种蔬菜的日成交数据 如表3-9,计算三种蔬菜该日的平均批发价格
N: 数据总数 L: 中位数所在组区间下限 Sm-1: 中位数以前的累积频数 i: 中位数所在组的组距 fm: 中位数所在组的频数
该公式假定中位数组的频数在该组内均匀分布
数值型分组数据的中位数(算例)
【 例 3.5】 根据第2 讲 表 2-5 中 的 数 据 , 计 算 50 名 工 人 日 加 工 零 件 数 的 中位数
X
i 1
i
N
设分组后的数据为:X1 ,X2 ,… ,XK 相应的频数为: F1 , F2,… ,FK 加权均值的计算公式为
X 1 F1 X 2 F2 L X N FN XB F1 F2 L FN
X F
i 1 K
K
i i
F
i 1
i
调和平均数(概念要点)
1. 2. 3. 4. 5. 6.
频数(人)
3 5 8 14 10 6 4 50
累积频数
3 8 16 30 40 46 50 —
50 16 M e ; 120 2 5 123.21(个) 14
四分位数(概念要点)
1. 集中趋势的测度值之一 2. 排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
QU
中位数
N 分组数据: 中位数位置 2
未分组数据:
X N 1 2 Me 1 XN XN 1 2 2 2 当N为奇数时 当N为偶数时
定序数据的中位数(算例)
【例 3.4】根据第 2 讲表 2-2 中的数据,计算甲城 市用户对冰箱使用满意状况评价的中位数
300
数值型未分组数据的中位数(5个 数据的算例)
原始数据: 排 序: 位 置:
24 20 1
22 21 26 21 22 24 2 3 4
20 26 5
N 1 5 1 位置 3 2 2
中位数 22
数值型未分组数据的中位数(6个 数据的算例)
原始数据: 排 序: 位 置:
Mo=不满意
数值型分组数据的众数(要点及计算公式)
1. 众数的值与相邻两组频数的分布有关
2. 相邻两组的频数相等时,众数组的组中 值即为众数 3. 相邻两组的频数不相等时,众数采用下 列近似公式计算 f f 1 M0 ; L i ( f f 1 ) ( f f 1 )
L: 频数最高所在组区间下限 f : 频数最高所在组的频数 i: 频数最高所在组的组距 f-1:前一组的频数; f+1:后一组的频数
数据分布的特征
集中趋势 (位置) 离散趋势 (分散程度) 偏态和峰度 (形状)
数据分布的特征和测度
数据的特征和测度
集中趋势
众 数 中位数 均 值
离散程度
异众比率
分布的形状
偏 态
四分位差 方差和标准差 离散系数
峰 度
第1节 集中趋势的定量描述
一. 二. 三. 四. 定类数据:众数 定序数据:中位数和分位数 定距和定比数据:均值 众数、中位数和均值的比较
众数(概念要点)
1. 集中趋势的测度值之一
2. 出现次数最多的变量值 3. 不受极端值的影响 4. 可能没有众数或有几个众数 5. 主要用于定类数据,也可用于定序数据 和数值型数据
众数(Mode)(众数的不唯一性)
无众数 原始数据: 10
一个众数 原始数据: 6
5
5
9 12
9 8 5
6
5
8
多于一个众数 原始数据: 25 28 28 36 42 42
3. 不受极端值的影响
4. 主要用于定序数据,也可用于数值型数据, 但不能用于定类数据
四分位数(位置的确定)
下四分位数(QL)位置 =
未分组数据:
上四分位数(QU)位置 =
N+1 4 3(N+1)
4
N 4
分组数据:
下四分位数(QL)位置 =
3N 上四分位数(QU)位置 = 4
定距和定比数据:均值
未付款发票的平均帐龄不应超过45天,超过 60天的未付款发票的价值不应超过所有应收 账款价值的5%。
统计描述的数值方法
一 集中趋势的定量描述 二 离散程度的定量描述 三 偏态与峰度的测度
学习目标
1.集中趋势各测度值的计算方法 2.集中趋势不同测度值的特点和应用场合 3.离散程度各测度值的计算方法 4.离散程度不同测度值的特点和应用场合 5.偏态与峰度测度方法 6.用SPSS(或Excel)计算描述统计量并进行 分析
GM N X 1 X 2 X N 4 104 .5% 102 .0% 103 .5% 105 .4% 103 .84%