统计学贾俊平第4章 数据的概括性度量

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章 数据的概括性度量
4.1 集中趋势的度量 4.2 离散程度的度量 4.3 偏态与峰态的度量
1
All rights reserved 1
引例
男性: 110 109 90 140 105 150 120 110 110 90 115 95 145 140 110 105 85
95 100 115 124 95 100 125 140 85 120 115 105 125 102 85 120 110 120 115 94 125 80 85 140 120 92 130 125 110 90 110 110 95 95 110 105 80 100 110 130 105 105 120 90 100 105 100 120 100 100 80 100 120 105 60 125 120 100 115 95 110 101 80 112 120 110 115 125 55 90
一般以Me来表示 如果一组数列有奇数个观察值,则中位数为排序
后数列的中间值 如果一组数列有偶数个观察值,则中位数为排序
后数列的中间两个观察值的算数平均数
15
All rights reserved
中位数
未分组数据
女性: 80 75 83 80 100 100 90 75 95 85 90 85 90 90 120 85 100 120 75 85
80 70 85 110 85 75 105 95 75 70 90 70 82 85 100 90 75 90 110 80 80 110 110 95 75 130 95 110 110 80 90 105 90 110 75 100 90 110 85 90 80 80 85 50 80 100 80 80 80 95 100 90 100 95 80 80 50 88 90 90 85 70 90 30 85 85 87 85 90 85 75 90 102 80 100 95 110 80 95 90 80 90
回答类别
甲城市 户数 (户) 百分比 (%)
非常不满意
24
8
不满意
108
36
一般
93
31
满意
45
15
非常满意
30
10
合计
300
100.0
解:这里的数据为顺 序数据。变量为“回 答类别”
甲城市中对住房 表示不满意的户数最 多 , 为 108 户 , 因 此 众数为“不满意”这 一类别,即
Mo=不满意
10
14
f 27 35 57
172 1001 251
87 71 50 35
F累积次数 27 62 119
291 1292 1543 1630 1701 1751 1786
1786
All rights reserved
中位数
中位数(median)
将一组数字由大排至小,位居中间的数值为该组 数字的中位数。
值 不同类型的数据用不同的集中趋势测度值 低层次数据的测度值适用于高层次的测量数据,
但高层次数据的测度值并不适用于低层次的测量 数据
5
All rights reserved
集中趋势
集中趋势
均值
n
Xi
X i1 n
N
Xi
i1
N
中位数
众数
几何平均数
1
G n
x1x2 xn
合计
50
1
100
解:这里的变量为“饮 料品牌”,这是个分类 变量,不同类型的饮料 就是变量值
所调查的50人中,购 买碳酸饮料的人数最多 ,为15人,占总被调查 人数的30%,因此众数 为“可口可乐”这一品 牌,即
Mo=碳酸饮料
9
All rights reserved
顺序数据的众数
甲城市家庭对住房状况评价的频数分布
17
15
14
13
13
12
11 10
f 1
f
12
f 1
11
9
7
5
13
All rights reserved
示例
例解:
请问你每星期大约学习几小时? 0.5-10.5小时 10.5-20.5小时 20.5-30.5小时
30.5-40.5小时 40.5-50.5小时 50.5-60.5小时 60.5-70.5小时 70.5-80.5小时 80.5-90.5小时 90.5-100.5小时
All rights reserved
数值型数据的众数
分组数据
先在次数表中找出次数最多的那一组,称为「众 数组」
一般以Mo来表示 若取众数组的组中点为众数,则称为粗众数 Czuber插补法
11
All rights reserved
数值型数据的众数
Czuber插补法
Mo

B

1 1 2
C
1 f f1 2 f f1
f为众数组的次数
f 1为 前 一 组 的 次 数
f

1
后一组的次数
C为组距
12
All rights reserved
数值型数据的众数
Mo

B

1 1 2
C
25 23
23
21
19 1 f f1
2 f f1
18


n i1
n xi
6
All rights reserved
众数
众数(Mode)
出现次数最多的变量值 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于定性数据,也可用于定量数据
7
All rights reserved
众数(续)
未分组数据
无众数 原始数据: 1 2 3 4 5 6 7
一个众数 原始数据: 1 2 3 3 3 4 5
多于一个众数 原始数据: 1 2 3 3 4 4 5
8
All rights reserved
分类数据的众数
不同品牌饮料的频数分布
饮料品牌
Baidu Nhomakorabea
频数 比例 百分比 (%)
果汁 矿泉水 绿茶 其他 碳酸饮料
6 0.12 12 10 0.20 20 11 0.22 22 8 0.16 16 15 0.30 30
统计图
统计表

2
All rights reserved
三个角度
• 集中趋势 平均值
概括性度量
• 分散趋势
变差
3
形状
• 偏斜问题
All rights reserved
4.1 集中趋势的度量
4
All rights reserved
集中趋势
集中趋势(Central tendency)
一组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据水平的代表值或中心
相关文档
最新文档