统计学课件第四章_PPT幻灯片

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

甲城市家庭对住房状况评价的频数分布
甲城市 回答类别
户数 (户) 累计频数
非常不满意
24
24
不满意
108
132
一般
93
225
满意
45
270
非常满意
30
300
合计
300

解:QL位置= (300)/4 =75
QU位置 =(3×300)/4 =225
从累计频数看, QL在“不 满意”这一组别中; QU在 “一般”这一组别中
30
合计
300
24
从累计频数看,中
132
位数在“一般”这一组
225
别中
270
中位数为
300

Me=一般
数值型数据的中位数 (原始数据)
【例】 9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000
中位 9数 60 108 10020 2
数值型数据的中位数 (分组数据)
计算公式
N
Me L
2
S m 1 i
fm
劳动效率 公斤/人
0-2
人数 人
3
M
e
U
Sm
N 2
fm
i
2-4
7
4-6
11
6-8
9
例题:某公司30个工人经两周训练后 合计
30
其劳动效率如下,求中位数(4.91)
四分位数 (quartile)
排 序: 660 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5
6 7 8 9 10
Q L 位 1 4 置 1 0 2 .7Q 5 U 位 3 ( 置 1 4 1 ) 0 8 .25
Q L75 0 0 .7 5(78 7 05 ) 0 77 .52 Q U15 0 0.2 0 5(16 3 10 5) 0105.5 32
n
xi Me min
i1
中位数 (位置的确定)
原始数据: 中位数位 n置 1 2
顺序数据: 中位数位置n 2
顺序数据的中位数 (例题分析)
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市 户数 (户) 累计频数
解:中位数的位置为
300/2=150
非常不满意
24
不满意
108
一般
93
满意
45
非常满意
四分位数为 QL = 不满意 QU = 一般
数值型数据的四分位数 (9个数据的算例)
【例】:9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630
排 序: 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3
4 5 67
89
Q L 位 9 4 置 1 2 .5Q U 位 3 ( 9 置 4 1 ) 7 .5
7 8 80 50 15 106030 Q L 2 81 Q U 5 2 1565
数值型数据的四分位数 (10个数据的算例)
【例】:10个家庭的人均月收入数据
所调查的50人中,购买 可口可乐的人数最多,为 15人,占总被调查人数的 30%,因此众数为“可口 可乐”这一品牌,即
Mo=可口可乐
顺序数据的众数 (例题分析)
解:这里的数据为顺
甲城市家庭对住房状况评价的频数分布 序数据。变量为“回
回答类别
甲城市
答类别”
户数 (户) 百分比 (%)
非常不满意
24
不满意
未分组数据—单批数据箱线图
(例题分析)
1、排序后处于25%和75%位置上的值
25% 25% 25% 25%
QL
QM
QU
2、不受极端值的影响
3、主要用于顺序数据,也可用于数值型数据, 但不能用于分类数据
四分位数 (位置的确定)
原始数据:
QL 位置
n 1 4
QU 位置
3(n 1) 4
顺序数据:
Q
L
位置
n 4
Q
U
位置
3n 4
顺序数据的四分位数 (例题分析)
位 置: 1 2 3 4
5 6 78 9
位 置 n1915 22
中位数 1080
数值型数据的中位数 (原始数据)
【例】:10个家庭的人均月收入数据
排 序: 660 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5 6 7 8 9 10
位 置 n11 015.5 22
分类数据的众数 (例题分析)
不同品牌饮料的频数分布
饮料品牌
频数
比例
百分比 (%)
可口可乐
15 0.30 30
旭日升冰茶 11 0.22 22
百事可乐
9 0.18 18
汇源果汁
6 0.12 12
露露
9 0.18 18
合计
50
1 100
解:这里的变量为“饮料
品牌”,这是个分类变量 ,不同类型的饮料就是变 量值
学习目标
1、集中趋势各测度值的计算方法 2、集中趋势各测度值的特点及应用场合 3、离散程度各测度值的计算方法 4、离散程度各测度值的特点及应用场合 5、用Excel计算描述统计量并进行分析
第四章 数据描述分析 (二)
位置特征的度量 离散特征的度量 形态特征的度量 平均值的应用
位置特征的度量
中心位置 分类数据:众数 顺序数据:众数、中位数和分位数 数值型数据:众数、中位数和分位数、均值 众数、中位数和平均数的比较 小结
众数 (mode)
1. 一组数据中出现次数最多的变量值 2. 不受极端值的影响 3. 一组数据可能没有众数或有几个众数 4. 主要用于分类数据,也可用于顺序数据
和数值型数据
众数 (不惟一性)
无众数 原始数据: 10 5 9 12 6 8
一个众数 原始数据:
6 59 8 5 5
多于一个众数 原始数据: 25 28 28 36 42 42
108
一般
93
8
甲城市中对住房
36
表示不满意的户数最
31
多,为108户,因此
满意
45
15
Байду номын сангаас
众数为“不满意”这
非常满意
30
10
一类别,即
合计
300
100.0
Mo=不满意
数值型数据的众数 (例题分析)
计算公式
MO=L+( f
f f1 f1) ( f
d f1)
劳动效率 公斤/人
0-2
人数 人
3
MO=U ( f
f f1 f1) ( f
d f1)
2-4
7
4-6
11
6-8
9
合计
30
例题:某公司30个工人经两周训练后其
劳动效率如下,求众数(5.33)
中位数 (median)
1、排序后处于中间位置上的值
50%
Me 2、不受极端值的影响
50%
3、主要用于顺序数据,也可用数值型数据,但不能用于分 类数据
4、各变量值与中位数的离差绝对值之和最小,即
相关文档
最新文档