集中趋势度量法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【例】
原始数据: 排 序: 位 置:
1
2
3
4
5
6
7
8
9
n 1 9 1 位置 5 2 2 中位数 1080
4 - 25
西北工业大学管理学院
统计学
STATISTICS
数值型数据的中位数
(10个数据的算例)
【例】:10个家庭的人均月收入数据
排 位 序: 置: 660 750 780 850 960 1080 1250 1500 1630 2000
【例】:10个家庭的人均月收入数据
排 位 序: 置: 660 750 780 850 960 1080 1250 1500 1630 2000
1 2
3
4
5
6
7
8
9
10
10 1 3 (10 1) QL 位置 2.75 QU 位置 8.25 4 4
QL 750 0.75 (780 750) 772.5 QU 1500 0.25 (1630 1500) 1532.5
0.30 0.22 0.18 0.12 0.18 1
30 22 18 12 18 100
西北工业大学管理学院
统计学
STATISTICS
顺序数据的众数
(例题分析)
解:这里的数据为顺 序数据。变量为“回 答类别”
甲城市中对住房 表示不满意的户数最 多 , 为 108 户 , 因 此 众数为“不满意”这 一类别,即 Mo=不满意
f
2 S m 1 f me f i u ( 2 S m 1 ) i f me
上限公式 : M e u
1500 1230 800 100 774.3 1050 M e:中位值 u:中位值所在组的上限
f :总次数
S m 1:中位值所在组以上各组次的累计数 f me:中位值所在组的次数
4 - 11
西北工业大学管理学院
统计学
STATISTICS
4.2 集中趋势的度量
众数 位置均值 中位数 分位数 平均指标 算术平均值 计算均值 调和均值 几何均值
4 - 12
西北工业大学管理学院
统计学
STATISTICS
• 研究总体某种标志数值的平均水平在时间上的变化
• 分析社会经济现象的依存关系
• 研究和评价事物优劣的数量指标 • 计算和估算其他重要的经济指标
4-9
西北工业大学管理学院
统计学
STATISTICS
集中趋势
(central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
统计学
STATISTICS
众数
(不惟一性)
无众数 原始数据: 一个众数 原始数据:
10 6
5 5
9 12 9 8
6 5
8 5
多于一个众数 原始数据: 25 28 28 36 42 42
4 - 15
西北工业大学管理学院
统计学
STATISTICS
分类数据的众数
(例题分析)
百分比 (%)
不同品牌饮料的频数分布 饮料品牌 频数 比例
4 - 34
西北工业大学管理学院
统计学
STATISTICS
数值型数据的四分位数
(分组数据的算例)
N N Q1 Q1 LQ1 4 iQ1 f Q1
1000 170 500 4 100 530元 270 LQ1 第一个分位数所在组的下限;N 为总次数; N Q1 第一个分位数之前所有各组的累计次数; f Q1 第一个分位数所在组次数;iQ1 第一个分位数所在组组距。
以下3个特点: 1. 用一个代表数值综合反映个体某种标志值的一 般水平。 2. 将个体标志值之间的差异抽象掉了。 3. 计量单位与标志值的计量单位一致。
4-7
西北工业大学管理学院
统计学
STATISTICS
作用
4-8
西北工业大学管理学院
统计学
STATISTICS
集中趋势的作用
• 比较若干总体的某种标志数值的平均水平
4. 低层次数据的测度值适用于高层次的测量数据,但高 层次数据的测度值并不适用于低层次的测量数据
4 - 10
西北工业大学管理学院
统计学
STATISTICS
4.2 集中趋势的度量
分类数据:众数 顺序数据:中位数和分位数 数值型数据:平均数 众数、中位数和平均数的比较
4.2.1 4.2.2 4.2.3 4.2.4
分类数据:众数
mo
4 - 13
西北工业大学管理学院
统计学
STATISTICS
众数
(mode)
1. 一组数据中出现次数最多的变量值
2. 适合于数据量较多时使用 3. 不受极端值的影响 4. 一组数据可能没有众数或有几个众数 5. 主要用于分类数据,也可用于顺序数据和 数值型数据
4 - 14
西北工业大学管理学院
统计学
STATISTICS
众数的优缺点
优点:不受变量数列极端数值的影响,不受变量数列 中开口组的影响。 缺点:要求总体单位数足够多、且具有明显的集中 趋势。
4 - 20
西北工业大学管理学院
统计学
STATISTICS
顺序数据:中位数和分位数
4 - 21
西北工业大学管理学院
统计学
STATISTICS
(位置的确定)
n 1 中位数位置 2 n 中位数位置 2
西北工业大学管理学院
原始数据:
顺序数据:
4 - 23
统计学
STATISTICS
顺序数据的中位数
(例题分析)
甲城市
甲城市家庭对住房状况评价的频数分布
解:中位数的位置为 300/2=150
回答类别
非常不满意 不满意 一般 满意 非常满意
甲城市家庭对住房状况评价的频数分布 回答类别 非常不满意 不满意 一般 满意 非常满意 甲城市 户数 (户) 24 108 93 45 30 百分比 (%) 8 36 31 15 10
合计
4 - 17
300
100.0
西北工业大学管理学院
统计学
STATISTICS
数值数据的众数
计算公式
1)下限公式
4-2
西北工业大学管理学院
统计学
STATISTICS
数据分布的特征
集中趋势 (位置) 离中趋势 (分散程度) 偏态和峰态 (形状)
4-3
西北工业大学管理学院
统计学
STATISTICS
数据分布特征的测度
数据特征的测度
集中趋势
众 数 中位数 平均数
4-4
离散程度
异众比率
分布的形状
偏源自文库态
四分位差 方差和标准差 离散系数
下限公式 : M e L
1500 720 700 100 774.3 1050 M e:中位值 L :中位值所在组的下限
f :总次数
S m 1:中位值所在组以下各组次的累计数 f me:中位值所在组的次数
4 - 27
西北工业大学管理学院
统计学
STATISTICS
数值型数据的中位数
统计学
STATISTICS
第 4 章 集中趋势度量法
4.1 4.2 4.3 4.4
集中趋势的基本概念和作用 集中趋势的度量 算术平均值、中位数和众数的比较 集中趋势分析需注意的问题
4-1
西北工业大学管理学院
统计学
STATISTICS
学习目标
1. 集中趋势的基本概念
2. 集中趋势各测度值的计算方法
3. 集中趋势各测度值的特点及应用场合
中位数
(median)
1. 排序后处于中间位置上的值
50%
2. 不受极端值的影响
Me
50%
3. 主要用于顺序数据,也可用数值型数据,但不能 用于分类数据 4. 各变量值与中位数的离差绝对值之和最小,即
x M
4 - 22
i 1 i
n
e
min
西北工业大学管理学院
统计学
STATISTICS
中位数
1
2
3
4
5
6
7
8
9
9 1 3(9 1) QL 位置 2.5 QU 位置 7.5 4 4 780 850 1500 1630 QL 815 QU 1565 2 2
4 - 33
西北工业大学管理学院
统计学
STATISTICS
数值型数据的四分位数
(10个数据的算例)
1 570 M0 L i 700 100 755.9 1 2 570 450 M 0:众值 L :众值组的下限 1:众值组次数与下一组次数之差 2:众值组次数与上一组次数之差 i:众值组的组距
4 - 18
西北工业大学管理学院
统计学
STATISTICS
西北工业大学管理学院
峰 态
统计学
STATISTICS
4.1 集中趋势的基本概念和 作用
4.1.1 基本概念 4.1.2 作用
4-5
西北工业大学管理学院
统计学
STATISTICS
基本概念
4-6
西北工业大学管理学院
统计学
STATISTICS
集中趋势的基本概念
表明同类现象在一定时间、地点条件下,所
达到的一般水平与大量单位的综合数量特征,有
数值数据的众数
1 450 i 800 100 755.9 1 2 570 450
计算公式
2)上限公式
M0 u
M 0:众值 u:众值组的上限 1:众值组次数与下一组次数之差 2:众值组次数与上一组次数之差 i:众值组的组距
4 - 19
西北工业大学管理学院
户数 (户)
24 108 93 45 30
累计频数
24 132 225 270 300
从累计频数看, 中位数在“一般”这 一组别中 中位数为
合计
4 - 24
300
—
西北工业大学管理学院
Me=一般
统计学
STATISTICS
数值型数据的中位数
(9个数据的算例)
9个家庭的人均月收入数据
1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
解:这里的变量为“饮 料品牌”,这是个分类 变量,不同类型的饮料 就是变量值 所调查的50人中,购 买可口可乐的人数最多 ,为15人,占总被调查 人数的 30% ,因此众数 为“可口可乐”这一品 牌,即
Mo=可口可乐
可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露 合计
4 - 16
15 11 9 6 9 50
4 - 30
西北工业大学管理学院
统计学
STATISTICS
四分位数
(位置的确定)
n 1 QL 位置 4 Q 位置 3(n 1) U 4 n3 QL位置 4 Q 位置 3n 1 U 4
西北工业大学管理学院
常用方法:
Excel:
4 - 35
西北工业大学管理学院
统计学
STATISTICS
数值型数据的四分位数
(分组数据的算例)
N N Q2 Q2 LQ2 2 iQ2 f Q2
1000 440 600 2 100 627元 220 LQ2 第一个分位数所在组的下限;N 为总次数; N Q2 第一个分位数之前所有各组的累计次数; f Q2 第一个分位数所在组次数;iQ2 第一个分位数所在组组距。
4 - 28
西北工业大学管理学院
统计学
STATISTICS
中位数的优缺点
优点:不受变量数列极端数值的影响
缺点:要求均匀分布
4 - 29
西北工业大学管理学院
统计学
STATISTICS
四分位数
(quartile)
1. 排序后处于25%和75%位置上的值
25%
QL
25%
25%
QM
25%
QU
2. 不受极端值的影响 3. 主要用于顺序数据,也可用于数值型数据, 但不能用于分类数据
4 - 31
统计学
STATISTICS
顺序数据的四分位数
(例题分析)
解:QL位置= (300)/4 =75
QU位置 =(3×300)/4 =225 不 24 132 225 270 300 —
西北工业大学管理学院
甲城市家庭对住房状况评价的频数分布
回答类别 非常不满意 不满意 一般 满意 非常满意 合计
4 - 32
甲城市
户数 (户)
24 108 93 45 30 300
累计频数
从累计频数看, QL 在“
满意”这一组别中; QU在
“一般”这一组别中
四分位数为 QL = 不满意 QU = 一般
统计学
STATISTICS
数值型数据的四分位数
(9个数据的算例)
【例】:9个家庭的人均月收入数据
原始数据: 排 序: 位 置: 1500 750 780 1080 850 960 2000 1250 1630 750 780 850 960 1080 1250 1500 1630 2000
1 2
3
4
5
6
7
8
9
10
n 1 10 1 位置 5.5 2 2
960 1080 中位数 1020 2
4 - 26
西北工业大学管理学院
统计学
STATISTICS
数值型数据的中位数
f
2 S m 1 f me f i L ( 2 S m 1 ) i f me