数据分布特征的测度
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
反过来,高层次数据的集中趋势测度值并不适用于低层次 的测量数据 5. 选用哪一个测度值来反映数据的集中趋势,要根据所掌握 的数据的类型来确定
7
众数
8
众数
(概念要点)
1. 集中趋势的测度值之一 2. 出现次数最多的变量值 3. 不受极端值的影响 4. 可能没有众数或有几个众数 5. 主要用于定类数据,也可用于定序数据
Mo=不满意
12
数值型分组数据的众数
(要点及计算公式)
1. 众数的值与相邻两组频数的分布有关
2. 相邻两组的频数相等时,众数组的组中值
即为众数
Mo
3. 相邻两组的频数不相等时,众数采用下 列近似公式计算
M0
L
(
f
f f1 f1) ( f
f 1 )
i
Mo
4. 该公式假定众数组的频数在众数组内均匀分布
从累计频数看,中位数 的在“一般”这一组别 中。因此
Me=一般
19
数值型未分组数据的中位数
(5个数据的算例)
原始数据:24 22 21 26 20 排 序:20 21 22 24 26 位 置: 1 2 3 4 5
位置 N 1 5 1 3 22
中位数 22
20
数值型未分组数据的中位数
Me
L
N 2
S m1 fm
i
4. 该公式假定中位数组的频数在该组内均匀分布
22
数值型分组数据的中位数
(算例)
【 例 4.3】 根据第三 章 表 3-5 中 的数据, 计算50 名 工人日加
工零件数 的中位数
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
累积频数
105~110
3
Mo
13
数值型分组数据的众数
(算例)
【 例 4.1】 根据第三 章 表 3-5 中 的数据, 计 算 50 名 工人日加
工零件数 的众数
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
累积频数
105~110
3
3
110~115
5
8
115~120
8
16
120~125
14
30
125~130
和数值型数据
9
众数
(众数的不唯一性)
无众数 原始数据: 10 5 9 12 6 8
一个众数 原始数据: 6 5 9 8 5 5 多于一个众数 原始数据: 25 28 28 36 42 42
10
定类数据的众数
(算例)
【例】根据第三章表3-1中的数据 ,计算众数
表3-1 某城市居民关注广告类型的频数分布
第三章 数据分布特征的测度
第一节 集中趋势的测度 第二节 离散程度的测度 第三节 偏态与峰度的测度
1
学习目标
通过本章的学习,要正确理解各种指标的 概念及计算方法,学会运用指标对总体进 行分析说明。本章计划课时7小时。
2
数据分布的特征
集中趋势 (位置)
离中趋势 (分散程度) 偏态和峰度 (形状)
数据的特征和测度
集中趋势
众数 中位数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰度Байду номын сангаас
6
集中趋势
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的集中趋势测度值适用于高层次的测量数据,
(算例)
【例4.2】根据第三章表3-2中的数 据,计算甲城市家庭对住房满意状 况评价的中位数
表3-2 甲城市家庭对住房状况评价的频数分布
回答类别
甲城市
户数 (户)
累计频数
非常不满意
24
24
不满意
108
132
一般
93
225
满意
45
270
非常满意
30
300
合计
300
—
解:中位数的位置为: 300/2=150
3
110~115
5
8
115~120
3
数据分布的特征和测度
数据的特征和测度
集中趋势
众数 中位数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰度
4
第一节 集中趋势的测度
一. 定类数据:众数 二. 定序数据:中位数和分位数 三. 定距和定比数据:均值 四. 众数、中位数和均值的比较
5
数据特征分布的和测度 (本节位置)
10
40
130~135
6
46
135~140
4
50
合计
50
—
M0
120
14 8 (14 8) (14
10)
5
123(个)
14
中位数和分位数
15
中位数
(概念要点)
1. 集中趋势的测度值之一 2. 排序后处于中间位置上的值
50%
50%
3. 不受极端值的影响 Me
4. 主要用于定序数据,也可用数值型数据,但不能用于定 类数据
Mo=商品广告
11
定序数据的众数
(算例)
【 例 】 根 据 第 三 章 表 3-2 中 的 数 据 ,计算众数
表3-2 甲城市家庭对住房状况评价的频数分布
回答类别
甲城市 户数 (户) 百分比 (%)
非常不满意
24
8
不满意
108
36
一般
93
31
满意
45
15
非常满意
30
10
合计
300
100.0
解:这里的数据为定 序数据。变量为“回 答类别”。甲城市中 对住房表示不满意的 户 数 最 多 , 为 108 户 ,因此众数为“不满 意”这一类别,即
广告类型
人数(人) 比例 频率(%)
商品广告
112
0.560
56.0
服务广告
51
0.255
25.5
金融广告
9
0.045
4.5
房地产广告
16
0.080
8.0
招生招聘广告
10
0.050
5.0
其他广告
2
0.010
1.0
合计
200
1
100
解:这里的变量为“广告类 型”,这是个定类变量,不 同类型的广告就是变量值。 我们看到,在所调查的200 人当中,关注商品广告的人 数最多,为112人,占总被 调查人数的56%,因此众数 为“商品广告”这一类别, 即
(6个数据的算例)
原始数据:10 5 9 12 6 8 排 序: 5 6 8 9 10 12 位 置: 1 2 3 4 5 6
位置 N+1 6+1 3.5
22 中位数 8 + 9 8.5
2
21
数值型分组数据的中位数
(要点及计算公式)
1. 根据位置公式确定中位数所在的组 2. 采用下列近似公式计算:
5. 各变量值与中位数的离差绝对值之和最小,即
n
X i M e min
i 1
16
中位数
(位置的确定)
未分组数据: 中位数位置 N 1 2
组距分组数据: 中位数位置 N 2
17
未分组数据的中位数
(计算公式)
Me
X
N 1 2
1 2
X
N 2
X
N 2
1
当N为奇数时 当N为偶数时
18
定序数据的中位数
7
众数
8
众数
(概念要点)
1. 集中趋势的测度值之一 2. 出现次数最多的变量值 3. 不受极端值的影响 4. 可能没有众数或有几个众数 5. 主要用于定类数据,也可用于定序数据
Mo=不满意
12
数值型分组数据的众数
(要点及计算公式)
1. 众数的值与相邻两组频数的分布有关
2. 相邻两组的频数相等时,众数组的组中值
即为众数
Mo
3. 相邻两组的频数不相等时,众数采用下 列近似公式计算
M0
L
(
f
f f1 f1) ( f
f 1 )
i
Mo
4. 该公式假定众数组的频数在众数组内均匀分布
从累计频数看,中位数 的在“一般”这一组别 中。因此
Me=一般
19
数值型未分组数据的中位数
(5个数据的算例)
原始数据:24 22 21 26 20 排 序:20 21 22 24 26 位 置: 1 2 3 4 5
位置 N 1 5 1 3 22
中位数 22
20
数值型未分组数据的中位数
Me
L
N 2
S m1 fm
i
4. 该公式假定中位数组的频数在该组内均匀分布
22
数值型分组数据的中位数
(算例)
【 例 4.3】 根据第三 章 表 3-5 中 的数据, 计算50 名 工人日加
工零件数 的中位数
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
累积频数
105~110
3
Mo
13
数值型分组数据的众数
(算例)
【 例 4.1】 根据第三 章 表 3-5 中 的数据, 计 算 50 名 工人日加
工零件数 的众数
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
累积频数
105~110
3
3
110~115
5
8
115~120
8
16
120~125
14
30
125~130
和数值型数据
9
众数
(众数的不唯一性)
无众数 原始数据: 10 5 9 12 6 8
一个众数 原始数据: 6 5 9 8 5 5 多于一个众数 原始数据: 25 28 28 36 42 42
10
定类数据的众数
(算例)
【例】根据第三章表3-1中的数据 ,计算众数
表3-1 某城市居民关注广告类型的频数分布
第三章 数据分布特征的测度
第一节 集中趋势的测度 第二节 离散程度的测度 第三节 偏态与峰度的测度
1
学习目标
通过本章的学习,要正确理解各种指标的 概念及计算方法,学会运用指标对总体进 行分析说明。本章计划课时7小时。
2
数据分布的特征
集中趋势 (位置)
离中趋势 (分散程度) 偏态和峰度 (形状)
数据的特征和测度
集中趋势
众数 中位数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰度Байду номын сангаас
6
集中趋势
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的集中趋势测度值适用于高层次的测量数据,
(算例)
【例4.2】根据第三章表3-2中的数 据,计算甲城市家庭对住房满意状 况评价的中位数
表3-2 甲城市家庭对住房状况评价的频数分布
回答类别
甲城市
户数 (户)
累计频数
非常不满意
24
24
不满意
108
132
一般
93
225
满意
45
270
非常满意
30
300
合计
300
—
解:中位数的位置为: 300/2=150
3
110~115
5
8
115~120
3
数据分布的特征和测度
数据的特征和测度
集中趋势
众数 中位数 均值
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰度
4
第一节 集中趋势的测度
一. 定类数据:众数 二. 定序数据:中位数和分位数 三. 定距和定比数据:均值 四. 众数、中位数和均值的比较
5
数据特征分布的和测度 (本节位置)
10
40
130~135
6
46
135~140
4
50
合计
50
—
M0
120
14 8 (14 8) (14
10)
5
123(个)
14
中位数和分位数
15
中位数
(概念要点)
1. 集中趋势的测度值之一 2. 排序后处于中间位置上的值
50%
50%
3. 不受极端值的影响 Me
4. 主要用于定序数据,也可用数值型数据,但不能用于定 类数据
Mo=商品广告
11
定序数据的众数
(算例)
【 例 】 根 据 第 三 章 表 3-2 中 的 数 据 ,计算众数
表3-2 甲城市家庭对住房状况评价的频数分布
回答类别
甲城市 户数 (户) 百分比 (%)
非常不满意
24
8
不满意
108
36
一般
93
31
满意
45
15
非常满意
30
10
合计
300
100.0
解:这里的数据为定 序数据。变量为“回 答类别”。甲城市中 对住房表示不满意的 户 数 最 多 , 为 108 户 ,因此众数为“不满 意”这一类别,即
广告类型
人数(人) 比例 频率(%)
商品广告
112
0.560
56.0
服务广告
51
0.255
25.5
金融广告
9
0.045
4.5
房地产广告
16
0.080
8.0
招生招聘广告
10
0.050
5.0
其他广告
2
0.010
1.0
合计
200
1
100
解:这里的变量为“广告类 型”,这是个定类变量,不 同类型的广告就是变量值。 我们看到,在所调查的200 人当中,关注商品广告的人 数最多,为112人,占总被 调查人数的56%,因此众数 为“商品广告”这一类别, 即
(6个数据的算例)
原始数据:10 5 9 12 6 8 排 序: 5 6 8 9 10 12 位 置: 1 2 3 4 5 6
位置 N+1 6+1 3.5
22 中位数 8 + 9 8.5
2
21
数值型分组数据的中位数
(要点及计算公式)
1. 根据位置公式确定中位数所在的组 2. 采用下列近似公式计算:
5. 各变量值与中位数的离差绝对值之和最小,即
n
X i M e min
i 1
16
中位数
(位置的确定)
未分组数据: 中位数位置 N 1 2
组距分组数据: 中位数位置 N 2
17
未分组数据的中位数
(计算公式)
Me
X
N 1 2
1 2
X
N 2
X
N 2
1
当N为奇数时 当N为偶数时
18
定序数据的中位数