第六章 变异度指标
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
❖ 1、四分位差是四分位数中间两个分位之差。 ❖ 四位差Q=第三个四分位数Q3—第一个四分位数Q1 ❖ 实质上是两端各去掉四分之一的数据以后的极差,表示占全
部数据一半的中间数据的离散程度。四分位差越大,表示数 据离散程度越大。
❖ 2、适用条件:四分位差是一种顺序统计量,适用于定序数 据和定量数据。尤其是当用中位数来测度数据集中趋势时。
❖ 对于总体数据而言,极差也就是变量变化的范围或幅度大小。 ❖ 组距数列中,极差≈最高组的上限-最低组的下限。 ❖ 在总体中任何两个单位的标志值之差都不可能超过极差,即
xi x j R,其中i j
❖ 2、优缺点:计算简便、含义直观、容易理解。反映现象的 差异程度较粗略,未考虑数据的中间分布情况,不能充分说 明全部数据的差异程度。
❖ 解:第一步:求出第一个四分位数和第三个四分位数的位次:
Q1的位次
n
1 4
12 1 4
3.25
Q3的位次
3(n 1) 4
9.75
❖ 第二步:求出第一个四分位数和第三个四分位数,得到四分 位数
Q1
22 2
24
23
Q3
30 32 2
31
Q Q3 Q1 31 23 8
❖ 三、平均差
❖ 1、平均差是总体各单位标志值对其算术平数的离 差绝对值的算术平均数。反映各个数据与其均值的 平均差距,通常以A.D表示。计算公式为:
引例
“平均”这个词往往是“算术平均值”的简称。这是 一个很有用的统计学的度量指标。然而,如果有少数几 个很大的数,“平均值”就会给人错误的印象。例如, 有一个人在一条平均只有1.2米的河中淹死了,而成人的 身高一般都会超过1.5米。那么,为什么一条平均深度只 有1.2米的河却会淹死人?原因是这条河深浅不同,这个 人是在一个2米多深的陷坑处沉下去的。
❖ 三、学习重点和难点
❖ 本章的重点是标准差、离散系数的计算;难点是偏 度与峰度的计算,以及如何正确的运用标准差和离 散系数来判别社会经济现象的代表性。
❖ 四、授课课时:4-6学时
变量数列1 变量数列2
___
X
一则笑话
❖ 如果你一只脚放在摄氏 1 度的水里,另一只脚放在 摄氏 79 度的水里,平均水温 40 度,你一定感觉很 舒服 ?
❖ 三、变异度指标的种类 ❖ 1、全距 ❖ 2、四分位差 ❖ 3、平均差 ❖ 4、标准差 ❖ 5、方差 ❖ 6、离散系数 ❖ 7、偏度 ❖ 8、峰度
第二节 变异度指标的计算
❖ 一、全距(极差) ❖ 1、全距是总体各单位标志值中最大值与最小值之差,又称
极差。 全距 R=最大值-最小值 R xmax xmin
(一)全距计算
例 6.1
日产量X 工人数f
R X X 20
3
21
4
max mwk.baidu.comn
22
5
23 6 26 20
24
5
25
26
4 3
6件
∑
30
例 6.2
X分组
f
30-40
1
40-50
3
50-60
8
60-70
4
70-80
2
∑
R X max X min 80 30 50
❖ 二、四分位差
员工数f 5 10 20 7 5
3
50
❖ 计算月工资水平的平均差
月工资X 800 1000 1200 1500 2000 2500 合计
员工数f 5 10 20 7 5 3 50
X X
-520 -320 -120 180 680 1180
--
X X
520 320 120 180 680 1180 --
XX f
2600 3200 2400 1260 3400 3540 16400
n
A.D
| xi x | fi
i 1 n
fi
16400 328元 50
i 1
❖ 四、方差和标准差
❖ 1. 方差(Variance)
❖ 方差是各个数据与其均值的离差平方的算术平均 数.
❖ 总体方差( σ2 )的计算公式为:
第六章 变异度指标
❖ 一、基本内容
❖ 第一节 变异度指标的意义
❖ 变异度指标的概念、变异度指标的作用、变异度 指标的种类
❖ 第二节 变异度指标的计算
❖ 全距、四分位差、平均差、标准差和方差、离散 系数
❖ 第三节 偏度与峰度
❖ 偏度、峰度;偏度和峰度的简捷计算及应用
❖ 二、学习目的与要求
❖ 通过对本章的学习,使同学们明确变异度指标的概 念、种类和作用,变异度指标和平均指标的区别, 掌握各种变异度指标的计算方法。
未分组数据
已分组数据
n
部差异,离中趋势)。
❖ 二、变异度指标的作用 ❖ 1、衡量平均数的代表性。变异度指标值与平均数
的代表性大小成反比。变异度指标值(离散程度) 越大,平均数的代表性就越小。 ❖ 如有三个生产小组,有5人每日产量如下: ❖ 甲组:24 24 24 24 24 ❖ 乙组:20 22 25 26 27 ❖ 丙组:10 20 25 30 35 ❖ 2、衡量现象变动的离散程度、稳定性和均衡程度。 ❖ 变异度指标越小,现象变动的稳定性和均衡程度越 高。 ❖ 3、计算抽样误差和确定样本容量的依据。
❖ 显然,只了解变量的集中趋势是不够的!
第一节 变异度指标
❖ 一、变异度指标的概念
❖ 变异度指标又称标志变动度指标,是综合反 映总体各单位标志值及其分布的差异程度的 指标。
❖ 如:七个人的工资分别为:320元,320元, 400元,400元,500元,500元,2000元。
❖ 平均工资为634.29元(平均指标 ,集中趋势) ❖ 最高和最低之差为1680元(变异度指标,内
❖ 3、优缺点:计算简单,意义清楚,在一定程度上对极差的 一种改进,避免了极端值的干扰。但反映现象的差异程度较 粗略和不全面,实用价值甚小。
全距和四分位 差均只使用部 分数据进行计
算。
❖ 例题:某车间12个工人,其日产量按数量大小依次排列如下: 10,20,22,24,25,26,27,28,30,32,34,35,求 其四分位差。
未分组数据
已分组数据
n
| xi x | A.D i1
n
n
| xi x | fi A.D i1
n
fi
i 1
❖ 平均差含义清晰,能全面地反映数据的离散程度。 但取离差绝对值进行平均,数学处理上不够方便, 在数学性质上也不是最优的。
❖ 计算月工资水平的平均差
月工资X 800 1000 1200 1500 2000 2500 合计
部数据一半的中间数据的离散程度。四分位差越大,表示数 据离散程度越大。
❖ 2、适用条件:四分位差是一种顺序统计量,适用于定序数 据和定量数据。尤其是当用中位数来测度数据集中趋势时。
❖ 对于总体数据而言,极差也就是变量变化的范围或幅度大小。 ❖ 组距数列中,极差≈最高组的上限-最低组的下限。 ❖ 在总体中任何两个单位的标志值之差都不可能超过极差,即
xi x j R,其中i j
❖ 2、优缺点:计算简便、含义直观、容易理解。反映现象的 差异程度较粗略,未考虑数据的中间分布情况,不能充分说 明全部数据的差异程度。
❖ 解:第一步:求出第一个四分位数和第三个四分位数的位次:
Q1的位次
n
1 4
12 1 4
3.25
Q3的位次
3(n 1) 4
9.75
❖ 第二步:求出第一个四分位数和第三个四分位数,得到四分 位数
Q1
22 2
24
23
Q3
30 32 2
31
Q Q3 Q1 31 23 8
❖ 三、平均差
❖ 1、平均差是总体各单位标志值对其算术平数的离 差绝对值的算术平均数。反映各个数据与其均值的 平均差距,通常以A.D表示。计算公式为:
引例
“平均”这个词往往是“算术平均值”的简称。这是 一个很有用的统计学的度量指标。然而,如果有少数几 个很大的数,“平均值”就会给人错误的印象。例如, 有一个人在一条平均只有1.2米的河中淹死了,而成人的 身高一般都会超过1.5米。那么,为什么一条平均深度只 有1.2米的河却会淹死人?原因是这条河深浅不同,这个 人是在一个2米多深的陷坑处沉下去的。
❖ 三、学习重点和难点
❖ 本章的重点是标准差、离散系数的计算;难点是偏 度与峰度的计算,以及如何正确的运用标准差和离 散系数来判别社会经济现象的代表性。
❖ 四、授课课时:4-6学时
变量数列1 变量数列2
___
X
一则笑话
❖ 如果你一只脚放在摄氏 1 度的水里,另一只脚放在 摄氏 79 度的水里,平均水温 40 度,你一定感觉很 舒服 ?
❖ 三、变异度指标的种类 ❖ 1、全距 ❖ 2、四分位差 ❖ 3、平均差 ❖ 4、标准差 ❖ 5、方差 ❖ 6、离散系数 ❖ 7、偏度 ❖ 8、峰度
第二节 变异度指标的计算
❖ 一、全距(极差) ❖ 1、全距是总体各单位标志值中最大值与最小值之差,又称
极差。 全距 R=最大值-最小值 R xmax xmin
(一)全距计算
例 6.1
日产量X 工人数f
R X X 20
3
21
4
max mwk.baidu.comn
22
5
23 6 26 20
24
5
25
26
4 3
6件
∑
30
例 6.2
X分组
f
30-40
1
40-50
3
50-60
8
60-70
4
70-80
2
∑
R X max X min 80 30 50
❖ 二、四分位差
员工数f 5 10 20 7 5
3
50
❖ 计算月工资水平的平均差
月工资X 800 1000 1200 1500 2000 2500 合计
员工数f 5 10 20 7 5 3 50
X X
-520 -320 -120 180 680 1180
--
X X
520 320 120 180 680 1180 --
XX f
2600 3200 2400 1260 3400 3540 16400
n
A.D
| xi x | fi
i 1 n
fi
16400 328元 50
i 1
❖ 四、方差和标准差
❖ 1. 方差(Variance)
❖ 方差是各个数据与其均值的离差平方的算术平均 数.
❖ 总体方差( σ2 )的计算公式为:
第六章 变异度指标
❖ 一、基本内容
❖ 第一节 变异度指标的意义
❖ 变异度指标的概念、变异度指标的作用、变异度 指标的种类
❖ 第二节 变异度指标的计算
❖ 全距、四分位差、平均差、标准差和方差、离散 系数
❖ 第三节 偏度与峰度
❖ 偏度、峰度;偏度和峰度的简捷计算及应用
❖ 二、学习目的与要求
❖ 通过对本章的学习,使同学们明确变异度指标的概 念、种类和作用,变异度指标和平均指标的区别, 掌握各种变异度指标的计算方法。
未分组数据
已分组数据
n
部差异,离中趋势)。
❖ 二、变异度指标的作用 ❖ 1、衡量平均数的代表性。变异度指标值与平均数
的代表性大小成反比。变异度指标值(离散程度) 越大,平均数的代表性就越小。 ❖ 如有三个生产小组,有5人每日产量如下: ❖ 甲组:24 24 24 24 24 ❖ 乙组:20 22 25 26 27 ❖ 丙组:10 20 25 30 35 ❖ 2、衡量现象变动的离散程度、稳定性和均衡程度。 ❖ 变异度指标越小,现象变动的稳定性和均衡程度越 高。 ❖ 3、计算抽样误差和确定样本容量的依据。
❖ 显然,只了解变量的集中趋势是不够的!
第一节 变异度指标
❖ 一、变异度指标的概念
❖ 变异度指标又称标志变动度指标,是综合反 映总体各单位标志值及其分布的差异程度的 指标。
❖ 如:七个人的工资分别为:320元,320元, 400元,400元,500元,500元,2000元。
❖ 平均工资为634.29元(平均指标 ,集中趋势) ❖ 最高和最低之差为1680元(变异度指标,内
❖ 3、优缺点:计算简单,意义清楚,在一定程度上对极差的 一种改进,避免了极端值的干扰。但反映现象的差异程度较 粗略和不全面,实用价值甚小。
全距和四分位 差均只使用部 分数据进行计
算。
❖ 例题:某车间12个工人,其日产量按数量大小依次排列如下: 10,20,22,24,25,26,27,28,30,32,34,35,求 其四分位差。
未分组数据
已分组数据
n
| xi x | A.D i1
n
n
| xi x | fi A.D i1
n
fi
i 1
❖ 平均差含义清晰,能全面地反映数据的离散程度。 但取离差绝对值进行平均,数学处理上不够方便, 在数学性质上也不是最优的。
❖ 计算月工资水平的平均差
月工资X 800 1000 1200 1500 2000 2500 合计