数据分布特征的描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 数据分布特征的描述
第一节 集中趋势——数值平均数 第二节 集中趋势——位置平均数 第三节 离中趋势的测度 第四节 偏度与峰度的 测度
2020/4/1
版权所有 BY 统计学课程组
1
本章重点与难点
重点: 了解和掌握算术平均数、众数、中位
数、方差、标准差、标准分数的含义及 其计算方法;正确使用离散系数比较不 同均值的代表性。
2.4元、1.8元及1.5元(1)若三种苹果各买1元,试问
所购苹果的平均价格又为多少?(2)如果甲、乙、丙
三种苹果分别购买5元、8元和10元,试问其平均价格为
多少?
解:计算平均价格的是用所付金额除以所购数量。
(1)
(2)
2020/4/1
版权所有 BY 统计学课程组
19
计算调和平均数 ,注意:
从数学定义角度看算术平均数与调和平均数是 不一样的,但在社会经济应用领域,调和平均数实 际上只是算术平均数的另一种表现形式,二者本质 上是一致的,唯一的区别是计算时使用了不同的数 据。
差和标准差、离散系数、标准分数。 3.分布的形状
偏态系数、峰态系数。
2020/4/1
6
第一节 集中趋势——数值平均数 p75
数 值
一、算术平均数
ຫໍສະໝຸດ Baidu
型
二、调和平均数
数
据
三、几何平均数
的
平
均
数
2020/4/1
版权所有 BY 统计学课程组
7
集中趋势
(central tendency)
1. 一组数据向其中心值靠拢的倾向和程度
17
二、调和平均数 H m
调和平均数也称“倒数平均数”,它是对变 量的倒数求平均,然后再取倒数而得到的平均 数,以 H m表示。
根据掌握的资料不同,调和平均数也有简单 调和平均数和加权平均数两种形式。
其计 算公 式为:
2020/4/1
版权所有 BY 统计学课程组
18
例题分析
【例3.4] 假设甲、乙、丙三种苹果的价格分别为每斤
15
算术平均数的性质
2020/4/1
版权所有 BY 统计学课程组
16
算术平均数(均值)特征:
1. 集中趋势的最常用测度值; 2. 一组数据的均衡点所在; 3. 易受极端值的影响; 4. 由组距分组资料计算的均值有近似值性质; 5、用于数值型数据,不能用于分类数据和顺
序数据
2020/4/1
版权所有 BY 统计学课程组
解: 或
2020/4/1
版权所有 BY 统计学课程组
13
计算算术平均数, 注意:
用各组的组中值代表其实际数据计算算术平均数 时,通常假定各组数据在组内是均匀分布的,相 应的组中值近似等于各组的平均数。
权数:衡量变量值相对重要性的数值。
各个变量值的权数要起作用必须具备两个条件:
一是各个变量值之间有差异;
二是各个变量值的权数有差异。
简单算术平均数是加权算术平均数在权数相等时 的特例。
2020/4/1
版权所有 BY 统计学课程组
14
算术平均数的性质 p75-76
1.各变量值与其算术平均数的离差之 和等于零,即
邋 ( x -x )= 0 或 者 ( x -x )f= 0
2020/4/1
版权所有 BY 统计学课程组
人数
fi(人) 3 11 34 24 11
比重
(%) 3.61 13.25 40.96 28.92 13.25
总计
-
83
100.00
x xf f
x16.245
2020/4/1
组距数据
加权算 术平均
x x f x16.245f
数 版权所有 BY 统计学课程组
12
【例3.3】依据整理得表3-4中的数据,计算职工通信费 用支出额平均水平 。p74
算术平均数, 又有简单算术平均数和加权平均数 之分。
算术平均数公式的应用条件(1)各变量值相互独 立;(2)变量名称和计量单位相同;(3)截面数 据。
2020/4/1
版权所有 BY 统计学课程组
9
一、算术平均数
设一组数据为: 简单算术平均数
x1 ,x2 ,… ,xn 未分组数据
n
x
x1 x2
xn
xi
i 1
n
n
各组的组中值为:x1 ,x2 ,… ,xk 组距分组数据
相应的频数为: f1 , f2 ,… ,fk
k
加权算术平均数
x x1f1 x2f2 f1 f2
xkfk
xifi
i1
fk
n
f i
i1
2020/4/1
版权所有 BY 统计学课程组
10
【例3.1】根据表3-1中的数据,计算职工通信费用支出 额平均水平 。p72
解:
2020/4/1
版权所有 BY 统计学课程组
11
例3.2 分组资料均值的计算:次数 变量值 某年级83名女生身高资料 f
频率 f/∑f
x
身高
(cm) 150- 155 155-160 160-165 165-170 170以上
组中值
xi(cm ) 152.5 157.5 162.5 167.5 172.5
2. 测度集中趋势就是寻找数据水平的代表值或中心值
3. 不同类型的数据用不同的集中趋势测度值
4. 注意:低层次数据的测度方法也适用于高层次的数 据,但高层次数据的测度方法往往不适用于低层次 的数据。
2020/4/1
版权所有 BY 统计学课程组
8
一、算术平均数
均值(算术平均数)定义:将一组数据相加后除 以数据的个数所得到的一个数值,称为算术平均数 (average)或均值(mean)。
难点: 是偏度和峰度的含义及其计算方法。
2020/4/1
版权所有 BY 统计学课程组
2
学习目标
正确理解平均指标与变异指标的概念的、 意义与作用,明确其种类和区别;掌握平均 指标和变异指标的计算方法,以及应用的原 则和条件;掌握偏度和峰度的含义及其计算 方法;了解各种分位数的概念与意义。
2020/4/1
集中趋势:反映 数据向其中心 靠拢或聚集程
度 (位置)
离中趋势;数据 远离中心的趋势
(分散程度)
偏态和峰态;偏
态:反映数据偏
斜程度;峰度:
数据分布的平峰
或尖峰程度(形
2020状/4/)1
5
数据分布特征的测度
1.集中趋势 算术平均数、调和平均数 、几何平均数、
众数和中位数。 2.离散程度 全距、异众比率、四分位差、平均差、方
版权所有 BY 统计学课程组
3
数据分布的特征:
一、集中趋势:反映数据向其中心靠拢或 聚集
程度;
二、离中趋势;数据远离中心的趋势(又称离散
程度);
三、偏态和峰态;偏态是对数据分布对称性的度
量;峰度是指数据分布的平峰或尖峰程度
(形状)。
2020/4/1
版权所有 BY 统计学课程组
4
数据分布的特征
第一节 集中趋势——数值平均数 第二节 集中趋势——位置平均数 第三节 离中趋势的测度 第四节 偏度与峰度的 测度
2020/4/1
版权所有 BY 统计学课程组
1
本章重点与难点
重点: 了解和掌握算术平均数、众数、中位
数、方差、标准差、标准分数的含义及 其计算方法;正确使用离散系数比较不 同均值的代表性。
2.4元、1.8元及1.5元(1)若三种苹果各买1元,试问
所购苹果的平均价格又为多少?(2)如果甲、乙、丙
三种苹果分别购买5元、8元和10元,试问其平均价格为
多少?
解:计算平均价格的是用所付金额除以所购数量。
(1)
(2)
2020/4/1
版权所有 BY 统计学课程组
19
计算调和平均数 ,注意:
从数学定义角度看算术平均数与调和平均数是 不一样的,但在社会经济应用领域,调和平均数实 际上只是算术平均数的另一种表现形式,二者本质 上是一致的,唯一的区别是计算时使用了不同的数 据。
差和标准差、离散系数、标准分数。 3.分布的形状
偏态系数、峰态系数。
2020/4/1
6
第一节 集中趋势——数值平均数 p75
数 值
一、算术平均数
ຫໍສະໝຸດ Baidu
型
二、调和平均数
数
据
三、几何平均数
的
平
均
数
2020/4/1
版权所有 BY 统计学课程组
7
集中趋势
(central tendency)
1. 一组数据向其中心值靠拢的倾向和程度
17
二、调和平均数 H m
调和平均数也称“倒数平均数”,它是对变 量的倒数求平均,然后再取倒数而得到的平均 数,以 H m表示。
根据掌握的资料不同,调和平均数也有简单 调和平均数和加权平均数两种形式。
其计 算公 式为:
2020/4/1
版权所有 BY 统计学课程组
18
例题分析
【例3.4] 假设甲、乙、丙三种苹果的价格分别为每斤
15
算术平均数的性质
2020/4/1
版权所有 BY 统计学课程组
16
算术平均数(均值)特征:
1. 集中趋势的最常用测度值; 2. 一组数据的均衡点所在; 3. 易受极端值的影响; 4. 由组距分组资料计算的均值有近似值性质; 5、用于数值型数据,不能用于分类数据和顺
序数据
2020/4/1
版权所有 BY 统计学课程组
解: 或
2020/4/1
版权所有 BY 统计学课程组
13
计算算术平均数, 注意:
用各组的组中值代表其实际数据计算算术平均数 时,通常假定各组数据在组内是均匀分布的,相 应的组中值近似等于各组的平均数。
权数:衡量变量值相对重要性的数值。
各个变量值的权数要起作用必须具备两个条件:
一是各个变量值之间有差异;
二是各个变量值的权数有差异。
简单算术平均数是加权算术平均数在权数相等时 的特例。
2020/4/1
版权所有 BY 统计学课程组
14
算术平均数的性质 p75-76
1.各变量值与其算术平均数的离差之 和等于零,即
邋 ( x -x )= 0 或 者 ( x -x )f= 0
2020/4/1
版权所有 BY 统计学课程组
人数
fi(人) 3 11 34 24 11
比重
(%) 3.61 13.25 40.96 28.92 13.25
总计
-
83
100.00
x xf f
x16.245
2020/4/1
组距数据
加权算 术平均
x x f x16.245f
数 版权所有 BY 统计学课程组
12
【例3.3】依据整理得表3-4中的数据,计算职工通信费 用支出额平均水平 。p74
算术平均数, 又有简单算术平均数和加权平均数 之分。
算术平均数公式的应用条件(1)各变量值相互独 立;(2)变量名称和计量单位相同;(3)截面数 据。
2020/4/1
版权所有 BY 统计学课程组
9
一、算术平均数
设一组数据为: 简单算术平均数
x1 ,x2 ,… ,xn 未分组数据
n
x
x1 x2
xn
xi
i 1
n
n
各组的组中值为:x1 ,x2 ,… ,xk 组距分组数据
相应的频数为: f1 , f2 ,… ,fk
k
加权算术平均数
x x1f1 x2f2 f1 f2
xkfk
xifi
i1
fk
n
f i
i1
2020/4/1
版权所有 BY 统计学课程组
10
【例3.1】根据表3-1中的数据,计算职工通信费用支出 额平均水平 。p72
解:
2020/4/1
版权所有 BY 统计学课程组
11
例3.2 分组资料均值的计算:次数 变量值 某年级83名女生身高资料 f
频率 f/∑f
x
身高
(cm) 150- 155 155-160 160-165 165-170 170以上
组中值
xi(cm ) 152.5 157.5 162.5 167.5 172.5
2. 测度集中趋势就是寻找数据水平的代表值或中心值
3. 不同类型的数据用不同的集中趋势测度值
4. 注意:低层次数据的测度方法也适用于高层次的数 据,但高层次数据的测度方法往往不适用于低层次 的数据。
2020/4/1
版权所有 BY 统计学课程组
8
一、算术平均数
均值(算术平均数)定义:将一组数据相加后除 以数据的个数所得到的一个数值,称为算术平均数 (average)或均值(mean)。
难点: 是偏度和峰度的含义及其计算方法。
2020/4/1
版权所有 BY 统计学课程组
2
学习目标
正确理解平均指标与变异指标的概念的、 意义与作用,明确其种类和区别;掌握平均 指标和变异指标的计算方法,以及应用的原 则和条件;掌握偏度和峰度的含义及其计算 方法;了解各种分位数的概念与意义。
2020/4/1
集中趋势:反映 数据向其中心 靠拢或聚集程
度 (位置)
离中趋势;数据 远离中心的趋势
(分散程度)
偏态和峰态;偏
态:反映数据偏
斜程度;峰度:
数据分布的平峰
或尖峰程度(形
2020状/4/)1
5
数据分布特征的测度
1.集中趋势 算术平均数、调和平均数 、几何平均数、
众数和中位数。 2.离散程度 全距、异众比率、四分位差、平均差、方
版权所有 BY 统计学课程组
3
数据分布的特征:
一、集中趋势:反映数据向其中心靠拢或 聚集
程度;
二、离中趋势;数据远离中心的趋势(又称离散
程度);
三、偏态和峰态;偏态是对数据分布对称性的度
量;峰度是指数据分布的平峰或尖峰程度
(形状)。
2020/4/1
版权所有 BY 统计学课程组
4
数据分布的特征