统计学数据分布特征描述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
本章学习任务
以数值特征,对统计数据分布进行量化描述。 主要包括三方面:
➢集中趋势 用平均指标描述(位置特征);
➢离中趋势 用变异指标描述(离散特征);
➢偏斜程度 用偏度和峰度描述(偏斜特征、峰度特征)。
学习要求:
理解测度统计数据集中趋势、离散程度的概念 、指标、相互关系;
掌握主要分析指标的计算方法和应用场合,并能 熟练进行相关计算分析。
➢其更能清晰表明权数之权衡轻重的作用。
权数形式有2种:
➢ 绝对数形式
Mp
➢ 结构比例形式
k
N
xik wi
i 1
N
wi
i 1
k
N
i 1
xik
wi
N
wi
i 1
x
N
xiwi
i 1 N
wi
i 1
N
i 1
xi
wi
N
wi
i 1
MH
1
N
i 1
1 xi
wi
N
wi
i 1
1
N
i 1
22
22
25
25
25
25
25 25 25 25
25 25
30 30 30 30
50 30
22 22 25 25 25 25 25 30 30 50 22 ... 30
20
538 26.9 20
表 3-2
年龄 人数(人)
x
f
22
4
25
10
30
5
分组数据不能简单平 均 !因为各组变量值 的次数(权数)不等! 若采用简单平均:
➢如用平均工资了解职工工资分布的中心, 反映职工工资的一般水平。
2.比较同一现象在不同空间或不同阶段的发 展水平,反映现象变化特征、趋势和规律性。 ➢能消除总体规模差异造成的不利影响; ➢在一定程度上减弱偶然因素的影响。
3.分析现象之间的依存关系。 ➢如研究劳动者文化程度与收入的关系。
4.(数值)平均指标是推断统计中的重要 统计量,是进行统计推断的基础。
22 25 30 50 31.75 4
应采用加权平均。
50
1
合计
20
两种计算公式结果相同!
2.加权算术平均数
➢ 对单项式分组资料,应以各标志值出现次数为权数加权 平均 。
➢ 加权算术平均数计算公式:
n
x
x1 f1 x2 f2 ... xn fn f1 f2 ... fn
Βιβλιοθήκη Baidu
xi fi
一、集中趋势指标及作用
集中趋势(Central tendency)
➢集中趋势 即一组数据向其中心值聚集或靠
拢的倾向和程度。 用平均指标表示,代表数据的一
般水平。 ➢测定集中趋势是认识数据分布特征的
基本内容。
集中趋势指标有两类:
➢数值平均数 根据全部数据计算得到的代表值。
优点:数学性质良好,可用于统计推断 缺点:易受极端值影响。
几种常见的位置特征数
数据分布的位置特征数实际上也是数据的代表值, 代表了数据的一般水平。
在不同场合,可以适当选用平均数、中位数、众数充 当位置特征数(代表值)
其中平均数不同于中位数、众数的特点在于: ➢平均数是由所研究的全体数据参加计算所得。
平均数的一般形式叫做幂平均数。常见的有算 术平均数、几何平均数、调和平均数。
1 xi
wi
N
wi
i 1
N
MG
wi i1
x w1 1
x w2 2
x wN N
wi
N
N
wi
x i1 i
i 1
(二)算术平均数
➢算术平均数(Arithmetic mean ),也称均 值(mean)。
➢由一组数据的总和(总体标志总量)除以 该组数据的项数(总体单位总量)得到; 算术平均数=总体标志总量/总体单位总量
Mp
k
N
xik
i 1
N
特例情况 幂平均数
算术平均数(幂指数 k=1) 调和平均数(幂指数 k=-1) 几何平均数(幂指数 k0) 其他幂平均数
k=1:算术平均数
➢ 加权
➢ 简单
N
xiwi
x
i 1 N
wi
i 1
N
xi x i1
N
k=-1:调和平均数
➢ 加权 ➢ 简单
N
MH
N
i 1
1
1 xi
wi
wi
i 1
N1
i1 xi
wi
N
wi
i 1
MH
1 N1
N N1
i1 xi i1 xi
N
k0:几何平均数 ➢加权
N
MG
wi
i 1
x1w1
x2w2
xNwN
➢简单
MG N x1 x2 xN
关于加权问题
权数确定方式: ➢客观权数: 权数由实际统计资料获得或推算。 ➢主观权数: 根据研究问题,由研究者主观赋值。
主要有算术平均数、调和平均数及几 何平均数,三者均为幂平均数特例。
➢位置平均数 根据对总体中处于特定位置的单个或部
分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。
一、集中趋势指标及作用
集中趋势指标作用 1.反映变量分布的集中趋势和一般水平。
i 1 n
fi
xf f
i 1
例3-1单项式分组资料(表3-2)计算方法为:
x 22 4 2510 30 5 501 4 10 5 1
二、数值平均数
(一)幂平均数
➢ 幂,power
➢ 变量X取N个值: x1 , x2 , , xN。
➢ 权数为一组正数: w1 , w2 , , wN 。
➢ 加权幂平均数一般形式为: 其中,k 为任意实数。
N
xik wi
M
p
k
i 1 N
wi
i 1
➢权数w均相等时,加权平均数退化为简单 平均数:
数据分布特征与测度:概览
集中趋势 (位置)
离中趋势 (分散程度) 偏态和峰态
(形状)
数据分布特征测度
集中趋势
幂平均数 中位数 众数
离散程度
分布形状
极差 平均差 方差、标准差 异众比率 变异系数
偏度 峰度
第一节 统计变量集中趋势测定
一 集中趋势指标及作用 二 数值平均数 三 众数与中位数(位置平均数)
➢是最常用的数值平均数;
➢根据掌握资料不同,其有多种计算公式。
1.简单算术平均数 ➢对未分组数据,采用简单算术平均数公式。即 把各项数据直接加总,然后除以总项数。 ➢计算公式:
N
xi x i1
N
举例
表 3-1 解:采用简单算术平均法计算,即全体队员的
男性 女性 平均年龄为(单位:周岁)
22 22
权数作用: ➢权衡变量的各种取值在计算平均数时的重 要性。 ➢权数作用,根本上是通过权数结构实现。
权数作用:
➢即使不改变被平均的数值,仅改变权数结构,即 可改变平均数水平。
例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
权数实质
➢权数的实质在于其结构,即结构比例形式(比重 权数)。
以数值特征,对统计数据分布进行量化描述。 主要包括三方面:
➢集中趋势 用平均指标描述(位置特征);
➢离中趋势 用变异指标描述(离散特征);
➢偏斜程度 用偏度和峰度描述(偏斜特征、峰度特征)。
学习要求:
理解测度统计数据集中趋势、离散程度的概念 、指标、相互关系;
掌握主要分析指标的计算方法和应用场合,并能 熟练进行相关计算分析。
➢其更能清晰表明权数之权衡轻重的作用。
权数形式有2种:
➢ 绝对数形式
Mp
➢ 结构比例形式
k
N
xik wi
i 1
N
wi
i 1
k
N
i 1
xik
wi
N
wi
i 1
x
N
xiwi
i 1 N
wi
i 1
N
i 1
xi
wi
N
wi
i 1
MH
1
N
i 1
1 xi
wi
N
wi
i 1
1
N
i 1
22
22
25
25
25
25
25 25 25 25
25 25
30 30 30 30
50 30
22 22 25 25 25 25 25 30 30 50 22 ... 30
20
538 26.9 20
表 3-2
年龄 人数(人)
x
f
22
4
25
10
30
5
分组数据不能简单平 均 !因为各组变量值 的次数(权数)不等! 若采用简单平均:
➢如用平均工资了解职工工资分布的中心, 反映职工工资的一般水平。
2.比较同一现象在不同空间或不同阶段的发 展水平,反映现象变化特征、趋势和规律性。 ➢能消除总体规模差异造成的不利影响; ➢在一定程度上减弱偶然因素的影响。
3.分析现象之间的依存关系。 ➢如研究劳动者文化程度与收入的关系。
4.(数值)平均指标是推断统计中的重要 统计量,是进行统计推断的基础。
22 25 30 50 31.75 4
应采用加权平均。
50
1
合计
20
两种计算公式结果相同!
2.加权算术平均数
➢ 对单项式分组资料,应以各标志值出现次数为权数加权 平均 。
➢ 加权算术平均数计算公式:
n
x
x1 f1 x2 f2 ... xn fn f1 f2 ... fn
Βιβλιοθήκη Baidu
xi fi
一、集中趋势指标及作用
集中趋势(Central tendency)
➢集中趋势 即一组数据向其中心值聚集或靠
拢的倾向和程度。 用平均指标表示,代表数据的一
般水平。 ➢测定集中趋势是认识数据分布特征的
基本内容。
集中趋势指标有两类:
➢数值平均数 根据全部数据计算得到的代表值。
优点:数学性质良好,可用于统计推断 缺点:易受极端值影响。
几种常见的位置特征数
数据分布的位置特征数实际上也是数据的代表值, 代表了数据的一般水平。
在不同场合,可以适当选用平均数、中位数、众数充 当位置特征数(代表值)
其中平均数不同于中位数、众数的特点在于: ➢平均数是由所研究的全体数据参加计算所得。
平均数的一般形式叫做幂平均数。常见的有算 术平均数、几何平均数、调和平均数。
1 xi
wi
N
wi
i 1
N
MG
wi i1
x w1 1
x w2 2
x wN N
wi
N
N
wi
x i1 i
i 1
(二)算术平均数
➢算术平均数(Arithmetic mean ),也称均 值(mean)。
➢由一组数据的总和(总体标志总量)除以 该组数据的项数(总体单位总量)得到; 算术平均数=总体标志总量/总体单位总量
Mp
k
N
xik
i 1
N
特例情况 幂平均数
算术平均数(幂指数 k=1) 调和平均数(幂指数 k=-1) 几何平均数(幂指数 k0) 其他幂平均数
k=1:算术平均数
➢ 加权
➢ 简单
N
xiwi
x
i 1 N
wi
i 1
N
xi x i1
N
k=-1:调和平均数
➢ 加权 ➢ 简单
N
MH
N
i 1
1
1 xi
wi
wi
i 1
N1
i1 xi
wi
N
wi
i 1
MH
1 N1
N N1
i1 xi i1 xi
N
k0:几何平均数 ➢加权
N
MG
wi
i 1
x1w1
x2w2
xNwN
➢简单
MG N x1 x2 xN
关于加权问题
权数确定方式: ➢客观权数: 权数由实际统计资料获得或推算。 ➢主观权数: 根据研究问题,由研究者主观赋值。
主要有算术平均数、调和平均数及几 何平均数,三者均为幂平均数特例。
➢位置平均数 根据对总体中处于特定位置的单个或部
分单位标志值直接观察或推算确定的代表值。 优点:不易受极端值影响,具有较好稳健性。 缺点:不宜用作统计推断。 主要包括众数和中位数。
一、集中趋势指标及作用
集中趋势指标作用 1.反映变量分布的集中趋势和一般水平。
i 1 n
fi
xf f
i 1
例3-1单项式分组资料(表3-2)计算方法为:
x 22 4 2510 30 5 501 4 10 5 1
二、数值平均数
(一)幂平均数
➢ 幂,power
➢ 变量X取N个值: x1 , x2 , , xN。
➢ 权数为一组正数: w1 , w2 , , wN 。
➢ 加权幂平均数一般形式为: 其中,k 为任意实数。
N
xik wi
M
p
k
i 1 N
wi
i 1
➢权数w均相等时,加权平均数退化为简单 平均数:
数据分布特征与测度:概览
集中趋势 (位置)
离中趋势 (分散程度) 偏态和峰态
(形状)
数据分布特征测度
集中趋势
幂平均数 中位数 众数
离散程度
分布形状
极差 平均差 方差、标准差 异众比率 变异系数
偏度 峰度
第一节 统计变量集中趋势测定
一 集中趋势指标及作用 二 数值平均数 三 众数与中位数(位置平均数)
➢是最常用的数值平均数;
➢根据掌握资料不同,其有多种计算公式。
1.简单算术平均数 ➢对未分组数据,采用简单算术平均数公式。即 把各项数据直接加总,然后除以总项数。 ➢计算公式:
N
xi x i1
N
举例
表 3-1 解:采用简单算术平均法计算,即全体队员的
男性 女性 平均年龄为(单位:周岁)
22 22
权数作用: ➢权衡变量的各种取值在计算平均数时的重 要性。 ➢权数作用,根本上是通过权数结构实现。
权数作用:
➢即使不改变被平均的数值,仅改变权数结构,即 可改变平均数水平。
例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
权数实质
➢权数的实质在于其结构,即结构比例形式(比重 权数)。