数据分布特征的描述讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
算术平均数有两点不足:wk.baidu.com
1、算术平均数易受极端变量值的影响,
使 X 的代表性变小,而且受极大值的影响
大于受极小值的影响。
2、当组距数列为开口组时,由于组中
值不易确定,使
X的代表性也不很可靠。
二、调和平均数
1.集中趋势的测度值之一;
2.算术平均数的另一种表现
原来只是计算 时使用了倒数
加权算术平均数算式:
55×2+65×8+75×16+85×10 +95×4=3060
x
x
i 1 K i 1
K
i
fi
i
f
3060 76.5 40
权数(fi ,也称权重)
权数——指在计算总体平均数或综合水平的过程中对各个 数据起着权衡轻重作用的变量。 可以是绝对数形式,也可以是比重形式(如频率)表示。
(二)相对指标的种类和计算方法
相对指标通常分为:结构相对指标、比例相对指 标、比较相对指标、计划完成相对指标、强度相对指 标和动态相对指标。 1、结构相对指标 计算各组总量占总体或样本总量的比重,用以 反映总体或样本结构状况的综合指标。
各组总量 结构相对数 100% 总体(样本)总量
22
22 25
22
22 25
25
25 25 25 30
25
25 25 25 30
22 22 25 25 25 25 25 30 30 50 22 ... 30 20 538 26.9 分组数据不能简单平均 20 !因为各组变量值的次 数不等! 表 3-2
(1)水平法
5年计划末年实际达到的 水平 5年计划完成程度 100% 5年计划规定的末年水平
(2)累计法
5年计划期间实际累计完 成数 100% 5年计划规定的累计数
5年计划完成程度
5、强度相对指标
概念:是性质不同但又有内在联系的两个绝对指 标的对比,是用以反映某现象的强度、密度或普遍程 度的综合指标。 强度相对数的两种表示方法: (1)一般用无名数表示。 (2)少数用百分数或千分数表示。 注:强度相对数不是平均数,不是同类指标数值 之比。
设分组后各组的变量值或组中值为:
x1 ,x2 ,… ,xn 相应的频数为: f1 , f2 ,… ,fn
(二)加权算术平均数
加权算术平均数的计算公式:
x1 f1 x2 f 2 ... xn f n i 1 xf x n f1 f 2 ... f n f f i
某地人口数(千人) (逆指标) 某地零售商业机构数
6、动态相对指标
概念:是不同时期同一指标数值之比,用以
反映现象在不同时期发展变化程度的综合指标。
动态相对数的计算结果用百分数或倍数表示。
报告期水平 动态相对数 100% 基期水平
正确运用相对指标的原则
1、注意两个对比指标的可比性 2、相对指标要和总量指标结合起来运用 结合运用的方法有两种: 一是计算分子与分母的绝对差额; 二是计算每增长1%的绝对值。 增长量=报告期水平-基期水平
标数值对比的结果。
注:用来对比的两个数既可以是绝对数,也
可以是平均数和相对数。
相对指标的主要作用:
①能具体表明社会经济现象之间的比例关系。 ②能使一些不能直接对比的事物找出共同比较的基础。 ③相对指标便于记忆、易于保密。 相对指标的表现形式:有名数、无名数。 有名数是将对比的分子指标和分母指标的计量单位 结合起来使用。 无名数是一种抽象化的数值,一般分为系数、倍数、 成数、百分数、千分数等。
年龄 人数(人)
x
22 25 30 50
f
4 10 5 1
若采用简单平均:
30
50
30
30
22 25 30 50 31.75 4
合计
20
(二)加权算术平均数
正确的计算是:
22 4 25 10 30 5 50 1 538 x 26.9 4 10 5 1 20
人均国内生产总 值(元)
第三产业占国内 生产总值比重%
相对指标的种类和计算方法
相对指标 计算方法
结构相对指标
比例相对指标 比较相对指标 强度相对指标 动态相对指标
总体中部分数值/全部数值
总体中A部分数值/B部分数值
甲地某指标数值/乙地同一指标数值
计划完成程度指标 实际数/计划数
某一指标数值/同期另一有联系的指标数值
轻重工业 轻工业 工业增加值/亿元 28277 比重% 29.90 以轻工业增加值为100% 100.00
重工业
66304
70.10
234.48 ——
合计
94581
100.00
3、比较相对指标
反映某一现象在同一时期内或同一时点上不
同空间下的不平衡程度的综合指标。 比较相对数可以是两个总量指标对比,也可 以是相对指标或平均指标对比。
某条件下的某类指标数 值 比较相对数 100% 另一条件下的同类指标 数值
4、计划完成相对数
是用一定时期内实际完成指标与计划指标的 比重,来反映计划完成程度的综合指标。
实际完成数 计划完成相对数 100% 计划数 实际完成百分比 计划完成相对数 100% 计划完成百分比
长期计划的检查:
i 1
xi f i
n
加权—为了体现各变量值轻重不同的影响作用, 对各个变量值赋予不尽相同的权数(fi ).
[例 ]
表 某班级40名同学统计学原始成绩(单位:分)
简单算术平均数算式:
X
64 70 40
78 75
3089 77.23 40
表 40名同学统计学成绩汇总表(单位:分)
(一)简单算术平均数
把每项数据直接加总后除以它们的项数 通常用于对未分组的数据计算算术平均数 计算公式:
x1 x2 ... xn x n
x
i 1
n
i
n
x n
Xi代表变量, x代表算数平均数, n变量值个数,∑求和
表 3-1 男性 女性
解:采用简单算术平均法计算,即全体队员 的平均年龄为(单位:周岁):
第四章 数据分布特征的描述
描述数据分布特征的指标主要有三大类: 一是描述数据分布集中趋势的指标;
二是描述数据分布离散程度的指标;
三是描述分布偏斜程度的指标。
统计指标的分类
总量指标(绝对数)—数量指标 相对指标(相对数)—质量指标 平均指标(平均数)—质量指标
绝对数。现象的规模、水平一般以绝对数形 式表现。 相对数。相对数由两个互相联系的数值对比 求得。常用的相对数包括:结构相对数、动 态相对数、比较相对数、强度相对数、利用 程度相对数、计划完成相对数等。 平均数。平均数反映现象总体的一般水平或 分布的集中趋势。
1、结构相对指标
①可以反映总体内部结构的特征。 ②通过不同时期相对数的变动,可以看 出事物的变化过程及其发展趋势。
③结构相对数一般用百分数表示。
④各组结构相对数之和等于100%或1。
例:我国规模以上工业增加值的轻重工业构成表
轻重工业
2006年 工业增加值/亿元 轻工业 24314 比重% 30.49 2007年 工业增加值/亿元 28277 比重% 29.90
偏态和峰度
(形状)
数据分布的特征和测度
数据的特征和测度
集中趋势
众 数
离散程度
离散系数
分布的形状
偏 态 峰 度
中位数
均 数
方差和标准差
四分位差
第二节 平均指标
数据分布集中程度的描述指标
第二节 平均指标
1.概念 也称平均指标或平均数 用来反映标志值的典型水平或标志值分布 的中心位置或集中趋势
增长量 基期水平 增长1%绝对值 (发展速度 1 ) 100 100
例:我国2001-2007年若干统计指标资料
指标 国内生产总值 (亿元) 年末总人口数 (万人) 2001年 109655 127627 8622 40.5 2002年 120333 128453 9398 41.5 2003年 135823 129227 10542 41.2 2004年 159878 129988 12336 40.4 2005年 183218 130756 14053 40.1 2006年 211924 131448 16165 40.0 2007年 249530 132129 18934 40.1
Xf X f f f
(三)算术平均数的数学性质
1、各个变量值与算术平均数的离差之和等于零。
( X X ) 0 ( X X ) f 0
2、各个变量值与算术平均数的离差平方之和等于最小值。
2 ( X X ) 最小值
(X
X ) f 最小值
2
第一节 总量指标和相对指标
一、总量指标 (一)总量指标的概念和作用 总量指标是反映现象在具体时间、地点、 条件下的总规模或总水平的统计指标。 总量指标也称为绝对指标或绝对数。
总量指标在社会经济统计中的作用:
①可以反映社会经济和企业的基本情况,反 映一个国家的基本国情和国力, ②它是计算相对指标、平均指标等描述指标 的基础。 ③是制定政策、编制计划、实行社会经济管 理的基本依据。
2.作用 反映变量分布的集中趋势和一般水平。 可用来比较同一总体在不同空间的发展水平 可用来分析现象之间的依存关系 是统计推断中一个重要的统计量。
集中趋势
(central tendency)
1.一组数据向其中心值靠拢的倾向和程度 2.测量集中趋势就是寻找数据水平的代表值或中心值 3.不同类型的数据用不同的集中趋势测度值
重工业
55438
69.51
66304
70.10
合计
79752
100.00
94581
100.00
2、比例相对指标
比例相对数是总体或样本中不同部分加以 对比,用以反映总体或样本内部的比例关系和 协调关系的综合指标。
总体中某部分数值 比例相对数 总体中另一部分数值
例:我国规模以上工业增加值的轻重工业构成表(2007年)
时期指标和时点指标的不同特点:
①时期指标的数值是连续计数的;时点指标
的数值则是间断计数的。 ②时期指标具有累加性;时点指标则不具有。 ③时期指标数值的大小受时期长短的制约; 时点指标数值的大小与时点的间隔长短无直
接关系。
二、相对指标
(一)相对指标的概念和作用
相对指标又称相对数,它是两个有联系的指
(二)总量指标的种类
1、总量指标按其反映的时间状况不同,分为时期 指标和时点指标。
•时期指标反映现象在某一时期发展过程的总数量; •时点指标则反映现象在某一时刻上的状况总量。
2、总量指标按计量单位不同,分为实物量指标、 价值量指标和劳动量指标。
•实物量指标是以所反映现象的实物单位为计量单位的总量指标; •价值量指标是以货币为计量单位的总量指标; •劳动量指标是以劳动时间为计量单位的总量指标。
报告期水平/基期水平
数据分布的特征描述
数据分布的特征:
一、集中趋势:反映数据向其中心靠拢或聚集程度; 二、离散趋势;数据远离中心的趋势; 三、偏态和峰态;偏态是对数据分布对称性的度量; 峰度是指数据分布的平峰或尖峰程度(形状)。
数据分布的特征
集中趋势(平均指标) (位置)
离散趋势(变异指标)
(分散程度)
f x x f
事实上比重权数更能够直接表明权数权衡轻重作用的实质
当权数完全相等(f1 =f2 =…= fn)时,加权算术平均数就 成了简单算术平均数。
变量数列的权数有两种形式: 一种是以绝对数表示,称次数或频数; 另一种是以比重表示,称频率。
X X
f
f
用频率计算的公式和直接用次数计算的公式在内 容上是相等的,即
集中趋势指标的分类
数值平均数 算术平均数 调和平均数 几何平均数 位置平均数 众数 中位数及其他分位数
一、算术平均数
算术平均数的基本公式(最基本指标):
变量值总和 算术平均数 变量值个数
注:平均指标和强度相对数的区别 分子和分母在经济内容上有从属关系,即分子数值是各 分母单位特征的总和,两者在总体范围上是一致的。
某一总量指标数值 强度相对数 另一有联系而性质不同 的总量指标数值
例:
表现社会服务能力的强度相对数是用服务单位数与人口比较。 表现现象普遍成都的强度相对数,如人口密度、公路网密度等。
某一主要工业品或农产品的全国产量 人均产量 全国人口数(一般按年初年末人口平均数计算)
某地零售商业机构数 商业网点密度 (正指标) 某地人口数(千人)