第一节 数据集中趋势的测度
2012年经济师测试中级经济基础预习讲义 集中趋势的测度
2012年经济师测试中级经济基础预习讲义集中趋势的测度第二十二章数据特征的测度第一节集中趋势的测度集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
集中趋势的测度,主要包括:位置平均数----众数、中位数等数值平均数----算术平均数和几何平均数等(一)、众数1、涵义:众数是一组数据中出现频数最多的那个数值,用M0表示。
2、用众数反映集中趋势,非常直观,不仅适用于品质数据,也适用于数值型数据。
众数是一个位置代表值,不受极端值的影响,抗干扰性强。
(二)中位数1、涵义:把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数,用Me表示。
中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。
2、中位数计算:根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n为数据的个数,其公式为: n为奇数:中位数位置是,该位置所对应的数值就是中位数数值。
n为偶数:中位数位置是介于和( +1)之间,中位数数值就是所对数值和( +1)所对应数值的算术平均数。
具体计算见教材例题:3、中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数也是一(三)算术平均数1、涵义:算术平均数是全部数据的算术平均,又称均值,用表示。
是集中趋势中最主要的测度值。
主要适用于数值型数据,但不适用于品质数据。
2、计算公式(1)简单算术平均数简单算术平均数主要用于处理未分组的原始数据。
简单算术平均数的计算公式为:(2)加权算术平均数加权算术平均数主要用于处理经分组整理的数据。
加权算术平均数的计算公式为:Xi——各组的组中值fi——各组的频数3、计算和运用算术平均数注意事项:(1)算术平均数同时受到两个因素的影响:各组数值的大小、各组分布频数的多少。
频数在算术平均数中起着权衡轻重的作用。
(2)算术平均数易受极端值的影响。
极端值的出现,会使平均数的真实性受到干扰。
集中趋势的度量
第五章数据分布特征的描述第一节集中趋势指标概述一、集中趋势指标及其特点集中趋势(Central tendency),是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是要寻找数据一般水平的代表值或是心值。
在现象的同质总体中,各个单位的标志值是不尽相同的。
如果我们的目的是要对总体的数量水平有一个概括地、一般地认识,显然不能用某一单位的标志值表示。
统计平均数就是用来反映总体的一般水平和集中趋势的指标。
通俗的理解就是,在不变更总体总量的情况下,对总体内的全部标志值进行“截长补短”,使得总体各单位拥有同一水平的数量表现,这个同一水平的数量表现就是平均数,即集中趋势指标。
统计平均数有两个重要的特点:第一,平均数是一个代表值,表示被研究总体的一般水平。
例如,某企业职工的工资水平有高有低,有的职工月工资1680元,有的职工月工资1900元,有的职工月工资1870元,有的职工月工资2200元,等等。
若根据该企业各个职工月工资额综合计算出职工月平均工资为1860元,那么,1860元就是一个代表值。
它反映了该企业职工月工资的—般水平。
第二,平均数把被研究总体各单位的标志值的数量差异抽象化了。
例如,某企业职工的月平均工资为1860元,但是各个职工的工资水平有高有低,高于1860元的工资和低于1860元的工资互相抵消了,从而得出平均工资1860元。
由此可见,平均工资(1860元)已把各职工月工资水平的差别抽象化了。
二、集中趋势指标的作用集中趋势指标——统计平均数,在统计研究中被广泛应用,平均数的作用可以归纳为以下几点:1.利用平均数对比不同总体的一般水平。
平均数可以用来对同类现象在各单位、各部门、各地区之间进行比较,以说明生产水平的高低或经济效果的好坏。
例如,要比较不同的生产企业生产水平的好坏,仅对比企业的产品总产量是不足以说明问题的,因为产品总产量受到企业规模大小的影响。
要比较,需要计算各企业生产人员的平均产品产量,即劳动生产率,并分析不同的生产条件,才能做出正确的判断。
中级经济师-经济基础知识-基础练习题-第二十四章描述统计-一、集中趋势的测度
中级经济师-经济基础知识-基础练习题-第二十四章描述统计-一、集中趋势的测度[单选题]1.某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人(江南博哥),其中位数为()。
A.34B.35C.36D.37正确答案:B参考解析:此题考查集中趋势测度值,已排序,居中的是34人36人,则中位数是(34+36)÷2=35人。
[单选题]5.下面一组数据为9个家庭在2017年的人均月收入数据(单位:元):750、780、850、960、1080、1250、1500、1650、2000,则中位数为()元,均值为()元。
A.750,1250B.1080,1202.2C.1500,1080D.2000,1500正确答案:B参考解析:本题考查集中趋势的测度。
先把上述数据按顺序排列,由于有9个数据,是奇数,中位数的位置为(9+1)/2=5,中位数是1080元。
均值=(750+780+850+960+1080+1250+1500+1650+2000)/9=1202.2(元)。
[单选题]6.某直辖市下辖8个县,每个县的面积如下(单位:平方公里):1455、2019、912、1016、1352、1400、1792、2000,则该直辖市下辖县面积的中位数是()。
A.1400B.1455C.1427.5D.1428正确答案:C参考解析:本题考查中位数的具体应用。
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫作中位数。
Me=(1400+1455)÷2=1427.5[单选题]7.下面是抽样调查的10个学生的考试分数等级,分别为:不及格,中,中,良,良,良,良,优,优,优。
这10个学生分数的众数为()。
A.优B.中C.良D.不及格正确答案:C参考解析:此题考查集中趋势测度值中的众数。
众数是指一组数据中出现次数(频数)最多的变量值,题目中良的出现次数最多,所以应为良。
数据分布特征的描述
该项活动中,每月都有数据统计及分析以用来进 行该项活动旳调整与实施。
如:有一组有关病人进入“救济”活动旳时间长 度旳数据:
67个样本:时间长度从1天到185天。
除了对该组数据进行频数方面旳描述和分析外, 下面旳统计措施在描述数据分布特征及分析方面也很 主要:
均值(mean):35.7天; 中位数(median):17天; 众数(Mode):1天
X Me Mo 当分布右偏时(阐明存在极端大旳值)
X Me Mo
3、在偏斜度适度旳情况下,不论是左偏还是右偏,中位数
与算术平均数之差约等于众数与算术平均数之差旳1/3,即有如
下经验公式:
Me
X
1 3 (M O
X)
众数、中位数和均值旳应用场合
• 众数、中位数和均值都是对数据集中趋势旳测度,
1、均值由全部数据计算,包括了全部数据旳信息,具有良 好旳数学性质,当数据接近对称分布时,具有很好旳代表性; 但对于偏态分布,其代表性较差。
Graduates Monthly Graduates Monthly Graduates Monthly
Salary($)
Salary($)
Salary($)
1
2350
5
2255
9
2440
2
2450
6
2210
10
2852
3
2550
7
2390
11
2428
4
2380
8
2630
12
2380
未分组时旳算术平均值为:2440
一、均值(Mean)
均值就是一组数据旳平均值(average value),用来测 度中心位置(central location)。
中级经济师-经济基础、第二十三章描述统计-第一节集中趋势的测度及第二节离散程度的测度(一)
第二十三章描述统计【本章内容讲解】对统计数据特征的测度,主要从三个方面进行:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。
第一节、集中趋势的测度【本节知识点】1.均值的计算及适用范围2.中位数的计算及适用范围3.众数的含义及适用范围【本节内容精讲】集中趋势是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
集中趋势均值也就是平均数,就是数据组中所有数值的总和除以该组数值的个数。
【提示1】它是集中趋势中最主要的测度值,是一组数据的重心所在,解释了一组数据的平均水平。
【提示2】均值主要适用于数值型数据,但不适用于分类数据和顺序数据。
【提示3】均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。
【例题1:2014年单选题】在某城市2014年4月空气质量检测结果中,随机抽取6天的质量指数进行分析。
样本数据分别是:30、40、50、60、80和100,这组数据的平均数是()。
A. 50B. 55C. 60D. 70【答案】C【解析】均值即位平均数,本题均值=(30+40+50+60+80+100)/6=60【知识点二】中位数1.含义:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数。
中位数将数据分为两部分,其中一半的数据小于中位数,另一半数据大于中位数。
2.计算: 根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,n 为数据的个数,其公式为: (1)n 为奇数:中位数位置是21 n ,该位置所对应的数值就是中位数数值。
(2)n 为偶数:中位数位置是介于2n 和(2n +1)之间,中位数就是这两个位置对应的数据的均值。
3.适用:中位数主要用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强。
第四章 综合指标(下)(平均指标和变异指标)
x) 0
③、各变量值与算术平均数的离差平方和最小
2 ( x x ) min i i 1 n
2、调和平均数 (倒数平均数 Harmonic mean) (1)、定义:调和平均数是变量值倒数的算术平均数 的倒数,又称倒数平均数。 从数学意义上来说,是一种独立的平均指标;在统计 实践中,大多数情况下是将调和平均数作为算术平均数 的变形来使用的。
(三)、平均指标的作用
1、用于不同总体的同类现象的对比分析; 2、作为判断事物的标准和制定生产定额的依据;
3、利用平均指标进行推算和预测,深入统计研究分析 。
二、数值平均数与位置平均数
(一)、数值平均数
1、算术平均数 (1)、算术平均数的基本形式 定义:总体各单位的标志总量与其相对应的 单位总数之比,是集中趋势最重要的一种测度值。 算术平均数=总体标志总量/总体单位总量
(2)、是非标志的平均数
是非标志:将总体全部单位划分为具有某种特征和 不具有某种特征两组的分组标志。
如:产品质量分“合格”与“不合格”;性别分 “男”和“女”等
其标志表现只有“是”与“非”两种结果,将其数 量化,通常以“1”代表“是”,以“0”代表“非”。 设全部总体单位数为N,“是”的单位数为“N1”, “非”的单位数为“N0”。则N=N1+N0。
440 1300 900 2640
xf 2640 X 66 (件) f 40
以组中值作为各组标志值的代表值,是假定各组 变量值在组内分布是均匀的,组中值等于组平均数,而 实际上不一定如此。因此,用组中值计算的算术平均数 是一个近似值,但此平均数对总体仍然具有足够的代表 性,实际工作中广泛运用。
一、平均指标的含义、特点和作用
(一)、平均指标的含义
中级经济师考试辅导经济基础知识24
第四部分统计——第二十四章描述统计考情分析:年份单选题多选题合计2016年2题2分2题4分6分2015年4题4分2题4分8分本章重点:1.集中趋势的测度指标:均值、中位数和众数。
2.离散程度的测度指标:方差、标准差和离散系数。
3.分布形态的测度:偏态系数、标准分数。
4.变量相关关系的分类、散点图、相关系数。
知识点一:集中趋势的测度1.均值。
均值也叫做平均数,就是数据组中所有数值的总和除以该组数值的个数。
设一组数据为X1,X2,…,X n,平均数`X的计算公式为:【注意1】:均值主要适用于数值型数据,但不适用于分类和顺序数据。
【注意2】:均值容易受到极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。
2.中位数。
把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用M e表示:【注意1】:中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。
【注意2】:中位数的优点是不受极端值的影响,抗干扰性强。
3.众数:指一组数据中出现次数(频数)最多的变量值。
适用于描述分类数据和顺序数据,不适用于定量数据。
【注意】:有些情况下可能出现双众数、多众数或者没有众数,难以描述数据的集中趋势。
总结:均值VS中位数VS众数:指标适用特点均值定量变量利用全部信息,受极端值影响如有明显极端值,则代表性差中位数顺序变量和定量变量没有充分利用全部信息,不受极端值影响适用于分布不对称的数据众数分类变量和顺序变量没有充分利用全部信息,不受极端值影响适用于分布明显呈偏态的数据【例题·单选题】在对数据集中趋势的测度中,适用于偏斜分布的数值型数据的是()。
A.中位数B.均值C.标准差D.方差『正确答案』A『答案解析』本题考查中位数。
中位数主要适用于顺序数据,也适用于数值型数据,但不适用于分类数据,中位数不受极端值的影响,抗干扰性强,尤其适用于收入这类偏斜分布的数值型数据。
1统计学-数据的描述性分析
③ 对某些不具有数学特点或不能用数字测定的 现象,可用中位数求其一般水平。
负偏 注: (1)中位数总是介于众数和平均数之间.
正偏
(2) 皮尔逊经验法则 分布在轻微偏斜的情况下,众数、中位数和算术平均 数数量关系的经验公式为:
x M o 3( x M e )
根据卡尔· 皮尔逊经验公式,还可以推算出:
●
(1).各变量值与均值的离差之和等于零.
x
n i =1
n i
i
x =0
(2).各变量值与均值的离差平方和最小.
x
i =1
x = min
2
△ 算术平均数的特点
算术平均数适合用代数方法运算,因此运用 比较广泛; 易受极端变量值的影响,使 X 的代表性变小; 受极大值的影响大于受极小值的影响; 当组距数列为开口组时,由于组中值不易确 定,使 X 的代表性也不很可靠;同时要求各单位 标志值在组内是均匀分布的,此时各组的平均数正好 等于它的组中值。故用组中值计算得出来的平均数只 能是一个近似值。
总体均值常用X 或 表示,样本均值常用 x 表示,样本均值 的计算公式: 简单算术平均数:
x1 x2 xn x n n
x
x
i 1
n
i
加权算术平均数:
x
i 1 n
n
i
fi
i
f
权数的意义和作用
• 权数:各组次数(频数)的大小所对应的标志值对平均数 的影响具有权衡轻重的作用. • 当各组的次数都相同时,即当 f1 =f 2 =f3 = =f n 时: 加权算术平均数就等于简单算术平均数.
2.中位数(Median)
中位数是一组数据按一定顺序排列后,处于中间位置 上的变量
统计学基础知识之数据集中趋势的描述
统计学基础知识之数据集中趋势的描述统计学基础知识之数据集中趋势的描述在社会和经济领域中有许多实际发生的数据,因为各种偶然因素的影响,这些数据看起来往往杂乱无章。
但是,如果对这些无序的数据进行整理和归纳,就可以发现有一种必然的因素在起作用,这种因素就是社会和经济领域中内在的变化趋势。
通过这种趋势的研究可以了解事物的本质特征,可以掌握事物发展变化的规律。
这种趋势在统计学中就被称为集中趋势。
下面是yjbys店铺为大家带来的关于数据集中趋势的描述的知识,欢迎阅读。
数据集中趋势的描述算术平均数(arithmetic mean),又称均值,分为简单算术平均数、加权算术平均数。
它主要适用于数值型数据,不适用于品质数据。
就是将一组数据的和除以数据的个数。
计算公式:1. 简单算术平均,适用:主要用于未分组的原始数据。
设一组数据为X1,X2,...,Xn,则简单的算术平均数的计算公式为:2. 加权算术平均,适用:主要用于处理经分组整理的数据。
设原始数据为被分成K组,各组的组中的值为X1,X2,...,Xk,各组的频数分别为f1,f2,...,fk,则加权算术平均数为:应用问题:均值是实际中应用最广泛的集中趋势测度值,样本均值受样本数据影响最小,具有一定的稳定性,因此,在抽样推断中均值是用于推断总体的一个最重要指标,但还需要注意以下几个问题:(1)当数据中有极大值或极小值存在时,均值会受到很大影响,其结果会掩盖数据的真实特征,使均值失去代表性。
(2)使用分组数据计算总平均数时,由于各组频率对平均数的影响,在对总平均数进行对比时,要注意结合组平均数补充说明。
几何平均数(geometric mean),是指n个观察值连乘积的n次方根。
几何平均数主要用于各种比率的平均,尤其在计算动态比率的平均时特别适合。
计算公式:设一组数据为X1,X2,…,Xn,且均大于0,则几何平均数Xg 为:应用举例:某厂流水作业的装配线有4道工序,各工序的产品合格率分别是85%,97%,94%,92%,求4道工序平均产品合格率。
第3章集中趋势和离散趋势lily
例
投资银行某笔投资的年利率是按复利计算的,25年的年利 率分配是:有1年为3%,有4年为5%,有8年为8%,有10年为10%, 有2年为15%,求平均年利率。
利率(%) 3 5 8 10 15 合计 年数 1 4 8 10 2 25
平均本利率 1.031.05 1.08 1.1 1.15
• 例如:某企业共有8名高层管理人员,其月 工资分别为(单位:元):2000、2050、 2150、2180、2200、2200、2500、2800,计 算该企业8位高层管理人员的平均工资。
平均工资 2000 2050 2150 2180 2200 2200 2500 2800 8 2260 (元)
• 一般情况下,几何平均数主要用于计算: • (1)流水生产线产品的平均合格率; • (2)按复利计息时,计算若干年的平 均利率; • (3)一定时期现象的平均发展速度。
五、中位数
Me
1.概念: 将总体中各单位标志值按大小顺序排列, 居于中间位置的那个标志值就是中位数。
2.中位数的计算方法
① 由未分组资料确定中位数
实际产值总额 (2)平均计划完成程度 计划产值总额 (各企业实际产值) 各企业实际产值 ( 各企业计划完成程度) 1140 13440 2300 1140 13440 2300 95% 105% 115% 16880 105.5% 16000
练习题
• 1、某企业职工工资资料如下表所示
中位数的位置 n1 2 ( n为总体单位数)
⑴ n为奇数时,则居于中间位置的那个标志值就是中位数。
例
有五个工人生产某产品件数,按序排列如下: 20,23,26,29,30 n 1 5 1 3 2 2 即,第3位工人日产26件产品为中位数:M e 26(件) 中位数位置
新编统计学原理 第三章 集中趋势和离散趋势
(四) 中位数 将总体各单位的某一变量值按大小顺序排列, 位于中间位置上的变量值即为中位数。显然, 中位数将全部数据等分成两部分:一部分数据 比中位数大,一部分数据比中位数小。从这个 意义上说,中位数以其居中的位置,代表了经 济现象某一方面的一般水平。 依据资料的不同,中位数的计算,可以有两种 不同的方法。
3. 加权算术平均数与简单算术平均数的关系 简单算术平均数的大小只与变量值的大小有 关,加权算术平均数的大小不仅与各组变量 值大小有关,而且受各组变量值出现的次数 (权数)大小的影响。权数愈大,其对应的 变量值对算术平均数的影响愈大;反之,则 愈小,权数的大小对算术平均数的大小起着 权衡轻重的作用。只有当各组的权数完全相 等时,加权算术平均数才等于简单算术平均 数。
4. 算术平均数的数学性质 (1)各变量值与其算术平均数的离差之和等 于零,即 ∑(x-X)=0 (2)各变量值与其算术平均数的离差平方之 和为最小,即 ∑(x-X)^2为最小值
(二) 调和平均数 调和平均数是根据变量值倒数计算的一种算 术平均数,也称倒数平均数。调和平均数 根据资料的不同,分为简单调和平均数和 加权调和平均数。
式中Xh表示加权调和平均数; x表示各组变量值; f表示各组变量值所出现的次数; n表示各组变量值次数之和。
(三) 几何平均数 几何平均数是n个变量值连乘积的n次方根,根 据所依据的资料不同,也可分为简单几何平 均数和加权几何平均数。计算公式为: 1.简单几何平均数 n n x g x 1 x 2 xn x 式中 xg 表示几何平均数; x表示各变量值; n表示变量值个数; π 表示连乘符号。
1. 简单调和平均数 简单调和平均数往往是根据未分组资料计算 的。其公式为:
xh 1
第三章+数据分布特征的描述(教案)
第三章+数据分布特征的描述(教案)第三章数据分布特征的描述(一)教学目的通过本章的自学,并使同学们正确理解各种指标的概念及计算方法,学会运用适当的统计数据指标对数据的原产特征展开分析表明。
(二)基本要求并使学生熟练掌握数据分布特征的叙述方法。
(三)教学要点1、集中趋势的测度指标及其计算方法;2、离散趋势的测度指标及其计算方法;3、总体分布的偏度与峰度的测度。
(四)教学时数9――10课时(五)学习内容本章共分三节:第一节数据分布分散趋势的测量一、定类数据集中趋势的测度――众数(mode)(一)概念要点众数就是指一组数据中发生次数最少的变量值,用mo表示。
从变量分布的角度看,众数就是具备显著分散趋势点的数值,一组数据分布的最高峰点所对应的数值即为为众数。
当然,如果数据的原产没显著的分散趋势或最高峰点,众数也可以不存有;如果存有多个高峰点,也就存有多个众数。
1.集中趋势的测度值之一2.出现次数最多的变量值3.不受极端值的影响4.可能将没众数或存有几个众数5.主要用于定类数据,也可用于定序数据和数值型数据众数的不唯一性:并无众数原始数据:10591268一个众数原始数据:659855多于一个众数原始数据:252828364242(二)众数的排序根据未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即为众数。
对于组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关系可作如下的理解:设众数组的频数为fm,众数前一组的频数为f?1,众数后一组的频数为f?1。
当众数相连两组的频数成正比时,即f?1=f?1,众数组的组中值即为众数;当众数组的前一组的频数多于众数组后一组的频数时,即f?1>f?1,则众数可以向其前一组依靠,众数大于其组中值;当众数组后一组的频数多于众数组前一组的频数时,即f?1<f?1,则众数可以向其后一组依靠,1众数大于其组中值。
基于这种思路,借助几何图形而求出的分组数据众数的计算公式如下:下限公式:mo?l?下限公式:fm?f?1??d?l?1?d(fm?f?1)?(fm?f?1)?1??2(3.1)fm?f?1??d?u?2?d(fm?f?1)?(fm?f?1)?1??2(3.2)mo?u?式中:l表示众数所在组的下限;u表示众数所在组的上限;d表示众数所在组的组距。
集中趋势和离中趋势的度量
第五章数据分布特征的描述第一节集中趋势指标概述一、集中趋势指标及其特点集中趋势(Central tendency),是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是要寻找数据一般水平的代表值或是心值。
在现象的同质总体中,各个单位的标志值是不尽相同的。
如果我们的目的是要对总体的数量水平有一个概括地、一般地认识,显然不能用某一单位的标志值表示。
统计平均数就是用来反映总体的一般水平和集中趋势的指标。
通俗的理解就是,在不变更总体总量的情况下,对总体内的全部标志值进行“截长补短”,使得总体各单位拥有同一水平的数量表现,这个同一水平的数量表现就是平均数,即集中趋势指标。
统计平均数有两个重要的特点:第一,平均数是一个代表值,表示被研究总体的一般水平。
例如,某企业职工的工资水平有高有低,有的职工月工资1680元,有的职工月工资1900元,有的职工月工资1870元,有的职工月工资2200元,等等。
若根据该企业各个职工月工资额综合计算出职工月平均工资为1860元,那么,1860元就是一个代表值。
它反映了该企业职工月工资的—般水平。
第二,平均数把被研究总体各单位的标志值的数量差异抽象化了。
例如,某企业职工的月平均工资为1860元,但是各个职工的工资水平有高有低,高于1860元的工资和低于1860元的工资互相抵消了,从而得出平均工资1860元。
由此可见,平均工资(1860元)已把各职工月工资水平的差别抽象化了。
二、集中趋势指标的作用集中趋势指标——统计平均数,在统计研究中被广泛应用,平均数的作用可以归纳为以下几点:1.利用平均数对比不同总体的一般水平。
平均数可以用来对同类现象在各单位、各部门、各地区之间进行比较,以说明生产水平的高低或经济效果的好坏。
例如,要比较不同的生产企业生产水平的好坏,仅对比企业的产品总产量是不足以说明问题的,因为产品总产量受到企业规模大小的影响。
要比较,需要计算各企业生产人员的平均产品产量,即劳动生产率,并分析不同的生产条件,才能做出正确的判断。
统计学导论曾五一第三章数据分布特征的描述
统计学导论曾五⼀第三章数据分布特征的描述第三章数据分布特征的描述第⼀节统计变量集中趋势的测定⼀测定集中趋势的指标及其作⽤集中趋势(Central tendency)较⼤和较⼩的观测值出现的频率⽐较低,⼤多数观测值密集分布在中⼼附近,使得全部数据呈现出向中⼼聚集或靠拢的态势。
测度集中趋势的指标有两⼤类:数值平均数——是根据全部数据计算得到的代表值,主要有算术平均数、调和平均数及⼏何平均数;位置代表值——根据数据所处位置直接观察或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数。
1.反映变量分布的集中趋势和⼀般⽔平。
如⽤平均⼯资了解职⼯⼯资分布的中⼼,反映职⼯⼯资的⼀般⽔平。
2.可⽤来⽐较同⼀现象在不同空间或不同阶段的发展⽔平。
不受总体规模⼤⼩的影响;在⼀定程度上使偶然因素的影响相互抵消。
3.可⽤来分析现象之间的依存关系。
如研究劳动者的⽂化程度与收⼊的关系。
4.平均指标也是统计推断中的⼀个重要统计量,是进⾏统计推断的基础。
⼆数值平均数(⼀)算术平均数(均值)⼀组数据的总和除以这组数据的项数所得的结果;最常⽤的数值平均数。
1.简单算术平均数把每项数据直接加总后除以它们的项数。
通常⽤于对未分组的数据计算算术平均数。
计算公式:2.加权算术平均数加权算术平均数的计算公式:加权—为了体现各变量值轻重不同的影响作⽤,对各个变量值赋予不尽相同的权数(fi )。
权数(fi ,也称权重)权数——指在计算总体平均数或综合⽔平的过程中对各个数据起着权衡轻重作⽤的变量。
可以是绝对数形式,也可以是⽐重形式(如频率)来表⽰。
事实上⽐重权数更能够直接表明权数的权衡轻重作⽤的实质。
当权数完全相等(f1 =f2 =…= fn)时,加权算术平均数就成了简单算术平均数。
3.由组距数列计算算术平均数各组变量值⽤组中值来代表。
假定条件是各组内数据呈均匀分布或对称分布。
计算结果是近似值。
4.对相对数求算术平均数由于各个相对数的对⽐基础不同,采⽤简单算术平均通常不合理,需要加权。
中级经济基础辅导:集中趋势的测度
众数:⼀组数据中出现次数最多的变量值;它是⼀个位置代表值,特点是不受数据中极端值的影响。
众数不仅适⽤于品质数据,也适⽤于数值型数据。
中位数:是⼀组数据按⼀定顺序排序后,处于中间位置上的数值。
当数值个数为奇数时,取中间位置的数;当数值个数为偶数时,取中间位置两个数的均值。
它将全部数据等分成两部分,也是⼀个位置代表值,其特点是不受极端值的影响,在研究收⼊分配时很有⽤。
中位数主要⽤于顺序数据,也适⽤于数值型数据,但不适⽤于分类数据。
算术平均数:也称均值,是全部数据的算术平均。
它是集中趋势的最主要测度值。
简单均值:等于所有数值相加之和 / 数值个数;加权均值:(各组组中值*各组频数) / 频数之和。
均值是⼀组数据的重⼼所在,是数据误差相互抵消后的必然结果,反映出事物必然性的数量特征。
其缺点是容易受极端值的影响
⼏何平均数:将⼀组中n个数据连乘后再开n次⽅。
是适⽤于特殊数据的⼀种平均数,主要⽤于计算⽐率或速度的平均。
实践中,主要⽤于计算社会经济现象的平均发展速度。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.5 1.0 1.8 合计
某餐馆蔬菜采购情况
采购金额(元) 200 400 150 750
200 400 150 750 1.15(元/千克) 200 400 150 650 1.5 1.0 1.8
蔬菜价格(元/千克)
解:
蔬菜的平均采购价格
互动地带
4-13
第一节
xw w x w w
或
xw w x x w w
4-10
例4.5 某公司15个销售网点销售年度计划完成 情况分布如表4.5所示,试求公司平均销售计划完 成程度。
表4.5
计划完成程度(%) 95-100 100-110 110-120 合计
某公司年度销售计划分布表
4-15
第一节
f
数据集中趋势的测度
f f
x
1. 唯一众数 2. 复众数
x
3. 无众数
x
图4.1 确定众数的三种情况
在组距数列中,由于原始数据的信息丢失较多,由组距数列计算众 数的取值与实际值的差距可能是很大的。
4-16
第一节
数据集中趋势的测度
一 、中位数(median)
也叫中数或中值,是变量值的排序中位置居中的数 值。 中位数把全部数列分成了两部分,每一部分都包含了 50%的数据,其中一部分比中位数小,另一部分比中位 数大。 例如,在处理快艇的5次实验数据中,得到最大速度 值(单位:m/s)的排序结果为:27 30 31 33 35 。显然,31位于这5个数据排位的中间,它就是快艇 最大时速的中位数。 测度中位数的前提条件是数据必须能够排序大小 。因此, 定类数据不能计算中位数。 对一个特定的数列,中位数是必然存在的唯一确定值。
组中值 (%) 95 105 115 — 网点数 (个) 5 8 2 10 计划销售额 (万元) 1000 8000 1000 145
解:计划完成程度乘以计划销售额等于实际销售额,并 能汇总求和,得到公司实际销售总额。因此,计划销售额指 标应当是我们所要确定的权数w,代入公式计算如下:
xw 95% 1000 105% 8000 115% 1000 10500 105(%) 1000 8000 1000 10000 w
表4.8 某市50户居民消费品支出情况累计分布表
频数(户) 5 1 8 10 12 7 4 3 50 以下累计频数(户) 5 6 14 24 36 43 47 50 — 按户消费品支出分组(元) 1600~1800 1800~2000 2000~2200 2200~2400 2400~2600 2600~2800 2800~3000 3000以上 合计
总体或样本某一标志总 量 算术平均值 总体或样本容量
4-2
第一节
数据集中趋势的测度
x
i 1 N
由原始数据计算算术平均值:简单算术平均法
x1 x 2 x3 x N N
i
或
N
i x1 x 2 x3 x n x i 1 n n 表示总体均值;表示样本算术平均值;总体 x 式中,
31 34 29 32 35 38 34 30 29 32 31 26 381 31.75(分钟 ) 12 12
互动地带
4-4
第一节
数据集中趋势的测度
x
i 1
由单值式变量数列计算算术平均值:加权算术 平均法 K
x1 f 1 x 2 f 2 x K f K f1 f 2 f K
第四章 数据分布特征的测度
学习目的: 熟悉数据集中趋势测度的主要指标的含义和应 用条件,熟练掌握算术平均值的计算方法; 熟悉数据离散程度主要测度指标的含义,熟练 掌握标准差和变异系数的计算和应用; 了解数据的偏态和峰度的含义及其测度方法。
4-1
第一节
数据集中趋势的测度
数据的集中趋势(central tendency) 是指某一总体或样本的数据向某一中心值集 中或靠拢的趋势。 一 、算术平均值(arithmetical mean) 也叫算术平均数,简称平均数、均值或均数 (mean),是指总体或样本中平均每一个体的 某一标志数值,因而表现为总体或样本的某一 标志总量与总体或样本的容量的比值,它的基 本计算公式如下:
平均零件加工合格率 4 95% 97% 96% 98%
4-14
96.5%互动地带
第一节
数据集中趋势的测度
一 、众数(mode) 也叫众值,是在数据集中出现频数最多或频率 最大的数据值。 众数的测度适用于任何种类(分类数据、数值数据) 的数据。 众数的大小不受极端值大小的影响。 对于原始数据,用定义求众数 : 1.编制单值式变量数列 2.频数最大的组的变量值即众数 对于一个数据集,众数的测算结果会出现三种情 况:唯一一个众数;多个众数;无众数。
4-11
第一节
数据集中趋势的测度
调和平均:算术平均的另一种形式 当已知各组总量指标C(=xf,或=xw)和变量x时, 可用调和平均法计算分组数据的均值:
xw c w c
或
x
xw c w c x
x
4-12
例4.6 某餐馆采购员,一天内在三个集市采购的同 一种蔬菜的数据如表 4.6 所示,求该采购员当天采 购的这种蔬菜的平均价格。
x
n
容量为N;样本容量为 n。
4-3
第一节
数据集中趋势的测度
例4.1 某工厂加工某种零件的12名工人完成工作所需的时 间(计量单位:分钟)为 31 34 29 32 35 38 34 30 29 32 31 26 试计算这组数据平均数。 解:这是一组由12名工人所组成的总体数据,它的平均 数计算如下:
计算午餐的近似平均账单金额如下:
4-9
解:首先,计算各组的组中值,见表中内容。然后,
x
m
i 1
k
i
fi
n
2080 104(元) 20
第一节
数据集中趋势的测度
权数含义的推广 在组距数列中只要一个指标与变量值的乘积等 于组的总量指标,而且各组的总量指标能够加总求 和,那么这个指标就可以作为权数计算分组数据的 算术平均值。因此,用广义权数计算均值的公式为:
2710、2755、2850 2880、2880、2890 2920、2940、2950 3050、3130、3325
最小值
箱形图(box plot) 是用图示形式表达五数概括法的图形 。绘制方法是,首先找出最 小值、下四分位数、中位数、上四分位数和最大值5个数值在坐标上 的位置,然后连接相邻的两个四分位数画出两个箱子,再将两个极 端值与两个箱子连接。
起重吨位分组的数据如表4.1所示。求这10台起重 机械的平均吨位。
表4.1
起重机吨位(吨) x 40 25 10 5 合计
某货场起重机械分布表
频数(台) f 1 2 4 3 10 起重总量(吨) xf 40 50 40 15 145
解:这10台起重机械的平均吨位的计算如下:
40 1 25 2 10 4 5 3 145 14.5(吨) 1 2 4 3 10
i
3. 确定或计算各分位数的值。如果 i 不是整数,则向上取整,用比 i 大的下一个整数代表第 p 个分位数;如果 i 是整数,则第 p 个分位 数是 i 第项和第 (i 1) 项数值的算术平均值。
4-20
k
n
p 1,2,3,, k 1
第一节
五数概括法
数据集中趋势的测度
利用3个四分位数再加上最大值和最小值2个总共5个数值就能够 简单地概括出一组数据分布的特征,用于分析数据的方法 。 例4.10 某行业业务经理每月起薪的抽样调查资料的排序如下:(单位: 元)2710、2755、2850、2880、2880、2890、2920、2940、 2950、3050、3130、3325 。 解:首先把数据按照由小到大进行排序,再确定最小值、下四分位数、 中位数、上四分位数和最大值,如下所示:
1 (xn xn ) 1 2 2 2
f
2
ቤተ መጻሕፍቲ ባይዱ
位次上的变量值所在的组 )。
f
4-18
Me L
2
CF f
d
例4.8 某月对某市50户居民抽样调查得到的消费品支出资料如表 4.8所示。试计算这50户被调查居民家庭消费品支出额的中位数。 解:计算以下累计频率,中位数的位次为 50/2 = 25。2400~2600 组为中位数组。L=2400元,d =2600元-2400元=200元, f =12户,累 计至中位数组下限的频数CF=24户 。代入公式计算中位数为:
推论:对于定序数据,经排序后用1、2、3…或 0、1、2…等定义数据值,可计算定序数据的均值. 互动地带 4-7
x= p
第一节
数据集中趋势的测度
由组距数列计算算术平均值 :加权算术平均法 K K mi f i mi f i K f i 1 i 1 K mi i N N i 1 f i i 1 或 m f m f f x m n n f x i 是第 i 组的组中值; f i 是 i 组的频数,称为权 式中, k 数;是样本的分组数; K是总体的分组数 。 由组距数列计算的算术平均值是一个近似值。
k k i 1 k i i i 1 i i k i i 1 i i 1 i
4-8
例4.3 某餐馆午餐账单金额的频数分布见表 4.3所示,试计算该餐馆午餐的平均账单金额。
表4.3 账单金额 (元) 70以下 70-90 90-110 110-130 130-150 150以上 合计 某餐馆午餐账单金额的频数分布 组中值m (元) 60 80 100 120 140 160 — 频数 f (笔) 2 6 4 4 2 2 20 收入 m f (元) 120 480 400 480 280 320 2080