03第三章 统计分布的数值特征
第三章 统计数据分布特征的描述
2 .根据组距式数列确定众数
例 3‐12 根据表3‐4 的资料计算众数 。
第一步 :确定众数组 。表 3‐4 中数据显 示 ,月工资在 800 — 1000 元这一组的职 工人数最多 ,为 70 人 ,因此 ,这一组即 第二组为众数组 。
第二步 :将相关数据代入下限公式或上限 公式进行计算 。
四 、离散系数
计算变异指标的相对指标 ——— 离散 系数 ,又称为变异系数 ,通常用 V 表示 , 它是极差 、平均差 、标准差与其平均指 标对比的结果 ,分别称为极差系数 、平 均差系数和标准差系数 ,其计算公式为
例 3‐17 有甲、乙两个村子,每村各户年 收入情况如表3‐9 所示 ,计算两村村民年 收入的平均数和标准差系数 。
70 ,但极差不同 ,甲数列 R = 4 ,乙数 列 R = 40
二 、平均差
平均差是指总体所有单位的标志值与 其算术平均数的离差绝对值的算术平均数 , 通常用 A .D表示 。
(一) 简单式平均差
例 3‐14 某车间有两个生产小组,每组5 个工人,每人日产量(件)如表3‐6 所 示 ,试计算其平均差 。
按众数的下限公式计算 :
一 、极差
极差又称为全距 ,是总体中或分布中 最大的标志值与最小的标志值之差 ,一般
用 R来表示 。其计算公式为
R = x max - x min
例 3‐13 有甲、乙两个数列: 甲数列 68 69 70 71 72 , x = 70 ,R = 4 乙数列 50 60 70 80 90 , x = 70 ,R = 40 由结果可知 ,这两个数列的平均数均为
根据式(3‐10) 可确定中位数位置 :
(二)众数
1 .根据单项式数列确定众数
第三章 统计数据分布的特征
12.42 6.60
82.2
调和平均数
各变量值的倒数的平均数。又称倒数平均 数。 n x 1 简单调和平均数
x
例题:书77页例3-2 加权调和平均数 x m m为权数 例题:见书78页例
m x
几何平均数
用于计算比率或速度的平均。 在计算社会经济现象时应用较多。 公式: N
i i 1
n
2
样本方差用(n-1)去除,从数学角度看是
因为它是总体方差σ2的无偏估计量。
n 1
k
分组数据
2
i 1
K
( X i X )2 fi
s2
i 1
( xi x ) 2 f i
k
f
i 1
K
i
f
i 1
i
1
标准差(例子)
某工会随机调查了5名工人上月的加班时间 如下表,平均加班时间为13小时。计算数 据的标准差。
1、集中趋势分析 2、离中趋势分析 3、分布偏态与峰度的测度
数据描述的数值方法
数据描述的数值方法
集中趋势
均 值
离散程度
极差 四分位距
分布的形状
偏 态 峰 度
中位数 众 数
方差和标准差 离散系数
2.2 分布集中趋势的测度
众数 中位数 分位数 均值 几何平均数 切尾均值
集中趋势
集中趋势:一组数据向其中 心值靠拢的倾向和程度。 集中趋势测度:寻找数据水 平的代表值或中心值。
特点:
反映了相对于均值的相对离散程度; 可用于比较计量单位不同的数据的离散程度; 计量单位相同时,如果两组数据的均值相差悬殊, 离散系数可能比标准差等绝对指标更有意义。
第3章 统计分布的数值特征
对一个分配数列求众数是有一定条件的。如果 一个分配数列没有一个明显的集中趋势,就不 存在众数。但如果一个分配数列存在两个相对 集中趋势,则这个分配数列就有两个众数。
众数
(不唯一性)
无众数(各数出现次数均为1) 原始数据: 10 5 9 12 6
8
一个众数(5)
原始数据: 6 5 9 8 5 5
多于一个众数(28、42) 原始数据: 25 28 28 36 42 42
计算加权算术平均数时,需要注意两个问题:
(1)权数的意义和作用。各组次数的大小所对应的标志 值对平均数的影响具有权衡轻重的作用。权数的权衡 轻重作用,可以直接从各组频率上观察到。频率越大, 该标志值记入平均数的份额也越大,对平均数的影响 也越大;这就是权数的权衡轻重作用的实质。 次数也有不起权数作用的时候。这就是当各组的次数 都相同时,即:
例:某水泥生产企业1995年水泥产量 100万吨,1996年比1995年增长9%, 1997年比1996年增长16%,1998年比 1997年增长20%,求各年平均增长率。 解:
G n x1 x2 ... xn 3 109% 116% 120% 114.91%
114.91%-100%=14.91%为各年平均增 长率
二、数值平均数
(一)算术平均数
算术平均数的统计定义公式是:总体单 位的标志值总量除以总体单位数,表明总体单 位标志值的平均水平。用公式表示如下:
算术平均数要求总体标志总量和总体单位 数相适应。即总体标志总量必须是总体各单位 标志值的总和。计算算术平均数有简单算术平 均数和加权算术平均数两种形式。
1.简单算术平均数
1.由单项式分配数列确定众数。出现次数最多 的标志值就是众数。(例3-6)
第三章统计分布的数值特征
=1.02439元/斤
3*(1/1.5+1/0.7+1/1.2)
某超市香蕉,梨,苹果某日的销售价格见表
水果 销售 销售额 名称 价格
H
香蕉 1.5 梨 0.7 苹果 1.2 合计 -
4500 3500 7200 15 200
= 销售总额 ( m) 销售量 ( m) x
=
15200 14000
= 1.0857 (元 斤)
样,调和平均数有简单调和平均数和加权调和平均数两 种。
1、简单调和平均数
计算公式:
H=
N
1+ 1 +
x1 x2
=N
+1 xn
1 xi
应用条件:资料未分组,各个变量值次数都是1。
例:一个人步行两里,走第一里时速度为每小时
10里,走第二里时为每小时20里,则平均速度为:
2、加权调和平均数
计算公式:
H
=
8%、第6年至第8年为10%、第9年至第10年12%,
计算平均年利率
设本金为 x0
年份
累计存款额
本利率%
第1年 x0 + x0 5% = x0105%
105%
第2年 x0105% + x0105%5% = x0105%2
105%
第3年 x0105%2 + x0105%28% = x0105%2108% 108%
1.2
2
2.8
1
1.5
1
5.5
4
课堂练习:
某水泥生产企业1999年的水泥产量为100万 吨,2000年与1999年相比增长率为9%, 2001年与2000年相比增长率为16%,2002 年与2001年相比增长率为20%。求各年的 年平均增长率
第3章统计学数据分布特征的描述
第3章统计学数据分布特征的描述统计学是一门研究收集、分析和解释数据的学科。
在统计学中,数据分布特征的描述是指通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。
数据的集中趋势描述了数据的平均水平或中心。
常用的统计量有平均值、中位数和众数。
平均值是将所有观测值相加然后除以观测值的总数,它能够反映数据的总体平均水平。
然而,当数据包含异常值时,平均值的计算结果可能会受到影响。
因此,中位数和众数在这种情况下被认为是更稳健的集中趋势度量。
中位数是将数据按大小排序,然后找出中间位置的观测值。
众数是数据中出现次数最多的观测值。
数据的离散程度描述了数据的变异程度或分散程度。
常用的统计量有方差、标准差和四分位差。
方差是观测值与均值之间差异的平方的平均值,它反映了数据的总体离散程度。
标准差是方差的平方根,用于衡量数据的波动性。
四分位差是数据的上四分位数和下四分位数之差,它描述了数据的中间50%的变异程度。
数据的分布形态描述了数据的形状和对称性。
常用的分布形态有正态分布、偏态分布和峰态分布。
正态分布是最常见的分布形态,其特点是对称、钟形曲线。
偏态分布是指数据分布不对称的情况,主要分为正偏态和负偏态。
正偏态分布意味着数据的尾部偏向右侧,负偏态分布则意味着数据的尾部偏向左侧。
峰态分布用于描述数据的峰值的尖锐程度,主要分为正态分布、高峰态和低峰态。
除了统计量,还可以使用图表来对数据分布特征进行描述。
常用的图表包括直方图、箱线图和散点图。
直方图是通过将数据分组并在坐标轴上绘制各组的频率或相对频率来展示数据的分布形态。
箱线图通过绘制数据的分位数和异常值来展示数据的中位数、四分位数和离群观测值。
散点图用于展示两个变量之间的关系,特别适用于发现变量之间的相关性和异常值。
综上所述,统计学中的数据分布特征描述是通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。
这些描述能够帮助我们更好地理解数据,并对数据进行分析和解释。
统计学 03第三章 统计分布的数值特征概论
2020/11/22
第三章 统计分布的数值特征
18
1.2 调和平均数 【例3-5】甲、乙两企业生产同一产 品,它们的劳动生产率和总产量的资 料如下表所示。试计算甲、乙两企业 的平均劳动生产率。
2020/11/22
第三章 统计分布的数值特征
19
1.2 调和平均数
甲、乙 两 企 业 生 产 情 况 汇 总 表
2020/11/22
第三章 统计分布的数值特征
3
第一节 集中趋势指标
分布的集中趋势—数据呈现出在一定 范围内围绕某个中心分布的特征,反 映数据向某一中心靠拢或者集中的程 度。
分布的集中趋势用统计平均数来反映
2020/11/22
第三章 统计分布的数值特征
4
统计平均数
数值平均数——需要全部数据参 与计算,
2020/11/22
第三章 统计分布的数值特征
14
1.1 算术平均数
某地 200 户家庭月生活费支出情况表
பைடு நூலகம்
月生活费支出(元) 户 数 支出额 户数比重 金 额
分组 1 000以下
组中值 x 900
(户) f 20
(元) xf
18 000
(%)
f f
10
(元)
x f f
90.0
1 000~1 200 1 100
12
1.1 算术平均数
加权算术平均数:
x
xf f
x
f
f
f f —频率,结构指标
权数—“权衡轻重”,重要程度。
2020/11/22
第三章 统计分布的数值特征
13
1.1 算术平均数
【例3-3】 现抽查某地 200户 3 口之家家庭的月生活费支出资料如 下表,试计算这 200户家庭的月平 均生活费支出。
第三章统计学教案(分布的数字特征)
第三章统计分布的数值特征只知道什么是统计分布是不够的,还必须学会对其进行量化描述。
描述统计分布的重要的特征值有两个,一个是说明其集中趋势的平均指标,另一个是说明其离散程度的变异指标。
这一对矛盾的指标分别从不同角度反映了统计分布的分布特点,它们相辅相成,相互补充,缺一不可。
本章着重就这两个指标展开讨论,介绍了它们的理论、方法与应用,充分理解掌握本章的内容,对于以后各章节的学习尤为重要。
本章的目的与要求通过本章学习,要求学生在了解总体分布的两个重要特征值就是平均指标与变异指标的前提下,着重掌握这两个指标的计算方法及其数学性质;明确反映集中趋势的各种平均指标的计算特点与作用、反映离散程度的各种变异指标的计算特点与作用;还要学会利用这两个特征值得各自数学性质,采用简捷法计算算术平均数和标准差,以提高计算效率;此外,算术、调和与几何平均数三者之间的关系,算术平均数与众数、中位数之间的关系等也是学生应充分理解掌握的内容。
本章主要内容(计划学时7 )一、分布的集中趋势(1)——数值平均数1、算术平均数2、调和平均数3、几何平均数二、分布的集中趋势(2)——位置平均数1、众数2、中位数3、其他分位数三、分布的离中趋势——变异指标1、变异全距2、平均差3、标准差4、变异系数学习重点一、重点掌握各种平均数的特点、应用条件、应用范围和计算方法,及其相互之间的关系;二、了解变异指标的意义和作用,熟练掌握各种变异指标的计算方法,尤其应重点掌握标准差的计算与应用;三、理解掌握算术平均数与标准差的数学性质,并且能利用其数学性质进行简捷计算;四、明确平均指标与变异指标的相互关系及其运用原则。
学习难点一、各种平均指标的应用条件、运用范围,尤其是加权算术权数的选择;二、根据所掌握的资料,应选择算术平均或调和平均方法;三、标准差的理论依据及其计算方法,尤其是成数标准差的计算更是初学者不易掌握的问题。
第一节 分布的集中趋势(1)——数值平均数一、统计平均数1、反映总体分布的集中趋势2、反映统计数列所达到的一般水平(静态、动态)3、与强度相对数的区别 二、算术平均数(用A x 表示) (一)算术平均数的基本内容: 算术平均数=总体单位总量总体标志总量(二)简单算术平均数nxnx x x x ni inA ∑==+++=121可简写为:nx x A∑=式中: x i 为变量值 n 是总体单位数 Σ为总和符号例3-1.1 从某味精厂的生产线上随机抽取了10包味精,测得每包净重分别为(单位:克)499 497 501 499 502 503 500 499 498 500 将此十个数据相加除以十就是算术平均数(结果为499.8克)。
第三章统计数据分布特征的描述
第三章统计数据分布特征的描述统计数据分布特征的描述是统计学中非常重要的一个概念,它用于对数据进行系统化的描述和分析。
统计数据分布特征的描述包括位置参数、散布参数和形状参数。
位置参数描述了数据集中心位置的特征。
最常用的位置参数是均值和中位数。
均值是指所有数据值的总和除以数据个数,它能够反映数据集的平均水平。
中位数是将数据值按大小排序后的中间值,它能够反映数据集的中心位置。
均值对异常值比较敏感,中位数能够较好地排除异常值的干扰。
散布参数描述了数据集的离散程度。
最常用的散布参数是方差和标准差。
方差是指每个数据值与均值之差的平方和的平均值,它能够反映数据集的离散程度。
标准差是方差的平方根,它与数据的单位相一致,常用于衡量数据的波动性。
方差和标准差越大,表示数据的离散程度越大。
形状参数描述了数据集的分布形状。
常用的形状参数包括偏度和峰度。
偏度是指数据分布的不对称程度,大于0表示右偏,小于0表示左偏,等于0表示对称。
偏度能够反映数据集的分布形态。
峰度是指数据分布的尖锐程度,大于0表示尖锐,小于0表示平坦,等于0表示与正态分布相似。
峰度能够反映数据集的尖峰或扁平程度。
除了这些常见的参数之外,还有其他一些描述统计数据分布特征的方法,如四分位数和箱线图。
四分位数是将数据分为四等分的值,它包括上四分位数、下四分位数和中位数。
上四分位数是四分之三分位数,下四分位数是四分之一分位数。
箱线图是以箱子和线段的形式展示数据分布特征,箱子的上边界和下边界分别代表上四分位数和下四分位数,箱子的中线代表中位数,箱子的长度代表数据的离散程度。
统计数据分布特征的描述对于研究数据的特征、提取有效信息以及进行统计推断都非常重要。
了解数据的位置、散布和形状特征能够帮助研究者更好地理解数据集的性质和规律。
在实际应用中,统计数据分布特征的描述还可以帮助决策者进行决策,例如对于质量控制的判断和产品的质量评估等。
综上所述,统计数据分布特征的描述是对数据集进行系统化描述和分析的重要工具。
第三章统计数据分布特征的描述
第三章统计数据分布特征的描述统计数据分布特征的描述是统计学中的重要概念之一、它是通过对数据进行整理、组织和分析来了解数据的分布情况,帮助我们更好地理解数据的特点和趋势。
一、数据分布特征的描述方法在统计学中,数据分布特征主要通过以下两种方法进行描述:1.图形描述法:通过绘制图表来展示数据的分布情况。
常见的图形描述方法有直方图、条形图、饼图、箱线图等。
直方图是一种用于展示数据分布的图形。
它将其中一范围内的数据分成若干个等宽的区间,并统计每个区间中数据的频数或频率,然后绘制柱状图来表示。
箱线图是一种用于展示数据分布和异常值的图形。
它将数据划分为四个部分:最大值、上四分位数、中位数、下四分位数和最小值,并通过画出盒子和须来表示数据的分布情况。
2.数值描述法:通过使用统计指标和参数来描述数据的分布情况。
常见的数值描述方法有均值、中位数、众数、标准差、方差等。
均值是指将所有数据相加后再除以数据的总个数的得到的值,代表了数据的平均水平。
中位数是指将数据按大小排序后,处于中间位置的值,代表了数据的中心位置。
众数是指数据集中出现次数最多的值,代表了数据的集中趋势。
标准差是指数据在均值附近的波动程度,代表了数据的离散程度。
方差是指数据与均值之间的平均差的平方的平均值,代表了数据的离散程度。
二、数据分布特征的描述步骤要进行数据分布特征的描述,一般需要进行以下步骤:1.数据的整理和搜集:搜集所需的数据,并将其整理成适合进行分析的形式。
2.确定描述方法:根据数据的特点和目标,选择适当的图形描述法或数值描述法。
3.进行描述分析:根据所选的描述方法,对数据进行分析和计算,得出相应的描述结果。
4.解释和应用:根据描述结果,解释数据的分布特征,并根据需要进行相应的应用。
三、数据分布特征的描述应用数据分布特征的描述在实际应用中有很多用途,以下是几个常见的应用:1.判断数据是否符合其中一种分布:通过对数据的分布特征进行描述,可以判断数据是否符合正态分布或其他特定的分布形式。
统计学第3章数据分布特征描述
xi fi i1
xf
f1 f2 ... fn
n
fi
f
x x f
i 1
f
举例
表3-3 节能灯泡使用寿命数据
使用寿命 组中 数量 (小时) 值x f
xf
频率 f /Σf
xf/Σf
1000以下 900 2 1800 0.020 18
1000-1200 1100 8 8800 0.080 88
n(xi x) 0
i1
(3)各变量值与算术平均数的离差平方之总和最小。 (从全 部数据看,算术平均数最接近所有变量值)
n(xi x)2 min
i1
性质(3)证明:
(三)调和平均数(Harmonic mean)
➢ 调和平均数,也称倒数平均数。 ➢ 各变量值倒数(1/xi)的算术平均数的倒数。 ➢ 计算公式为:
➢由一组数据的总和(总体标志总量)除以 该组数据的项数(总体单位总量)得到; 算术平均数=总体标志总量/总体单位总量
➢是最常用的数值平均数;
➢根据掌握资料不同,其有多种计算公式。
1.简单算术平均数 ➢对未分组数据,采用简单算术平均数公式。即 把各项数据直接加总,然后除以总项数。 ➢计算公式:
N
xi x i1
例如,改变教师职称结构,而不改变各种职 称教师课时费标准,会改变平均课时费水平。
权数实质
➢权数的实质在于其结构,即结构比例形式(比重 权数)。
➢其更能清晰表明权数之权衡轻重的作用。
权数形式有2种:
➢ 绝对数形式
Mp
➢ 结构比例形式
k
N
xik wi
i 1
N
wi
i 1
k
N
i 1
《统计学》第三章 统计分布的数值特征解读
1 k
称为k阶幂平均数,当k 取不同的整数值时, 幂平均数就给出不同的数值平均数计算公式。
例如: 当k=1时,幂平均数为算术平均数计 1 算公式。 x1 1 x
xk x1 n n
当 k=-1 时,幂平均数为调和平均数 1 计算公式。 1 1
1)反映总体各单位变量分布的集中趋势 和一般水平。 2)比较同类现象在不同单位的发展水平 3)比较同类现象在不同时期的发展变化 趋势或规律。 4)分析现象之间的依存关系。
3.分类: 按其具体代表的含义和计算方式的不 同,分为数值平均数和位置平均数。 1)数值平均数: A)定义 B)特点 C)种类 按计算方法不同,分为:算术平均数、 调和平均数、几何平均数和幂平均数。
2)位置平均数: A)定义:用处于数列中特殊位置 上的个别单位或部分单位的标志值 来确定的代表值。 B)特点:对数据的概括能力不如 数值平均数的强,但是不易受数列 中极端值的影响。 C)种类:常用的位置平均数有众 数和中位数两种。
二、数值平均数
( 一 ) 算 术 平 均 数 arithmetic mean
x
x
i 1 N i 1
N
i
fi
i
f
1 p 0 q p pq
p为总体中具有某种属性的单位成数,N为 总体单位数。成数是是非标志的平均数。
4. 算术平均数的数学性质 1 )算术平均数与标志值个数的乘积等 于各标志值的总和。 2 )各个标志值与其算术平均数的离差 之和等于零。 3 )各标志值与算术平均数离差的平方 和为最小值。 4)对被平均的变量实施某种线性变换后, 新变量的算术平均数等于对原变量的算 术平均数实施同样的线性变换的结果。
第3章 分布数量特征的统计描述
21 22 23 24 25 合计
420 660 1380 1200 750 4610
20 30 60 50 30 200
f
xf
26
例2:求平均利润率
某公司下属三个部门销售情况,求三个部门的平均利润率 部 A B C 门 销售利润率(%) x 12 10 7 销售额(万元) f 1000 2000 1500
n
xi
i 1
加权算术平均数
i 1
fi x xi fi
i 1
19
n
n
性质2:各单位标志值与算术平均数的离差之和等
于0
x x x x
x1
x x
x
x x
xn
(x x) x x N x N x 0
( x x ) f xf x f x f x f 0
17
例:某市有126万人口,其中男性人口64.26 万,女性人口61.74万,求该城市人口的男性 平均成数。
解:
x p
64 . 26 126
51 %
该城市人口的男性成数为51%
(三)算术平均数的数学性质
性质1:算术平均数与标志值个数的乘积等于 各标志值的总和
简单算术平均数
Nx
2 .1 1 2 5(万 吨 )
按产棉量分 县数 组中值 组(万吨) f 1 以下 5 0.5 1~2 42 1.5 2~3 16 2.5 13 3.5 3~4 4 4.5 4 以上 合计 — 80
x
xf
2.5 63 40 45.5 18 169
注意:这里假定各组标志值在组内分布是均匀的。但
第三章统计分布的数值特征(王宇新)
m m x
例3
某企业职工工资总额及其分组资料如下:
工资总额m 1264000 18240000 66651000 10203000 96358000 x 2000 4000 6500 9500 / m/x 632 4560 10254 1074 16520
月工资 3000元以下 3000—5000 5000--8000 8000元以上 合计
例4:某局所属20个企业的产品的生产计划完成
情况如下表,求这些企业平均的计划完成程度?
计划完成程度分 企业数 组% 实际产值 (万元)
90以下
2
85
90-100
100-110
3
13
228
1050
110以上
合计
2
20
230
1593
由于计划完成程度是一个相对指标,所以计算企业平均的 计划完成程度时就应从实际经济意义出发,即 计划完成程度=实际值/计划值 上例中各企业的实际产值已知(即分子已知),而计划产 值未知,只要根据公式求出计划产值,再对比即可。所以 平均的计划完成程度=实际值/计划值=
xf 55 2 65 3 75 5 85 6 95 4 f 20 1570 78.5分 20 x
60分以下 2
60-70分 70-80分 80-90分 3 5 6
90分以上 4 合计 20 注意:这一结果与例1计算的结果有 误差。可见,用组距数列计算加权算 术平均数时与实际值存在一定的误差。
②各个变量值与平均数离差平方之和为最小值
x x
2
min
x x
2
f min
证 明:设x0为不等于平均数的任意值,则:
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 统计分布的数值特征
19
1.2 调和平均数 相对数的平均数
求相对数的平均数是一个难题,说它难, 不是计算困难,而是人们往往“想当然地” 求解,结果一动手就发生了错误。
例如,三所大学“四、六级英语考试” 的过级率分别是:50%、60%、70%。问 这三所学校平均过级率是多少?
下面来看一个较为复杂的例子。
2016/4/29
第三章 统计分布的数值特征
11
1.1 算术平均数
某地 200 户家庭月生活费支出情况表 月生活费支出(元) 分 组 1 000以下 1 000~1 200 1 200~1 500 1 500~2 000 户数 支出额 户数比重 金 额
组中值
x 900 1 100 1 350 1 750
2016/4/29 第三章 统计分布的数值特征 18
1.2 调和平均数
计算平均指标时,是采用算术平均数, 还是采用调和平均数。一般不可简单套用 公式。
要根据客观实际问题所反映的经济关系 和所掌握的资料来选择平均数的计算形式。 可见,求解平均数问题的关键是要熟练 掌握客观现象的经济关系实质。
2016/4/29
第一节 集中趋势指标 分布的集中趋势—数据呈现出在一定 范围内围绕某个中心分布的特征, 反映数据向某一中心靠拢或者集中 的程度。
分布的集中趋势用统计平均数来反映
2016/4/29
第三章 统计分布的数值特征
3
第一节 集中趋势指标
调 术 和 数 值 平 平 数值平均数——需要全部数据参 统 平均数 均 均 计 与计算, 数 数 算 统计平均数 几 何 平 均 数
100家企业平均 产值利润率
2016/4/29
等价
该行业的 产值利润率
24
第三章 统计分布的数值特征
1.2 调和平均数
【例】某集团公司下属三个企业,有关计划完 成情况的资料如下表所示。求三企业平均计划完 成百分数。
某集团公司三个企业计划完成情况表 企业 计划完成百分数 (%) 实际完成 (万元) 计划任务 (万元)
平均指标的一般含义:
总体标志总量 平均指标 总体单位总量
2016/4/29 第三章 统计分布的数值特征 5
1.1 算术平均数
简单算术平均数和加权算术平均数 。 n xi 简单算术平均数 — 将各单位的标志值简 x1 x 2 x n i 1 x 单加总起来,再除以变量值个数。 n n 适用于未分组的数据。
算术平均数 : 简单算术平均数计算公式
x 如果全部数据为: x
n , xn x1 , x2 ,
第三章 统计分布的数值特征 6
2016/4/29
1.1 算术平均数
【例3-1】某农作物在6块生产条件基本相同的 地块上试种,其亩产(公斤/亩)分别为 800、 900、950、960、1 000、1 050,求其平均亩产。
(户)
f 20 40 100 30
(元)
xf 18 000 44 000 135 000 52 500
(%)
f
(元)
x f
f
10 20 50 15
f
90.0
220.0 675.0 262.5
2 000以上
合 计
2016/4/29
2 250
—
10
200
22 500
272 000
5
100
112.5
2. 各变量值与平均数的离差平方和为最小。
x x x c
i i
x x f x c
2 i i
2
f
3. 4.
2016/4/29
a bx a b x
x y x y
第三章 统计分布的数值特征 14
1.2 调和平均数
f
f x f
f —频率,结构指标
10
权数 — “权衡轻重”,重要程 度。
2016/4/29
第三章 统计分布的数值特征
1.1 算术平均数
【例3-3】 现抽查某地 200户 3 口之家家庭的月生活费支出资料如 下表,试计算这 200户家庭的月平
均生活费支出。
2016/4/29 第三章 统计分布的数值特征 23
1.2 调和平均数
上 半 年 产值总额 利润总额
57 000 10 800
下 半 年 利润总额 产值总额
11 000 54 000
上半年平均 10 800 18.95% 产值利润率 57 000 下半年平均 11 000 20.37% 产值利润率 54 000
x f x f
x1 f 1 x 2 f 2 x n f n f
x1
f
f1
x2
f
f2
xn
f
9
fn
f x f
2016/4/29 第三章 统计分布的数值特征
1.1 算术平均数
加权算术平均数:
x f x f
n
2016/4/29 第三章 统计分布的数值特征 15
调和平均数 : n
n
n
— 简单
1.2 调和平均数 【例3-5】甲、乙两企业生产同一产
品,它们的劳动生产率和总产量的资
料如下表所示。试计算甲、乙两企业 的平均劳动生产率。
2016/4/29
第三章 统计分布的数值特征
16
1.2 调和平均数
甲、乙 两 企 业 生 产 情 况 汇 总 表 甲 企 业 工人 产量(百件) 工人数 总产量 (件) xf 27 000 55 000
由此可以看出,计算统计指标时, 一定要: 1. 理解客观经济现象的实质; 2. 根据掌握的资料灵活计算; 3. 不能简单套用计算公式。 在后面进行动态分析时,我们还会 遇到这种情况。
2016/4/29 第三章 统计分布的数值特征 26
1.3 几何平均数 几何平均数的计算公式:
G G
n
x1 x 2 x n
25
1 000
2016/4/29
第三章 统计分布的数值特征
1.2 调和平均数
产值利润率(%)
利润总额 产值利润率 产值总额
(单位:万元) 下 半 年
石材业产值和利润计算表
上 半 年
分组 10~15 15~20 20~30 合计
ቤተ መጻሕፍቲ ባይዱ
组中值 12.5 17.5 25.0 —
产值总额 10 000 22 000 25 000 57 000
第三章 统计分布的数值特征
17
1.2 调和平均数
甲 企 业 工人人数 f 100 总产量 xf 108 000 乙 企 业 总产量 m 107 000 工人人数 m/x 100
甲企业人均产量: 108 000 xf 108 000 1 080 件 人 甲企业人均产量 x 1 080 件 人 100 100 f 乙企业人均产量: 107 000 乙企业人均产量 1 070 件 人 m 107100 000 H 1 070 件 人 m 100 x
第三章
统计分布 的数值特征
第一节 集中趋势指标
第二节 离散程度指标 第三节 分布形态描述指标
第一节 集中趋势指标 1.1 算术平均数 1.2 调和平均数 1.3 几何平均数 1.4 A、H、G的比较 1.5 众数 1.6 中位数 1.8 平均指标的比较
2016/4/29 第三章 统计分布的数值特征 2
2016/4/29 第三章 统计分布的数值特征 20
1.2 调和平均数 【例】泉州地区石材业比较发达, 为了了解该行业的经济效益情况,现 抽查了100家石材生产企业某年上半年 和下半年的产值、利润和产值利润率
的情况列入下表。
2016/4/29
第三章 统计分布的数值特征
21
1.2 调和平均数
石材业产值和利润汇总表
f x 元 人 1 360 元 人 解法二: x 1 360 f
2016/4/29 第三章 统计分布的数值特征 13
1.1 算术平均数
算术平均数的性质
1. 各变量值与平均数离差之和为零。
x
2
i
x 0
x
2
i
x fi 0
f1 1
n
x
fn n
f1 f 2 f n
x x x
f2 2
f
x
f
几何平均数在统计上更多地是用于计算
平均发展速度 , 进行时间数列分析。
2016/4/29 第三章 统计分布的数值特征 27
1.3 几何平均数 【例】某产品需要经过3道工序才能 加工完成,任何一道工序失败则为不 合格品。已知这三道工序的合格率分 别为96%、98%、90%,请问三道工
人均产量
乙 企 业 总产量 工人数 (人) m/x 20 60
分组 8~10
10~12 12以上 合 计
组中值
x
(人)
f 30 50
(件)
x
(件)
m
9
11 13 —
950
1 050 1 250 合计
19 000
63 000 25 000 107 000
20
100
26 000
108 000
20
100
2016/4/29
n
如果变量值为: x1 , x2 , , xn ,
x
1
1
2
2
n
n
f1 f 2 f n
i 1 n