03第三章 统计分布的数值特征
《统计学概论》习题解答
《统计学概论》习题解答第三章 统计分布的数值特征【7】某大型集团公司下属35个企业工人工资变量数列如下表所示:试计算该企业平均工资。
(注:比重——各组工人人数在工人总数中所占的比重) 【解】 该集团公司职工的平均工资为755元/人。
【8】某地甲、乙两个农贸市场三种主要水果价格及销售额资料见下表试计算比较该地区哪个农贸市场水果平均价格高?并说明原因。
解:()千克元甲市场水果平均价格44.20009000002002==()元乙市场水果平均价格44.200000010005502== 甲市场以较低价格销售的水果所占的比重比乙市场以相同价格销售的水果的比重大,反之,正好情况相反,故甲市场水果的平均价格较低。
【10】根据某城市500户居民家计调查结果,将居民户按其食品开支占全部消费开支的比重(即恩格尔系数)分组后,得到如下的频数分布资料:恩格尔系数 ( % ) 户 数 向上累计户数 x f (户%)分 组组中值( % )(户) (户)xf ∑f20以下 15 6 6 0.90 20—30 25 38 44 9.50 30—40 35 107 151 37.45 40—50 45 (中)137288(中) 61.65 50—60 55 114 402 62.70 60—70 65 74 476 48.10 70以上 75 24 500 18.00 合 计—500—283.30(1)据资料估计该城市恩格尔系数的中位数和众数,并说明这两个平均的具体分析意义。
(2)利用上表资料,按居民户数加权计算该城市恩格尔系数的算术平均数。
(3)上面计算的算术平均数能否说明该城市恩格尔系数的一般水平?为什么?解:()()()()%%%% M %%%% M o e 66.4540501141371071371071374022.47405013715125040=-⨯-+--+==-⨯-+=数:众中位数:以户数为权数计算的恩格尔系数的平均数:%fxf 66.4750030.283==∑∑不能作为该500户家庭恩格尔系数的平均水平。
第三章 统计数据分布的特征
12.42 6.60
82.2
调和平均数
各变量值的倒数的平均数。又称倒数平均 数。 n x 1 简单调和平均数
x
例题:书77页例3-2 加权调和平均数 x m m为权数 例题:见书78页例
m x
几何平均数
用于计算比率或速度的平均。 在计算社会经济现象时应用较多。 公式: N
i i 1
n
2
样本方差用(n-1)去除,从数学角度看是
因为它是总体方差σ2的无偏估计量。
n 1
k
分组数据
2
i 1
K
( X i X )2 fi
s2
i 1
( xi x ) 2 f i
k
f
i 1
K
i
f
i 1
i
1
标准差(例子)
某工会随机调查了5名工人上月的加班时间 如下表,平均加班时间为13小时。计算数 据的标准差。
1、集中趋势分析 2、离中趋势分析 3、分布偏态与峰度的测度
数据描述的数值方法
数据描述的数值方法
集中趋势
均 值
离散程度
极差 四分位距
分布的形状
偏 态 峰 度
中位数 众 数
方差和标准差 离散系数
2.2 分布集中趋势的测度
众数 中位数 分位数 均值 几何平均数 切尾均值
集中趋势
集中趋势:一组数据向其中 心值靠拢的倾向和程度。 集中趋势测度:寻找数据水 平的代表值或中心值。
特点:
反映了相对于均值的相对离散程度; 可用于比较计量单位不同的数据的离散程度; 计量单位相同时,如果两组数据的均值相差悬殊, 离散系数可能比标准差等绝对指标更有意义。
第3章 统计分布的数值特征
对一个分配数列求众数是有一定条件的。如果 一个分配数列没有一个明显的集中趋势,就不 存在众数。但如果一个分配数列存在两个相对 集中趋势,则这个分配数列就有两个众数。
众数
(不唯一性)
无众数(各数出现次数均为1) 原始数据: 10 5 9 12 6
8
一个众数(5)
原始数据: 6 5 9 8 5 5
多于一个众数(28、42) 原始数据: 25 28 28 36 42 42
计算加权算术平均数时,需要注意两个问题:
(1)权数的意义和作用。各组次数的大小所对应的标志 值对平均数的影响具有权衡轻重的作用。权数的权衡 轻重作用,可以直接从各组频率上观察到。频率越大, 该标志值记入平均数的份额也越大,对平均数的影响 也越大;这就是权数的权衡轻重作用的实质。 次数也有不起权数作用的时候。这就是当各组的次数 都相同时,即:
例:某水泥生产企业1995年水泥产量 100万吨,1996年比1995年增长9%, 1997年比1996年增长16%,1998年比 1997年增长20%,求各年平均增长率。 解:
G n x1 x2 ... xn 3 109% 116% 120% 114.91%
114.91%-100%=14.91%为各年平均增 长率
二、数值平均数
(一)算术平均数
算术平均数的统计定义公式是:总体单 位的标志值总量除以总体单位数,表明总体单 位标志值的平均水平。用公式表示如下:
算术平均数要求总体标志总量和总体单位 数相适应。即总体标志总量必须是总体各单位 标志值的总和。计算算术平均数有简单算术平 均数和加权算术平均数两种形式。
1.简单算术平均数
1.由单项式分配数列确定众数。出现次数最多 的标志值就是众数。(例3-6)
统计学第3章数据分布特征描述
3.分析现象之间的依存关系。 如研究劳动者文化程度与收入的关系。
4.(数值)平均指标是推断统计中的重要 统计量,是进行统计推断的基础。
几种常见的位置特征数
N
MH
N
i 1
1
1 xi
wi
wi
i 1
N
i 1
1 xi
wi
N
wi
i 1
MH
1 N1
N N1
i1 xi i1 xi
N
k0:几何平均数 加权
N
M G i 1w i x 1 w 1x2 w 2 xN w N
简单
M G N x 1x 2 x N
fi
i1
i 1(xifi)254 674 58 012 1110 % 01.7 1%
n(xifi) i1 xi
1 2% 6 56 1 4% 0 75 1 4% 2 80 10350
(四)几何平均数(Geometric mean)
简单几何平均数— n个变量值连乘积的n次方根。
n(xi x)2 min
i1
性质(3)证明:
(三)调和平均数(Harmonic mean)
调和平均数,也称倒数平均数。 各变量值倒数(1/xi)的算术平均数的倒数。 计算公式为:
n
xHx11m1x12m12... x1nmn
m1m2... mn
m1m2 ... mn
与单项式分组资料一样,采用加权算术平均数计算。
第3章统计学数据分布特征的描述
第3章统计学数据分布特征的描述统计学是一门研究收集、分析和解释数据的学科。
在统计学中,数据分布特征的描述是指通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。
数据的集中趋势描述了数据的平均水平或中心。
常用的统计量有平均值、中位数和众数。
平均值是将所有观测值相加然后除以观测值的总数,它能够反映数据的总体平均水平。
然而,当数据包含异常值时,平均值的计算结果可能会受到影响。
因此,中位数和众数在这种情况下被认为是更稳健的集中趋势度量。
中位数是将数据按大小排序,然后找出中间位置的观测值。
众数是数据中出现次数最多的观测值。
数据的离散程度描述了数据的变异程度或分散程度。
常用的统计量有方差、标准差和四分位差。
方差是观测值与均值之间差异的平方的平均值,它反映了数据的总体离散程度。
标准差是方差的平方根,用于衡量数据的波动性。
四分位差是数据的上四分位数和下四分位数之差,它描述了数据的中间50%的变异程度。
数据的分布形态描述了数据的形状和对称性。
常用的分布形态有正态分布、偏态分布和峰态分布。
正态分布是最常见的分布形态,其特点是对称、钟形曲线。
偏态分布是指数据分布不对称的情况,主要分为正偏态和负偏态。
正偏态分布意味着数据的尾部偏向右侧,负偏态分布则意味着数据的尾部偏向左侧。
峰态分布用于描述数据的峰值的尖锐程度,主要分为正态分布、高峰态和低峰态。
除了统计量,还可以使用图表来对数据分布特征进行描述。
常用的图表包括直方图、箱线图和散点图。
直方图是通过将数据分组并在坐标轴上绘制各组的频率或相对频率来展示数据的分布形态。
箱线图通过绘制数据的分位数和异常值来展示数据的中位数、四分位数和离群观测值。
散点图用于展示两个变量之间的关系,特别适用于发现变量之间的相关性和异常值。
综上所述,统计学中的数据分布特征描述是通过一系列统计量和图表来描述数据的集中趋势、离散程度和分布形态等特征。
这些描述能够帮助我们更好地理解数据,并对数据进行分析和解释。
统计学第三章 数据分布特征的描述
(二)意义
1.为人们深入认识事物发展的质量与状况提供客观 依据。(例如2010年我国GDP总量构成:第一产业占 10.16%,第二产业占46.86%,第三产业占42.98%。)
2.可以使不能直接对比的现象找到可以对比的基础, 进行更为有效的分析。(例如:2010年我国农民年人均 纯收入5919元。) 统计学课程建设小组
求支出中,食品支出占相当大的比例,其次是居住、衣着、家庭设备用品及服
务。衣着基本需求支出为107.3元,家庭设备用品及服务基本需求支出为75.3。
从实际情况来看,随着农村居民收入的增加,对衣、食、住、行方面的消费需
求,已由追求数量过渡到讲究质量。对于农村居民而言,衣、食、住、行是最
为基本的要求也是最低层次的,在并未达到富裕水平的农村居民而言,这些方
三峡大学
经济与管理学院
第三章 数据分布特征的描述
本章教学目的:本章要求掌握①总量指标的概 念、作用和种类;②相对指标的概念、作用、 常见相对指标的性质、特点和计算方法;③平 均指标的概念、作用、常见的几种平均数的特 点和计算方法;④变异指标的概念、计算。
本章教学重点:时期指标、时点指标、相对指 标、平均指标及变异指标的计算。
本章教学难点:时期与时点指标区别及变异指 标的计算。
本章教学学时:10学时
统计学课程建设小组
三峡大学
经济与管理学院
第一节 总量指标
一、总量指标的概念、作用
(一)概念
又称绝对数。它是表明一定时间、地点和条件下某种
社会经济现象总体规模或水平的统计指标。(如2009年年
末全国就业人员77995万人;2009年年末国家外汇储备
面的增长更加依赖于收入的增加,因此会在相当大的程度上受到收入变动的影
第3章 分布数量特征的统计描述
21 22 23 24 25 合计
420 660 1380 1200 750 4610
20 30 60 50 30 200
f
xf
26
例2:求平均利润率
某公司下属三个部门销售情况,求三个部门的平均利润率 部 A B C 门 销售利润率(%) x 12 10 7 销售额(万元) f 1000 2000 1500
n
xi
i 1
加权算术平均数
i 1
fi x xi fi
i 1
19
n
n
性质2:各单位标志值与算术平均数的离差之和等
于0
x x x x
x1
x x
x
x x
xn
(x x) x x N x N x 0
( x x ) f xf x f x f x f 0
17
例:某市有126万人口,其中男性人口64.26 万,女性人口61.74万,求该城市人口的男性 平均成数。
解:
x p
64 . 26 126
51 %
该城市人口的男性成数为51%
(三)算术平均数的数学性质
性质1:算术平均数与标志值个数的乘积等于 各标志值的总和
简单算术平均数
Nx
2 .1 1 2 5(万 吨 )
按产棉量分 县数 组中值 组(万吨) f 1 以下 5 0.5 1~2 42 1.5 2~3 16 2.5 13 3.5 3~4 4 4.5 4 以上 合计 — 80
x
xf
2.5 63 40 45.5 18 169
注意:这里假定各组标志值在组内分布是均匀的。但
第3章 统计数据分布特征的描述
农民家庭年人均纯收入情况表 农民家庭数(户) 240 480 1 050 600 270 210 120 30 3 000
计
f M o - f M o -1
´ d M o ( f M o - f M o -1 ) + ( f M o - f M o +1 )
3.1
统计变量集中趋势的测定
统计学是关于收集、分析、表述和解释统计数据的方法论科学,她对统计数据的收集、分析、表述 和解释虽然要从每一个数据着手,但其着眼点即研究目的却是在于统计数据整体或者说研究现象的总体 特征。在一个统计总体中,每一个个体即统计单位都有自己的特征和属性,具体地就表现出不同的标志 值,我们不能用其中的某一个或某几个的标志值来代表全部数据的特征,而必须使用所有数据的代表值 来表述总体特征,这就必须测定变量的集中趋势。
1050 - 600 ´ 200 = 1551.8 (元) (1050 - 480) + (1050 - 600)
在不等距分组的条件下,众数必须根据频数密度或频率密度来计算。 众数是按照数据的位置计算的,它的长处是易于理解,不受极端数值的影响。当数据分布存在明显 的集中趋势,且有显著的极端值时,适合使用众数。但是其灵敏度、计算功能和稳定性差,具有不唯一 性,所以当数据分布的集中趋势不明显或存在两个以上分布中心时,便不适合使用众数(前者无众数, 后者为双众数或多众数,也等于没有众数) 。 2.中位数(Median) 中位数和众数一样,也是一种位置代表值,但是,它不能用于定类数据,只能在顺序及以上的数据 中使用,所以又称为次序统计量,用 Me 表示。 中位数是将总体中的数据按顺序排列后,处于数列中点位置上的那个数据值或变量值,或者说中位 数是累计频率数列中,累计频率为 0.50 所对应的变量值。 从中位数概念可见:在总体中,小于中位数的数据个数占一半,大于中位数的数据个数也占一半, 即中位数是将数据按大小顺序排列后,位于二等分点上的那个数据值。用中位数来代表总体中所有标志 值的一般水平,可以避免极端值的影响,在有的情况下更具有代表性。例如,人口的平均年龄会受到个 别特别长寿人口年龄的影响,使计算结果偏大,而年龄中位数则可以较好地体现人口年龄结构的特征, 国际上就使用人口的年龄中位数(30 岁)作为人口老龄化的一个判断标准。 中位数的确定方法,根据所掌握的数据不同而有所不同: (1)由顺序数据和未分组的数量数据确定中位数。这种情况下,确定中位数的方法是:先将总体 中的全部数据顺序排列,然后确定中位数的位置,处于中位数位置的标志值就是中位数。 顺序数据中位数的位置:
统计学 03第三章 统计分布的数值特征概论
2020/11/22
第三章 统计分布的数值特征
18
1.2 调和平均数 【例3-5】甲、乙两企业生产同一产 品,它们的劳动生产率和总产量的资 料如下表所示。试计算甲、乙两企业 的平均劳动生产率。
2020/11/22
第三章 统计分布的数值特征
19
1.2 调和平均数
甲、乙 两 企 业 生 产 情 况 汇 总 表
2020/11/22
第三章 统计分布的数值特征
3
第一节 集中趋势指标
分布的集中趋势—数据呈现出在一定 范围内围绕某个中心分布的特征,反 映数据向某一中心靠拢或者集中的程 度。
分布的集中趋势用统计平均数来反映
2020/11/22
第三章 统计分布的数值特征
4
统计平均数
数值平均数——需要全部数据参 与计算,
2020/11/22
第三章 统计分布的数值特征
14
1.1 算术平均数
某地 200 户家庭月生活费支出情况表
பைடு நூலகம்
月生活费支出(元) 户 数 支出额 户数比重 金 额
分组 1 000以下
组中值 x 900
(户) f 20
(元) xf
18 000
(%)
f f
10
(元)
x f f
90.0
1 000~1 200 1 100
12
1.1 算术平均数
加权算术平均数:
x
xf f
x
f
f
f f —频率,结构指标
权数—“权衡轻重”,重要程度。
2020/11/22
第三章 统计分布的数值特征
13
1.1 算术平均数
【例3-3】 现抽查某地 200户 3 口之家家庭的月生活费支出资料如 下表,试计算这 200户家庭的月平 均生活费支出。
第三章统计分布的数值特征(王宇新)
m m x
例3
某企业职工工资总额及其分组资料如下:
工资总额m 1264000 18240000 66651000 10203000 96358000 x 2000 4000 6500 9500 / m/x 632 4560 10254 1074 16520
月工资 3000元以下 3000—5000 5000--8000 8000元以上 合计
例4:某局所属20个企业的产品的生产计划完成
情况如下表,求这些企业平均的计划完成程度?
计划完成程度分 企业数 组% 实际产值 (万元)
90以下
2
85
90-100
100-110
3
13
228
1050
110以上
合计
2
20
230
1593
由于计划完成程度是一个相对指标,所以计算企业平均的 计划完成程度时就应从实际经济意义出发,即 计划完成程度=实际值/计划值 上例中各企业的实际产值已知(即分子已知),而计划产 值未知,只要根据公式求出计划产值,再对比即可。所以 平均的计划完成程度=实际值/计划值=
xf 55 2 65 3 75 5 85 6 95 4 f 20 1570 78.5分 20 x
60分以下 2
60-70分 70-80分 80-90分 3 5 6
90分以上 4 合计 20 注意:这一结果与例1计算的结果有 误差。可见,用组距数列计算加权算 术平均数时与实际值存在一定的误差。
②各个变量值与平均数离差平方之和为最小值
x x
2
min
x x
2
f min
证 明:设x0为不等于平均数的任意值,则:
第三章统计数据分布特征的描述
第三章统计数据分布特征的描述统计数据分布特征的描述是统计学中非常重要的一个概念,它用于对数据进行系统化的描述和分析。
统计数据分布特征的描述包括位置参数、散布参数和形状参数。
位置参数描述了数据集中心位置的特征。
最常用的位置参数是均值和中位数。
均值是指所有数据值的总和除以数据个数,它能够反映数据集的平均水平。
中位数是将数据值按大小排序后的中间值,它能够反映数据集的中心位置。
均值对异常值比较敏感,中位数能够较好地排除异常值的干扰。
散布参数描述了数据集的离散程度。
最常用的散布参数是方差和标准差。
方差是指每个数据值与均值之差的平方和的平均值,它能够反映数据集的离散程度。
标准差是方差的平方根,它与数据的单位相一致,常用于衡量数据的波动性。
方差和标准差越大,表示数据的离散程度越大。
形状参数描述了数据集的分布形状。
常用的形状参数包括偏度和峰度。
偏度是指数据分布的不对称程度,大于0表示右偏,小于0表示左偏,等于0表示对称。
偏度能够反映数据集的分布形态。
峰度是指数据分布的尖锐程度,大于0表示尖锐,小于0表示平坦,等于0表示与正态分布相似。
峰度能够反映数据集的尖峰或扁平程度。
除了这些常见的参数之外,还有其他一些描述统计数据分布特征的方法,如四分位数和箱线图。
四分位数是将数据分为四等分的值,它包括上四分位数、下四分位数和中位数。
上四分位数是四分之三分位数,下四分位数是四分之一分位数。
箱线图是以箱子和线段的形式展示数据分布特征,箱子的上边界和下边界分别代表上四分位数和下四分位数,箱子的中线代表中位数,箱子的长度代表数据的离散程度。
统计数据分布特征的描述对于研究数据的特征、提取有效信息以及进行统计推断都非常重要。
了解数据的位置、散布和形状特征能够帮助研究者更好地理解数据集的性质和规律。
在实际应用中,统计数据分布特征的描述还可以帮助决策者进行决策,例如对于质量控制的判断和产品的质量评估等。
综上所述,统计数据分布特征的描述是对数据集进行系统化描述和分析的重要工具。
第三章统计数据分布特征的描述
第三章统计数据分布特征的描述统计数据分布特征的描述是统计学中的重要概念之一、它是通过对数据进行整理、组织和分析来了解数据的分布情况,帮助我们更好地理解数据的特点和趋势。
一、数据分布特征的描述方法在统计学中,数据分布特征主要通过以下两种方法进行描述:1.图形描述法:通过绘制图表来展示数据的分布情况。
常见的图形描述方法有直方图、条形图、饼图、箱线图等。
直方图是一种用于展示数据分布的图形。
它将其中一范围内的数据分成若干个等宽的区间,并统计每个区间中数据的频数或频率,然后绘制柱状图来表示。
箱线图是一种用于展示数据分布和异常值的图形。
它将数据划分为四个部分:最大值、上四分位数、中位数、下四分位数和最小值,并通过画出盒子和须来表示数据的分布情况。
2.数值描述法:通过使用统计指标和参数来描述数据的分布情况。
常见的数值描述方法有均值、中位数、众数、标准差、方差等。
均值是指将所有数据相加后再除以数据的总个数的得到的值,代表了数据的平均水平。
中位数是指将数据按大小排序后,处于中间位置的值,代表了数据的中心位置。
众数是指数据集中出现次数最多的值,代表了数据的集中趋势。
标准差是指数据在均值附近的波动程度,代表了数据的离散程度。
方差是指数据与均值之间的平均差的平方的平均值,代表了数据的离散程度。
二、数据分布特征的描述步骤要进行数据分布特征的描述,一般需要进行以下步骤:1.数据的整理和搜集:搜集所需的数据,并将其整理成适合进行分析的形式。
2.确定描述方法:根据数据的特点和目标,选择适当的图形描述法或数值描述法。
3.进行描述分析:根据所选的描述方法,对数据进行分析和计算,得出相应的描述结果。
4.解释和应用:根据描述结果,解释数据的分布特征,并根据需要进行相应的应用。
三、数据分布特征的描述应用数据分布特征的描述在实际应用中有很多用途,以下是几个常见的应用:1.判断数据是否符合其中一种分布:通过对数据的分布特征进行描述,可以判断数据是否符合正态分布或其他特定的分布形式。
第三章--统计分布的数值特征
3*(1/1.5+1/0.7+1/1.2)
某超市香蕉,梨,苹果某日的销售价格见表
水果 销售 销售额 名称 价格
H
香蕉 1.5 梨 0.7 苹果 1.2 合计 -
4500 3500 7200 15 200
= 销售总额 ( m) 销售量 ( m) x
=
15200 14000
= 1.0857 (元 斤)
= 企业利润额( xf ) 企业占用资金( f )
= 54 280 = 19.3%
3、是非标志的平均数
是非标志:也称交替标志,当总体单位某种品 质标志的具体表现为“是”与“非”或“有”与 “无”两种情况时,这种品质标志就称为是非标 志。平均数的计算:把具有某种特征的用“1”表
示,不具有该种特征的用“0”表示。
(三)几何平均数(G)
另一种形式的平均数,是N 个变量值乘 积的 N 次方根。主要用于计算平均比率和 平均速度。几何平均数也有简单几何平均 数和加权几何平均数两种。
1、简单几何平均数
计算公式:Gm = n x1 x2 xn = n n xi
应用条件:资料未分组(各变量值次i=1数都是1)。 例:某产品需经三个车间加工,已知第一个车间 加工合格率为95%,第二个车间加工合格率为 90%,第三个车间加工合格率为98%,求三个 车间的平均加工合格率
4、算术平均数的数学性质
(1)各个变量值与其平均数离差之和等于零
x - x= 0
( x - x )f = 0
(2)各个变量值与其平均数离差平方之和为最小值
x - x2 = 最小值
x - x2f = 最小值
(3)给每个变量值增加或减少一个任意数A,则 算术平均数也相应增加或减少这个任意数A。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
f 解法二: x x f
2014-3-30
第三章 统计分布的数值特征
1.1 算术平均数
算术平均数的性质
1. 各变量值与平均数离差之和为零。
x
2
i
x 0
x
2
i
x fi 0
2. 各变量值与平均数的离差平方和为最小。
x x x c
x f x f
x1 f 1 x 2 f 2 x n f n f
x1
f
f1
x2
f
f2
xn
f
16
fn
f x f
2014-3-30 第三章 统计分布的数值特征
1.1 算术平均数
加权算术平均数:
x f f x x f f
第三章 统计分布的数值特征
24
1.2 调和平均数
甲 企 业 工人人数 f 100 总产量 xf 108 000 乙 企 业 总产量 m 107 000 工人人数 m/x 100
甲企业人均产量: xf x f 108 000 1 080 件 人 100
乙企业人均产量: m H m x
xf 18 000 44 000 135 000 52 500
(%)
f
(元)
x f
f
10 20 50 15
f
90.0
220.0 675.0 262.5
2 000以上
合 计
2014-3-30
2 250
—
10
200
22 500
272 000
5
100
112.5
1 360.0
19
第三章 统计分布的数值特征
人均产量
乙 企 业 总产量 工人数 (人) m/x 20 60
分组 8~10
10~12 12以上 合 计
பைடு நூலகம்
组中值
x
(人)
f 30 50
(件)
x
(件)
m
9
11 13 —
950
1 050 1 250 合计
19 000
63 000 25 000 107 000
20
100
26 000
108 000
20
100
2014-3-30
第三章
统计分布的 数值特征
本章主要内容
3.1 水平的度量
3.2 差异的度量
3.3 分布形状的度量
2014-3-30
第三章 统计分布的数值特征
2
统计名言
一些人使用统计就像喝醉酒的 人使用街灯柱—支撑的功能多 于照明。
——Andrew Lang
学习目标
度量水平的统计量
度量差异的统计量
度量分布形状的统计量
下面来看一个较为复杂的例子。
2014-3-30 第三章 统计分布的数值特征 27
1.2 调和平均数 【例】泉州地区石材业比较发达, 为了了解该行业的经济效益情况,现 抽查了100家石材生产企业某年上半年 和下半年的产值、利润和产值利润率
的情况列入下表。
2014-3-30
第三章 统计分布的数值特征
28
i i
x x f x c
2 i i
2
f
3. 4.
2014-3-30
a bx a b x
x y x y
第三章 统计分布的数值特征 21
1.2 调和平均数
H
1 1 1 1 1 是标志值的倒数的算术平均数的倒 x1 x 2 xn x i 1 x i 数,也称倒数平均数。 n mi 在统计中一般作为算术平均数的变 m m1 m 2 m n i 1 H n — 加权 形加以应用。 mn m m1 m 2 mi x x1 x2 xn i 1 x i 调和平均数也分为简单的和加权的 调和平均数两类。
解 x 800 900 950 960 1 000 1 050
6
943.3 (公斤 亩)
即这6块地的平均亩产为943.3公斤。
2014-3-30 第三章 统计分布的数值特征 14
1.1 算术平均数
算术平均数 : 加权算术平均数计算公式
n
简单算术平均数和加权算术平均数。
xi f i 加权算术平均数 适用于分组的数据。 x f x f x f
18
1.1 算术平均数
某地 200 户家庭月生活费支出情况表 月生活费支出(元) 分 组 1 000以下 1 000~1 200 1 200~1 500 1 500~2 000 户数 支出额 户数比重 金 额
组中值
x 900 1 100 1 350 1 750
(户)
f 20 40 100 30
(元)
1.2 调和平均数
上 半 年 产值总额 利润总额
57 000 10 800
下 半 年 利润总额 产值总额
11 000 54 000
10 800 18.95% 产值利润率 57 000
上半年平均
11 000 20.37% 产值利润率 54 000
下半年平均
2014-3-30
第三章 统计分布的数值特征
如果变量值为: x1 , x 2 , , x n ,fi
x
1
1
2
2
n
n
f1 f 2 f n
i 1 n
xf:f1 , f 2 , , f n 各组单位数(权数)为
x f
i 1
2014-3-30
第三章 统计分布的数值特征
15
1.1 算术平均数 加权算术平均数:
平均数 数据确定或计算,便可得到 。 数
数
数
10
2014-3-30
第三章 统计分布的数值特征
第一节 集中趋势指标
集中趋势指标的作用
1. 反映数据分布的一般水平和集中趋势。如 数据存在向中心点集聚或靠拢的趋势,集中趋 势指标便是对其中心点的描述。 2. 对于时间序列数据,集中趋势指标反映序
列一般水平。如某市若干年GDP时间序列,其
平均数说明该市这些年GDP的一般水平。
2014-3-30 第三章 统计分布的数值特征 11
1.1 算术平均数 平均指标的一般含义:
总体标志总量 平均指标 总体单位总量
平均指标与强度相对指标
人均钢铁拥有量
人均钢铁日产量
2014-3-30 第三章 统计分布的数值特征 12
1.1 算术平均数
简单算术平均数和加权算术平均数 。 n xi 简单算术平均数—将各单位的标志值简 x1 x 2 x n i 1 单加总起来,再除以变量值个数。 x n n 适用于未分组的数据。
2014-3-30
107 000 1 070 件 人 100
25
第三章 统计分布的数值特征
1.2 调和平均数 计算平均指标时,是采用算术平均 数,还是采用调和平均数。一般不可 简单套用公式。 要根据客观实际问题所反映的经济 关系和所掌握的资料来选择平均数的 计算形式。 可见,求解平均数问题的关键是要 熟练掌握客观现象的经济关系实质。
各统计量的的特点及应用场合
用Excel和SPSS计算描述统计量
第三章 统计分布的数值特征 4
2014-3-30
哪名运动员的发挥更稳定?
在奥运会女子10米气手枪比赛中,每个 运动员首先进行每组 10 抢共 4 组的预赛, 然后根据预赛总成绩确定进入决赛的 8 名运动员。决赛时 8 名运动员再进行 10 枪射击,再将预赛成绩加上决赛成绩确 定最后的名次 在 2008 年 8 月 10 日举行的第 29 届北京奥 运会女子10米气手枪决赛中,进入决赛 的 8 名运动员的预赛成绩和最后 10 枪的 决赛成绩如下表
第三章 统计分布的数值特征 5
2014-3-30
2014-3-30
第三章 统计分布的数值特征
6
哪名运动员的发挥更稳定?
最会的比赛结果是,中国运动员郭文珺凭借决 赛的稳定发挥,以总成绩492.3环夺得金牌,预 赛排在第 1 名的俄罗斯运动员纳塔利娅 · 帕杰林 娜以总成绩 498.1 环获得银牌,预赛排在第 4 名 的格鲁吉亚运动员妮诺 · 萨卢克瓦泽以总成绩 487.4 环的成绩获得铜牌,而预赛排在第 3 名的 蒙古运动员卓格巴德拉赫· 蒙赫珠勒仅以479.6环 的成绩名列第8名 由此可见,在射击比赛中,运动员能否取得好 的成绩,发挥的稳定性至关重要。那么,怎样 评价一名运动员的发挥是否稳定呢?通过本章 内容的学习就能很容易回答这样的问题 2014-3-30 7 第三章 统计分布的数值特征
石材业产值和利润计算表
上 半 年 产值总额 10 000 22 000 25 000 57 000 利润总额 1 250 3 300 6 250 10 800
利润1 10 000 12.5% 1 250 万元 产值1 1 000 12.5% 8 000 万元
2014-3-30 第三章 统计分布的数值特征 30
算术平均数: 简单算术平均数计算公式
如果全部数据为:
n , xn x1 , x 2 ,
2014-3-30 第三章 统计分布的数值特征 13
x x
1.1 算术平均数
【例3-1】某农作物在6块生产条件基本相同的 地块上试种,其亩产(公斤/亩)分别为 800、 900、950、960、1 000、1 050,求其平均亩产。
1.1 算术平均数