数据的概括性度量
第四章数据的概括性度量
第四章数据的概括性度量
一.填空题
1.是一组数据中出现次数最多的变量值。
2.一组数据排序后处于中间位置上的变量值称
3.不受极端值影响的集中趋势度量指标有.和
4.一组数据的最大值与
最小值之差称
5.是一组数据的标准差与其相应的平均数之比。
6.E某cel中计算中
位数时选用的函数为
7.某工厂13名工人某日生产零件数分别为(单位:件)
10.11.13.11.14.11.12.11.15.16.12.11.13,则中位数为;众数为
8.某百货公司连续几天的销售额如下:
257.276.297.252.238.310.240.236.265,则其下四分位数是
9.若一组数据的某MeMo,则其属于_______________分布(左偏.右偏)。10.如果一组数据服从标准正态分布,则峰态系数为___________。
11.假定一个总体由5个数据组成:3.7.8.9.13,该总体的方差为
13.某班共有25名学生,期末统计学课程的考试分数分别为:
68.73.66.76.86.74.61.89.65.90.69.67.76.62.81.63.68.81.70.73.60.8 7.75.64.56,该班考试分数的下四分位数和上四分位数分别是和
14.在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别为72.63.1.54.7.54.3.29.26.9.25.23.9.23.20,该组数据的极差为二.单项选择题
1.对于对称分布的数据,众数.中位数和平均数的关系是:()。
A.众数>中位数>平均数
B.众数=中位数=平均数
第4章 数据的概括性度量(数据特征的描述PPT课件
成交额 (元)
Mi fi
成交量 (公斤)
fi
甲 1.20 18000 15000 乙 0.50 12500 25000 丙 0.80 6400 8000
合计 — 36900 48000
解:由公式
Hm
Mi fi Mi fi
Mi fi
fi
Mi
所以 H m
成交额
成交额 批发价格
36900 0.769(元) 48000
18.08.2020
33
例题分析
【例4.11】某水泥生产企业1999年的水泥产 量为100万吨,2000年与1999年相比增长率为
9%,2001年与2000年相比增长率为16%, 2002年与2001年相比增长率为20%。求各年
的年平均增长率。
Gm n x1x2 xn
3 109%116%120%
偏态 峰态
7
第1 节 集中趋势的度量
一. 分类数据:众数 二. 顺序数据:中位数和分位数 三. 数值型数据:均值 四. 众数、中位数和均值的比较
18.08.2020
8
集中趋势(Central tendency)
集中趋势:一组数据向其中心值靠拢的倾 向和程度.测度趋势就是寻找数据水平的代 表值或中心值。
n为奇数 n为偶数
18.08.2020
16
例4.4求下述问题的中位数
第4章统计数据的概括性度量(新)
算术均值的数学性质
1. 各变量值与算术均值的离差之和等于0
(x) 0 或 (x ) f 0
2.各变量值与算术均值的离差平方和最小
( x ) 2 min(最小) 或 ( x ) 2 f min(最小)
(二)调和均值
1.调和均值是各个变量值倒数的算术均值的倒数
2.易受极端值的影响
总规模数据的计算要求
1.现象要具有同类性 2.要有明确、科学的涵义和科学的统计方法 3.要有统一的计量单位
第二节 相对水平的度量
一、相对数据的概述 二、相对水平的度量
一、相对数据的概述
1.相对数是由两个相互联系的变量值相除而得出的比 率,它反映了研究对象内部各部分之间或现象之间的 相互关系。
2.其数值表现形式有无名数和有名数两种,其中绝大 多数的相对数数值都采用无名数表现,常用的无 名数是系数、倍数和百分数。
甲组: 考试成绩(x ): 人数分布(f ):
0 20 100 11 8
乙组: 考试成绩(x): 人数分布(f ):
0 20 100 81 1
甲组 : xf 0 1 20 1 100 8 82(分)
f
10
乙组: xf 0 8 20 1 100 1 12(分)
f
10
相对数的算术均值
适合数值型数据分组资料算术均值的计算,对于组距 分组资料,各组变量值以组中值替代。
统计学第4章学习指导
第4章(数据的概括性度量)学习指导
数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。掌握计算、特点及其应用场合。
主要内容学习要点
2.1 集中趋势的度量众数▶概念:众数。
▶众数的特点。
中位数和分位数▶概念:中位数,四分位数。
▶中位数和四分位数的特点。
▶中位数和四分位数的计算。
平均数▶概念:平均数,简单平均数,加权平均
数,调和平均数,几何平均数。
▶简单平均数和加权平均数的计算。
▶用Excel中的统计函数计算平均数。
▶几何平均数的计算和应用场合。
众数、中位数和
平均数的比较
▶众数、中位数和平均数在分布上的关系。
▶众数、中位数和平均数的特点及应用场合。异众比率▶概念:异众比率
异众比率的计算和应用场合。
2.2离散程度
的度量四分位差
(内距)
概念:四分位差。
四分位差的计算。
用Excel中的统计函数计算四分位差。方差和标准差概念:极差,平均差,方差,标准差。
样本方差和标准差的计算。
用Excel计算标准差。
离散系数概念:离散系数。
离散系数的计算。
离散系数的用途。
2.3偏态与峰态
的度量偏态及其测度概念:偏态,偏态系数。
用Excel计算偏态系数。
偏态系数数值的意义。峰态及其测度概念:峰态,峰态系数。
用Excel计算峰态系数。
峰态系数数值的意义。
Excel统计函数的应用。
一)判断题
1,各变量值与其平均数的离差之和为最小值。( )
2.当各组的变量值所出现的频率相等时,加权算术平均数中的权数就失去作用,因而,加权算术平均数也就等于简单算术平均数( )
第四章 数据的概括性度量
第四章数据的概括性度量
第四章 数据的概括性度量
一.填空题 1. 是一组数据中出现次数最多的变量值。
2.一组数据排序后处于中间位置上的变量值称 。
3.不受极端值影响的集中趋势度量指标有 . 和 。
4.一组数据的最大值与最小值之差称 。
5. 是一组数据的标准差与其相应的平均数之比。
6.Excel 中计算中位数时选用的函数为 。
7. 某工厂13名工人某日生产零件数分别为(单位:件)10.11.13.11.14.11.12.11.15.16.12.11.13 ,则中位数为 ;众数为 。
8.某百货公司连续几天的销售额如下:257.276.297.252.238.310.240.236.265,则其下四分位数是 。
9.若一组数据的e o
X M M 〈〈,则其属于_______________分布(左偏.右偏)。
10.如果一组数据服从标准正态分布,则峰态系数为___________。
11.假定一个总体由5个数据组成:3.7.8.9.13,该总
体的方差为。
13.某班共有25名学生,期末统计学课程的考试分数分
别为:
68.73.66.76.86.74.61.89.65.90.69.67.76.62.81.
63.68.81.70.73.60.87.75.64.56,该班考试分数的
下四分位数和上四分位数分别是和。
14.在某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别为72.63.1.54.7.54.3.29.26.9.25.23.9.23.20,该组数据的极差为。
二.单项选择题
1.对于对称分布的数据,众数.中位数和平均数的关系是:()。
第章数据的概括性度量
数据分布的特征
集中趋势 (位置)
离中趋势 (分散程度) 偏态和峰态 (形状)
集中趋势
(central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的测度值适用于高层次的测量数据,但高
经济意义;③数值大小与时点间隔长短无直接关系。
•
总体单位总量是指总体单位数之和。如
一个企业的职工人数。
•
总体标志总量是指总体各单位就某一数
量标志的标志值之和。如以一个企业全体职
工作为总体,工资为数量标志,该企业全部 职工工资总额就是标志总量。
相对指标
• 相对指标是采用对比的方法,来反映现 象之间数量上的联系程度和对比关系的综合 指标。其表现形式是相对数。
×100
%
= 11 %
• 某地区2006年末人口数为100万人,该地 区2006年末拥有的1200个商业网点。则:
每万人拥有商业网点数 =
商业网点数
人口数
=
1200个 100万人
正指标
= 12个/万人
每商业网点服务人口数 =
人口数 商业网点数
=
100万人 1200个
逆指标
= 833人/个
• 计划完成程度相对指标 是以现象在某一
数据的概括性度量
1、总规模度量
2、比较度量
3、集中趋势度量
4、离散程度度量
5、偏态和峰度度量
1、总规模度量
反映总体规模达到的水平
2、比较度量
通过相对指标反应现象的数量对比关系
3、集中趋势度量
反映数据向中心靠拢的程度
4、离散程度度量
反映数据远离中心值的趋势
5、偏态和峰度度量
反映数据的分布形状
一、总量指标(按其反应的时间状况不同):分为时期指标,时点指标
从实际应用角度来看,在抽样估计中,当我们用样本方差Sn-1²去估计总体方差σ²时,它是σ²的无偏估计量。
工时,工日
⑷统计分数
学生考试成绩打分
为什么样本方差s是用自由度n-1去除呢?
从字面含义来看,自由度是指一组数据中可以自由取值的个数。当样本数据的个数为n时,若样本均值X拔确定后,只有n-1个数据可以自由取值,其中必有一个数据不能自由取值。例如,假定样本有三个数值,即X1=2,X2=4,X3=9,则X拔=5。当X拔=5确定以后,X1,X2,X3只有2个数据可以自由取值,另一个不能自由取值。比如,X1=5,X2=7,那么X3必然取3,而不能取其他值。
人,辆,双,台
2度量衡单位
吨,米,立方米
3标准实物单位
拖拉机折合标准台,不同含量的化肥折合为100%含量计算,各种不同发热量的煤折合为7000大卡/千克的标准煤
统计学第4章数据的概括性度量
PART 06
Excel在概括性度量中的 应用
REPORTING
WENKU DESIGN
利用Excel计算集中趋势指标
算术平均数
众数
使用Excel的AVERAGE函数计算一组 数据的算术平均数。
使用Excel的MODE函数计算一组数据 的众数。
中位数
使用Excel的MEDIAN函数计算一组数 据的中位数。
方差和标准差能够全面反映数据的离散程度,且计算相对简单。其中标
准差具有与原始数据相同的量纲,更便于比较不同数据集之间的离散程
度。
PART 04
偏态与峰态的度量
REPORTING
WENKU DESIGN
偏态及其度量
偏态定义
偏态是指数据分布的不对称性。 在统计学中,偏态通常通过计算 偏态系数来衡量。
REPORTING
WENKU DESIGN
直方图
01
定义:直方图是一种用矩形的面积表示频数分布的图形, 矩形的高度表示每一组的频数或频率,宽度则表示各组的 组距。
02
绘制步骤
03
1. 收集数据并确定数据的分组。
04
2. 计算各组的频数或频率。
05
3. 绘制矩形,其高度表示频数或频率,宽度表示组距。
06
应用场景:直方图适用于展示连续变量的分布情况,特别 是当数据量较大时,可以直观地看出数据的分布规律。
统计学-数据的概括性度量
频数 5 9 27 35 17 3 96
频率 5.21% 9.38% 28.13% 36.46% 17.71% 3.13% 100.00%
平均成绩70.7
人数
40 35 30 25 20 15 10
5 0
50分以下
考分频数直方图
50~60
60~70 70~80 80~90
90以上
数据分布的集中趋势
【例】 某车间两个生产小组各人日产量(件) 如下:
甲组:20,40,60,70,80,100,120 乙组:67,68,69,70,71,72,73 从下图可以看出甲组离散程度大,乙组离散 程度小。
即 a(1+r)20= a(1+10%)10(1+8%)5(1+6%)5
年平均本利率(1r)201.1101.0851.065 108.49%
年平均利率r 108.49%18.49%
(四)众数、中位数和平均数的比较
1.众数、中位数、平均数的大小关系
Mo = Me = x 对称分布
x Me Mo
2 4 6 8
⒊再求倒数:
4
1 2
1 4
1 6
1 8
例:有一种蔬菜,早晨的价格每千克0.5元, 中午0.2元,晚上0.1元。如果早、中、晚 各买1元钱的蔬菜,则当天所买的蔬菜平 STAT 均价格是多少?
《统计学基础》(第7版)第3章 ——数据的概括性测度(J7)
数据的概括性度量
第3章
数据的概括性测度
3.1 集中趋势的度量
3.2 离散程度的度量
3.3 偏度与峰度的度量
3.4 Excel【数据分析】工具的应用
贾俊平
2023/4/3
2023/4/3
统计学基础(第7版)—贾俊平
4-1
第3章
数据的概括性度量
学习目标
本章学习目标
度量集中趋势的统计量
度量离散程度的统计量
63.3823
44.0567
离散系数
0.5124
0.5921
0.5421
0.5357
0.3222
0.3428
0.4211
0.4444
0.4505
0.6343
众数
➢ 不受极端值影响
➢ 具有不惟一性
➢ 数据分布偏斜程度较大且有明显峰值时代表性较好
2023/4/3
统计学基础(第7版)—贾俊平
4 - 10
第3章
数据的概括性度量
3.2 离散程度的度量
极差和四分位差——极差
极差(range)
一组数据的最大值与最小值之差,称为,也称全距用R表示
计算公式为: = max − min()
× −1
置对应的数值;如果位置不是整数,百
分位数等于该位置前面的数值加上按比
第4章 数据的概括性度量
n为奇数
n为偶数
70
顺序数据的中位数(例题分析)
甲城市家庭对住房状况评价的频数分布 回答类别 非常不满意 不满意 一般 满意 非常满意 合计
15
解:中位数的位置为
(300+1)/2=150.5 从累计频数看, 中位数在“一般”这一 组别中 中位数为
甲城市 户数 (户) 24 108 93 45 30 300 累计频数 24 132 225 270 300 —
LOGO
4.1 4.2 4.3
集中趋势的度量 离散程度的度量 偏态与峰态的度量
2
70
基本内容 集中趋势的度量、离散程度的度量、偏态与峰态的度量。 重点内容 各种集中趋势的度量、离散程度的度量的统计含义与计算方法。 学习目标 1.熟悉几种数据分布特性度量的统计含义 2.掌握各种集中趋势的度量、离散程度的度量的适用条件和计算 方法 3.了解各种集中趋势的度量、离散程度的度量的优缺点 4.了解偏态与峰态的度量意义和测度方法
长期来讲,对时间的度量并没有偏差。 NIST 的秒有时比 BIPM的短,有时比BIPM 的长,并不是都较短或较长。尽管 NIST的测量很准确,但从上面的数字还是可以看出有些差 异。世界上没有百分之百可靠的度量,但用多次测量的平 均数比只用一次测量的结果可靠程度会更高。这就是BIPM 要结合很多原子钟的时间的原因
《统计学考研题库》【章节题库+名校考研真题+模拟试题】数据的概括性度量【圣才出品】
4.当两个数列平均数不等时,反映变量之间差异程度最恰当的统计指标是( )。[四 川大学 2013 研]
A.动态相对数 B.平均差 C.标准差 D.标准差系数 【答案】D 【解析】标准差系数是反映变量变动程度的相对指标。其计算公式为:标准差系数=样 本标准差/平均数,消除了平均数不相等的影响。
5.右偏分布的特征是( )。[华东师范大学 2013 研]
圣才电子书
www.100xuexi.com
十万种考研考证电子书、题库视频学习平台
第 4 章 数据的概括性度量
一、单项选择题 1.某企业男性职工占 80%,月平均工资为 450 元,女性职工占 20%,月平均工资为 400 元,该企业全部职工的平均工资为( )。[中央财经大学 2015 研] A.425 元 B.430 元 C.435 元 D.440 元 【答案】D 【解析】企业全部职工的平均工资=男性职工比例×男性月平均工资+女性职工比例× 女性月平均工资=80%×450+20%×400=440(元)。
贾俊平《统计学》(第5版)章节题库-第4章 数据的概括性度量【圣才出品】
第4章 数据的概括性度量
一、单项选择题
1.一组数据中出现频数最多的变量值称为( )。
A.众数
B.中位数
C.四分位数
D.平均数
【答案】A
【解析】众数是一组数据中出现次数最多的变量值。众数主要用于测度分类数据的集中趋势。一般情况下,只有在数据量较大的情况下,众数才有意义。
2.下列关于众数的叙述,不正确的是( )。
A.一组数据可能存在多个众数
B.众数主要适用于分类数据
C.一组数据的众数是唯一的
D.众数不受极端值的影响
【答案】C
【解析】众数是一组数据中出现次数最多的变量值。众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。一般情况下,只有在数据量较大的情况下,众数才有意义。一组数据可能存在多个众数,由于众数是一个位置代表值,因此它不受数据中极端值的影响。
3.一组数据排序后处于中间位置上的变量值称为( )。
A.众数
B.中位数
C.四分位数
D.平均数
【答案】B
【解析】中位数是一组数据排序后处于中间位置上的变量值。中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。
4.一组数据排序后处于25%和75%位置上的值称为( )。
A.众数
B.中位数
C.四分位数
D.平均数
【答案】C
【解析】四分位数也称四分位点,它是一组数据排序后处于25%和75%位置上的值。四分位数是通过3个点将全部数据等分为4部分,其中每部分包含25%的数据。
5.非众数组的频数占总频数的比例称为( )。
A.异众比率
B.离散系数
C.平均差
D.标准差
【答案】A
统计学 数据的概括性度量
…,Mk,各组频数为f1,f2, …,fk,k则加权平均数为,
- X
M 1 f 1 M 2 f 2 … Mkfk f 1 f 2 … fk
Mifi
i 1 k
fi
i 1
简单平均数 算例
【例4.8】计算第三章中50个工人日加工零 件数的均值
—x = (117+122+……121)/50
1. 平均数是一组数据相加后除以数据个数 得到的结果。
2. 集中趋势的最主要测度值 3. 易受极端值的影响 4. 用于数值型数据,不能用于分类数据和
顺序数据。
简单平均数
对未分组数据计算的平均数
N
公式为:
X
X1 X2 X N
Xi
i 1
N
N
加权平均数
对分组数据计算的平均数
设原始数据被分成k组,各组的组中值为M1,M2,
【例4.7】计算50 名工人日加工零件数的四分位数
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
累积频数
105~110
3
3
110~115
5
8
115~120
8
16
120~125
14
30
125~130
10
统计学数据的概括性度量
四分位数(位置的确定)
未分组数据:
N+1 下四分位数(QL)位置 = 4
3(N+1) 上四分位数(QU)位置 = 4
组距分组数据:
N 下四分位数(QL)位置 = 4
上四分位数(QL)位置 =
3N 4
计算甲城市家庭对住房满意状况评价的四分位数
甲城市家庭对住房状况评价的频数分布
回答类别
甲城市
户数 (户)
集中趋势
(位置)
集中趋势指标的种类
取得集中趋势代表值方法的不同,可分为数值平均数和位置平均数 。
数值平均数
从总体各单位变量值中抽象出具有一般水平的量,这
个量是根据各个单位的具体标志值计算出来的,有算 术平均数、调和平均数、几何平均数等形式。
位置平均数
先将总体各单位的变量值按一定顺序排列,然后取某
一位置的变量值来反映总体各单位的一般水平。位置 平均数有众数、中位数、四分位数等形式。
QU = 30
原始数据: 排 序: 位 置:
23 21 30 28 25 26
21 23 25 26 28 30
12 3 456
QL位置 =
N+1 4=
6+1 4
= 1.75
3(N+1) 3(6+1)
QU位置 =
4
=
= 5.25 4
统计学第四章数据概括性度量
四分位数为 QL = 不满意 QU = 一般
数值型数据的四分位数
(9个数据的算例)
【例】:9个家庭的人均月收入数据(4种方法计算)
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000
19
12
25
37
20
13
37
25
21
12
50
12
合计 50
-
-
数值型数据的中位数
(组距分组数据)
下限公式 : 上限公式 :
f
Me L
2
Sm1 i
fm
f
Me U
2
Sm1 i
fm
Sm-1是到中位数组前面一组为止的向上累计 频数, Sm+1则是到中位数组后面一组为止的 向下累计频数;
数值型数据的中位数
22200 185 120
权数的作用与选择
1、影响加权算术平均数的因素:变量值和权数
2、权数起到权衡轻重的作用
3、选择权数的原则:变量值与其乘积是具有实 际经济意义的标志总量。
K
xi fi K
x
i1 K
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人数
3 7 13 5 2
30
向上累积
3 10 23 28 30
——
me
l
n
/
2 sm1 fm
.i
100
30 / 2 10 10 13
103.85
美国人口普查局发布报告显示,2013年美国家庭年 收入的中位数是51939美元
四口之家的年收入在23624美元以下即为贫困户。
2016年,美国家庭收入中位数增长3.2%,从2015 年的57230美元增至59039美元,创有记录以来新 高,超过1999年的前纪录58655美元。所有数字都 是经过通胀调整后的。
层次数据的测度值并不适用于低层次的测量数据
众数
(mode)
一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和
数值型数据 应用范围不多
众数
(不惟一性)
无众数 原始数据: 4 3 7 10 5 9 12 6 8
位 置: 1 2 3 4 5 6 7 8 9 10
中位数 (1080+1250)/2=1165(元/月)
分组数据的中位数的近似公式
me
l
n
/
2 fm
sm1
.i
在求中位数时,如果数据大量重复某一数值 ,这时的中位数未必准确,在解释时要特别 小心。
实例分析
按零件加工数分组
80-90 90-100 100-110 110-120 120-130
85 3 95 7 105 13 115 5 125 2 30
i 1
3110 103.67 30
均值
(数学性质)
各变量值与均值的离差之和等于零
n
xi x 0
i 1
各变量值与均值的离差平方和最小
n
( xi x )2 m in i 1
几何平均数
是n个变量值乘积的n次方根,用G表示 在计算社会经济问题的平均发展速度和
平均增长速度等方面有很重要的作用。
计算公式
G
n
x 1
x2
L
xn
适用于特殊数据,变量值x一般为比率
9wk.baidu.com97%
某企业最近4年产品销售收入的年增长 率分别为8%、7%、12%、13%,求该企 业这4年销售收入的年平均增长率?
50%
主要用于顺序数据,也可用数值型数据,但不能用 于分类数据
各变量值与中位数的离差绝对值之和最小。
中位数的位置
未分组数据 中位数的位置=(1+n)/2
分组数据 中位数的近似位置=n/2
数值型数据的中位数
(9个数据的实例)
【例1】 9个家庭的人均月生活费支出数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 排 序: 750 780 850 960 1080 1250 1500 1630 2000
样本均值
k
x x1 f1 x2 f2 L xk fk i1xi fi
f1 f2 L fk
k
i1
fi
实例分析
按零件加工数分组
80-90 90-100 100-110 110-120 120-130
合计
人数
3 7 13 5 2
30
组中值
加权均值 (例题分析)
k
x
xi fi
i 1 k
fi
2017年底港府统计处发表《2016年中期人口统计》, 称本港人均居住面积中位数为161呎(约合15平方米)
四分位数
(quartile)
排序后处于25%和75%位置上的值
25% 25% 25% 25%
QL
QM
QU
不受极端值的影响
四分位数
(位置的确定)
原始数据:
分组数据:
数值型数据的四分位数
(9个数据的算例)
均值
(mean)
1. 集中趋势的最常用测度值 2. 一组数据的均衡点所在 3. 易受极端值的影响 4. 是客观事物必然性数量特征的一种反映
简单均值
(simple mean)
总体均值 样本均值
加权均值
(weighted mean)
设一组数据为: x1 ,x2 ,… ,xk 相应的频数为: f1 , f2 ,… ,fk
位 置: 1 2 3 4 5 6 7 8 9
中位数 1080(元/月)
数值型数据的中位数
(9个数据的实例)
【例1】 10个家庭的人均月生活费支出数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630 1680 排 序: 750 780 850 960 1080 1250 1500 1630 1680 2000
排 序: 660 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5 6 7 8 9 10
试想一下分组数据的四分数计算近似公 式
十分位数
有几个十分位数? 十分位数的位置如何确定 如何求十分位数?
百分位数
有几个百分位数? 百分位数的位置如何确定 如何求百分位数?
【例1】:9个家庭的人均月收入数据
原始数据: 1500 750 780 1080 850 960 2000 1250 1630
排 序: 750 780 850 960 1080 1250 1500 1630 2000
位 置: 1 2 3 4 5 6 7 8 9
【例2】:10个家庭的人均月收入数据
一个众数 原始数据: 5 5 6 5 9 8 5 5 5
多于一个众数 原始数据:28 25 28 28 28 36 42 42 42 42
原始数据(职业):
教师 医生 公务员 教师 医生 银行职员 财务人员 医 生 教师 教师
中位数
(median)
排序后处于中间位置上的值
50%
Me
不受极端值的影响
第四章 统计数据的概括性度量
4.1 集中趋势的度量 4.2 离散程度的度量 4.3 偏态与峰态的度量
学习目标
• 掌握集中趋势各测度值的计算方法和 应用场合
• 掌握离散程度各测度值的计算方法及 应用场合
• 了解偏态和峰态的测度方法 • 能运用EXCEL计算描述统计量并进行分
析
4.1 集中趋势的度量
4.1.1 众数 4.1.2 中位数和分位数 4.1.3 平均数 4.1.4 众数、中位数和平均数的比较
集中趋势
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的测度值适用于高层次的测量数据,但高