第04章描述统计中的测度试讲课件
合集下载
第四章 统计描述_PPT幻灯片
4.1 基本概念和原理
统计学的基本内容可分为两大类——统计 描述和统计推断。
➢ 统计描述(Descriptive Statistics)是指运用 各种统计学手段(如统计表、统计图、统计 指标等)对观测数据的数量特征进行客观地 描述和表达。
2021/3/10
1
4.1 基本概念和原理
➢统计推断(Inferential Statistics)是指根据 观测数据(即“样本”——Sample)所提供 的信息,对未知总体的情况做出具有一定概 率保证的估计和推断,包括假设检验和参数 估计两大内容。
2021/3/10
11
4.3 描述性统计量(Descriptive)
专门用于计算各种描述统计量(均值、中位数、 众数、方差、标准差、全距、偏度、峰度),以 反映总体分布的集中趋势和离散趋势。
2021/3/10
12
4.4 探索性数据分析(Explore)
是一种基于数据稳健性和耐抗性的统计分析方法。 基本思路是在统计分析时尽量减小数据中存在的 少量异常值对分析结果的影响。Explore命令提供 了3种非常重要的功能:
i1
Me L 2
Sm1 d
fm
2021/3/10
7
4.1 基本概念和原理
3.众数(Mode)
➢ 上限公式:
m o U (m f f f 1 m ) ( f m 1 f f 1 ) d U Δ 1 Δ 2 Δ 2 d
➢ 下限公式:
m o L (m f f f1 m ) ( f m 1 f f 1 ) d L Δ 1 Δ 1 Δ 2 d
➢ 异常值检查 ➢ 正态分布检验 ➢ 方差齐性检验
2021/3/10
13
2021/3/10
统计学的基本内容可分为两大类——统计 描述和统计推断。
➢ 统计描述(Descriptive Statistics)是指运用 各种统计学手段(如统计表、统计图、统计 指标等)对观测数据的数量特征进行客观地 描述和表达。
2021/3/10
1
4.1 基本概念和原理
➢统计推断(Inferential Statistics)是指根据 观测数据(即“样本”——Sample)所提供 的信息,对未知总体的情况做出具有一定概 率保证的估计和推断,包括假设检验和参数 估计两大内容。
2021/3/10
11
4.3 描述性统计量(Descriptive)
专门用于计算各种描述统计量(均值、中位数、 众数、方差、标准差、全距、偏度、峰度),以 反映总体分布的集中趋势和离散趋势。
2021/3/10
12
4.4 探索性数据分析(Explore)
是一种基于数据稳健性和耐抗性的统计分析方法。 基本思路是在统计分析时尽量减小数据中存在的 少量异常值对分析结果的影响。Explore命令提供 了3种非常重要的功能:
i1
Me L 2
Sm1 d
fm
2021/3/10
7
4.1 基本概念和原理
3.众数(Mode)
➢ 上限公式:
m o U (m f f f 1 m ) ( f m 1 f f 1 ) d U Δ 1 Δ 2 Δ 2 d
➢ 下限公式:
m o L (m f f f1 m ) ( f m 1 f f 1 ) d L Δ 1 Δ 1 Δ 2 d
➢ 异常值检查 ➢ 正态分布检验 ➢ 方差齐性检验
2021/3/10
13
2021/3/10
管理统计学第04章 描述统计中的测度
-1
-2
1
x 5
1
x1
2 2 2
x2
2
x3 x4
2 2
x5
x6
( x x ) 1 0 (2) 3 1 (1) 0
( x x ) 1 0 (2) 3 1 (1) 16
2
第4 章
第2节 集中趋势的测度
2 集中趋势统计平均指标
第4 章
第2节 集中趋势的测度
2 集中趋势统计平均指标
均值(数学性质)
各变量值与均值的离差之和等于零
(X
i 1 n i 1
n
i
X) 0
i
各变量值与均值的离差平方和最小
(X
X ) min
2
第4 章
离差的概念
第2节 集中趋势的测度
2 集中趋势统计平均指标
8 7 6 5 4 3 2 -1 3
2 集中趋势统计平均指标
例:市场上早、中、晚蔬菜的价格分别是:早晨0.67公斤/元,中午0.5公斤/元,晚上0.4公斤 /元。 现在,我们分别按四种方法购买蔬菜,分别计算蔬菜的平均价格(不管用什么方法购买, 平均价格都应该等于花费的现金除以所购买蔬菜的数量)。
第4 章
第2节 集中趋势的测度
2 集中趋势统计平均指标
数据集中区 变量x
x
简单算术平均数和加权算术平均数。
一组数据的总和除以这组数据的项数所得的结果,最常用的数值平均数,容易受极端值的影响,有
第4 章
第2节 集中趋势的测度
2 集中趋势统计平均指标
简单算术平均数把每项数据直接加总后除以它们的项数,通常用于对未分组的数据计算算术平
第四章 统计描述PPT课件
几何平均数也称几何均值,它是n个变量值 乘积的n次方根。根据统计资料的不同,几 何平均数也有简单几何平均数和加权几何平 均数之分。
14
(一)简单几何平均数
直接将n项变量连乘,然后对其连乘积开n次 方根所得的平均数即为简单几何平均数。它 是几何平均数的常用形式。计算公式为:
n
Gn x1x2x3 xn n xi i1
年利率(%) 5 8 15 18 —
本利率(%)xi 105 108 115 118 —
––
频数f
3 5 8 14 10 6 4
50
xf
322.5 562.5 940.0
1715.0 1275.0 795.0 550.0
6160.0
平均日产量=
xf=616= 0123.( 2 件) f 50
7
(三)算术平均数性质
1、各变量值与其算术平均数的离差之和等 于零,即∑=0;
2、各变量值与其算术平均数的离差平方和 最小,即∑=min。
计算IT从业人员的平均年薪。 根据公式计算如下:
n
平均 xi 1 年 x i 4薪 9 1 40 9 0 3 0 50 3 5 41 0 9 0 50 0.5 0 2 (元 8 )14
n
24
5
(二)加权算术平均数
根据分组整理的数据计算的算术平均数。 其计算公式为:
x= x1f1f1 x2 f2 f2 fx nnfn xf f
n
xGf x1f1x2f2x3f3 xnfn f
xfi i
i1
式中:fi代表各个变量值出现的次数。
17
例4.7:某工商银行某项投资年利率是按复利计算的。 20年的利率分配如表4-6,计算20年的平均年利率。
14
(一)简单几何平均数
直接将n项变量连乘,然后对其连乘积开n次 方根所得的平均数即为简单几何平均数。它 是几何平均数的常用形式。计算公式为:
n
Gn x1x2x3 xn n xi i1
年利率(%) 5 8 15 18 —
本利率(%)xi 105 108 115 118 —
––
频数f
3 5 8 14 10 6 4
50
xf
322.5 562.5 940.0
1715.0 1275.0 795.0 550.0
6160.0
平均日产量=
xf=616= 0123.( 2 件) f 50
7
(三)算术平均数性质
1、各变量值与其算术平均数的离差之和等 于零,即∑=0;
2、各变量值与其算术平均数的离差平方和 最小,即∑=min。
计算IT从业人员的平均年薪。 根据公式计算如下:
n
平均 xi 1 年 x i 4薪 9 1 40 9 0 3 0 50 3 5 41 0 9 0 50 0.5 0 2 (元 8 )14
n
24
5
(二)加权算术平均数
根据分组整理的数据计算的算术平均数。 其计算公式为:
x= x1f1f1 x2 f2 f2 fx nnfn xf f
n
xGf x1f1x2f2x3f3 xnfn f
xfi i
i1
式中:fi代表各个变量值出现的次数。
17
例4.7:某工商银行某项投资年利率是按复利计算的。 20年的利率分配如表4-6,计算20年的平均年利率。
重点在于数量关系和公式第四章PPT课件
x i1 n
22200 185 120
14
4.2 分布集中趋势的测度—平均指标
4.2.1 数值型数据:均值
简单均值与加权均值
(simple mean / weighted mean)
•
甲乙两组各有10名学生,他们的考试成绩及其分布数据如
下
•
甲组: 考试成绩(x ): 0 20 100
•
人数分布(f ):1 1 8
• 算术平均数与强度相对数的比较 • 1、概念不同。强度相对数是两个有联系而性质不同
的总体对比而形成相对数指标。算术平均数是反映同 质总体单位标志值一般水平的指标。 • 2、主要作用不同。强度相对数反映两不同总体现象 形成的密度、强度。算术平均数反映同一现象在同一 总体中的一般水平。 • 3、计算公式及内容不同。算术平均数分子、分母分 别是同一总体的标志总量和总体单位数,分子、分母 的元素具有一 一对应的关系,即分母每一个总体单位 都在分子可找到与之对应的标志值,反之,分子每一 个标志值都可以在分母中找到与之对应的总体单位。 而强度相对数是两个总体现象之比,分子分母没有一 18 一对应关系。
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的测度值适用于高层次的测量数据,但高
层次数据的测度值并不适用于低层次的测量数据
11
4.2 分布集中趋势的测度—平均指标 4.2.1 数值型数据:均值 4.2.2 分类数据:众数 4.2.3 顺序数据:中位数和分位数 4.2.4 众数、中位数和均值的比较
n
简单均值
xx1 x2
22200 185 120
14
4.2 分布集中趋势的测度—平均指标
4.2.1 数值型数据:均值
简单均值与加权均值
(simple mean / weighted mean)
•
甲乙两组各有10名学生,他们的考试成绩及其分布数据如
下
•
甲组: 考试成绩(x ): 0 20 100
•
人数分布(f ):1 1 8
• 算术平均数与强度相对数的比较 • 1、概念不同。强度相对数是两个有联系而性质不同
的总体对比而形成相对数指标。算术平均数是反映同 质总体单位标志值一般水平的指标。 • 2、主要作用不同。强度相对数反映两不同总体现象 形成的密度、强度。算术平均数反映同一现象在同一 总体中的一般水平。 • 3、计算公式及内容不同。算术平均数分子、分母分 别是同一总体的标志总量和总体单位数,分子、分母 的元素具有一 一对应的关系,即分母每一个总体单位 都在分子可找到与之对应的标志值,反之,分子每一 个标志值都可以在分母中找到与之对应的总体单位。 而强度相对数是两个总体现象之比,分子分母没有一 18 一对应关系。
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的测度值适用于高层次的测量数据,但高
层次数据的测度值并不适用于低层次的测量数据
11
4.2 分布集中趋势的测度—平均指标 4.2.1 数值型数据:均值 4.2.2 分类数据:众数 4.2.3 顺序数据:中位数和分位数 4.2.4 众数、中位数和均值的比较
n
简单均值
xx1 x2
统计学第四章课件
合人们的认识规律,通常用xG 来表示。
一、分布的集中趋势
1. 简单几何平均数
简单几何平均数适用于资料未进行分组 的情况。其计算公式为
(4-8)
式中, xG 为几何平均数;xi为变量值;n为
变量值个数;Ⅱ为连乘符号。
一、分布的集中趋势
【例4-6】 某企业生产某种产品要经过三个连续的作业车间才能完 成。若某月份第一车间粗加工产品的合格率为95%,第二车间精加工产 品的合格率为93%,第三车间最后装配的合格率为90%,则该产品的企 业合格率(三个车间的平均合格率)为多少?
一、分布的集中趋势
此外,从上述表达式中可以看出,加权算术平均 数受两个因素的影响:一是各组的标志值,二是各组 的单位数或频率。当各组的标志值不变时,其出现的 次数f对于平均数的大小起着权衡轻重的作用,统计学 称其为权数。当各组次数相等时,影响平均数的因素 就只有一个,即各组的标志值,这时加权算术平均数 就等于简单算术平均数。可见,简单算术平均数是加 权算术平均数的特例。
一、分布的集中趋势
【例4-13】 表4-9为某企业工人工资资料,试计算其中位数。
表4-9 某企业工人工资资料
一、分布的集中趋势
确定中位数的方法如下: ①计算累计频数,见表4-9第3栏和第4栏。 ②利用公式∑f/2确定中位数的项次,∑f/2=120/2=60。 ③通过观察,找到中位数(以向上累计为例),从向上累计频数可知,从 第41个工人到第80个工人都包含在了第三组中。由此可以判断,第60个 工人也应在第三组里。 ④利用公式求得中位数近似值(以上限公式为例)。
一、分布的集中趋势
解:中位数的位置=(n+1)/2=(11+1)÷2=6,则 中位数为第6号位置的零件数,即Me=x(6)=24件。
一、分布的集中趋势
1. 简单几何平均数
简单几何平均数适用于资料未进行分组 的情况。其计算公式为
(4-8)
式中, xG 为几何平均数;xi为变量值;n为
变量值个数;Ⅱ为连乘符号。
一、分布的集中趋势
【例4-6】 某企业生产某种产品要经过三个连续的作业车间才能完 成。若某月份第一车间粗加工产品的合格率为95%,第二车间精加工产 品的合格率为93%,第三车间最后装配的合格率为90%,则该产品的企 业合格率(三个车间的平均合格率)为多少?
一、分布的集中趋势
此外,从上述表达式中可以看出,加权算术平均 数受两个因素的影响:一是各组的标志值,二是各组 的单位数或频率。当各组的标志值不变时,其出现的 次数f对于平均数的大小起着权衡轻重的作用,统计学 称其为权数。当各组次数相等时,影响平均数的因素 就只有一个,即各组的标志值,这时加权算术平均数 就等于简单算术平均数。可见,简单算术平均数是加 权算术平均数的特例。
一、分布的集中趋势
【例4-13】 表4-9为某企业工人工资资料,试计算其中位数。
表4-9 某企业工人工资资料
一、分布的集中趋势
确定中位数的方法如下: ①计算累计频数,见表4-9第3栏和第4栏。 ②利用公式∑f/2确定中位数的项次,∑f/2=120/2=60。 ③通过观察,找到中位数(以向上累计为例),从向上累计频数可知,从 第41个工人到第80个工人都包含在了第三组中。由此可以判断,第60个 工人也应在第三组里。 ④利用公式求得中位数近似值(以上限公式为例)。
一、分布的集中趋势
解:中位数的位置=(n+1)/2=(11+1)÷2=6,则 中位数为第6号位置的零件数,即Me=x(6)=24件。
统计数据分布特征的测度
• 组中值法:
• ①找出众数组
• ②计算众数组的组中值,该组中值就近似 等于众数
• 这种方法适用于同组内的数据分布比较均 匀,组距不大的组距数列。
• 插补法: • ①.找出众数组
• ②.根据上限或者下限公式确定众数的值 • 这种方法适用于数据分布不均匀的组距数
列。
• 计算(估计):公式
Mˆo Lm
90-100
3
6
合计
50
100
累计次数
按工资分组
42-50 50-58 58-66 66-74 74-82 82-90 90-100
工人数
4 2 18 8 9 6 3
向上累积
4 6 24 32 41 47 50
向下累积
50 46 44 26 18 9 3
• 1.累计次数:50 • 2.确定中位数的位置:25 • 3.确定中位数所在组:66-74 • 4.按照上限公式或者下限公式计算:67
• 强度相对数是两个性质不同而有联系 的统计绝对数之比,说明一种现象在 另一种现象中的强度、密度和普遍程 度。其计算公式为:
• 强度相对数=
某一统计绝对数 另一性质不同有联系的绝对数
2.强度相对数的应用 • 反映客观事物发展的基本状况和质量。 • 反映现象发展水平之间的差距。
• (六)动态相对数
1
1 2
dm
(下限公式)
Mˆ o Um
2 1 2
dm
(上限公式)
某工地有50个工人,本周所得工资分布表, 计算其众数
按工资分组(元)
42-50 50-58 58-66 66-74 74-82 82-90 90-100
工人数(人)(频 数)
4 2 18 8 9 6 3
大学应用统计学经典课件04-数据分布特征的测度
MD=i1
Xi-xFi N
3126.2(4 件) 50
注意:平均差 有量纲! 76
77
78
注意:标准差
也有量纲!
79
标准差可 以有单位
80
为何用总体 计算时自由
度为N?
81
82
83
与平均差有 何区别?
84
平均值的方差多 出的部分
85
86
均值=34 标准差=6
均值=0
标准差=1
11
置
12
13
14
15
16
17
众数组的下限值
众数组的频数
众数前一组的频数
众数的组距 众数后一组的频数
18
搞清楚众数
值与众数频
数的区别
19
20
?
p72
?
21
对比课本P72
对定序数据 如何办?
除分组数据外
22
23
搞清楚中位数 的值与中位数 的位置的区别。
24
25
对比课本P73、例题4.4
价格 =
成交额 成交量
成交 量
成交额 =
价格
∑XiFi/Xi
48
价格 =
成交额 成交量
平均价格 =
全部成交额 全部成交量
全部成交额 平均价格 =
单项成交额
∑ 单项批发价格
成交量 =
成交额 价格
单项成交额 单项成交量 =
单项批发价格
∑ 单项成交量 = 全部成交量
49
成交额 价格 =
成交量
∑XiFi/Xi
单变量或 未分组数 据
42
43
尝试计算这 两组数据的 众数和中值
《描述性统计》课件
定性数据
定性数据是描述性的数据,不能进行数值计算和比 较,例如性别、颜色等。
数据的收集和整理方法
数据收集
通过调查问卷、观察和实验等方 式收集数据。
数据整理
数据验证
对收集到的数据进行清洗和整理, 消除异常值和缺失数据。
对整理后的数据进行验证,确保 数据的准确性和完整性。
频率分布表的制作
频率分布表用于展示数据的分布情况。将数据分组并计算每个组的频数,然后将结果整理成表格形式。
1 平均数
2 中位数
数据集的平均值是所有数 据的总和除以数据的个数。
中位数是将数据按升序排 列后的中间值。它可以帮 助我们了解数据集的中心 位置。
3 众数
众数是数据集中出现频率 最高的值。它可以告诉我 们数据集中最常出现的值 是什么。
描述性统计的数据类型及其特征
定量数据
定量数据是可以用数字表示的数据,例如年龄、收 入等。这些数据可以进行数值计算和比较。
频率分布直方图的绘制
频率分布直方图用于可视化数据的分布。将数据分组并绘制柱状图,柱子的高度表示每个组的频率。
累积频率分布表的制作和应用
累积频率分布表展示了每个组的累积频数。它可以帮助我们了解在某个值之 前有多少数据。
箱线图的绘制及其分析
箱线图可以展示数据的整体分布和离群值。它由一个矩形框和两条延伸出去的线段组成,可以帮助我们快速了 解数据的中值、四分位数和离群值。
描述性统计的应用领域
市场研究
描述性统计可以帮助分析市场数据,了解受众的 特点和偏好。
医学研究
描述性统计可分析
描述性统计在财务数据分析中用于评估企业的财 务状况和趋势。
实际问题
描述性统计在解决实际问题中起到重要作用,比 如预测销售趋势和人口增长。
(04)第4讲 数据的概括性度量
20112011-3-12
Jinling College of Nanjing University
数据分布的特征
集中趋势 (位置 位置) 位置 离散趋势 (分散程度 分散程度) 分散程度 偏态和峰态 (形状) 形状)
20112011-3-12
Jinling College of Nanjing University
4.1.3
数值型数据:平均数
20112011-3-12
Jinling College of Nanjing University
平均数
(mean) 1. 也称为均值 2. 集中趋势的最常用测度值 3. 一组数据的均衡点所在 x 体现了数据的必然性特征 易受极端值的影响 有简单平均数和加权平均数之分 根据总体数据计算的,称为平均数,记为µ; 根据样本数据计算的,称为样本平均数, 记为x
20112011-3-12
第 4 章 数据的概括性度量
本讲主要内容 4.1 集中趋势的度量 4.2 离散程度的度量 4.3 偏态与峰态的度量
20112011-3-12
Jinling College of Nanjing University
第 4 章 数据的概括性度量
本讲主要内容 4.1 集中趋势的度量 4.2 离散程度的度量 4.3 偏态与峰态的度量
集中趋势
(central tendency)
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值 4. 低层次数据的测度值适用于高层次的测量数据,但高 层次数据的测度值并不适用于低层次的测量数据
20112011-3-12
Jinling College of Nanjing University
统计学统计数据分布特征的测度.精选PPT
导入案例
融康保健品公司销售部经理将公司60名员工 年2月份的销售业绩情况 进行了统计后制定 年3月份的员工销售计划。数据如表3-1:
根据表中数据,该经理计算出60名业务员销售额的平均数,以此作为计划的 目标值,因为这个平均数反映了60个数据的集中趋势。同时,为了使计划目 标值更加科学合理,还要考虑业务员个体之间的差异性,即要了解这60名业 务员中最高销售额与最低销售额相差多少,每个业务员的销售额与平均数相 差多少。销售额之间的差异越大,那么由此计算出的平均数的代表性就越差 ;反之,销售额之间的差异越小,那么由此计算出的平均数的代表性就越好 。数据之间的这种差异也是制定计划目标的重要依据。
式中:G为几何平均数;xi为变量值;n为
变量值个数;为连乘符号。
2.加权几何平均数
G x x x x x fi 1 f1 2f2 3f3 nfn fi
fi i
式中:G为几何平均数;xi为每组变量值;
fi为每组频数;代表连乘符号
3.1集中趋势的测度
中位数 1.未分组数据的中位数 2.已分组数据的中位数 ❖ 由单项数列确定中位数 ❖ 由组距数列确定中位数 众数 1.由单项数列确定众数 2.由组距数列确定众数
式中:fi为各组变量值出现的频数。
3.1集中趋势的测度
调和平均数
1.简单调和平均数
H
k x1
nk
k x2
xkn
n
x1i
式中:H为调和平均数。
2.加权调和平均数
H
m1 m1 x1
m2 xm22
mn xmnn
mi
mi xi
3.1集中趋势的测度
几何平均数
1.简单几何平均数
Gnx1x2x3 xnn xi
统计学第4章 数据分布特征的测度(第二版)1
H
i 1
K mi
ቤተ መጻሕፍቲ ባይዱ
x i1 i
xi fi xi fi xi
xi fi x fi
2019/10/19 统计学(第4章)
主讲:王光玲,济南大学经济学院 33
2.加权调和平均数(例题分析)
【例4-8】某蔬菜批发市场三种蔬菜的日成交数据如表计,算栏计
算三种蔬菜该日的平均批发价格。
层次数据的测度值并不适用于低层次的测量数据。
平均数/平均指标
1. 用一个概括性的数值反映总体各单位数量表现的一般 水平。计算平均数是统计分析中最常用的一种方法。
2. 在统计分析中,除了用平均数表现数据资料的集中趋 势外,还常运用平均数进行静态和动态的对比分析, 运用平均数分析现象之间的依存关系。
3. 平均数也是统计推断的一个非常重要的参数。
主讲:王光玲,济南大学经济学院 6
教学内容
利用图表展示数据,可以对数据分布的形状和特征 有一个大致的了解。但要全面把握数据分布的特征, 还要找到反映数据分布特征的各个代表值。
数据分布的特征主要从三个方面进行测度和描述:
一是分布的集中趋势,反映各数据向其中心值靠拢 或聚集的程度;
二是分布的离散程度,反映各数据远离其中心值的 趋势;
主讲:王光玲,济南大学经济学院 15
测定集中趋势的意义:
可以反映现象总体的客观规定性,如计算平均 年龄、平均成绩、平均工资、平均亩产量等 ; 可以对比同类现象在不同的时间、地点和条件 下的一般水平; 可以分析现象之间的依存关系。
2019/10/19 统计学(第4章)
主讲:王光玲,济南大学经济学院 16
某日三种蔬菜的批发成交数据
蔬菜 名称
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一组数据为 x1 公式可表达为 :
x2 …… xn
,其简单算术平均数计算的一般
x1 x 2 x n x n
xi
n
(一)算术平均数
例如:为了研究目前大学中班级学生人数的情况,从北京
某大学抽样五个班级,其学生人数分别为:46,54,42, 46,32。我们使用x1,x2,……x5 ,分别表示该五个数据,计 算其均值,可以写成:
(三)几何平均数
1.简单几何平均数 假定有n个变量值x1,x2,……xn,则简单几何平均数的基本计算
公式为:
G n x1 x2 xn n
x
i 1
n
i
(三)几何平均数
2.加权几何平均数 当掌握的数据资料为分组资料,且各个变量值出现的次数不
相同时,应用加权方法计算几何平均数。 加权几何平均数的公式为:
(二)调和平均数
调和平均数(Harmonic
mean)是均值的另一种重要表示形式, 由于它是根据变量值倒数计算的,也叫倒数平均数,一般用 字母表示 Hm。 根据所给资料情况的不同,调和平均数可分为:简单调和平 均数和加权调和平均数两种。
(二)调和平均数
1.简单调和平均数
Hm
n 1 1 1 x1 x2 xn
G
f1 f 2 f n
x x x
f1 f 2 1 2
fn n
f1 f 2 f n
x
i 1
n
i
fi
二、位置平均数
数值平均数是根据所提供资料的具体数值计算而得到,和 我们通常观念中的平均含义比较接近,但结果受极端值的 影响而不能真实地反应该组资料的整体集中趋势, 在这种情况下,一般可以考虑用位置平均数取代算术平均 数来对数据的集中趋势进行描述。 常用的位置平均数有:中位数、众数、分位数。
f m 1 ——从高到低累计至众数所在组后一组的次数;
i ——众数所在组的组距。
(三)分位数
中位数是从中间点将全部数据等分为两部分。与中位数类似
的还有四分位数、八分位数、十分位数和百分位数等。它们 分别是用3个点、7个点、9个点和99个点将数据四等分、八等 分、十等分和100等分后各分位点上的值。这里只介绍百分位 数和四分位数的计算,其他分位数与之类似。
(三)分位数
1.百分位数
(一)中位数
1.根据未分组数据确定中位数 对于未分组的数据,确定其中位数的具体步骤为: (1)将变量按变量值大小从小到大进行排列。 (2)确定中位数的位置,即中点位置。一般的,设一组数据
的个数为 n ,则中点的位置为(n+1)/2 。 (3)确定中位数。
(一)中位数
如果观测值的数目n为奇数,则(n+1)/2为整数,该位置上
一、数值平均数
数值平均数又称均值(Mean),是根据统计资料的数值计
算而得到,在统计学中具有重要的作用和地位,是度量集 中趋势的最主要的指标之一。 平均的对象可理解为变量 ,平均数可记为 。
x
x
(一)算术平均数
1.简单算术平均数 简单算术平均数是根据原始数据直接计算均值。一般地,设
i
由此可以看出,当权重mi相等时,则加权调和平 均数则转换为简单调和平均数。
(二)调和平均数
3.调和平均数是算术平均数的变形
在一定的条件下,加权调和平均数和加权算术平均数只是计算
形式不同,在经济内容上没有实质性的区别,调和平均数是算 术平均数的变形,是在缺少总体单位的资料时才被迫使用的计 算平均数的一种方法。即:
第4章 描述统计中的测度
教学目的要求 教学目的要求
学习描述统计中的测度,计算数据的集中 趋势、离散趋势和分布形态,是为了更深入的分 析数据,挖掘更多有价值的信息。而我们要用代 表性的数量特征值来准确地描述统计数据的分布, 就要理解各测度指标的概念,掌握各指标的计算 方法。
教学要点
●数据分布的特征和规律 ●均值、中位数、众数的概念和计算 ●均值、中位数、众数的比较 ●分布偏态和峰度的测度 ●用Excel计算描述统计量
m1 m2 mn Hm mn m1 m2 x1 x2 xn
mi mi x
i
xi f i xi f i x
i
xi f i fi
x
(三)几何平均数
几何平均数(Geometric
mean)是个变量值连乘积的次方根,常 用字母表示。它是平均指标的另一种计算形式。 几何平均数是计算平均比率和平均速度最适用的一种方法。 根据掌握的数据资料不同,几何平均数可分为简单几何平均 数和加权几何平均数两种。
所对应的变量即为所求的中位数 如果观测值的数目n为偶数,则 (n+1)/2为非整数,则取位 于中间位置的两个变量值的算术平均数作为中位数。
(一)中位数
2.根据单项数列确定中位数 根据单项数列资料确定中位数与根据未分组资料确定中位数
方法基本一致。具体步骤为: (1)计算各组的累计次数(或频数) fi 1 (2)确定中位数的位置,k 。 2 (3)确定中位数。中位数所在组的变量值即为中位数Me 。
xi x n
x1 x 2 x3 x 4 x5 46 54 42 46 32 44 5 5
(一)算术平均数
2.加权算术平均数 加权算术平均数计算的所依靠的数据是经过一定整理的,即
是根据一定规则分组的。可分为 (1)由数列计算加权算术平均数 (2)根据组距计算加权算术平均数
(一)算术平均数
(1)由数列计算加权算术平均数 由单项变量数列计算加权算术平均数的基础是要先将数据进
行分组,即将n个数据按变量值(xi)进行分组,并统计在各 个变量取值出现的次数,或称为频数( fi )。其加权算术平 均数的计算公式如下:
x1 f 1 x 2 f 2 x n f n x f1 f 2 f n
fi
上限公式: M e U 2
fm 式中: L ——中位数所在组的下限; U ——中位数所在组的上限; S m 1 ——从低到高累计至中位数所在组前一组止的次数; S m 1 ——从高到低累计至中位数所在组后一组止的次数;
i
f m ——中位数所在组的次数; i ——中位数所在组的组距。
第一节 集中趋势测度 第二节 离散趋势测度 第三节 分布形状测度 第四节 如何用Excel计算
第一节 集中趋势测度
一、数值平均数
算术平均数、调和平均数、几何平均数
二、位置平均数
中位数、众数、分位数
三、众数、中位数与均值的比较
集中趋势(General
tendency)是指分布的定位,它是指一组 数据向某一中心值靠拢的倾向,或是表明一组统计数据所具 有的一般水平。 对集中趋势进行测度也就是寻找数据一般水平的代表值或中 心值。 对集中趋势的度量有数值平均数和位置平均数之分。
xi f i xi f i n fi
(一)算术平均数
设某班级10名同学的年龄分别为:18,19,17,18,17,
18,19,18,18,19。则根据简单平均数的公式,我们可 计算得到该班10名同学的平均年龄:
x i 18 19 17 18 17 18 19 18 18 19 x 18 n 10
(二)众数
众数(Mode)是一组数据中出现次数最多的那个变量值,通常用MO表示。
如果在一个总体当中,各变量值皆不相同,或各个变量值出现的次数皆 相同,则没有众数。 如果在一个总体中,有两个标志值出现的次数都最多,称为双众数。 只有在总体单位比较多、变量值又有明显集中趋势的条件下确定的众数 ,才能代表总体的一般水平; 在总体单位较少,或虽多但无明显集中趋势的条件下,众数的确定是没 有意义的。 众数的确定方法要根据给定资料的具体情况而定。
n
1 xi
事实上简单调和平均数是权数均相等条件下的 加权调和平均数的特例。当权数不相等时,就 产生了通常所说的加权调和平均数。
(二)调和平均数
2.加权调和平均数 用公式表示为:
m1 m 2 m n Hm mn m1 m 2 x1 x2 xn
mi mi x
简单、容易许多。根据组距计算加权平均数的方法与上面所 述的数列加权平均数方法基本相同,只需以各组的组中值来 代替相应的x值即可
(一)算术平均数
①简单算术平均数适用于数据量较少的未分组数据;加权
算术平均数则只适用于分组数据,且在进行数据分组时, 可以根据每个变量的取值来分组,亦或根据一定的区间来 分组,这应该根据所针对问题的具体数据来来选取。 ②简单算术平均数其数值的大小只与变量值的大小有关; 对最终加权平均数大小的影响因素有两个:一是各组变量 值的影响;另一个是各组变量值的频数的影响。
(一)算术平均数
年龄(岁)
17 18 19 合计
x
人数
2 6 2 10
f
人数比重
f
f
2/10 (0.2) 6/10 (0.6) 2/10 (0.2) 1
xi f i x 17 2 18 6 19 2 / 2 6 2 18 f
(一)算术平均数
(2)根据组距计算加权算术平均数 选择适当的组距来对数据进行分组,再求加权平均数往往就
(一)中位数
3.根据组距数列确定中位数
如果我们掌握的资料是分组后得到的组距数列,则确定中
位数的步骤为: fi 1 k (1)确定中位数的位置 。 2 (2)计算累计次数,据以找出中位数所在的组。 (3)利用以下公式,确定中位数的近似值
(一)中位数
fi
下限公式: M e L 2 s m 1 fm s m 1 i