统计学第4章 数据分布特征的测度(第二版)1

合集下载

统计学课后题答案_吴风庆_王艳明

统计学课后题答案_吴风庆_王艳明

《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。

10第4章 数据分布的特征的测度

10第4章 数据分布的特征的测度

第4 章数据分布特征的测度(进行一些描述性的计算)4.1集中趋势的度量4.2 离散程度的度量4.3数据分布的性质4.4 偏态与峰度的度量441数据分布的特征集中趋势(位置)离中趋势(分散程度)偏态和峰态(形状)2414.1 集中趋势的度量4.1.1 分类数据:众数4.1.2 顺序数据:中位数和分位数4.1.3 数值型数据:平均数4.1.4 众数、中位数和平均数的比较414众数中位数和平均数的比较3集中趋势(central tendency)1.测度集中趋势就是寻找数据水平的代表值或中心值值22.不同类型的数据用不同的集中趋势测度值低层次数据的测度值用于高层次的测数据3.低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据44.1.1 分类数据的集中趋势的测度•众数(mode):一组数据中出现次数最多的变量值•组数据中出现次数最多的变量值•注:顺序数据和数值型数据显然也有众数5例:分类数据的众数籍贯的频数分布百分比•解:这里的变量为解:这里的变量为““籍贯频数比例(%)上海1503030籍贯籍贯””,这是个分类变量变量,,不同类型的籍浙江江苏110.300.2201822贯就是变量值•众数为众数为““上海上海””这一山东辽宁960.180.120181812品牌品牌,,即•Mo =上海广东90.1818海合计501100顺序数据的众数甲城市家庭对住房状况评价的频数分布甲城市Mo =不满意回答类别户数(户)百分比(%)非常不满意不满意24108836一般满意93453115非常满意30101000合计300100.0数值型数据的众数(mode)•无众数个众数原始数据: 10 5 9 12 6 8一个众数原始数据: 6 5 9 8 5 5多于一个众数:252828364242原始数据: 25 28 28 36 42 428(d)众数(mode)•适合于数据量较多且有明显的集中趋势时使用•不受极端值的影响•一组数据可能没有众数或有几个众数(multimodal: 多众数的)•主要用于分类数据,也可用于顺序数据和数值型数据94124.1.2 顺序数据•中位数(Median):•排序后处于中间•分位数:四分位数十分位置上的值•四分位数,十分位数,百分位数。

第4章 数据分布特征的度量(1).ppt

第4章 数据分布特征的度量(1).ppt

2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
例4.2 利用第三章中例3.1中某学期某班35名学生统计学考试成绩的 原始数据。
要求 试计算计算该班35名学生统计学考试成绩的众数。 解 将该原始数据排序之后,得到有序数据如下 52,56,62,64,65,69,70,74,75,75,76,78,78,79,79, 81,82,82,83,84,84,84,84,86,87,87,88,89,89,90, 91,91,92,96,98
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
MO
2020年11月12日/下午11时15分
《统计学教程》
第4章 数据分布特征的度量
4.1 集中趋势的度量
4.1 集中趋势的度量
原始数据经过分组整理所形成的频数分布,直观和概略地反映出数据 分布的基本特征。频数分布属于对数据分布特征的初步描述,缺乏对数 据分布特征的综合度量,若需要深入地表述数据分布特征的具体特征和 内在联系,还应对数据分布特征进行综合性的度量。
数据分布特征的度量包括三个方面的内容,一是数据分布的集中趋势, 反映总体中各个单位的数值水平向其聚集,或者集中的中心数值;二是 数据分布的离散趋势,反映总体中各个单位的数值水平偏离中心数值的 综合程度;三是数据分布的偏态和峰度,反映各个总体单位的数值水平 的分布形态是对称或偏倚,平坦或尖耸的具体数值。
4.1.1众数 众数(Mode)是一组数据中频数最大的变量值,直观地反映了数据的

第4章 数据分布特征的测度

第4章 数据分布特征的测度

%
%
%
%
甲车间 120 38 31.7 40 33.3 42 乙车间 120 20 16.7 40 33.3 60
35 120 100 50 120 100
H
35
一、数值型数据的离中趋势测度 (一)极差(全距Range)

极差(R)=最大标志值-最小标志值(原始数据)
如前例中,R甲90050040(0 元) R乙80060020(0 元)
20 100

人数分布(f ): 8
1
1
n
xi
x甲i1 n
012 01108 08(2 分 ) 10
n
xi
x乙i1n
082 0110101(2 分 ) 10
H
21
均值的基本数学性质
1. 各变量值与均值的离差之和等于零
n
(xi x) 0
i1
2. 各变量值与均值的离差平方和最小
n
(xi x)2 min
• 四分位数是位置平均数,不受极端值的影响;
• 主要用于顺序数据,也可用于数值型数据,
但不能用于分类数据;
Q
L
位置
n 1 4
Q
U
位置
3(n 1) 4
Q
L
位置
n 4
Q
U
位置
3n 4
H
14
• 例 计算甲城市家庭对住房满意状况评价的四分 位数。
• 解:QL位置= (300)/4 =75

QU位置 =(3×300)/4=225
向上累积
户数 百分比
(户)
(%)
向下累积 户数 百分比 (户) (%)
24

第4章 数据分布特征的测度共64页文档

第4章 数据分布特征的测度共64页文档

定序数据的众数(例题分析)
表4-1 某城市家庭对住房状况评价的频数分布
回答类别
非常不满意 不满意 一般 满意 非常满意
合计
户数 (户) 百分比 (%)
24
8
108
36
93
31
45
15
30
10
300
100.0
解:这里的数据为定 序数据。变量为“回 答类别”
该城市中对住房表 示不满意的户数最多 , 为 108 户 , 因 此 众 数为“不满意”这一 类别,即
位 置 n110 15.5 22
中位数 9601080 1020 2
箱式图
中位数(位置和数值的确定)
位置确定 数值确定
中位数位 n置 1 2Leabharlann Mex12n2x1n2
x
n21
n为奇数 n为偶数
未分组数据—箱线图(box plot)
1. 用于显示未分组的原始数据的分布; 2. 由一组数据的5个特征值绘制而成,它由一个箱子
4 6 8 10 12
Median/Quart./Range箱线图
单批数据箱线图
最小值 141
下四分位数 中位数 上四分位数
170.8
182
197
最大值 237
140 150 160 170 180 190 200 210 220 230 240
某电脑公司销售量数据的 Median/Quart./Range箱线图
调和平均数 平均数 数值型数据
几何平均数
定类数据
众数 (位置平均数)
中位数
定序数据
低层次数据的集中趋势测度值适用于高层次 的测量数据,反过来,高层次数据的集中趋 势测度值并不适用于低层次的测量数据

第四章 数据分布特征的测度

第四章  数据分布特征的测度

第四章数据分布特征的测度学习目的和要求:通过本章的学习,掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。

难点释疑:(一)算术平均数通常用来反映总体分布的集中趋势,调和平均数往往只作为算术平均数的变形来使用,即在已知标志总量而未知总体单位总量的情况下计算调和平均数;而几何平均数较适用于计算平均比率和平均速度。

(二)调和平均数虽然是根据标志值的倒数计算的,但其结果不等于算术平均数的倒数。

在计算和应用平均指标时,除了考虑数理方面的要求外,更重要的是要考虑其现实的经济意义。

(三)平均数的性质是简捷计算法的基础,也是计算标志变异指标的基础。

掌握中位数和众数与算术平均数的关系的目的是能够根据其中的两个平均数大体计算出第三个平均数,并判断总体的分布状态。

(四)全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。

全距是描述数据离散程度的最简单测度值,它计算简单,易于理解,但不能全面反映总体各单位标志值的差异程度。

标准差与平均差的意义基本相同,但在数学性质上比平均差要优越,所以,在反映标志变动度大小时,一般都采用标准差。

标准差是实际中应用最广泛的离散程度测度值。

(五)标准差系数的应用。

为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。

它是标志变异的相对指标。

它既消除了变量数列变量值差异程度的影响,也消除了变量数列水平高低的影响。

练习题:(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)1.平均指标反映了()。

①总体变量值分布的集中趋势②总体分布的离散特征③总体单位的集中趋势④总体变动趋势2.加权算术平均数的大小( )。

①受各组标志值的影响最大 ②受各组次数的影响最大③受各组权数系数的影响最大 ④受各组标志值和各组次数的共同影响3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( )。

统计数据分布特征的测度

统计数据分布特征的测度

• 组中值法:
• ①找出众数组
• ②计算众数组的组中值,该组中值就近似 等于众数
• 这种方法适用于同组内的数据分布比较均 匀,组距不大的组距数列。
• 插补法: • ①.找出众数组
• ②.根据上限或者下限公式确定众数的值 • 这种方法适用于数据分布不均匀的组距数
列。
• 计算(估计):公式
Mˆo Lm
90-100
3
6
合计
50
100
累计次数
按工资分组
42-50 50-58 58-66 66-74 74-82 82-90 90-100
工人数
4 2 18 8 9 6 3
向上累积
4 6 24 32 41 47 50
向下累积
50 46 44 26 18 9 3
• 1.累计次数:50 • 2.确定中位数的位置:25 • 3.确定中位数所在组:66-74 • 4.按照上限公式或者下限公式计算:67
• 强度相对数是两个性质不同而有联系 的统计绝对数之比,说明一种现象在 另一种现象中的强度、密度和普遍程 度。其计算公式为:
• 强度相对数=
某一统计绝对数 另一性质不同有联系的绝对数
2.强度相对数的应用 • 反映客观事物发展的基本状况和质量。 • 反映现象发展水平之间的差距。
• (六)动态相对数
1
1 2
dm
(下限公式)
Mˆ o Um
2 1 2
dm
(上限公式)
某工地有50个工人,本周所得工资分布表, 计算其众数
按工资分组(元)
42-50 50-58 58-66 66-74 74-82 82-90 90-100
工人数(人)(频 数)
4 2 18 8 9 6 3

统计学第4章 数据分布特征的测度(第二版)1

统计学第4章 数据分布特征的测度(第二版)1

H
i 1
K mi
ቤተ መጻሕፍቲ ባይዱ

x i1 i
xi fi xi fi xi
xi fi x fi
2019/10/19 统计学(第4章)
主讲:王光玲,济南大学经济学院 33
2.加权调和平均数(例题分析)
【例4-8】某蔬菜批发市场三种蔬菜的日成交数据如表计,算栏计
算三种蔬菜该日的平均批发价格。
层次数据的测度值并不适用于低层次的测量数据。
平均数/平均指标
1. 用一个概括性的数值反映总体各单位数量表现的一般 水平。计算平均数是统计分析中最常用的一种方法。
2. 在统计分析中,除了用平均数表现数据资料的集中趋 势外,还常运用平均数进行静态和动态的对比分析, 运用平均数分析现象之间的依存关系。
3. 平均数也是统计推断的一个非常重要的参数。
主讲:王光玲,济南大学经济学院 6
教学内容
利用图表展示数据,可以对数据分布的形状和特征 有一个大致的了解。但要全面把握数据分布的特征, 还要找到反映数据分布特征的各个代表值。
数据分布的特征主要从三个方面进行测度和描述:
一是分布的集中趋势,反映各数据向其中心值靠拢 或聚集的程度;
二是分布的离散程度,反映各数据远离其中心值的 趋势;
主讲:王光玲,济南大学经济学院 15
测定集中趋势的意义:
可以反映现象总体的客观规定性,如计算平均 年龄、平均成绩、平均工资、平均亩产量等 ; 可以对比同类现象在不同的时间、地点和条件 下的一般水平; 可以分析现象之间的依存关系。
2019/10/19 统计学(第4章)
主讲:王光玲,济南大学经济学院 16
某日三种蔬菜的批发成交数据
蔬菜 名称

统计学第4章_统计数据分布特征的度量

统计学第4章_统计数据分布特征的度量

类型
结构相对数 比例相对数 比较相对数 动态相对数 强度相对数
相对指标比较
计算 方法
同一 总体
总体部分指标数值 总体全部数值

总体部分指标数值
总体其他部分数值

某条件下某类指标数值
另一条件下同类指标数 值 否
报告期指标数值
基期指标数值

某一总量指标数值

另一总量指标数值
实际完成数
计划任务数

同类 指标
X G 5 0.95 0.92 0.90 0.85 0.80 5 0.5349 88.24﹪
【例】某金融机构以复利计息。近12年来的年 利率有4年为3﹪,2年为5﹪,2年为8﹪,3年 为10﹪,1年为15﹪。求平均年利率。
解:
X G 42 1 1 0.034 1 0.052 1 0.15
n n1
(2)加权调和平均数(分组)
x i1 i
n
xH
m1 m2 ... mn
m1 m2 ... mn
x1
x2
xn
mi
i1
n mi
x i1 i
3.几何平均数 是变量值的连乘积开变量值的项数次方。 (1)简单几何平均数---末分组
n
xG n x1.x2 ...xn n xi i 1
12 2.2154 106.85﹪ 平均年利率 X G 1 106.85﹪1 6.85﹪
案例分析 某公司的生产情况如下: (单位:万元)
计划
第四季度工业增加值


绝对值
比重%
完成计划 %
第三季度 实际工 业增加 值
报告期 比基 期%

1
2

第4章 数据的分布特征的测定

第4章 数据的分布特征的测定

4 N+ 下四分位数(QL)位置 = 1 4 3(N+1) 上四分位数(QU)位置 = 4
4 - 23
经济、管理类 基础课程
顺序数据的四分位数
(算例)
统计学
【例4.4】根据第三章表3-2中的数据,计算甲城市家庭对住房 满意状况评价的四分位数
表3-2 甲城市家庭对住房状况评价的频数分布 解:下四分位数(QL)的位置为: QL位置=(300)/4=75 上四分位数(QL)的位置为: QU位置=(3×300)/4=225 从累计频数看, QL在“不满意 ”这一组别中; QU在“一般” 这一组别中。因此 QL =不满意 QU =一般
偏 态
均 值
4-3
异众比率 四分位差 方差和标准差 离散系数
峰 度
经济、管理类 基础课程
统计学
第一节 集中趋势的测度
一、集中趋势的含义 二、众数 三、中位数 四、均值 五、众数、中位数和均值的比较
4-4
经济、管理类 基础课程
一、集中趋势
(Central tendency)
统计学
1. 一组数据向其中心值靠拢的倾向和程度 2. 测度集中趋势就是寻找数据一般水平的代表值或中心值 3. 不同类型的数据用不同的集中趋势测度值
中位数
(位置的确定)
统计学
N 顺序数据与分组 中位数位置 2 数据: N 1 未分组数据: 中位数位置 2
4 - 15
经济、管理类 基础课程
顺序数据的中位数
(算例)
统计学
【例4.2】根据第三章表3-2中的数 据,计算甲城市家庭对住房满意状 况评价的中位数
表3-2 甲城市家庭对住房状况评价的频数分布
X 1 F1 X 2 F2 X N FN X F1 F2 FN

第四章 数据分布特征的测度

第四章 数据分布特征的测度

第四章数据分布特征的测度【教学要求】了解绝对数和相对数的概念及作用,掌握绝对数的种类、相对数的种类及应用;掌握集中趋势的测度方法,掌握算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;掌握离散程度的测度方法,理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用;了解偏态与峰度的测度方法。

【知识点】绝对数、相对数、术平均数、调和平均数、几何平均数、众数、中位数、全距、四分位差、异众比率、平均差、标准差、离散系数【本章重点】相对数的种类及应用;算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用。

【本章难点】算术平均数、调和平均数、几何平均数、众数、中位数的计算方法及应用;理解全距、四分位差、异众比率、平均差的概念及计算方法,掌握标准差、离散系数的计算方法及应用。

【教学内容】第一节绝对数和相对数统计指标就其具体内容来讲非常多,可谓成千上万,但从其基本形式看,则不外乎总量指标、相对指标和平均指标三种类型,统称统计综合指标。

一、绝对数(一)绝对数的概念和种类1、绝对数的作用主要表现在:(1)绝对数可以反映一个国家、地区、部门或单位的基本情况(2)绝对数是制定政策、编制计划以及进行科学管理的重要依据(3)绝对数是计算相对数和平均数的基础相对数和平均数是由两个有联系的总量指标对比计算出来的统计综合指标,无论是相对指标还是平均指标,都是总量指标的派生指标,没有总量指标就不会有相对指标和平均指标。

例如,职工劳动生产率、职工平均工资、宏观经济增长速度、国民经济发展的重要比例关系、农作物单位面积产量等都是在总量指标的基础上计算出来的。

(二)绝对数的种类1、按反映总体内容不同分为总体单位总量和总体标志总量。

例、某业企业职工人数1,000人,工资总额1980,000元。

第四章数据分布特征的度量 (1)

第四章数据分布特征的度量 (1)

第四章思考与习题一、思考题1.什么是集中趋势?测度集中趋势常用指标有哪些?2.算术均值.众数和中位数有何关系?3.什么是几何平均数?其适用场合是什么?4.什么叫离散趋势?测度离散趋势常用指标有哪些?5.为什么要计算离散系数?二、练习题(一)填空题1.统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势离散程度偏斜和峰度__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。

2.在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:,则其众数为,中位数为。

3.算术均值有两个重要数学性质:各变量值与其算术均值的__________等于零;各变量值与其算术均值的__________等于最小值。

4.简单算术均值是__________的特例。

4.几何均值主要用于计算__________的平均。

5.在一组数据分布中,当算术均值大于中位数大于众数时属于________分布;当算术均值小于中位数小于众数时属于________分布。

6.__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。

7.为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。

8.偏态是对数据分布__________或__________的测度;而峰度是对数据分布_________的测度。

(二)判断题1.众数的大小只取决于众数组与相邻组次数的多少。

()2.当总体单位数n为奇数时,中位数=(n+1)/2。

()3.根据组距分组数据计算的均值是一个近似值。

()4.若已知甲企业工资的标准差小于乙企业,则可断言:甲企业平均工资的代表性好于乙企业。

()5.标准分数只是将原始数据进行线性变换,没有改变该组数据分布的形状,也没有改变一个数据在该组数据中的位置,只是使该组数据的均值为0,标准差为1。

统计数据分布特征的度量.精选PPT

统计数据分布特征的度量.精选PPT
当且仅当所有变量值都相等时三者相等。
(3)平均数是代表值 计划完成程度相对数是用来检查、监督计划执行情况的一个分析指标,它是以现象在某一段时间内的实际完成数与计划数对比,来观
察计划完成程度,一般用百分数来表示计划完成程度相对数基本计算公式为:
集中趋势的测度,主要是计算各种平均数,平均数,也称平均指标,是表示同类社会经济现象在一定的时间、地点、条件下所达到的
结构相对数 总体 总某 体部 全分 部或 数组 值的 10数 0%
(2)比例相对数 比例相对数是反映总体内部各个组成
部分之间的比例关系和均衡状况的综 合指标。计算公式为:
比例相对数 总 总体 体中 中另 某一 一部 部分 分 10数 数0%值 值
(3)比较相对数 比较相对数是将不同地区、单位或企业
之间的同类指标数值作静态对比而得出的 综合指标,表明同类事物在不同空间条件 下的差异程度或相对状态,用以说明某一 同类现象在同一时间内不同空间发展的不 平衡程度,以表明同类实物在不同条件下 的数量对比关系。其计算公式为:
比较相对 甲 乙数 地 地区 区( (单 单位 位 某 同或 或 类 类企 企 指 指业 业 标 标 1) 0) 数 数 % 0 值 值
(4)所计算总体的同质性 一般水平的代表值,如平均工资、平均价格、平均单位成本、平均亩产量等。
货币单位是以货币作为价值尺度来计量的绝对数,如国民生产总值、国民收入、商品销售额、工资总额等都是以货币单位(“元”、
“万元”、“亿元”等)计量的。 (3) 利用平均数可以比较同类现象在不同时间上的发展变化趋势 数值平均数是根据所有变量值计算的平均数,而位置平均数是根据变量值所处的特殊位置确定平均数的,具体有众数与中位数两种。 平均差是数列中各单位标志值与平均数之间绝对离差的平均数。 强度相对数有正指标、逆指标之分。 算术平均数有两个重要数学性质: 在实际应用中可以把这三种平均数结合起来,通过比较三者之间的数量关系分析变量分布的特征。 劳动量单位是用劳动时间表示的计量单位,也是一种复合单位,是工人数与劳动时间的乘积,如“工时”、“工日”等。 简单形式与加权形式:
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

3.加权算术平均数与简单算术平均 数的关系
当各组变量值出现的频数或频率相等,即当

时,权数的作用就消失了,这就意味着各组变量值对总 平均的结果所起的作用是一样的,此时,加权算术平均 数就等于简单算术平均数。
(二)调和平均数(Harmonic mean ) (见P86)
1.集中趋势的测度值之一 2.均值的另一种表现形式 3.易受极端值的影响 4.有简单调和平均数和加权调和平均数两种
某汽车配件厂工人每人每日加工某种零件情况
(件/人)
2.加权算术平均数(Weighted mean)
(例题分析)
【例4-3】已知某储蓄所为120个企业的贷款情况见下表,
求该储蓄所平均为每个企业提供的贷款额。
某储蓄所贷款情况表
k
x
xi fi
i 1 k
fi
5620 46.83 120
(万元)
i 1
数值平均数
2.顺序数据:中位数
分位数 3.分类数据:众数
位置平均数
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 18
数值型数据:平均数
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 19
(一)算术平均数(mean) (见P82)
1.也称为均值
2.集中趋势的最常用测度值
x
基本计算公式:
算术平均数=
总体标志总量 总体单位总量
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 20
(一)算术平均数(mean) (见P82)
3.一组数据的均衡点所在
体现了数据的必然性特征
x
4.易受极端值的影响
5.有简单算术平均数和加权算术平均数之分
6.根据总体数据计算的,称为总体平均数,记为;
几何平均:
G 4 104.5% 102.1% 125.5% 101.9% 1
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 29
1.简单调和平均数
【例4-7】某种蔬菜的价格,甲集市4.5元/千克, 乙集市4元/千克,丙集市5.5元/千克。若在三 个集市各买1元,求蔬菜的平均价格。
甲集市购买蔬菜的数量 1 0.2(2 千克) 4.5
乙集市购买蔬菜的数量 1 0.2(5 千克) 4
丙集市购买蔬菜的数量 1 0.1(8 千克) 5.5
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 30
1.简单调和平均数
蔬菜平均价格 111 4.6(2 元/ 千克) 1 1 1 4.5 4 5.5
简单调和平均数又称倒数平均数。计算公式为:
H
1 1 1 1
n 1 1 1
众数 中位数 平均数
离散程度
分布的形状
异众比率 四分位差 方差和标准差 离散系数
偏态 峰态
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 9
教学内容
4.1 集中趋势的测定 4.2 离散程度的测定 4.3 数据分布的偏态和峰度 4.4 用Excel计算描述统计量并进行分析
本节将重点讨论数据分布特征各测度值 的计算方法、特点及其应用场合。
N
N
X N i1 X i
N
2.加权算术平均数 (Weighted mean)
计算公式
设各组的变量值(组中值)为:x1 ,x2 ,… ,xk
相应的频数为: 样本加权平均数
f1 ,f2 ,… ,fk
k
x x1 f1 x2 f2 f1 f2
xk fk fk
xi fi
i 1 k
fi
三是分布的形状,反映数据分布偏斜程度和峰度。
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 7
数据分布的特征
集中趋势 (聚集程度)
离中趋势 (分散程度)
偏态和峰态 (形状)
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 8
数据分布特征的测度
数据特征的测度
集中趋势
3.主要用于计算平均比率或平均速度
(三)几何平均数(geometric mean)
(计算公式)
4. 计算公式 (1)简单几何平均数
n
G n x1 x2 L xn n xi i1
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 37
(三)几何平均数(geometric mean)
欢迎学习《统计学》课程
主讲: 王光玲
《统计学》 第四章 数据分布特征的测度
济南大学经济学院 王光玲
统计学(第4章)
主讲:王光玲,济南大学经济学院
统计研究目的
统计设计
客观 现象 数量 表现
4/4/2020






分 析
统计


总体


描 述 分
数量 特征
统计研究的程序 析
统计学(第4章)
主讲:王光玲,济南大学经济学院 3
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 5
重点、难点
重点:平均指标和变异指标的概念、种类、 计算方法。尤其是加权算术平均指标和加权 调和平均指标的计算、标准差和标准差系数 的计算。
难点 :各综合指标的计算方法、适应条件 及其关系。利用EXSEL进行统计处理。
4/4/2020 统计学(第4章)
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 14
平均数或平均指标
表明同类社会经济现象在一定 时间、地点条件下达到的一般 水平,是总体内各单位某一数 量标志的不同标志值的代表值。
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 15
测定集中趋势的意义:
可以反映现象总体的客观规定性,如计算平均 年龄、平均成绩、平均工资、平均亩产量等 ; 可以对比同类现象在不同的时间、地点和条件 下的一般水平; 可以分析现象之间的依存关系。
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 32
2.加权调和平均数
设 m xf ,则计算公式为:
K
H m1 m2 L
m1 m2 L
mk mk
mi
i 1
K mi
x1 x2
xk
x i1 i
原来只是 计算时使 用了不同 的数据!
K
mi
H
i 1
K mi
x i1 i
集中趋势
(Central tendency)
1. 一组数据向其中心值靠拢的倾向和程度; 2. 测度集中趋势就是寻找数据水平的代表值或中心值; 3. 不同类型的数据用不同的集中趋势测度值; 4. 低层次数据的测度值适用于高层次的测量数据,但高
层次数据的测度值并不适用于低层次的测量数据。
平均数/平均指标
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 10
4.1 集中趋势的测定
4.1.1 集中趋势的涵义 4.1.2 集中趋势的度量
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 11
集中趋势
(见P82)
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 12
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 16
集中趋势的度量 (P82)
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 17
平均指标的种类及计算方法
根据数据的类型和特点选用不同的测度值来反映数 据的集中趋势
★1.数值型数据:
算术平均数
均值 调和平均数 几何平均数
n n1
x1 x2
xn x1 x2
xn x i1 i
n
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 31
2.加权调和平均数
在上例中,如果在甲集市花费8元,乙集市花 费10元,丙集市花费5元,购买这些蔬菜的平 均价格是多少? 蔬菜平均价格 8 10 5 4.4(3 元/ 千克) 8 10 5 4.5 4 5.5
当平均数的分子资料未知时,采用加 权算术平均数方法计算平均数;
当分母资料未知时,采用加权调和平 均数方法计算平均数。
4/4/2020 统计学(第4章)
主讲:王光玲,济南大学经济学院 35
(三)几何平均数(geometric mean)
(见P87)
1. n 个变量值连乘积的 n 次方根
2.适用于对比率数据的平均,而且各比率的乘积等于 总的比率
频率(%)
fi
fi
xi .
fi fi
6
10
50
600-800
700
14
23.33
163.31
800-1000 900
26
43.33
389.97
1000-1200 1100
10
16.67
183.37
1200以上 1300
4
6.67
86.71
合计
--
60
100
873.36
x xi· fi 873.36(元) fi
k
x
xi fi
i 1 k
k
xi ·k fi
fi
i 1
fi
i 1
i 1
2.加权算术平均数(Weighted mean)
(以频率为权数计算均值)
【例4-4】某企业60名工人月工资分组情况如下表, 试
相关文档
最新文档