数据资料的统计描述:数值计算
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
h
12
特点:
1.集中趋势的测度值之一;
2.出现次数最多的变量值;
3.不受极端值的影响;
4.可能没有众数或有几个众数;
5.适用于定类数据、定序数据、定距数据和定比数据。
众数的不唯一性:
• 无众数原始数据: 10 5 9 12 6 8
• 一个众数原始数据: 6 5 9 8 5 5
• 多于一个众数原始数据: 25 28 28 36 42 42
h
3
前言
统计数据的分布特征可以从两个方面进行描述:一是数据分布的集中趋势,二是数据分布的离散程度。 集中趋势和离散程度是数据分布特征对立统一的两个方面。 本章通过介绍平均指标和变异指标这两种统计指标的概念及计算来讨论反映数据集中趋势和分散程度的
两个方面的特征。
h
4
第一节 数据分布集中趋势的测定
h
15
基于这种思路,借助于几何图形而导出的分组数据众数的计算公式 如下:
M0
L ( fm
fm f1 f1)( fm
i f1)
其中:L表M 示众0数 所U 在组 的(下f限m ; U表示f f众1 m 数) 所在(f组 f1 m 的上限f;i1表)示众i数所在组的 组距;fm为众数组的频数;f-1为众数组前一组的频数;f+1为众数组后一组 的频数。
h
17
五、中位数
(一)概念
中位数是将总体各单位标志值按大小顺序排列后,处于中间位置的那个数值。 1.集中趋势的测度值之一; 2.排序后处于中间位置上的值; 3.不受极端值的影响; 4.适用于定序数据和数值型数据; 5.各变量值与中位数的离差绝对值之和最小,即:
n
Xi Me min
i1
h
18
(二)中位数的确定
h
6
二、调和平均数(Harmonic mean)
在实际工作中,经常会遇到只有各组变量值和各组标志总量而缺少 总体单位数的情况,这时就要用调和平均数法计算平均指标。
调和平均数是各个变量值倒数的算术平均数的倒数,习惯上用H表 示。
1. 集中趋势的测度值之一
2. 均值的另一种表现形式
3. 易受极端值的影响
h
10
计算公式:
G M NX 1X 2 X NN NX i i 1
h
11
四、众数(Mode)
(一) 概念 众数是指一组数据中出现次数最多的变量值,用M0表示。 从变量分布的角度看,众数是具有明显集中趋势点的数值,一组数据分布的最高峰点所对应的变量值即 为众数。 当然,如果数据的分布没有明显的集中趋势或最高峰点,众数也可以不存在;如果有多个高峰点,也就 有多个众数。
4. 用于定比数据
h
7
计算公式:
H m1 m2
m1 m2
x1
x2
mk mk
xk
K
mi
i1
K mi
x i1 i
h
8
在实际工作中,调和平均数通常是作为算术平均数的变形使用的,也就是由于受所掌握资料的限制,有 时不能直接采用算术平均数的计算公式计算平均数,这就需要使用调和平均数的形式进行计算。
h
9
三、几何平均数(Geometric mean)
1. 集中趋势的测度值之一 2. N 个变量值乘积的 N 次方根 3. 适用于特殊的数据 4. 几何平均数是适应于特殊数据的一种平均数,在实际生活中,通常用来计算平均比率和平均速度。 当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,就应采用几何平均法计算平 均比率。
1.定序数据中位数的确定
定序数据中位数确定的关键是确定中间位置,中间位置所对应的变量值即 为中位数。
h
19
h
20
六、众数、中位数与算术平均数的关系
h
21
h
22
从上面的分析我们可以看出,当频数分布出现偏态时,极端值对算术平均数产生很大的影响,而对众数 、中位数没有影响,此时,用众数、中位数作为一组数据的中心值比算术平均数有较高的代表性。
参看例题:P54例4.7
h
16
(三)适用场合
上述下限和上限公式是假定数据分布具有明显的集中趋势,且众数组的频数在该组内是均匀分布的,若 这些假定不成立,则众数的代表性就会很差。 从众数的计算公式可以看出,众数是根据众数组及相邻组的频率分布信息来确定数据中心点位置的,因 此,众数是一个位置代表值,它不受数据中极端值的影响。
集中趋势是指一组数据向某中心值靠拢的倾向,集中趋势的测度实际上就是 对数据一般水平代表值或中心值的测度。
不同类型的数据用不同的集中趋势测度值,低层次数据的集中趋势测度值适 用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于 低层次的测量数据,选用哪一个测度值来反映数据的集中趋势,要根据所掌 握的数据的类型来确定。
h
13
(二)众数确定
1.定类数据和定序数据众数的测定 定类数据与定序数据计算众数时,只需找出出现次数最多的组所对应的变量值即为众数。
2.未分组数据或单变量值分组数据众数的确定 未分组数据或单变量值分组数据计算众数时,我们只需找出出现次数最多的变量值即为众数。
h
14
3.组距分组数据ห้องสมุดไป่ตู้数的确定
组距分组数据,众数的数值与其相邻两组的频数分布有一定的关系,这种关 系可作如下的理解:设众数组的频数为fm,众数前一组的频数为f-1,众数后 一组的频数为f+1。 当众数相邻两组的频数相等时,即f-1=f+1,众数组的组中值即为众数; 当众数组的前一组的频数多于众数组后一组的频数时,即f-1>f+1,则众数 会向其前一组靠,众数小于其组中值; 当众数组后一组的频数多于众数组前一组的频数时,即f-1<f+1,则众数会 向其后一组靠,众数大于其组中值。
本节重点介绍众数、中位数两个位置平均数和算术平均数、调和平均数及几 何平均数三个数值型平均数。
h
5
一、算术平均数
算术平均数(Arithmetic mean)也称为均值(Mean),是全部数据算术平均的结果。算术平均法是计算平 均指标最基本、最常用的方法。
算术平均数在统计学中具有重要的地位,是集中趋势的最主要测度值,通常用表示。根据所掌握数据形 式的不同,算术平均数有简单算术平均数和加权算术平均数。
第四章 数据资料的统计描述: 数值计算
h
1
(一)教学目的
通过本章学习,掌握数据分布集中趋势和分布离散程度的测度,重点掌握分组数据的均值和标准差及变 异系数的计算与众数、中位数和均值的比较,并能灵活加以运用,了解数据分布形状(即偏态与峰度) 及其测度。
h
2
(二)教学要点
集中趋势的测度指标及其计算方法; 离散趋势的测度指标及其计算方法; 数据分布偏态与峰度的测度。