统计基础任务5 统计资料分析——总体分布分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
图5.1
15
由此可见,当不知道各组权数资料,但已知各 组权数的比重时也可以计算平均数。直接用各组的 变量乘以相应各组的权数比重,最后汇总即可得到 加权算术平均指标。其计算形式为:
16
加权算术平均数中的权数既可以是绝对数频数, 还可以是相对数频率,频率对平均数的影响如图5. 2
图5.2
17
2 调和平均数是标志值倒数的算术平均数的倒数 ,又称为倒数平均数。在实际统计工作中,有时由 于资料的原因,不能直接计算算术平均数,而采用
8
9
(1 简单算术平均数是将总体各个单位的标志值逐 个相加,求得标志总量,然后除以总体单位数的商 ,它一般适用于对原始资料平均数的计算。其计算 公式为:
10
(2 简单算术平均数是在假设各个标志值出现的次 数相同(或资料未经过分组),对平均数的影响程 度相同的情况下使用的计算方式。若对总体进行分 组形成变量数列,在有变量值和次数的情况下还能 用简单算术平均数的公式计算平均数吗?如对例 5.1资料分组形成“表5.2工人日产量分组资料表”
任务5
统计资料分析—总体分布 分析
教学要求: 1. 2.掌握算术平均数和调和平均数的计算方法及
3. 4.掌握标志变异指标的计算及应用。
1
第一节 1 平均指标又称为平均数,表明同类现象在一定 时间、地点条件下所达到的一般水平的综合指标。 平均指标是总体各单位某一数量标志值差异抽象化 的结果,其实质是变量的集中值和中心值,也可以 称为变量的代表值。
11
表5.2
工人日产量分组资料表
12
加权算术平均数是以各组标志值为变量,以标 志值出现的次数为权数计算的平均数。其计算公式 为:
13
②组距式变量数列算术平均数的计算。组距式 变量数列最大的特点是各组的组名是一个区间值, 计算平均数时既不能按下限计算,也不能按上限计 算,其关键是确定各组的代表值,即组中值,其计 算公式如图5.1。
18
(1 在资料末分组的情况下,可用简单调和平均法 计算调和平均数,其计算公式为:
19
Fra Baidu bibliotek
(2 在已经分组的条件下,用加权平均法计算调和 平均数。其计算公式为:
20
(3)算术平均数与调和平均数的关系 算术平均数与调和平均数是计算平均数的两种 形式,两者在实质上是相同的,“标志总量/总体 单位总数”是其内在共同的特点。在m,x,f之间 存在着m=xf的数量关系,所以调和平均数只是算
23
(1 单项数列确定众数不需要计算,可以通过观察 寻找。在一组原始数据中,频数最多的那个数值就 是众数,如下表所示。
24
(2) 由组距数列确定众数,可以分为两步:首先根 据分布次数确定众数所在组,然后采用上限公式或 下限公式: 上限公式:
25
5 中位数是将总体单位的标志值按大小顺序排列 ,居于中间位置的那个数叫做中位数。用符号Me 表示,中位数的大小取决于它所处的位置,因此, 它是一个位置平均数,不受极端数值的影响。
31
标志变异指标,也称为标志变动度,是反映总 常见的标志变异指标有全距、平均差、标准差 、离散系数等,其中全距、平均差、标准差的计算 单位与平均指标的计量单位相同,一般为绝对数形
32
1 全距(R)也称为极差,是变量分布中最大值 与最小值之差,是描述变量离散状况最简单的测量 值。 (1 公式为:全距(R)=
26
(1 对未分组资料确定中位数,首先要确定它在数 列中的位次,然后才能确定中位数。具体步骤是: 先将标志值按照从大到小(或从小到大)的顺序排 列,然后找到中间位置,最后选定中间位置上的标 志值,这个标志值就是中位数。
27
为3 的位置;第二步确定中位数所在组;第三步采用公 式计算近似中位数数值。计算公式如下:
33
(2 公式为:全距(R)=最高值组上限值-最低值
34
2 标准差(σ)是总体单位各变量值与其平均数 的离差平方的算术平均数的平方根。标准差的计量 单位与变量值的计量单位相同,它分为简单标准差
5
1) 算术平均数是统计中最常用的一种平均指标, 它是同质总体内总体标志总量与总体单位总量之比 。由于在计算时所有变量值均参加了计算,因此算 术平均数反映全面情况,能够代表所有的变量值。
6
应该注意的是,算术平均数对极端值反映很灵 敏,容易受到两侧极端数值的影响。算术平均数用 公式表示为:
7
由算术平均数基本公式可以知道,算术平均数 是总体标志总量和总体单位总量的比,它们必须属 于同一总体,这是算术平均数与强度相对数与算术 平均数相混淆,例如,人均国民生产总值、人均粮 食产量等。为了便于区分和理解,现将两者的区别 用图表5.1
2
① ②它是总体单位标志值的具体差异抽象化的结
3
2 由于平均指标能够综合反映某种社会经济现象 在一定条件下的一般水平,所以它应用广泛,其作 (1 (2)可对现象进行不同空间、不同地区的比 (3
4
统计中常用的反映集中趋势的代表值有两类: 一是根据总体各单位标志值计算的平均数,如算术 平均数、调和平均数、几何平均数等,称为数值平 均数;另一类是根据标志值的特点确定的近似平均
(2 分组资料中位数的计算比较复杂,一般可以分
28
中位数的计算公式复杂,其关键是假设现象变 化均匀,求出中位数所在组,并确定单位组距内的 单位数,然后据此推算出处在中间位置的标志值, 即中位数。中位数计算的基本原理如图5.4所示。
29
图5.4
30
第二节 总体在某一变量上的分布呈现出集中和分散两 个方面的特征,平均数是反映现象集中趋势的指标, 是总体在变量上分布的一个重要特征。但仅仅掌握 了现象集中的趋势,据此对总体分析是不全面的。 为此还需要了解变量相对于中心位置的偏离状况— —即现象的离中趋势。标志变异指标就是反映变量 的离散状况的,它们是总体分布的另一个数量特征。
21
3 几何平均数是n个变量值的连乘积的n次方根 ,它是计算平均数的另一种形式。当社会经济现象 的总量等于各个具体变量值连乘的积,并且其变量 值连乘积有明确的内涵和直观的解释时,其平均数 的计算方法宜采用几何平均数的形式来计算。平均 数的计算公式是:
22
4 众数是总体中出现次数最多或最普遍的标志值 ,用符号M0表示。众数是一个位置平均数,不受 数列极端数值的影响。根据资料的不同,众数的确