经济统计学第3章
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
重叠式确定组限 适用于连续变量
上组限不在内
2.组中值
每组上限与下限之间的中点数值,是各组的 假定平均数。
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2 缺上限:组中值=本组下限+ 相邻组组距/2
例如
产值(万元)
50以下 50 — 60 60 — 70 70以上
从构成要素看,统计表包括 以下三个部分。
(1)总标题。就是统计表的总 称,简要说明全表的内容,一般都写 在表的上端中央。
(2)分标题(又叫做标目)。就 是指总体名称或分类名称及说明总体 的各种项目。分横行标题(横标目) 写在表的左方,纵栏标题(纵标目) 写在表的上方。
(3)纵、横栏组成的本身及表 中的数字。
第一组组中值: 50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
合理确定组中值
例如: 按公式
第一组:50人以下 第二组:50—200人
组中值 50 200 50 2(5 不合理) 2
应定下限为0 组中值 (0 50)/ 2 25
例:分 配 数 列 的 编 制
例
横 行 标 题
2003年某月某公司各企业劳动生产率统计表 单位____
分组
总产值 职工人数
(万元)
第三章 统计整理
第一节 统计整理的基本问题
统计整理的意义 统计整理是统计工作的第二阶 段。它是根据统计研究的任务,对 统计调查所搜集到的大量原始资料 进行加工汇总,使其系统化、条理 化、科学化,以得出反映事物总体 综合特征的资料的工作过程。
整理的内容 整理要依据事先拟定的整理 纲要要求的项目确定。 整理纲要的内容包括一整套 空白的综合表和编制说明。 综合表的基本内容包括两部 分:一部分是分组,一部分是相 应的统计指标。
合计
家庭数(户)
5 7 10 13 8 6 3 2 54
频率%
9.26 12.96 18.52 24.07 14.87 11.11 5.56 3.70 100.00
二 组距数列的编制
组限
组距两端的数值。分为上限和下限。
组距
某一组的上限和下限的距离,分等距和异距。
组距=上限-下限
全距 组中值
分组数列中最大值的上限与最小值的下限之差。
单项式分组:
工人看管设备数(台) 1 2 3 4
工人人数(人) 20 40 15 15
某地区工业企业总产值计划完成情况
按计划完成程度分组(%)
90以下 90-100 100-110 110以上
合计
企业数 (个)
4 8 32 12 56
比重 (%) 7.41 14.29 57.14 21.43 100.00
间断式确定组限:汇总各组单位数时,按照“上下限均 包括在本组内”的原则汇总。
重叠式确定组限:汇总各组单位数时,按照“上组限不在 内”的原则汇总。
职工人数(人) 单位数(个)
499以下 500 — 599 600 — 699 700 — 799
产值(万元) 单位数(个) 50 — 60 60 — 70 70 — 80 80 — 90
y
y
o
x
右偏分布
o
x
左偏分布
(二)U型分布
特征是靠近中间的变量值分布的次数少, U型分布: 靠近两端的变量值分布的次数多,其形状
宛如英文字母U。
y
o
x
(三)J型分布
y
y
o
xo
x
正J型分布
反J型分布
特征是次数随着变量值的增大而增多或随 J型分布: 变量值的增大而减少,其形状宛如英文大
写字母J。
次数分布的主要类型 1、钟型分布
等距数列的组距
全距R 组数
组的上限和下限的中间值。
因数列两端组限形式不同分:
开口式组距:最低组与最高组不封口。例:成绩60分以下,90分 以上。
闭口式组距:例40-60分,90-100分。
斯特奇斯公式(组距公式):
(一)确定组距和组数
组距
某一组的上限和下限的距离,分等距和异距。
组距=上限-下限
全距
第三节
分配数列 (次数分布)
月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
187
35.3
1500 以上
133
25.1
合计
530
100.0
组别(变量) 次数(频数) 频率(比率)
一、分配数列的概念和种类
在统计分组的基础上,将总体 的所有单位按组归类整理,并按一 定顺序排列,形成总体中各个单位 在各组间的分布,称为次数分配和 分配数列。分布在各组的个体单位 数叫次数,又称频数;各组次数与 总次数之比叫比率,又称频率。
各组组距均相等。如: 10—20 20—30 30—40
以上各组组距均为10。 这种分组适用于均匀分布的总体。
各组组距不一定相等。如: 10—20 20—50 50—60 60—70
以上分组中,其中第二组与其它各组的组 距不同。这种分组适用于资料分布离差较大或 者是为了满足特殊的研究目的的需要。
(三)组限和组中值
品质标志分组 —— 反映事物属性差异
数量标志分组 —— 反映事物数量差异
- 单项式数量分组 —— 运用于变量变动幅度 小、项目少的分组。如:看管机器台数分组(0,1, 2,3,4,…)
- 组距式分组 —— 运用于变量变动幅度大、项目多的分 组。 如:按月工资(元)分组(600~650,650~ 700,700~750,…)
若把上表改变为如下统计表,则基本上能准确反映总体 的分布特征。
某班学生统计学考试成绩表(表2-10)
考试成绩(分) 人数(人) 比重(%)
50-60
2
5.0
60-70
7
17.5
70-80
11
27.5
80-90
12
30.0
90-100
8
20.0
合计
40 100.0
(二)等距分组和异距分组
1.等距数列 2.异距数列
(1)对称的钟型分布
100 80 60
ÈÈ(È)
40 20
0
日产量
9 10 11 12 13 14 15 (件)
(2)左偏分布
100
80
60 ÈÈ(È4)0
20
日
0
产
4 9 10 11 12 13 14 量
(件)
(3)右偏分布
100
80
60
ÈÈ(È)
40
20
0
日
10
11
12
13 14
15
19
产 量
外商 3298.4 585.7 2404.3 196.23 221.39 397.25
港澳 1942.6 台
其他 102.8
430.8 464.8
1445.5 94.22
90.55 15.9
106.22 188.05 -2.96 -1.55
第二节 统计分组
一、统计分组的意义 统计分组就是根据统计研究
1、品质分配数列的编制:
只需将品质标志的表现一一排列出来,然后汇总 出每一种标志表现出现的次数即可。如下例:
经济类型
国有企业 股份制企业 合资企业 独资企业
企业数
100 80 50 20
比重(%)
40 32 20
8
合计
250
100
2、变量分配数列的编制:
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 第二步:确定变量的类型和分组方法(单
分组数列中最大值的上限与最小值的下限之差。
等距数列的组距
全距R 组数
斯特奇斯公式(组距 公式):
d
R 1 3.21 lg n
n — 数据的个数
例 若将考试成绩仅分为不及格与及格两组, 则可编成如下组距数列:
某班学生统计学考试成绩表
考试成绩(分) 人数(人)
56-60
2
60-100
38
合计
40
四、简单分组、复合分组和分 组体系
简单分组又称单一分组,即只 按一个标志进行分组。
特点是:只能反映现象在某一 标志特征方面的差异情况,而不能 反映现象在其他标志方面的差异。
复合分组是按两个或两个以上 标志进行层叠分组。
特点是:第一,对总体选择两 个或两个以上标志进行层叠分组,可 以从几个不同角度了解总体内部的差 别和关系,因而比简单分组能更全面、 更深入地研究问题;第二,复合分组 的组数随着分组标志的增加而成倍地 增加。
全国大中型工业企业主要经济指标(1996)(万元)
总产值 增加 销售成 管理费 利润总 利税总
值
本
用
额
额
国企 22510 7381.5 18074.7 2122.3 493.6 2573.5
集体 3794 股份 2626
808.2 2754.2 201.69 100.37 244.46 630.2 1999.9 191.56 169.37 322.61
项式分组或组距分组)。 第三步:确定组数和组距。当组数确定后,
组距可计算得到: 组距 = 全距÷组数 全距 = 最大变量值-最小变量值
第四步:确定组限。 注意:第一组的下限要小于或等于 最小变量值,最后一组的上限要大 于最大变量值。) 第五步:汇总出各组的单位数,计 算频率,并编制统计表。 注意不同方法确定的组限在汇总单 位数时的区别
(一)根据研究问题的目的来选 择。
(二)要选择最能反映被研究对 象本质特征的标志作为分组标志。
(三)要结合现象所处的具体历 史条件或经济条件来选择。
分组标志也有品质标志与数量 标志两种。
品质标志一般不能用数量表示, 它表明事物的质量属性,有的比较 简单,有的则比较复杂。
数量标志一般是用数量表示的, 按数量标志进行分组,可有两种情 况:不同标志值较少,可作成单项 式分组;数值较多,变动范围较大, 则应作组距式分组。
按品质标志分组成为品质数列。
按数量标志分组形成为变量数 列。
单项式分组:来自百度文库
工人看管设备数(台) 1 2 3 4
工人人数(人) 20 40 15 15
组距式分组:
月收入(元)
80~100 100~120 120~140 140~160 160~180 180~200 200~220 220~240
1. 组限
组限就是每一组两端的数值。
下限
10 — 20 20 — 30
上限
30 — 40
确定组限的方法有两种:按连续变量分组和按离散变量分组。
职工人数(人) 99以下 100—199 200—299 300—399
固定资产额(万元) 50—60 60—70 70—80 80—90
间断式确定组限 适用于离散变量
(件)
2、U型分布
50 40 30 ÈÈÈ(%) 20 10
0
È×Èù ÈÈê Èê È Èê È È¤ Èà È È
3、J型分布(1)
120 100
80 È è È ó È 60
40 20
0
价格
返回
J型分布(2)
100
80
60
ÈÈÈ
40
20
0
价格
第四节 统计表
一、统计表的作用
(1)能使大量的统计资料系统 化、条理化、因而能更清晰地表述 统计资料的内容。
人数(人) 比率(%) 人数(人) 比率(%) 人数(人) 比率(%)
2
5.0
2
5.0
40
100.0
7
17.5
9
22.5
38
95.0
11
27.5
20
50.0
31
77.5
12
30.0
32
80.0
20
50.0
8
20.0
40
100.0
8
20.0
40
100.0
-
-
-
-
向上累计:以下累计次数(上限)——即较小 制累计。每一组的累计次数表示小于该组 上限(变量)值的次数共有多少。
向下累计:以上累计次数(下限)——即较大 制累计。每一组的累计次数表示大于该组 下限(变量)值的次数共有多少。
次数分布的主要类型
(一)钟型分布
(1)对称分布 特征是“两头小,中间大”,即靠近中间的 钟型分布: 变量值分布的次数多,靠近两端的变量值
分布的次数少,其形状宛如一口古钟。
y
o
x
(2)偏态分布
因为有了“上组限不在内”的原则,实际工作中,对 于离散型变量也经常采用重叠式确定组限的方法。
三 累计次数分布
1.次数分布的表示方法 ⑴ 表示法—— 即用统计表来表示次数分布。
例
某班统计学考试成绩次数分配
考分
50-60 60-70 70-80 80-90 90-100 合计
次数
向上累计 (上限)
向下累计 (下限)
的需要,将统计总体按照一定的 标志区分为若干个组成部分的一 种统计方法。
保持各组内统计资料的一致 性与组和组之间资料的差异性。
统计分组的作用 统计分组基本作用有以下三方
面: (一)划分现象的类型 (二)揭示现象内部结构 (三)分析现象之间的依存关系
三、分组标志的选择 分组标志是统计分组的依据。
正确选择分组标志,须考虑以下三 点:
(2)利用统计表便于比较各项 目(指标)之间的关系,而且也便 于计算(如有些计算表比用公式更 简易、明了);
(3)采用统计表格表述统计资 料比用叙述的方法表述统计资料显 得紧凑、简明、醒目,使人一目了 然;
(4)利用统计表易于检查数字 的完整性(是否有遗漏)和正确性。
二、统计表的结构
从内容上看,统计表由主词 和宾词两部分组成。主词是统计表 所要说明的总体及其分组;宾词是 用来说明总体的统计指标。