第三章 统计整理

合集下载

第三章 统计整理

第三章 统计整理

组中值 每一组中点位置的数值
重合式组限组的组中值= 非重合式组限组的组中值=
上限 下限
2
本组下限 后一组下限
2
注意
开口组以相邻组的组距作为该组的组距, 确定其下限或上限,再计算组中值。
缺下限开口组的组中值=上限 - 邻组的组距 2
缺上限开口组的组中值=下限 邻组的组距 2
某地区100个百货商店 月销售额与流通费用情况
3.数据的排序
数据排序就是按照一定的顺序将数据排列,以 便初步显示数据的一些明显特征和规律,为研究者 找到解决问题的线索。此外,排序还有助于对数据 的检查纠错,为分组、汇总提供依据。
对于定类数据,可以按字母的顺序或笔画数的 多少顺序排序;
对于定距数据和定比数据,可以按递增顺序排列 或按递减顺序排列。
编制结果如下:
日产量(件)X 工人数(人) f
20
3
21
5
22
6
23
4
24
3
25
2
26
1
合计
24
将作为分组依据的数量标志的整个取 组距式分组 值范围依次划分为若干个满足互斥性
和包容性的区间,用这些数值区间作
编制条件: 为组的名称。
变量是连续变量;
或:总体单位数较多,变量不同取值个数也较
多的离散变量。
二、统计整理的内容

第3章 统计整理

第3章 统计整理

划分社会现象的依存关系
按商品销售额分组(万元) 商店数(个) 100以下 100500 500 1000 1000 3000 3000 5000 5000 10000 10000以上 25 70 130 75 40 18 10
流通费用率(%) 11.2 10.6 9.9 8.7 7.8 7.0 6.3
准确的资料是 进行正确统计 分析的关键。
(一)审查资料的完整性和 及时性
• 完整性: 检查应调查的 单位或个体是否有遗漏, 所有的调查项目或指标是 否填写齐全。
及时性:检查填报单位是 否按时报送了有关资料。

(三)历史资料的审核

应审查资料的可靠性程度,指标含义,所属时间,计算方法等, 对不能满足现在要求,有缺漏或有疑问的资料,要进行有科 学依据的推算,弥补和订正。
(4)定比尺度 定比尺度也称比率尺度,它与定距尺度属于同一层次,其 计量的结果也表示为数值。 与定距尺度相比较,定比尺度有绝对固定的零点。如计量 人数时,把“没有人”规定为0;测量物体的长度时,把测量 的起始点规定为0。采用这种方法进行观测得到的结果称为定 比数据。如上例中“月收入”和“身高”是定比尺度变量, “3000元”和“170cm”为定比数据。


(2)必须选择最主要的标志作为分组依据;
例3:根据统计调查资料来研究人民生活水平变动情况时, 可供选择的分组标志有家庭人口数、每户就业人数、每 一就业者负担人数、家庭总收入、平均每人每月生活费 收入等,其中最能反映人民生活水平变动的标志是:平 均每人每月生活费收入,应选择这一标志作为分组标志。

统计学第三章统计整理

统计学第三章统计整理
7
第三章 统计整理
第一节 统计整理的概念、原则和步骤(4)
四、统计整理的组织形式
1、逐级汇总:自下而上一级一级地汇总本地区、
本系统、本单位的调查资料。
2、集中汇总:把全部调查资料集中在一个机关或
最高统计机关进行汇总。
3、综合汇总:对各地区和各级都需要的基本资料
进行逐级汇总,对全国的总的数字和其他需要在全 国范围内进行加工的资料或本系统的全面资料则实 行集中汇总。
6
第三章 统计整理
调查资料的检查
准确性
完整性
及时性
准确性检查就是对调查误差的检查
登记性误差
代表性误差
由于错误判断事实或错误登 记事实而发生的误差。这种 误差可以避免
根据样本单位的数量特征推 断总体数量特征时产生的误 差。这种误差不可避免
检查方法
逻辑检查:内容是否合理,有无矛盾,是 否符合实际;
计算检查:数字有无差错,指标计算方法是 否恰当,计算单位是否正确,指标之间平衡 关系是否保持。
变量
次数或频数
21
比率或频率
第三章 统计整理
第三节 次数分布(4)
2、组距数列是总体按组距式分组而形成的变量 数列,每个组是由若干个变量值形成的区间表示, 顺序排列。
工资分组 职工人数(人) 各组人数所占比重
(元) (次数或频数) (%) (频率)

第三章 统计整理

第三章 统计整理
Байду номын сангаас
二、数据整理的程序
审核 分组 汇总 制表或绘图 保管、积累和公布统计资料
第二节 统计分组
一、统计分组的概念
根据统计研究的目的和客观现象的内在特点,按 某个标志(或几个标志)把被研究的总体划分为若 干个不同性质的组,称为统计分组。
统计分组的原则:
穷尽原则,就是使总体中的每一个单位都应有组可归, 或者说各分组的空间足以容纳总体所有的单位。
单项式分组表

某车间50名工人日加工零件数次数分布表
零件数 (件)
频数 (人)
零件数 (件)
频数 (人)
零件数 (件)
频数 (人)
由此推出: 组距=全距/(1+3.3lg N )
第三节 频数分布
一、频数分布的基本概念 二、品质数列的编制 三、变量数列的编制 四、累计频数和累计频率
一、频数分布的基本概念
1、频数分布 在统计分组的基础上,将总体所有的单位按某一标
志进行归类排列,称为频数分布,或次数分布。 根据分组标志特征的不同,分布数列可分为品质分
全 距: R=xmax-xmin 组中值:上下限之间的中点数值称为组中值,
组中值的计算公式:
计算平均指标或进行其它 统计分析时,常以组中值来
组中值 上限 下限
2
代表各组标志值的平均水平。

统计学原理(第七版)第三章统计整理

统计学原理(第七版)第三章统计整理
进行分组。 • 3.选择分组标志时,要考虑现象发展
的历史条件和经济条件。
B(二)按品质标志 或按数量标志分组
统计总体可以按品质标志分组,也 可以按数量标志分组。 • 1.按品质标志分组。按品质标
志分组是指选择反映事物属性 差异的标志作为分组标志,并 在品质标志的变异范围内划定 各组界限,将总体划分为若干 个性质不同的组成部分。 • 2.按数量标志分组。按数量标 志分组是指选择反映事物数量 差异的数量标志作为分组标志, 并在数量标志的变异范围内划 定各组界限,如企业按固定资 产价值分组、人口按年龄分组、 工人按技术等级分组等。
四 次数分布的主要类型
(二)U形分布
U形分布的特征是“两头大,中间小”,即接近两端的变量值 分布的次数多,接近中间的变量值分布的次数少(如图3-3所 示)。人口死亡率、每日不同时刻天空中云量的百分比等现象 的分布都呈U形分布。
四 次数分布的主要类型
(三)J形分布
J形分布有正、反J形两种类型。正J形分布是次数随着变量值 的增大而增多,反J形分布是次数随着变量值的增大而减少 (如图3-4所示)。投资额按利润率大小分布,一般呈正J形分 布;人口总体按年龄大小分布,一般呈反J形分布。
因此,在统计整理工作中应该首先对所研究的社会经济现象进 行深刻的政治经济分析,在此基础上运用最基本的、最能说明 问题本质特征的统计分组和统计指标对统计资料进行加工整理。

统计学第3章统计整理

统计学第3章统计整理

组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2

产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
以上各组组距均为10。 这种分组适用于均匀分布的总体。
各组组距不一定相等。如: 10—20 20—50 50—60 60—70
以上分组中,其中第二组与其它各组的组 距不同。这种分组适用于资料分布离差较大 或者是为了满足特殊的研究目的的需要。
第三章 统计整理
组限
组限就是每一组两端的数值。
10 — 20
-
例 直方图
人数 频数 密度
70
14
60
12
50
10
40
8
30
6
20
4
10
2
0
0
10 15 20 25 30年龄35 40 45 50 55
折线图
在直方图的基础上连接各条形顶边的中点成 折线图。 如下图红笔围成的,即为次数分配曲线图:
次数 比率(%)
12
30
8
20
4

统计学原理 第三章 统计整理

统计学原理 第三章 统计整理

统计学原理
(二)必须选择最主要的、能反映总体本质特征的标志作为分组 依据
社会经济现象纷繁复杂,研究某一问题可能涉及许多标志,科学 的统计分组则应从中选择与统计研究的目的、与有关事物的性质或 类型关系最密切的标志,即以最主要或最本质的标志作为统计分组 的依据。
(二)审核资料的正确性 审核资料的正确性,是检查所填报的资料是否准确可靠。常用 的审核方法有两种: 逻辑检查,首先,是从理论上或常识上检查资料是否有悖常理,
有无不切实际或不符合逻辑的地方。 计算检查,就是检查各项指标的计算口径、计量单位是否符
合规定,并通过各种计算方法来检查各项指标间的数字是否 相互衔接。
统计学原理
第二节 统计分组
一、统计分组的意义
统计学原理
根据统计研究任务的要求,把统计总体按照某一标志划分为性 质不同而又有联系的若干部分的过程,称为统计分组。
具体来说,统计分组的重要意义可从以下三方面来阐述: (一)划分社会经济现象的类型 任何统计分组都是把总体划分为各种类型的。其中经济类型的 划分直接反映生产关系各种类型所具有的重要意义。
三、分组标志的选择
统计学原理
统计分组的关键在于分组标志的选择。分组标志就是进行统计 分组的标准或根据。分组标志选择得正确与否,关系到能否正确地 反映总体的性质特征、实现统计研究的目的任务。
为了正确选择分组标志,必须遵循以下原则: (一)要符合统计研究的目的和要求 统计分组是为统计研究服务的,统计研究的目的不同,选择的分 组标志也应有所不同。

第三章统计整理

第三章统计整理
来说明对象的有关标志或指标的名称(即纵栏 标题)及其具体数值(即数字资料)。
二、统计表的种类
根据主词是否经过分组及分组方法不同,可分为: 1、简单表:主词未分组 2、简单分组表:主词经过简单分组 3、复合分组表:主词经过复合分组
即主词的三种设计方法
三、统计表宾词设计
1、平行设计:宾词平行排列 如表3-14
15来自百度文库
37.5
36
90.0
19
47.5
90~100 95
4
10.0
40
100.0
4
10.0
合计

40
100.0




计算累计次数方法:
1、向上累计:由变量值小的组向大的组累计,累 计次数表示该组上限以下(比该组上限 小)的组的次数的总和,所以又称为较小 制累计。
2、向下累计:由变量值大的组向小的组累计,累 计次数表示该组下限以上(比该组下限 大)的组的次数的总和,所以又称为较大 制累计。
例:我国第五次人口普查我国大陆人口年龄分布:
人口按年龄分组 14岁以下
15 —— 64 65岁以上 合计
人口数(亿人) 2.8979 8.8793 0.8811 12.6583
比率(%) 22.89 70.15 6.96
100.00
2、构成:
由两部分构成:(1)各组 (2)各组次数(或频率)

统计学 整理-3

统计学 整理-3
⒈ 统计分组按其任务和作用的不同,分为类型分 组,结构分组和分析分组。(1) 任何统计分组都可以说把总体划分为各种类型; 任何统计分组也都可以对总体进行结构上的分组。 因此,类型分组与结构分组的界限是困难确定的。 通常认为,现象总体按主要的品质标志分组,多属 于类型分组;按数量标志进行分组多是结构分组, 进行结构分组的现象总体相对来说同类性较强。类 型分组,比如社会产品按经济类型、按部门、按轻 重工业分组;国民收入和社会总产值按物质生产部 门分组。结构分组,如全民所有制企业按产量计划 完成程度、劳动生产率、职工人数、利税率来分组。
Ⅱ 组距的形式(1)
ⅰ 等距和异距两种形式
■等距(等距分组) 组距分组中每组的组距都相等 的叫等距分组。 例:40-50;50-60;60-70这就 是等距分组
■异距(不等距分组) 组距分组中每组的组距大小不相等的 叫不等距分组。例如,为了研究劳动力资源
情况,需要将总人口按年龄分组,分为:
1岁以下(婴儿组) 源组) 1-6岁(学龄前儿童组)女16-55岁(劳动力资源 7-12岁(学龄儿童组) 组) 13-15岁(劳动力后备 男60岁以上(丧失劳动力 人口组) 组)
组中值=
闭口组:组中值=(上限+下限)/2 开口组:组中值=上限-相邻组组距/2 或组中值=下限+相邻组组距/2
举例说明:
40以下 第一组的组中值=40-10÷2 40-50 =35 50-60 60以上 最后一组的组中值=60+10 ÷2 =65

第三章统计整理

第三章统计整理
78 80 88 73 81 89 75 56 78 70 92 48 60 84 66 66 74 72 66 74 80 63 55 59 82 52 71 75 63 75 77 88 84 80 80 96 90 77 90 81 63 67 66 74 66 82 71 90 66 78
要求编制组距数列。 要求编制组距数列。
编制结果如下: 编制结果如下:
日产量(件)X 日产量(件)X 20 21 22 23 24 25 26 合计 工人数(人) 工人数(人) f 3 5 6 4 3 2 1 24
组距数列
指每个组的变量值用一个区间来表现 的变量数列
编制条件:
变量是连续变量; 变量是连续变量; 或:总体单位数较多,变量不同取值个数 总体单位数较多, 也较多的离散变量。 也较多的离散变量。
编制等距数列
编制步骤: 编制步骤:
⒈求全距 全距=最大值 最小值 全距 最大值-最小值 最大值 ⒉确定组距及组数 组距=全距÷ 组距 全距÷组数 全距
编制等距数列 ⒊确定组限
组限的表示方法
对于离散变量,相邻组组限可以间断, 对于离散变量,相邻组组限可以间断,也 间断 重叠; 可重叠; 对于连续变量,相邻组组限必须重叠; 对于连续变量,相邻组组限必须重叠; 必须重叠 符合“上组限在内”原则; 符合“上组限在内”原则; 首末两组可使用“××以下” 首末两组可使用“××以下”及“××以 以下 ××以 的开口组。 上”的开口组。

(完整版)第3章统计整理

(完整版)第3章统计整理

第三章统计整理

学习要求:明确统计整理在统计研究中承前起后的地位;掌握分组的方法和汇总技术;认识统计分布是统计整理的重要表现形式;学会统计表的编制并能熟练地运用。

§1 统计整理的意义和方法

一、统计整理的意义

统计整理是指根据统计研究任务的要求,对调查所搜索的原始资料进行分组、汇总,使其条理化、系统化的工作过程。统计整理实现了从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。

二、统计整理的方法:

1、统计分组就是根据整理的目的要求,按照规定的标志进行区分若干组成部分的一种统计方法。(科学的分组是搞好统计整理的前提条件)

2、汇总是对分组后的各项指标进行汇总,并计算各组的单位数和合计数,计算出说明总体和各组情况的统计指标数值。

汇总是统计整理的中心内容

汇总技术:①手工汇总:划记法、过录法、折叠法、卡片法。②电子计算机汇总。

3、编表:经过汇总,得出表明社会现象总体和各个组的单位数和一系列标志总量的资料,把这些资料按一定的规则在表格上表现出来。

§2 统计分组

一、统计分组的意义:

统计分组的含义:指根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同而又联系的几个部分。

统计分组是在总体内部进行的一种定性分类。①对总体而言是“分”,即将总体区分为性质相异的若干组成部分。②对个体而言是“合”,即将性质相同的个体组合起来。

(统计分组的关键是分组标志的选择)

二、统计分组的种类

1、按统计分组任务和作用不同分:

第三章统计资料整理

第三章统计资料整理

一、统计分组的概念 ——根据社会经济现象的特点和统计研究的目的要求,
按照某种重要标志把总体分成若干部分的科学分类。 两方面含义:
(1)对总体而言:是“分”,即将总体分为若干性质相 异的部分
(2)对总体单位而言:是“合”,即将性质相同的个体 组合起来
组内同质性,组间差异性
第三章统计资料整理
二、统计分组的作用
基本要素:各组的名称(各组变量值) “x”
各组单位数(次数)
“f”
第三章统计资料整理
次数分布数列的种类
(1)按分组标志不同分:品质数列和变量数列
(2)按分组形式不同分:
单项式数列:每组只有一具体变量值 组距式数列:用组距代表一个组
(分等距数列和不等距数列)
第三章统计资料整理
(3)按次数分布特征分:
盈利 亏损
盈利 亏损 盈利 亏损 盈利 亏损
第三章统计资料整理
2、按分组标志性质不同
(1)品质分组
(2)数量分组
A、单项式分组:一个变量值表示一个组的分组。
适用于离散型变量且变量的取值不多。 按家庭人口数分组
例如:职工家庭人口数,其取值不可 能很多,且每一个取值都可视 为一种类型 。
1人 2人 3人 4人
第三章 统计资料整理
第三章统计资料整理
教学目的与要求:
本章阐述统计整理的理论与方法,包括统计分 组、汇总和统计表的设计。

3-统计整理

3-统计整理

工人数 (人) 210 187 133 530
占总数比重 (%) 39.6 35.3 25.1
100.0
组别(变量) 次数(频数) 频率(比率)
第33页,共109页。
两个构成要素:
(1) 分组标志的具体表现; (将总体按某标志所分成的各个组)
(2) 与之相对应的各组次数或频率
(各组所包含的总体单位数)。
SPSS(Statistical Pakage for the Social Science)、
SARP(Statistical Annual Report Processing System)
第15页,共109页。
编表:
经过汇总,得出表明社会现象总 体和各个组的单位数和一系列标志总 量的资料,把这些资料按一定的规则 在表格上表现出来。
个体所有制
轻工业 重工业 轻工业
大型企业
中型企业 小型企业
第25页,共109页。
【例】 对全国的工业企业进行多个简单
分组并列形成分组体系
按经济类型分
全民所有制企业 集体所有制企业
城乡个体企业
重工业
按轻重工业分 轻工业
按企业规模大小分
大型企业
中型企业 小型企业
第26页,共109页。
【例】
男工 干
人 部
第28页,共109页。
五、统计分组方法

第三章 统计整理

第三章 统计整理

19:18:05
32
举例
40名学生统计学考试成绩
89 88 76 99 74 60 82 60 89 86
93
99
94
82
77
79
97
78
95
92
87
84
79
65
98
67
59
72
84
85
56
81
77
73
65
66
83
63
79
70
19:18:05
33
计算极差
最小值=56 最小值=56 最大值=99 最大值=99 极差R=99极差R=99-56=43
19:18:05 15
三、统计分组标志的选择
选择分组标志应考虑以下三个原则:
1、根据研究问题的目的和任务选择分组标志。 2、在若干个标志中,选择能反映问题本质的标志 进行分组。 3、结合所研究现象所处的历史条件具体问题具体 分析。
19:18:05
16
三、统计分组标志的选择
统计分组是通过选择分组标志进行的,而 标志只有两种,即品质标志和数量标志, 因此统计分组也有两种:
向上累计 向下累计
19:18:05
39
向上累计
指各组频数或频 率由变量值低的 组向变量值高的 组累计。 累计数反映各组 上限以下的累计 频数或频率。 如右表:学生考 试成绩分布

第三章 统计整理

第三章 统计整理

计算全距=98-51=47
编制步骤之二——确定变量数列的形式
因变量值较多、变动幅度较大,适宜采用 组距式数 列。
简单次数分布数列的编制实例
编制步骤之三——确定组数和组距
[分析] 全距为47,分为5组,组距为10。
编制步骤之四——确定组限
[分析] 离散型变量分组,相邻组的组限可以重叠,也可间
断,本例选择重叠。
统计分组种类---复合分组
农业 生产性积累 积累 国民收入 使用额 消费 社会集团消费 非生产性积累 居民消费
轻工业
重工业 居民住宅
复合分组
文化服务设施
3
分配数列
一、分配数列的概念与种类
(一)概念
形成总体中各单位数在各组间的分配称为分配数列,又称
在统计分组的基础上,将总体中所有单位按组归类整理所,
(二)统计分组方法
2. 划分各组界限 按数量标志划分 ① 分组时各组数量界限的确定必须能反映事物质的差 别。 ② 根据被研究的现象总体的数量特征,采用适当的分 组形式,确定相应的组距、组限。
五、统计分组的种类
(一)根据分组变量(标志)的性质不同
1. 按品质变量分组
2. 按数值变量分组
(二)根据采用的分组标志的个数多少
2
统计分组
一、统计分组的概念
1、概念:
根据统计研究目的和客观现象的内在特点,按照选定的 某个或几个标志,将被研究的总体数据分成若干部分的 科学分类。 “分”:就是把同一总体中性质不同的总体单位分配到 不同的组里,突出组与组之间的差异性。 “组”:就是把同一总体中性质相同的总体单位归并到 同一组里,突出组内的同质性。

第三章 统计整理

第三章 统计整理

单项式分组:
工人平均日产量资料
工人平均日产量(件) 2 3 4 5 6 合计 工人数 绝对数 比重(%) 10 8.7 15 13.0 30 26.1 40 34.8 20 17.4 115 100.0 上一页 下一页
返回本节首页
组距式分组:
某工厂工人完成生产定额情况表 工人完成生产定额分组(%) 工人数 绝对数 比重(%) 80~90 30 16.7 90~100 40 22.2 100~110 60 33.3 110~120 30 16.7 120~130 20 11.1 合计 180 100.0
第3章 统计整理 34
⑶按分组的作用和任务不同,分为:



类型分组:把复杂的现象总体,划分为若干个不 同性质的部分。如我国全社会消费品零售额分为国有 及国有控股商业零售额、集体商业零售额、私营及个 体商业零售额和其他类型商业零售额。 结构分组:在对总体分组的基础上计算出各组对 总体的比重,借此研究总体各部分的结构。它往往与 类型分组紧密结合在一起。 分析分组:为研究现象之间的依存关系而进行的 统计分组。如商品流通费用率与商品销售额之间的依 存关系。
上一页
下一页
返回本节首页
⒉对数据资料分组和汇总。
对全部调查资料,按其性质和特点, 划分为若干类,并加总计算各组和总体 总数。分组和汇总是整理的中心工作。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 统计整理
第三章 统计整理
第一节 统计整理方案
第二节 统计分组 第三节 统计表 第四节 分布数列
第一节
统计整理
统计整理方案
将统计调查得到的原始资料进行 科学的分组和汇总形成综合统计 资料的工作过程 是统计调查的继续,统计分析的 前提和基础
地位
统计数据的处理:
内 容 统计资料的分组、汇总及制表
对于连续变量,相邻组组限必须重叠; 符合“上组限不计入”原则; 首末两组可使用“××以下”及“××以上” 的开口组。
编制异距数列
编制步骤:
⒈确定标准组距 标准组距=数列中最小组组距 2.确定标准组距次数 或者直接计算次数密度或频率密度
频数密度=频数/组距 频率密度=频率/组距
工人按年龄分 组 15~20 20~25 25~30 30~35 35~45 45~50
3)等距分组与异距分组
等距分组:标志值在各组保持相等的组距,即各
组的标志值变动都限于相同的范围。
一般用于标志值变动比较均匀的场合。
异距分组:各组的组距不都相等。
一般用于标志值变动分布不均匀
2、 相关指标的计算
1)组距 连续式分组的组距计算公式: 组距=本组上限–本组下限 间断式分组的组距计算公式:
组中值=50-(100-50)/2 =25 (万元) 某地区 100个百货商店 月销售额与流通费用情况
销售额(万元)
50以下 50~100 100~200 200~300 300以上 商店数 (个) 10 20 30 25 15 每百元商品销售额 中支付的流通费 (元) 14.2 11.4 10.1 9.2 8.5
组中值=300+(300-200)/2 =350(万元)
3、组距数列的编制
• 1)等距数列的编制 • 2)异距数列的编制
等距数列编制
适用于总体单位的标志值变 动比较均匀的情况
己知某地区某年50个商店商品销售额的资料如下(单位: 百万元): 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0 要求编制组距数列。
统计数据的管理:
数据的传输、贮存、更新及输出
统计整理的步骤 制定统计整理方案 对原始资料进行审核 资料的分组和汇总 制作统计图表 统计资料的积累和保管
第二节
统计分组
• 一、统计分组的概念和意义
• 二、统计分组的程序和原则 • 三、统计分组的种类
• 四、变量分组
一、统计分组的概念和意义
根据统计研究的目的和客观现象的内在 统计分组 特点,按某个标志(或几个标志)把被研 究的总体划分为若干个不同性质的组。
2.0 7.4 12.6 15.0 18.2 3.5 8.3 12.8 15.5 18.7 4.0 8.5 13.2 15.6 19.3 4.5 9.5 13.4 15.7 20.0 5.0 10.0 13.6 16.0 21.0 5.8 10.5 13.9 16.3 22.0 6.0 11.4 14.2 16.7 23.0 6.4 11.9 14.5 17.1 25.0 6.8 12.0 14.7 17.3 26.0 7.0 12.4 14.8 17.5 29.0
组距=本组上限-前组上限(通用公式)
2)组中值:
上下限之间的中点数值,组中值的计算公式:
组中值
上限 下限 2
年龄分组:17-20,20-22
上组限U
某地区100个百货商店 月销售额与流通费用情况
每百元商品销售额 组距 d=U-L 商店数 销售额(万元) 中支付的流通费 =100-50=50 (万元) (个) 50以下 50~100 100~200 200~300 300以上 10 20 30 25 15
编制等距数列
编制步骤:
⒈求全距 R X max X min 29 2 27 (百万元) ⒉确定组距及组数 R≤组距(d) ×组数(m)
确定组距的原则:
要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍
编制等距数列 计算组数(组数不宜过多,也不宜太少)
分配数列
将总体各单位按某个标志分成若干组, 列出各组的总体单位数或各组在总体中 所占的比重而形成的数列
频数: 分布在各组的个体单位数 频率: 频数与总频数之比
各组频数(fi)之和等于总体单位数
各组频率( fi fi )
之和等于1,且0 ≤频率≤1
构成要素
分组标志的具体表现 各组的次数或频率
பைடு நூலகம்
2、累计频数与累计频率
组距
人数(人)
标准组距人数
次数密度
5 5 5 5 10 5
17 28 40 70 65 10
17 28 40 70 32.5 10
3.4 5.6 8 14 6.5 2
合计
——
230
——
——
第三节
统计图表
一、统计表 二、统计图
一、统计表
统计表
以纵横交叉的线条所形成的表格来表现 统计资料的形式
统计表有广义和狭义之分: 广义指统计工作阶段中的所有的一切表格。 狭义指整理后的结果表和分析表。 具有 容量 大、 方便 计算 等特 点
3、组距数列的编制
1、变(数)量分组
• 1)单项式分组和组距式分组
• 2)间断组距式分组和连续组距式分组 • 3)等距分组和异距分组
1)单项式分组与组距式分组
单项式分组:用一个变量值作为一组,形成单项式变量数 列。
单项式分组一般适用于离散型变量且变量变动范围不大的 场合。 组距式分组:将变量依次划分为几段区间,一段区间表现 为“从……到……”,把一段区间内的所有变量值归为一组, 形成组距式变量数列。 组距式分组适用于连续型变量或者变动范围较大的离散型 变量。
统计表的常用结构:
总 标 题 宾词栏 主词栏 注释 数据栏
统计表的加工方法
对主词栏加工 (对主体进行分组)
单式加工 复式加工
对宾词栏加工(选择指标及对指标进行分组)
简单设计 复合设计
按月工资分 组 300以下 300~400 400~500 500~600
按性别分(人)
按级别分
小计
4 16 22 15
统计分组的作用:
划分现象的类型 反映现象的内部结构和比例关系 揭示现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
二、统计分组的程序与原则
选择分组 标志 确定分组 体系 总体单位 归类
科学性:
组间差异大, 组内差异小。
下组限L
(元) 14.2 11.4 10.1 9.2 8.5
组中值x=(U+L)/2 =(100+200)/2 =150(万元)
开口式组距数列组中值的计算:
先计算开口组的假定上、下限: 首组假定下限=首组上限-相邻组组距 末组假定上限=末组下限+相邻组组距
因此有:
首组 首组上限 首组假定下限 首组 相邻组组距 组中值 2 2 上限 末组 末组下限 末组假定上限 末组 相邻组组距 组中值 2 2 下限
完备性和互斥性:
每个单位均能且 只能归到某个组 中。
二、统计分组的程序与原则 对父母亲下岗情 对大学生月生活 况进行分组研究: 费支出情况进行 单亲下岗; 分组研究: 双亲下岗; 按家庭收入水平 双亲在岗。 分组;
按城乡分组; 按性别分组; 按年龄分组。?
不符合科学性 城乡区别
离退休 是否健在 不符合完备性和互斥性
二、统计图
统计图 以点、线条、面积等方法描述、显 示统计数据的形式 具有直观、醒目、易于理解等特点
组成: 坐标系
单式图 图形 图例
一个图只用来显示一种现象的 数量特征
复合图
叠加图
用一个图同时显示几种数量的 分布或变化情况
几种常用的统计图
条形图(Bar)用于显示离散型变量的次数分布
5
4 3 2
1 0
向 上 累 计 向 下 累 计 从变量值低的组开始,将各组频数(频
率)逐次向变量值高的组累计,说明某一
组上限以下各组的累计频数(频率)。 从变量值高的组开始,将各组频数(频 率)逐次向变量值低的组累计,说明某一
组下限以上各组的累计频数(频率)。
VAR00001 Valid Percent 1.2 2.4 2.4 4.8 1.2 2.4 2.4 14.5 8.4 9.6 4.8 3.6 9.6 6.0 3.6 8.4 1.2 6.0 2.4 3.6 1.2 100.0 Cum ulative Percent 1.2 3.6 6.0 10.8 12.0 14.5 16.9 31.3 39.8 49.4 54.2 57.8 67.5 73.5 77.1 85.5 86.7 92.8 95.2 98.8 100.0
下限,上限:组距式分组的每一组变量值中,其
最小值为下限,最大值为上限。
组距:上下限之间的距离。 组限:相邻两组的界限。
“上限不在内”原则:统计上规定,凡是总体某
一个单位的变量值是相邻两组的界限值,这一个单 位归入作为下限值的那一组内。
2)间断组距式分组和连续组距式分组
间断组距式分组:组限不相连的组距式分组。 连续组距式分组:组限相连的组距式分组。 离散型变量,可间断组距式分组,也可连续组距 式分组。 连续型变量,只能采用连续组距式分组。
R R m (当 d d R R m 1 (当 d d
的结果为整数时) 的结果为小数时)
上例中,取d=5,则有
R 27 m 1 1 6(组) d 5
编制等距数列
⒊确定组限
组限的表示方法
对于离散变量,相邻组组限可以间断,也可 重叠;

1 6 10 11

3 10 12 4
小计
4 16 22 15
技工
0 2 4 5
学徒工
4 14 18 10
600~700
700以上
10
5
8
4
2
1
10
5
8
5
2
0
合计
72
40
32
72
24
48
对宾词栏的简单设计
按级别分(人) 按月工资 分组 技工 学徒工 总 计 小计 男 女 小计 男 女
对宾词栏的复合设计

三、统计分组的种类
根据分组标志的性质不同:
1、品质分组 2、数量分组:单项式和组距式 根据分组标志的个数不同: 1.简单分组:即只按一个标志进行的分组。 2. 复合分组:按两个或两个以上标志进行 重叠分组。
分组体系
指同时使用两个以上标志分组 时,分组标志的组合形式。 各分组标志并列使用 各分组标志交叉结合使用
体操
举重
乒乓球 羽毛球
射击
跳水
柔道
田径
跆拳道
用于显示连续型变量的 直方图( Histogram ) 次数分布
40
30
20
10 Std. Dev = 4.86 Mean = 163.3 0 154.0 158.0 162.0 166.0 170.0 174.0 N = 83.00
VAR00001
用于显示定类变量的次 圆形图(饼图 Pie ) 数分布
1 2 1 3
体操 举重
5 5
乒乓球 羽毛球 射击 跳水 柔道 田径
4 3
跆拳道
4
线图(Line)
主要用于显示连续型变量的次 数分布和现象的动态变化
茎叶图
主要显示数据的分布形状及数 据的离散状况。
第四节 分布数列
• 1、分布数列的定义及种类
• 2、累计频数与累计频率 • 3、频数分布的类型
1、分配数列的定义及种类
平行分组体系 交叉分组体系
平行分组体系
按性别分类
对教师 的分类
男性 女性
高级
共计 7 组 按职称分类 中级 2+3+2 初级
按年龄分类
青年
中年
交叉分组体系
按性别 分类
对教师 的分类
共计12组 男 2× 3× 2

按职称 分类 按年龄 分类
高级
中级 初级
青年 中年
四、变量分组
1、变(数)量分组
2、相关指标的计算
统计表的编制规则
标题设计:总标题、横行标题和纵栏标题应简明扼要。 表格长与宽比例适当 表的上、下端用粗线或双线封口,左右两端一般不封口; 纵列合计在最后一行,横行合计可列在最前一栏或最后一栏 计量单位:全表只有一种计量单位则放在表达右上方,若各栏 的指标数值 的计量单位不同可在纵栏标题中注明;或横栏标题 后添一列计量单位。 可在各列的文字标题下面设置栏数编号加以标识,主词栏用“甲、 乙、丙”;宾词栏用“(1)、(2)、(3)……”等序号。 (如p205,209) ; 数据栏不能有空白,数字小忽略用“0”,缺少数字用“…”;
相关文档
最新文档