统计整理——统计资料的整理

合集下载

第三章 统计资料的收集与整理

第三章 统计资料的收集与整理

间 50 名 工 人 日 加 工零件数如下(

108 131
125
117 122
133
126 122
118
108
单 位 : 个 ) 。 试 110 118 123 126 133 134 127 123 118 112
采用单变量值对 数据进行分组。

112 134
127
123 119
113
120 123
2. 普查
全面调查
3. 抽样调查
4. 重点调查
非全面调查
5. 典型调查
统计报表
统计报表(Statistical Report Forms) 是指依照国家统计局或国家各行政管理部 门的规定,自上而下地统一布置,以一定 的原始记录为依据,按照统一的表式,统 一的指标项目,统一的报送时间与报送程 序,自下而上地逐级定期提供基本统计资 料的一种调查方式。
1. 用于显示未分组的原始数据的分布
2. 由“茎”和“叶”两部分构成,其图形是由数字组 成的
3. 以该组数据的高位数值作树茎,低位数字作树叶
4. 对于n(20≤n≤300)个数据,茎叶图最大行数不超过

L = [ 10 × log 10 n ]
5. 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值
例题1 例题2 扩展表
例题
扩展表
统计表的结构
从形式来看要素包括:总标题、横行标题、纵行标题、 数字资料。 表示统计研究的对象,称主词 ;其余的是宾词。
表例1
表例2
表例3
图例1
图例2
频数分布表的编制
(实例)

第三章 统计资料整理

第三章  统计资料整理

2.分组表: 2.分组表:主词按一个标志分组的统计表. 分组表
复合表: 3. 复合表:主词按两个或两个以上标志复合 分组的统计表. 分组的统计表.
四,统计表的编制原则
应遵循科学,实用,简明,美观的原则. 应遵循科学,实用,简明,美观的原则. 统计表的各种标题要简明扼要; 1.统计表的各种标题要简明扼要; 要合理安排统计表的结构; 2.要合理安排统计表的结构; 数据计量单位相同时,可放在表的右上角标明, 3. 数据计量单位相同时 , 可放在表的右上角标明 , 不同 时应放在每个指标后或单列出一列标明; 时应放在每个指标后或单列出一列标明; 表中的上下两条横线一般用粗线,其他线用细线; 4.表中的上下两条横线一般用粗线,其他线用细线; 5.统计表的栏数较多时,通常要加以编号; 统计表的栏数较多时,通常要加以编号; 通常情况下,统计表的左右两边不封口; 6.通常情况下,统计表的左右两边不封口; 表中的数字应该填写整齐,对准位数; 7.表中的数字应该填写整齐,对准位数; 对于没有数字的表格单元,一般用" 表示; 8.对于没有数字的表格单元,一般用"—"表示; 表中主词各行和宾词各栏, 9. 表中主词各行和宾词各栏 , 应按先局部后整体的原则 排列; 排列; 10.必要时可在表的下方加上注释. 10.必要时可在表的下方加上注释.

编制
四,次数分布的主要类型 钟型分布——"两头小,中间大" 两头小,中间大" 钟型分布 两头小
对称分布
右偏分布
左偏分布
两头大, U型分布——"两头大,中间小" 型分布 两头大 中间小"
U型分布
一边小, J型分布——"一边小,一边大" 型分布 一边小 一边大"

统计学教案——统计整理

统计学教案——统计整理

第三章统计整理【教学重点、难点】重点:统计资料的整理的方法及技术和统计表难点:统计资料的整理技术【教学用具】多媒体【教学过程】第三章统计整理学习重点:本章主要讲授第一节统计资料整理的意义和程序一、统计资料整理的概念和意义统计资料整理是根据统计研究的任务与要求,对调查得来的各种原始资料,进行科学的整理与加工,使之系统化,从而得出反映总体特征的综合资料,包括系统地积累资料与为研究特定问题对资料的再加工。

统计调查取得的原始资料是分散的、杂乱的、不系统的,只能表明各个被调查单位的具体情况,反映事物的表面现象或一个侧面,不能说明事物的全貌、总体情况。

因此,只有对这些资料进行加工整理才能认识事物的总体及其内部联系。

统计资料整理,是统计调查的继续,也是统计分析的前提,在整个统计工作中具有承前启后的作用。

二、统计资料整理的步骤统计资料整理是一项细致周密的工作,需要有计划、有组织的进行,因此,进行统计资料整理必须按以下步骤进行。

1.设计和编制统计资料的汇总方案。

2.对原始资料进行审核。

为了保证统计资料的质量,在统计资料进行整理前,应该对统计调查材料的准确性、及时性、完整性进行严格的审核,看它们是否达到准确、及时、完整,若发现问题及时纠正。

汇总后须对其结果进行逻辑检查和技术性检查。

3.用一定的组织形式和方法对原始资料进行分组、汇总和计算。

主要根据汇总的要求和工作条件选择适当的汇总组织形式和具体方法对原始资料进行整理、加工,以达到我们的目的。

4.对整理好的资料再一次进行审核,改正在汇总过程中所发生的各种差错。

5.编制统计表,以简明扼要地表达社会经济现象在数量方面的有关联系。

6.统计资料的保管与积累。

第二节统计分组一、统计分组的概念统计分组是根据统计研究的需要,按照一定的标志将总体区分为若干个性质不同而又有联系的组成部分的一种统计方法。

这些组成部分称为这一统计总体的“组”。

统计分组对总体而言是“分”,即把统计总体划分为一定意义上的性质相异的若干个组;对个体而言是“合”即把一定意义上的性质相同的个体组合成一组。

统计学 第3章 统计数据的整理

统计学 第3章 统计数据的整理

统计分组的标志
第三章 统计数据的整理
统计分组的标志:分组标志就是将总体分为各个性质不同的标准或根据。

据分组标志的特征不同,总体可按属性标志分组,也可按数量标志分组。
1.按属性标志分组
以属性标志作为分组标志,并在属性标志的变异范围内划分各组界限,将总体 分为若干组。属性标志划分,概念明确,容易确定分组组数,如性别。
2.按数量标志分组
以数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体 分为若干组。如工资。
第三章 统计数据的整理
(五)简单分组和复合分组
在统计分组时,根据统计研究目的不同,分组标志的选择可以是一个标志,也可以是 两个或两个以上的标志,这样就有简单分组和复合分组之分:
1.简单分组 对总体只按一个标志分组称为简单分组。
第三章 统计数据的整理
数量次数分布的编制方法
在组距次数分布中,各组组距相同的次数分布称为等距次数分 布(表3-8)。各组组距不同的次数分布称为异距次数分布。
等距次数分布一般在现象性质差异变动比较均衡的条件下使用。
优点:
• 易于掌握次数分布的特性。
• 各组次数可以直接比较。
组数= 全距/组距
组距=全距/组数
100.00
提问:这是单 项次数分布还 是组距次数分 布?
第三章 统计数据的整理
数量次数分布的编制方法
例:对某工厂某月50名工人装配零件(件)情况进行调查, 得到下列初级资料:
106 81 98 111 91 107 86 105 93 106 82 108 114 122 109 104 125 103 113 102 106 84 128 104 91 112 85 96 115 89 97 105 92 111 107 97 105 124 106 86 96 110 112 103 108 110 109 125 101 119

统计资料的整理的主要内容

统计资料的整理的主要内容

统计资料的整理的主要内容:1.统计资料的整理是统计工作的中心环节,他是统计资料调查的继续和深化;是统计分析的基础;是统计调查和统计分析的连接点;2.统计资料整理的目的是使收集的初级资料系统化、条理化、科学化,以便对总体内部规律性、相互联系、结构关系能够做出概括说明;3.统计整理主要包括以下步骤:统计资料整理方案设计、统计资料审核、统计资料分组与分析、编制统计表与绘制统计图;4.统计分组是统计资料整理的核心,它是依据统计研究的目的和研究对象的特点,按照一定的标志将统计总体分为若干个组成部分;能够进行分组是由统计总体中的各单位所具有的差异性所决定的;5.统计分组主要有四个作用:发现统计资料的特点与规律性、分析总体众不同现象的类型、分析总体内部结构和总体结构的特征、揭示现象之间的依存关系;6.统计分组的关键是:选择分组标志和各组限的划分;7.统计分组标志选择的原则:一是根据统计研究目的与任务选择、二是根据能够反映研究现象本质特征的标志选择、三是根据现象所处的历史条件或经济条件选择;8.分组按标志性质的不同分类(划分各组组限的方法):一是按品质标志分组,二是按数量标志分组(单项式分组、组距式分组);9.统计分组体系:简单分组与平行分组体系、复合分组与复合分组体系:10.分布数列:分布数列的次数或频数、比率或频率;单项式分组与组距式分组,上下限与组距、组中值,组距与组数的确定(上开下闭原则)(经验公式:组距=1+3.322lgN);11.统计表的构成:主要由横向构造与纵向构造组成,包括:总标题、横行标题、纵栏标题和指标数值四部分组成(一般情况还要有资料来源、填表说明、填报单位、填表人、填表日期等);12.统计表的分类:简单表、分组表、复合表13.编制统计表的要求(编制规则)14.统计图:条形图、饼示图、曲线图等。

3统计资料整理

3统计资料整理
故 障 率
使用时间 0 包退、换 7天
免费(免费)
3年
10年 淘汰
保修(收费)
对产品故障浴缸曲线的说明
产品的故障率受产品自身缺陷和老化两个因素影响: 在使用初期,由于产品自身缺陷造成的故障率较高,在 使用后期,由于老化引起的故障率较高,中间阶段则正 好处于两个故障率均较低的阶段。 浴缸曲线对厂商制定服务政策有重要的借鉴意义。
(三)J形分布 正J形分布
累 计 收 入 比 重 ( % ) 累计家庭户数比重(%) 资产规模(个) 企 业 数
反J形分布
收入分配的洛伦滋曲线
企业数按资产规模分布
任务四 统计表和统计图
一、统计表的意义和结构 (一)统计表的意义 1、含义 用纵横交错的线条绘制出来的、表现统计资 料的表格。 广义的统计表包括在统计调查、统计整理和统 计分析等统计活动各个阶段使用的表格; 狭义的统计表特指在统计整理过程中使用的 统计表,即统计汇总表。
(2)分组形式
简单分组:选择一个标志对总体进行的分组。
某班级学生构成情况
年龄
20岁以下
人数 (人) 10 30
10 50
比重 (%) 20 60
20 100
20-22
22岁以上 合 计
复合分组 选择两个或两个以上的标志并将它们层叠起来对总体进 行的分组。 例:某班级学生构成情况
人数(人) 20岁以下 男 其中: 女 20—25岁 其中:男 女 合 计 20 12 8 30 20 10 50 比重(%) 40.0 60.0 40.0 60.0 66.6 33.3 100
20
13 50
37
50 ——
74
100 ——
(2)向下累计 某班50名学生按成绩分布 成绩 60以下 60—80 80—90 90以上 合 计 人数 (人) 2 15 20 13 50 累计人数 (人) 50 48 33 13 —— 累计比重 (%) 100 96 66 26 ——

第4章 统计资料整理

第4章   统计资料整理

20
例:某企业工人日产量资料如下
日产量分组(件) 工人数 日产量分组(件) 工人数
50—60 60—70 70—80 80—90
6
90—100
15
9
100—110
18
12
110—120
20
14
120—130
8
要求:1、指出上述变量数列属于哪一种变量数列? 这个数列说明什么问题?
2、指出统计表中的变量、变量值、上限、下限、次 数、频率、总体单位总数
200以下 10 200—400 30 400—600 35 600—800 15 800以上 10
频率 10%
30% 35% 15% 10%
要求:各组的频率大于0,各组的频率总和等于1 •累计频数指首先列出各组的组限,然后依次累计到本 组为止的各组频数。 •累计频率指累计频数除以频数总和。
2019/9/26
2019/9/26
27
平衡数列
平衡数列是利用总体内部有关变量或统计指标之间 的数量平衡关系而编制的统计数列,又称平衡表。
结构关系、比例关系 平衡关系有:相加平衡关系、相减平衡关系、收支
平衡关系。 分类
按内容不同分为人口平衡表、劳动力平衡表等。 按计量单位不同有价值量平衡表、实物量平衡表。 按统计范围不同分为综合平衡表、专项平衡表。 按排列不同分为收支对照式和棋盘式。
• 汇总技术:
手工汇总:划记法、过录法、折叠法、卡片法。
电子计算机汇总
5、表现统计资料
编表:经过汇总,得出表明社会现象总体和各个组的单 位数和一系列标志总量的资料,把这些资料按一定的规则在 表格上表现出来。
统计表、统计图、统计报告、统计模型、统计数据库

统计资料的整理和搜集

统计资料的整理和搜集
数据备份
为了防止数据丢失或损坏,需要定期对数据进行备份,并确保备份数据的可恢复 性。
04
统计资料分析方法
描述性统计分析
数据的集中趋势
通过平均数、中位数和众数等指 标,描述数据的中心位置或典型
值。
数据的离散程度
通过方差、标准差和极差等指标, 刻画数据分布的离散程度或波动范 围。
数据的分布形态
通过偏态和峰态等指标,描述数据 分布的形状,如正态分布、偏态分 布等。
医疗健康领域应用案例
疾病监测
01
通过收集和整理疾病发病率、死亡率、流行趋势等数据,及
医疗资源调查
02
调查医疗机构的数量、分布、服务质量等,为医疗资源的合理
配置和优化提供参考。
健康状况调查
03
通过问卷调查、体检等方式收集居民健康状况数据,为制定健
康促进政策和措施提供依据。
06
统计资料搜集整理挑战与对策
数据质量挑战及应对策略
数据准确性问题
采用高质量的数据采集工具和方法,进行数据清洗和校验,确保 数据的准确性。
数据一致性问题
建立统一的数据标准和规范,进行数据整合和标准化处理,确保数 据的一致性。
数据缺失问题
采用插值、回归等方法进行数据填补,或者基于已有数据进行推测 和预测,减少数据缺失对分析结果的影响。
重要性及应用领域
重要性
统计资料是认识社会、研究经济、制 定政策的重要依据,对于政府、企业 和个人都具有重要意义。
应用领域
广泛应用于经济学、社会学、政治学 、医学、环境科学等各个领域,如国 民经济核算、社会调查、市场分析、 医学研究、环境监测等。
02
统计资料搜集方法
问卷调查法
设计问卷

第三章 统计资料整理

第三章 统计资料整理

31
简单表案例
某年某公司所属两企业自行车合格品数量表
厂别 甲厂 乙厂 合 计 合格品数量(辆) 5000 7000 12000
32
简单分组表案例
2005年某月某公司各企业劳动生产率统计表 分组 总产值 (万元) 职工人 数(人) 劳动生产率 (元/人)
大型
中型 小型 合计
33
复合分组表案例
某年某地区工业增加值和职工人数
26
第三步:确定组限和组中值。以区分事物质的差别。
对于离散变量,相邻组组限可以间断,也
可重叠;
对于连续变量,相邻组组限必须重叠; 符合“上组限不计入”原则; 首末两组可使用“××以下”及“××以
上”的开口组。
27
第四步:归类汇总,计算各组次数。
本着“不重复,不遗漏”的原则,按照各个总体单位的具体 标志值,将其划归某一具体组之中。 对于重叠设置的组距数列,要本着“上限不在内”的原则。
19
某地区人口分布状况
人口按年龄分组 1岁以下(婴儿组) 1-7岁(幼儿组) 7-17岁(学龄儿童组) 17-55岁(有劳动能力的人口组) 55岁以上(老年组) 合计
人口数(万人) 1 6 12 24.6 8.1 51.7
20
对于异距数列,为了消除各组组距大小对次数分布的影响,
需计算
次数密度=该组次数/该组组距
14-16
16-18 18-20
16
12 5
540
620 680
8
三、统计分组的种类和分组标志的选择
(一)统计分组的种类 1、按标志的性质不同分为:品质标志分组和数量标志分组: 2、按选择标志的多少不同,可分为: 简单分组:对统计总体仅按一个标志进行分组。特点:只能 反映现象在某一标志特征方面的差异情况,说明的问题比较 简单明了。 复合分组:对同一总体采用两个或两个以上的标志重叠起来 进行分组。特点:可从几个不同角度了解总体内部的差别和 关系,因此能更全面、更深入地研究问题;复合分组的组数 随着分组标志的增加而成倍地增加。

统计学第三章 统计数据的整理

统计学第三章 统计数据的整理

汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计

统计资料的整理统计

统计资料的整理统计
预见性。
02
评估决策效果
通过统计分析,评估决策实施的 效果和影响,为后续决策提供参
考。
04
改进管理措施
通过统计分析,发现管理中的问 题和不足,提出改进措施和管理 建议,提高管理效率和效果。
05
统计资料整理的软件工具
Excel在统计资料整理中的应用
数据输入与整理
Excel提供了方便的数据输入和整理功能, 如数据验证、数据筛选和排序等。
数据可视化
R支持多种数据可视化包,如 ggplot2、lattice等,可以创建各种
类型的图表。
统计分析函数库
R拥有丰富的统计分析函数库,包括 基础统计学、线性模型、广义线性模 型等。
交互式分析
R提供了交互式分析工具,如Shiny应 用程序和RStudio的界面组件,使数 据分析更加直观和高效。
06
图形整理法的优点是形象直观, 易于理解,可以清晰地展示数 据的分布特征和变化规律。
图形整理法的缺点是主观性强, 容易产生视觉误差,且不易表 示数值型数据。
指数法与相对数法
指数法是指通过比较不同时间或不同 条件下的数据,计算出数据的相对变 化程度,从而反映现象的发展趋势和 变化规律。
指数法和相对数法的优点是简单易行, 可以清晰地反映数据的相对变化程度 和现象的发展趋势。
统计资料的整理统计
• 统计资料整理概述 • 统计资料的收集与分类 • 统计资料的整理方法 • 统计资料的分析与应用 • 统计资料整理的软件工具 • 统计资料整理的案例分析
01
统计资料整理概述
定义与目的
定义
统计资料整理是对原始统计资料 进行加工、整理、分类、汇总, 使其系统化、条理化,以便进一 步开展统计分析工作。

第三章统计资料的整理

第三章统计资料的整理

本章重点
1.分组的概念、特点和原则,分组的作用,能 熟练进行分组 2.频数分布的概念及其构成
3.组限的表现形式及原则、组距和组中值的计 算 4.统计表的含义及其构成,统计表的编制方法 和原则
本章难点
1.统计数据的预处理
?
2.统计分组的方法
3.频数分布的编制
4.组限的表现形式、组距和组中值的计算
第一节 统计整理概述
次数分布数列,或称分配数列。
频数分布的两个要素
1.组别:总体按某标志所分的组
2.频数(次数)和频率:各组的单位数叫频数,用
f 表示,各组的单位数与总体单位总数之比叫
频率,用 f 表示 。频率具有如下两个性质:
f
(1)各组频率都是界于0和1之间的一个分数。 即: f 0 1 f
(2)各组频率之和等于1 。即
(3)如果所发现的差错在其他单位也可能发生 时,应将错误情况通报所有单位,以免发生类 似错误。
(4)对于严重的错误,应发还重新填报,并查
明发生错误的原因,若属于违法行为,则应依
法严肃处理。
第二节
一、统计分组的概念
统计分组
根据社会经济现象的特点和统计研究的
目的要求,按照某个重要标志(或几个标志) 把总体划分为若干不同性质的组,称为统计 分组。
在下列情况下,就必须考虑采用异距分组:
第一,标志值分布很不均匀的场合。
第二,标志值相等的量具有不同意义的场合。
第三,标志值按一定比例发展变化的场合。
3.间断组距式分组和连续组距式分组
(1)间断组距式分组 :是指组限不相连
的分组。
(2)连续组距式分组 :凡是组限相连(或 重叠)的分组,即以同一数值作为相邻两组的 共同界限的分组。统计上规定 :“上限不在内”

2 第二章 统计资料的收集和整理

2 第二章  统计资料的收集和整理

二、资料的搜集
(Collection of Data) 要求:原始数据准确、完整、及时。 资料的主要来源: 1.经常性资料:①统计报表:国家统一 制定并要求定期逐级上报的报表;②报 告卡(单);③日常医疗卫生工作记录。 2.一时性资料:①专题调查(不施加 处理因素);②实验(试验)研究(施 加处理因素) 。
三类资料间关系
例:一组2040岁成年人的血压
等 级 资 料
<8 8 12
低血压 正常血压 轻度高血压
计量资料 计数资料
15
17
中度高血压
重度高血压
以8kPa和12kPa为界分为正常 与异常两组,统计每组例数
第三节 统计工尽可能少的人力、财力及物力达到 预期的研究目的。设计是后三个步骤的 依据,是统计工作中最关键的一步。 方法:应遵循对照、齐同、随机和重复4个 基本原则。医学科研设计有调查设计和 实验设计。调查设计包括专业设计和统 计设计,统计设计包括资料搜集整理与 分析全过程的统计设想和安排;实验设 计包括动物实验、临床试验、社区干预 实验。
第二节 统计资料的类型
计量资料
(measurement data) 对每个观察单位用定量的方 法测定某项指标数量的大小所收 集的资料称为计量资料,一般有 度量衡单位。与计数资料的主要 区别在于观察单位之间只有量的 差别,没有质的不同。
计数资料
(enumeration data)
将观察单位按照某种性质或 类别进行分组,然后计数各组的 观察单位数所收集的资料称为计 数资料。与计量资料的主要区别 在于观察单位之间只有质的不同, 没有量的差别。
数值变量
(numerical variable)
数值变量又称为定量变 量,是指相同性质的观察单 位所具有的变量值是定量的, 表现为数值大小,一般有度 量衡单位,大多数数值变量 属于连续性变量。

统计资料的整理

统计资料的整理

第三章统计资料的整理教学目的与要求:本章是统计研究活动的第三阶段—统计资料整理阶段,阐述了统计整理的理论与方法,包括分组、汇总和统计表的设计。

重点要求为:1、明确统计资料整理的概念,了解统计整理的步骤。

2、通过学习统计分组理论,能够对不同的社会经济现象进行统计分组。

3、运用分配数列对原始数据进行系统整理。

4、掌握统计表的具体编配方法。

重点掌握:1、统计分组方法。

2、分配数列的编制与汇总教学方式:用多媒体课件讲练结合。

课时安排:理论4学时,实训4学时第一节统计整理的意义和步骤一、统计整理的意义1、定义统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。

统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。

2、意义统计整理在整个统计研究中占有重要的地位。

统计整理的正确与否,将直接影响和决定着能否完成整个统计研究的任务。

如果采用不科学不完整的整理方法,即使搜集到准确、全面的统计资料,也往往使这些资料失去应用价值,掩盖客观现象的本质,难以得出正确的结论。

因此,必须十分重视统计整理工作。

二、统计资料整理的步骤第一步,设计和制定统计整理方案。

第二步,对原始资料进行审核。

第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。

第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。

第五步,对统计资料妥善保存,系统积累。

第二节统计分组一、统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。

例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。

统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
编号
16 17 18 19
教育程度
本科 高中 高中 本科
工资水平
7900 3700 3000 3800
教育程度
大专 本科 大专 研究生
工资水平
3000 6500 6000 8900
编号
31 32 33 34
教育程度
大专 高中 大专 初中
工资水平
2700 2700 6400 4900
5
6 7 8
初中
高中 高中 高中
统计分组应 达到的要求
同一组内的单位性质相同;
不同组所包括的单位性质相异。
看以下数据分组,有何不同?
分组标志的选 择 统计分组的关 键?
工业企业按地区分组,可分为以下几组: 工业企业按经济类型分组,可分为以下几组: 地区 经济类型 企业数(个) 企业数(个) 国有企业 10000 1000 北京市 合资企业 200 天津市 8000 合作经营企业 300 股份制企业 11000 500 上海市 工业企业按职工人数分组,可分为以下几组:
5000
4100 5200 2800
20
21 22 23
高中
大专 本科 高中
4900
4500 5500 9400
35
36 37 38
本科
本科 本科 研究生
4900
6300 5400 7500
9
10 11 12 13 14 15
高中
大专 高中 高中 大专 大专 大专
3500
4400 2500 4600 2400 5700 3400
本科
研究生 初中 初中 本科 大专 研究生 大专 高中
5400
7500 5800 4600 3100 11700 12999 2600 3600
三、变量数列的编制
单项式变量数列的编制
某车间20名工人分组表
按看管设备台数分组 1 2 3 工人数 2 8 6
4 合计
4 20
三、变量数列的编制
• 组限 • 组距 • 组中值






累计频数和累计频率:向上累计、向下累计 向上累计:由变量值低的组向变量值高的组累计 向下累计:由变量值高的组向变量值低的组累计
某车间50名工人日加工零件数分组表
按零件数 分组(个/人) 频数 (人) 频率 %
向上累计 频数
频率%
向下累计 频数 频率%
105-110
110---115
3
数据的审核
对于“第二手数据”: 1.适用性审核:
-应弄清楚数据的来源、口径和有关的背景资料。 -确定数据是否符合自己分析研究的需要。
2.时效性审核:
-应尽可能使用最新的数据。
数据的筛选
1.对审核过程中发现的错误应尽可能地予以纠
正。(如回访等)
2.当发现数据中的错误不能予以纠正时,则必
须对数据进行筛选。(删除或插补)
统计资料的预处理
编码
数据录入
数据的审核 数据的筛选
数据的排序
编码
1.概念:
给问题的每项答案配以一个数值代码的 过程,以便于数据录入和作进一步处理。
2.具体方法:
-问卷已预先编码
-手工编码
数据录入
1.概念:
在数据收集完成之后,由操作员将问 卷上的数据输入计算机,将纸张式数据转 化为可机读的形式。

组限
组限就是每一组两端的数值。 10 — 20 下限 上限 20 — 30 30 — 40
确定组限的方法有两种:间断式确定组限和重叠式确定组限。 职工人数(人) 99以下 100—199 200—299 300—399 间断式确定组限 适用于离散变量 固定资产额(万元) 50.5—60.5 60.5—70.5 70.5—80.5 80.5—90.5 重叠式确定组限 适用于连续变量
【项目概述】
某公司经理想了解一下本公司员工的教育程 度和工资收入情况。人事部小李将45名员工的学 历资料和月收入资料从计算机中调出来,准备整 理一下交给经理。表3-1是45名员工未整理的学历 构成和月工资资料。小李如何将数据整理提交给 经理呢?
表3-1
编号
1 2 3 4
某公司员工教育程度及月工资收入资料
本项目要解决的问题是如何将原始数据进行整 理,即将员工按照学历和工资进行分组,并编制 数列来展示员工的学历和工资水平的分布。该项 目可以分解为以下两个任务来完成: 任务1:统计数据分组 任务2:Excel在数列编制中的运用
3.1 数据处理的概念和意义
一.概念: 根据研究目的,对调查所得到的原始
资料进行分类、汇总,使之系统化、条理化的工 作过程。
3.筛选可借助于计算机完成。
数据的排序
1.按一定的顺序将数据排列,以发现一些明
显的特征或趋势,找到解决问题的线索。
2.排序有助于对数据的检查纠错以及为重新
归类或分组提供依据。
3.在某些场合,排序本身就是分析的目的之
一。
4.排序可借助于计算机完成。
3.3 统计分组
统计分组概念 根据研究任务的要求和现象总体的内在特点, 把统计总体按照某一标志划分为若干性质不 同又有联系的几个部分。
组距式数列编制
表3-1-7 某班学生统计学考试成绩分组表
学生人数(人)
3 5 10 11 7
按考分分组(分)
60以下 60~70 70~80 80~90 90~100
频率(%)
8.33 13.89 27.78 30.56 19.44
合 计
36
100.0
组距式数列编制
对下列数据进行累计频数和累计频率的计算
_
第三章 统计整理
3、累计频数或频率分配数列的编制方法
序 号 1 2 3 4 5 6 7 8 计划完成 工人数 比重 向上累计 向下累计 程度(%) (人) (%) 人数 比重 人数 比重 2 200 100 60 — 70 2 1.0 1.0 70 — 80 5 2.5 7 3.5 198 99.0 80 — 90 14 7.0 21 10.5 193 96.5 90 —100 31 15.5 52 26.0 179 89.5 100—110 65 32.5 117 58.5 148 74.0 169 84.5 83 41.5 110—120 52 26.0 192 96.0 31 15.5 120—130 23 11.5 200 100 8 4.0 130—140 8 4.0 合 计 200 100 通过累计频数分配数列可以反映累计到某一组出现的总次 数或总频率。
组中值
每组上限与下限之间的中点数值,是各组的 假定平均数。 组中值 = (上限值+下限值)÷2 开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2 缺上限:组中值=本组下限+ 相邻组组距/2
例如
产值(万元) 50以下 50 — 60 60 — 70 70以上
第一组组中值: 50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
职工人数 500人以下 500—1000 1000—1500 企业数(个) 50 200 100
3.4 分配数列
一、分配数列的概念
分 配 数 列
总体分组后将各组单位数按顺 序排列出来形成的数列
变数
连续型变数
指称量、度量或测量方法所得到的数据,其各个观察 值并不限于整数,在两个数值之间可以有微量数值差 异的第三个数值存在。如身高、体重、工资收入等。
模块三
统计整理

项目一 统计资料的整理 项目二 统计数据显示

• 项目一
能力目标
能对统计总体进行 统计分组。 能确定调查结果的 分组形式。 能编制变量数列。
统计资料的整理
知识目标
掌握统计分组标志的 确定方法。 了解统计分组的种类。 掌握分布数列的种类。 掌握分布数列编制方 法。
能与人协作、沟通、 团队合作。
三、变量数列的编制
组距式变量数列的编制




1、数据排序 计算全距=最大标志值-最小标志值 2、确定组数和组距:组距=全距/组数 3、确定组限和组中值 4、计算频数和频率 5、计算累计频数和累计频率
组距式数列编制

某班学生的性别、年龄和统计学考试成绩资料如 表3-1-4所示,请按照成绩分组编制分布数列。
24
25 26 27 28 29 30
高中
高中 大专 大专 初中 本科 高中
3500
4700 8200 2300 3400 3300 2500
39
40 41 42 43 44 45
初中
初中 本科 大专 研究生 大专 高中
5800
4600 3100 11700 12999 2600 3600
【项目分析】
离散型变数
指用计数方法获得的数据,其各个观察值必须以整数 表示,在两个相邻的整数间不容许有带小数的数值存 在。如员工人数、企业数等,也叫间断性变数。
分配数列/次数分布

1、变数的分配数列:由不同区间内变 量出现的次数组成的分布。
2人 4人 8人 4人 2人
1.45m 1.55m 1.65m
1.75m 1.85m 1.95m
2.具体方法:
-单选题 -多选题
-限选题
-排序题
数据的审核
对于“第一手数据”: 1.完整性审核:
• 如何检查?计 -检查应调查的单位或个体是否有遗漏。 算机中如何操 -所有的调查项目或指标是否填写齐全。 作?
2.准确性审核:
-检查数据及其内容是否真实地反映了客观实际(逻 辑检查) -检查数据是否有错误,计算是否正确等(计算检查)
2、分配数列的作用
(1)整理资料,化繁为简;
相关文档
最新文档