3统计数据的整理及显示
第三章统计数据的整理和显示习题
第三章统计数据的整理和显示练习题一、填空题1.统计数据分组的关键在于。
2.一般说来,统计分组用于三方面:(1>;<2);<3)。
3.根据分组标志的不同,统计分组可以有分组和分组。
4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。
5.在组距式数列中,表示各组界限的变量值叫。
各组中点位置上的变量值叫。
6.组距式变量数列,根据各组的组距是否相等可以分为和。
7.已知一个变量数列最后一组的下限为900,其邻组的组中值为850,则最后一组的上限和组中值分别为和。
b5E2RGbCAP8.统计资料的表现形式主要有和。
9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。
10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。
p1EanqFDPw11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。
12.直方图是用的宽度和高度来表示频数分布的图形。
13.雷达图是一种的图示方法。
二、单项选择题1.统计分组的关键问题是( >A正确选择分组标志 B确定组距和组数C确定组距和组中值 D确定全距和组距2.为了反映我国经济中所有制成份的构成情况需要进行( >A经济成份分类B登记注册类型分类C三次产业分类 D国民经济行业分类3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( >A组数较多 B标志变异不明显C两种性质变异间存在过渡形态 D分组有粗有细4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( >A260 B 215 C 230 D 1855.下列分组中按品质标志分组的是( >A人口按年龄分组 B产品按质量优劣分组C企业按固定资产原值分组 D乡镇按工业产值分组6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( >A简单分组 B平行分组C复合分组 D分组体系7.用组中值代表各组内的一般水平的假定条件是( >A各组的次数均相等 B各组的组距均相等C各组的变量值均相等 D各组次数在本组内呈均匀分布8.对统计总体按两个及以上标志分组后形成的统计表叫( >A简单表 B简单分组表C复合分组表 D汇总表9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( >A变量分组 B属性分组C分组体系 D复合分组10.在频数分布中,频率是指( >A各组频数之比 B各组频率之比C各组频数与总频数之比 D各组频数与各组次数之比11.频数分布用来表明( >A总体单位在各组的分布状况 B各组变量值构成情况C各组标志值分布情况 D各组变量值的变动程度12.在分组时,若有某单位的变量值正好等于某组的下限时,一般应将其归在( >A上限所在组 B下限所在组C任意一组均可 D另设新组13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( >A正比例关系 B反比例关系C乘积关系 D毫无关系14.统计表的宾词是用来说明总体特征的( >A标志 B总体单位C统计指标 D统计对象15.统计表的主词是统计表所要说明的对象,一般排在统计表的( >A左方 B上端中部 C右方 D下方16.用组中值与次数求坐标点连接而成的统计图是( >A直方图 B条形图 C曲线图 D折线图17.按字母的顺序或笔画数的多少顺序排序的统计数据一般是( >A定类型数据 B定距数据C定比数据 D定序数据18.多指标的图示方法是( >A直方图 B条形图 C环行图 D雷达图19.变量数列的构成要素是< )A分组标志和指标B分组标志和次数C数量分组标志数值和频数D品质分组标志属性和频数20.下列哪一种资料,适合编制单项数列< )A连续型变量且各变量值变动比较均匀B离散型变量且变量值的种类数较少C连续型变量且各变量值变动幅度较大D离散型变量且各变量值变动幅度较大21.某组向上累计次数表示< )A大于该组上限的次数有多少B大于该组下限的次数有多少C小于该组上限的次数有多少D小于该组下限的次数有多少三、多项选择题1.统计分组的主要应用有(>A区分现象的类型 B反映现象总体的内部结构C比较现象间的一般水平 D分析现象的变化关系E研究现象之间的数量依存关系2.指出下表表示的分布数列所属的类型( >A品质数列 B变量数列C分组数列 D组距数列E等距数列3.指出下列分组哪些是属性分组( >A人口按性别分组 B企业按产值多少分组C家庭按收入水平分组 D在业人口按文化程度分组 E宾馆按星级分组4.对统计数据准确性审核的方法有( >A计算检查 B逻辑检查C时间检查 D调查检查E平衡检查5.统计数据的预处理,包括( >A数据分类 B数据筛选C数据审核 D数据订正E数据排序6.从形式上看,统计表由哪些部分构成( >A总标题 B主词 C纵栏标题D横行标题 E宾词7.按主词是否分组,统计表可分为( >A单一表 B简单表 C分组表D复合表 E综合表8.统计数据的审核主要是审核数据的( >A准确性 B及时性 C完整性D适用性 E代表性9.统计数据整理的内容一般有( >A对原始数据进行预处理 B对统计数据进行分组C对统计数据进行汇总 D对统计数据进行分析E编制统计表、绘制统计图10.国民经济中常用的统计分组有( >A经济成分分组 B登记注册类型分组C国民经济行业分类 D三次产业分类E机构部门分类11.某厂100名工人按工资额分为800以下、800-1000、1000-1200、1200-1400、1400以上等五个组。
湘教版九年级上册教案 4.2统计数据的整理与显示
统计数据的整理与显示统计数据收集上来之后,首先应对这些数据进行加工整理,使之系统化、条理化,以符合分析的需要。
数据整理是统计分析之前的必要步骤,通过加工整理可以简化数据,使我们更容易理解和分析。
不同类型的数据,所采取的处理方式和所适用的处理方法是不同的。
分类数据和顺序数据主要是做分类整理,数值型数据则主要是做分组整理。
数据经过整理后,可以用图形将其显示出来,以便对数据的特征有一个初步的了解。
(一)分类数据的整理和图示分类数据本身就是对事物的一种分类,因此,在整理时我们除了列出所分的类别外,还要计算出每一类别的频数、频率或比例、比率,同时选择适当的图形进行显示,以便对数据及其特征有一个初步的了解。
1.分类数据的整理分类数据的整理通常要计算下面的一些指标。
(1)频数与频数分布。
频数也称次数,它是落在各类别中的数据个数。
我们把各个类别及其相应的频数全部列出来就是频数分布或称次数分布。
将频数分布用表格的形式表现出来就是频数分布表。
例如,为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题做了邮寄问卷调查,其中的一个问题是:“您比较关心下列哪一类广告?”1.商品广告;2.服务广告;3.金融广告;4.房地产广告;5.招生招聘广告;6.其他广告。
这里的变量就是“广告类型”,不同类型的广告就是变量值。
调查数据经整理分类后形成表的频数分布表。
很显然,如果我们不做分类整理,观察200个人对不同广告的关注情况,既不便于理解,也不便于分析。
经分类整理后,可以大大简化数据,我们可以很容易看出,关注“商品广告”的人数最多,而关注“其他广告”的人数最少。
(2)比例。
比例是一个总体中各个部分的数量占总体数量的比重,通常用于反映总体的构成或结构。
假定总体数量N 被分成K 个部分,每一部分的数量分别为1N ,2N ,…,k N ,则比例定义为N N i /。
显然,各部分的比例之和等于1,即121=+++NNN N N N K K比例是将总体中各个部分的数值都变成同一个基数,也就是都以1为基数。
统计学第3章统计数据整理与显示
2013-11-21
本 章 内 容
第一节 统计数据整理概述 第二节 统计分组与频数分布数列
第三节 统计数据的显示
第四节
2013-11-21
EXCEL在数据整理应用示例
第一节 统计数据整理概述
一、统计数据整理的含义与要求
二、统计数据整理的步骤
三、统计数据的预处理
2013-11-21
一、统计数据整理的含义与要求
个体企业 其它企业
70~80分 (中等) 80~90分 (良好) 90~100分(优秀)
2013-11-21
统计分组是在总体内部进行的一种定性分类,把 总体划分为一个个性质不同,范围更小的总体。
统计分组有两个方面的含义,即:
是“分” 即将总体区分为性质 不同的若干组成部分
统计 分组
是“合” 即将性质相同的总 体单位合为一组
每一组中的最大变量值称为上限,每组最小变量值
称为下限。
重叠组限 在统计时 遵循“上 限不在内” 的原则。
工人按工资分组:
600 700 800 1200 ~ 700 ~ 800 ~ 1200 ~ 1500
企业按人数分组:
1 ~ 499 500 ~ 999 1000 ~ 2999 3000 ~ 3499
(4)按数量标志分组
数量标志分组,即变量分组。 例如, 按考分分组(分) 60以下 用数量来 60 ~ 70 表示各组 70 ~ 80 性质上的 80 ~ 90 差别 90 ~ 100 注意:第一,明确分组的目的,. 即通过数量的变化来区 分各组质的差别,而不是单纯的数量差别。 第二,采用适当的分组形式, 即要以什么样的数量作 为划分标准。是单项式或是组距式?如果是组距式分
2013-11-21
统计学 第二章 统计数据的搜集、整理和显示
(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。
统计学原理 第三章 数据整理与显示
4.数量(变量)分组
如,企业按产值分组
按数量标志进行的分组。
100万元以下 100 ~ 500 500 ~ 1000 1000万元以上
单项式分组 数量(变量)分组 组距式分组
单项式分组: 在变量分组中, 一个组只有一个变量值。
如,居民家庭按子女数分组: 0 1 2 3 单项式分组适用于变量值变化范围不大、不同变量值个数 较少的离散型变量的场合。
10
22
20
22
30
27
主要步骤:数据------数据透视表------布局
EXCELL应用:单项式分组及汇总 日产量 22 23 24 25 26 工人人数 6 8 10 1 3 比重 20.00% 26.67% 33.33% 3.33% 10.00%
27
总计
2
30
6.67%
100.00%
主要步骤:数据------数据透视表------布局
600 ~ 700 700 ~ 800 800 ~ 1200 1200 ~1500
组 限 重 叠
499以下 500 ~ 999 1000 ~ 1999 2000 ~ 2999 3000及以上
组 限 不 重 叠
组限的划 分方法
不重叠组限(只适用于离散型变量) 重叠组限(适用于连续型变量和离散型变量)
当为重叠组限时,交叉组限值遵循 “上限不在其内”的原则。
它适用于变量值变化范围较大、不同变量值个数较多 的离散型变量及连续型变量的情形。
组距式分组最为常见,进行分组涉及以下几个问题
(1)组限及划分方法
(2)组距与组数 (3)等距分组与不等距分组 (4)组中值
组距式分组的组限及划分方法
每组起点值称为上限,终点值称为下限。 工人按工资分组: 企业按人数分组:
第三章_数据的整理与显示讲解
将某些不符合要求的数据或有明显错误的数据
予以剔除
将符合某种特定条件的数据筛选出来,而不符
合特定条件的数据予以剔除
数据筛选
(data filter)
用EXCEL进行数据筛选
8名学生的考试成绩数据
数据排序
1. 按一定顺序将数据排列,以发现一些明显的 特征或趋势,找到解决问题的线索
一、数据的分组
分组的方法: 单变量值分组和组距分组
例题:数据的分组是( )
A 统计调查阶段的基本方法 B 统计整理阶段的基本方法 C 统计分析阶段的基本方法 D 贯穿于统计工作全过程的基本方法
答案 B
例题:离散型变量分组的方法( ) A 只能是单变量值分组 B 既可以是单变量值分组,也可以使组距分组 C 只能是组距分组 D 不能进行分组
如表3-8:140~149,150~159,160~169…… 对于连续变量,可以采取相邻两组限重叠 的方法,根据“上限不在内”的规定解决不重 的问题,也可以对一个组的上限采用小数点的 形式(小数点的位数根据所要求的精度具体确 定)。 如:10~11.99,12~13.99,14~15.99
例题:划分连续型变量的组限时,相邻组的组 限通常( )。
第 3 章 数据的整理与显示
3.1 数据的预处理 3.2 分类和顺序数据的整理与显示 3.3 数值型数据的整理与显示 3.4 统计表
3.1 数据的预处理
数据的预处理是数据整理的先前步骤,包括:
1.数据的审核
检查数据中的错误
2.数据的筛选
找出符合条件的数据
3.数据排序
升序和降序 寻找数据的基本特征
资料审核、分组、 汇总、制表、制图等。
统计学统计数据的整理和显示
组数
组中值:各组中点位置所对应的变量值。其计算公式为:
01
或= (适用上开口组)
03
组中值= (适用所有闭口组)
02
或= (适用下开口组)
表3—2 三次产业增加值结构变化 资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。
从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。
举例说明:
1
某工厂生产车间30人工人日产量原始数据如下:
第三章 统计数据的整理和显示
本章主要内容
肆
叁
贰
壹
统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。
第一节 统计数据整理概述
3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。
第三章统计数据的整理与显示
统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
统计学第三章 统计数据的整理
汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
统计数据的整理及其显示(ppt-107页)(共106张PPT)全篇
穷尽原则
互斥原则
注意:统计分组是对总体认识深化的手段,它是一切统计研究的基 础,应用于统计工作的全过程,是统计研究的基本方法。
⑴ 类型分组
揭露社会经济现象的类型,反映各类型的特点。
例
单位:亿元
类 型 1999年 2000年 2001年 2002年
农业 14 106.2 13 873.6 14 462.8 14 931.5
审核
对第二手数据: 完整性: 准确性: 适用性:数据的来源、口径以及
有关背景资料; 时效性:尽可能使用最新的数据。
(2)数据筛选
当数据中的错误不能予以纠正,或者有些数据不符合 调查的要求而又无法弥补时,需要对数据进行筛选。
数据筛选的内容:
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除;
例如:企业按人数分组
499及以下
500 ~ 999
1000 ~ 2999 3000及以上
工人按工资分组
600 ~ 700 700 ~ 800 800 ~ 1200
1200 ~ 1500
适用条件: 它适用于变量值变化范围较大、不同变量值个数
较多的离散型变量及连续型变量的场合。
注意:连续型变量的数值不能一一列举,故
例如:按以五分制计分的成绩对全班100名学生进行分组,宜单 变量数列;按以百分制计分的成绩对全班100名学生进行分组 ,宜组距式数列;
1. 定类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯
上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列
,也可按笔画排序,其中也有笔画多少的升 序降序之分
2. 定距和定比数据的排序
递递增增排排序序:后设可一表组示数为据:为X(1X)1<,X(X2)2<,……<X,(NX) N, 递减排序可表示为:X(1)>X(2)>…>X(N)
统计学基础(第三章)
7.0 40.0 66.0 87.3 100.0 —
300 279 180 102 38 —
100.0 93.0 60.0 34.0 12.7 —
statistics
统计学——第三章数据整理与显示 数值数据(定距数据)的分组
单项分组:每一个组中只有一个变量值,适用于离散型变量 的数据、并且数据的范围不太大情况下的分组。 组距分组:每个分组是一个数值区间。它适用于连续型变量 或变动范围较大的离散型变量的数据分组。
statistics
统计学——第三章数据整理与显示
具体步骤:
(1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。
(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。 (3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域” 一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他 选项根据需要选择。点击“确定”按钮,得结果。 (4)对输出结果进行还原并适当改造,即可得频数分布。
统计学——第三章数据整理与显示
第四节 统 计 图
statistics
统计学——第三章数据整理与显示
统计图的结构
标题 一般包括图表标题、数值轴(X,Y)标题 坐标轴和网格线 坐标轴和网格线构造了绘图区的骨架, 借助坐标轴和网格线,可以更容易读懂统计图。 图表区和绘图区 统计表的所有内容都在图表区内,包括 绘图区。统计图绘制在绘图区内。 图例 用来标明图表中的数据系列。
答:调查整理的结果为
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 户数/户 24 108 93 45 30 300 百分比/% 8 36 31 15 10 100 向上累积 24 132 225 270 300 — 8.0 44.0 75.0 90.0 100.0 — 向下累积 百分比/% 100 92 56 25 10 — 300 276 168 75 30 — 户数/户 百分比/% 户数/户
第三章 统计数据的整理
土 地 面 积
人口密度
日本
美国
欧共体
统计地图
合成纤维人造纤维的地域分布
(四)统计图的构成
图题
某国各地降水量
90 80 70 60 50 40
1 图题 2 图号 3 图目
4 图尺 5 图形 6 图注
图 目
降 水 量 ( 毫 米 )
图形
图注
东部 西部 北部
图尺 30
20 10 0 第一季度 第二季度 第三季度 第四季度
分配数列的种类
1.按分组标志的性质不同
品质变量数列:按品质变量分组形成
数值变量数列:按数值变量分组形成
2.数值变量数列还可分为 单项数列:每组只有一个变量值的变量数列 组距数列:每组变量值是一段区间的变量数列
连续变量数列:按连续变量分组形成的数列
离散变量数列:按离散变量分组形成的数列
品质变量分配数列实例
本章重难点提示
本章重点:统计分组、变量数列的编制、统计数据的显示方 法——统计表和统计图。 本章难点:统计分组、变量数列的编制、次数分布图的绘制。
第一节 数据整理的一般问题
一 数据整理的概念和作用
(一)概念 对统计调查所搜集到的数据进行分类和汇总,使 其系统化、条理化、科学化,以得出反映事物总体综 合特征的资料的工作过程。
100-500 500以上
180
85 35
7.83
3.70 1.52
合计
2300
100.00
单项式变量数列实例
表3-4 家庭人口数(人) 1 某市居民家庭按家庭人口数分组 家庭数(千户) 9.8 比重(%) 5.76
2
3
27.5
94.6
第三章 统计数据的整理和显示
发现数据 的规律性, 作进一步的 统计分析
二、统计整理的步骤
1.统计资料的审核
包括对资料的完整性和准确性审核。
2.统计资料的分组和汇总
分组和汇总是统计整理的中心工作
3.编制统计图表
统计图表是统计整理成果最常用的表现形式,
举例
男
政治面貌
中共党员 团员 中共党员 团员
按别
女
政治面貌
3.
按分组的作用分
类型分组 结构分组 分析分组
四、分组体系
1.概念:统计分组体系是指在统计整理中,为研究现 象总体的情况而运用多个分组标志对总体进行分组,从而 形成一系列相互联系、相互补充的分组体系。 2.分类:平行分组体系和复合分组体系。 平行分组体系就是对同一总体进行若干次简单分组。 复合分组体系就是对某一总体进行某种复合分组。 汉族12人,占60% 1.按民族分组 回族5人,占25% 平 满族3人,占15% 行 20岁5人,占25% 分 21岁5人,占25% 组 2.按年龄分组 22岁2人,占10% 体 23岁8人,占40% 系 中共党员8人,占40% 3.按政治面貌分组 团员12人,占60%
一、统计整理的意义
统计整理:根据统计研究的目的,对统计 调查所搜集到的原始资料进行分组、汇总, 使其条理化、系统化的工作过程。
对于已整理过的初级资料进行再整理,也属于
统计整理。
意义:整个统计工作和研究过程的中间
环节,起着承前启后的作用。统计整 理是统计调查的继续,又是统计分析 的基础。
适用于连续型变量 变动范围比较大的离散型变量
某班考试成绩统计表
统计学 第3章 数据的整理与显示
主讲:王光玲,济南大学商学院 45
2.统计分组的方法
2)数量标志分组 ——按表现总体单位数量特征的标 志进行的分组 。
例如,按职工人数分组、按人口年龄分组、按工资收 入水平分组、按销售额分组等
(1)单项式分组:每组变量值是一个值 (2)组距式分组:每组变量值是一个区间。
2020/5/14
46
小作业:课后将课本P50的例3-1和3-2的例子演示
一遍!
2020/5/14
39
3.2 统计分组与频数分布
3.2.1 统计分组 3.2.2 频数分布及统计图
主讲:王光玲,济南大学经济学院
3.2.1 统计分组
主讲:王光玲,济南大学经济学院
1、统计分组(见P52)
概念:根据统计研究的目的和客观现象的内在特点,按 照一定的标志把被研究总体划分为若干个性质不同但又 有联系的组,称为统计分组。
某单位共有1000名职工,每名职工的文化程度、月收入、 婚姻状况等个体特征都有所不同(变异)。若该单位领导 想从总体上了解职工队伍的文化程度、月收入、婚姻状况 等情况,则可先要通过登记方法获得每个职工的资料,对 这些描述每名职工个体特征的资料进行分类汇总和分析计 算,就可以了解该单位全部职工中有多少人未婚、多少人 已婚、多少人离婚、多少人丧偶,各自所占的百分比是多 少;也可以了解研究生、大学、中专(高中)等不同文化 程度职工的人数及比重;还可以了解职工月平均工资、各 类职工的工资水平、职工工资分布的均衡性等等,以上内 容均为统计整理的有效信息,这些统计信息对于制定企业 的人力资源计划是十分必要的。
2020/5/14
43
2.统计分组的方法
1)品质标志分组 ——按研究对象的某种属性特征分组。
(2)复合分组:对总体按两个或两个以上的标志进 行的重叠式分组。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
工商管理
分类数据的图示—饼图
统计学
30.00%
12.00%
20.00%
工商管理
16.00%
22.00%
果汁 矿泉水 绿茶 其他 碳酸饮料
用Excel制作复式条形图
统计学
定序数据的整理与图示
工商管理
顺序数据的整理
统计学
• 1. 累积频数:各类别频数的逐级累加 • 2. 累积频率:各类别频率(百分比)的逐级累加
也可以放在横轴,称为柱形图。
• 图形绘制建立在频数表的基础之上。 • 即先生成频数分别表或交叉频数分布表,在其
基础上绘制相应图形。
工商管理
分类数据的图示—条形图
统计学
频数
16 15
12
11
9
9
8
6
4
0 可口 旭日升 百事 可乐 冰茶 可乐
汇源 果汁
露露
不同品牌饮料的频数分布
品牌
工商管理
统计学
10
– 递 递增增排排序序后:可设表一示组为数:据x为(1)x<1x,(2)x<2…,<…x,(n)xn, – 递减排序:可表示为:x(1)>x(2)>…>x(n)
工商管理
数据透视表
P40-43 EXCEL操作生成数据透视表
统计学
工商管理
§3.2 分类和顺序数据的整理与显示 统计学 一. 分类数据的整理与显示 二. 顺序数据的整理与显示
21%
33% 36%
26% 31%
非常不满意 不满意 一般 满意 非常满意
甲、乙城市家庭对住房状况评价的累积频数分布
工商管理
统计学
§3.3 数值型数据的整理与显示
工商管理
数据分组
统计学
工商管理
统计学
★统计分组 根据统计研究任务的要求和现象总体 的内在特点,把数据(统计)总体按照 某一标志划分为若干性质不同而又有 联系的几个部分,称为数据分组(统计 分组)。
• 4. 统计对于现象的研究,不但要注意现象的一 般性,更要注意现象的特殊性。统计分组为认识 事物间的差别、特点提供了手段。
工商管理
★关 键
统计学
统计分组是把总体按某一标志来分门别类的, 选择什么样的标志就有什么样的分组体系。因此, 统计分组的关键在于分组标志的选择和分组界限 的确定。
选择分组标志是统计分组的核心问题,关键问 题。分组标志作为将现象总体划分为各个不同性 质的组的标准或根据,选择得正确与否,关系到 能否正确反映总体的性质特征、实现统计研究的 目的任务。
– 主要用于对定类和定序尺度数据的审核 2. 计算检查
– 检查调查表中的各项数据在计算结果和计算 方法上有无错误
– 主要用于对数值型数据的审核
工商管理
二手数据的审核
统计学
1. 适用性审核 – 弄清楚数据的来源、数据的口径以及有 关的背景材料 – 确定数据是否符合自己分析研究的需要
2. 时效性审核 – 尽可能使用最新的数据
9
8
7
5
5
4
3
2
1
1
0
果汁
9
7 6
6
6
男
4
4
女
2
矿泉水
绿茶
其他 碳酸饮料
用Excel制作复式条形图
工商管理
分类数据的图示—饼图
统计学
1. 也称圆形图,是用圆形及圆内扇形的角度来表 示数值大小的图形。
2. 主要用于表示总体或样本中各组成部分所占的
比例,对于研究结构性问题十分有用。
3. 绘制圆形图时,总体中各部分所占的百分比用 圆内的各个扇形角度表示,这些扇形的中心角 度,是按各部分数据百分比占3600的相应比例 确定的。
不满意
99 33.0 120 40.0 279 93.0
一般
78 26.0 198 66.0 180 60.0
满意
64 21.3 262 87.3 102 34.0
非常满意
38 12.7 300 100.0 38 12.7
合计
300 100.0 —
—
—
—
工商管理
顺序数据的图示—累计频数分布图 统计学
不同原因引起的寿命损失 统计学
• 教材P35-36 • 1.文字描述 • 2.表格描述 • 3.图形描述
• 合理使用图表描述统计结果是应用统计的 基本技能之一。
工商管理
第 3 章 统计数据的整理与显示 统计学
§3.1 数据的预处理 §3.2 定类和定序尺度数据(品质数据)的整理与 显示
一、分类数据的整理与显示 二、顺序数据的整理与显示 §3.3 数值型数据的整理与显示 §3.4 统计表
统计学
凡是用变量值的一个区间表示一个组的分组。适用 于连续型变量或虽为离散型变量但取值很多,不便一 一列举的情况。
① 了解究竟谁是中国汽车生产的三大巨头; ② 世界500强企业的名次; ③ ……
4. 排序可借助于计算机完成
工商管理
数据排序
统计学
1. 分类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯
上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列,
也可按笔画排序,其中也有笔画多少的升序 降序之分 2. 数值型数据的排序
2. 环形图与圆形图类似,但又有区别 – 圆形图只能显示一个总体各部分所占的比 例 – 环形图则可以同时绘制多个总体的数据系 列,每一个总体的数据系列为一个环
3. 环形图可用于结构比较研究 4. 环形图主要用于展示分类和顺序数据
工商管理
环形图
统计学
甲乙两城市家庭对住房状况评价比较
10%
8%
15%
13% 7%
工商管理
统计学
分类数据的整理与图示
工商管理
分类数据的整理
统计学
1. 列出各类别
2. 计算各类别的频数 3. 制作频数分布表 4. 用图形显示数据
分类 A B C D E
频数
比例
百分比 比率
☺☺☺ ☺☺
工商管理
数据整理的几个概念
统计学
1. 频数(frequency) :落在各类别中或各组中的 数据个数;
工商管理
教学目的和要求
统计学
1. 了解数据预处理的内容和目的 2. 掌握定类和定序尺度数据的整理与显示方法 3. 掌握数值型数据的整理与显示方法 4. 用Excel作频数分布表和条形图 5. 合理使用统计表
工商管理
数据整理的目的
统计学
数据整理的目的在于将个别单位的标志值转 化为说明总体数量特征的指标值,使统计资料 系统化,从而得出反映现象总体性和规律性的 综合资料,为统计分析提供基础和前提条件。
3. 确认是否必要做进一步的加工整理
工商管理
统计学
数据筛选与排序
工商管理
数据筛选
统计学
1. 当数据中的错误不能予以纠正,或者有些数据 不符合调查的要求而又无法弥补时,需要对数 据进行筛选
2. 数据筛选的内容包括
▪ 将某些不符合要求的数据或有明显错误的
数据予以剔除
▪ 将符合某种特定条件的数据筛选出来,而
且变量的取值不多。例如,职工按家庭人口数分组,家
庭人口数其取值不可能很多,且每一个取值都可视为一
种类型
按家庭人口数分组
1人
2人
3人
4人
5人
6人
工商管理
单变量值分组 (要点)
• 1. 将一个变量值作为一组 • 2. 适合于离散变量 • 3. 适合于变量值较少的情况
工商管理
统计学
☺ ☺ ☺ ☺
②组距式分组
2. 频率(比例)(proportion) :某一类(组)别数据 个数占全部数据的比值;
3. 百分比(percentage) :将对比的基数作为100 而计算的频率;
4. 比率(ratio) :不同类别数值的比值。
工商管理
分类数据整理—频数分布表 (例题分析)
【例】一家市场调查公司
为研究不同品牌饮料的市场 占有率,对随机抽取的一家 超市进行了调查。调查员在 某天对50名顾客购买饮料的 品牌进行了记录,如果一个 顾客购买某一品牌的饮料, 就将这一饮料的品牌名字记 录一次 。右边就是记录的 原始数据
数据根据其标志的类型,将数据分为分类数 据、定序数据和数值型数据.
工商管理
数据整理与显示的基本问题
统计学
1. 要弄清所面对的数据类型,因为不同类型 的数据,所采取的处理方式和方法是不同 的。
2. 对定类和定序尺度的数据主要是做分类整 理。
3. 对数值型数据则主要是做分组整理。 4. 适合于低层次数据的整理和显示方法也适
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全 2. 准确性审核 – 检查数据是否真实反映客观实际情况,
内容是否符合实际 – 检查数据是否有错误,计算是否正确等
工商管理
原始数据的审核
统计学
• 审核数据准确性的方法 1. 逻辑检查
– 从定性角度,审核数据是否符合逻辑,内容 是否合理,各项目或数字之间有无相互矛盾 的现象
统计学
绿色
健康饮品
工商管理
用Excel制作频数分布表
统计学
工商管理
统计学
• SPSS操作生成频数分布表和交叉频数分布表 P45-46
工商管理
分类数据的图示—条形图
统计学
1. 用宽度相同的条形的高度或长短来表示各类别 数据的图形;
2. 有单式条形图、复式条形图等形式; 3. 主要用于反映分类数据的频数分布; 4. 绘制时,各类别可以放在纵轴,称为条形图,
统计学