第三章 统计整理与统计显示
统计学基础(第三章统计数据整理与展示)PPT课件
– 两种整理形式优缺点互补,实际中常常结合运用, 称为综合整理,即对一些最基本的统计指标实行 逐级整理,另一方面又将全部原始资料实行集中 整理。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
三、统计整理的步骤
• 1.设计和编制统计资料的整理方案。 • 2.审核统计资料。
第一节 统计整理的
统计分组 分配数列 统计表和统计图
• 案例分析
• 思考与练习
E-mail::
第三章 统计数据整理与展示
第三章>>第E-一ma节il::
第三章 统计数据整理与展示
一、统计整理的意义
• 概念
– 统计整理,是指根据统计研究的目的,将 统计调查所搜集到的原始资料进行科学的 分类和汇总,或对已初步加工的资料进行 再加工,使之系统化、条理化,成为能够 反映现象总体特征的综合资料的工作过程。
1980年
GDP 100 第一产业 3.2 第二产业 75.7 第三产业 21.1
1990年 100 4.3 63.8 31.9
1996年 1997年 100 100
2.5 2.3 54.5 52.2 43.0 45.5
3·研究总体现象之间的依存关系
例:中国农民家庭按收入分组的恩格尔系数(1984年)
• 5.编制统计图表。
– 以统计表、统计图的形式简明扼要地表现统计整 理的结果。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
第三章E>-m>a第il::二节
第三章 统计数据整理与展示
什么是统计分组?
根据现象的特点和统计研究的目的要求, 按照某个(或几个)标志把总体划分为若干 不同性质的组,称为统计分组。
《统计学》第3章统计数据的整理和显示
• 组限
• 1、组数的多少与组距的大小有关。在全距一定时,组距 大,组数就少;组距小,组数就多。 • 2、组距的确定要根据事物的数量特征来确定。组距如果
过大,就会使性质不同的单位归并到了同一组里(破坏了
组内的同质性);组距过小,就会使同一性质的单位分到 了不同的组里(破坏了组与组之间的差异性)。
指标名称和数值)。
例
2006年某月某公司各企业劳动生产率统计表 (单位)
分组 P 总产值( 万元) 1 职工人数( 人) 2 劳动生产率 (元/人) 3
总标题
纵栏标题
横 行 标 题
大型 中型 小型 合计
数据资料 (指标数值)
主词
宾词
(1)、调查表 1、按用途分类: (2)、整理表或汇总表
(3)、分析表
或变异范围较大的离散变量。
例:学生按学习成绩分组:
按成绩分组 60分以下 人 2 数
60—70
70—80 80—90 90分以上 合 计
9
15 11 3 40
(1)、等距分组:各组的组距都相等。适用于标志值的
变动比较均匀的情况下。
(2)、异距分组:各组的组距不完全相同。适用:
a、标志值分布很不均匀
b、标志值相等的量具有不同意义
• 向上累计:由标志值小的方向向标志值大的方 向累计。 表示的意义是:该组上限以下所包含的总体单位 是多少。 • 向下累计:由标志值大的方向向标志值小的方 向累计。 表示的意义是:该组下限以上所包含的总体单位是 多少。
某班50名学生“统计学”考试成绩累计次数分布统计表
按考试 成绩分 组 60以下 60-70 70-80 80-90 90以上 合计 人数 频率( %) 4 20 24 32 20 100 向上累计 人数 2 12 24 40 50 频率 4 24 48 80 100 人数 50 48 38 26 10 向下累计 频率 100 96 76 52 20 -
第3章 统计数据的整理与显示.ppt
统计整理
将统计调查得到的原始资料进行 科学的分类和汇总,使之成为系 统化、条理化的综合资料,以反 映研究总体特征的过程。
地位
是统计调查的继续,统计分析的前 提和基础,起着承前启后的作用。
统计数据整理的一般程序 数据的预处理 数据的分组 数据的汇总
分布数列(频数分布)
(一)数据的预处理
1. 数据的审核
0~15 15~65 65以上
合计
1953年
36.3 59.3 4.4
100
1964年
40.7 55.7 3.6
100
1982年
33.6 61.5 4.9
100
1990年
27.5 66.7 5.8
100
2000年
22.9 70.1 7.0
100
(3)分析现象之间的依存关系
中国农民家庭按收入分组的恩格尔系数
▪ 检查数据中的错误
2. 数据的排序
▪ 升序和降序 ▪ 寻找数据的基本特征
3. 数据的筛选
▪ 找出符合条件的数据
数据的审核
1. 完整性与及时性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全 – 检查填报单位是否按时报送了有关数据
2. 准确性审核
– 检查数据是否真实反映客观实际情况,内 容是否符合实际
– 检查数据是否有错误,计算是否正确等
• 审核数据准确性的常用方法
1. 逻辑检查
– 从定性角度,审核数据是否符合逻辑,内容是否 合理,各项目或数字之间有无相互矛盾的现象
– 主要用于对分类和顺序数据的审核
2. 计算检查
– 检查调查表中的各项数据在计算结果和计算方法 上有无错误
统计学教案(第3章统计数据的整理与显示)
组距式分组要确定并考虑组距、组数、组限、组中值等问题。组距式分组 的步骤是: (一)确定组距与组数 组距与组数互为消长,在全距一定的情况下,若组数很多,则必然组距较 小,反之,若组数少,则必然组距较大。在分组时,应避免组距过大或过小, 因为当组距过大以至组数过少时,则可能将一些性质不同的单位归并到同一 组,不能充分显示总体的特征;当组距过小以至组数过多时,则可能把性质相 同或相近的单位分散到不同的组, 也不能很好地显示总体的特征。 比如对学生 按考试成绩分为 0-60 分、60-100 分,显然分组过少,不能充分揭示学生考试
解:第 1 步:顺次点击【销售收入】单元格、 【数据】菜单、 【筛选】和【自动筛选】命 令,见图 3-2。
2
图 3-2
Excel 自动筛选命令
第 2 步:顺次点击【销售收入】标志的下拉箭头、 【自定义】 , 见图 3-3。
图 3-3
选择“自定义”命令
第 3 步:点击对话框中的下拉箭头,选择“大于或等于” ,并在其后的空格中输入 3000, 见图 3-4。单击【确定】 ,即可得到图 3-5 所示的结果。
统计学
授课题目 第 3 章统计数据的整理与显 示 授课方式 教学目的: 过本章的学习,要求明确统计整理的意义、内容和步骤;掌握统计分组的涵义及作用、正确选 择分组标志的原则及分组方法;掌握分配数列的概念、种类、编制方法;熟悉统计表的结构及设计 要求。 教学重点及难点提示: 重点为统计分组的概念、作用;正确选择分组标志的原则、方法;分配数列的编制。 难点为分组标志的选择和次数分布的特征。 案例导入:我国人口老龄化趋势不可逆转 第一节 数据整理的意义和程序 一、数据整理的意义 通过统计调查, 我们得到许多原始数据, 但这些数据是反映总体单位特征 的、 分散的、 不系统的, 为此必须对数据进行整理, 使之由 “个别” 上升到 “一 多媒体教学 般”,成为既便于储存,又便于传递的反映总体特征的资料。统计数据的整理 案例教学 是统计分析的前提,关系到整个统计工作的质量,因此,必须十分重视统计数 据的整理。 二、数据整理的程序 统计数据整理的主要内容有:数据预处理、数据的分组(类) 、汇总、整 理后的数据显示。 第二节 一、数据的审核 在分类汇总之前, 必须对原始数据进行认真的审核。 审核的内容是数据的 完整性和准确性。 所谓完整性审核, 一是审核各调查单位的调查表或调查问卷 是否汇集齐全,比如,已对 500 个学生分别发放了调查问卷,要审核是否全部 回收,如果回收不全要及时催收;若无法催收,要清点已回收的数量;若回收 的数量不能满足要求,必须进行补充调查。其次,要审核各份调查表或调查问 卷的项目是否填写齐全。 若填写不全要补充完整; 若一些缺失的重要项目无法 补充填写,视为无效调查表或调查问卷对其剔除。 所谓准确性审核, 就是审核各调查项目的填写内容是否准确。 数据的准确 性审核主要采用逻辑检查和计算检查。 逻辑检查就是根据项目之间存在的内在
统计学第三章统计数据的整理与显示
对第二手资料(获取他人的资料): 审核其完整性、准确性、适用性、时效性 2、筛选:
筛选包括: 剔除不符合要求的数据或有明显错误的数据; 将符合特定条件的数据筛选出来。
§3.1
统计整理与统计分组
★ 一、统计整理的意义和步骤 ★ 二、统计整理的基本方法
——统计分组
《统计学》第三章 统计数据的整理与显示
将总体中所有单位按一定的标志分 统计分组 为性质不同但又有联系的若干部分 的过程
统计分组的作用:
划分社会经济现象的类型
反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
Percent
有效 数据
频数
频率
有效 频率
累计 频率
约2/3的人身高不超过165cm 频数表 (用SPSS制作)
洛伦茨曲线
累计频数(频率)分布曲线,可用于分析 社会财富、土地和工资收入等的分配是否 公平的问题。该曲线图是由美国洛伦茨博 士提出,故称为洛伦茨曲线。
二、统计整理的基本方法
——统计分组
《统计学》第三章 统计数据的整理与显示
统计整理
将统计调查得到的原始资料进行 科学的分组和汇总形成综合统计 资料的工作过程(对调查资料去伪
地位
是统计调查的继续,统计分析的 前提和基础
存真、去粗取精、科学分类、浓缩简 化)
统计数据的处理:
内 容 统计资料的分组、汇总及制表
《统计学》第三章 统计数据的整理与显示
统计整理的步骤
制定统计整理方案 对原始资料进行审核 数据处理 制作统计表或统计图
(一)数据的审核与筛选 1、审核: 对 第一手资料(直接调查或试验取得):审 核其完整性与准确性 完整性审核:应调查的单位或个体是否有遗 漏;所调查的项目是否填齐全。 准确性审核:内容是否符合实际;计算是否 正确。 如:文化程度:小学 职业:大学教师
第三章统计数据的整理与展示
编制结果
组中值: 5-(10-5)/2=S2T.A5T
根据“上限不包括在内”原则,所以在
5的销~1数0售之值额间值,有(不:百应5.万0该5把元.81)06包.0括组6在.4内中6.,8值这7.里0 商店数
7.4 8.3 8.5 9.5
5以下
2.5
4
5~10 10~15 15~20
172.5.5组25中+值(:211006-25)/2=27.5 17.5 13
储蓄存款
品
活期
质 标 志
定期 财政性存款
复合 分组
分 组
活期 定期
STAT
例2 :企业职工按工龄分组
5年以下
5~10年
10~15年
数量标志分组
15~20年
20年以上
统计分组的程序与原则
选择分 组标志
确定分 组体系
总体单 位归类
科学性: 组间差异 大,组内 差异小。
完备性和互斥性: 每个单位均能且 只能归到某个组 中。
2. 时效性审核 – 应尽可能使用最新的统计数据
3. 确认是否必要做进一步的加工整理
数据的筛选
STAT
1. 对审核过程中发现的错误应尽可能予以纠正 2. 当发现数据中的错误不能予以纠正,或者有些
数据不符合调查的要求而又无法弥补时,需要 对数据进行筛选 3. 数据筛选的内容包括:
▪ 将某些不符合要求的数据或有明显错误的数
志作为分组标志 • 要结合现象所处的具体历史条件或经济条
件来选择分组标志
例 1 : 为了了解某地区银行存款的构成,可以选 用存款性质、期限两个标志分别进行分组
STAT
按存款性质分组 企业存款 储蓄存款 财政性存款
第三章统计数据的整理与显示
统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
统计学原理课件:第三章 统计数据的整理与显示
2、不重合式
指前一组的上限与后一组的下限,两值紧密相连而不相重 复。
一般用于离散型变量。 组距=下组下限-本组下限=本组上限-前组上限 例:人口普查时,按照家庭人口数分组:1-2,3-4,5-6,
7和7以上
组 中值
组中值:各组上下限的中点值,代表组内各标志值的一般水平。 重合式组限时:
3、会审汇编:将下级统计工作人员集中到上级机关, 共同审核和汇总统计资料(如:年报),可以节省时 间,随时纠正资料中的错误,交流经验,提高水平。
4、综合汇总:对各级需要的基本资料实行逐级汇总, 对调查所得的其他资料实行集中汇总(人口普查)
三、统计汇总的技术
1、手工汇总 2、电子计算机汇总
第五节 分布数列
U形分布数列
J形分布数列 J形
倒J形
按分组形式 单项式数列
组距式数列 等距数列
异距数列
按分组标志不同分为品质数列和变量数列(按 数量标志分组)
1.品质分布数列例:
按性别分组 男性 女性
合计
人数 600 400
1000
所占% 60 40
100
各组名称 次数(频数)
频率
2.变量数列例:
按月工资收入分组 1000元以下 1000-1500 1500-2000 2000-2500 2500-3000 3000元以上 合计
n 1 3.3lg N n : 组数,N:总体单位数,d:组距,R:全距 X max:最大变量值,X min:最小变量值
N 15-24 25-44 45-89 90-179 180-359 360-719
n5
6
7
8
9
10
适用条件:
第三章统计数据的整理和显示
第三章 统计数据的整理与显示
3.历史资料的审核: 在利用历史资料(或其他间接资料)时,
应审核资料的可靠程度、指标含义、所属 时间与空间范围、计算方法和分组条件与 规定的要求是否一致。 一般可以从调查 资料的历史背景、调查者搜集资料的目的 以及资料来源等,来判断资料的可靠程度, 也可以从指标间的相互关系以及指标的变 动趋势来检查它的正确性。
第三章 统计数据的整理与显示
• 复合分组实例:
男生 文科 女生
• 学生
男生
理科 女生
第三章 统计数据的整理与显示
2、按分组标志性质
品质分组
数量分组
第三章 统计数据的整理与显示
• 1 品质分组 是按品质标志进行的分组,即按实 物的某种属性分组。 • 如 企业按经济类型、行业分组;人口按性别、 民族分组;大学生按专业分组等。 • 这种分组可以反映总体的构成和不同属性事物 在总体中的地位和作用。
第三章 统计数据的整理与显示
(二)统计数据整理的意义:
1、统计数据整理能够对总体做出概括性的 说明。 2、统计整理是整个统计工作和研究过程 的中间环节,起着承前启后的作用。统计 整理是统计调查的继续,又是统计分析的 基础。 3、统计整理还是积累历史资料的必要手 段。
第三章 统计数据的整理与显示
(3)如果所发现的差错在其他单位也可能发 生时,应将错误情况通报所有单位,以免 发生类似错误。 (4)对于严重的错误,应发还重新填报,并 查明发生错误的原因,若属于违法行为, 则应依法严肃处理。
第三章 统计数据的整理与显示
(三)数据的排序
数据排序就是按照一定的顺序将数据排列,
以便初步显示数据的一些明显特征和规律, 为研究者找到解决问题的线索。
第3章 统计数据的整理与显示
第3章统计数据的整理与显示【学习目标】本章主要介绍了统计整理是统计调查的继续,又是统计分析的前提。
介绍了统计整理的概念和内容,统计分组的方法,分配数列的概念、种类以及编制分配数列的基本步骤。
统计资料汇总的组织形式和具体方法。
【基本要求】学习本章内容,要求学习者注意统计资料整个工作过程的有关问题,掌握统计资料整理的程序、步骤和方法,绘制统计图,编制统计表。
通过各种渠道将统计数据搜集上来之后,首先应对这些数据进行加工整理,使之系统化、条理化,以符合分析的需要。
通过整理可以大大简化数据,使我们更容易理解和分析。
数据整理通常包括数据的预处理、分类或分组、汇总等几个方面的内容,它是统计分析之前的必要步骤。
【学习内容】3.1 数据的预处理数据的预处理是数据整理的先前步骤,是在对数据分类或分组之前所做的必要处理,包括数据的审核、筛选、排序等。
3.1.1数据的审核与筛选在对统计数据进行整理时,首先要进行审核,以保证数据的质量,为进一步的整理与分析打下基础。
从不同渠道取得的统计数据,其审核内容和方法有所不同,不同类型的统计数据在审核内容和方法上也有所差异。
对于通过直接调查取得的原始数据,应主要从完整性和准确性两个方面去审核。
完整性审核主要是检查应调查的单位或个体是否有遗漏,所有的调查项目或指标是否填写齐全等。
准确性审核主要包括两个方面:一是检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;二是检查数据是否有错误,计算是否正确等。
审核数据准确性的方法主要有逻辑检查和计算检查。
逻辑检查主要是从定性角度审核数据是否符合逻辑,内容是否合理,各项目或数字之间有无相互矛盾的现象。
比如中学文化程度的人所填的职业是大学教师,对于这种违背逻辑的项目应予以纠正。
逻辑检查主要用于对定类数据和定序数据的审核。
计算检查是检查调查表中的各项数据在计算结果和计算方法上有无错误。
比如各分项数字之和是否等于相应的合计数,各结构比例之和是否等于1或100%,出现在不同表格上的同一指标数值是否相同,等等。
第三章 统计数据整理与显示
概 念
分配数列(频数分配/次数分配):分组归类、排序, 形成总体内所有单位在每一组的分布。 作用:反映总体的结构分布特征。 分配数列/频数分布表的一般形式:
分组标志
频数/次数
频率(%)
……
…… 合计
……
…… ……
统计学原理
……
…… 100
分 类
表1 xxx学校教师性别分布情况 教师人数(人) 120 98 218 表2 x村家庭人口情况
5
图X 某电脑公司销售量的频数分布直方图
统计学原理
销售量(台)
折线图(Line Chart) 反映和比较现象的变动趋势。
160000 140000 120000 100000 80000 60000 40000 20000 0
1996 1997 1998 1999 2000 2001 2002 2003 2004 GDP(亿元)
第三章 统计数据的整理与显示
统计整理 (Statistical arrangement)
整理的概念和内容
整理最基本手段——统计分组
数据汇总基本手段——分配数列
数据展示基本方式——统计表和统计图
统计学原理
1、为了了解影响大学生成绩的因素,通过调查取得了 2000份在校大学生相关数据,如何将这些数据进行处理, 对哪些因素对成绩有影响,哪些因素比较重要等等能做 出初步判断? 2、某银行个贷部根据上级的要求,在郑州各高校抽取了 1000名学生,调查了学生信用卡拥有、使用情况等信息, 除此之外,还搜集了一些宏观经济形势、货币政策、其 他银行在高校业务开展情况等信息,如何使这些信息简 明、直观,以便领导能较为迅速地做出准确判断,以制 定适当的措施,做出合理的决策?
社会经济统计学第3章统计数据的整理与显示
15
9 — 11
2
12 — 14 1
合计
50
工人平 均日产 量(件)
工人人 数
1
5
2
13
3
18
4
12
5
2
合计 50
单项数列
学生 按成绩 分组 50 — 60
60 — 70
70 — 80
80 — 90
90 — 100 合计
学生 人数
5 13 18 12 2 50
等距数列
人口 按年龄 分组
人口数 (万人)
2、要素:分组;次数。
次数分布表
按性别分组 男 女 合计
次数(频数) 30 20 50
频率(%) 60 40 100
二、次数分布数列的分类 1、品质分布数列 2、变量分布数列
(1)离散型: 单项、组距(等距、不等距);
(2)连续型: 等距、不等距。
单词 按字母数 单词数
分组
0—2
18
3—5
14
6—8
第3章 统计数据的整理与展示
3.1 统计数据整理概述 3.2 统计分组 3.3 次数分布 3.4 统计整理数据的显示
3.1 统计数据整理概述
一、统计整理的含义:对原始统计数据进行加工汇总,使之系 统化、条理化、科学化、反映数据分布规律的工作过程。
二、统计整理的内容:审核;分组;汇总加工;编制图表; 系统积累。
学生 按成绩 分组 60以下
60 — 70
70 — 80
80 — 90 90以上
合计
学生 人数
5 13 18 12 2 50
2、编制步骤(以等距数列为例) (1)排序,计算全距:
全距 = 最大值 – 最小值; 例,全距 = 99 – 56 = 43; (2)确定组数K,计算组距 d : 组数根据数据多少、经验、 习惯等确定,5 — 20 组; 组距 = [ 全距 / 组数 ] 的调整; 例,K = 5 ,
统计学第三章统计数据的整理与显
地位
化)
是统计调查的继续,统计分析的 前提和基础
统计数据的处理:
内
统计资料的分组、汇总及制表
容 统计数据的管理:
数据的传输、贮存、更新及输出
统计整理
《统计学》第三章 统计数据的整理与显示
主要任务 资料审核、分组、 STAT 汇总、制表、制图等。
分组
频数分布 统计表
统计图
5
分组
《统计学》第三章 统计数2据5的%整理与显示
《统计学》第三章 统计数据的整理与显示
STAT
(一)数据的审核与筛选
1、审核:
对 第一手资料(直接调查或试验取得):审 核其完整性与准确性
完整性审核:应调查的单位或个体是否有遗 漏;所调查的项目是否填齐全。
准确性审核:内容是否符合实际;计算是否 正确。
如:文化程度:小学
职业:大学教师
8
《统计学》第三章 统计数据的整理与显示
值个数也较多的离散变量。
等距数列 变量值变动区间的长度相等 异距数列 变量值变动区间的长度不完全相等
获金牌项目 金牌数 占总数比例
跳水 举重 乒乓球 羽毛球 体操 射击 柔道 田径 跆拳道
5枚 5枚 4枚 4枚 3枚 3枚 2枚 1枚 1枚
0.1786 0.1786 0.1429 0.1429 0.1071 0.1071 0.0714 0.0357 0.0357
品质数列
《统计学》第三章 统计数据的整理与显示
33%
STAT
分组前
分组后
作用:如:划分现象类型
42%
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
第3章统计数据的整理与显示
第3章统计数据的整理与显⽰第三章数据的整理与显⽰§1 数据的预处理⼀、数据的审核与筛选完整性审核:主要是检查应调查的单位或个体是否有遗漏,所有的调查项⽬或指标是否填写齐全等。
准确性审核:1. 检查数据资料是否真实地反映了客观实际情况,内容是否符合实际;2. 检查数据是否有错误,计算是否正确等。
数据筛选:1. 将某些不符合要求的数据或有明显错误的数据予以剔除;2. 将符合某种特定条件的数据筛选出来,⽽不符合条件的数据予以剔除。
⼆、数据的排序数据排序是按⼀定顺序将数据排列,以便于研究者通过浏览数据发现⼀些明显的特征或趋势,找到解决问题的线索。
原始数据 n x x x x ,,,,321顺序统计量 '''21n x x x 或'''21n x x x§2 属性数据的整理与显⽰⼀、分类数据的整理与显⽰(⼀)频数与频数分布1. 频数(frequency 次数):是落在各类别中的数据个数。
频数分布(frequency distribution 次数分布):各个类别及其相应的频数全部列出来。
2. ⽐例(proportion ):是⼀个总体(或样本)中各个部分的数值占全部数值的⽐重,通常⽤于反映总体的构成或结构。
3. 百分⽐(percentage ):将⽐例乘以100就是百分⽐或百分数,它是将对⽐的基数抽象化为100⽽计算出来的,⽤%表⽰。
4. ⽐率(ratio ):是各不同类别数值之间的对⽐关系,因⽽⽐值可能⼤于1。
(⼆)分类数据的图⽰ 1. 条形图(bar chart )2. 饼图(pie chart )⼆、顺序数据的整理与显⽰(⼀)累积频数和累积频率1.累积频数(cumulative frequencies )就是将各类别的频数逐级累加起来。
向上累积向下累积(⼆)顺序数据的图式1.累积频数分布图 2.环形图§3 定量数据的整理与显⽰⼀、数据的分组分组就是根据统计研究的需要,将数据按照某种标准划分成不同的组别,分组后再计算出各组中出现的次数或频数,形成频数分布表。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(三)统计表的设计
统计表的设计应注意如下事项: 1.线条的绘制。表的上下端应以粗线绘制,表内纵横线以 细线绘制。表格的左右两端一般不划线,采用“开口式”。 2.合计栏的设置。 3.标题设计。以简练而又准确的文字表述统计资料的内容、 资料所属的空间和时间范围。
)
统计分组以后,掩盖了各组内部各单位的差异, 而突出了各组之间单位的差异。( )
在组距分组时,对于连续型变量,相邻两组的 组限( A )。
A、必须是重叠的
B、必须是间断的
C、可以是重叠的,也可以是间断的
( B )。 A、学生按考试分数分组 B、产品按品种分组 C、企业按计划完成程度分组 D、家庭按年收入分组
二、统计图
1、直方图:用直方形的宽度和高度来表示次数分布 的图形。绘制直方图时,横轴表示各组组限,纵轴 表示次数(一般标在左方)和比率(或频率,一般 标在右方)。 2、折线图:折线图可以在直方图的基础上,用折线 将各组次数高度的坐标连接而成,也可以用组中值 与次数求坐标点连接而成 3、曲线图:用平滑曲线连接各组次数坐标点即得分 布曲线。
有一个学生考试成绩为70分,在统计
分组中,这个变量值应归入( B )。
A、60---70分这一组
B、70---80分这一组
C、60—70或70—80两组都可以 D、作为上限的那一组
某主管局将下属企业先按轻、重工业分类,
B 再按企业规模分组,这样的分组属于(
)。
A、简单分组
B、复合分组
C、分析分组
划分连续变量的组限时,相邻组的组限必 须( A )。 A、重叠 B、相近 C、不等 D、间断
复合分组是(C )。 A、用同一标志对两个或两个以上的总体层叠 起来进行分组 B、对某一总体选择一个复杂的标志进行分组 C、对同一总体选择两个或两个以上的标志层 叠起来进行分组 D、对同一总体选择两个或两个以上的标志并 列起来进行分组
统计整理的概念和原则
统计整理的方法: 分组 汇总(汇总组织形式) 编表
统计分组
含义:根据统计研究任务的要求和研究现象 总体的内在特点,把现象总体按某一标志 划分为若干性质不同但又有联系的几个部 分称统计分组。
统计分组
统计分组的原则: 穷尽原则,使总体中的每一个单位都应 有组可归,或者说各分组的空间足以容 纳总体所有的单位。 互斥原则,在特定的分组标志下,总体 中的任何一个单位的只能归属于某一组, 而不能同时或可能归属于几个组。 组内同质性和组间差异性原则
合
计
───────────────────────
A、品质分配数列 C、组距式变量分配数列 数列 E、次数分配数列
B、变量分配数列 D、等距变量分配
分配数列
1.组距 连续式分组的组距计算公式: 组距=本组上限–本组下限 间断式分组的组距计算公式: 组距=本组上限–本组下限+1
开口组的组距:以相邻组的组距为本组的组距。
2.组中值:上下限之间的中点数值称为组中值,组中值的 计算公式:
组中值
上限 下限 2
分配数列
开口组组限的计算: 缺下限开口组的组中值=上限-邻组组距/2 缺上限开口组的组中值=下限-邻组组距/2
下列数列属于( B C D E
─────────────────────── ───────────────────────
)
企业数
15 30 5 50
按生产计划完成程度分组(%)
80─90 90─100 100─110
─────────────────────—─
第三章 统计整理与统计显示
本章要点
统计整理的概念和原则 统计分组(重点) 分配数列(重点) 统计表与统计图(重点)
统计整理的概念和原则
统计整理的步骤 1)设计方案 2)统计资料的审核。 3)资料的分组和汇总。分组,即对资料按 其性质和特点,划分为若干类;汇总, 加总计算形成各项统计指标。统计分组 和统计指标是整理的中心工作。 4)编制统计表或绘制统计图。
统计整理的方法是( A、统计分组 B、划分经济类型 C、检验统计资料库 D、统计汇总 E、编制表统计
AD E
)
统计表按主词是否分组及分组的程度,可 分为( ) AC D A、简单表 B、一览表 C、分组表 D、复合表
下列分组哪些是按品质标志分组 BCDE ( ) A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按经济类型分组 E、人口按地区分组
分配数列
计算平均指标或进行其它统计分析时,常以组中值来代表 各组标志值的平均水平。 3.组数 组数=全距/组距 斯特杰斯经验公式: 组数=1+3.322Lg N 由此推出 组距=(最大变量值-最小变量值)/(1+3.322Lg N )
分配数列
累计频数分布:反映总体在某一变量值的某 一水平上总共包含的总体频数和频率
思考:变量数列和 累计频数分布各有 什么作用?
分配数列
向上累计频数(或频率)分布:先列出各组的上 限,然后由标志值低的组向标志值高的组依次累 计。向上累计频数表明某组上限以下的各组单位 数之和是多少,向上累计频率表明某组上限以下 的各组单位数之和占总体单位数比重的大小。 2、向下累计频数(或频率)分布:先列出各组的 下限,然后由标志值高的组向标志值低的组依次 累计。向下累计频数表明某组下限以上的各组单 位数之和是多少,向下累计频率表明某组下限以 上的各组单位数之和占总体单位数比重的大小。
下面哪些分组是按数量标志分组 AC D ) ( A、企业按销售计划完成程度分组 B、学生按健康状况分组 C、工人按产量分组 D、职工按工龄分组 E、企业按隶属关系分组
将某地区国有企业按产值计划完成程度分为以下四组, 哪些是正确的?( ACD )
A、第一种 100% 以下 100% ~110% 110% 以上 B、第二种 C、第三种 80 % 以下 80 % 以下 80.1% ~ 90 % 80% ~ 90 % 90.1% ~ 100% 90 % ~ 100% 100.1% ~ 110% 100% ~ 110% 110.1% 以上 110% 以上 D、第四种 85% 以下 85% ~ 95% 95% ~ 105% 105% ~ 115% 115% 以上
统计分组的关键问题是确定组距和组数
某企业职工按文化程度分组形成的分配数列是一个单
项式分配数列。(
)
连续型变量和离散型变量在进行组距式 分组时,均可采用相邻组组距重叠的方 法确定组限。( )
按数量标志分组形成的分配数列和按品 质标志分组形成的分配数列,都可称 为次数分布。( )
按数量标志分组的目的,就是要区 分各组在数量上的差异。(
分配数列
当我们所关心的是标志值较高的现象的次 数分配情况时,我们通常用次数向下累计 以表明在这些数值以上所有数值所占的比 重 当我们所关心的是标志值较低的现象的次 数分配情况时,我们通常用次数向上累计 以表明在这些数值以下所有数值所占的比 重
第一节 统计表与统计图
一、统计表 (一)统计表的定义和结构 1、统计表:把统计数据按一定的顺序排列在表格 上,就形成了统计表。它清楚地、有条理地显示 统计资料,直观地反映统计分布特征,是统计分 析的一种重要工具。
想一想:分配数 列有哪些特点
分配数列
组限:各组两端的数值 下限,上限:组距式分组的每一组变量值 中,其最小值为下限,最大值为上限 组距:上下限之间的距离 全距:变量数列中的最大值与最小值之差
分配数列
间断组距式分组:组限不相连的组距式分组。 连续组距式分组:组限相连(或称相重叠的), 即以同一数值作为相邻两组的共同界限的组距式 分组。 离散型变量,可间断组距式分组,也可连续组距 式分组。连续型变量,只能采用连续组距式分组。 开口式分组:同一分组中上、下限不齐全
“上限在不内”原则:以同一个数值作为相邻两 组共同的界限,统计上规定,凡是总体某一个单 位的变量值是相邻两组的界限值,这一个单位归 入作为下限值的那一组内。
分配数列
等距分组:标志值在各组保持相等的组距, 即各组的标志值变动都限于相同的范围。 一般用于标志值变动比较均匀的场合。 异距分组:各组的组距不相等。
分配数列
品质数列和变量数列 品质数列 变量数列 学生按性别分组 学生按年龄、成绩分组 男 18 60分以下 19 60-70 女 20 70-80 80-90 90以上
分配数列
单项分组与组距分组
家庭按儿童数分组 0 1 2 学生按工资分组 300---400 400---500 500---600
(二)统计表的分类
1、按主词的结构分类
1)简单表:主词未经任何分组的统计表称为简单 表,也称一览表。主词罗列各单位的名称。 2)分组表:主词只按一个标志进行分组形成的统 计表,也称简单分组表,。 3)复合表:主词按两个或两个以上标志进行分组 的统计表,也称复合分组表。
2、按宾词设计分类
D、结构分组
简单分组和复合分组的区别在于( B )。 A、选择的分组标志的性质不同 B、选择的分组标志多少不同 C、组数的多少不同 D、组距的大小不同答案
有20 个工人看管机器台数资料如下: 2,5,4,4,3,4,3,4,4,2,2,4, 3,4,6,3,4,5,2,4。如按以上资料 编制分配数列,应采用( A ) A.单项式分组 B.等距分组 C.不等距分组 D.以上几种分组均可以
2、统计表的结构
1)从表式上看,表格包括总标题、横行标题、纵 栏标题和指标数值四个部分。 2)从内容上看,统计表由主词栏和宾词栏两个部 分组成。 主词栏是统计表所要说明的总体及其组成部分; 宾词栏是统计表用来说明总体数量特征的各个统 计指标。此外,统计表还有补充资料、注解、资 料来源、填表单位、填表人等。