统计学课件--第三章统计整理-39页精选文档
合集下载
统计学课件---第三章【统计整理】
19 78 19 80 19 82 19 84 19 86 19 90 19 88 19 92 19 94 19 96 19 98 20 00 20 02 20 04 20 06 20 08
GDP
年温州市GDP 图1:1978-2008年温州市 年温州市
统计分布的类型
钟型分布、 型分布、 钟型分布、U型分布、 J型分布
编制等距数列
编制步骤: 编制步骤:
⒈求全距 全距=最大值 最小值 全距 最大值-最小值 最大值 ⒉确定组距及组数 组距=全距÷ 组距 全距÷组数 全距
编制等距数列 ⒊确定组限
组限的表示方法
对于离散变量,相邻组组限可以间断, 对于离散变量,相邻组组限可以间断,也 间断 重叠; 可重叠; 对于连续变量,相邻组组限必须重叠; 对于连续变量,相邻组组限必须重叠; 必须重叠 符合“上组限不在内”原则; 符合“上组限不在内”原则; 首末两组可使用“××以下” 首末两组可使用“××以下”及“××以 以下 ××以 的开口组。 上”的开口组。
第三章统计整理
第三章 统计整理
★ 第一节 统计整理概述
第二节 第三节 第四节 第五节 统计分组 频数分布 统计表 统计图
第一节 统计整理概述 ★
一、统计整理的概念 二、统计整理的程序
统计整理概念
将统计调查得到的数据进行加 工整理,使其系统化、条理化, 工整理,使其系统化、条理化, 符合分析的需要。 符合分析的需要。 是统计调查的继续, 是统计调查的继续,统计分析的前 提和基础
累计频数(频率) 累计频数(频率)
向 上 累 计 向 下 累 计
从变量值低的组开始向变量值高的 组累计, 组累计,说明某一组上限以下各组的 累计频数(频率)。 累计频数(频率)。 从变量值高的组开始向变量值低的 组累计, 组累计,说明某一组下限以上各组的 累计频数(频率)。 累计频数(频率)。
GDP
年温州市GDP 图1:1978-2008年温州市 年温州市
统计分布的类型
钟型分布、 型分布、 钟型分布、U型分布、 J型分布
编制等距数列
编制步骤: 编制步骤:
⒈求全距 全距=最大值 最小值 全距 最大值-最小值 最大值 ⒉确定组距及组数 组距=全距÷ 组距 全距÷组数 全距
编制等距数列 ⒊确定组限
组限的表示方法
对于离散变量,相邻组组限可以间断, 对于离散变量,相邻组组限可以间断,也 间断 重叠; 可重叠; 对于连续变量,相邻组组限必须重叠; 对于连续变量,相邻组组限必须重叠; 必须重叠 符合“上组限不在内”原则; 符合“上组限不在内”原则; 首末两组可使用“××以下” 首末两组可使用“××以下”及“××以 以下 ××以 的开口组。 上”的开口组。
第三章统计整理
第三章 统计整理
★ 第一节 统计整理概述
第二节 第三节 第四节 第五节 统计分组 频数分布 统计表 统计图
第一节 统计整理概述 ★
一、统计整理的概念 二、统计整理的程序
统计整理概念
将统计调查得到的数据进行加 工整理,使其系统化、条理化, 工整理,使其系统化、条理化, 符合分析的需要。 符合分析的需要。 是统计调查的继续, 是统计调查的继续,统计分析的前 提和基础
累计频数(频率) 累计频数(频率)
向 上 累 计 向 下 累 计
从变量值低的组开始向变量值高的 组累计, 组累计,说明某一组上限以下各组的 累计频数(频率)。 累计频数(频率)。 从变量值高的组开始向变量值低的 组累计, 组累计,说明某一组下限以上各组的 累计频数(频率)。 累计频数(频率)。
统计整理-PPT课件
2019/2/21
统计表
统计表的构成
统计表的内容
22
统计表的种类
第四节 统计表和 统计图
二、统计图
条形图
曲线图 饼图
3500 3000 2500 2000 1500 1000 第一季度 第一季度
23
500 0 别克 本田 威驰 宝来
2019/2/21
19
2019/2/21
第三节 分配数列
某班学生统计成绩次数分布情况
按成绩 分组 (分) 60以下 60~70 70~80 80~90 90以上 合计
频数
(人)
频率
(%)
向上累计 频数
(人)
向下累计
频率(%) 频数(人) 频率(%) 6 20 48 88 100 — 50 47 40 26 6 — 100 94 80 52 12 —
87 72 61
2
2019/2/21
整理资料
按成绩等级分组 人数(人)
60以下 4
各组人数占 总人数比重(%) 10.0 15.0
30.0
60~70分
70~80分
6
12
80~90分
90~100分 合 计
3
15
3 40
37.5
7.5 100.0
2019/2/21
第一节 统计整理的 意义和步骤
统计整理的意义、步骤
500以下
500-1000 1000—2000 2000-3000 3000以上 合计
50
125 225 75 25 500
3000+1000/2=3500 -
15
相邻两组组限用相同数字表示, 叫重叠式组限。重叠式组限适 用于连续型变量分组。
统计表
统计表的构成
统计表的内容
22
统计表的种类
第四节 统计表和 统计图
二、统计图
条形图
曲线图 饼图
3500 3000 2500 2000 1500 1000 第一季度 第一季度
23
500 0 别克 本田 威驰 宝来
2019/2/21
19
2019/2/21
第三节 分配数列
某班学生统计成绩次数分布情况
按成绩 分组 (分) 60以下 60~70 70~80 80~90 90以上 合计
频数
(人)
频率
(%)
向上累计 频数
(人)
向下累计
频率(%) 频数(人) 频率(%) 6 20 48 88 100 — 50 47 40 26 6 — 100 94 80 52 12 —
87 72 61
2
2019/2/21
整理资料
按成绩等级分组 人数(人)
60以下 4
各组人数占 总人数比重(%) 10.0 15.0
30.0
60~70分
70~80分
6
12
80~90分
90~100分 合 计
3
15
3 40
37.5
7.5 100.0
2019/2/21
第一节 统计整理的 意义和步骤
统计整理的意义、步骤
500以下
500-1000 1000—2000 2000-3000 3000以上 合计
50
125 225 75 25 500
3000+1000/2=3500 -
15
相邻两组组限用相同数字表示, 叫重叠式组限。重叠式组限适 用于连续型变量分组。
第三章统计整理PPT课件
3、分 品质数列 类 变量数列
单值数列
比重。
等距数列
组距数列 异距数列
二、变量数列的编制
编制变量数 列的步骤
确
确
计
编
定
定
算
制
组
组
频
表
数
距
数
格
(一)品质数列:
将总体按品质标志分组形成的分布数列
例
某班学生的性别构成情况
按性别分组 绝对数人数 比重(%)
男
30
75
女
10
25
合计
40
100
组别
次数
频率
(二)变量数列
1、单值数列
指每个组值只用一个具体的 变量值表现的数列
编制条件:
变量是离散变量
同时
变量的不同取值个数较少 具备
【例】己知某车间有24名工人,他们的日产量(件) 分别是:20,23,20,24,23,21,22,25,26,20, 21,21,22,22,23,22,22,24,25,21,22,21, 24,23.要求根据以上资料编制变量数列。
2.性质
分与合 、穷尽与互斥、反映本质差异、可能掩 盖差异、关键是分组标志的选择和分组界限的 确定
3、统计分组的原则 穷尽原则,使总体中的每一个单位都
应有组可归,或者说各分组的空间足以 容纳总体所有的单位。
互斥原则,在特定的分组标志下,总
体中的任何一个单位的只能归属于某一 组,而不能同时或可能归属于几个组。
二、统计分组的作用:
划分社会经济现象的类型 反映社会经济现象的内部结构和比例关系 揭示社会经济现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
统计学---第3章 统计整理---课件
医科
540
农林类
240
20
(二)变量数列
1.按数量标志分组,再按一定顺序排列所组 成的数列。如表3-1。各组组别都以数字表 示。
2.有两个构成要素:分组的变量(X)和每组 的次数(f)。
3.是统计研究的重要内容。
21
(三)单项数列
1. 将一个变量值作为一组的组别 2. 适合于离散变量 3. 适合于变量值较少的情况
1 2 1 4 4 3 2 2 3
零件数 (个) X
128 129 130 131 133 134 135 137 139
频数 (人) f
2 1 1 1 2 2 1 1 2
50名工人的日产量不尽相同,但最多只有50个变量值, 实际统计调查所得,有27个不同的“日产量”---变量23值。
(四)组距数列
22
单项数列的例题
表3-3 某车间50名工人日加工零件数分组表
零件数 (个) X
107 108 110 112 113 114 115 117 118
频数 (人) f
1 2 1 2 1 1 1 3 3
零件数 (个) X
119 120 121 122 123 124 125 126 127
频数 (人) f
2
本章要点﹒﹒﹒﹒
• 理解统计整理的作用 • 掌握统计分组与编制分配数列的方法 • 掌握统计图表的运用方法
3
第1节 统计整理的基本问题
一、统计整理 二、统计整理的步骤
4
一、统计整理的定义与基本任务
1、统计整理的定义 是统计工作的第二个阶段,是对统计调查取得 的
资料用科学的方法进行加工处理,使资料系统化、 条理化,为下一环节的统计分析服务。 2、统计整理的基本任务:
统计学原理(第七版)第三章统计整理
比重(%) 6
10 17 28 22 17 100
二 变量数列的种类
(二)组距变量数列
当变量值较多,变量值变动的范围也比较大时,编制单项变量数列会使 分组数过多,总体单位过于分散,不便于分析问题,这时应当采用组距 变量数列。
组距变量数列是按照数量标志分组后,用变量值变动的一定范围(即组 距)代表一个组所形成的数列(见表3-4)。
审核
(四) 编制统计表或绘
制统计图
(一) 设计和编制统计
资料整理方案
(三) 对原始资料进行统 计分组和统计汇总
02 PART TWO
第二节
统计分组
一 统计分组的概念
统计分组是根据所研究事物的特点和统计研究的目的,按照某一标志将统计 总体划分为若干个组成部分的一种统计方法。统计总体的这些组成部分称为 “组”。通过统计分组,使同一组内的各单位性质更加相同,不同组的各单 位性质更加相异。能够对统计总体进行分组,是由总体单位所具有的“差异 性”特点决定的。统计总体中的各个单位,一方面在某一个或某一些标志上 具有相同的性质,可以结合在同一性质的总体中;另一方面,又在其他一些 标志上具有彼此相异的性质,从而又可以被区分为性质不同的若干个组成部 分。例如,在工业企业这个总体中,我们可以按照企业的生产规模将工业企 业划分为大型企业、中型企业、小型企业和小微型企业四个组。每一组内各 企业的生产规模相近,组与组之间的企业的生产规模差异较大。
统计学 原理
(第七版)
01 第一章 总论
02 第二章 统计设计和统计调查
03 第三章 统计整理
04
第四章 总量指标和相对指标
05
第五章 平均指标和变异指标
06
第六章 动态数列
第三章 统计整理PPT教学课件
第三章 统计整理
第一节统计整理的意义和内容 一、统计整理的意义 统计整理:根据统计研究的任务与要求,
对通过统计调查取得的资料进行分组、 汇总,使其条理化、系统化的工作过 程。
2020/12/101二、统计整理的步骤和内容 1、设计和编制统计资料整理方案 2、对调查来的资料进行审核 3、对资料进行分组、汇总和计算 4、对整理后的资料再一次进行审核 5、将汇总整理的结果编制成统计表
2020/12/10
24
(二)国民经济中常用的几种分组(类)标 准
1、经济类型分组(9类) (1)国有经济(2)集体经济 (3)私营经济(4)个体经济 (5)联营经济(6)股份制经济 (7)外商投资经济(8)港澳台投资经济 (9)其他经济
2020/12/10
25
三次产业分类
第一产业:农业(农业、林业、牧业、渔业)
2020/12/10
14
为了解工业企业职工总体的基本情况,选择 年龄、文化程度、工龄和操作形式等标志 进行分组:
2020/12/10
15
按年龄分组 20岁及20岁以下 21岁—35岁 36岁—50岁 51岁—55岁 56岁—60岁 60岁以上
按文化程度分组 大专以上 中专 技工 高中 初中 小学
2.选择能够反映事物本质特征的标志作 为分组标志
2020/12/10
8
(二)分组方法
1.按品质标志分组
按品质标志分组是指选择反映事物属性 差异的品质标志作为分组标志进行分 组,并在品质标志的变异范围内划定 各组界限,将总体划分为若干个性质 不同的组成部分。
2020/12/10
9
为了使复杂的分类在全国统一执行, 国家统计局及中央有关部门,统一制 订有各种分类目录与规定标准,如: 《工业部门分类目录》《工业产品目 录》《大中小型工业企业划分标准》 《经济类型划分规定》
第一节统计整理的意义和内容 一、统计整理的意义 统计整理:根据统计研究的任务与要求,
对通过统计调查取得的资料进行分组、 汇总,使其条理化、系统化的工作过 程。
2020/12/101二、统计整理的步骤和内容 1、设计和编制统计资料整理方案 2、对调查来的资料进行审核 3、对资料进行分组、汇总和计算 4、对整理后的资料再一次进行审核 5、将汇总整理的结果编制成统计表
2020/12/10
24
(二)国民经济中常用的几种分组(类)标 准
1、经济类型分组(9类) (1)国有经济(2)集体经济 (3)私营经济(4)个体经济 (5)联营经济(6)股份制经济 (7)外商投资经济(8)港澳台投资经济 (9)其他经济
2020/12/10
25
三次产业分类
第一产业:农业(农业、林业、牧业、渔业)
2020/12/10
14
为了解工业企业职工总体的基本情况,选择 年龄、文化程度、工龄和操作形式等标志 进行分组:
2020/12/10
15
按年龄分组 20岁及20岁以下 21岁—35岁 36岁—50岁 51岁—55岁 56岁—60岁 60岁以上
按文化程度分组 大专以上 中专 技工 高中 初中 小学
2.选择能够反映事物本质特征的标志作 为分组标志
2020/12/10
8
(二)分组方法
1.按品质标志分组
按品质标志分组是指选择反映事物属性 差异的品质标志作为分组标志进行分 组,并在品质标志的变异范围内划定 各组界限,将总体划分为若干个性质 不同的组成部分。
2020/12/10
9
为了使复杂的分类在全国统一执行, 国家统计局及中央有关部门,统一制 订有各种分类目录与规定标准,如: 《工业部门分类目录》《工业产品目 录》《大中小型工业企业划分标准》 《经济类型划分规定》
第三章 统计整理 《统计学原理》PPT课件
(一)正确选择分组标志
1.根据统计研究的目的选择分组标志 2.选择最能反映事物本质特征的标 志进行分组 3.选择分组标志时,要考虑到现象发展 的历史条件和经济条件
(二)按品质标志或按数量标志分组
1.按品质标志分组 2.按数量标志分组
(三)简单分组和复合分组
1.简单分组。简单分组是指对所研究 的总体按一个标志进行分组。
品质分布数列和变量分布数列
按品质标志分组形成的次数分布 数列叫品质分布数列,简称品质数列 (见表3-3)。
按数量标志分组形成的次数分布 数列叫变量分布数列,简称变量数列 (见表3-4) 。
查看Excel表3-3 查看Excel表3-4
品质分布数列
变量分布数列
(返回组距数列) 返回组限 下一个
二、变量数列的种类
在Excel内排序
(3)编制变量数列
查看Excel
下一个
(4)编制累计次数(频数)分布数列与 累计频率分布
查看Excel
下一个
四、次数分布的主要类型
(一)钟形分布 (二)U形分布
(三)J形分布
(一)钟形分布
图3—2 钟形分布图
(二)U形分布
图3—3 U形分布图
(三)J形分布
图3—4 正、反J形分布图 下一个
组限
在组距变量数列中,表示各组界 限的变量值叫组限,其中较小的变量 值称为下限,较大的变量值称为上限。 (见表3-4) 。
组距=上限-下限 组中值=(上限+下限)÷2
开口组
编制组距变量数列时,常常使用 像“× ×以上”或“× ×以下”这样 不确定组限的组,称为开口组(见表 3-6) 。
查看Excel表3-6
开口组组中值计算公式
统计学课件ppt(全).
• 初步核算,全年国内生产总值471564亿元, 比上年增长9.2%。其中,第一产业增加值 47712亿元,增长4.5%;第二产业增加值 220592亿元,增长10.6%;第三产业增加 值203260亿元,增长8.9%。第一产业增加 值占国内生产总值的比重为10.1%,第二产 业增加值比重为46.8%,第三产业增加值比 重为43.1%。
概率论
样本数据 统计数据 总体数据 描述统计学 推断统计学
总体内在的 数量规律性
一、描述统计学和推断统计学
描述统计和推断统计是统计方法的两个 组成部分。描述统计是整个统计的基础, 推断统计是现代统计学的主要内容,已经 成为统计学的核心内容。
二、理论统计学和应用统计学
• 1.理论统计学(Theoretical Statistics)指 统计学的数学原理,它主要研究统计学的 一般理论和统计方法的数学理论。它是统 计方法的理论基础。 • 2.应用统计学(Applied Statistics)研究如 何应用统计方法去解决实际问题。 如:生物统计学、卫生统计学、人口统 计学、农业统计学、管理统计学、社会统 计学
一、描述统计学和推断统计学
• 1.描述统计学(Descriptive Statistics)研究如何取 得反映客观现象的数据,并通过图表形式,对所收 集的数据进行加工处理和显示,进而通过综合、概 括与分析得出反映客观现象的规律性数量特征。 (数据的收集、加工处理、显示以及数据分布特征 的概括与分析) • 2.推断统计学(Inferential Statistics)研究如何根据 样本数据去推断总体数量特征的方法,它是在对样 本数据进行描述的基础上,对统计总体的未知数量 特征作出以概率形式表述的推断。(举例说明,全 校某次英语四级考试的通过率,通过抽样调查100人) (抽样估计、假设检验、回归分析)
概率论
样本数据 统计数据 总体数据 描述统计学 推断统计学
总体内在的 数量规律性
一、描述统计学和推断统计学
描述统计和推断统计是统计方法的两个 组成部分。描述统计是整个统计的基础, 推断统计是现代统计学的主要内容,已经 成为统计学的核心内容。
二、理论统计学和应用统计学
• 1.理论统计学(Theoretical Statistics)指 统计学的数学原理,它主要研究统计学的 一般理论和统计方法的数学理论。它是统 计方法的理论基础。 • 2.应用统计学(Applied Statistics)研究如 何应用统计方法去解决实际问题。 如:生物统计学、卫生统计学、人口统 计学、农业统计学、管理统计学、社会统 计学
一、描述统计学和推断统计学
• 1.描述统计学(Descriptive Statistics)研究如何取 得反映客观现象的数据,并通过图表形式,对所收 集的数据进行加工处理和显示,进而通过综合、概 括与分析得出反映客观现象的规律性数量特征。 (数据的收集、加工处理、显示以及数据分布特征 的概括与分析) • 2.推断统计学(Inferential Statistics)研究如何根据 样本数据去推断总体数量特征的方法,它是在对样 本数据进行描述的基础上,对统计总体的未知数量 特征作出以概率形式表述的推断。(举例说明,全 校某次英语四级考试的通过率,通过抽样调查100人) (抽样估计、假设检验、回归分析)
统计学课件--第三章统计整理
(二)复合分组体系
对同一总体选择两个或两个以上分组标志层叠起来进行
分组叫做复合分组。复合分组所形成的分组体系叫做复合 分组体系。例如,对工业企业按轻重工业和企业规模重叠 分组形成的复合分组体系:
按轻重工业和企业规模分组 轻工业 大型工业企业 中型工业企业 小型工业企业 重工业 大型工业企业 中型工业企业 小型工业企业
3
第三章 统计整理
第一节 统计整理的基本理论
(二) 意义 统计整理是统计工作过程的第三阶段,是统计调查的继续,是 统计分析的前提,它是从对现象的感性认识过渡到对现象理性认识 的开始,是这个过程的连续点,并为这个过程提供坚实的基础, 它在统计工作中起着承前启后的作用 。
2021/3/2
4
第三章 统计整理
个以上的标志分别进行简单分组,就形成平行分组体系。例如,根
据工业统计的研究任务,可以对工业企业按隶属关系、重工业和轻
工业、生产规模等标志进行分组,形成平行分组体系:
按隶属关系分组
按轻重工业分组
中央工业
轻工业
地方工业
重工业
按企业规模分组
大型工业企业
中型工业企业
小型工业企业。
2021/3/2
9
第三章 统计整理
2021/3/2
11
第三章 统计整理
1987年底我国职工构成表
按经济类型 职工人数 比重(%)
分组
(万人)
全民所有 制
集体所有 制
其它
9654 3488 72
73.09 26.40 0.54
合计
13214
100.00
组的名称 次数(频数 ) 比率(频率)
2021/3/2
12
统计原理课件 第三章统计整理
作用:可以科学合理地显示统计资料,使统计资料更能便于 人们阅读,为分析研究客观现象之间的关系,如现象的规模、 结构、比例、发展速度等提供便利条件。在实际应用中,统 计表是统计资料最广泛的表现形式。
3.4.1 统计表
结构: 1)从统计表的表式结构看,统计表包括
总标题、横行标题、纵栏标题和指标数值四部 分。
取决于所研究变量的类型和变量的变动幅度。 对于连续变量,只能编制组距数列;对于离散 变量,则根据其变量值的多少和变动幅度的大 小来确定。
3.3.2 变量数列的编制
3.确定组数和组距 组距是每组中最大变量值与最小变量值之间的距
离或差数。其中最大的变量值称为上组限,简称上限, 最小的变量值称为下组限,简称下限。组距的计算公 式为: 组距=上限-下限
3.4.1 统计表
• 表3-4 某班50名学生期中测验成绩分组表
按成绩分组 60分以下
60-70 70-80 80-90 90以上
合计
学生数(人) 3 9 12 20 6
50
比重(%) 6 18 24 40 12
100
3.4.1 统计表
• 表3-5 某地区固定资产投资额
项目
一、国有企业 基本建设 更新改造
条形图
100 90 80 70 60 50 40 30 20 10 0
第一季度 第二季度 第三季度 第四季度
东部 西部 北部
折线图
08年北京城镇居民消费结构
6% 8%
14%
41%
5% 5%
11%
10%
食品 衣着 家庭设备 医疗保健 交通和通讯 文化教育 居住 杂项商品
饼图
商品销售额 (万元)
第三章 统计整理
学习目标
3.4.1 统计表
结构: 1)从统计表的表式结构看,统计表包括
总标题、横行标题、纵栏标题和指标数值四部 分。
取决于所研究变量的类型和变量的变动幅度。 对于连续变量,只能编制组距数列;对于离散 变量,则根据其变量值的多少和变动幅度的大 小来确定。
3.3.2 变量数列的编制
3.确定组数和组距 组距是每组中最大变量值与最小变量值之间的距
离或差数。其中最大的变量值称为上组限,简称上限, 最小的变量值称为下组限,简称下限。组距的计算公 式为: 组距=上限-下限
3.4.1 统计表
• 表3-4 某班50名学生期中测验成绩分组表
按成绩分组 60分以下
60-70 70-80 80-90 90以上
合计
学生数(人) 3 9 12 20 6
50
比重(%) 6 18 24 40 12
100
3.4.1 统计表
• 表3-5 某地区固定资产投资额
项目
一、国有企业 基本建设 更新改造
条形图
100 90 80 70 60 50 40 30 20 10 0
第一季度 第二季度 第三季度 第四季度
东部 西部 北部
折线图
08年北京城镇居民消费结构
6% 8%
14%
41%
5% 5%
11%
10%
食品 衣着 家庭设备 医疗保健 交通和通讯 文化教育 居住 杂项商品
饼图
商品销售额 (万元)
第三章 统计整理
学习目标
统计学基础课件 第3章 统计整理
指变量数列中每个组用一 个变量值区间表示的形式。 组距数列使用于接连续变 量分组或变量值的变动范 围较大的离散变量的情况。
3.3 分配数列
3.3.2 变量数列的编制
1. 计算全距
全距=最大值-最小值
2. 确定变量数列的类型
单项数列还是组距数列
等距数列还是异距数列 3. 确定组数和组距 组距=上限-下限 组数=全距÷组距
第3章 统计整理
学习目标
◎了解:统计整理的概念及作用,统计表设计 原则。
◎理解:统计分组的意义作用,分组标志的选 择原则。
◎掌握:统计分组方法,变量数列的编制方法, 统计表的制作,统计图的绘制。
第3章 统计整理
3.1 统计整理概述 3.2 统计分组 3.3 分配数列 3.4 统计表和统计图
3.1 统计整理概述
3.1.1 统计整理的概念和作用
1. 统计整理的概念 统计整理就是根据统计研究的目的和任务,将统计
调查阶段所搜集到的分散的、零乱的、不系统、不规范 的大量原始资料,进行科学的分类、汇总,为统计分析 提供系统化、条理化综合统计资料的工作过程。
它一般包括狭义的统计整理和广义的统计整理。狭 义的统计整理也称为初级整理,仅指对统计调查所取得 的原始统计资料的整理;而广义的统计整理也称为次级 整理,除了对原始调查资料的整理外,还包括对某些已 经加工过的综合(或历史)资料的整理。
缺少下限组的组中值=该组上限-邻组组距的一半 缺少上限组的组中值=该组下限+邻组组距的一半
5. 计算各组单位数,编制变量数列 遵循“不重复不遗漏”的基本原则 重叠组距数列应按“上组限不在内”原则
2020年11月27日/下午5时47分
例题:对某车间工人年龄作调查得到原始资料,由 小到大排列如下表所示,编制变量数列。
03第三章 统计整理
教师性别结构
男 女
整理结果的表现形式-统计表
该校教师职称及性别分布数列 单位:人
职称
小计
男
女
助教
15
3
12
讲师
26
6
20
副教授
19
7
12
教授
20
11
9
合计
80
27
53
某高校教师月收入分布表
收入(元) 2000以下 2000-3000 3000-4000 4000以上
合计
人数(人) 12 15 34 19 80
比重% 15.0 18.7 42.5 23.8 100.0
本章主要内容
☆ 统计整理的意义和步骤 ★ 统计分组 ☆ 次数分布(分配)数列 ★ 统计表
第一节 统计整理的意义和步骤
主要内容
☆ 统计整理的意义 ★ 统计整理的步骤
一、统计整理的意义
※ 统计整理的概念
根据目的 对统计调查资料
实施分类、汇总
《统计学》课件
第三章 统计整理
教学目的与要求
通过本章学习,首先要明确统计整理的意义和步 骤,重点掌握统计分组的理论和方法,学会编制变量 数列和统计表。
教学重点与难点
重点:分组标志的选择; 连续型变量的组距分 组;次数分布数列的编制;权数意识的培养,正确理 解权数。
难点:组距分组中组数、组距和组限的确定。
面对如此繁杂的 个体资料,大家 感觉怎么样?
乱乱乱……..
那么整理为下面的图表又怎么样呢?
整理结果的表现形式-统计图
该校教师职称及性别柱形图
20
18
16
14
男
12
10
安徽财经大学统计学课件-第03章 统计整理
28
2、分配数列的构成要素
分组标志(或标志的表现) 各组出现的单位数,即次数或频数
构成要素
次数:分布在各组间的总体单位数,又称频数。
用f 表示
频率:次数的相对数,各组次数占总次数的比重,
用f/∑f
上一页 下一页 返回本节首页
3、分配数列的分类: 品质数列
变量数列 单项式数列
分 类
组距式数列
等距数列 异距数列
第3章 统计整理
30
(二)变量数列
1、变量数列的种类: 单项式:一个变量值代表一组。 组距式:一组变量值代表一组。 其中: 组距式又分为等距式和不等距式两种
第3章 统计整理
31
等距式
ª3-8 Ä ©Ñ ö ¿ Ê ± ¼ ¥ í ± §É ¼ Ô É ¨³ ¼ Ö ¿ « È Ê £ Ë £ ªÖ £ %£ Ë ý ¨È § È × ¨ § 50~60 2 5.0 60~70 7 17.5 70~80 11 27.5 80~90 12 30.0 90~100 8 20.0 Ï Æ º ¼ 40 100.0
第3章 统计整理
18
说明: 平行分组体系:多个简单分组构成一个 平行分组体系。 复合分组体系:复合分组本身构成复合 分组体系。
第3章 统计整理
19
如对学生按学科、学历、性别分组 学科 学历 性别 文科 大专 男生 女生 本科 研究生及以上 理工科
第3章 统计整理
20
(2)、按分组标志的性质不同可分为 品质分组(属性分组) 变量分组(数量分组)
25 70 130 75 40 18 10
11.2 10.4 9.9 6.7 5.9 5.0 5.5
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章 统计整理
【学习目标】通过对本章的学习,重点掌握统计整理的最 基本理论,在此基础上熟练掌握主要的整理操作方法,能够根 据不同的统计原始数据编制相应的次数分布数列,并能根据所 编制的数列编制恰当的统计表和绘制适当的统计图。
第一节 统计整理的基本理论 第二节 统计分组 第三节 次数分布 第四节 统计汇总
第五节 统计表 第六节 统计图
06.04.2020
课件
1
第三章 统计整理
第一节统计整理的基本理论
一、统计整理的意义
(一)涵义
统计整理,是指根据统计研究目的,将统计调查所 得的原始资料进行科学的分类汇总,或对已经加工的次 级资料进行再加工,为统计分析准备系统化、条理化的 综合资料的工作过程。 。
06.04.2020
06.04.2020
课件
12
第三章 统计整理
第三节 次数分布
编制结果如下:
日产量(件)X
20 21 22 23 24 25 26
工人数(人) f
3 5 6 4 3 2 1
合计
24
06.04.2020
课件
13
第三章 统计整理
第三节 次数分布
(二)组距数列
依组距分组而编制的变量数列叫做组距数列。组距数列 中的每个组不是用一个具体的变量值表示,而是用变量值的 一定变化范围即各组标志值变动的区间表示。每组标志值变 动的区间长度称为组距。
集体所有 制
其它
9654 3488 72
73.09 26.40 0.54
合计
13214
100.00
组的名称 次数(频数 ) 比率(频率)
06.04.2020
课件
11
第三章 统计整理
第三节 次数分布
二、变量数列的类型
(一)单项式数列
按每个变量值分别列组,依次分组编制的变量数列叫 做单项式变量数列。
【例】己知某车间有24名工人,他们的日产量(件)分别 是: 20,23,20,24,23,21,22,25,26,20,21,21,22, 22,23,22,22,24,25,21,22,21,24,23. 要求根据以上资料编制变量数列。
组距数列中,各组变量值变动的界限称为组限,组内最大变 量值称为上限,最小变量值称为下限。组距就是上限与下限之差,
即:组距=组上限-组下限
上述公式通常在由连续型组距数列计算组距时使用。而在 离散型组距数列中,考虑到离散型组距数列的特点,其组距一
06.04.2020
课件
7
第三章 统计整理
五、统计分组体系
分组体系: 指同时使用两个以上标志分组时,分组标志的组合形式。
(一)平行分组体系
总体按一个标志分组称为简单分组。对同一个总体选择两个或
两个以上的标志分别进行简单分组,就形成平行分组体系。例如,
根据工业统计的研究任务,可以对工业企业按隶属关系、重工业和
课件
2
第三章 统计整理
第一节 统计整理的基本理论
(二) 意义 统计整理是统计工作过程的第三阶段,是统计调查的继续, 是统计分析的前提,它是从对现象的感性认识过渡到对现象理性 认识的开始,是这个过程的连续点,并为这个过程提供坚实的基 础,它在统计工作中起着承前启后的作用 。
06.04.2020
课件
3
单位之间的差异,使数据变得条理化,便于进一步分析研究。
06.04.2020
课件
5
第三章 统计整理
三、分组标志的选择
(一)根据统计研究的目的与任务选择分组标志 在对社会经济现象进行研究时,可根据不同的研究目
的而从不同的角度进行研究,也正是研究目的的不同,才选 择不同的分组标志进行分组。 (二)在若干个标志中抓住具有本质性的或主要的标志作为分 组的依据
分布在各组中的个体单位数叫做次数或频数。 各组次数与总次数之比叫做比率或频率。 将各组别与次数按一定的次序排列所形成的数列称作次数分布 数列,简称分布数列,又称分配数列或频数分配。
06.04.2020
课件
10
第三章 统计整理
1987年底我国职工构成表
按经济类型 职工人数 比重(%)
分组
(万人)
全民所有 制
(一)按品质标志分组法
按品质标志分组法分组就是选择反映事物属性差异的品质标志 为分组标志,并在品质标志的变异范围内划定各组界限,将总体 划分成为若干个性不同的组成部分。
(二)按数量标志分组的办法 按数量标志分组就是按反映事物数量差异的数量标志为分
组标志,并在数量标志的变异范围内,将总体划分为性质不 同的若干组成部分。
轻工业、生产规模等标志进行分组,形成平行分组体系:
按隶属关系分组
按轻重工业分组
中央工业
轻工业
地方工业
重工业
按企业规模分组
大型工业企业
中型工业企业
小型工业企业。
06.04.2020
课件
8
第三章 统计整理
(二)复合分组体系
对同一总体选择两个或两个以上分组标志层叠起来进 行分组叫做复合分组。复合分组所形成的分组体系叫做复 合分组体系。例如,对工业企业按轻重工业和企业规模重 叠分组形成的复合分组体系:
总体中的若干标志,有能反映问题本质特征的标志,也有 对反映事物本质作用不大的标志,这时我们应该选择最能反 映问题本质特征的标志。 (三)根据现象所处的历史条件或经济条件来选择标志
对现象进行研究,要视具体时间、地点条件的不同而选 择不同的分组标志。
06.04.2020
课件
6
第三章 统计整理
四、统计分组的方法
一、统计分组的概念
统计分组是指根据事物内在的特点和统计研究的需要,将统计
总体按照一定标志区分为若干组成部分的一种统计方法。 。
二、统计分组的作用
(一)反映社会经济现象的内部结构和比例关系 (二)划分社会经济现象的类型 (三)揭示社会经济现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异而抽象掉组内各
第三章 统计整理
第一节 统计整理的基本理论
(二)、统计整理的内容与程序 统计数据整理的内容与程序主要包括以下几个方面:
首先是统计数据的预处理——调查资料的审核。 其次是统计数据的排序。 再次,是统计数据的分组和汇总。 最后,是编制统计表和绘制统计图。
06.04.2020
课件
4
第三章 统计整理
第二节 统计分组
按轻重工业和企业规模分组 轻工业 大型工业企业 中型工业企业 小型工业企业 重工业 大型工业企业 中型工业企业 小型工业企业
06.04.2020
课件
9
第三章 统计整理
第三节 次数分布
一、次数分布的概念
在统计分组的基础上,将总体中所有单位按组归类整理,形成 总体中各个单位数在各组间的分布,叫做次数分布。
【学习目标】通过对本章的学习,重点掌握统计整理的最 基本理论,在此基础上熟练掌握主要的整理操作方法,能够根 据不同的统计原始数据编制相应的次数分布数列,并能根据所 编制的数列编制恰当的统计表和绘制适当的统计图。
第一节 统计整理的基本理论 第二节 统计分组 第三节 次数分布 第四节 统计汇总
第五节 统计表 第六节 统计图
06.04.2020
课件
1
第三章 统计整理
第一节统计整理的基本理论
一、统计整理的意义
(一)涵义
统计整理,是指根据统计研究目的,将统计调查所 得的原始资料进行科学的分类汇总,或对已经加工的次 级资料进行再加工,为统计分析准备系统化、条理化的 综合资料的工作过程。 。
06.04.2020
06.04.2020
课件
12
第三章 统计整理
第三节 次数分布
编制结果如下:
日产量(件)X
20 21 22 23 24 25 26
工人数(人) f
3 5 6 4 3 2 1
合计
24
06.04.2020
课件
13
第三章 统计整理
第三节 次数分布
(二)组距数列
依组距分组而编制的变量数列叫做组距数列。组距数列 中的每个组不是用一个具体的变量值表示,而是用变量值的 一定变化范围即各组标志值变动的区间表示。每组标志值变 动的区间长度称为组距。
集体所有 制
其它
9654 3488 72
73.09 26.40 0.54
合计
13214
100.00
组的名称 次数(频数 ) 比率(频率)
06.04.2020
课件
11
第三章 统计整理
第三节 次数分布
二、变量数列的类型
(一)单项式数列
按每个变量值分别列组,依次分组编制的变量数列叫 做单项式变量数列。
【例】己知某车间有24名工人,他们的日产量(件)分别 是: 20,23,20,24,23,21,22,25,26,20,21,21,22, 22,23,22,22,24,25,21,22,21,24,23. 要求根据以上资料编制变量数列。
组距数列中,各组变量值变动的界限称为组限,组内最大变 量值称为上限,最小变量值称为下限。组距就是上限与下限之差,
即:组距=组上限-组下限
上述公式通常在由连续型组距数列计算组距时使用。而在 离散型组距数列中,考虑到离散型组距数列的特点,其组距一
06.04.2020
课件
7
第三章 统计整理
五、统计分组体系
分组体系: 指同时使用两个以上标志分组时,分组标志的组合形式。
(一)平行分组体系
总体按一个标志分组称为简单分组。对同一个总体选择两个或
两个以上的标志分别进行简单分组,就形成平行分组体系。例如,
根据工业统计的研究任务,可以对工业企业按隶属关系、重工业和
课件
2
第三章 统计整理
第一节 统计整理的基本理论
(二) 意义 统计整理是统计工作过程的第三阶段,是统计调查的继续, 是统计分析的前提,它是从对现象的感性认识过渡到对现象理性 认识的开始,是这个过程的连续点,并为这个过程提供坚实的基 础,它在统计工作中起着承前启后的作用 。
06.04.2020
课件
3
单位之间的差异,使数据变得条理化,便于进一步分析研究。
06.04.2020
课件
5
第三章 统计整理
三、分组标志的选择
(一)根据统计研究的目的与任务选择分组标志 在对社会经济现象进行研究时,可根据不同的研究目
的而从不同的角度进行研究,也正是研究目的的不同,才选 择不同的分组标志进行分组。 (二)在若干个标志中抓住具有本质性的或主要的标志作为分 组的依据
分布在各组中的个体单位数叫做次数或频数。 各组次数与总次数之比叫做比率或频率。 将各组别与次数按一定的次序排列所形成的数列称作次数分布 数列,简称分布数列,又称分配数列或频数分配。
06.04.2020
课件
10
第三章 统计整理
1987年底我国职工构成表
按经济类型 职工人数 比重(%)
分组
(万人)
全民所有 制
(一)按品质标志分组法
按品质标志分组法分组就是选择反映事物属性差异的品质标志 为分组标志,并在品质标志的变异范围内划定各组界限,将总体 划分成为若干个性不同的组成部分。
(二)按数量标志分组的办法 按数量标志分组就是按反映事物数量差异的数量标志为分
组标志,并在数量标志的变异范围内,将总体划分为性质不 同的若干组成部分。
轻工业、生产规模等标志进行分组,形成平行分组体系:
按隶属关系分组
按轻重工业分组
中央工业
轻工业
地方工业
重工业
按企业规模分组
大型工业企业
中型工业企业
小型工业企业。
06.04.2020
课件
8
第三章 统计整理
(二)复合分组体系
对同一总体选择两个或两个以上分组标志层叠起来进 行分组叫做复合分组。复合分组所形成的分组体系叫做复 合分组体系。例如,对工业企业按轻重工业和企业规模重 叠分组形成的复合分组体系:
总体中的若干标志,有能反映问题本质特征的标志,也有 对反映事物本质作用不大的标志,这时我们应该选择最能反 映问题本质特征的标志。 (三)根据现象所处的历史条件或经济条件来选择标志
对现象进行研究,要视具体时间、地点条件的不同而选 择不同的分组标志。
06.04.2020
课件
6
第三章 统计整理
四、统计分组的方法
一、统计分组的概念
统计分组是指根据事物内在的特点和统计研究的需要,将统计
总体按照一定标志区分为若干组成部分的一种统计方法。 。
二、统计分组的作用
(一)反映社会经济现象的内部结构和比例关系 (二)划分社会经济现象的类型 (三)揭示社会经济现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异而抽象掉组内各
第三章 统计整理
第一节 统计整理的基本理论
(二)、统计整理的内容与程序 统计数据整理的内容与程序主要包括以下几个方面:
首先是统计数据的预处理——调查资料的审核。 其次是统计数据的排序。 再次,是统计数据的分组和汇总。 最后,是编制统计表和绘制统计图。
06.04.2020
课件
4
第三章 统计整理
第二节 统计分组
按轻重工业和企业规模分组 轻工业 大型工业企业 中型工业企业 小型工业企业 重工业 大型工业企业 中型工业企业 小型工业企业
06.04.2020
课件
9
第三章 统计整理
第三节 次数分布
一、次数分布的概念
在统计分组的基础上,将总体中所有单位按组归类整理,形成 总体中各个单位数在各组间的分布,叫做次数分布。