第三章 统计资料整理
第3章 统计整理
(2)必须选择最主要的标志作为分组依据;
例3:根据统计调查资料来研究人民生活水平变动情况时, 可供选择的分组标志有家庭人口数、每户就业人数、每 一就业者负担人数、家庭总收入、平均每人每月生活费 收入等,其中最能反映人民生活水平变动的标志是:平 均每人每月生活费收入,应选择这一标志作为分组标志。
练习:企业按净产值分组为:单位(万元) 10以下 10-20 20-30 计算首组和末组的组中值。 30-40 40-70 70以上 首组组中值=10-10/2=5(万元) 末组组中值=70+30/2=85(万元)
第四节
统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。
例如:对全国的工业企业进行
简单分组: 按所有制类型分:全民所有制企业、集体所有制企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业
复合分组:
重工业 全民所有制 轻工业 集体所有制
大型企业 中型企业 小型企业
重工业
轻工业
3、按分组标志的性质分为品质分组和数量分 组。
N 15-24 25-44 45-89 90-179 n 5 6 7 8
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组
组
限
组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式。
第一节 统计整理的意义和程序
一、统计整理的意义 二、统计整理的程序
第三章 统计整理
第三章统计整理一、名词解释数据分组次数分布 (频数分布) 单变量分组组距分组组距组限组中值次数(频数)频率向上累积频数(或频率)向下累计频数(或频率)统计表二、填空1.每个组只有一个变量值的分配数列叫________,各组组距不相等的组距列叫________。
2、在组距数列中,说明总体单位数值变化界限的数值称为_____ ,各组上限与下限之间的中点数值称为_________。
3、在变量数列中,各组单位数称_______,各组单位数占总体单位总数的比重称________。
4、数据分组的原则有和____________。
5、对总体进行统计分组关键在于。
三、选择1.统计资料按数量标志分组后,处于每组两端的数值叫 ( )。
A.组距 B.组数 C.组限 D.组中值2.统计表中的主词是指 ( )A.统计表的横行标题 B.统计表的纵栏标题 C.统计表所要说明的总体 D.说明总体的统计指标3.数据整理的步骤一般为()()()()()()。
(排序)A.数据的预处理 B.编制统计数列和统计表 C.选择标志对总体进行分组 D.数据汇总E.计算和汇总 F.统计复查4.下列各项中按数量标志分组的有()()()()()。
A.人口按年龄分组 B.企业产品按合格与不合格分组C.人口按性别分组 D.家庭按月收入分组E.企业按年产值分组 F.人口按文化程度分组5.构成分配数列的两个基本要素是()()()()()。
A.组数的多少 B.各组组距大小 C.统计分组 D.各组标志值的大小E.各组次数大小 F.分配在各组的单位数6.统计表从形式上看,它是由()()()()()构成的。
A.总标题B.纵栏标题C.横行标题 D.主词E.指标数值 F.宾词第四章指标一、名词解释总体单位总数总体标志总量时期指标时点指标实物指标价值指标劳动指标算术平均数权数调和平均数几何平均数中位数众数标准差标准差系数二、简答1、简述时期指标和时点指标的概念、特点。
第三章 统计资料整理
2.分组表: 2.分组表:主词按一个标志分组的统计表. 分组表
复合表: 3. 复合表:主词按两个或两个以上标志复合 分组的统计表. 分组的统计表.
四,统计表的编制原则
应遵循科学,实用,简明,美观的原则. 应遵循科学,实用,简明,美观的原则. 统计表的各种标题要简明扼要; 1.统计表的各种标题要简明扼要; 要合理安排统计表的结构; 2.要合理安排统计表的结构; 数据计量单位相同时,可放在表的右上角标明, 3. 数据计量单位相同时 , 可放在表的右上角标明 , 不同 时应放在每个指标后或单列出一列标明; 时应放在每个指标后或单列出一列标明; 表中的上下两条横线一般用粗线,其他线用细线; 4.表中的上下两条横线一般用粗线,其他线用细线; 5.统计表的栏数较多时,通常要加以编号; 统计表的栏数较多时,通常要加以编号; 通常情况下,统计表的左右两边不封口; 6.通常情况下,统计表的左右两边不封口; 表中的数字应该填写整齐,对准位数; 7.表中的数字应该填写整齐,对准位数; 对于没有数字的表格单元,一般用" 表示; 8.对于没有数字的表格单元,一般用"—"表示; 表中主词各行和宾词各栏, 9. 表中主词各行和宾词各栏 , 应按先局部后整体的原则 排列; 排列; 10.必要时可在表的下方加上注释. 10.必要时可在表的下方加上注释.
�
编制
四,次数分布的主要类型 钟型分布——"两头小,中间大" 两头小,中间大" 钟型分布 两头小
对称分布
右偏分布
左偏分布
两头大, U型分布——"两头大,中间小" 型分布 两头大 中间小"
U型分布
一边小, J型分布——"一边小,一边大" 型分布 一边小 一边大"
统计学第3章统计整理
14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。
例
月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2
例
产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)
第三章统计整理
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分
学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .
统计资料整理
第三章统计资料整理一、解释概念1. 统计整理是根据统计研究的目的要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已初步加工的资料进行再加工,使之成为系统化、条理化的综合资料,以反映现象总体特征的工作过程。
2. 统计分组,就是根据统计研究的需要,按照一定的标志,将统计总体划分为若干个组成部分的一种统计方法。
3.分组标志就是将统计总体划分为几个性质不同部分的标准或依据。
4.复合分组是对被研究现象按两个或两个以上的标志结合起来所进行的分组。
5. 分布数列又称分配数列、次数分布,是在统计分组的基础上形成的,用来反映总体单位在各组中分布状况的统计数列。
6.统计表是把统计数据按照一定的结构和顺序,用表格显示出来的一种形式。
二、填充内容1. 统计调查、统计分析。
2.逐级汇总、综合汇总。
3. 及时性、准确性。
4. 简单分组、复合分组、分组体系。
5. 并列标志、分别。
6. 离散型、组距式。
7. 反比。
8. 组中值、一般水平。
9. 重合式、非重合式。
10. 总标题、纵标目。
11. 调查表、分析表、分组表、复合表。
12. 几何图形、具体形象。
三、选择答案1.( a b c d )2.( d )3.( a )4.( b c )5.( b )6.( b )7.( d )8.( a b )9.( a )10.( a c d )11.( b )12.( c d )13.( a )14.( a c )15.( c d )四、判断改错1.(√)2.(×)分布数列包括品质数列和变量数列。
3.(√)4.(√)5.(×)是一个品质数列。
6.(√)7.(×)通常是把该数值列人下限的所在组。
8.(√)9.(×)是离散变量数列。
10.(×)开口数列是指最大值只有下限没有上限,或者是最小值只有上限没有下限。
五、简答问题1.【回答要点】①统计整理是统计工作的中间环节,是统计调查的继续,又是统计分析的基础②实现由个体到全体、由特殊到一般、由现象到本质、由感性到理性的转化,从整体上反映出事物的数量特征。
《统计学》-第三章-统计整理
第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。
在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。
2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。
3、统计分组实质上是在统计总体内部进行的一种定性分类。
4、对原始资料审核的重点是真实性。
5、区分现象质的差别是统计分组的根本作用。
6、标志是统计分组的依据,是划分组别的标准。
7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组.8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组.9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。
10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。
11、按品质标志分组的结果,形成品质分布数列。
12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值.13、组距变量数列的组距大小与组数的多少成反比。
与全距的大小成正比。
14、组距变量数列的分布可以用次数分布曲线图表示。
15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。
16、统计资料的整理方法主要有统计分组和统计汇总两种。
17、钟形分布、U形分布和J形分布是次数分布的三种主要类型.18、统计分组体系有品质标志分组和数量标志分组两种.19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。
20、统计表从内容结构上看,是由主词和宾词两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C。
组内同质性,组间同质性 D。
组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组 B。
《应用统计学》第三章:统计整理
三、次数分布数列的编制
根据变量的类型和变量值的多少确定是编 制单项数列还是编制组距数列
单项变量数列的编制方法
编制步骤
第一,将日产量按从小到大顺序排列 第二,将变量值分为若干组 第三,找出每组变量出现的次数 第四,按变量值的大小顺序编制出单项数列
【例】己知某车间有24名工人,他们的日产量(件) 资料,要求编制变量数列。
返回
第三节 统计数据分组与频数分布
一、统计数据分组的原则
穷尽原则:就是使总体中的每一个单位都 应有组可归,或者说各分组的空间足以容 纳总体所有的单位
互斥原则:就是在特定的分组标志下,总 体中的任何一个单位只能归属于某一组, 而不能同时或可能归属于几个组
二、统计数据分组的步骤和方法
统计分组一般经过三个步骤:即选择分组 标志、分组界限的划分、选用分组体系
组距式变量数列编制方法
第四,计算组限,指每组两端数值,分为上 限和下限 上限:每组的终点数值(最大值) 下限:每组的起点数值(最小值) 第五,计算次数和频数
组距式变量数列编制方法
第六,计算组中值,即各组中点位置所对应的变 量值。其计算公式为:
组中值= 或=
上组下限 本组下限 2
本组组距 2
(适用所有闭口组)
(2)从内容上来看,统计表是由主词栏和 宾词栏两个部分组成。 主词栏是统计表所要说明的总体及其组成 部分,一般都列在表的左半部分; 宾词栏是统计表用来说明总体数量特征的各 个统计指标及其数值,一般都列在统计表 的右半部分。 此外,统计表还有补充资料、注解、资料 来源、填表单位、填表人等附加内容。
2、统计表的分类ຫໍສະໝຸດ 三、统计分组的应用
划分社会现象的不同类型 揭示社会现象的内部结构 分析社会现象之间的依存关系
第三章 统计资料整理
31
简单表案例
某年某公司所属两企业自行车合格品数量表
厂别 甲厂 乙厂 合 计 合格品数量(辆) 5000 7000 12000
32
简单分组表案例
2005年某月某公司各企业劳动生产率统计表 分组 总产值 (万元) 职工人 数(人) 劳动生产率 (元/人)
大型
中型 小型 合计
33
复合分组表案例
某年某地区工业增加值和职工人数
26
第三步:确定组限和组中值。以区分事物质的差别。
对于离散变量,相邻组组限可以间断,也
可重叠;
对于连续变量,相邻组组限必须重叠; 符合“上组限不计入”原则; 首末两组可使用“××以下”及“××以
上”的开口组。
27
第四步:归类汇总,计算各组次数。
本着“不重复,不遗漏”的原则,按照各个总体单位的具体 标志值,将其划归某一具体组之中。 对于重叠设置的组距数列,要本着“上限不在内”的原则。
19
某地区人口分布状况
人口按年龄分组 1岁以下(婴儿组) 1-7岁(幼儿组) 7-17岁(学龄儿童组) 17-55岁(有劳动能力的人口组) 55岁以上(老年组) 合计
人口数(万人) 1 6 12 24.6 8.1 51.7
20
对于异距数列,为了消除各组组距大小对次数分布的影响,
需计算
次数密度=该组次数/该组组距
14-16
16-18 18-20
16
12 5
540
620 680
8
三、统计分组的种类和分组标志的选择
(一)统计分组的种类 1、按标志的性质不同分为:品质标志分组和数量标志分组: 2、按选择标志的多少不同,可分为: 简单分组:对统计总体仅按一个标志进行分组。特点:只能 反映现象在某一标志特征方面的差异情况,说明的问题比较 简单明了。 复合分组:对同一总体采用两个或两个以上的标志重叠起来 进行分组。特点:可从几个不同角度了解总体内部的差别和 关系,因此能更全面、更深入地研究问题;复合分组的组数 随着分组标志的增加而成倍地增加。
统计学第三章 统计数据的整理
汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
第三章统计整理
按照习惯,成绩一般分为不及格、及格、 按照习惯,成绩一般分为不及格、及格、中 良好、 等、良好、优秀
即 组限 60分以下 60~70 70~80 80~90 90分以上 65 75 85 组中值
上组限不在内
利用Excel Excel进行分组 ㈢ 利用Excel进行分组
数据分析” 直方图 直方图” 选“工具”-“数据分析”-“直方图” 工具” 数据分析 定义“输入区域” 数据 定义“输入区域”—数据 分组中每组上限, “接收区域”—分组中每组上限,包括在本组 接收区域” 分组中每组上限 内 “输出区域”—结果 输出区域” 结果
编制结果如下: 编制结果如下:
日产量(件)X 日产量(件)X 20 21 22 23 24 25 26 合计 工人数(人) 工人数(人) f 3 5 6 4 3 2 1 24
组距数列
指每个组的变量值用一个区间来表现 的变量数列
编制条件:
变量是连续变量; 变量是连续变量; 或:总体单位数较多,变量不同取值个数 总体单位数较多, 也较多的离散变量。 也较多的离散变量。
复合分组
按性别 分类
对教师 的分类
共计12组 共计 组 × × 男 2×3×2
女 高级 中级 初级 青年 中年
按职称 分类 按年龄 分类
第三节 次数分布 ★ 一、分布数列的概念及种类
二、组距数列的编制 三、累计次数与累计频率
将总体各单位按分组标志分组后, 将总体各单位按分组标志分组后, 次数分布 形成的各单位在各组的分布
地位
统计整理的步骤
拟定统计整理方案 统计资料的预处理 数据处理 制作统计表或统计图
第二节 统计分组
将总体中所有单位按一定的标志划 统计分组 分为类型或性质不同的若干部分的 过程 统计分组的作用: 划分现象的类型 反映现象内部结构 分析现象之间的依存关系
统计学原理_第三章_陈本炎
三、统计整理的原则和步骤
统计整理的原则:根据统计研究的任务和要求,从 实际出发,在对所研究的客观现象进行全面、系统、 深刻分析的基础上,抓住最基本的、最能说明问题 本质特征的统计分组和统计指标体系对统计资料进 行加工整理。
统计整理的基本步骤是: (1)设计和编制统计资料的汇总方案; (2)审核原始资料,包括完整性、正确性、可比
性;
(3)用一定的组织形式和方法,对原始资料进行 分组、汇总和计算;
(4)对整理好的统计资料再一次进行审核,改正 在汇总过程中发生的差错;
(5)编制统计表、统计图及统计报告。 以上统计资料整理的基本步骤紧密相关,统计资
料的汇总是统计资料整理的中心内容,统计分组 是统计资料整理的关键和基础,统计表则是统计
(三)变量数列的编制方法
例如,某生产车间50名工人日加工零件数如下:
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
第三章意义 统计分组的意义和种类 分布数列的编制
技能目标
具有对统计数据进行统计分组的能力 具有编制统计分布数列的能力 具有应用Excel工具编制频数分布数列的能力
主要内容
第一节 第二节 第三节 第四节
统计整理的意义和步骤 统计分组 分 配数列 统计资料的汇总技术
资料整理成果的表现形式。
第二节 统计分组
(完整版)第3章统计整理
第三章统计整理学习要求:明确统计整理在统计研究中承前起后的地位;掌握分组的方法和汇总技术;认识统计分布是统计整理的重要表现形式;学会统计表的编制并能熟练地运用。
§1 统计整理的意义和方法一、统计整理的意义统计整理是指根据统计研究任务的要求,对调查所搜索的原始资料进行分组、汇总,使其条理化、系统化的工作过程。
统计整理实现了从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。
二、统计整理的方法:1、统计分组就是根据整理的目的要求,按照规定的标志进行区分若干组成部分的一种统计方法。
(科学的分组是搞好统计整理的前提条件)2、汇总是对分组后的各项指标进行汇总,并计算各组的单位数和合计数,计算出说明总体和各组情况的统计指标数值。
汇总是统计整理的中心内容汇总技术:①手工汇总:划记法、过录法、折叠法、卡片法。
②电子计算机汇总。
3、编表:经过汇总,得出表明社会现象总体和各个组的单位数和一系列标志总量的资料,把这些资料按一定的规则在表格上表现出来。
§2 统计分组一、统计分组的意义:统计分组的含义:指根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同而又联系的几个部分。
统计分组是在总体内部进行的一种定性分类。
①对总体而言是“分”,即将总体区分为性质相异的若干组成部分。
②对个体而言是“合”,即将性质相同的个体组合起来。
(统计分组的关键是分组标志的选择)二、统计分组的种类1、按统计分组任务和作用不同分:类型分组:划分社会经济类型;结构分组:研究同类总体的结构;分析分组:分析被研究现象总体诸标志之间的联系和依存关系。
类型分组、结构分组:现象总体按品质标志分组,多属类型分组(例如工业生产按经济类型分-----国有、私营、集体);现象总体按数量标志分组,多属结构分组(例如企业按职工人数分------1000人以下、1000-5000人、5000人以上)。
第三章 统计整理
单项式分组:
工人平均日产量资料
工人平均日产量(件) 2 3 4 5 6 合计 工人数 绝对数 比重(%) 10 8.7 15 13.0 30 26.1 40 34.8 20 17.4 115 100.0 上一页 下一页
返回本节首页
组距式分组:
某工厂工人完成生产定额情况表 工人完成生产定额分组(%) 工人数 绝对数 比重(%) 80~90 30 16.7 90~100 40 22.2 100~110 60 33.3 110~120 30 16.7 120~130 20 11.1 合计 180 100.0
某班学生籍贯分布表 地区分 绝对数人数 安徽 30 非安徽 10 合计 40
比重(%) 75 25 100
第3章 统计整理
42
单项式数列:一个变量值代表一组。
工人生产情况表 产量(件) 工人数
第3章 统计整理 11
2、统计分组目的: 总体经过分组,能够突出组与组之间的 差异,抽象掉组内各单位之间的差异, 使数据变得条理化,便于进一步分析研 究。
上一页
下一页
返回本节首页
3、统计分组的原则
⑴穷尽性
就是使总体中的每一个单位都应有组可归, 或者说各分组的空间足以容纳总体所有的单位。 例如:从业人员按文化程度分组,分为小学 毕业、中学毕业(含中专)和大学毕业三组,那 么,文盲及识字不多的以及大学以上的学历者则 无组可归。如果将分组调整为:文盲及识字不多、 小学程度、中学程度、大学及大学以上,那么就 可以包括全部从业人员的各种不同层次的文化程 度,符合了分组的穷尽性原则。
位数。
频率(f/∑f):次数的相对数,各组次数占总
次数的比重。
上一页 下一页 返回本节首页
㈡统计分布(分配数列)的分类
第三章统计资料的整理
本章重点
1.分组的概念、特点和原则,分组的作用,能 熟练进行分组 2.频数分布的概念及其构成
3.组限的表现形式及原则、组距和组中值的计 算 4.统计表的含义及其构成,统计表的编制方法 和原则
本章难点
1.统计数据的预处理
?
2.统计分组的方法
3.频数分布的编制
4.组限的表现形式、组距和组中值的计算
第一节 统计整理概述
次数分布数列,或称分配数列。
频数分布的两个要素
1.组别:总体按某标志所分的组
2.频数(次数)和频率:各组的单位数叫频数,用
f 表示,各组的单位数与总体单位总数之比叫
频率,用 f 表示 。频率具有如下两个性质:
f
(1)各组频率都是界于0和1之间的一个分数。 即: f 0 1 f
(2)各组频率之和等于1 。即
(3)如果所发现的差错在其他单位也可能发生 时,应将错误情况通报所有单位,以免发生类 似错误。
(4)对于严重的错误,应发还重新填报,并查
明发生错误的原因,若属于违法行为,则应依
法严肃处理。
第二节
一、统计分组的概念
统计分组
根据社会经济现象的特点和统计研究的
目的要求,按照某个重要标志(或几个标志) 把总体划分为若干不同性质的组,称为统计 分组。
在下列情况下,就必须考虑采用异距分组:
第一,标志值分布很不均匀的场合。
第二,标志值相等的量具有不同意义的场合。
第三,标志值按一定比例发展变化的场合。
3.间断组距式分组和连续组距式分组
(1)间断组距式分组 :是指组限不相连
的分组。
(2)连续组距式分组 :凡是组限相连(或 重叠)的分组,即以同一数值作为相邻两组的 共同界限的分组。统计上规定 :“上限不在内”
第三章 统计整理
1.分组标志的选择原则 (1)应根据研究的目的与任务选择分组标志。 例如,同一个工人总体,有多种不同分组方法: ①如果研究学历对收入的影响时,应选择“文 化程度”作为分组标志。 ②如果研究资历对收入的影响时,则应选择 “工龄”作为分组标志。
(2)要选择能够反映事物本质或主要特征的标志。 例如,研究职工生活水平的高低情况时,可 以用“职工的工资水平”作为分组标志,也可以 用“职工家庭成员平均收入水平”作为分组标志。 应该选择后者作为分组标志。 (3)要根据现象的历史条件变化来选择分组标志。 例如,前面讲到研究职工生活水平问题,如 果要列出“职工生活贫困户”一组,则“贫困户” 的标准就随历史条件变化而变化,而且不同地区 标准也不相同。
第三节,变量数列(分配数列)
一、分配数列(次数分布)的概念
在统计分组的基础上,将总体中所有单位按组 归类整理,并按一定的顺序排列,形成总体中各单 位数在各组间的分布称为次数分布,又称分布数列 分布在各组的个体单位数叫次数,又称频数 (fi)。各组次数与总次数(Σfi)之比称为比 率,又称频率。 分配数列(次数分布)有两个构成要素:一 个是分组,另一个是次数。 统计分布的实质:把总体的全部单位按某标 志所分的组进行分配所形成的数列。
第二节 统计分组
一、统计分组的意义: • 统计分组的含义:是根据统计研究任务的 要求和现象总体的内在特点,把统计总体 按照某一标志划分为若干性质不同而又联 系的几个部分(或组)的一种统计方法。 统计分组的关键是分组标志的选择和 划分各组界限。而核心问题是正确地选择 分组标志。 (下)
• 在一个总体中,单位的品质标志或数量标志, 其标志表现可能是互不相同的,总体内部各 个单位间存在许多的变异标志又是人们把总 体进一步分为性质不同的几个部分的客观依 据。 • 统计分组是在总体内部进行的一种分类。兼 有“分”和“合”的双重含义:对总体而言 是“分”(分为范围更小的总体),而对总 体单位而言是“合”(合为性质相同的组); 对分组标志而言是“分”(按分组标志划分 总体成为标志表现不同的许多组),而对其 它标志来说又是“合”(其它标志表现的差 异消失了)。
统计资料的整理
第三章统计资料的整理教学目的与要求:本章是统计研究活动的第三阶段—统计资料整理阶段,阐述了统计整理的理论与方法,包括分组、汇总和统计表的设计。
重点要求为:1、明确统计资料整理的概念,了解统计整理的步骤。
2、通过学习统计分组理论,能够对不同的社会经济现象进行统计分组。
3、运用分配数列对原始数据进行系统整理。
4、掌握统计表的具体编配方法。
重点掌握:1、统计分组方法。
2、分配数列的编制与汇总教学方式:用多媒体课件讲练结合。
课时安排:理论4学时,实训4学时第一节统计整理的意义和步骤一、统计整理的意义1、定义统计整理,就是根据统计研究的目的,对所搜集到的资料进行科学的加工,使之系统化,条理化的工作过程。
统计整理即包括对统计调查所得到的原始资料进行整理,也包括对加工过的综合资料,即次级资料进行再整理。
2、意义统计整理在整个统计研究中占有重要的地位。
统计整理的正确与否,将直接影响和决定着能否完成整个统计研究的任务。
如果采用不科学不完整的整理方法,即使搜集到准确、全面的统计资料,也往往使这些资料失去应用价值,掩盖客观现象的本质,难以得出正确的结论。
因此,必须十分重视统计整理工作。
二、统计资料整理的步骤第一步,设计和制定统计整理方案。
第二步,对原始资料进行审核。
第三步,对经过审核的资料进行分组、并结合汇总,计算出总体总量指标。
第四步,将汇总计算的结果,以统计表或统计图的形式表现出来。
第五步,对统计资料妥善保存,系统积累。
第二节统计分组一、统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定的标志分为若干个组成部分的一种统计方法。
例如,将某一班级的全体同学按照性别划分为男、女两个组;对某市100家大型零售商店按照零售额、职工人数进行分组等。
统计分组具有两个方面的含义:对总体而言,是“分”,即将同质总体区分为性质有别的不同组成部分;对总体单位而言,它是“组”,即将性质相同或相近的不同总体单位组合在一起,构成一个组。
第三章统计整理
例:我国第五次人口普查我国大陆人口年龄分布:
人口按年龄分组 14岁以下
15 —— 64 65岁以上 合计
人口数(亿人) 2.8979 8.8793 0.8811 12.6583
比率(%) 22.89 70.15 6.96
100.00
2、构成:
由两部分构成:(1)各组 (2)各组次数(或频率)
3、种类:根据分组标志的不同可分为:
第三章 统计整理
学习目的:通过本章的学习,使学生掌握统计资料整理 的程序、统计分组的方法以及分布数列的编制、统 计汇总的组织形式和技术方法,以及设计和编制统 计表。 第一节 统计整理概述 第二节 统计分组 第三节 分布数列 第四节 统计汇总 第五节 统计表
第一节 统计整理概述
一、概念
原始统计资料
综合统计资料
(1)周延性:即不能遗漏(又称穷举原则) (2)互斥性:即不能重复(又称互斥原则)
即:要求保持组内资料同质性和组间资料的差异性
二、统计分组的作用
1、区分社会经济现象的类型 2、研究总体的内部结构 3、研究现象之间的依存关系
三、分组标志(分组标准)
1、概念:即分组的依据 2、选择: (1)根据统计研究的目的选择 (2)选择具有本质性的重要标志 (3)结合现象所处的具体条件
200
1.000
100.0
1、条形图
其他广告 2
广 招生招聘广告 告 房地产广告 类 型 金融广告
10 16
9
服务广告
51
商品广告
某0城市居民关注不同类4型0 广告的人数分布图 80
112
人数(人)
2、圆形图(饼形图)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第三章统计资料整理通过统计调查所取得的资料只能反映总体各单位的具体情况,是分散的、零碎的、个别的,要说明事物的总体情况,揭示总体的一般情况,还需对这些资料进行加工整理,才能对总体做出概括性的说明。
1、统计资料整理的一般问题(1) 统计整理的概念、作用、重要性统计整理是根据统计研究的目的和要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已经初步加工的资料进行再加工,使之成为系统化、条理化的综合分析,以反映现象总体特征的工作过程。
统计整理是整个统计工作的中间环节,统计整理是统计调查的继续,又是统计分析的基础,具有承前启后的作用。
统计调查所搜集到的资料只有经过科学的审核、分类、汇总等整理工作,才能实现由个体到总体、由现象到本质、由感性到理性的转变。
(2) 统计整理的程序1、制定整理方案2、数据审核就是对搜集到的资料进行全面审核,主要检查数据的完整性(是否遗漏)和准确性(是否可靠),如果发现问题,及时纠正,以保证搜集的资料准确无误,这是统计工作十分重要的环节,必须认真对待。
3、划类分组根据研究目的和统计分析的需要,对原始资料进行分组分类。
例如:研究性别构成可以按性别分组;研究不同职业的工资水平可以按照职业分组,又可以按照某一组距进一步细分。
4、综合汇总即在分组的基础上,将各项资料进行汇总,得出反映各组和总体的总量指标。
例如:女性总人口数、男性总人口数、总人口数;金融业人均工资、会计类人均工资、教师类人均工资、公务员人均工资、农民工人均工资等。
(注意:前者总量指标,后者为平均指标)5、制表制图将整理出来的统计结果用统计表或统计图的形式反映出来,表述统计资料的内容6、积累保管即统计资料的积累的保管。
因为统计研究中要经常进行动态分析,这就需要长期积累统计资料。
(3) 统计整理的技术1、手工汇总手工汇总是指以算盘和计算器为主要工具,通过手工操作对统计资料进行汇总。
由于手工汇总速度慢、易出错,取而代之的是现代化汇总技术——计算机汇总2、计算机汇总计算机汇总是指通过计算机来进行统计汇总的一种技术手段。
计算机汇总具有计算容量大、速度快、准确性高的特点,而且还能还能进行数据储存、自动运行程序(例如Excel在统计中的应用)等,这些都是手工汇总无法比拟的。
(4) 统计整理的组织形式1、逐级汇总(自下而上逐级对调查资料进行汇总)2、集中汇总(将所有调查资料集中在制定部门进行汇总)3、综合汇总(上面两者的结合)2、统计分组(1) 统计分组的概念统计分组就是统计整理的第二个环节,对调查资料按照统计研究的需要进行分组。
例如:对全班同学按年龄分组可以知道年龄构成,按成绩分组可以知道学习状况,按生源地分组可以知道地域分布状况,按户口类型分类可以知道城乡学生比例。
(2) 统计分组的作用由上可见,通过统计分组可以区分社会经济现象的类型,可以反映社会经济现象的内部结构,可以分析社会现象之间的依存关系(比如收入与支出之间的关系、销售量与价格之间的关系)。
(3) 分组标志的选择统计整理的关键在于统计分组,而统计分组的关键又在于分组标志的选择。
分组标志就是划分各组的依据。
比如上面的年龄、成绩、生源地、户口类型等。
到底如何确定分组标志呢?原则有下:1、要根据研究的目的确定例如:同样对于工业企业这样一个总体分组,当研究工业企业的规模结构时,应选择“生产能力”作为分组标志来说明大中小型企业的构成情况;当研究工业企业部门结构时,应选择所属“部门”进行分类。
根据不同的研究目的,选择合适的分组标志,才能使统计分组的资料更好地满足研究的需要。
2、要选择最能反映事物本质特征的标志如果能够说明目的的标志有多个,则需要抓住具有本质特征的关键性标志作为分组的依据。
如上例中对企业规模的划分,就有多个标志,如企业职工人数、企业固定资产、生产能力、占地面积等,无疑只有生产能力最能够体系企业的规模,生产能力才是最具有本质特征的标志。
3、要结合历史条件和具体情况即选择分组的标志不是一成不变的,需要以一定的时间、地点、条件为转移。
如研究工业企业生产能力的问题,在机械化程度较低的情况下,生产能力的大小主要取决于劳动力的数量,那时候就可以把职工人数作为主要标志。
但在现代化工业企业中,机械化程度很高,职工人数的多少不再是决定生产能力的关键因素了,取而代之的是固定资产,因而我们研究工业企业生产能力的时候也必须选择固定资产来作为分组标志。
(4) 统计分组的方法1、按品质标志分组2、按数量标志分组(1) 单项式分组(2) 组距式分组(5) 统计分组的形式1、简单分组2、复合分组3、分配数列(1) 分配数列的概念统计分组以后,调查资料就变成了由若干小组数据按一定顺序构成的分配数列。
分布在各个组的总体单位数叫次数(频数),各组单位数(即次数、频数)占总体单位数的比重称为频率。
例如:第六次全国人口普查结果(大陆地区)标志人数(人)比率(%)性别男性68685257251.27%女性65287228048.73%年龄0-14岁22245973716.60%15-59岁93961641070.14%60岁以上177********.26%总人口1339724852(2) 分配数列的分类1、品质数列即按照品质标志进行分组所形成的分配数列,用来观察总体单位中不同属性的单位分布情况。
例如按组织形式将企业分为股份公司、合伙企业、合资企业等;按照文化程度将人分为大学及以上、高中、初中、小学、半文盲、文盲等。
2、变量数列即按照数量标志进行分组所形成的分配数列。
例如研究居民家庭贫富状态时,按恩格尔系数分组,60%以上为贫困家庭、50%~60%为温饱家庭、40%~50%为小康家庭、40%以下为富裕家庭。
根据总体各单位数量变动的特征,有两种分组方式(单项式分组、组距式分组):(1) 单项数列即按照单项式分组所形成的分配数列,也就是每一个变量值都成一组,一般适用于离散变量,而且变量值不多。
例如:按照家庭孩子数量来对家庭进行分类:孩子数量(个)家庭数量(户)123(2) 组距数列即按照组距式分组所形成的分配数列,也就是按变量值的一定范围来进行分组。
例如前面关于贫富状况的分组、按照年龄进行的分组等,这种分组非常常见。
这种分组方法涉及到一些概念:闭口组:上限呵呵下限都齐全的分组开口组:上限下限缺其一的分组组限:就是分组的数量界限。
上限(改组的最大值)和下限(改组的最小值)组距:就是每一组的上限与下限之差。
所有分组中组距都相等的分组叫等距分组,不相等的叫异距分组。
组数:即有多少组数据。
组数的多少和组距的大小呈反比例关系。
组中值:即各组变量值的代表性水平,是各组上限与下限的中点值。
闭口组条件下:组中值=(上限+下限)/2开口组条件下:却下限的组中值=上限-邻组组距/2缺上限的组中值=下限+邻组组距/23、变量数列的编制(1) 单项数列的编制如果分组标志是由离散变量组成,并且变动范围不大时可以编制成单项数列。
如前面所述按照家庭孩子数量对家庭的分类;再如按照每年进电影院观看电影的次数对学生进行分类。
(2) 分组数列的编制很多经济现象不适合用单项数列进行分组,那样太繁琐而且没有统计意义。
举例:加入按单项方式对学生成绩进行分类,那就是0分的有多少学生、1分的有多少学生……显然这样不具有统计意义。
这是就需要编制分组数列。
那么到底编成等距数列还是异距数列?这还取决于标志值变动的具体情况。
举例:如果学生成绩如下:51、52、63、65、66、69、75、76、77、78、79、74、72、76、80、85、91。
就可以按照组距为10编制等距数列,同样可以编制成异距数列:60分以下、60~70分、70~80分、80~90分、90~100分。
1) 等距数列的编制排序→求全距→确定组距→求组数→计算各组的次数或频数→制作频数分布表。
举例:再给学生一个练习。
2) 异距数列的编制当标志值变动很不均匀、遇偏遇斜的情况下,应编制成异距数列。
根据经验确定组距。
4、关于次数的两个问题(1) 累计次数分布次数研究是统计研究的一个基本问题。
累计次数分布是将各组变量的次数和频率逐组累计相加,它表明总体的某一标志值在某一水平上下的总体次数和比率。
累计的方法有两种:向上累计和向下累计(2) 次数分布的主要类型1、钟形分布次数呈现“两头小、中间大”的特征,即靠近中间的变量值分布的次数较多,靠近两端的变量值分布的次数较小。
2、U形分布U形分布的特征与钟形分布恰恰相反,是“两头大中间小”,即靠近中间的变量值分布的次数较小,靠近两端的变量值分布的次数较多。
3、J形分布J形分布的特征是“一头大一头小”,即多数变量值集中在某一端。
5、统计数据的显示经过统计整理以后的资料有数据资料和文字资料两大类。
其中,数字资料的条理化、科学化往往通过统计表和统计图显示出来,因此,统计表和统计图称为显示统计资料的重要工具。
(1) 统计表统计表就是把统计数据按照一定的结构和顺序,用表格的形式显示出来。
统计表的运用十分广泛,其主要优点:表格式的列示不仅使得数据显示简明易懂,而且使得统计资料条理化,也便于计算和比较表内各项总统计指标。
1、统计表的构成(见教材)从形式上看,由总标题、横标题、纵标题、数字资料四部分组成从内容上看,由主词、宾词两部分组成2、统计表的分类(1) 按分组情况:简单表、分组表、复合表简单表:是指对总体未作分组,仅按时间顺序等排列而成的统计表。
分组表:是对总体单位按照一定的标志进行分组而形成的统计表,如上按照由低到高对身高的排序。
复合表:是对总体的统计单位按两个或两个以上标志进行交叉重叠分组而形成的统计表。
按作用分类:调查表、汇总表和分析表调查表:主要应用在调查资料中的登记、搜集原始资料环节汇总表:用于对统计资料的整理、汇总分析表:用于统计分析的表格举例:对本班学生的身高情况的研究按照学号一次进行测量,得到41个身高数据(调查表)→把这些身高数据进行从低到高排序,并按一定的组距进行分组,可以计算每组的次数、频率(汇总表)→分析本班学生的平均身高,对比标准身高或其他总体平均身高或全国同龄人平均身高评价本班学生身高状况(分析表)。
(2) 按时空性质不同:空间数列表和时间数列表空间数列表:即静态表,是反映同一时间条件下不同范围内的统计数据的表格。
例:2008年我国土地构成状况时间数列表:即动态表,是反映同一空间条件下不同时间上的统计数据的表格。
例:近十年来我国GDP发展状况。
两者也可以结合起来显示统计数据。
3、统计表的编制原则(1) 制表外观简洁大方(2) 统计表的标题、项目、指标简明扼要,能准确反映内容(3) 如须合计时,合计栏一般在最后一行或最左一列或最右一列(4) 表中数字应根据纵横关系对位,为零时应写为“0”,没有数字的标记为“—”;缺失某项数字时“……”,相同的数字不能用“同上”之类的词语表示。