第三章 统计整理
第3章 统计整理
(2)必须选择最主要的标志作为分组依据;
例3:根据统计调查资料来研究人民生活水平变动情况时, 可供选择的分组标志有家庭人口数、每户就业人数、每 一就业者负担人数、家庭总收入、平均每人每月生活费 收入等,其中最能反映人民生活水平变动的标志是:平 均每人每月生活费收入,应选择这一标志作为分组标志。
练习:企业按净产值分组为:单位(万元) 10以下 10-20 20-30 计算首组和末组的组中值。 30-40 40-70 70以上 首组组中值=10-10/2=5(万元) 末组组中值=70+30/2=85(万元)
第四节
统计汇总
一、统计汇总:即在统计分组的基础上,将统计资料
归并到各组中去,并计算各组和总体的合计数(包 括单位总数和标志总量)的工作过程。
例如:对全国的工业企业进行
简单分组: 按所有制类型分:全民所有制企业、集体所有制企业 按轻重工业分:重工业、轻工业 按企业规模大小分:大型企业、中型企业、小型企业
复合分组:
重工业 全民所有制 轻工业 集体所有制
大型企业 中型企业 小型企业
重工业
轻工业
3、按分组标志的性质分为品质分组和数量分 组。
N 15-24 25-44 45-89 90-179 n 5 6 7 8
180-359 9
360-719 10
适用条件:
1.近似正态分布 2.现象特性适合等距分组
组
限
组限:指每组两端数值。分为上限和下限。 上限:每组的终点数值(最大值)。 下限:每组的起点数值(最小值)。 组限的形式:与变量的特点有关,重合式和不重合式。
第一节 统计整理的意义和程序
一、统计整理的意义 二、统计整理的程序
统计学基础第三章统计整理
第三章统计整理【教学目的】1. 深刻理解统计分组的作用,并且能够对不同的社会经济现象进行统计分组2. 运用分配数列对原始数据进行系统整理3. 制作统计表,运用计算机绘制统计图【教学重点】1. 能够对不同的社会经济现象进行统计分组2. 运用分配数列对原始数据进行系统整理3. 制作统计表,运用计算机绘制统计图【教学难点】1. 运用分配数列对原始数据进行系统整理2. 制作统计表,运用计算机绘制统计图【教学时数】教学学时为8 课时【教学内容参考】第一节统计整理的意义一、统计整理的意义统计整理,就是根据统计研究的目的和任务的要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化,从而得到表现总体特征的综合统计资料的工作过程。
对于已整理过的初级资料进行再整理,也属于统计整理。
统计调查取得的各种原始资料是分散的、不系统的,只能表明各个被调查单位的具体情况,反映事物的表面现象或一个侧面,不能说明事物的总体情况与全貌。
因此,只有对这些资料进行加工、整理,才能认识事物的总体及其内部联系。
例如,工业企业普查中,所调查的每个工业企业资料,只能说明每个工业企业的经济类型、注册资本、职工人数、工业总产值、工业增加值、实现利税等具体情况。
必须通过对所有资料进行分组、汇总等加工处理后,才能得到全国工业企业的综合情况,从而分析工业企业的构成、经营状况等,达到对全国工业企业的全面的、系统的认识。
统计整理是统计调查的继续,也是统计分析的前提,它在统计研究中起着承前启后的作用。
因此,资料整理得是否正确,直接决定着整个统计研究任务的完成,不恰当的加工整理,不完善的整理方法,往往使调查得来的丰富、完备的资料失去价值。
因此,必须十分重视统计整理工作。
二、统计整理的步骤统计整理的基本步骤是:(一)对原始资料进行审查。
1. 审查被调查单位的资料是否齐全;2. 应审查数据是否准确。
审查的办法主要有:①逻辑审查:主要是从定性角度审查数据是否符合逻辑,内容是否合理,各项目或数量之间有无相互矛盾的现象。
第三章 统计整理
第三章统计整理一、名词解释数据分组次数分布 (频数分布) 单变量分组组距分组组距组限组中值次数(频数)频率向上累积频数(或频率)向下累计频数(或频率)统计表二、填空1.每个组只有一个变量值的分配数列叫________,各组组距不相等的组距列叫________。
2、在组距数列中,说明总体单位数值变化界限的数值称为_____ ,各组上限与下限之间的中点数值称为_________。
3、在变量数列中,各组单位数称_______,各组单位数占总体单位总数的比重称________。
4、数据分组的原则有和____________。
5、对总体进行统计分组关键在于。
三、选择1.统计资料按数量标志分组后,处于每组两端的数值叫 ( )。
A.组距 B.组数 C.组限 D.组中值2.统计表中的主词是指 ( )A.统计表的横行标题 B.统计表的纵栏标题 C.统计表所要说明的总体 D.说明总体的统计指标3.数据整理的步骤一般为()()()()()()。
(排序)A.数据的预处理 B.编制统计数列和统计表 C.选择标志对总体进行分组 D.数据汇总E.计算和汇总 F.统计复查4.下列各项中按数量标志分组的有()()()()()。
A.人口按年龄分组 B.企业产品按合格与不合格分组C.人口按性别分组 D.家庭按月收入分组E.企业按年产值分组 F.人口按文化程度分组5.构成分配数列的两个基本要素是()()()()()。
A.组数的多少 B.各组组距大小 C.统计分组 D.各组标志值的大小E.各组次数大小 F.分配在各组的单位数6.统计表从形式上看,它是由()()()()()构成的。
A.总标题B.纵栏标题C.横行标题 D.主词E.指标数值 F.宾词第四章指标一、名词解释总体单位总数总体标志总量时期指标时点指标实物指标价值指标劳动指标算术平均数权数调和平均数几何平均数中位数众数标准差标准差系数二、简答1、简述时期指标和时点指标的概念、特点。
3第三章统计整理
(4)时效性审核 应尽可能使用最新的统计数据
(5)确认是否必要做进一步的加工整理
统计学
河南科技大学
第三章 统计整理
(二)差错的更正与处理
通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不同 情况作如下处理:
10. 爱尔兰 拥有大学学位人群所总人口占比例:37% 年增速 (2000-2010年): 7.3% (最高)
9. 澳大利亚 拥有大学学位人群所占总人口比例:38% 8. 芬兰 拥有大学学位人群所占总人口比例:38% 7. 英国 拥有大学学位人群所占总人口比例:38% 6. 韩国 拥有大学学位人群所占总人口比例:40%
统计学
第三章 统计整理
河南科技大学 历次人口普查中,每10万人中各种文化程度的人数
大专及以上 高中
初中
小学
1982 1990 2000 2010
615 1422 3611 8930
Hale Waihona Puke 6779 8039 11146 14032
17892 23344 33961 38788
35237 37057 35701 26779
统计学
河南科技大学
三、统计整理的程序
第三章 统计整理
统计资料的审核
资料的分组和汇总
编制统计表或绘制统计图
统计资料的积累、保管和公布
统计学
河南科技大学 数据审核
第三章 统计整理
统计工作的基本程序
收集 数据
真实 数据
虚假 数据
科学地计 算与分析
假数真算
第三章--统计整理-幻灯片(1)
如某班学生按年龄分组:17岁,18岁,19岁, 20岁, 21岁,22岁。
组距式分组
将作为分组依据的数量标志的整个取 值范围依次划分为若干个满足互斥性
和包容性的区间,用这些数值区间作
为组的名称。
某班学生统计 学原理成绩分 组
60分以下 60—70分 70—80分 80—90分 90分以上
组距式分组中的一些概念 《统计学原理》第三章 统计整理
对教师 的分类
按性别分类
男性 女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
复合分组体系
对教师 的分类
按性别 分类
按职称 分类
按年龄 分类
《统计学原理》第三章 统计整理
共计12组 男 2×3×2
女 高级
中级
初级 青年 中年
《统计学原理》第三章 统计整理
统计资料的再分组
• 统计资料的再分组就是把统计分 组资料按某种要求,重新划定各 组界限,再将资料中的单位数或 比重分布重新做出调整。
对总体单位而言,是“合”,即将性质相同的 个体组合起来,在同一组内则保持着相同的性 质。
分组
《统计学原理》第三章 统计整理
25%
33%
分组前
分组后
42%
作用:1·区分事物的性质
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
将统计调查得到的原始资料进行科
统计整理 学的分类和汇总,使之成为系统化、
条理化的综合资料,以反映研究总 体的特征。
地位 是统计调查的继续,统计分析的前提 和基础,起着承前启后的作用。
三章节统计整理
27
⒈对数据进行排序
①打开 “成绩.xls” 工作簿,选定“英语成绩”工作表。 ②利用鼠标选定单元格 区域。
上一页 下一页 返回本节首页
28
③在菜单中选择“数据”中旳“排序”选项,则弹 出排序对话框。
上一页 下一页 返回本节首页
29
④在排序对话框窗口中,选择“主要关键字” 列表中旳“英语”作为排序关键字,并选择按 “递增”排序。因为所选用数据中已经包括标 题,所以在“目前数据清单”中选择 “有标题 行”,然后单击 “拟定”按钮,即可得到 排序 旳成果。
函数是其中旳一种。
上一页 下一页 返回本节首页
37
频数分布函数 (FREQUENCY) 能够对一列垂直数组返回某个区域中数据旳频数分布。
频数分布函数 (FREQUENCY)旳语法形式为: FREQUENCY(data_array,bins_array)
其中:Data_array为用来编制频数分布旳数据,Bins_array 为频数或次数旳接受区间。
3. 数据透视表
数据透视表是一种交互式工作表,用于对已经 有数据表和数据库中旳数据进行汇总和分析旳 一种工具。
上一页 下一页 返回本节首页
14
4. 统计图
Excel能够绘制许多图表,其中大部分是统计 图,可用于数据旳整顿与分析,能够直观形
象地描述现象旳数量规律性。
上一页 下一页 返回本节首页
15
第二节 统计分组与分配数列
3
第一节 统计整顿旳概念
一、统计整顿定义 二、统计整顿旳内容 三、EXCEL中统计整顿工具
上一页 下一页 返回本章首页
4
一、统计整顿旳定义
统计整顿是根据统计研究旳任务,对 统计调查所搜集到旳大量原始资料进行 加工汇总,使其系统化、条理化、科学 化,以得出反应事物总体综合特征旳资 料旳工作过程。
统计学第3章统计整理
14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。
例
月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2
例
产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)
统计学(第三章)
四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。
第三章统计整理
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分
学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .
统计资料整理
第三章统计资料整理一、解释概念1. 统计整理是根据统计研究的目的要求,对统计调查所得的原始资料进行科学的分类、汇总,或对已初步加工的资料进行再加工,使之成为系统化、条理化的综合资料,以反映现象总体特征的工作过程。
2. 统计分组,就是根据统计研究的需要,按照一定的标志,将统计总体划分为若干个组成部分的一种统计方法。
3.分组标志就是将统计总体划分为几个性质不同部分的标准或依据。
4.复合分组是对被研究现象按两个或两个以上的标志结合起来所进行的分组。
5. 分布数列又称分配数列、次数分布,是在统计分组的基础上形成的,用来反映总体单位在各组中分布状况的统计数列。
6.统计表是把统计数据按照一定的结构和顺序,用表格显示出来的一种形式。
二、填充内容1. 统计调查、统计分析。
2.逐级汇总、综合汇总。
3. 及时性、准确性。
4. 简单分组、复合分组、分组体系。
5. 并列标志、分别。
6. 离散型、组距式。
7. 反比。
8. 组中值、一般水平。
9. 重合式、非重合式。
10. 总标题、纵标目。
11. 调查表、分析表、分组表、复合表。
12. 几何图形、具体形象。
三、选择答案1.( a b c d )2.( d )3.( a )4.( b c )5.( b )6.( b )7.( d )8.( a b )9.( a )10.( a c d )11.( b )12.( c d )13.( a )14.( a c )15.( c d )四、判断改错1.(√)2.(×)分布数列包括品质数列和变量数列。
3.(√)4.(√)5.(×)是一个品质数列。
6.(√)7.(×)通常是把该数值列人下限的所在组。
8.(√)9.(×)是离散变量数列。
10.(×)开口数列是指最大值只有下限没有上限,或者是最小值只有上限没有下限。
五、简答问题1.【回答要点】①统计整理是统计工作的中间环节,是统计调查的继续,又是统计分析的基础②实现由个体到全体、由特殊到一般、由现象到本质、由感性到理性的转化,从整体上反映出事物的数量特征。
《统计学》-第三章-统计整理
第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。
在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。
2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。
3、统计分组实质上是在统计总体内部进行的一种定性分类。
4、对原始资料审核的重点是真实性。
5、区分现象质的差别是统计分组的根本作用。
6、标志是统计分组的依据,是划分组别的标准。
7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组.8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组.9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。
10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。
11、按品质标志分组的结果,形成品质分布数列。
12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值.13、组距变量数列的组距大小与组数的多少成反比。
与全距的大小成正比。
14、组距变量数列的分布可以用次数分布曲线图表示。
15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。
16、统计资料的整理方法主要有统计分组和统计汇总两种。
17、钟形分布、U形分布和J形分布是次数分布的三种主要类型.18、统计分组体系有品质标志分组和数量标志分组两种.19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。
20、统计表从内容结构上看,是由主词和宾词两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C。
组内同质性,组间同质性 D。
组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组 B。
《应用统计学》第三章:统计整理
三、次数分布数列的编制
根据变量的类型和变量值的多少确定是编 制单项数列还是编制组距数列
单项变量数列的编制方法
编制步骤
第一,将日产量按从小到大顺序排列 第二,将变量值分为若干组 第三,找出每组变量出现的次数 第四,按变量值的大小顺序编制出单项数列
【例】己知某车间有24名工人,他们的日产量(件) 资料,要求编制变量数列。
返回
第三节 统计数据分组与频数分布
一、统计数据分组的原则
穷尽原则:就是使总体中的每一个单位都 应有组可归,或者说各分组的空间足以容 纳总体所有的单位
互斥原则:就是在特定的分组标志下,总 体中的任何一个单位只能归属于某一组, 而不能同时或可能归属于几个组
二、统计数据分组的步骤和方法
统计分组一般经过三个步骤:即选择分组 标志、分组界限的划分、选用分组体系
组距式变量数列编制方法
第四,计算组限,指每组两端数值,分为上 限和下限 上限:每组的终点数值(最大值) 下限:每组的起点数值(最小值) 第五,计算次数和频数
组距式变量数列编制方法
第六,计算组中值,即各组中点位置所对应的变 量值。其计算公式为:
组中值= 或=
上组下限 本组下限 2
本组组距 2
(适用所有闭口组)
(2)从内容上来看,统计表是由主词栏和 宾词栏两个部分组成。 主词栏是统计表所要说明的总体及其组成 部分,一般都列在表的左半部分; 宾词栏是统计表用来说明总体数量特征的各 个统计指标及其数值,一般都列在统计表 的右半部分。 此外,统计表还有补充资料、注解、资料 来源、填表单位、填表人等附加内容。
2、统计表的分类ຫໍສະໝຸດ 三、统计分组的应用
划分社会现象的不同类型 揭示社会现象的内部结构 分析社会现象之间的依存关系
第三章统计整理
按照习惯,成绩一般分为不及格、及格、 按照习惯,成绩一般分为不及格、及格、中 良好、 等、良好、优秀
即 组限 60分以下 60~70 70~80 80~90 90分以上 65 75 85 组中值
上组限不在内
利用Excel Excel进行分组 ㈢ 利用Excel进行分组
数据分析” 直方图 直方图” 选“工具”-“数据分析”-“直方图” 工具” 数据分析 定义“输入区域” 数据 定义“输入区域”—数据 分组中每组上限, “接收区域”—分组中每组上限,包括在本组 接收区域” 分组中每组上限 内 “输出区域”—结果 输出区域” 结果
编制结果如下: 编制结果如下:
日产量(件)X 日产量(件)X 20 21 22 23 24 25 26 合计 工人数(人) 工人数(人) f 3 5 6 4 3 2 1 24
组距数列
指每个组的变量值用一个区间来表现 的变量数列
编制条件:
变量是连续变量; 变量是连续变量; 或:总体单位数较多,变量不同取值个数 总体单位数较多, 也较多的离散变量。 也较多的离散变量。
复合分组
按性别 分类
对教师 的分类
共计12组 共计 组 × × 男 2×3×2
女 高级 中级 初级 青年 中年
按职称 分类 按年龄 分类
第三节 次数分布 ★ 一、分布数列的概念及种类
二、组距数列的编制 三、累计次数与累计频率
将总体各单位按分组标志分组后, 将总体各单位按分组标志分组后, 次数分布 形成的各单位在各组的分布
地位
统计整理的步骤
拟定统计整理方案 统计资料的预处理 数据处理 制作统计表或统计图
第二节 统计分组
将总体中所有单位按一定的标志划 统计分组 分为类型或性质不同的若干部分的 过程 统计分组的作用: 划分现象的类型 反映现象内部结构 分析现象之间的依存关系
(完整版)第3章统计整理
第三章统计整理学习要求:明确统计整理在统计研究中承前起后的地位;掌握分组的方法和汇总技术;认识统计分布是统计整理的重要表现形式;学会统计表的编制并能熟练地运用。
§1 统计整理的意义和方法一、统计整理的意义统计整理是指根据统计研究任务的要求,对调查所搜索的原始资料进行分组、汇总,使其条理化、系统化的工作过程。
统计整理实现了从个别单位的标志值向说明总体数量特征的指标值过渡,是人们对社会经济现象从感性认识上升到理性认识的过渡阶段,为统计分析提供基础。
二、统计整理的方法:1、统计分组就是根据整理的目的要求,按照规定的标志进行区分若干组成部分的一种统计方法。
(科学的分组是搞好统计整理的前提条件)2、汇总是对分组后的各项指标进行汇总,并计算各组的单位数和合计数,计算出说明总体和各组情况的统计指标数值。
汇总是统计整理的中心内容汇总技术:①手工汇总:划记法、过录法、折叠法、卡片法。
②电子计算机汇总。
3、编表:经过汇总,得出表明社会现象总体和各个组的单位数和一系列标志总量的资料,把这些资料按一定的规则在表格上表现出来。
§2 统计分组一、统计分组的意义:统计分组的含义:指根据统计研究任务的要求和现象总体的内在特点,把统计总体按照某一标志划分为若干性质不同而又联系的几个部分。
统计分组是在总体内部进行的一种定性分类。
①对总体而言是“分”,即将总体区分为性质相异的若干组成部分。
②对个体而言是“合”,即将性质相同的个体组合起来。
(统计分组的关键是分组标志的选择)二、统计分组的种类1、按统计分组任务和作用不同分:类型分组:划分社会经济类型;结构分组:研究同类总体的结构;分析分组:分析被研究现象总体诸标志之间的联系和依存关系。
类型分组、结构分组:现象总体按品质标志分组,多属类型分组(例如工业生产按经济类型分-----国有、私营、集体);现象总体按数量标志分组,多属结构分组(例如企业按职工人数分------1000人以下、1000-5000人、5000人以上)。
第三章统计整理
统计整理
第一节 统计整理的意义和步骤
第二节 统计分组
第三节 分配数列 第四节 统计表和统计图
本章的教学目的、要求及内容
一般了解统计整理的概念和内容、统计分组、分配 数列及统计表等概念和内容。
重点与难点:重点掌握统计分组的方法,在分组的 基础上进行次数分配数列的编制,并学会用统计表 来表示统计资料。
预处理
分组汇总
编制表图
数据的预处理
数据的预处理,主要包括三个方面: 1. 数据的审核 2. 数据的筛选 3. 数据的排序
统计数据资料整理的内容
统计整理的步骤:
(1)拟定统计整理方案 (2)审查原始资料 (3)对各项原始资料分组、汇总,计算总体总量指标 (4)将汇总的结果,以统计表或统计图的形式表现出 来 (5)将统计资料进行系统积累
统计分组的作用 3、揭示现象的内部结构
现象的内部结构是表明现象本质特点的一个重要方面,将同 一总体不同时期的结构联系起来,还可以看到现象的发展趋 势和规律。 “九五”期间我国国内生产总值构成(%)
年
份
1996
20.4
1997 1998
19.1 18.6
1999
17.6
2000
15.9
第一产业
第二产业
分配数列表
频数
分布数列的种类
分布数列以分组标志特征不同可以 分为: 品质数列
Байду номын сангаас
变量数列
品质数列
品质数列:按品质标志分配而形成的数列叫属性 分配数列,简称品质数列。用来观察总体单位中 不同属性的单位分布情况。
例 某班学生的性别构成情况
按性别分 组 男 女 合计
绝对数人 比重(%) 数 30 75 10 40 25 100
第三章 统计整理
开口组组中值的确定
缺下限开中组组中值=上限-邻组组距/2 缺下限开中组组中值=上限-邻组组距/2 缺上限开中组组中值=下限+邻组组距/2 缺上限开中组组中值=下限+邻组组距/2
19:18:05
31
把资料中各数值归到应属的组内
按照各个总体单位的具体标志值, 按照各个总体单位的具体标志值 , 将其划归某一 具体组之中, 在归类汇总时 , 要遵循 “ 具体组之中 , 在归类汇总时, 要遵循“ 不重复不 遗漏”的基本原则。 遗漏”的基本原则。 对于单项数列和不重叠设置的离散型组距数列来 说,上述原则容易做到。 上述原则容易做到。 对于重叠设置的连续型组距数列来说, 对于重叠设置的连续型组距数列来说 , 应处理好 恰好是组限的标志值的总体单位之归类问题, 恰好是组限的标志值的总体单位之归类问题 , 一 般应按“ 上组限不在内 ” 原则 , 般应按 “ 上组限不在内” 原则, 即本组下限的次 数属于本组, 本组上限的次数归于邻近的较大组 。 数属于本组 , 本组上限的次数归于邻近的较大组。
19:18:05
34
确定组数和组距
根据考试成绩性质的不同,在60分的基础上 根据考试成绩性质的不同,在60分的基础上 分为不及格、及格、中等、良好、优秀五 个类型。 令组距=10 令组距=10 则组数=43/10=4.3,因此组数取5 则组数=43/10=4.3,因此组数取5。
19:18:05
35
品质标志分组 数量标志分组
19:18:05
17
四、简单分组和复合分组
根据分组选择标志的多少不同,统计分组又可分 为: 简单分组
简单分组是指对统计总体仅按一个标志进行分组
第三章 统计整理
单项式分组:
工人平均日产量资料
工人平均日产量(件) 2 3 4 5 6 合计 工人数 绝对数 比重(%) 10 8.7 15 13.0 30 26.1 40 34.8 20 17.4 115 100.0 上一页 下一页
返回本节首页
组距式分组:
某工厂工人完成生产定额情况表 工人完成生产定额分组(%) 工人数 绝对数 比重(%) 80~90 30 16.7 90~100 40 22.2 100~110 60 33.3 110~120 30 16.7 120~130 20 11.1 合计 180 100.0
某班学生籍贯分布表 地区分 绝对数人数 安徽 30 非安徽 10 合计 40
比重(%) 75 25 100
第3章 统计整理
42
单项式数列:一个变量值代表一组。
工人生产情况表 产量(件) 工人数
第3章 统计整理 11
2、统计分组目的: 总体经过分组,能够突出组与组之间的 差异,抽象掉组内各单位之间的差异, 使数据变得条理化,便于进一步分析研 究。
上一页
下一页
返回本节首页
3、统计分组的原则
⑴穷尽性
就是使总体中的每一个单位都应有组可归, 或者说各分组的空间足以容纳总体所有的单位。 例如:从业人员按文化程度分组,分为小学 毕业、中学毕业(含中专)和大学毕业三组,那 么,文盲及识字不多的以及大学以上的学历者则 无组可归。如果将分组调整为:文盲及识字不多、 小学程度、中学程度、大学及大学以上,那么就 可以包括全部从业人员的各种不同层次的文化程 度,符合了分组的穷尽性原则。
位数。
频率(f/∑f):次数的相对数,各组次数占总
次数的比重。
上一页 下一页 返回本节首页
㈡统计分布(分配数列)的分类
第三章 统计整理
1.分组标志的选择原则 (1)应根据研究的目的与任务选择分组标志。 例如,同一个工人总体,有多种不同分组方法: ①如果研究学历对收入的影响时,应选择“文 化程度”作为分组标志。 ②如果研究资历对收入的影响时,则应选择 “工龄”作为分组标志。
(2)要选择能够反映事物本质或主要特征的标志。 例如,研究职工生活水平的高低情况时,可 以用“职工的工资水平”作为分组标志,也可以 用“职工家庭成员平均收入水平”作为分组标志。 应该选择后者作为分组标志。 (3)要根据现象的历史条件变化来选择分组标志。 例如,前面讲到研究职工生活水平问题,如 果要列出“职工生活贫困户”一组,则“贫困户” 的标准就随历史条件变化而变化,而且不同地区 标准也不相同。
第三节,变量数列(分配数列)
一、分配数列(次数分布)的概念
在统计分组的基础上,将总体中所有单位按组 归类整理,并按一定的顺序排列,形成总体中各单 位数在各组间的分布称为次数分布,又称分布数列 分布在各组的个体单位数叫次数,又称频数 (fi)。各组次数与总次数(Σfi)之比称为比 率,又称频率。 分配数列(次数分布)有两个构成要素:一 个是分组,另一个是次数。 统计分布的实质:把总体的全部单位按某标 志所分的组进行分配所形成的数列。
第二节 统计分组
一、统计分组的意义: • 统计分组的含义:是根据统计研究任务的 要求和现象总体的内在特点,把统计总体 按照某一标志划分为若干性质不同而又联 系的几个部分(或组)的一种统计方法。 统计分组的关键是分组标志的选择和 划分各组界限。而核心问题是正确地选择 分组标志。 (下)
• 在一个总体中,单位的品质标志或数量标志, 其标志表现可能是互不相同的,总体内部各 个单位间存在许多的变异标志又是人们把总 体进一步分为性质不同的几个部分的客观依 据。 • 统计分组是在总体内部进行的一种分类。兼 有“分”和“合”的双重含义:对总体而言 是“分”(分为范围更小的总体),而对总 体单位而言是“合”(合为性质相同的组); 对分组标志而言是“分”(按分组标志划分 总体成为标志表现不同的许多组),而对其 它标志来说又是“合”(其它标志表现的差 异消失了)。
第三章统计整理
例:我国第五次人口普查我国大陆人口年龄分布:
人口按年龄分组 14岁以下
15 —— 64 65岁以上 合计
人口数(亿人) 2.8979 8.8793 0.8811 12.6583
比率(%) 22.89 70.15 6.96
100.00
2、构成:
由两部分构成:(1)各组 (2)各组次数(或频率)
3、种类:根据分组标志的不同可分为:
第三章 统计整理
学习目的:通过本章的学习,使学生掌握统计资料整理 的程序、统计分组的方法以及分布数列的编制、统 计汇总的组织形式和技术方法,以及设计和编制统 计表。 第一节 统计整理概述 第二节 统计分组 第三节 分布数列 第四节 统计汇总 第五节 统计表
第一节 统计整理概述
一、概念
原始统计资料
综合统计资料
(1)周延性:即不能遗漏(又称穷举原则) (2)互斥性:即不能重复(又称互斥原则)
即:要求保持组内资料同质性和组间资料的差异性
二、统计分组的作用
1、区分社会经济现象的类型 2、研究总体的内部结构 3、研究现象之间的依存关系
三、分组标志(分组标准)
1、概念:即分组的依据 2、选择: (1)根据统计研究的目的选择 (2)选择具有本质性的重要标志 (3)结合现象所处的具体条件
200
1.000
100.0
1、条形图
其他广告 2
广 招生招聘广告 告 房地产广告 类 型 金融广告
10 16
9
服务广告
51
商品广告
某0城市居民关注不同类4型0 广告的人数分布图 80
112
人数(人)
2、圆形图(饼形图)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
下限,上限:组距式分组的每一组变量值中,其
最小值为下限,最大值为上限。
组距:上下限之间的距离。 组限:相邻两组的界限。
“上限不在内”原则:统计上规定,凡是总体某
一个单位的变量值是相邻两组的界限值,这一个单 位归入作为下限值的那一组内。
2)间断组距式分组和连续组距式分组
间断组距式分组:组限不相连的组距式分组。 连续组距式分组:组限相连的组距式分组。 离散型变量,可间断组距式分组,也可连续组距 式分组。 连续型变量,只能采用连续组距式分组。
对于连续变量,相邻组组限必须重叠; 符合“上组限不计入”原则; 首末两组可使用“××以下”及“××以上” 的开口组。
编制异距数列
编制步骤:
⒈确定标准组距 标准组距=数列中最小组组距 2.确定标准组距次数 或者直接计算次数密度或频率密度
频数密度=频数/组距 频率密度=频率/组距
工人按年龄分 组 15~20 20~25 25~30 30~35 35~45 45~50
组距=本组上限-前组上(通用公式)
2)组中值:
上下限之间的中点数值,组中值的计算公式:
组中值
上限 下限 2
年龄分组:17-20,20-22
上组限U
某地区100个百货商店 月销售额与流通费用情况
每百元商品销售额 组距 d=U-L 商店数 销售额(万元) 中支付的流通费 =100-50=50 (万元) (个) 50以下 50~100 100~200 200~300 300以上 10 20 30 25 15
3、组距数列的编制
1、变(数)量分组
• 1)单项式分组和组距式分组
• 2)间断组距式分组和连续组距式分组 • 3)等距分组和异距分组
1)单项式分组与组距式分组
单项式分组:用一个变量值作为一组,形成单项式变量数 列。
单项式分组一般适用于离散型变量且变量变动范围不大的 场合。 组距式分组:将变量依次划分为几段区间,一段区间表现 为“从……到……”,把一段区间内的所有变量值归为一组, 形成组距式变量数列。 组距式分组适用于连续型变量或者变动范围较大的离散型 变量。
?
三、统计分组的种类
根据分组标志的性质不同:
1、品质分组 2、数量分组:单项式和组距式 根据分组标志的个数不同: 1.简单分组:即只按一个标志进行的分组。 2. 复合分组:按两个或两个以上标志进行 重叠分组。
分组体系
指同时使用两个以上标志分组 时,分组标志的组合形式。 各分组标志并列使用 各分组标志交叉结合使用
平行分组体系 交叉分组体系
平行分组体系
按性别分类
对教师 的分类
男性 女性
高级
共计 7 组 按职称分类 中级 2+3+2 初级
按年龄分类
青年
中年
交叉分组体系
按性别 分类
对教师 的分类
共计12组 男 2× 3× 2
女
按职称 分类 按年龄 分类
高级
中级 初级
青年 中年
四、变量分组
1、变(数)量分组
2、相关指标的计算
R R m (当 d d R R m 1 (当 d d
的结果为整数时) 的结果为小数时)
上例中,取d=5,则有
R 27 m 1 1 6(组) d 5
编制等距数列
⒊确定组限
组限的表示方法
对于离散变量,相邻组组限可以间断,也可 重叠;
统计表的编制规则
标题设计:总标题、横行标题和纵栏标题应简明扼要。 表格长与宽比例适当 表的上、下端用粗线或双线封口,左右两端一般不封口; 纵列合计在最后一行,横行合计可列在最前一栏或最后一栏 计量单位:全表只有一种计量单位则放在表达右上方,若各栏 的指标数值 的计量单位不同可在纵栏标题中注明;或横栏标题 后添一列计量单位。 可在各列的文字标题下面设置栏数编号加以标识,主词栏用“甲、 乙、丙”;宾词栏用“(1)、(2)、(3)……”等序号。 (如p205,209) ; 数据栏不能有空白,数字小忽略用“0”,缺少数字用“…”;
2.0 7.4 12.6 15.0 18.2 3.5 8.3 12.8 15.5 18.7 4.0 8.5 13.2 15.6 19.3 4.5 9.5 13.4 15.7 20.0 5.0 10.0 13.6 16.0 21.0 5.8 10.5 13.9 16.3 22.0 6.0 11.4 14.2 16.7 23.0 6.4 11.9 14.5 17.1 25.0 6.8 12.0 14.7 17.3 26.0 7.0 12.4 14.8 17.5 29.0
统计分组的作用:
划分现象的类型 反映现象的内部结构和比例关系 揭示现象之间的相互依存关系
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
二、统计分组的程序与原则
选择分组 标志 确定分组 体系 总体单位 归类
科学性:
组间差异大, 组内差异小。
组中值=50-(100-50)/2 =25 (万元) 某地区 100个百货商店 月销售额与流通费用情况
销售额(万元)
50以下 50~100 100~200 200~300 300以上 商店数 (个) 10 20 30 25 15 每百元商品销售额 中支付的流通费 (元) 14.2 11.4 10.1 9.2 8.5
向 上 累 计 向 下 累 计 从变量值低的组开始,将各组频数(频
率)逐次向变量值高的组累计,说明某一
组上限以下各组的累计频数(频率)。 从变量值高的组开始,将各组频数(频 率)逐次向变量值低的组累计,说明某一
组下限以上各组的累计频数(频率)。
VAR00001 Valid Percent 1.2 2.4 2.4 4.8 1.2 2.4 2.4 14.5 8.4 9.6 4.8 3.6 9.6 6.0 3.6 8.4 1.2 6.0 2.4 3.6 1.2 100.0 Cum ulative Percent 1.2 3.6 6.0 10.8 12.0 14.5 16.9 31.3 39.8 49.4 54.2 57.8 67.5 73.5 77.1 85.5 86.7 92.8 95.2 98.8 100.0
完备性和互斥性:
每个单位均能且 只能归到某个组 中。
二、统计分组的程序与原则 对父母亲下岗情 对大学生月生活 况进行分组研究: 费支出情况进行 单亲下岗; 分组研究: 双亲下岗; 按家庭收入水平 双亲在岗。 分组;
按城乡分组; 按性别分组; 按年龄分组。?
不符合科学性 城乡区别
离退休 是否健在 不符合完备性和互斥性
男
1 6 10 11
女
3 10 12 4
小计
4 16 22 15
技工
0 2 4 5
学徒工
4 14 18 10
600~700
700以上
10
5
8
4
2
1
10
5
8
5
2
0
合计
72
40
32
72
24
48
对宾词栏的简单设计
按级别分(人) 按月工资 分组 技工 学徒工 总 计 小计 男 女 小计 男 女
对宾词栏的复合设计
统计数据的管理:
数据的传输、贮存、更新及输出
统计整理的步骤 制定统计整理方案 对原始资料进行审核 资料的分组和汇总 制作统计图表 统计资料的积累和保管
第二节
统计分组
• 一、统计分组的概念和意义
• 二、统计分组的程序和原则 • 三、统计分组的种类
• 四、变量分组
一、统计分组的概念和意义
根据统计研究的目的和客观现象的内在 统计分组 特点,按某个标志(或几个标志)把被研 究的总体划分为若干个不同性质的组。
统计表的常用结构:
总 标 题 宾词栏 主词栏 注释 数据栏
统计表的加工方法
对主词栏加工 (对主体进行分组)
单式加工 复式加工
对宾词栏加工(选择指标及对指标进行分组)
简单设计 复合设计
按月工资分 组 300以下 300~400 400~500 500~600
按性别分(人)
按级别分
小计
4 16 22 15
组距
人数(人)
标准组距人数
次数密度
5 5 5 5 10 5
17 28 40 70 65 10
17 28 40 70 32.5 10
3.4 5.6 8 14 6.5 2
合计
——
230
——
——
第三节
统计图表
一、统计表 二、统计图
一、统计表
统计表
以纵横交叉的线条所形成的表格来表现 统计资料的形式
统计表有广义和狭义之分: 广义指统计工作阶段中的所有的一切表格。 狭义指整理后的结果表和分析表。 具有 容量 大、 方便 计算 等特 点
组中值=300+(300-200)/2 =350(万元)
3、组距数列的编制
• 1)等距数列的编制 • 2)异距数列的编制
等距数列编制
适用于总体单位的标志值变 动比较均匀的情况
己知某地区某年50个商店商品销售额的资料如下(单位: 百万元): 7.4 12.6 29.0 2.0 12.4 7.0 14.8 17.5 15.0 18.2 18.7 15.5 12.8 26.0 17.3 8.3 14.7 12.0 3.5 6.8 25.0 19.3 6.4 4.0 11.9 8.5 13.2 14.5 17.1 15.6 13.4 4.5 9.5 20.0 15.7 6.0 11.4 23.0 14.2 16.7 21.0 16.0 13.6 10.0 13.9 5.0 5.8 10.5 16.3 22.0 要求编制组距数列。