统计学基础 3章--统计整理
统计学原理-统计整理
统计整理的意义
统计调查所搜集的反映个体量的原始资料是分散 的,不是集中的;是零碎的,不是系统的。根据这 些资料。人们难以从总体上分析和认识现象的数量 表现。
至于某些已经加工的综合资料,则往往由于资料在 分组方法、总体范围或指标涵义、口径、计算方法 等方面不同,而不能满足统计分析的要求,也必须 先通过统计整理,才能据以从总体上分析社会经济 现象的数量表现,
一、统计分组的意义和作用
统计分组的作用
⒈区分社会经济现象的类型-类型分组 ⒉研究现象的内部结构-结构分组 ⒊分析现象之间的依存关系-分析分组
某地区2008年底各类工业企业数 按所有制性质分组 企业数(个) 比重(%) 全民所有制企业 集体所有制企业 3204 1286 64.08 25.72
私营企业 中外合资企业 外商独资企业
二、统计分组的要求和方法
统计分组的方法
2、按品质标志和数量标志分组
经调查 ,某地年末货币流通量为 15.3亿元,比上年增加 4.5亿元。
按地区分组 甲县 乙县 丙县 丁县 合计 上期 36000 24000 28000 20000 108000 本期 52000 34000 41000 26000 153000 增减% 44.4 41.7 46.7 30.0 41.7
第三节 变量数列
一、变量数列的概念 分 类
品质标志数列
数量标志数列
连续型变量数列
离散型变量数列 单项数列 组距数列 等距数列 异距数列
按品质标志分组—品质数列,一般是单项式分组
某班学生的性别构成情况 按性别分组 男 女 合计 绝对数人数 30 10 40 比重(%) 75 25 100
某厂第二季度工人平均日产量 工人数 绝对数 比重(%) 10 15 30 40 20 115 8.7 13.0 26.1 34.8 17.4 100
统计学基础第三章统计整理
第三章统计整理【教学目的】1. 深刻理解统计分组的作用,并且能够对不同的社会经济现象进行统计分组2. 运用分配数列对原始数据进行系统整理3. 制作统计表,运用计算机绘制统计图【教学重点】1. 能够对不同的社会经济现象进行统计分组2. 运用分配数列对原始数据进行系统整理3. 制作统计表,运用计算机绘制统计图【教学难点】1. 运用分配数列对原始数据进行系统整理2. 制作统计表,运用计算机绘制统计图【教学时数】教学学时为8 课时【教学内容参考】第一节统计整理的意义一、统计整理的意义统计整理,就是根据统计研究的目的和任务的要求,对统计调查所搜集到的原始资料进行分组、汇总,使其条理化、系统化,从而得到表现总体特征的综合统计资料的工作过程。
对于已整理过的初级资料进行再整理,也属于统计整理。
统计调查取得的各种原始资料是分散的、不系统的,只能表明各个被调查单位的具体情况,反映事物的表面现象或一个侧面,不能说明事物的总体情况与全貌。
因此,只有对这些资料进行加工、整理,才能认识事物的总体及其内部联系。
例如,工业企业普查中,所调查的每个工业企业资料,只能说明每个工业企业的经济类型、注册资本、职工人数、工业总产值、工业增加值、实现利税等具体情况。
必须通过对所有资料进行分组、汇总等加工处理后,才能得到全国工业企业的综合情况,从而分析工业企业的构成、经营状况等,达到对全国工业企业的全面的、系统的认识。
统计整理是统计调查的继续,也是统计分析的前提,它在统计研究中起着承前启后的作用。
因此,资料整理得是否正确,直接决定着整个统计研究任务的完成,不恰当的加工整理,不完善的整理方法,往往使调查得来的丰富、完备的资料失去价值。
因此,必须十分重视统计整理工作。
二、统计整理的步骤统计整理的基本步骤是:(一)对原始资料进行审查。
1. 审查被调查单位的资料是否齐全;2. 应审查数据是否准确。
审查的办法主要有:①逻辑审查:主要是从定性角度审查数据是否符合逻辑,内容是否合理,各项目或数量之间有无相互矛盾的现象。
3第三章统计整理
(4)时效性审核 应尽可能使用最新的统计数据
(5)确认是否必要做进一步的加工整理
统计学
河南科技大学
第三章 统计整理
(二)差错的更正与处理
通过上述审核,如发现有缺报、缺份和缺项等情况, 应及时催报、补报;如有不正确之处,则应分别不同 情况作如下处理:
10. 爱尔兰 拥有大学学位人群所总人口占比例:37% 年增速 (2000-2010年): 7.3% (最高)
9. 澳大利亚 拥有大学学位人群所占总人口比例:38% 8. 芬兰 拥有大学学位人群所占总人口比例:38% 7. 英国 拥有大学学位人群所占总人口比例:38% 6. 韩国 拥有大学学位人群所占总人口比例:40%
统计学
第三章 统计整理
河南科技大学 历次人口普查中,每10万人中各种文化程度的人数
大专及以上 高中
初中
小学
1982 1990 2000 2010
615 1422 3611 8930
Hale Waihona Puke 6779 8039 11146 14032
17892 23344 33961 38788
35237 37057 35701 26779
统计学
河南科技大学
三、统计整理的程序
第三章 统计整理
统计资料的审核
资料的分组和汇总
编制统计表或绘制统计图
统计资料的积累、保管和公布
统计学
河南科技大学 数据审核
第三章 统计整理
统计工作的基本程序
收集 数据
真实 数据
虚假 数据
科学地计 算与分析
假数真算
统计学 第3章 统计数据的整理
统计分组的标志
第三章 统计数据的整理
统计分组的标志:分组标志就是将总体分为各个性质不同的标准或根据。
根
据分组标志的特征不同,总体可按属性标志分组,也可按数量标志分组。
1.按属性标志分组
以属性标志作为分组标志,并在属性标志的变异范围内划分各组界限,将总体 分为若干组。属性标志划分,概念明确,容易确定分组组数,如性别。
2.按数量标志分组
以数量标志作为分组标志,并在数量标志的变异范围内划分各组界限,将总体 分为若干组。如工资。
第三章 统计数据的整理
(五)简单分组和复合分组
在统计分组时,根据统计研究目的不同,分组标志的选择可以是一个标志,也可以是 两个或两个以上的标志,这样就有简单分组和复合分组之分:
1.简单分组 对总体只按一个标志分组称为简单分组。
第三章 统计数据的整理
数量次数分布的编制方法
在组距次数分布中,各组组距相同的次数分布称为等距次数分 布(表3-8)。各组组距不同的次数分布称为异距次数分布。
等距次数分布一般在现象性质差异变动比较均衡的条件下使用。
优点:
• 易于掌握次数分布的特性。
• 各组次数可以直接比较。
组数= 全距/组距
组距=全距/组数
100.00
提问:这是单 项次数分布还 是组距次数分 布?
第三章 统计数据的整理
数量次数分布的编制方法
例:对某工厂某月50名工人装配零件(件)情况进行调查, 得到下列初级资料:
106 81 98 111 91 107 86 105 93 106 82 108 114 122 109 104 125 103 113 102 106 84 128 104 91 112 85 96 115 89 97 105 92 111 107 97 105 124 106 86 96 110 112 103 108 110 109 125 101 119
第三章--统计整理-幻灯片(1)
如某班学生按年龄分组:17岁,18岁,19岁, 20岁, 21岁,22岁。
组距式分组
将作为分组依据的数量标志的整个取 值范围依次划分为若干个满足互斥性
和包容性的区间,用这些数值区间作
为组的名称。
某班学生统计 学原理成绩分 组
60分以下 60—70分 70—80分 80—90分 90分以上
组距式分组中的一些概念 《统计学原理》第三章 统计整理
对教师 的分类
按性别分类
男性 女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
复合分组体系
对教师 的分类
按性别 分类
按职称 分类
按年龄 分类
《统计学原理》第三章 统计整理
共计12组 男 2×3×2
女 高级
中级
初级 青年 中年
《统计学原理》第三章 统计整理
统计资料的再分组
• 统计资料的再分组就是把统计分 组资料按某种要求,重新划定各 组界限,再将资料中的单位数或 比重分布重新做出调整。
对总体单位而言,是“合”,即将性质相同的 个体组合起来,在同一组内则保持着相同的性 质。
分组
《统计学原理》第三章 统计整理
25%
33%
分组前
分组后
42%
作用:1·区分事物的性质
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
将统计调查得到的原始资料进行科
统计整理 学的分类和汇总,使之成为系统化、
条理化的综合资料,以反映研究总 体的特征。
地位 是统计调查的继续,统计分析的前提 和基础,起着承前启后的作用。
统计学第3章统计整理
14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。
例
月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2
例
产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)
统计学(第三章)
四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。
第三章统计整理
20.27%
68.70% 11.03%
16.60%
70.14% 13.26%
工厂按产量分组
Â Ý Ô · 1 2 3 4 5 6 Ï Æ º ¼
ú ¿ ¨Ô ² Á £ ª þ © ¼ £ x
2 3 4 3 4 5 21
¥ » É ± µ Î ³ ¾ ¨Ô £ y £ ª © 73 72 71 73 69 68 426
•向下累计是将各组频数和频率由变量值大的组 向变量值小的组累计(是各组下限以上的累计频 数或累计频率)
向下累计 生活费 250 275 300 325 350 375 合计 频数 10 8 12 9 5 6 50 累计频数 50 40 32 20 11 6 累计频率 100% 80% 64% 40% 22% 12%
2. 统计表的内容构成:主词部分和宾词部分。
注:统计表的构成和内容构成见表3-2
总标题
表3-2
按考试成绩分组 (分)
某班统计学原理考试成绩分布表
频数 组中值 学生数 (人) 比重 (%) 向上累计 学生数 (人) 比重 (%) 向下累计 学生数 (人) 比重 (%)
纵 栏 标 题
90以上 80-90 横 行 标 题 70-80 60-70 60以下 合计
大型企业 中型企业 小型企业 大型企业 中型企业 小型企业 重工业
轻工业
按分组标志的性质分
学生按性别分组
男 女
学生按民族分组
学生按考试成绩分组
90分以上 80-90 70-80 60-70 60 分以下 19岁及以下 20岁 21岁 22岁 23岁 24岁及以上
汉族 回族 苗族 土家族 羌族 壮族 . . .
《统计学》-第三章-统计整理
第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。
在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。
2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。
3、统计分组实质上是在统计总体内部进行的一种定性分类。
4、对原始资料审核的重点是真实性。
5、区分现象质的差别是统计分组的根本作用。
6、标志是统计分组的依据,是划分组别的标准。
7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组.8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组.9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。
10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。
11、按品质标志分组的结果,形成品质分布数列。
12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值.13、组距变量数列的组距大小与组数的多少成反比。
与全距的大小成正比。
14、组距变量数列的分布可以用次数分布曲线图表示。
15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。
16、统计资料的整理方法主要有统计分组和统计汇总两种。
17、钟形分布、U形分布和J形分布是次数分布的三种主要类型.18、统计分组体系有品质标志分组和数量标志分组两种.19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。
20、统计表从内容结构上看,是由主词和宾词两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C。
组内同质性,组间同质性 D。
组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组 B。
统计学原理第三章(统计资料整理)习题答案解析
第三章统计资料整理一.判断题部分1:对统计资料进行分组的目的就是为了区分各组单位之间质的不同。
(×)2:统计分组的关键问题是确定组距和组数。
(×)3:组中值是根据各组上限和下限计算的平均值,所以它代表了每一组的平均分配次数。
(×)3:分配数列的实质是把总体单位总量按照总体所分的组进行分配。
(∨)4:次数分配数列中的次数,也称为频数。
频数的大小反映了它所对应的标志值在总体中所起的作用程度。
(∨)5:某企业职工按文化程度分组形成的分配数列是一个单项式分配数列。
(×)6:连续型变量和离散型变量在进行组距式分组时,均可采用相邻组组距重叠的方法确定组限。
(∨)7:对资料进行组距式分组,是假定变量值在各组内部的分布是均匀的,所以这种分组会使资料的真实性受到损害。
(∨)8:任何一个分布都必须满足:各组的频率大于零,各组的频数总和等于1 或100%。
(×)9:按数量标志分组形成的分配数列和按品质标志分组形成的分配数列,都可称为次数分布。
( ∨ )10:按数量标志分组的目的,就是要区分各组在数量上的差异。
(×)11:统计分组以后,掩盖了各组内部各单位的差异,而突出了各组之间单位的差异。
(∨)12:分组以后,各组的频数越大,则组的标志值对于全体标志水平所起的作用也越大;而各组的频率越大,则组的标志值对全体标志水平所起的作用越小。
(×)二.单项选择题部分1:统计整理的关键在( B )。
A、对调查资料进行审核B、对调查资料进行统计分组C、对调查资料进行汇总D、编制统计表2:在组距分组时,对于连续型变量,相邻两组的组限( A )。
A、必须是重叠的B、必须是间断的C、可以是重叠的,也可以是间断的D、必须取整数3:下列分组中属于按品质标志分组的是( B )。
A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。
统计学第三章 统计数据的整理
汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
3管理统计学-统计整理
3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
12
135~139
4
8
合计
50
100
等距分组表
(使用开口组)
表3-7 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~114
5
10
115~119
8
16
120~124
——
第四节 统计表
统计表的作用
(1) (2)比用叙述的方式表现统计资料更简明易懂, (3)便于比较各项目之间的关系, (4)便于检查统计数字的完整性和正确性。
均能且只能归 到某个组中。
统计分组的方法
分组标志的选择
关键:服从研究任务需要,反映总体本质特征 (1)要根据研究目的选择
(2)要反映现象的本质特征 (3)要因时、因地制宜
统计 分组 方法
按品质标志分组
按数量标志分组 按主要标志和 辅助标志分组
统计分组体系
分组体系指同时使用两个以上 标志分组时,分组标志的组合形式。 具体形式有:平行分组体系和交叉 分组体系。
金牌数 占总数比例
5枚
5枚 4枚 4枚 3枚 3枚 2枚 1枚 1枚
频率 f /∑f
0.1786
0.1786 0.1429 0.1429 0.1071 0.1071 0.0714 0.0357 0.0357
变量数列的编制
频数分布表的编制步骤 (一)排序
第三章 统计学课件,统计整理2
编制结果如下:
日产量(件)X 工人数(人)
f
比重(%)
20 21 22 23 24 25 26
合计
3 5 6 4 3 2 1
24
12.5 20.8 25.0 16.7 12.5 8.3 4.2
100
(二)组距数列
指每个组的变量值用一个区间来表现的变量数列
编制条件:
变量是连续变量; 或:变异范围较大的离散变量。
12 10 8 6 4 2 0
00
10
20
30
40
90
50 15
10
~1
~1
~1
~1
0~
~1
0~
00
00
00
00
80
90
10
11
12
13
频数
14
00
00
以
上
0
0
0
0
0
0
(二)U形分布
25
0~
~3
~5
~6 51
4~
15
36
死亡率
60
以
其特征是“两头 大,中间小”, 即靠近中间的变 量值分布的次数 少,靠近两端的 变量值分布的次 数多。
组距数列编制 步骤或内容
原始数据 计算组中值
汇总组单位数
排序 确定组限
计算变异全距 确定组数、组距
制作组距数列统计表
1、组距和组数
在组距数列中是用变量变动的一定范围 代表一个组,每个组的最大值为组的上 限,最小值为组的下限,每个组上限和 下限之间的距离成为组距。
组数过多过少都不妥,一般情况下可分 为5-7组,组数尽可能取奇数,避免偶 数。
第三章统计整理
统计整理
第一节 统计整理的意义和步骤
第二节 统计分组
第三节 分配数列 第四节 统计表和统计图
本章的教学目的、要求及内容
一般了解统计整理的概念和内容、统计分组、分配 数列及统计表等概念和内容。
重点与难点:重点掌握统计分组的方法,在分组的 基础上进行次数分配数列的编制,并学会用统计表 来表示统计资料。
预处理
分组汇总
编制表图
数据的预处理
数据的预处理,主要包括三个方面: 1. 数据的审核 2. 数据的筛选 3. 数据的排序
统计数据资料整理的内容
统计整理的步骤:
(1)拟定统计整理方案 (2)审查原始资料 (3)对各项原始资料分组、汇总,计算总体总量指标 (4)将汇总的结果,以统计表或统计图的形式表现出 来 (5)将统计资料进行系统积累
统计分组的作用 3、揭示现象的内部结构
现象的内部结构是表明现象本质特点的一个重要方面,将同 一总体不同时期的结构联系起来,还可以看到现象的发展趋 势和规律。 “九五”期间我国国内生产总值构成(%)
年
份
1996
20.4
1997 1998
19.1 18.6
1999
17.6
2000
15.9
第一产业
第二产业
分配数列表
频数
分布数列的种类
分布数列以分组标志特征不同可以 分为: 品质数列
Байду номын сангаас
变量数列
品质数列
品质数列:按品质标志分配而形成的数列叫属性 分配数列,简称品质数列。用来观察总体单位中 不同属性的单位分布情况。
例 某班学生的性别构成情况
按性别分 组 男 女 合计
绝对数人 比重(%) 数 30 75 10 40 25 100
统计学(第3章)
4、定比尺度(比率尺度 ratio scale)
是对事物之间比值的一种测度,可用
于参数与非参数统计推断。 特征:
除区分事物的类别、进行排序、比较大 小,而且还可以进行加减乘除运算。 具有绝对零点,即“0”表示“没有” 或“不存在”。 所有统计量都可以对其进行分析。与定 距尺度的唯一区别是有绝对固定的零点。
第三章 统计数据的整理 10
3、观察数据和实验数据
观察数据:通过调查或观测而得 到的数据。 实验数据:通过控制实验对象而 收集的数据。
第三章 统计数据的整理
11
4、直接数据和间接数据
直接数据:即原始数据。
间接数据:已加工整理过的数据。
第三章 统计数据的整理
12
第二节 统计整理的含义和步骤
当异距分组时,各组的次数还受 到组距不同的影响。为消除异距 分组的这种影响,须计算频率密 度(或次数密度),计算公式: 频数密度 = 频数/组距 频率密度 = 频率/组距
第三章 统计数据的整理
36
二、分布数列的编制
将原始资料按其数值大小重新排列 2. 确定全距 3. 确定组距和组数 4. 确定组限 5. 编制变量数列 示例3-5
第三章 统计数据的整理
某地人口
21
(三)按分组标志的不同性质分
品质分组(属性分组):是将总体按
品质(或属性)标志进行分组。如企 业按经济成份、企业规模,职工按性 别、文化程度分组等。 数量分组(变量分组):是将总体按 数量标志进行分组,如企业按职工人 数、劳动生产率分组,职工按工龄、 工资分组等。
第三章 统计数据的整理 31
4、开口组的组距与组中值
统计学基础知识与统计实务第3章
(二) 复合分组和复合分组体系
对同一总体选择两个或两个以上标志重叠起来
进行分组称为复合分组,复合分组的结果形成复合分
组体系。
男 生 专科 女 生 文科 男 生 本科 女 生 男 生 专 科 女 生 大 学 生 理 科 男 生 本科 女 生 男 生 专科 女 生 工 科 男 生 本科 女 生
例:统计上海市工业企业的工业总产值 时间 地点(主管部门、地域) 范围 计算口径
计算方法
符号
(三) 对原始资料进行分组,编制分配数列 (四)编制统计表,画统计图 (五) 对统计资料进行系统积累
第二节 统计分组
一、统计分组的概念
根据统计的需要,按一定的标志将总体划分为若干
个组,使组与组之间有明显的差别,同组的单位具有相对 的同质性。 一定的标志——分组标志。
(一) 组距与组数的划分
注意:不同质的数量必须划分开来 组距与组数的关系: 组数↑ 组距↓
(二)等距数列和异距数列
等距数列——各组组距相等的数列 异距数列——各组组距不完全相等的数列
当变量值变动较均匀,编制等距数列可用下列公式:
组 距 ( i) = 全 距 ( R) 组 数 ( k)
(三)组限与组中值
组限——各组的上限或下限
原则:每个单位都能根据它的变量值分在各个组内,
并且只能分在一个组内。 ①连续变量——相邻两组组限重叠,“ 上限不在内”
棉 田按 亩产量 分组( 千克)
块 数 (块 ) 10 32 24 16 82
199 以 下 00 1 0 0 ~ 149 150 1 5 0 ~ 199 200 200 以 上 合计
统计学基础(第三章)
7.0 40.0 66.0 87.3 100.0 —
300 279 180 102 38 —
100.0 93.0 60.0 34.0 12.7 —
statistics
统计学——第三章数据整理与显示 数值数据(定距数据)的分组
单项分组:每一个组中只有一个变量值,适用于离散型变量 的数据、并且数据的范围不太大情况下的分组。 组距分组:每个分组是一个数值区间。它适用于连续型变量 或变动范围较大的离散型变量的数据分组。
statistics
统计学——第三章数据整理与显示
具体步骤:
(1)打开Excel工作表中“工具”下拉菜单中的“数据分析”选项。
(2)在“数据分析”对话框中选择“直方图”命令,并点击“确定”按钮。 (3)在该对话框中“输入区域”一栏填入数据区域B2:B41;在“接收区域” 一栏填入代码区域C2:C5;在“输出区域”一栏填入结果输出的区域;其他 选项根据需要选择。点击“确定”按钮,得结果。 (4)对输出结果进行还原并适当改造,即可得频数分布。
统计学——第三章数据整理与显示
第四节 统 计 图
statistics
统计学——第三章数据整理与显示
统计图的结构
标题 一般包括图表标题、数值轴(X,Y)标题 坐标轴和网格线 坐标轴和网格线构造了绘图区的骨架, 借助坐标轴和网格线,可以更容易读懂统计图。 图表区和绘图区 统计表的所有内容都在图表区内,包括 绘图区。统计图绘制在绘图区内。 图例 用来标明图表中的数据系列。
答:调查整理的结果为
甲城市 回答类别 非常不满意 不满意 一般 满意 非常满意 合计 户数/户 24 108 93 45 30 300 百分比/% 8 36 31 15 10 100 向上累积 24 132 225 270 300 — 8.0 44.0 75.0 90.0 100.0 — 向下累积 百分比/% 100 92 56 25 10 — 300 276 168 75 30 — 户数/户 百分比/% 户数/户
第三章 统计整理
1.分组标志的选择原则 (1)应根据研究的目的与任务选择分组标志。 例如,同一个工人总体,有多种不同分组方法: ①如果研究学历对收入的影响时,应选择“文 化程度”作为分组标志。 ②如果研究资历对收入的影响时,则应选择 “工龄”作为分组标志。
(2)要选择能够反映事物本质或主要特征的标志。 例如,研究职工生活水平的高低情况时,可 以用“职工的工资水平”作为分组标志,也可以 用“职工家庭成员平均收入水平”作为分组标志。 应该选择后者作为分组标志。 (3)要根据现象的历史条件变化来选择分组标志。 例如,前面讲到研究职工生活水平问题,如 果要列出“职工生活贫困户”一组,则“贫困户” 的标准就随历史条件变化而变化,而且不同地区 标准也不相同。
第三节,变量数列(分配数列)
一、分配数列(次数分布)的概念
在统计分组的基础上,将总体中所有单位按组 归类整理,并按一定的顺序排列,形成总体中各单 位数在各组间的分布称为次数分布,又称分布数列 分布在各组的个体单位数叫次数,又称频数 (fi)。各组次数与总次数(Σfi)之比称为比 率,又称频率。 分配数列(次数分布)有两个构成要素:一 个是分组,另一个是次数。 统计分布的实质:把总体的全部单位按某标 志所分的组进行分配所形成的数列。
第二节 统计分组
一、统计分组的意义: • 统计分组的含义:是根据统计研究任务的 要求和现象总体的内在特点,把统计总体 按照某一标志划分为若干性质不同而又联 系的几个部分(或组)的一种统计方法。 统计分组的关键是分组标志的选择和 划分各组界限。而核心问题是正确地选择 分组标志。 (下)
• 在一个总体中,单位的品质标志或数量标志, 其标志表现可能是互不相同的,总体内部各 个单位间存在许多的变异标志又是人们把总 体进一步分为性质不同的几个部分的客观依 据。 • 统计分组是在总体内部进行的一种分类。兼 有“分”和“合”的双重含义:对总体而言 是“分”(分为范围更小的总体),而对总 体单位而言是“合”(合为性质相同的组); 对分组标志而言是“分”(按分组标志划分 总体成为标志表现不同的许多组),而对其 它标志来说又是“合”(其它标志表现的差 异消失了)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(3)统计汇总 统计汇总是在统计分组的基础上,采用一 定的汇总手段,把符合各组情况的总体单位和 标志值归纳到各个组,并进一步计算出各组的 单位数和各组的标志总量的统计工作过程。
从组织形式上看统计汇总主要有以下三种:
• 逐级汇总
• 集中汇总
• 逐级汇总和集中汇总相结合
(4)编制统计表
统计表是用纵横交叉的线条绘制而 成的表格,是用来表现统计资料的一种 形式。 编制统计表就是把统计资料按一定 的顺序表现在表格中。 在统计工作中的各个阶段都会用到 统计表,这里所讲的编制统计表,主要 是指编制整理表。
1.分布数列的概念
分布数列是在统计分组的基础上, 把总体单位按组归并排列而形成的、反 映总体单位在各组分布状况的数列,也 叫做次数分布。 分布数列是统计资料整理结果的一 种重要表现形式,也是进行统计分析的 重要手段之一。
2.分布数列的构成要素
• 各组名称 • 各组单位数
(1)各组名称 在按品质标志分组的情况下, 各组的名称就是该品质标志的具体 表现。 在按数量标志分组的情况下, 各组的名称就是该数量标志的标志 值。
3.2 统计分组
• 统计分组的概念和作用 • 分组标志的选择 • 统计分组的种类 • 统计分组体系
1.统计分组的概念和作用
• 统计分组的概念
• 统计分组的作用
(1)统计分组的概念 统计分组是根据统计研究的目的和 总体的特点,采用某种标志,把总体划 分为性质不同又有联系的若干个组成部 分的一种统计研究方法。 统计分组具有两方面的含义,对总 体而言有“分”的含义,对总体单位而 言有“合”的含义。 统计分组的结果表现为同一组的总 体单位之间具有某种同质性,不同组的 总体单位之间具有某种差异性。
第二产业
第三产业 合计
21109
25717 77480
27.20
33.20 100.00
(2)变量分布数列 变量分布数列是在按数量标志分组的基础 上编制而成的数列,简称变量数列。例如,下 表中把商品流通企业按商品销售额分组编制而 成的数列就属于变量数列。 商品流通企业的商品销售额和流通费用率表
商品销售额(万元) 500以下 500—800 800—1100 企业数(家) 15 32 58 商品流通费用率(%) 13.80 11.50 9.80
如果以每一个变量值变动的区间为 一个组,这种分组被称为组距式分组。
在组距式分组中,根据各组组距是 否都相等,又可以分为等距分组和不等 距分组。
• 分组讨论
第二次全国农业普查主要数据公报 (第二号)显示,2006年末,全国农业从 业人员34874万人,其中,男性占46.8%, 女性占53.2%。按年龄分,20岁以下占 5.3%,21-30岁占14.9%,31-40岁占24.2%, 41-50岁占23.1%,51岁以上占32.5%;按 文化程度分,文盲占9.5%,小学占41.1%, 初中占45.1%,高中占4.1%,大专及以上 占0.2%。
• 统计图
目 录
3.1 3.2 3.3 3.4 3.5
统计整理的意义和步骤 统计分组 分布数列 统计表 统计图 本章小结 重点 难点
3.1 统计整理的意义和步骤
• 3.1.1 统计整理的意义
• 3.1.2 统计整理的步骤
3.1.1 统计整理的意义
• 统计整理的概念 • 统计整理的意义
3.1.2 统计整理的步骤
• 对调查资料进行审核 • 统计分组 • 统计汇总 • 编制统计表
(1)对调查资料进行审核 对调查资料的审核通常包括以 下几个方面: 完整性审核 准确性审核 及时性审核
1)完整性审核
对调查资料的完整性审核,主要是审 核应该调查的单位是否有遗漏,上报的调 查表的份数是否齐全,调查表中应该填写 的调查项目是否已经按规定填写完毕等。
• 问题
各细目的产量和小项目产量之 间、各小项目产量和全年粮食产量 之间存在什么关系?如果我们在审 核调查表时发现,全年粮食产量小 于其中的谷物产量,那么,这种差 错首先属于逻辑差错,还是计算差 错?对发现的此类问题应该怎样解 决?
(2)统计分组
统计分组是统计整理的主要方法, 也是统计整理的关键。统计调查所取得 的大量资料类型多样、错综复杂,只有 根据统计研究的任务和被研究现象的特 点把这些资料分组,才能区分社会经济 现象的类型,进而研究总体的内在结构 和各部分之间的数量关系。 统计分组的关键问题是选择分组标 志。
• 问题
以上资料中,对全国农业从业人 员采用了性别、年龄和文化程度三个 不同的标志进行分组,这样的分组属 于简单分组,还是属于复合分组?为 什么?其中,哪种分组属于品质标志 分组?哪种分组属于数量标志分组?
3.3 分布数列
• 分布数列的概念 • 分布数列的构成要素 • 分布数列的种类 • 变量数列的编制
(2)统计分组的作用
统计分组的根本作用在于将社会经 济现象总体按照统计分析的基本要求区 分为若干个性质不同的组成部分。在统 计研究中可以发挥以下主要作用:
• 区分社会经济现象的类型
• 研究总体的内在结构
• 研究社会经济现象之间的依存关系
பைடு நூலகம்
2.分组标志的选择 分组标志的选择是统计分组的关键。 分组标志是统计分组时区分组与组之间差 别的标准。在选择分组标志时,一定要遵 循以下原则:
2.统计表的结构
• 从形式上看,统计表由总标题、横行标 题、纵栏标题和指标数值四部分组成 • 从内容上看,统计表由主词和宾词两部 分组成 如下表所示:
变量分布数列
• 单项数列
• 组距数列
品质分布数列
(1)品质分布数列
品质分布数列是在按品质标志分组的基 础上编制而成的数列,简称品质数列。例如, 下表中把我国的就业人员按产业分组编制而 成的数列就属于品质数列。 2008年末我国就业人员按产业分组表
产业 第一产业 人数(万人) 30654 比重(%) 39.60
(2)各组单位数
各组单位数即各组的次数。次 数可以从绝对数上说明该组的名称 出现的频繁情况,又称为频数。 各组的单位数占总体单位总数 的比重称为频率。频率除了可以从 相对数上说明各组名称出现的频繁 情况以外,还可以说明总体的构成 情况。
在按数量标志分组的情况下, 各组的频数或频率可以说明该组的 变量值在总体标志总量中所起的作 用。频数或频率大的组,其变量值 在总体标志总量中所起的作用就越 大,反之就越小。
1100—1400 1400以上
29 11
8.20 7.50
4. 变量数列的编制
单项数列的编制
组距数列的编制
(1)单项数列的编制 单项数列是以每一个变量值为一个组编制 而成的数列。一般来说,在按离散型变量分组、 变量值的变动范围不大、变量值又不太多的情 况下,适合编制单项数列。
某村农户按拥有大型农用机械的数量分组表
• 根据研究目的选择分组标志
• 选择能反映事物本质特征的标志作为分组 标志 • 结合现象所处的历史条件和经济条件选择 分组标志
3.统计分组的种类
• 根据分组标志的多少,统计分组可 分为简单分组和复合分组 • 根据分组标志的特征,统计分组可
分为品质标志分组和数量标志分组
(1)简单分组和复合分组
简单分组是只按一个标志对总体进行 分组。简单分组的结果只能说明总体在某 一方面的构成情况,说明不同组的总体单 位之间在某一方面的差异情况。 复合分组是用两个或者两个以上的标 志对总体进行层叠式的分组。复合分组可 以深入细致地分析总体的构成情况和总体 的特征,通常在总体单位很多的情况下采 用。
编制组距数列的步骤
• 将原始资料按变量值的大小排序 • 确定组距数列的形式 • 确定组距和组数 • 确定组限
• 计算各组单位数,编制组距数列
3.4 统计表
• 统计表的概念和作用 • 统计表的结构 • 统计表的种类 • 宾词部分的指标配置
• 统计表的编制规则
1. 统计表的概念和作用
统计表是用纵横交叉的线条绘制的、用 来表现统计资料的一种表格。广义的统计表 泛指在统计工作中的各个阶段所使用的表格 , 本章所讲的统计表是指狭义的统计表,即用 以表现统计整理结果的整理表。 在统计表中可以系统而有条理地安排大 量的数字资料,彰显了紧凑、有力而突出地 表现数字资料的优点,使人们在阅读这些资 料时一目了然,并便于数字之间的对照和比 较。
(1)统计整理的概念
统计整理是根据统计研究的目的和 任务,对统计调查所搜集到的资料进行 科学分类和汇总,为统计分析提供系统 化、条理化的综合资料的工作过程。 统计整理主要是指对原始资料的整 理,但也包括对次级资料的再加工、再 整理。
(2)统计整理的意义
只有对调查资料进行科学的整理,才 能使统计在认识社会经济现象的过程中, 实现由个体到总体、由特殊到一般、由 感性认识到理性认识的转化,才能从整 体上反映社会经济现象的数量特征,否 则,即使统计调查取得的资料十分丰富 而准确,也往往会失去其使用价值,也 会使统计分析毫无意义。
如果发现调查单位有遗漏、上报的调 查表不齐全或者调查表中应该填写的项目 还没有填写,应该及时催报、补报。
2)准确性审核
准确性审核就是要审核调查资料是否 正确可靠。 基层单位主要审核原始记录和调查表 中的相关资料是否一致,综合单位主要审 核下属单位上报的资料是否正确。 准确性审核主要包括计算审核和逻辑 审核两个方面。
机械数(台) 0 1 2 3 4 合计 农户数(户) 4 31 120 39 6 200 比重(%) 2.00 15.50 60.00 19.50 3.00 100.00
(2)组距数列的编制 组距数列是以每一个变量值区间为 一个组编制而成的数列,或者说,是在 组距式分组的基础上编制而成的数列。 如以上讲到的、把商品流通企业按商品 销售额分组编制而成的数列就属于组距 数列数列。 编制组距数列需要明确以下概念: 全距、组限、组距、开口组、闭口 组和组中值