统计学数据的整理和展示
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分或组。
•
统计分组的两方面涵义:
•
对总体而言,是“分”,即将总体中的各个个体按照它
们的差异性区分为若干部分;
对个体(总体单位)而言,是“合”,即将性质相同的 个体组合起来。
• 即对总体实行异质分解,对总体单位实行同质组 合。即组内同质性,组间差异性
分组
25% 33%
分组前
分组后
42%
二、作用: (1)划分社会经济现象的类型
• ②离散型变量——相邻两组的上、下限间断, 且采用差数为“1”的形式。
——相邻两组的上、下限重叠。
• 下限,上限:组距式分组的每一组变量值中,其 最小值为下限,最大值为上限。
• 组限:相邻两组的界限。 • 间断组距式分组:组限不相连的组距式分组。
• 连续组距式分组:组限相连(或称相重叠的), 即以同一数值作为相邻两组的共同界限的组距式 分组。
• 三、统计整理的组织方式
1、逐级整理 2、集中整理 3、逐级整理与集中整理相结合
四、统计整理的方法
主要方法
分组
汇总
• 汇总 1. 手工汇总 2. 计算机汇总
统计表
统计图
第二节、统计分组
• 一、统计分组的概念
•
统计分组是根据统计研究的目的和研究对象的特点,将
统计总体各个单位按照一定的标志划分为若干性质不同的部
多的情况下,可采用组距分组。它将全部变量 值依次分为若干个区间,并将这个区间的变量 值作为一组。
• ①连续型变量——相邻两组的上、下限采用 同限,且遵循“下闭上开”(即上限不在内) 的原则。“上限在不内”原则:在连续组距式分组中,以同
一个数值作为相邻两组共同的界限,统计上规定,凡是总体某 一个单位的变量值是相邻两组的界限值,这一个单位归入作为 下限值的那一组内。
选择分组标志。
• (2)分组方法(统计分组的种类)
• 1)、按分组标志的性质不同,分为品质分组(或称 属性分组)和数量分组(或称变量分组)。
• 品质分组——按品质标志进行的分组。 • 数量分组——按数量标志进行的分组。
• 、按分组的作用和任务不同,分为类型分组、结构分 组和分析分组。
• 类型分组——将复杂现象分为若干性质不同部分 的分组。
按性别分组
人数(人) (频数)
比率(%) (频率)
男职工 女职工
253 115
68.75 31.25
合计
368
100.00
(2)按数量标志分组
变量分布数列的分类见P56图示
• 则应按照研究目的及研究对象的特点确定相应的组 数,划分相应的组限。
•
按数量标志分组即变量分组,有两种:
单项式分组 组距式分组
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济联营 经济;股份制经济;外商投资经济;港澳台投资 经济
(2)揭示社会经济现象的内部结构和比例关系
例:上海市按GDP计算的三次产业结构(%)
1980年 1990年 1996年 1997年
GDP 100 100 100 100
第三章 数据的整理和展示
统计调查
统计整理
统计分析
统计工作的三个中心阶段
• 第一节 统计数据的整理
一、数据整理的概念和作用
• 统计整理是指根据统计研究的目的,将 统计调查所得的原始资料(也称初级资料) 进行科学的分类和汇总;或对已经加工的综 合资料(也称次级资料)进行再加工,为统 计分析准备系统化的、条理化的综合资料的 工作过程。
个以上的标志进行层叠分组。(表3-5)
四、统计分类标准化和国民经济中常用的统计分组
第三节 次数分布
一、次数分布数列的概念和种类 1
在统计分组的基础上,将总体中的所有单 位按组归类整理,形成总体中各个单位数在各 组间的分布,叫做频(次)数分布,将各组组 别与次数依次编排而形成的数列叫做次数分布 数列,简称为分布数列。
三、统计分组的原则和方法
1、统计分组的原则
• (1) 科学性原则 • (2) 完整性原则(穷尽原则)——即应使总
体中的每一单位都应有组可归,或者说各分组 的空间足以容纳总体所有的单位。 • (3) 互斥原则(不相容性)——即总体中任 一单位只能归入某一组。
2、统计分组的方法
• 统计分组的关键在于正确选择分组标志。 (1)分组标志的选择——原则是: 1)从研究目的出发选择分组标志; 2)选择最能反映现象本质特征的分组标志; 3)根据事物所处的具体历史条件和经济条件
• 结构分组——表明总体结构的分组。 • 分析分组——分析现象间依存关系的分组。
• 2)、按采用分组标志多少不同的分组方法 • 简单分组——对总体各单位只采用一个标志进
行分组。 • 平行分组体系——对总体各单位同时采用两个
或两个以上的标志进行并列分组。 (表3-4) • 复合分组——对来自百度文库体各单位同时采用两个或两
第一产业 3.2
4.3 2.5 2.3
第二产业 75.7 63.8 54.5 52.2
第三产业 21.1 31.9 43.0 45.5
(3)研究现象之间的依存关系
例:某地农民家庭按收入分组的恩格尔系数
按收入分组(元) <200 <300 <400 <500 <600 <800 <1000 恩格尔系数(%) 64.9 60.2 56.7 54.4 50.5 49.9 43.6
• 统计整理是统计调查的继续、统计分析 的前提。
• 二、统计整理的步骤
(一)设计和编制统计资料的整理方案。 (二)对原始资料进行审核。 (三)用一定的组织形式和方法,对原始资料进 行排序、分组、汇总和计算。 (四 )对整理好的资料再一次进行审核,改正在 汇总过程中发生的各种差错。 (五)编制统计图表。 (六)统计数据的积累和保管。
次数分布(分布数列)
是一种重要的分组资料,反映总体单位在各组的 分布状态。 基本形式:
分组 单位数(频数) 频率
…
…
…
合计
100
次数分布 频率分布
一、次数分布数列的概念和种类 2、次数分布数列的种类
按分组标志特征的不同,分布数列可以分为两种: 品质分布数列与变量分布数列。 (1)品质分布数列
某厂职工人数统计表
•
单项式分组—— 单项式分组即将某一变量的
每一个变量值作为一组。组数及组限是明确的。 *
某厂职工家庭人口分组统计
按家庭人口分组 职工户数 (频数)
比率(%) (频率)
1
7
2.9
2
38
15.2
3
105
41.3
4
54
20.5
5
31
12.1
6
20
8.0
合计
255
100
*
• 组距式分组——在连续变量或变量值较