2-2 数据整理

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

工人数(人) f
3 5 6 4 3 2 1
24
(2)组距式分组:组距式分组是以变量值变动 的一定范围(区间)作为一组,区间的距离 就是组距。这样的分组所形成的分配数列叫 组距式变量数列,简称组距数列。
每一组变量值中,其最小值称为下限,最大 值称为上限。对于连续型变量或者变动范围 较大的离散型变量,适宜采用组距式分组。
闭口组
开口
“上限不在内”原则

重叠组限 值70归于 70—80组
组中值
80 70 75 2
组中值
60 10 55 2
第二章 统计资料的收集与整理
第一节
★ 第二节
第三节 第四节
统计资料的搜集 数据整理 频数分布 数据显示
第二节 数据整理
一、数据整理的内容与程序
数据整理
将统计调查得到的原始资料进行科学的 分类和汇总形成综合统计资料的工作过 程
地位
是统计调查的继续,统计分析的前提和 基础
统计数据的处理:

统计资料的分组、汇总及制表
不连续组距 式分组
①全距与组距 ②等距与异距
组距 =80-70=10
例:学生按成绩分组(分)
③组限与组中值
(1)50—60 60—70
(2)60以下 60—69
④开口组与闭口组 上限:80
70—80
70—79
⑤ 连续组距分组
下限:70
和不连续组距分组
80—90 90—100
80—89 90以上
重叠组限
其次,应根据被研究的现象总体的数量特征, 采用适当的分组形式。
1.单项式分组与组距式分组
(1)单项式分组:单项式分组是将一个变量 值(标志值)作为一组,这样的分组所形成 的分配数列叫单项式数列。
单项式分组一般适用于离散型变量且变量 变动范围不大的场合。
单项分组举例
编制条件:
变量是离散变量 变量的不同取值个数较少
【例】己知某车间有24名工人,他们的日产量(件) 分别是:20,23,20,24,23,21,22,25,26,20, 21,21,22,22,23,22,22,24,25,21,22,21, 24,23.要求根据以上资料编制变量数列。
编制结果如下:
日产量(件)X
20 21 22 23 24 25 26 合计
斯特杰斯经验公式:组数=1+3.3 Lg N 组距=全距/(1+3.3Lg N )
(3)组中值
组中值:各组中点位置所对应的变量值。计算公式
为:
组中值=
本组下限
本组上限
(适用所有闭口组)
2
或=
本组下限
本组组距 2
(适用上开口组)
或= 本组上限 本组组距(适用下开口组) 2
组距式分组的概念举例
连续组距式 分组
并列(平行)分组
按性别分类
男性 女性
对教师 的分类
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
复合(交叉)分组
共计12组
按性别 分类
男 2×3×2

对教师 按职称 的分类 分类
高级 中级
按年龄 分类
初级
青年 中年
按分组作用或任务不同 类型分组 结构分组 分析分组
1、统计分组的根本作用是将复杂的社会经济现象按 照统计认识的要求区分为各个性质不同的组成部分。
第一,标志值分布很不均匀的场合。
第二,标志值相等的量具有不同意义的场合。 第三,标志值按一定比例发展变化的场合。
(三)组距式分组中相关指标的计算
(1)组距 组距是各组上下限之间的距离,即各 组最大标志值与最小标志值之差。 上限:各组的最大标志值 下限:各组的最小标志值
(2)组数 全距是总体中最大的标志值与最小的标志值 之差。 组数的多少直接取决于两个因素,一个是总 体的全距,另一个是组距。 组数=全距/组距(等距分组条件下)
容 统计数据的管理:
数据的传输、贮存、更新及输出
数据整理的程序 统计资料的审核
统计资料的分组与汇总
制作统计表或统计图 统计资料的积累、保管和公布
二、统计分组
(一)统计分组的概念与种类
1.概念
根据统计研究的目的和客观现象的 内在特点,按某个标志(或几个标 志)把被研究的总体划分为若干个 不同性质的组,称为统计分组
离散型变量,可间断组距式分组,也可连续组距 式分组。连续型变量,只能采用连续组距式分组。
3.等距分组与异距分组
等距分组:就是标志值在各组保持相 等的组距,即各组的标志值变动都限 于相同的范围。凡是在标志值变动比 较均匀的情况下,都可采用等距分组。
异距分组:各组组距并不完全相等的分组, 在下列情况下,就必须考虑采用异距分组:
2.研究总体现象的内部结构。现象的内部结构是表 明现象本质特点的一个重要方面,例如,某年我国独立 核算工业企业净产值如下:
3、 分析总体现象之间的依存关系。通过分组将有相互 影响的现象联系起来进行研究,反映它们在数量上的变 动规律。例如:商品销售额与流通费用率的关系
按分组标志性质不同
品质分组 (属性分组)
对大学生月生活 对父母亲下岗情况进
费支出情况进行 行分组研究:
分组研究:
单亲下岗; 双
按家庭收入水平 亲下岗; 双亲在
分组;
ቤተ መጻሕፍቲ ባይዱ岗。
按城乡分组;
按性别分组; 按城乡区别?
按年龄分组。?
不符合科学性
不符合完备性和互斥性
3.统计分组的种类
按分组标志的多少
简单分组(一个标志)
多个标志
并列(平行)分组
复合(交叉)分组
数量分组 (变量分组)
(一)品质(属性)分组
1.对事物进行属性分组,其组数的多少首先取 决于事物本身的特点。
2.对于有些事物构成比较复杂,组数可多可少 的情况,就需要考虑统计研究任务的具体要 求
(二)数量(变量)分组
按数量标志分组,应注意如下两个问题:
首先,分组时各组数量界限的确定必须能反 映事物质的差别。
2.间断组距式分组和连续组距式分组 (1)间断组距式分组 :是指组限不相连的分组。
(2)连续组距式分组 :凡是组限相连(或重叠)的分 组,即以同一数值作为相邻两组的共同界限的分 组。统计上规定: “上限不在内”原则,凡是总体 某一个单位的变量值是相邻两组的界限值,这一 个单位归入作为下限值的那一组内。
分组的性质:兼有分和合双重含义。
总体经过分组,能够突出组与组之间的差异 而抽象掉组内各单位之间的差异,使数据变 得条理化,便于进一步分析研究。
2.统计分组的程序与原则
选择分 组标志
确定分 组体系
总体单 位归类
科学性:
组间差异 大,组内 差异小。
穷尽原则和 互斥原则:
每个单位均能 且只能归到某 个组中。
相关文档
最新文档