数据整理统计数据的收集与整理PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
分配数列 将组别与次数按一定的顺序排列所 形成的数列。
次数 分布在各组的单位数叫次数,又称频数。
比率 率。
各组次数与总次数之比叫比率,又称频
.
10
某车间工人按日产量分组表
日产量(件) 工人数(人) 人数比重(%)
20 21 22 23 24 25 合计
组别
10 20 30 50 40 30 180
.
21
4.确定组限
1.组限最好用整数表示;
2.应使第一组下限不大于资料中的最小变量值, 最末组上限不小于资料中的最大变量值;
3.对于连续变量,应采用重叠组限,并且习惯上 按照“上限不在本组内”原则处理;而离散变量 变量两种方法都可以。
本 例 中 的 组 限 分 别 为 : 60 以 下 ,60~70 , 70~80,80~90,90以上.
60~70
7
17.50
70~80
12
30.00
80~90
15
37.50
90以上
4
10.00
合计
40
100.00
.
15
(二)分布数列的编制
组数 即分得的组的数目,K。
组限 确定每组距离的数值,分下限和上限。
下限 毎组起点数值。
上限 毎组终点数值 。
组距 即毎组的距离,i,等于上限与下限之差。
组中值 即各组中点的数值 。
.
2
数据整理的程序(课外)
(一)对调查资料的审核
审核的内容主要有资料的准确性、及 时性、完整性和适用性等几个方面。发现 问题,及时纠正。这是统计资料处理工作 中一个十分重要的问题,必须认真对待。
逻辑审查
计算审查
人机同审
.
3
(二)统计分组与汇总(前提和基础)
按照资料整理的要求进行分组汇总, 计算各组单位数和总体单位数,计算各组 指标和综合指标。
1、品质标志分组就是按事物的质量属 性分组。
2、数量标志分组就是按照事物的数量 特征分组
.
7
(二)简单分组与复合分组
统计分组按分组标志的多少可以分为 简单分组与符合分组
1、简单分组,就是对研究现象按一个 标志进行分组。
2、复合分组,就是按两个或两个以上 的标志对总体单位进行重叠分组。
.
8
某校教师按性别、职称复合分组表
第二章 统计数据的收 集与整理
第二节 统计数据整理
.
1
数据整理的含义
数据整理又称统计整理是指根据统计 研究的任务与要求,对搜集来的各种原始 资料进行科学的分类和汇总,为统计分析 提供系统化、条理化的综合资料的工作过 程。
统计资料整理在统计工作中处于中间阶段, 它是统计调查的继续,是统计分析的前提, 起着承前启后的作用。
开口组 上、下限只有一个的组。
闭口组 上限和下限都齐全的组。
.
16
组中值的计算
闭口组组中值=(上限+下限)/2 上限-邻组组距/2(只有上限)
开口组组中值= 下限+邻组组距/2(只有下限)
组距=上限-下限 全距=最大值-最小值
.
17
变量数列的编制例题
课本64页
6.某班45名学生“统计学”考试成绩从低 分到高分排列~~
等距数列
组距数列
按数量标志 分组两编个制的变量值确定一组。 分布在数变列量值较多,变动范
围较大的情况下采用。
异距数列
各组组距不等
.
12
某班学生按性别分组表
性别
人数
男
15
女
25
合计
40
人数比重(%)
37.5 62.5
100.0
.
13
某车间工人按日产量分组表
日产量(件) 工人数(人) 人数比重(%)
组别
人数(人)
比重(%)
男性
92
42.2
教授
4
1.8
副教授
18
8.3
讲师
40
18.3
助教
30
13.8
女性
126
57.8
教授
3
1.4
副教授
22
10.1
讲师
56
25.7
助教
45
20.6
合计
218 .
100.0 9
二、分布数列
在统计分组基础上,将总体中所有单位按组归类 整理,形成总体中各个单位数在各组间的分布, 叫做次数分布,又称分布数列。
2)变动均匀 等距数列
.
20
3.确定组距和组数
对组距和组数,不能机械地规定先确定什 么。从原则上讲,都应力求符合实际,能 够反映总体分布的特点。 斯透奇斯规则”(Sturges' rule):
K= 1 + 3.322 lgn=1+3.322*lg45=6.49 组数与组距(i)的关系是:
i=R/K=49/6.49≈7.55~~7或8 两者成反比变化 本例中采用组距为10,组数为5
对总体是“分” 两层含义
对个体是“合”
.
5
分组标志的选择
统计分组的关键在于正确选择分组标志, 这是统计分组的核心问题。 1.完备性——各组之和等于总体之和 2.互斥性——一个单位只能归到某一个组 3.分组标志的一致性
.
6
统计分组的种类(课外)
(一)品质标志分组和数量标志分组
按照分组标志的性质不同可分为品质标志 分组和数量标志分组
20 21 22 23 24 25
合计
组别
10 20 30 50 40 30
180
次数(频数)f i
.
5.56 11.11 16.67 27.77 22.22 16.67
100.00
fi
比率(频率)∑ f i 14
某班40名学生英语测验成绩分组表
成绩(分) 学生数(人)
比重(%)
60以下
2
5.00
次数(频数) f i
.
5.56 11.11 16.67 27.77 22.22 16.67
100.00
fi
比率(频率)∑ f i 11
(一)分布数列的种类
品质数列
一个变量值就代表一 组按。品在质变标量志值分不组多编且 变制化的幅分度布不数大列的情况
分
下采用。
布 数
单项式数列 各组组距相等
列 变量数列
.
18
1.将原始资料按其数值大小重新排列
找出最小值最大值计算全距 全距 R=99-50=49
.
19
2.确定变量数列的形式
1.编制单项式数列还是组距数列,取决于 所研究变量的类型和变量变动的幅度;
2.编制等距数列还是异距数列,主要取决 于现象的wenku.baidu.com点和研究目的。
3.案例中的数据特点:1)波动范围大,数 据多 组距数列;
(三)编制统计表或绘制统计图
统计汇总的结果一般通过统计表或统 计图的形式表现出来,以简明扼要、生动 形象地表达社会经济现象的数量表现和数 量关系。
.
4
一、统计分组的含义
统计分组是根据研究任务的需要和事物内 在的特点,将统计总体按照一定的标志划分为若 干组成部分的一种统计方法。
总体中的各单位在某一(些)方面是相同 的(即同质性),而在其他许多方面则是不同的 (即差异性),统计分组的目的是把不同性质的 单位分开,把性质相同的单位合在一起。因此, 统计分组同时具有两方面的含义: