《统计数据的整理》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
800- 900 900-1000 1000-1100 1100-1200 1200-1300
合计
职工人数 (频数)
3 7 13 5 2 30
精选ppt
频率(%)
10.0 23.3 43.3 16.7 6.7 100.0
19
组中值
(闭口组)组中值=(上限+下限)/2 (连续式写法) (开口组)缺下限的开口组组中值=相邻组下限-邻组组距/2
4
二、统计分组的方法
定性数据的分组 定量数据的分组
精选ppt
5
(一)定性数据的分组:一个取值一个组 ——单项式分组
例
性别 男 女 合计
人数 30 20 50
精选ppt
6ห้องสมุดไป่ตู้
(二)定量数据的分组
1、按离散变量分组
(1)变量值取值不多时:一个取值一个组——单项式分组
年龄 18 19 20 合计
学生人数 5 15 20 40
合计
组距=本组上限-前组上限
或=本组下限-前组下限 或=本组上限-本组下限+1 (分组标志为离散变量)
按班级人数分组(人) 20以下 20-29
– 等距分组和异距分组
30-49
50及50以上
精选ppt
合计
组距 0.1 0.1 0.1
组距 10 20 -
12
等距分组:在组距式分组中,每个组的组距均相等。
精选ppt
3
一、统计分组的一般问题
概念:
– 统计分组是根据统计研究的目的和客观现象的内在特点,按某个标 志(或几个标志)把被研究的总体划分为若干个不同性质的组的统 计方法 。
原则:
– 穷尽原则、互斥原则
种类:
– 按分组标志的多少:简单分组、复合分组
– 按分组标志的性质:品质分组、数量分组
精选ppt
第三章 统计数据的整理和显示
第一节 数据的预处理 第二节 统计分组
第三节 统计图表
精选ppt
1
第一节 数据的预处理
数据的审核
一手数据:完整性审核、准确性审核 二手数据:适用性审核、时效性审核
数据的筛选 数据的排序
精选ppt
2
第二节 统计分组
统计分组的一般问题 统计分组的方法
– 定性数据的分组方法 – 定量数据的分组方法
– 一般在现象性质差异的变动比较均衡条件下使用。 –优点:易于掌握次数分布的特征;各组次数可以直接比较。
按身高分组(米)
1.50-1.60 1.60-1.70 1.70-1.80 合计
学生人数
10 11 9
30
精选ppt
13
异距分组:在组距式分组中,各组组距不尽相等。
– 一般在现象性质差异的变动非均衡的条件下使用。 – 优点:能够准确地描述偏态分布;能将性质相同的总体单位
精选ppt
15
四、例:某单位30名职工工资资料如下:
1060 840 1100 910 1090 910 1110 1070 990 940 1190 870 1050 950 1060 1180 970 1030 1060 850 1060 1010 1050 960 1050 1070 1210 1280 1110 1010
归为一组。 –缺点:由于各组的组距不同,各组次数直接比较是没有意义
的。
按班级人数分组(人)
20以下
20-29
30-49
50及50以上
合计
精选ppt
班级数 1 6 19 4 30
14
3、组数
– 原则:
要尽量能反映总体单位的分布情况及总体单位的集 中趋势。 要尽可能区分出组与组性质上的差异。
– 经验公式:m=1+3.3Lg N
身高(米) 1.50-1.60 1.60-1.70 1.70-1.80 合计
精选ppt
学生人数 10 11 9 30
9
统计分组的方法(总结)
定性数据的分组方法 —— 单项式分组 定量数据的分组方法
1、按离散变量分组
(1)变量值取值不多 —— 单项式分组 (2)变量值取值较多 —— 组距式分组
2、按连续变量分组 —— 组距式分组
缺上限的开口组组中值=本组下限+邻组组距/2
月工资(元)
800- 900 900-1000 1000-1100 1100-1200 1200-1300
合计
职工人数 比重(%)
3 7 13 5 2 30 精选ppt
10.0 23.3 43.3 16.7 6.7 100.0
组中值
850
950
1050
1150
整理以上资料,并对该单位职工工资分布情况
作初步分析。
精选ppt
16
数据整理的基本步骤:
1. 排序:840 850……1210 1280 2. 组数: m 1 3 .3 lN g 1 3 .3 l3 g 6 0 3. 组距:
假设采用等距闭口组,则
组距 Rxm ax xmi n13 8 00 0 1000
精选ppt
7
(二)定量数据的分组
1、按离散变量分组
(1)变量值取值不多 —— 单项式分组 (2)变量值取值较多时,一个区间一个组 —— 组距式分组
班级人数(人) 20以下 20-29 30-49
50及50以上 合计
精选ppt
班级数 1 6 19 4 30
8
(二)定量数据的分组
1、按离散变量分组:单项式分组或组距式分组 2、按连续变量分组:一个区间一个组——组距式分组
mm
5
最大值比真实值大一些;最小值比真实值小一些;
精选ppt
17
职工工资分布表
月工资(元)
800- 900 900-1000 1000-1100 1100-1200 1200-1300
合计
精选ppt
18
五、几个常用指标
频数/单位数/次数:数据落在区间的个数 频率:各组频数占总频数的比重
月工资(元)
精选ppt
10
三、组距式分组中的几个概念
1、组限
按班级人数分组(人)
– 区间两端的数值
下限:区间最小值
20以下
上限:区间最大值
20-29
– 开口组和闭口组
开口组:统计分组中缺上限 或缺下限的组
闭口组:统计分组中上、下 限均齐全的组
– 组限的写法:
间断式写法 连续式写法:“上限不在内”
30-39 40及40以上
1250
-
20
累计频数和累计频率:
– 向上累计:从低组(第一组)到高组(最后一组),依次累 计到每个组上限的总频数或总频率,表明各组上限以下的频 数或频率是多少。
合计
按身高分组(米) 1.50-1.60 1.60-1.70 1.70-1.80
精选ppt
合计
班级数
1 6 19 4
30
学生人数 10 11 9 30 11
2、组距:区间的距离
按身高分组(米)
➢ (连续式写法)
1.50-1.60
组距=上限—下限
1.60-1.70 1.70-1.80
➢ (间断式写法)
合计
职工人数 (频数)
3 7 13 5 2 30
精选ppt
频率(%)
10.0 23.3 43.3 16.7 6.7 100.0
19
组中值
(闭口组)组中值=(上限+下限)/2 (连续式写法) (开口组)缺下限的开口组组中值=相邻组下限-邻组组距/2
4
二、统计分组的方法
定性数据的分组 定量数据的分组
精选ppt
5
(一)定性数据的分组:一个取值一个组 ——单项式分组
例
性别 男 女 合计
人数 30 20 50
精选ppt
6ห้องสมุดไป่ตู้
(二)定量数据的分组
1、按离散变量分组
(1)变量值取值不多时:一个取值一个组——单项式分组
年龄 18 19 20 合计
学生人数 5 15 20 40
合计
组距=本组上限-前组上限
或=本组下限-前组下限 或=本组上限-本组下限+1 (分组标志为离散变量)
按班级人数分组(人) 20以下 20-29
– 等距分组和异距分组
30-49
50及50以上
精选ppt
合计
组距 0.1 0.1 0.1
组距 10 20 -
12
等距分组:在组距式分组中,每个组的组距均相等。
精选ppt
3
一、统计分组的一般问题
概念:
– 统计分组是根据统计研究的目的和客观现象的内在特点,按某个标 志(或几个标志)把被研究的总体划分为若干个不同性质的组的统 计方法 。
原则:
– 穷尽原则、互斥原则
种类:
– 按分组标志的多少:简单分组、复合分组
– 按分组标志的性质:品质分组、数量分组
精选ppt
第三章 统计数据的整理和显示
第一节 数据的预处理 第二节 统计分组
第三节 统计图表
精选ppt
1
第一节 数据的预处理
数据的审核
一手数据:完整性审核、准确性审核 二手数据:适用性审核、时效性审核
数据的筛选 数据的排序
精选ppt
2
第二节 统计分组
统计分组的一般问题 统计分组的方法
– 定性数据的分组方法 – 定量数据的分组方法
– 一般在现象性质差异的变动比较均衡条件下使用。 –优点:易于掌握次数分布的特征;各组次数可以直接比较。
按身高分组(米)
1.50-1.60 1.60-1.70 1.70-1.80 合计
学生人数
10 11 9
30
精选ppt
13
异距分组:在组距式分组中,各组组距不尽相等。
– 一般在现象性质差异的变动非均衡的条件下使用。 – 优点:能够准确地描述偏态分布;能将性质相同的总体单位
精选ppt
15
四、例:某单位30名职工工资资料如下:
1060 840 1100 910 1090 910 1110 1070 990 940 1190 870 1050 950 1060 1180 970 1030 1060 850 1060 1010 1050 960 1050 1070 1210 1280 1110 1010
归为一组。 –缺点:由于各组的组距不同,各组次数直接比较是没有意义
的。
按班级人数分组(人)
20以下
20-29
30-49
50及50以上
合计
精选ppt
班级数 1 6 19 4 30
14
3、组数
– 原则:
要尽量能反映总体单位的分布情况及总体单位的集 中趋势。 要尽可能区分出组与组性质上的差异。
– 经验公式:m=1+3.3Lg N
身高(米) 1.50-1.60 1.60-1.70 1.70-1.80 合计
精选ppt
学生人数 10 11 9 30
9
统计分组的方法(总结)
定性数据的分组方法 —— 单项式分组 定量数据的分组方法
1、按离散变量分组
(1)变量值取值不多 —— 单项式分组 (2)变量值取值较多 —— 组距式分组
2、按连续变量分组 —— 组距式分组
缺上限的开口组组中值=本组下限+邻组组距/2
月工资(元)
800- 900 900-1000 1000-1100 1100-1200 1200-1300
合计
职工人数 比重(%)
3 7 13 5 2 30 精选ppt
10.0 23.3 43.3 16.7 6.7 100.0
组中值
850
950
1050
1150
整理以上资料,并对该单位职工工资分布情况
作初步分析。
精选ppt
16
数据整理的基本步骤:
1. 排序:840 850……1210 1280 2. 组数: m 1 3 .3 lN g 1 3 .3 l3 g 6 0 3. 组距:
假设采用等距闭口组,则
组距 Rxm ax xmi n13 8 00 0 1000
精选ppt
7
(二)定量数据的分组
1、按离散变量分组
(1)变量值取值不多 —— 单项式分组 (2)变量值取值较多时,一个区间一个组 —— 组距式分组
班级人数(人) 20以下 20-29 30-49
50及50以上 合计
精选ppt
班级数 1 6 19 4 30
8
(二)定量数据的分组
1、按离散变量分组:单项式分组或组距式分组 2、按连续变量分组:一个区间一个组——组距式分组
mm
5
最大值比真实值大一些;最小值比真实值小一些;
精选ppt
17
职工工资分布表
月工资(元)
800- 900 900-1000 1000-1100 1100-1200 1200-1300
合计
精选ppt
18
五、几个常用指标
频数/单位数/次数:数据落在区间的个数 频率:各组频数占总频数的比重
月工资(元)
精选ppt
10
三、组距式分组中的几个概念
1、组限
按班级人数分组(人)
– 区间两端的数值
下限:区间最小值
20以下
上限:区间最大值
20-29
– 开口组和闭口组
开口组:统计分组中缺上限 或缺下限的组
闭口组:统计分组中上、下 限均齐全的组
– 组限的写法:
间断式写法 连续式写法:“上限不在内”
30-39 40及40以上
1250
-
20
累计频数和累计频率:
– 向上累计:从低组(第一组)到高组(最后一组),依次累 计到每个组上限的总频数或总频率,表明各组上限以下的频 数或频率是多少。
合计
按身高分组(米) 1.50-1.60 1.60-1.70 1.70-1.80
精选ppt
合计
班级数
1 6 19 4
30
学生人数 10 11 9 30 11
2、组距:区间的距离
按身高分组(米)
➢ (连续式写法)
1.50-1.60
组距=上限—下限
1.60-1.70 1.70-1.80
➢ (间断式写法)