数据整理与显示优秀课件

合集下载

第3章数据整理与显示ppt课件

三、平均每户就业人口数
行四、平均每人全部收入
标五、平均每人实际支出
题
＃消费性支出
非消费性支出
六、平均每人居住面积
户人人元元元元平方米
37890 3.19 1.83
5188.54 4945.87 4185.64
755.94 11.90
复合分组
分组体系
3 - 30
经济、管理类基础课程
统计学
简单分组
（举例）
表3-5 某城市居民关注广告类型的频数分布
广告类型人数(人) 比例频率(%)
商品广告
112 0.560 56.0
服务广告
51
0.255 25.5
金融广告
9
0.045 4.5
房地产广告
16
0.080
8.0
招生招聘广告 10
0.050
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
主要用于对定类数据和定序数据的审核
2. 计算检查
检查调查表中的各项数据在计算结果和计算方法上有无错误
主要用于对定距和定比数据的审核
3 - 12
经济、管理类基础课程
统计学
资料的审核
（汇总后的资料）
审核的方法
1. 复计审核
对每个指标数值进行复核计算

第3章统计数据的整理与显示.ppt

统计整理
将统计调查得到的原始资料进行科学的分类和汇总，使之成为系统化、条理化的综合资料，以反映研究总体特征的过程。
地位
是统计调查的继续，统计分析的前提和基础，起着承前启后的作用。
统计数据整理的一般程序数据的预处理数据的分组数据的汇总
分布数列（频数分布）
（一）数据的预处理
1. 数据的审核
0～15 15～65 65以上
合计
1953年
36.3 59.3 4.4
100
1964年
40.7 55.7 3.6
100
1982年
33.6 61.5 4.9
100
1990年
27.5 66.7 5.8
100
2000年
22.9 70.1 7.0
100
（3）分析现象之间的依存关系
中国农民家庭按收入分组的恩格尔系数
▪ 检查数据中的错误
2. 数据的排序
▪ 升序和降序 ▪ 寻找数据的基本特征
3. 数据的筛选
▪ 找出符合条件的数据
数据的审核
1. 完整性与及时性审核
– 检查应调查的单位或个体是否有遗漏 – 所有的调查项目或指标是否填写齐全 – 检查填报单位是否按时报送了有关数据
2. 准确性审核
– 检查数据是否真实反映客观实际情况，内容是否符合实际
– 检查数据是否有错误，计算是否正确等
• 审核数据准确性的常用方法
1. 逻辑检查
– 从定性角度，审核数据是否符合逻辑，内容是否合理，各项目或数字之间有无相互矛盾的现象
– 主要用于对分类和顺序数据的审核
2. 计算检查
– 检查调查表中的各项数据在计算结果和计算方法上有无错误

【统计学精品课件】第3章统计数据的整理与显示

• 按数量标志分组应注意如下两个问题：①分组时各组数量界限必须能反映事物质的差别。②应根据被研究的现象总体的数量特征，采用适当的分组形式，确定适当的组距、组限。
• 1．单项式分组与组距式分组
• 单项式分组就是用一个变量值作为一组，形成单项式变量数列。
• 单项式分组一般适用于离散型变量且变量变动范围不大的场合。
• 3．统计表的分类 • （1）按主词的结构分类，根据主词是否分组和分组的程度，分为简单表、分组表和复合表
• （2）按宾词的设计分类，可分为宾词简单排列、分组平行排列和分组层叠排列三种
• 3．统计表的设计 • （1）标题设计 • （2）线条的绘制 • （3）合计栏的设置 • （4）指标数值 • （5）计量单位 • （6）注解或资料来源
•
（3k-2）1 3.22lg N
•
d R xmax xmin
• （3-3）
k 1 3.22 lg N
• 式中：k为组数；N为总体单位数；d为组距；R为全距，即最大变量值xmax与最小变量值xmin之差。
• 上下限之间的中点数值称为组中值，组中值的计算公式
为： •
组中值上限+下限 2
• 当研究目的在于探讨总体在某一标志上的构成，而将总体划分为若干组成部分以显示所研究标志的结构时，这种分组称为结构分组。
• （3）可以揭示现象之间的依存关系
• 当研究目的在于探讨同一总体范围内两个可变标志的依存关系时，可以将其中一个可变标志（自变量）作为分组标志，以观察另一标志（因变量）相应的变动情况。这种分组称为分析分组，它可以揭示现象之间的依存关系。
• 按品质标志分组编制的分布数列叫做品质分布数列或属性分布数列，简称为品质数列。

统计数据的整理及其显示(ppt-107页)(共106张PPT)全篇

2、统计分组的原则
穷尽原则
互斥原则
注意：统计分组是对总体认识深化的手段，它是一切统计研究的基础，应用于统计工作的全过程，是统计研究的基本方法。
⑴ 类型分组
揭露社会经济现象的类型，反映各类型的特点。
例
单位：亿元
类型 1999年 2000年 2001年 2002年
农业 14 106.2 13 873.6 14 462.8 14 931.5
审核
对第二手数据：完整性：准确性：适用性：数据的来源、口径以及
有关背景资料；时效性：尽可能使用最新的数据。
（2）数据筛选
当数据中的错误不能予以纠正，或者有些数据不符合调查的要求而又无法弥补时，需要对数据进行筛选。
数据筛选的内容：
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除；
例如：企业按人数分组
499及以下
500 ～ 999
1000 ～ 2999 3000及以上
工人按工资分组
600 ～ 700 700 ～ 800 800 ～ 1200
1200 ～ 1500
适用条件：它适用于变量值变化范围较大、不同变量值个数
较多的离散型变量及连续型变量的场合。
注意：连续型变量的数值不能一一列举，故
例如：按以五分制计分的成绩对全班100名学生进行分组，宜单变量数列；按以百分制计分的成绩对全班100名学生进行分组，宜组距式数列；
1. 定类数据的排序
▪ 字母型数据，排序有升序降序之分，但习惯
上用升序
▪ 汉字型数据，可按汉字的首位拼音字母排列
，也可按笔画排序，其中也有笔画多少的升序降序之分
2. 定距和定比数据的排序
递递增增排排序序：后设可一表组示数为据：为X(1X)1<，X(X2)2<，……<X，(NX) N，递减排序可表示为：X(1)>X(2)>…>X(N)

调查数据的整理与显示PPT课件

• ①、将变量值的一个区间作为一组； • ②、适合于连续变量； • ③、适合于变量值较多的情况； • ④、必须遵循“不重不漏”的原则； • ⑤、可采用等距分组，也可采用不等距分组。
第18页/共48页
等距分组与异距分组
• 等距分组：标志值在各组保持相等的组距，即各组的标志值变动都限于相同的范围。一般用于标志值变动比较均匀的场合。
•
例：某企业职工工资的分组调查
月工资(分组)
1000 以下
1000～1500
1500～2000
2000～3000
3000～3500
3500～4000
4000 以上
合
计
人数(频数) 150 185 256 262 120 54 8
1035
第27页/共48页
比率(频率%) 14.5 17.9 24.7 25.3 11.6 5.2 0.8 100
组距数列中的几个基本概念
• ①、下限：一个组的最小值 • ②、上限：一个组的最大值 • ③、组距：上限与下限之差 • ④、组中值：下限与上限之间的中点值 • 组中值=（上限值+下限值）/2 • 下限开口组组中值=上限值-邻组组中值/2 • 上限开口组组中值=下限值+邻组组中值/2
第28页/共48页
合计
255
100
第20页/共48页
简单分组和复合分组
• 按分组标志的多少，可分为简单分组和复合分组。
• 简单分组：就是对研究现象按一个标志进行分组。 • 复合分组：用两个或两个以上标志分组，即先按一个标志分组，在此基础上再按第二个标志分小组，又再
层叠地按第三个标志分成更小的组，这称为复合分组。 (多个变量值）
• 分组的数量和组距应根据对象的特点和分析的需要决定。 • 第一，确定组数。斯特格斯(Sturges)经验公式：k=1+3.322lgN • 第二，确定组距。组距=（最大值-最小值）/组数 • 第三，确定组限。 • 一个组的最小值叫下限 • 一个组的最大值叫上限 • 分组过多则难以反映总体的数量分布特征； • 分组过少则会丢失许多重要的调查信息。 •

统计学-第3章-数据的整理与显示课件

汇源果汁
品牌
精选课件
17
购买饮料品牌饼图
汇源果汁 12%
露露 18%
可口可乐 30%
百事可乐 18%
不同品牌饮料的构成
旭日升冰茶 22%
精选课件
18
环形图
13%
7%
10% 8%
15% 21%
33% 36%
31%
26%
甲乙两城市家庭对住房状况的评价
精选课件
非常不满意不满意一般满意非出来，而不
符合特定条件的数据予以剔除
精选课件
5
数据排序 (data rank)
1. 按一定顺序将数据排列，以发现一些明显的特征或趋势，找到解决问题的线索
2. 排序有助于对数据检查纠错，以及为重新归类或分组等提供依据
3. 在某些场合，排序本身就是分析的目的之一 4. 排序可借助于计算机完成
1. 完整性审核
– 应调查的单位或个体是否有遗漏
– 所有的调查项目或变量是否填写齐全
2. 准确性审核
– 数据是否真实反映实际情况，内容是否符合实际
– 数据是否有错误，计算是否正确等
精选课件
3
数据的审核——二手数据 (second hand data)
1. 适用性审核 – 弄清楚数据的来源、数据的口径以及有关的背景材料 – 确定数据是否符合自己分析研究的需要
12
50次购买计算机的频数分布条形图
14
13
12
10
8
6
4
2
0 苹果机
12 康柏机
5 贝尔
9 盖特威
11 频数
IBM
精选课件
13
购买饮料品牌

模块三数据整理与图表显示ppt课件

模块三数据整理与图表显示
利用 “数据分析”对教育程度分组
模块三数据整理与图表显示
二、用图表显示员工的教育构成
利用 “图表向导”绘制图形的步骤
模块三数据整理与图表显示
1. 条形图进入图表向导：在 “插入”菜单中选择 “图表”选项。步骤 1：在 “图表类型”中选择 “柱形图”；在 “子图表类型”中选择 “三维簇状柱形图”，如图所示，单击 “下一步”按钮。
模块三数据整理与图表显示
2. 顺序数据的图表显示分类数据适用的条形图、圆形图、环形图都适用于顺序数据，顺序数据还可以绘制累积频数 (或频率) 图。 (1) 环形图对比两个或多个研究对象的内部结构，可使用两个或多个圆套嵌的环形图。 (2) 累计频数 (或频率) 图
模块三数据整理与图表显示
设置百分比
模块三数据整理与图表显示
输出频数分布表：将频数分布表复制、粘贴到新工作表中，在 “选择性粘贴”中选择 “数值”选项。在频数分布表中填入相应的文字，得表。
按教育程度分组的频数分布
模块三数据整理与图表显示
2. 利用“数据分析”工具编制频数分布表步骤 1：在 “工具”菜单中选择 “数据分析”选项。步骤 2：在 “数据分析”对话框中选择 “直方图”，单击 “确定”按钮。步骤 3：在 “直方图”对话框中进行以下设置：在 “输入区域”框内输入数据所在单元格区域，这里输入 “B2：B46”；在 “接收区域”框内输入教育程度代码的输出区域，这里选定 “C2： C6”；在 “输出区域”框内输入任一单元格，这里选定 D1；选中 “图表输出”，单击 “确定”按钮，得下图。
模块三数据整理与图表显示
3. 箱线图箱线图由一个箱子、箱子中间的竖线、外延出来的两条线及最外端可能有的表示异常值的点组成。箱子的中间点表示该组数据的中位数，箱子两个端点分别代表了上四分位数 (即 75%的百分位数) 和下四分位数 (即 25%的百分位数)，外延线两个端点是最大值和最小值。箱子中间包含了总体 50%的数据。上四分位数和下四分位数之间的距离称为四分位差。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

分类数据的整理与图示
分类数据的整理
(基本过程)
1. 列出各类别
2. 计算各类别的频数 3. 制作频数分布表
4. 用图形显示数据
分类 A B C D E
频数
比例
百分比比率
☺☺☺ ☺☺
分类数据的整理
(可计算的统计量)
1. 频数(frequency) ：落在各类别中的数据个数 2. 比例(proportion) ：某一类别数据占全部数
步骤(自动筛选4)
在前10个数据中筛选出英语成绩为前三名的
步骤(高级筛选1)
筛选出4门课程成绩都大于70分的学生
步骤(高级筛选2)
步骤(高级筛选3)
数据排序
(data rank)
1. 按一定顺序将数据排列，以发现一些明显的特征或趋势，找到解决问题的线索
2. 排序有助于对数据检查纠错，以及为重新归类或分组等提供依据
2. 数据筛选的内容
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除
▪ 将符合某种特定条件的数据筛选出来，而不
符合特定条件的数据予以剔除
数据筛选
(data filter)
用Excel进行数据筛选
8名学生的考试成绩数据
步骤(自动筛选1)
步骤(自动筛选2)
步骤(自动筛选3)
结果：筛选出的统计学成绩为75分的数据
回答类别
户数百分比 (户) (%)
向上累积
户数百分比 (户) (%)
向下累积
户数百分比 (户) (%)
非常不满意 24
8
24
8.0 300 100.0
不满意
108 36 132 44.0 276 92
一般
93 31 225 75.0 168 56
满意
45 15 270 90.0 75 25
非常满意 30 10 300 100.0 30 10
☺ ☺☺
☺☺☺
顺序数据的频数分布表
(例题分析)
【例】在一项城市住房问题的研究中，研究人员在甲乙两个城市各抽样调查300户，其中的一个问题是：“您对您家庭目前的住房状况是否满意？
1．非常不满意；2．不满意；3．一般；4．满意；5．非常满意。
甲城市家庭对住房状况评价的频数分布
甲城市
3. 在某些场合，排序本身就是分析的目的之一
4. 排序可借助于计算机完成
数据排序
(方法)
1. 分类数据的排序
▪ 字母型数据，排序有升序降序之分，但习惯上
用升序
▪ 汉字型数据，可按汉字的首位拼音字母排列，
也可按笔画排序，其中也有笔画多少的升序降序之分
2. 数值型数据的排序
递排序增后排可序表：示设为一：组x数(1)据<x为(2)<x…1，<xx2(n，) …，xn，递增递减排序：可表示为：x(1)>x(2)>…>x(n)
☺
☺
3. 适合于变量值较少的情况
☺
例子
单变量值数据排序
单变量值分组频数分布表
组距分组
(要点)
1. 将变量值的一个区间作为一组 2. 适合于连续变量
☺~ ☺
3. 适合于变量值较多的情况
☺~ ☺
4. 需要遵循“不重不漏”的原则 ☺ ~ ☺
5. 可采用等距分组，也可采用不 ☺ ~ ☺
等距分组
☺~ ☺
93.0
一般
78 26.0 198
66.0 180 60.0
满意
64 21.3 262
87.3 102
34.0
非常满意
38 12.7 300 100.0
38
12.7
合计
300 100.0 —
—
—
—
数据分组
数据分组的作用
▪ 区分事物的性质
例：将我国企业进行分组，就可以有效地区分它们在所有制方面的区别
数据整理与显示
第 3 章数据整理与显示
3.1 数据的整理 3.2 数据的显示 3.3 Excel的应用
学习目标
1. 了解数据预处理的内容和目的 2. 掌握分类和顺序数据的整理与显示方法 3. 掌握数值型数据的整理与显示方法 4. 会用Excel制作各种统计图和统计表 5. 合理使用统计表
3.1 数据的整理
▪ 数据整理的步骤 ▪ 数据筛选与排序 ▪ 数据整理过程
数据整理的步骤
▪ 设计数据整理方案 ▪ 对统计资料进行审核、筛
选与排序 ▪ 分组或分类、计算和汇总
▪ 编制统计表、绘制统计图
数据筛选与排序
数据筛选
(data filter)
1. 当数据中的错误不能予以纠正，或者有些数据不符合调查的要求而又无法弥补时，需要对数据进行筛选
例子
例子
例子
按行排序
数据整理过程
数据的整理
(基本问题)
1. 要弄清所面对的数据类型，因为不同类型的数据，所采取的处理方式和方法是不同的
2. 对分类数据和顺序数据主要是作分类整理 3. 对数值型数据则主要是作分组整理 4. 适合于低层次数据的整理和显示方法也适合
于高层次的数据；但适合于高层次数据的整理和显示方法并不适合于低层次的数据
组距分组
(步骤)
1. 确定组数：组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时，可以按 Sturges 提出的经验公式来确定组数K
K 1 lg n 1 3.3lg N lg 2
2. 确定组距：组距(Class Width)是一个组的上限与下限之差，可根据全部数据的最大值和最小值及所分的组数来确定，即
▪ 研究统计总体的类型和结构
例企业根据职工文化程度不同分组，以便根据不同文化层次分期分批培训
▪ 反映现象之间的依存关系
可以看出流通费用率与流转额之间存在着比较密切的相关关系
分组方法
分组方法
单变量值分组
组距分组等距分组异距分组
单变量值分组
(要点)
1. 将一个变量值作为一组
☺
2. 适合于离散变量
合计
300 100.0 —
—
—
—
顺序数据的频数分布表
(例题分析)
回答类别
乙城市家庭对住房状况评价的频数分布
乙城市
户数百分比 (户) (%)
向上累积
户数百分比
(户)
(%)
向下累积
户数百分比 (户) (%)
非常不满意 21
7.0
21
7.0 300 100.0
不满意
99 33.0 120
40.0 279
据的比值 3. 百分比(percentage) ：将对比的基数作为100
而计算的比值 4. 比率(r序数据的整理与图示
顺序数据的整理
(可计算的统计量)
1. 累积频数(cumulative frequencies)：各类别频数的逐级累加
2. 累积频率(cumulative percentages)：各类别频率(百分比)的逐级累加