统计学第六版第3章数据的图表展示
统计学 第3章 数据的图表展示

22
Nankai University
例3.6 试根据某电脑公司20Байду номын сангаас5年前4个月每天的销售量数 据(单位:台),绘制直方图并分析。
23
Nankai University
线图
如果数值型数据是在不同时间上取得的,即时间序列数据 ,则可以绘制线图。线图(line plot)主要用于反映现象 随时间变化的特征。 绘制线图时,时间一般绘制在横轴,观测值绘制在纵轴, 一般应绘制成横轴略大于纵轴的长方形。图形过扁或过于 瘦高,不仅不美观,而且会给人造成视觉上的错觉,不便 于对数据变化的理解。一般情况下,纵轴数据下端应从 “0”开始,以便于比较。如果数据与“0”之间的间距过 大,可以采取折断的符号将纵轴折断。
Nankai University
第三章 数据的图表展示
1
Nankai University
示例:统计研究表明,多种原因会使寿命减少
文字描述 未结婚的男性会使寿命减少3500天,未结婚的女性 则减少1600天;吸烟的男性会使寿命减少2250天,女 性则减少800天;饮酒会使寿命减少130天;超重30% 会使寿命减少1300天,超重20%则减少900天;滥用 药物会使寿命减少90天……
17
Nankai University
3.数值型数据的整理与描述
箱线图 直方图 线图 散点图 气泡图 雷达图
18
Nankai University
箱线图
箱线图(box plot)是由一组数据的最大值、最小值、中 位数、两个四分位数这五个特征值绘制而成的,它主要用 于反映原始数据分布的特征,还可以进行多组数据分布特 征的比较。 箱线图的绘制方法:先找出一组数据的最大值、最小值、 中位数和两个四分位数;然后,连接两个四分位数画出箱 子;再将最大值和最小值与箱子相连接,中位数在箱子中 间。 对于多组数据,可以将各组数据的箱线图并列起来,从而 进行分布特征的比较。
统计学第6版第三章

《统计学第6版》练习题含答案第三章(数据的图表展示)1、落在某一特定类别或组中的数据个数称为( )。
A.频数B.频率C.频数分布表D.累积顿数2、一个样本或总体中各个部分的数据与全部数据之比称为( )。
A.频数B.顿率C.比例D.比率3、样本或总体中各不同类别数值之间的比值称为( )。
A.频数B.频率C.比例D.比率4、将比例乘以100得到的数值称为( )。
A.顿率B.百分数C.比例D.比率5、下面的哪一个图形最适合于描述结构性问题( )。
A.条形图B.饼图C.雷达图D.直方图.6、下面的哪一个图形适合于比较研究两个或多个样本或总体的结构性间题( )。
A.环形图B.饼图C.直方图D.蒸叶图7、将全部变量值依改划分为著干个区间,并将这一区间的变量值作为一组,这样的分组方法称为( )。
A.单变量值分组B.组距分组.C.等距分组D.连续分组8、组中值是( )。
A.一个组的上限与下限之差B一个组的上限与下限之间的中点值C.一个组的最小值D.一个组的最大值9、下面的图形中最适合描述一组数据分布的图形是( )。
A.条形图B.箱线图C直方图D.饼图10、对于大批量的数据,最适合描述其分布的图形是( )A.条形图B.茎叶图C.直方图D.饼图11、对于小批量的数据,最适合描述其分布的图形是( )。
A.条形图B.茎叶图C.直方图D.饼图12、对于时间序列数据,用于描述其变化趋势的图形通常是( )。
A.条形图B.直方图C.箱线图D.线图13为描述身高与体重之间是否有某种关系,适合采用的图形是( )。
A条形图B对比条形图C散点图D.箱线图14、气泡图主要用于描述( )。
A.两个变量之间的相关关系B.三个变量之间的相关关系C.两个变量的对比关系D.三个变量的对比关系15、为了研究多个不同变量在不同样本间的相似性,适合采用的图形是( )。
A.环形图B.茎叶图C.雷达图D.箱线图16、10家公司的月销售额数据(万元)分别为: 72、63、54、54、29、2、25、23、23、20。
贾俊平《统计学》章节题库(含考研真题)(数据的图表展示)【圣才出品】

1 / 33
圣才电子书 十万种考研考证电子书、题库视频学习平台
【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是 由数字组成的。ACD 三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。
8.对于 100 名学生某一门课程的成绩,若想得到四分之一分位数、中位数与四分之三 分位数,以下哪种描述统计的办法更有效?( )[中山大学 2012 研]
A.直方图 B.茎叶图 C.饼图 D.点图
4 / 33
圣才电子书
【答案】B
十万种考研考证电子书、题库视频学习平台
12.饼图的主要用途是( )。 A.反映一个样本或总体的结构 B.比较多个总体的构成 C.反映一组数据的分布 D.比较多个样本的相似性 【答案】A 【解析】饼图是用圆形及圆内扇形的角度来表示数值大小的图形。它主要用于表示一个 样本(或总体)中各组成部分的数据占全部数据的比例,对于研究结构性问题十分有用。
【解析】直方图、饼图描述的数值型数据是分组数据,而茎叶图描述的是未分组的数值
型数据,点图描述的是两个变量之间的关系。茎叶图保留了原始数据的信息,可以计算其分
位数。
9.某外商投资企业按工资水平分为四组:1000 元以下,1000~1500 元;1500~2000 元;2000 元以上。第一组和第四组的组中值分别为( )。[首经贸 2009 研]
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 3 章 数据的图表展示
一、单项选择题 1.对于大批量的数据,最适合描述其分布的图形是( )。[中国海洋大学 2018 研] A.条形图 B.茎叶图 C.直方图 D.饼图 【答案】C 【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。 条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形 的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占 全部数据的比例。
统计学(第六版)贾俊平课后习题答案

第一章导论1.1.1(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
1.3(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
统计学-第3章 数据的图表展示 学习指导

第3章(数据的图表展示)学习指导(一)数据的预处理数据预处理包括审核、筛选和排序。
1.对不同渠道取得的数据在审核内容和方法上有所不同。
直接调查取得的原始数据从完整性和准确性上去审核。
二手数据除审核其完整性和准确性外,还要审核其适用性和时效性。
2.数据的筛选包括两个方面:一是剔除错误数据;二是剔除不符合特定条件的数据。
3.数据排序是按一定的顺序将数据进行排列,以便发现数据的特征和趋势。
(二)品质数据的整理与显示品质数据的整理是对数据进行分类,计算出每一类别的频数、频率或比例、比率,并用图形进行显示。
(三)数值型数据的整理与显示品质数据的整理与显示方法都适用于数据型数据的整理与显示,但数据型数据还有一些特定的方法,而且这些方法不适用于品质数据。
(四)统计表统计表是用于显示统计数据的基本工具,由表头、行标题、列标题、数字资料以及表外附注组成。
概念练习一)单项选择题1、统计整理阶段最关键的问题是( )。
A、对调查资料的审核;B、统计分组;C、统计汇总;D、编制统计表。
2、统计分组的关键在于( )。
A、分组标志的正确选择;B、按品质标志分组;C、运用多个标志进行分组,形成一个分组体系;D、分组形式的选择。
3、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( )。
A、80-89%B、80%以下90-99%80.1-90%100-109%90.1-100%110%以上100.1-110%C、90%以下D、85%以下90-100%85-95%100-110%95-105%110%以上105-115%4、在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是( )。
A、将此值归人上限所在组;B、将此值归人下限所在组;C、将此值归人上限所在组或下限所在组均D、另行分组。
5、划分离散变量的组限时,相邻两组的组限( )。
A、必须是间断的;B、必须是重叠的;C、即可以是间断的,也可以是重叠的;D、应当是相近的。
统计学课件第3章 数据的图表展示

2
All rights reserved
南审理学院
图表的力量(续)
历史上著名的统计图表
拿破仑的大军团进军俄国
Minard绘制的地图,展现了1812年拿破仑的 大军团进军俄国的路线(上半部分)和撤退 时的气温变化(下半部分)。这一历史事件 中,法军数量的急剧减少以及恶劣的气候条 件一览无遗
法国科学家Étienne-Jules Marey称“该图所 展现出的雄辩对历史学家的笔是一种极大的 挑战”
6
All rights reserved
南审理学院
图表的力量(续)
南丁格尔的极坐标面积图:两幅图分别是1854年和1855年的 军队伤亡人数,一年12个月恰好可以将极坐标分为12等分, 每一瓣代表一个月。图中用颜色标记出了三种死亡原因。
7
All rights reserved
南审理学院
图表的力量(续)
3
All rights reserved
南审理学院
图表的力量(续)
4
All rights reserved
南审理学院
图表的力量(续)
这一史诗般的历史时刻被Charles Joseph Minard转换成了信息视觉化 的先驱作品。1861年,这位法国工程师出版了1812-1813征俄战役中法 国部队连续伤亡图解。这幅1861年出版的信息图,以拿破仑在1812征俄 战役中遭遇的灾难为主题。这幅图使用了好几种二维变量:线条的粗细 表示军队的强弱,数字指示关键转折点的军力。从左到右: ——图像顶端最粗的线条表示最初渡河的422,000人,他们一路深入到俄国 领土,在莫斯科停下来的时候还有100,000人左右。从右到左,他们朝 西走回头路,渡过Niemen河的时候,仅仅剩下10,000。随着大部队和 余部会师(比如在渡贝尔齐纳河之前),图中显示的数字降中也有升。 ——图的下半部分是从右往左看的。它用列氏度(将列氏度乘以1¼可以得到 相应的摄氏度,例如-30°R = −37.5 °C)显示了法国军队从俄国撤退 时的气温变化。从莫斯科的接近0°R(译注:原文此处未写明温度,该 数据由原图推断得出。)到这次灾难性冒险结束时的-30°R。 单纯的作图以非常形象的方式表示出了事件的规模以及在短短几个月里 法国军队每况愈下的过程。这幅地图很实在地告诉我们数据视觉化和图 象的交流的魅力:这幅地图通过各种不同的手段,仅仅用图像就描述出 征俄战役惨败的各项重要数据,以及这场灾难是如何发生的。信息设计 及稍后出现的数据视觉化的长处之一就是它能减少看懂一个特定事件的 来龙去脉所需要的时间,同时还能够更好地突出重点。
第3章 数据的图表展示

2 - 13
统计学
STATISTICS
等组距分组
(步骤)
1. 确定组数:组数的确定应以能够显示数
据的分布特征和规律为目的
2. 确定组距:组距(class width)是一个组的
上限与下限之差,可根据全部数据的最大 值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 3. 统计出各组的频数并整理成频数分布表
2 - 28
统计学
STATISTICS
统计表的设计
1.统计表的常用结构 2.设计统计表的一般规则
2 - 29
统计学
STATISTICS
本章小结
1.数据的预处理 2.品质数据的整理与展示 3.数值型数据的整理与展示 4.合理使用图表
2 - 30
统计学
STATISTICS
作业
1、P78-3.1 2、P79-3.3 3、P79-3.4 4、P82-3.12
2-4
统计学
STATISTICS
3.2 品质数据的整理与展示
统计学
STATISTICS
分类数据的整理与展示
一、图示用数据计算 1.频数:落在某一特定类别或组中的数据个数 2.频数分布:各个类别或组的频数汇总表 3.比例和百分比 4.比率:不同类别数值之间的比值
2-6
统计学
STATISTICS
分类数据的整理与展示
我一眼就看出 来了,周加工 零 件 在 100 ~ 110 之 间 的 人 数最多!
直方图的绘制
12
8
4
0 80 90 100 110 120 130
某车间工人周加工零件直方图 2 - 19
统计学
STATISTICS
《统计学》数据的表格与图形表示

第三章数据的表格与图形表示
重点:理解“分布”的概念,可通过两种途径来表示分布:表格与图形
1、组织数值数据:有序数组和茎叶图
有序数组(Ordered Array)
对数据进行排序归类
(可用EXCEL或其它计算机软件处理)
茎叶表示 (Stem-and-leaf display)
垂直线左边的数字称为“首数”或“茎”
垂直线右边的数字称为“尾数”或“叶”
选择多少作为茎? 应根据形状。
实例: 美国59个增长共同基金(Mutual funds) 表3.1(p.55)及图3.1
(p.56).
2、数值数据的表格
频数分布 (Frequency Distribution)(p.61,表3.2)
1) 组数 ( Number of Class)
一般规则:5到15组(取决于观察值的数量)
2)组距 ( Class Interval)
组距=全距/组数
(1)和(2)是相关的,关键要考虑分布的形状
3)组界 ( Boundary of Class)
不重复而包括全部数值
(注意“互斥且完备”的含义)
频率分布(Relative Frequency Distribution)(表3.3, p.62)
百分比分布 (Percentage Distribution) (表3.4, p.63)
累积频率分布显示了从最低组到最高组频率如何累积 (表3.5, p.64)
先用频数分布建立累计频数分布
累积频率分布只计算频率分布的下界
3、数值数据的图形
04/26/22 商务统计基础(第3章)3-1。
《贾俊平 统计学 考研真题 含复试 与典型习题详解 第6版 》读书笔记PPT模板思维导图下载

内容简介
第1章 导论
1.2 课后习题详 解
1.1 复习笔记
1.3 典型习题详 解
第2章 数据的搜集
2.2 课后习题详 解
2.1 复习笔记
2.3 典型习题详 解
第3章 数据的图表展示
3.2 课后习题详 解
3.1 复习笔记
3.3 典型习题详 解
第4章 数据的概括性度量
4.2 课后习题详 解
4.1 复习笔记
4.3 典型习题详 解
第5章 概率与概率分布
5.2 课后习题详 解
5.1 复习笔记
5.3 典型习题详 解
第6章 统计量及其抽样分布
6.2 课后习题详 解
6.1 复习笔记
6.3 典型习题详 解
第7章 参数估计
7.2 课后习题详 解
7.1 复习笔记
7.3 典型习题详 解
第8章 假设检验
8.2 课后习题详 解
8.1 复习笔记
8.3 典型习题详 解
第9章 分类数据分析
9.2 课后习题详 解
9.1 复习笔记
9.3 典型习题详 解
第10章 方差分析
10.2 课后习题 详解
10.1 复习笔记
10.3 典型习题 详解
第11章 一元线性回归
11.2 课后习题 详解
11.1 复习笔记
11.3 典型习题 详解
第12章 多元线性回归
12.2 课后习题 详解
12.1 复习笔记
12.3 典型习题 详解
第13章 时间序列分析和预测
13.2 课后习题 详解
13.1 复习笔记
13.3 典型习题 详解
第14章 指数
14.2 课后习题 详解
14.1 复习笔记
统计学 数据的整理及图表展示

– 饼图只能显示一个总体各部分所占的比例 – 环形图则可以同时绘制多个总体的数据系
列,每一个总体的数据系列为一个环
3. 环形图可用于进行比较研究 4. 环形图可用于展示分类数据和顺序数据
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
非常不满意 不满意 一般 满意 非常满意
组中值= 下限值+上限值 2
组距分组
第1步:排序,确定组数(K)
5≤K≤15
K 1 lg n
能够显示数据的分布特征和规律
lg 2
第2步:确定组距 组距=(最大值-最小值)÷组数
★ 组距宜取5或10的倍数
◆第一组的下限应低于最小值, ◆最后一组的上限应高于最大值。 遵循“不重不漏”的原则
上组限不在内
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~115
5
10
115~120
8
16
120~125
14
28
125~130
10
20
130~135
6
12
135以上
4
8
合计
50
100
用Excel制作数值型数据的频数分布表
【工具】 ——【数据分析】 ——【直方图】 【输入区域】:输入原始数据区域 【接收区域】:输入各组的上限值 【输出区域】:选择一个空白单元格(想要
(上下组限重叠)
表3-5 某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
105~110
3
6
2019年-统计学第三章统计数据的整理与显示-PPT精选文档

《统计学》第三章 统计数据的整理与显示
统计研究目的
统计设计
统统 计计 调整 查理
推
断
分 析
统计 总体
描
数量
述
特征
分
析
统计研究的程序
《统计学》第三章 统计数据的整理与显示
第三章 统计数据的整理与显示 STAT
★§3.1 统计整理与统计分组
§3.2 分布数列的编制 §3.3 统计图表
将总体各单位按某个标志分成若干
分布数列 组,列出各组的总体单位数或各组
在总体中所占的比重而形成的数列
构成要素
分组标志的具体表现 各组的次数或频率
分 品质数列 类 变量数列
单值数列 组距数列
等距数列 异距数列
《统计学》第三章 统计数据的整理与显示
中国体育代表团在悉尼奥运会上获金牌的项目
获金牌项目 金牌数 占总数比例
按年龄分组。?
不符合科学性
对父母亲下岗情 况进行分组研究:
单亲下岗; 双亲下岗; 双亲在岗。
城乡区别
离退休 ?
是否健在
不符合完备性和互斥性
统计分组的程序与原则
第三章 统计数据的整理与显示
分组体系
指同时使用两个以上标志分 组时,分组标志的组合形式。
平行分组体系 各分组标志并列使用 交叉分组体系 各分组标志交叉结合使用
《统计学》第三章 统计数据的整理与显示
§3.1 统计整理与统计分组 STAT
★ 一、统计整理的意义和步骤
二、统计整理的基本方法 ——统计分组
《统计学》第三章 统计数据的整理与显示
将统计调查得到的原始资料进行
统计整理 科学的分组和汇总形成综合统计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
必须有列标题
统计学第六版第3章数据的图表展示
数据透视表
(用Excel创建数据透视表)
第1步:在Excel工作表中建立数据清单 第2步:选中数据清单中的任意单元格,并选择【数据】菜单
中的【数据透视表和数据透视图】 第3步:确定数据源区域 第4步:在【向导—3步骤之3】中选择数据透视表的输出位置
•绿色
•健康饮品
•用Excel制作频数分布表
统计学第六版第3章数据的图表展示
分类数据的图示—条形图
(bar Chart)
1. 用宽度相同的条形的高度或长短来表示 各类别数据的图形
2. 有单式条形图、复式条形图等形式 3. 主要用于反映分类数据的频数分布 4. 绘制时,各类别可以放在纵轴,称为条
统计学第六版第3章数据 的图表展示
2020/12/12
统计学第六版第3章数据的图表展示
第 3 章 数据的图表展示
3.1 数据的预处理 3.2 品质数据的整理与显示 3.3 数值型数据的整理与显示 3.4 合理使用图表
统计学第六版第3章数据的图表展示
学习目标
1. 了解数据预处理的内容和目的 2. 掌握分类和顺序数据的整理与显示方法 3. 掌握数值型数据的整理与显示方法 4. 用Excel作频数分布表和图形 5. 合理使用图表
3. 在某些场合,排序本身就是分析的目的 之一
4. 排序可借助于计算机完成
统计学第六版第3章数据的图表展示
数据排序
(方法)
1. 分类数据的排序
▪ 字母型数据,排序有升序降序之分,但习惯上
用升序
▪ 汉字型数据,可按汉字的首位拼音字母排列,
也可按笔画排序,其中也有笔画多少的升序降 序之分
2. 数值型数据的排序
。然后选择【布局】 第5步:在【向导—布局】对话框中,依次将”分类变量“拖
至 左边的“行”区域,上边的“列”区域,将需要汇总
的“变 量” 拖至“数据区域”
第6步:然后单击【确定】,自动返回【向导—3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表
统计学第六版第3章数据的图表展示
•3.2 品质数据的整理与展示
统计学第六版第3章数据的图表展示
数据的审核—二手数据
(second hand data)
1. 适用性审核
n 弄清楚数据的来源、数据的口径以及有关的 背景材料
n 确定数据是否符合自己分析研究的需要
2. 时效性审核
n 尽可能使用最新的数据
3. 确认是否有必要做进一步的加工整理
统计学第六版第3章数据的图表展示
于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据
统计学第六版第3章数据的图表展示
分类数据的整理与图示
统计学第六版第3章数据的图表展示
分类数据的整理
(基本过程)
1. 列出各类别
•2. 计算各类别的频 •数3. 制作频数分布表
•4. 用图形显示数据
分类 A B C D E
频数
4. 数据透视
n 按需要汇总
统计学第六版第3章数据的图表展示
数据审核
统计学第六版第3章数据的图表展示
数据审核—原始数据
(raw data)
1. 完整性审核
n 应调查的单位或个体是否有遗漏 n 所有的调查项目或变量是否填写齐全
2. 准确性审核
n 数据是否真实反映实际情况,内容是否符合 实际
n 数据是否有错误,计算是否正确等
数据筛选与排序
统计学第六版第3章数据的图表展示
数据筛选
(data filter)
1. 当数据中的错误不能予以纠正,或者有些 数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选
2. 数据筛选的内容
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除
▪ 将符合某种特定条件的数据筛选出来,而不
符合特定条件的数据予以剔除
n 递排序增后排可序表:示设为一:组x数(1)据<x为(2)<x…1,<xx2(n,) …,xn,递增 n 递减排序:可表示为:x(1)>x(2)>…>x(n)
统计学第六版第3章数据的图表展示
数据透视表
统计学第六版第3章数据的图表展示
数据透视表
(pivot table )
1. 可以从复杂的数据中提取有用的信息 2. 可以对数据表的重要信息按使用者的习惯
统计学第六版第3章数据的图表展示
数据筛选
(data filter)
用Excel进行数据筛选
•8名学生的考试成绩数据
统计学第六版第3章数据的图表展示
数据排序
(data rank)
1. 按一定顺序将数据排列,以发现一些明 显的特征或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重 新归类或分组等提供依据
比例
百分比 比率
•☺•☺•☺ •☺•☺ •••••
统计学第六版第3章数据的图表展示
分类数据的整理
(可计算的统计量)
1. 频数(frequency) :落在各类别中的数据个数 2. 比例(proportion) :某一类别数据个数占全
部数据个数的比值 3. 百分比(percentage) :将对比的基数作为100
统计学第六版第3章数据的图表展示
•3.1 数据的预处理
•3.1.1 数据审核 •3.1.2 数据筛选 •3.1.3 数据排序 •3.1.4 数据透视表
统计学第六版第3章数据的图表展示
数据的预处理
1. 数据审核
▪ 检查数据中的错误
2. 数据筛选
▪ 找出符合条件的数据
3. 数据排序
▪ 升序和降序 ▪ 寻找数据的基本特征
而计算的比值 4. 比率(ratio) :不同类别数值个数的比值
统计学第六版第3章数据的图表展示
分类数据整理—频数分布表 (例题分析)
•【 例 】 一 家 市 场 调 查 公 司为研究不同品牌饮料的 市场占有率,对随机抽取 的一家超市进行了调查。 调 查 员 在 某 天 对 50 名 顾 客购买饮料的品牌进行了 记录,如果一个顾客购买 某一品牌的饮料,就将这 一饮料的品牌名字记录一 次 。右边就与图示 •3.2.2 顺序数据的整理与图示
统计学第六版第3章数据的图表展示
数据的整理与显示
(基本问题)
1. 要弄清所面对的数据类型
n 不同类型的数据,采取不同的处理方式和方法
2. 对分类数据和顺序数据主要是作分类整理 3. 对数值型数据则主要是作分组整理 4. 适合于低层次数据的整理和显示方法也适合