《数据可视化导论》数据可视化图表基础

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2.1 雷达图
作业:这张雷达图反映了什么? 1班女生负责回答,并简要解释说明。
2.2 面积图
➢ 面积图(Area chart),又称区域图,是指将排列在工作表 的列或行中的数据绘制到面积图中,强调数量随时间而变化 的程度,也可用于引起人们对总值趋势的注意。
➢ 通过显示所绘制的值的总和,面积图还可以显示部分与整体 的关系。
3.2 词云图
➢ 通过词云图,读 者可以快速感知 最突出的文字。
➢ UI设计师的技能 要求多为熟练掌 握PS和Flash
3.2 词云图
除了小说、经典、文学等传统热度词,当代青年在 外国小说、美学、绘本、漫画、诗有较高的热度。
3.2 词云图
➢ 作业:除了已经看到的特殊形状的词云,还有哪些? 2班女生负责1-2个,同时提供链接地址和简要解释说明
➢ 它直观地表明任务计划在什么时候进行,及实际进展与计划 要求的对比。
2.10 甘特图
2.11 直方图
➢ 直方图,显示在连续间隔,或者是特定时间段内数据分布情 况的图表,经常被用在统计学领域。
➢ 直方图描述的是一组数据的频次分布,例如把年龄分成“05,5-10,……,80-85”17个组,统计一下中国人口年龄的 分布情况。
➢ 直方图有助于知道数据的分布情况,诸如众数、中位数的大 致位置、数据是否存在缺口或者异常值。
2.11 直方图
直方图示意图
2.12 箱线图
➢ 箱线图(Box-plot)又称为盒须图、盒式图或箱形图, 显示一组数据分散情况资料的统计图。因形状如箱子而得名。
➢ 常见于品质管理。它主要用于反映原始数据分布的特征,还 可以进行多组数据分布特征的比较。
➢它能够很好的展示出2个或者多个分类型变量的关系 ➢可以定义为用图像的方式展示分类型数据。
2.8 树状图
➢ 树状图,也称为树枝状图,是枚举法的一种表达方式。 用数据树为图形表现形式,以父子层次结构来表示亲缘关系。 ➢ 树状图主要是把分类总单位摆在图上树枝顶部,然后根据需
要,从总单位中分出几个单支,而这些分支,可以作为独立 的单位,继续向下分类,以此类推。 ➢ 树状图中,可以很清晰的看出分支和总单位的部分和整体的 关系,以及这些分枝之间的相互关系。
1.4 散点图
➢用于发现各变量之间的关 系,适用于存在大量数据 点,而且结果更精准的场 景下,比如回归分析。
➢不足之处在于数据量小的 时候会比较混乱。
1.5 饼图
➢ 用来展示各类别占比,比 如男女比例。适用于了解 数据的分布情况,适用反 映部分与整体的关系。
➢ 不足在于➢ 霍乱传播因何而来又如何传播?可视化最终给出了答案。
【导读案例】霍乱地图与传染病的可视化研究
➢ Snow采用了点图方式,
➢ 图中心东西方向的街 道即为Broad大街,黑 点表示死亡的地点。
➢ 死亡发生地都在街道 中部一处水源(公共 水泵)周围
本章目录
Directory
基本图表 传统图表 新型图表
1.1 柱状图——(1)堆积柱状图
1.1 柱状图——(2)百分比堆积柱状图
1.1 柱状图——(3)双向柱状图
5个主要城市的平均房屋成本 提问:哪个城市变化最大?
1.1 柱状图——(4)分组柱状图
➢ 适合在同一个轴上显示不同分组的各个分类
1.1 柱状图——(5)个性化柱状图
1.1 柱状图——(5)个性化柱状图
➢ 瀑布图适合用于表达各项数据与各项数据总和的比例,或者用 于显示各项数据间的比较。
➢ 比如评估公司利润、比较产品收益、突出显示项目的预算变更、 分析一段时间内的库存或销售情况 、显示一段时间内产品价值 变化等。
2.5 瀑布图
大年初一我国电影票房组成
2.6 南丁格尔玫瑰图
2.6 南丁格尔玫瑰图
3.2 词云图
➢ 词云(Word cloud),又称文字云、标签云(Tag Cloud)、关键词云(Keyword Cloud),是文本数据 的视觉表示,由词汇组成类似云的彩色图形。
➢ 早期,词云图被广泛用作各种信息资源(如博客和小门 户)的导航工具,帮助突出显示具有快速访问链接的最 受欢迎标签。
1.3 折线形图
➢ 用于展示数据随时间或有序类别的波动情况的趋势变化。 适用对象为有序的类别,比如时间,也适用于数据量比较 大的场景。
➢ 局限之处在于无序的类别无法展示数据特点。
1.3 折线形图
美国二战后一段时间内, 各阶层财富一度是同步增 长的,但80年代后差距不 断扩大(3条曲线从上到下: 真实收入位于全社会95百 分位、中位数、20百分位 的人群的收入增长速度)
2.14 复合图
➢ 复合图就是指以两个或两个以上的图表组合在一起来展 现数据的图表类型。
➢ 有些时候人们所掌握的数据包含的信息太多,只通过单 一的图表不能很好的展现数据所表达的信息。
2.14 复合图——(1)柱线图
结合柱状图和折线图在同一个图表展现数据,适用 于要同时展现两个项目数据特点的场景中。
➢ 漏斗图适用于业务流程比较规范、周期长、环节多的流程分 析,通过漏斗各环节业务数据的比较,能够直观地发现问题 所在。
➢ 漏斗图还可以用来展示各步骤(如网站购买)的转化率,适 用于业务流程多的流程分析。
2.3漏斗图
「访问」到「咨询」环节数据明显减少
2.4 气泡图
➢用气泡代替散点图的数值点,面积大小代表数值大小。 ➢气泡图和散点图都不使用分类轴,水平轴和垂直轴都是
基本图表
1.1 柱状图 1.2 条形图 1.3 折线图 1.4 散点图 1.5 饼图 1.6 地图
1.1 柱状图
➢用于展示多个分类的数据 变化和同类别各变量之间 的比较情况,适用对象为 对比分类数据,局限在于 分类过多则无法展示数据 特点。
1.1 柱状图
1.1 柱状图
提问:此图反映哪些规律?
3.1 热力图
➢ 热力图(Heat map),也可以称为热图、热量表 (Heat Table)、密度表(Density Table)
➢ 主要用于展示数据的分布情况。
3.1 热力图
➢ 标准的热力图将两个连续数据分别映射到 x、y 轴,第三 个连续数据映射到颜色。
➢ 热力图是三维柱状图的俯视图。
3.1 热力图
2.8 树状图
2.9 子弹图
➢ 子弹图(Bullet Graph)是一个可视化实际与目标完成情况
的图表,它的外形很像子弹射出后带出的轨道,所以叫做子
弹图。
分公司效率优化嵌套图
2.10 甘特图
➢ 甘特图,又称为横道图、条状图(Bar chart)。
➢ 内在思想简单,基本是一条线条图,横轴表示时间,纵轴表 示活动(项目),线条表示在整个期间上计划和实际的活动2.1 雷达图 2.2 面积图 2.3 漏斗图 2.4 气泡图 2.5 瀑布图 2.6 南丁格尔玫瑰图 2.7 马赛克图 2.8 树状图 2.9 子弹图 2.10 甘特图 2.11 直方图 2.12 箱线图 2.13 维恩图 2.14 复合图
2.1 雷达图
➢ 热力图+地图=热力地图。
➢ 直观地显示测量值在整个地理区域(国家、省份、州、人 口普查区等)内的变化情况,也可以显示区域内变化程度。
3.1 热力图
➢ 景区热力图
➢ 气象热力图
3.1 热力图
➢ 房产热力图
3.1 热力图
➢ 网站热力图
该网页被浏览 者关注的区域
3.1 热力图
➢ 网站热力图
以特殊高亮的形式显示 用户页面点击位置或用 户所在页面位置的图示。 直观地观察到用户的总 体访问情况和点击偏好。
1.5 饼图
➢ 相似图表有环形图(挖空的饼图,中间区域可以展 现数据或者文本信息)。
1.5 饼图——环形图
1.5 饼图——注意事项
1.6 地图
➢ 表达地球(或其他天体)上各种事物的空间分布、组合、联 系、数量和质量特征及在时间中的发展变化状态绘制的图形。
基于地图的英国脱欧公投时各地投票率分析
3.3 桑基图
➢ 桑基图(Sankey diagram)主要由边、流量和支点组成, 其中边代表了流动的数据,流量代表了流动数据的具体 数值,节点代表了不同分类。边的宽度与流量成比例地 显示,边越宽,数值越大。
3.3 桑基图
➢ 最左边的支点代表了 不同的资金来源,包 括社会、个人税收等。
➢ 右边是支出,包括交 通、环境保护、住房、 教育、文化等各领域。
2.12 箱线图
提问:哪门课好?哪门课差?
2.13 韦恩图
➢ 韦恩图(Venn Diagram),也叫温氏图、维恩图、范氏图, 是用于显示集合重叠区域的关系图表,常用于数学、统计学、 逻辑学等领域。
➢ 通过图形与图形(通常是圆形或者椭圆形)之间的层叠,韦 恩图表示集合与集合之间的相交关系,或者是不同集合交叉 的可能性。
➢雷达图(Radar Chart),又被称为网络图、蜘蛛图、 极坐标图或者星图。
➢将多个分类的数据量映射到坐标轴上,对比某项目不同 属性的特点。
➢适合了解同类别的不同属性的综合情况,以及比较不同 类别的相同属性差异。
2.1 雷达图
提问:用户1和用户2有什么不同?
最近购买时间、购买频率和购买商品种类可以用来评价用户的忠诚度, 平均每次交易额和单词最高交易额可以用来衡量用户的消费能力。 用户1虽然购买频率和购买的广度不高,但其消费的能力较强 用户2是频繁购买用户,对网站有一定的忠诚度,但其消费能力一般。
DT时代
数据可视化导论
朱晓峰
第三章 数据可视化图表基础
【导读案例】霍乱地图与传染病的可视化研究
➢ 19世纪上半叶的欧洲,伴随工业迅速发展的是城市的扩张 和人口的增长,但是公共管理并未能与时俱进,城市居民 极易受到传染病的侵害。
➢ 1831年10月,英国第一次爆发亚洲霍乱,夺走了5万余生 命。在1848–1849和1853–1854年的霍乱流行中,死亡人数 更多。
➢ 堆积面积图(三维)、百分比堆积面积图(三维)、三维簇 状面积图等
2.2 面积图——注意事项
➢ 当数据值相距很远时,区域是模糊不清的,不适合使用面积图。
乍一看,很可能会误以为图表上显示三种不同的颜色
2.3漏斗图
➢ 漏斗图是一种直观表现业务流程中转化情况的图表形式,用 梯形面积表示某个环节业务量与上一个环节之间的差异。
但是,柱线图有柱状图和折线图两者的缺陷。
2.14 复合图——(2)堆积面积图+百分比堆积柱形图
2.14 复合图——(3)面积图+ 折线图
2.14 复合图——(4)柱图、饼图、折线图混合
新型图表
3.1 热力图(Heat map) 3.2 词云(Word cloud) 3.3 桑基图(Sankey diagram) 3.4 弦图(Chord diagram) 3.5 矩形树图(Treemap) 3.6 河流图(Stream graph) 3.7 旭日图(Sunburst chart) 3.8 玉玦图(Radial/ Circle Bar Chart) 3.9 仪表盘 3.10 其他图表
➢ 作业:除了已经看到的个性化柱状图,还有哪些?
1.1 柱状图——(6)注意事项
避免3D,避免空值
1.2 条形图
➢用于展示多个分类的数据 变化和同类别各变量之间 的比较情况,适用对象为 对比分类数据,局限在于 分类过多则无法展示数据 特点。
1.2 条形图
提问:不同时间各州 的人口条形图?
亚洲 2008
数值轴。 ➢某种角度而言,气泡图是散点图的变体——散点图只需
要绘制X轴和Y轴;气泡图,还需绘制Z值表示气泡的大小, 即气泡图允许在图表中额外加入一个表示大小的变量。
2.4 气泡图
美国各大战争中的死亡人数与新冠疫情死亡人数对比
2.5 瀑布图
➢ 瀑布图是由麦肯锡顾问公司所独创的图表类型,因为形似瀑布 流水而称之为瀑布图。瀑布图具有自上而下的流畅效果,也可 以称为阶梯图(Cascade Chart)或桥图(Bridge Chart)。
➢ 又名鸡冠花图(Coxcomb Chart)或极坐标区域图。 ➢ 使用扇形的半径表示数据的大小,各扇形的角度则保持一致。 ➢ 对照饼图,由于半径和面积的关系是平方的关系,南丁格尔
玫瑰图会将数据的比例大小夸大,尤其适合对比大小相近的 数值。
2.7 马赛克图
➢马赛克图,也叫做不等宽柱状,是一个展示不同分类数据 的多变量数据大小的图表。根据不同变量,矩形方块会被 填充不同的颜色,以区分数据。
法国公共管理部门收支情况
相关文档
最新文档