《数据可视化》教学课件05第五章 数据可视化的实现与优化

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

5
3.4
0.2 0
1月
发送总量 平均发送量
15.5
15.1
12.2
0.6
8.6
0.3
0.3
0.3
2月
3月
4月
5月
(2)两个系列数据
1.0
0.8 不在一个数量级应分
0.6
6.6
0.4 轴显示
0.2 0.2
0.0
6月
3.3 设计缺陷
缺乏对原始数据的汇总编辑,累计小于5%的类别最好给予合 并。前提是小概率事件是不重要的。
受众; ➢ 拒绝斜向的横坐标标签,因为这样不仅不利于阅读,也占据
了图表过多的版面; ➢ 简化纵坐标轴标签,不要出现过多的零,同时需要标明单
3.2 优化思路——(3)折线图的改进思路
➢ 直接在折线旁边标出类别名称,避免受众一一对应折线和 名称;
➢ 如果折线过多,可以拆分成多个折线图分开展示; ➢ 折线图适合表现时间序列上的趋势变化,对于非时间类别
6类 7类 8类 9类 2% 1% 1% 1% 5类 2%
4类 11%
3类 14%
10类 0%
11 12 类类 0% 0%
1类 45%
5类
6类 其他 1%
2%
4类 11%
3类
1类
14%
45%
2类
2类
23%
23%
必要时对原始数据编辑后再作图
3.3 设计缺陷
某业务客户反映问题点
信息量过多,读者很难快速准确解 读,降维及分层说明的金字塔结构有 利于问题解读。
➢ 突出图表想表达的重点,例如,在标题中写明观点,可以 帮助受众高效、理解图表;也可以在图形上直接标注出重 点信息,避免受众猜测图表的意思。
3.2 优化思路——(2)柱形图的改进思路
➢ 通过加粗柱形,使受众直接接收想传递的信息; ➢ 严格控制颜色数量,因为颜色过多起不到强调的作用,反而
使图表过于花哨; ➢ 当横坐标不是时间序列时,按照数量大小排列柱状图,方便
各行业客户数量
(1)指标轴标签排序如果没
商业
53
教育
43 有实际意义,则需要按数据
销售
33
IT
大小排序。有意义的标签:
29
电器销售
23
零售
21
生物医药
21
时间、大小、级别、顺序等 (2)单位为家数、个数,小
地产
19
装饰工程
16
数点没有意义需要去掉。
综合
13
单位:家
(3)未显示全所有bar,调 整刻度最大值。
可用改变字体颜色、单元格底色、加提升框。 4月份
5月份
6月份
下行流量 (单位:万条)
15.5 3.2 4.4
82.1 23.9
5.3
3.3 设计缺陷
各行业客户数量
IT 电器销售
教育 零售 商业 生物医药 食品 销售 装饰工程 综合 单位:家
29.0 23.0
43.0 21.0
21.0 12.0
33.0 16.0 13.0
➢ 6个圈,每个圈用不 同的颜色区分。
➢ 有一个圈的某一部分 跟其他的圈不一样 (图中方框部分), 这样就可以找到心电 图中的异常。
本章目录
Directory
基本步骤 具体实现 优化措施
基本步骤
1.1 顺序模型 1.2 反馈模型
1.1 循序模型
基于Ben Fry理论的顺序模型
1.2 反馈模型
3.3 设计缺陷
过于复杂,结论是没法看
3.3 设计缺陷 过多的图表类型、过多的图表颜色和效果。
3.3 设计缺陷
25.0% 20.0% 15.0% 10.0%
5.0% 0.0%
23.61%
不同类型客户占比
20.833%
19.10%
13.9%
13.02%
A
B
C
D
E
9.55%
F
F, 9.5%不同类型客户占比
横看成岭侧成峰 远近高低各不同
3.3 设计缺陷
➢ 数据差异极小,柱形图几乎成了整齐的栅栏,图表作用不明显。 不如直接使用排序的数据表格。
3.3 设计缺陷
➢ 对于一组或一个数字的情况,商业周刊没有使用图表, 而是使用大号的数字,这样的处理同样令人印象深刻。
3.3 设计缺陷
➢ 对于一组或一个数字的情况,商业周刊没有使用图表, 而是使用大号的数字,这样的处理同样令人印象深刻。
出某一数量; ➢ 控制扇形的数量,因为扇形数量太多影响扇形之间的大小对
比,一般而言,扇形数量2-7个为宜; ➢ 可以按照顺时针方向进行大小排序,改善扇形图显示效果; ➢ 避免受众一一对应扇形与名称,可直接在扇形内部标上名
称。
数据可视化的优化
设计
内容
Part 3.3 设计缺陷
3.3 设计缺陷
UE: User Experience RE : Reader Experience
Daniel Keim的可视化反馈模型
具体实现
2.1 指标图形化 2.2 指标值图形化 2.3 指标关系图形化
2.1 指标图形化
➢就是用与指标含义相近的icon来表现。
2.2 指标值图形化
➢指标值就是一个数据,将数据的大小以图形的方式表现。
➢如用柱形图的长度或高度表现数据大小,这也是最常用的可 视化形式。
DT时代
数据可视化导论
朱晓峰
【导读案例】基于形状空间投影的时间序列数据可视化探索
➢ 时变数据是很常见的一种数据形式,甚至可以说,日常见 到的大部分都是时变数据,比如说一切价格的变动(衣食 住行、股票等)。
➢ 时变数据可以看成是由一组按时间记录的数据。在每个时 间点的记录又包含了多条数据。
【导读案例】基于形状空间投影的时间序列数据可视化探索
E, 13.0%
A, 23.6%
D, 13.9%
B, 20.8%
C, 19.1%
(1)错误图表,百分比加起来为100%的图表,且类别小于10个最好用饼 图; (2)小数点位数要统一;
3.3 设计缺陷
负值不能用饼图
各产品盈亏情况
40%
30%
20%
10%
A产品
B产品
C产品
D产品
-16%
E产品
3.3 设计缺陷
24
产品10
24
3.3 设计缺陷
100% 80% 60% 40% 20% 0%
63.2% 54.5%
1月
67.2% 56.4%
2月
70.1% 57.4%
3月
70.9% 58.5%
4月
74.6% 58.9%
5月
78.3% 60.0%
6月
第一直觉: 没太多提升
下发成功率 访问率
下发成功率
80%
78.3%
3.3 设计缺陷
200000 150000 100000
50000 0
发送总量 平均发送量
155131
85780
121520
150537
34462 1500
6205
3299
3038
3136
1月
2月
3月
4月
5月
66498 1583
6月
(1)超过万级,应 以万为单位,并标明 单位
单位:万条
20
15
10
74.6%
75%
70.1% 70.9%
70%
67.2%
65% 63.2%
60%
1月 2月 3月 4月 5月 6月
访问率
62%
60%
58%
60.0% 58.5% 58.9%
56%
57.4%
56.4% 54%
54.5% 52%
1月 2月 3月 4月 5月 6月
第一直觉: 提升明显
别让数据埋没了你的成绩
3.3 设计缺陷
3.3 设计缺陷
展示每月产品下行短信流量
月份
下行流 量
1月份 155097
2月份 30736
3月份 44333
4月份 821234
5月份 239364
6月份 53334
3.3 设计缺陷
月份
1. 数字应靠右,方便比较;
1月份
2. 超过万级,应以万为单位,并标明单位; 2月份
3. 数字格式上统一字体,如果需要突出显示 3月份
3.1 数据墨水比原则
提问:左图,右图遵循了数据墨水比原则?
Part 3.2 数据可视化的优化思路
3.2 优化思路——(1)整体改进思路
➢ 尽量使用成熟的配色,因为颜色的明度过高或者过低,都直接 影响图表的专业程度。
➢ 尽量使用辨识度比较高的字体(如微软雅黑),避免使用衬线 字体、书法字体。
➢ 设计规整平衡的版式, 通过对比、紧密、重复、对齐等排版 原则,提升图表的观看体验。
指标图形化+指标值图形化
2.3 指标关系图形化
➢ 借助已有的场景来表现指标关系。
优化措施
3.1 墨水比原则 3.2 优化思路 3.3 容易被忽略的问题 3.4 优化测试
Part 3.1 数据墨水比原则
3.1 数据墨水比原则
数据墨水比(data-ink ratio): 一副规范的图表其绝大部分笔墨都应该用于展示数据信息,数据笔墨
的数据,显示效果并不理想,应该尽量避免; ➢ 合适的场景下可以把线条适当加粗,提高数据墨水比,帮
助受众加深印象; ➢ 谨慎使用虚线,因为虚线一般表示预测值。
3.2 优化思路——(4)扇形图的改进思路
➢ 控制没有意义的颜色,避免图表过于花哨; ➢ 使用同色系的颜色,通过深浅表现数据大小,用不同颜色突
A类市场 100%
没有坐标轴倒是次要的, 但若无坐标轴就必须有数值显示。
不同类型客户占比
A
B
C
D
E
F
神图!!!避免出现!
3.3 设计缺陷
美国的Fox News
容易上当的图表
Part 3.4 测试一下?
谢 谢!
➢ 尽量淡化网格线,去除多余的网格线,因为网格线过多过密都 会影响主要信息的传递效率。
3.2 优化思路——(1)整体改进思路
➢ 纵坐标的标题,需要横向排列,避免出现斜向或者旋转的 文字,影响图表的阅读速度。
➢ 尽量避免使用3D图,因为3D图表有时会造成理解上的偏 差,数据展示不准确,可以把3D图表改为2D图表。
必要时对原始数据编辑后再作图
3.3 设计缺陷
条行图指标轴长度不统一,造成视觉上误导。
A分公司销量
B分公司销量
产品1Baidu Nhomakorabea
75 产品1
46
产品2
61
产品2
43
产品3
53
产品3
35
产品4
50
产品4
45
产品5
45
产品5
45
产品6
35
产品6
35
产品7
33
产品7
33
产品8
31
产品8
24
产品9
27
产品9
27
产品10
是图表中不可去除的核心,是用来展示数据信息的非多余的部分。 数据墨水比=图表中用于数据的墨水量/总墨水量
=图表中用于数据信息显示的必要墨水比例 =1-可被去除而不损失数据信息的墨水比例 数据墨水比的比值越高,说明图表中越多的视觉编码被用于传递真正 的信息,而不是出现冗余,或者用于描述一些其他的东西。
过多的颜色和效果!
2 3
5
3
7
5
9
2
11
5
14
21
13
26
21
19
35 27 29
31
Once every 2-3 weeks At least once a week
26
Total
32
15-19
32
20-29
23
30-39
1
2
5
10
7
14
19
12
26
32
22
29
40-49
21
50 and above
3.3 设计缺陷
“你画我猜”其实很辛苦! (1)饼图颜色区分不大,且图例没有对
应;
A类 (2)没有D标类明, 数值;
B类
10% C类,
C类
20%
A类,
D类
B
50%
类,20
%
(3)此处只是示例,不可用ABCD代替具体事
3.3 设计缺陷
乱花渐欲迷人眼
Less often than once a year Once every 7-12 months Once every 4-6 months Once every 2-3 months Once a month
相关文档
最新文档