基于R语言数据可视化-类别数据可视化
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
人数 0 100 200 300 400 500
性别与满意度的条形图
p: 0.0047
男女
p: <0.0001
p: 0.13
22.0% 18.0%
18.0% 8.0%
18.0% 16.0%
不满意
满意 满意度
中立
12
数据可视化
6/10/2020
3.1
条形图及其变种
并列条形图和堆叠条形图——例题分析
【例3-1】
6次以上 238 3-5次 322 1-2次 280
网购次数
中立 96 满意 105
不满意 139 中立 162 满意 141
不满意 179 中立 102 满意 114
不满意 122 中立 83 满意 49
不满意 106 中立 131 满意 54
不满意 137 中立 106 满意 57
不满意 117
1-2次
不满意
满意
中立
不满意 满意度
满意
中立
17
数据可视化
6/10/2020
3.2
树状图
树状图
将各类别的层次结构画成树状图的形式,称为树状 图(dendrogram)或分层树状图
有条形树状图和矩形树状图,可以看做是条形图的 另一个变种
主要用来展示各类别变量之间的层次结构关系,尤 其适合展示3个及3个以上类别变量的情形(也可以 用于展示两个类别变量)
中 立 (162)
不 满 意 (139) 满 意 (105) 中 立 (96)
满意度
20
数据可视化
6/10/2020
3.2
树状图
矩形树状图——例题分析
【例3-1】
矩形树状图(treemap)是 将多个类别变量的层次结 构绘制在一个表示总频数 的大的矩形中,每个子类 用不同大小的矩形嵌套在 这个大的矩形中。嵌套矩 形表示各子类别的频数, 其大小与相应的子类频数 成比例。
4
数据可视化
6/10/2020
3.1
条形图及其变种
简单条形图和帕累托图——简单条形图——例题分析
【例3-1】
(a) 水 平 条 形 图
(b) 垂 直 条 形 图
人数 0 200 400 600 800
女
性别
graphics 中 的 barplot 函 数 绘 制的条形图
男
0 200 400 600 800 1000
• 使用treemap包中的 treemap函数可以绘制树 状图
21
数据可视化
6/10/2020
3.2
树状图
矩形树状图——例题分析
【例3-1】
矩形树状图(treemap)是 将多个类别变量的层次结 构绘制在一个表示总频数 的大的矩形中,每个子类 用不同大小的矩形嵌套在 这个大的矩形中。嵌套矩 形表示各子类别的频数, 其大小与相应的子类频数 成比例。
使 用 epade 包 中 的 bar.plot.ade 函 数 绘 制的3D条形图。默 认参数beside=TRUE, 绘制并列条形图, 设 置 beside=FALSE 可绘制堆叠条形图
人数
0
200 400 600 800 1000
p: 0.0036 10.4% 8.6% 11.9%
1-2次
p: <0.0001 14.6% 9.8% 15.8%
(a) 并列条形图
40.0%
42.9% (n=360) 37.9%
(n=440)
N 2000, 2 37.02, df c 2 , c 0.14, p .001
31.0% (n=360)
38.1% (n=320)
31.0% (n=360)
20.0%
19.1% (n=160)
性别 男 女
0.0%
不满意
条形树状图 矩形树状图
条形图及其变种 树状图
马赛克图 马赛克图变种
马赛克图及其变种
关联图 独立性检验P值图
关联图和独立性 检验P值图
3
Chap 3
数据可视化
气球图和热图
气球图
热
图
南丁格尔玫瑰图 玫 瑰 图
金 字 塔 图 金字塔图
饼图及其变种
饼图和扇形图 环形图和弧形
6/10/2020
3.1
条形图及其变种
• 使用treemap包中的 treemap函数可以绘制树 状图
22
数据可视化
6/10/2020
3.3
3-5次 (482)
6次 以 上 (340)
网购次数
不满意 (117)
满意 (57)
中立 (106)
不 满 意 (137)
满 意 (54)
中 立 (131)
不满意 (106)
满 意 (49)
中立 (83) 不 满 意 (122)
满意 (114)
中 立 (102)
不 满 意 (179)
满 意 (141)
14
数据可视化
6/10/2020
3.1
条形图及其变种
不等宽条形图——例题分析
【例3-1】
使 用 ggiraphExtra 包 中 的 ggSpine 函 数绘制不等宽条 形图。使用 ggiraphExtra 包 时 , 需要同时加载 ggplot2包
网购次数
1-2次 3-5次 6次以上
count
0 100 200 300
(b) 堆叠条形图
120%
100%
40.0% (n=800)
80% 60%
37.9% (n=440)
40% 20%
42.9% (n=360)
0%
不满意
满意
满意度
中立
26.0% (n=520)
31.0% (n=360)
19.1% (n=160)
满意
满意度
34.0% (n=680)
31.0% (n=360)
ggSpine 函 数
绘制按第3个
类别变量分
面的脊形图
网购次数
3-5次
6次以上
性别:男 N=840
29.4%
30.6%
25.9%
38.1%
33.8%
40.9%
32.5%
35.6%
33.1%
性别:女 N=1160
31.6%
29.2%
26.7%
40.7%
39.2%
45.0%
27.7%
31.7%
28.3%
累积频率
人数
400
200
0
不满意
中立
满意
满意度
8
数据可视化
6/10/2020
3.1
条形图及其变种
并列条形图和堆叠条形图
绘制两个类别变量的条形图时,可以使用原始数据绘图,也可以先生 成二维列联表再绘图
根据绘制方式不同有并列条形图(juxtaposed bar plot)和堆叠条形图 (stacked bar plot)等
6次 以 上
网购次数 (a) 垂 直 并 列
6次以上
3-5次
1-2次
245 179
154
316
293
195
239
171
208
不满意
满意
中立
满意度 (c) 垂 直 堆 叠
满意度 不满意 满意 中立
满意度 不满意 满意 中立
女
男
360 320
360 160
440 360
0
100
200
300
400
人数 (b) 水 平 并 列
520
plot_frq 函 数 绘 500
(26.0%)
制的条形图
250
0
不满意
满意
中立
满意度
6
数据可视化
6/10/2020
3.1
条形图及其变种
简单条形图和帕累托图——帕累托图
帕累托图(Pareto plot)是将各类别的频数降序排 列后绘制的条形图
以意大利经济学家V.Pareto的名字命名的 帕累托图可以看作简单条形图的一个变种,利用
38.1% (n=320)
中立
性别 男 女 Total
11
数据可视化
6/10/2020
3.1
条形图及其变种
并列条形图和堆叠条形图——例题分析
【例3-1】
使 用 epade 包 中 的 bar.plot.ade 函 数 绘 制的3D条形图。默 认参数beside=TRUE, 绘制并列条形图, 设 置 beside=FALSE 可绘制堆叠条形图
9
数据可视化
6/10/2020
3.1
条形图及其变种
并列条形图和堆叠条形图——例题分析
【例3-1】
使 用 barplot 结 合 BarText 函 数 绘制的条形图
人数 0 200 400 600 800
人数 0 100 200 300 400
男
女
482
338
322
280
340 238
1-2次
3-5次
该图很容易看出哪类频数出现得最多,哪类频数 出现得最少。
7
数据可视化
6/10/2020
3.1
条形图及其变种
简单条形图和帕累托图——帕累托图
800 1000
【例3-1】 barplot 函 数 绘 制的帕累托图
600
累积分布曲线 800
680 520
0.4 0.5 0.6 0.7 0.8 0.9 1.0
网购次数
6次以上
3-5次
1-2次
239
316
245
171
195
154
208
293
179
不满意
245 316 239
不满意
满意
满意度
154 195 171
满意
满意度
中立
179 293 208
中立
15
数据可视化
6/10/2020
3.1
条形图及其变种
脊形图——例题分析
【例3-1】 使 用 graphics 包 中 的 spineplot 函 数 、 vcd 包 中 的 spine 函 数 、 ggiraphExtra 包 中 的 ggSpine函数等均可以绘制脊形图。以性别与满意度、网购次数与满意度为例,由 graphics包中的spineplot函数绘制的脊形图
1-2次
3-5次
6次 以 上
人数
网购次数
(c) 垂 直 条 形 图
人数
0 200 400 600 800
不满意
满意 满意度
中立
5
数据可视化
6/10/2020
3.1
条形图及其变种
简单条形图和帕累托图——简单条形图——例题分析
【例3-1】
800 (40.0%)
750
680
sjPlot 包 中 的
(34.0%)
1-2次
3-5次
6次以上
208
293
179
171
195
154
239
316
245
0
200
400
600
800
人数 (d) 水 平 堆 叠
10
数据可视化
6/10/2020
3.1
条形图及其变种
并列条形图和堆叠条形图——例题分析
【例3-1】
使 用 sjPlot 包 中 的 sjp.xtab 函 数 可以也绘制的 条形图
0.0 0.2 0.4 0.6 0.8 1.0
0.0 0.2 0.4 0.6 0.8 1.0 网购次数
1-2次 3-5次 6次 以 上
女
性别
男
不满意
满意 满意度
中立
不满意
满意 满意度
中立
16
数据可视化
6/10/2020
3.1
条形图及其变种
脊形图——例题分析
【例3-1】
使
用
ggiraphExtra
包中的
简单条形图和帕累托图——条形图
条形图(bar plot)是用一定宽度和高度的矩形表 示各类别频数多少的图形
主要用于展示类别变数据的频数分布
绘制条形图时,各类别可以放在X轴(横轴),也 可以放在Y轴(纵轴)
类别放在X轴的条形图称为垂直条形图(vertical bar plot)或柱形图,类别放在Y轴的条形图称为 水平条形图(horizontal bar plot)
18
数据可视化
6/10/2020
3.2
树状图
条形树状图——例题分析
【例3-1】
使用plotrix包中的 plot.dendrite 函 数 和 sizetree 函 数 可 以绘制出不同式 样的树状图。 plot.dendrite 绘 制 的条形树状图
女 1160
男 840
性别
6次以上 340 3-5次 482 1-2次 338
数据可视化
R 语言
贾俊平
Chap 3
类别数据可视化
3.1 条形图及其变种 3.2 树状图 3.3 马赛克图及其变种 3.4 关联图和独立性检验P值图 3.5 气球图和热图 3.6 南丁格尔玫瑰图 3.7 金字塔图 3.8 饼图及其变种
Chap 3
类别数据可视化
简单条形图 帕累托图 并列条形图 堆叠条形图 不等宽条形图 脊形图
3-5次 网购次数
不满意 满意 中立
p: <0.0001 8.9% 7.7%
12.2%
6次 以 上
13
数据可视化
6/10/2020
3.1
条形图及其变种
不等宽条形图和脊形图
用一个变量各类别条形的宽度表示样本量,另一个类别 变量的各类别以并列或堆叠的方式绘制条形图
脊形图(spine plot)是根据各类别的比例绘制的一种条 形图,它可以看作堆叠条形图的一个变种,也可以看作 马赛克图的一个特例。绘制脊形图时,将某个类别各条 的高度都设定为1或100%,条的宽度与观测频数(样本量) 成比例,条内每一段的高度表示另一个类别变量各类别 的频数比例
满意度
19
数据可视化
6/10/2020
3.2
树状图
大小树状图——例题分析
【例3-1】
使用sizetree函数 男 (840)
可以绘制出另一
种形式的树状图,
Leabharlann Baidu
称为大小树
女 (1160)
( size tree ) 或
规模树 性别
1-2次 (280) 3-5次 (322) 6次 以 上 (238) 1-2次 (338)
并列条形图中,一个类别变量作为坐标轴,另一个类别变量各类别频 数的条形并列摆放;堆叠条形图中,一个类别变量作为坐标轴,另一 个类别变量各类别的频数按比例堆叠在同一个条中
使用barplot函数默认绘制堆叠条形图,设置参数beside=TRUE可绘制并 列条形图。使用DescTools包中的BarText函数、plotrix包中的barlabels函 数可以给条形图添加标签