基于R语言数据可视化-类别数据可视化

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
l 有条形树状图和矩形树状图,可以看做是条形图的 另一个变种
l 主要用来展示各类别变量之间的层次结构关系,尤 其适合展示3个及3个以上类别变量的情形(也可以 用于展示两个类别变量)
18
数据可视化
12/15/2019
3.2
条形树状图——例题分析
【例3-1】 使用plotrix包中的 plot.dendrite函 数 和 sizetree函 数 可 以绘制出不同式 样的树状图。 plot.dendrite绘 制 的条形树状图
35
数据可视化
12/15/2019
3.5
气球图——例题分析
【例3-1】 使 用 ggpubr包 中 的 ggballoonplot 函数可以绘制气 球图
图气球图和热图
36
数据可视化
12/15/2019
3.5
图气球图和热图
气球图——例题分析
【例3-1】 使 用 ggpubr 包中的 ggballoonplo t函数可以绘 制气球图
3.4 图
关联图和独立性检验的 P 值
独立性检验的 P 值图
l 关联图只是大概判断两个类别变量是否独立,难以得出确切的结论 l 对于多个类别变量,如果要分析任意两个变量之间是否独立,可以
使用Pearson卡方检验 l 该检验的原假设是:二维列联表中的行变量与列变量独立。如果检
验的P值较小足以拒绝原假设,则表示行变量与列变量不独立,或 者说二者之间具有相关性 l 独立性检验的P值图则列出Pearson卡方检验的P值
12
数据可视化
12/15/2019
3.1
条形图及其变种
并列条形图和堆叠条形图——例题分析
【例3-1】 使 用 epade包 中 的 bar.plot.ade函 数 绘 制的3D条形图。默 认参数beside=TRUE, 绘制并列条形图, 设 置 beside=FALSE 可绘制堆叠条形图
13
数据可视化
33
数据可视化
12/15/2019
3.4 图
关联图和独立性检验的 P 值
独立性检验的 P 值图——例题分析
【例3-1】 使 用 sjPlot包 中 的 sjp.chi2函 数 可 以 绘制多个二维表 的 Pearson卡 方 独 立性检验的P值矩 阵
34
数据可视化
12/15/2019
3.5
图气球图和热图
treemap函数可以绘制树 状图
21
数据可视化
树状图
12/15/2019
3.2
矩形树状图——例题分析
【例3-1】 矩形树状图(treemap)是 将多个类别变量的层次结 构绘制在一个表示总频数 的大的矩形中,每个子类 用不同大小的矩形嵌套在 这个大的矩形中。嵌套矩 形表示各子类别的频数, 其大小与相应的子类频数 成比例。 • 使用treemap包中的
形以R×C的形式布局,列联表中每一个单元格的观测频 数和期望频数用一个矩形表示 l 如果一个单元格的观察频数大于期望频数,矩形将高 于基线;如果一个单元格的观察频数小于期望频数时, 矩形则低于基线
30
数据可视化
12/15/2019
3.4 图
关联图和独立性检验的 P 值
关联图——二维关联图——例题分析
条 形树 状 图 矩形树状图
条形图及其变种 树状图
马赛克图 马赛克图变种
马赛克图及其wenku.baidu.com种
Chap 3
关联图 独 立 性 检 验P值 图
关 联图 和 独 立 性 检 验P 值 图
3
数据可视化
气球图和热图
气球图


南丁格尔玫瑰图 玫 瑰 图
金 字 塔 图 金字塔图
饼图及其变种
饼图 和 扇 形 图 环 形图 和 弧 形
12/15/2019
3.1
条形图及其变种
不等宽条形图和脊形图
l 用一个变量各类别条形的宽度表示样本量,另一个类别 变量的各类别以并列或堆叠的方式绘制条形图
l 脊形图(spine plot)是根据各类别的比例绘制的一种条 形图,它可以看作堆叠条形图的一个变种,也可以看作 马赛克图的一个特例。绘制脊形图时,将某个类别各条 的高度都设定为1或100%,条的宽度与观测频数(样本量) 成比例,条内每一段的高度表示另一个类别变量各类别 的频数比例
气球图
l 气球图是用气球大小表示数据的图形,它画出的是一个图形 矩阵,其中每个单元格包含一个点(气球),其大小与相应 数据的大小成比例
l 气球图可用于展示由两个类别变量生成的二维列联表,也可 以用于展示具有行名和列名称的其他数据
l 绘图的数据形式是一个数据框或矩阵,数据框中包含至少三 列,第1列对应第1个类别变量,第2列对应第2个类别变量, 第3列是两个类别变量对应的频数或其他数值
数据可视化
R 语言
贾俊平
Chap 3
类别数据可视化
3.1 条形图及其变种 3.2 树状图 3.3 马赛克图及其变种 3.4 关联图和独立性检验P值图 3.5 气球图和热图 3.6 南丁格尔玫瑰图 3.7 金字塔图 3.8 饼图及其变种
Chap 3
类别数据可视化
简单条形图 帕 累 托图 并 列条 形 图 堆 叠条 形 图 不等 宽 条 形 图 脊形图
19
数据可视化
树状图
12/15/2019
3.2
大小树状图——例题分析
【例3-1】 使用sizetree函数 可以绘制出另一 种形式的树状图, 称为大小树( size tree) 或 规 模树
20
数据可视化
树状图
12/15/2019
3.2
矩形树状图——例题分析
【例3-1】 矩形树状图(treemap)是 将多个类别变量的层次结 构绘制在一个表示总频数 的大的矩形中,每个子类 用不同大小的矩形嵌套在 这个大的矩形中。嵌套矩 形表示各子类别的频数, 其大小与相应的子类频数 成比例。 • 使用treemap包中的
25
数据可视化
12/15/2019
3.3
马赛克图
马赛克图的变种——筛网图
l 使用sieve函数可以绘制筛网图(sieve plot) l 该图可用于展示二维列联表或多维列联表,图
中矩阵的面积与相应单元格的观测频数成比例, 每个矩形中的多个小正方形(网格)表示该单 元格的观测频数,网格的密度表示观察频数与 期望频数的差异
bar plot)或柱形图,类别放在Y轴的条形图称为 水平条形图(horizontal bar plot)
4
数据可视化
12/15/2019
3.1
条形图及其变种
简单条形图和帕累托图——简单条形图——例题分析
【例3-1】 graphics中 的 barplot函 数 绘 制的条形图
5
数据可视化
12/15/2019
l 使用barplot函数默认绘制堆叠条形图,设置参数beside=TRUE可绘制并 列条形图。使用DescTools包中的BarText函数、plotrix包中的barlabels函 数可以给条形图添加标签
9
数据可视化
12/15/2019
3.1
条形图及其变种
并列条形图和堆叠条形图——例题分析
【例3-1】 使 用 barplot结 合 BarText函 数 绘制的条形图
23
数据可视化
12/15/2019
3.3
马赛克图
马赛克图——例题分析
【例3-1】 使用graphics包中的mosaicplot函数、vcd(可视化类别数据)包中的mosaic函数和 strucplot函数可以绘制马赛克图
24
数据可视化
12/15/2019
3.3
马赛克图
马赛克图——例题分析
【例3-1】 使用mosaic函数或strucplot函数可以绘制形式多样的马赛克图
26
数据可视化
12/15/2019
3.3
马赛克图
马赛克图的变种——筛网图——例题分析
【例3-1】 由sieve函数绘制的筛网图
27
数据可视化
12/15/2019
3.3
马赛克图
马赛克图的变种——瓦片图和双层图——例题分析
【例3-1】 使用tlie函数可以绘制瓦片图(tile plot)。该图生成一个矩形网格矩阵,其中每一个矩形的 面积(宽度或高度)与相应单元格的观测频数成正比。使用doubledecker函数可以绘制双层 图(doubledecker plot),该图展示了一个类别变量与另一个类别变量的依赖关系
10
数据可视化
12/15/2019
3.1
条形图及其变种
并列条形图和堆叠条形图——例题分析
【例3-1】 使 用 sjPlot包 中 的 sjp.xtab函 数 可以也绘制的 条形图
11
数据可视化
12/15/2019
3.1
条形图及其变种
并列条形图和堆叠条形图——例题分析
【例3-1】 使 用 epade包 中 的 bar.plot.ade函 数 绘 制的3D条形图。默 认参数beside=TRUE, 绘制并列条形图, 设 置 beside=FALSE 可绘制堆叠条形图
l 以意大利经济学家V.Pareto的名字命名的 l 帕累托图可以看作简单条形图的一个变种,利用
该图很容易看出哪类频数出现得最多,哪类频数 出现得最少。
7
数据可视化
12/15/2019
3.1
条形图及其变种
简单条形图和帕累托图——帕累托图 【例3-1】 barplot函 数 绘 制的帕累托图
8
数据可视化
12/15/2019
3.1
条形图及其变种
并列条形图和堆叠条形图
l 绘制两个类别变量的条形图时,可以使用原始数据绘图,也可以先生 成二维列联表再绘图
l 根据绘制方式不同有并列条形图(juxtaposed bar plot)和堆叠条形图 (stacked bar plot)等
l 并列条形图中,一个类别变量作为坐标轴,另一个类别变量各类别频 数的条形并列摆放;堆叠条形图中,一个类别变量作为坐标轴,另一 个类别变量各类别的频数按比例堆叠在同一个条中
12/15/2019
3.1
条形图及其变种
简单条形图和帕累托图——条形图
l 条形图(bar plot)是用一定宽度和高度的矩形表 示各类别频数多少的图形
l 主要用于展示类别变数据的频数分布 l 绘制条形图时,各类别可以放在X轴(横轴),也
可以放在Y轴(纵轴) l 类别放在X轴的条形图称为垂直条形图(vertical
16
数据可视化
12/15/2019
3.1
脊形图——例题分析
【例3-1】
使

ggiraphExtra
包中的
ggSpine函 数
绘 制 按 第 3个
类别变量分
面的脊形图
条形图及其变种
17
数据可视化
12/15/2019
3.2
树状图
树状图
l 将各类别的层次结构画成树状图的形式,称为树状 图(dendrogram)或分层树状图
【例3-1】 使用graphics包中的assocplot函数可用于绘制二维列联表的相关图
31
数据可视化
12/15/2019
3.4 图
关联图和独立性检验的 P 值
关联图——多维关联图——例题分析
【例3-1】 使 用 vcd包 中 的 assoc函数可以创 建多维列联表的 关联图
32
数据可视化
12/15/2019
3.1
条形图及其变种
简单条形图和帕累托图——简单条形图——例题分析
【例3-1】 sjPlot包 中 的 plot_frq函 数 绘 制的条形图
6
数据可视化
12/15/2019
3.1
条形图及其变种
简单条形图和帕累托图——帕累托图
l 帕累托图(Pareto plot)是将各类别的频数降序排 列后绘制的条形图
14
数据可视化
12/15/2019
3.1
条形图及其变种
不等宽条形图——例题分析
【例3-1】 使 用 ggiraphExtra 包 中 的 ggSpine函 数绘制不等宽条 形图。使用 ggiraphExtra包时, 需要同时加载 ggplot2包
15
数据可视化
12/15/2019
3.1
条形图及其变种
脊形图——例题分析
【例3-1】 使 用 graphics包 中 的 spineplot函 数 、 vcd包 中 的 spine函 数 、 ggiraphExtra包 中 的 ggSpine函数等均可以绘制脊形图。以性别与满意度、网购次数与满意度为例,由 graphics包中的spineplot函数绘制的脊形图
28
数据可视化
12/15/2019
3.3
马赛克图
条件马赛克图——例题分析
【例3-1】 使用vcd包中的cotabplot函数可以创建条件马赛克图
29
数据可视化
12/15/2019
3.4 图
关联图和独立性检验的 P 值
关联图
l 分析列联表中行变量和列变量关系的两种图形 l 关联图就是展示行变量和列变量差异的图形。它将图
treemap函数可以绘制树 状图
22
数据可视化
树状图
12/15/2019
3.3
马赛克图
马赛克图
l 马赛克图是用矩形表示列联表中对应频数的一种图 形
l 图中嵌套矩形的面积与列联表相应单元格的频数成 比例
l 也可以用于二维表的可视化,可视为条形图的一个 变种
l 其变种形式有:筛网图、瓦片图、双层图等
相关文档
最新文档