10数据可视化基础 (6)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
运行结果截图
数据的相 关关系
气泡图
气泡图与散点图相似, 不同之处在于,气泡 图允许在图表中额外 加入一个表示大小的 变量。实际上,这就 像以二维方式绘制包 含三个变量的图表一 样。其基本框架如图 所示。
数据的相 关关系
基于Python的气泡图实现
1. import matplotlib.pyplot as plt 2. import pandas as pd 3. import numpy as np 4. crime = pd.read_csv("../data/crimeRatesByState2005.csv") 5. crime2 = crime[crime.state != "United States"] 6. crime2 = crime2[crime2.state != "District of Columbia"] 7. s = list(crime2.population/10000) 8. colors = np.random.rand(len(list(crime2.murder))) 9. cm = plt.cm.get_cmap() 10. plt.scatter(x=list(crime2.murder), y=list(crime2.burglary), s=s, c=colors, cmap=cm, linewidth=0.5, alpha=0.5) 11. plt.xlabel("murder") 12. plt.ylabel("burglary") 13. plt.show()
大数据可视化技术 第五章
关系数据可视化
02
数据的关联性
散点矩阵图
散点矩阵图 也叫散点图矩阵, 它允许同时看到 多个单独变量的 分布和它们两两 之间的关系,是 多个散点图的有 机结合,其基本 框架如图所示。
数据的相 关关系
Seaborn
Seaborn是基于matplotlib的图形可视数化据p的y相thon包。它提供了一种高度交互式界面, 便于用户能够做出各种有吸引力的统计图表关。关系
Matplotlib试着让简单的事情更加简单,困难的事情变得可能,那么Seaborn就是 让困难的东西更加简单。—— Michael Waskom
基于Python的散点矩阵图实现
1. import pandas as pd 2. import matplotlib.pyplot as plt 3. import seaborn as sns 4. crime = pd.read_csv("../data/crimeRatesByState2005.csv") 5. crime = crime[crime.state != "United States"] 6. crime = crime[crime.state != "District of Columbia"] 7. crime = crime.drop(['state'], axis=1) 8. crime = crime.drop(['population'], axis=1) 9. g = sns.pairplot(crime, diag_kind="kde", kind="reg") 10. plt.show()
运行截图
代码的运行结果如图所示。
谢谢观看
百度文库
Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容 易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制 作具有更多特色的图。应该把Seaborn视为matplotlib的补充,而不是替代物。同时它 能高度兼容numpy与pandas数据结构。