数据可视化应用2
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数据可视化--相关领域
数据治理涵盖为特定组织机构之数据创建协调一致的企业级视图 (enterprise view)所需的人员、过程和技术,数据治理旨在: 1)增强决策制定过程中的一致性与信心 2)降低遭受监管罚款的风险 3)改善数据的安全性 4)最大限度地提高数据的创收潜力 5)指定信息质量责任
数据可视化--相关领域
数据可视化—历史
自那时起,数据可视化就是一个处于不断演变之中的概念,其边 界在不断地扩大;因而,最好是对其加以宽泛的定义。数据可视 化指的是技术上较为高级的技术方法,而这些技术方法允许利用 图形、图像处理、计算机视觉以及用户界面,通过表达、建模以 及对立体、表面、属性以及动画的显示,对数据加以可视化解释 。与立体建模之类的特殊技术方法相比,数据可视化所涵盖的技 术方法要广泛得多。
数据可视化的适用范围
关于数据可视化的适用范围,目前存在着不同的划分方法。一个 常见的关注焦点就是信息的呈现。例如,迈克尔· 弗兰德利(2008) 提出了数据可视化的两个主要的组成部分:统计图形和主题图。 另外,《Data Visualization: Modern Approaches》(意为“数据可 视化:现代方法”)(2007)一文则概括阐述了数据可视化的下列主 题: 1)思维导图 2)新闻的显示 3)数据的显示 4)连接的显示 5)网站的显示 6)文章与资源 7)工具与服务
数据可视化—历史
数据可视化领域的起源可以追溯到二十世纪50年代计算机图形学 的早期。当时,人们利用计算机创建出了首批图形图表。1987年 ,由布鲁斯· 麦考梅克、托马斯· 德房蒂和玛克辛· 布朗所编写的美 国国家科学基金会报告《Visualization in Scientific Computing》( 意为“科学计算之中的可视化”) ,对于这一领域产生了大幅度的 促进和刺激。这份报告之中强调了新的基于计算机的可视化技术 方法的必要性。随着计算机运算能力的迅速提升,人们建立了规 模越来越大,复杂程度越来越高的数值模型,从而造就了形形色 色体积庞大的数值型数据集。同时,人们不但利用医学扫描仪和 显微镜之类的数据采集设备产生大型的数据集,而且还利用可以 保存文本、数值和多媒体信息的大型数据库来收集数据。因而, 就需要高级的计算机图形学技术与方法来处理和可视化这些规模 庞大的数据集。
数据可视化的适用范围
所有这些主题全都与图形设计和信息表达密切相关。 另一方面,Frits H. Post (2002)则从计算机科学的视角,将这 一领域划分为如下多个子领域: 1)可视化算法与技术方法 2)立体可视化 3)信息可视化 4)多分辨率方法 5)建模技术方法 6)交互技术方法与体系架构
数据可视化的适用范围
数据可视化--相关领域
数据采集(有时缩写为DAQ或DAS),又称为“数据获取”或“数 据收集”,是指对现实世界进行采样,以便产生可供计算机处理 的数据的过程。通常,数据采集过程之中包括为了获得所需信息 ,对于信号和波形进行采集并对它们加以处理的步骤。数据采集 系统的组成元件当中包括用于将测量参数转换成为电信号的传感 器,而这些电信号则是由数据采集硬件来负责获取的。
数据可视化--概述
数据可视化主要旨在借助于图形化手段,清晰有 效地传达与沟通信息。但是,这并不就意味着,数据可 视化就一定因为要实现其功能用途而令人感到枯燥乏味 ,或者是为了看上去绚丽多彩而显得极端复杂。为了有 效地传达思想概念,美学形式与功能需要齐头并进,通 过直观地传达关键的方面与特征,从而实现对于相当稀 疏而又复杂的数据集的深入洞察。然而,设计人员往往 并不能很好地把握设计与功能之间的平衡,从而创造出 华而不实的数据可视化形式,无法达到其主要目的,也 就是传达与沟通信息[2]。
数据可视化--相关领域
数据挖掘是指对大量数据加以分类整理并挑选出相关信息的过 程。数据挖掘通常为商业智能组织和金融分析师所采用;不过 ,在科学领域,数据挖掘也越来越多地用于从现代实验与观察 方法所产生的庞大数据集之中提取信息。 数据挖掘被描述为“从数据之中提取隐含的,先前未知的, 潜在有用信息的非凡过程”,以及“从大型数据集或数据库之中提 取有用信息的科学”。与企业资源规划相关的数据挖掘是指对大 型交易数据集进行统计分析和逻辑分析,从中寻找可能有助于 决策制定工作的模式的过程。
数据可视化--相关领域
数据分析是指为了提取有用信息和形成结论而对数据加以详细研 究和概括总结的过程。数据分析与数据挖掘密切相关,但数据挖 掘往往倾向于关注较大型的数据集,较少侧重于推理,且常常采 用的是最初为另外一种不同目的而采集的数据。在统计学领域, 有些人将数据分析划分为描述性统计分析、探索性数据分析以及 验证性数据分析;其中,探索性数据分析侧重于在数据之中发现 新的特征,而验证性数据分析则侧重于已有假设的证实或证伪。 数据分析的类型包括: 1)探索性数据分析:是指为了形成值得假设的检验而对数 据进行分析的一种方法,是对传统统计学假设检验手段的补充。 该方法由美国著名统计学家约翰· 图基命名。 2)定性数据分析:又称为“定性资料分析”、“定性研究”或 者“质性研究资料分析”,是指对诸如词语、照片、观察结果之类 的非数值型数据(或者说资料)的分析。
数据可视化—历史
短语“Visualization in Scientific Computing”(意为“科学计算之中 的可视化”)后来变成了“Scientific Visualization”(即“科学可视化 ”),而前者最初指的是作为科学计算之组成部分的可视化:也 就是科学与工程实践当中对于计算机建模和模拟的运用。更近一 些的时候,可视化也日益尤为关注数据,包括那些来自商业、财 务、行政管理、数字媒体等方面的大型异质性数据集合。二十世 纪90年代初期,人们发起了一个新的,称为“信息可视化”的研究 领域,旨在为许多应用领域之中对于抽象的异质性数据集的分析 工作提供支持。因此,目前人们正在逐渐接受这个同时涵盖科学 可视化与信息可视化领域的新生术语“数据可视化” 。
数据可视化的成功应归于其背后基本思想的完备性:依据数据及 其内在模式和关系,利用计算机生成的图像来获得深入认识和知 识。其第二个前提就是利用人类感觉系统的广阔带宽来操纵和解 释错综复杂的过程、涉及不同学科领域的数据集以及来源多样的 大型抽象数据集合的模拟。这些思想和概念极其重要,对于计算 科学与工程方法学以及管理活动都有着精深而又广泛的影响。《 Data Visualization: The State of the Art》(意为“数据可视化:尖端 技术水平”)一书当中重点强调了各种应用领域与它们各自所特 有的问题求解可视化技术方法之间的相互作用。
数据可视化
数据可视化
数据可视化是关于数据之视觉表现形式的研究;其 中,这种数据的视觉表现形式被定义为一种以某种 概要形式抽提出来的信息,包括相应信息单位的各 种属性和变量[1]。 数据可视化技术的基本思想是将数据库中每一 个数据项作为单个图元元素表示,大量的数据集构 成数据图像,同时将数据的各个属性值以多维数据 的形式表示,可以从不同的维度观察数据,从而对 数据进行更深入的观察和分析。
数据可视化--概述
数据可视化与信息图形、信息可视化、科学可视化以及 统计图形密切相关。当前,在研究、教学和开发领域, 数据可视化乃是一个极为活跃而又关键的方面。“数据 可视化”这条术语实现了成熟的科学可视化领域与较年 轻的信息可视化领域的统一[3]。
数据可视化--基本概念
数据可视化技术包含以下几个基本概念: ①数据空间:是由n维属性和m个元素组成的数据集 所构成的多维信息空间; ②数据开发:是指利用一定的算法和工具对数据进 行定量的推演和计算; ③数据分析:指对多维数据进行切片、块、旋转等 动作剖析数据,从而能多角度多侧面观察数据; ④数据可视化:是指将大型数据集中的数据以图形 图像形式表示,并利用数据分析和开发工具发现其中未 知信息的处理过程。
数据管理,又称为“数据资源管理”,包括所有与管理作为有价值 资源的数据相关的学科领域。对于数据管理,DAMA所பைடு நூலகம்出的正 式定义是:“数据资源管理是指用于正确管理企业或机构整个数据 生命周期需求的体系架构、政策、规范和操作程序的制定和执行 过程”。这项定义相当宽泛,涵盖了许多可能在技术上并不直接接 触低层数据管理工作(如关系数据库管理)的职业。