基于子空间聚类的高维数据可视分析方法综述

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2018,54(13)基于子空间聚类的高维数据可视分析方法综述
田帅,陈谊
TIAN Shuai,CHEN Yi
北京工商大学计算机与信息工程学院食品安全大数据技术北京市重点实验室,北京100048
Beijing Key Laboratory of Big Data Technology for Food Safety,School of Computer and Information Engineering,Beijing Technology and Business University,Beijing 100048,China
TIAN Shuai,CHEN Yi.A survey of high dimensional data visual analysis methods based on subspace puter Engineering and Applications,2018,54(13):19-26.
Abstract :With the rapid development of information technology and the advent of big data era,the data show the com-plex features of high dimensionality and nonlinearity.For high-dimensional data,it is often difficult to find feature regions that reflect distribution patterns in full-dimensional space,but most of the traditional clustering algorithms only have good scalability for low-dimensional data.Therefore,when the traditional clustering algorithm processes high-dimensional data,the clustering results may not meet the needs of the current stage.The subspace clustering algorithm searches for clusters existing in the high-dimensional data subspace,and divides the original feature space of data into different subsets of fea-tures to reduce the influence of uncorrelated features and preserve the main features in the original data.The subspace clustering method can find the information that is not easy to show in high-dimensional data and display the internal struc-ture of data attributes and dimensions through visualization techniques,which provides an effective method for visual analysis of high-dimensional data.This paper summarizes the research progress of high-dimensional data visual analysis methods based on subspace clustering in recent years,and elaborates three different methods based on feature selection,subspace exploration and subspace clustering.Then,the methods and applications of its interaction analysis are analyzed,and the future development trends of visual analysis methods of high-dimensional data are prospected.
Key words :high dimensional data;visual analysis;subspace exploration;subspace clustering
摘要:随着信息技术的飞速发展和大数据时代的来临,数据呈现出高维性、非线性等复杂特征。

对于高维数据来说,在全维空间上往往很难找到反映分布模式的特征区域,而大多数传统聚类算法仅对低维数据具有良好的扩展性。

因此,传统聚类算法在处理高维数据的时候,产生的聚类结果可能无法满足现阶段的需求。

而子空间聚类算法搜索存在于高维数据子空间中的簇,将数据的原始特征空间分为不同的特征子集,减少不相关特征的影响,保留原数据中的主要特征。

通过子空间聚类方法可以发现高维数据中不易展现的信息,并通过可视化技术展现数据属性和维度的内在结构,为高维数据可视分析提供了有效手段。

总结了近年来基于子空间聚类的高维数据可视分析方法研究进展,从基于特征选择、基于子空间探索、基于子空间聚类的3种不同方法进行阐述,并对其交互分析方法和应用进行分析,同时对高维数据可视分析方法的未来发展趋势进行了展望。

关键词:高维数据;可视分析;子空间探索;子空间聚类
文献标志码:A 中图分类号:TP391doi :10.3778/j.issn.1002-8331.1802-0186
基金项目:“十二五”国家科技支撑计划(No.2012BAD29B01-2);国家科技基础性工作专项(No.2015FY111200);北京市科技计划
课题(No.Z151100001615041);虚拟现实技术与系统国家重点实验室开放基金(No.BUAA-VR-17KF-07);2018年研究生科研能力提升计划项目。

作者简介:田帅(1991—),男,硕士研究生,CCF 学生会员,主要研究领域为可视化与可视分析;陈谊(1963—),通讯作者,女,博
士,教授,博士生导师,CCF 杰出会员,主要研究领域为信息可视化与可视分析、食品安全数据分析、虚拟现实等,E-mail :chenyi@ 。

收稿日期:2018-02-26修回日期:2018-05-15文章编号:1002-8331(2018)13-0019-08
Computer Engineering and Applications 计算机工程与应用
19
Computer Engineering and Applications计算机工程与应用2018,54(13)
1引言
随着大数据时代的到来,各行各业产生数据的能力日益增强,各种各样的信息形式和信息存储量与日俱增。

面对具有高维性、非线性等复杂特征的数据[1],人们日益迫切需要发现其中隐藏的重要价值。

其中,高维数据由于其具有高维特征而受到了高度的重视,并成为了计算机领域的研究热点。

为了全面而准确地反映信息的特征及其内在规律,往往需要考虑多个指标,如何处理这些高维数据已经成为一个非常重要的问题。

另外,高维数据往往具有稀疏性特征,在高维空间中数据点比较分散,而且高维数据的出现带来了“维度灾难”的情况。

随着维度的增加,传统方法在高维数据上的局限性日益明显,如Walker等[2]引入了一种基于物理隐喻的力导向平行坐标,并结合多种交互手段一起探索多变量数据,能够快速识别数据的相关性和趋势。

Palmas等[3]提出了一种基于密度聚类的平行坐标边绑定技术,对于相关性的判断更为准确。

以上两种方法,随着维度的增加,平行坐标会产生一定的视觉混乱现象,从而影响用户对于数据的分析。

除了平行坐标轴方法,散点图矩阵也是处理高维数据常用的方法,如一种改进的散点图方法,Elmqvist等[4]将散点图扩展到三维空间中,通过旋转方块的方式扩展了可映射维度的数目。

由于高维数据的稀疏性,一些信息只存在于局部空间中,对于全局空间来说,分析起来较为复杂。

高维空间中往往难以使数据在全维空间密集,甚至很多数据在整个空间中并没有明确的分类,因此使得探寻的目标类存在于某些低维子空间中[5-6]。

不同的数据可能对应不同的子空间,要在全空间进行聚类较为困难,而子空间聚类方法能够很好的解决此问题。

子空间聚类是传统聚类方法的扩展,目的是将不同子空间的高维数据聚类到其本质上所属的低维子空间中。

同时,为了让用户对高维数据有一个直观的印象,本文采用可视分析技术进行数据展示。

可视分析技术依靠可视化交互界面来辅助用户,从而对复杂数据进行探索分析[7]。

在基于子空间聚类的高维数据中应用可视分析技术,易于直观展示数据子空间聚类的结果,增强人对数据的可读性,并通过交互探索方式发现数据在相应子空间的投影等。

比如Ward等[8]提出的一种可视化软件XmdvTool,是一款应用起来非常便利的可视化软件。

本文主要从基于子空间聚类的高维数据可视分析方法角度出发,讨论其基础理论、关键技术、面临的挑战及展望。

2子空间聚类基本概念
1998年,Agrawal等人使用自动子空间聚类方法对高维数据进行挖掘时,第一次提出子空间聚类的概念[9],其中,子空间指的是维度小于全空间的部分空间。

而子空间聚类方法则是将特征选择技术和聚类技术相结合,并在维度空间或数据空间中搜索可能存在的子空间,从而得到相应的子空间和聚类产生的结果簇。

子空间聚类的定义如下:给定一组数据X=(x1,x2…, x N)∈R D×N,设这组数据来自k个不同的线性子空间的
并S=∪i=1k S i[10],其中,D表示数据的全空间维数,N表示数据矩阵中向量的个数,k的取值范围大于等于1。

3基于子空间聚类的高维数据可视分析方法基于子空间聚类的高维数据可视分析方法是将高维数据空间中发现簇的过程限制到少量的相关属性维度上,并结合可视分析方法,提供交互式可视分析。

图1展示了利用子空间聚类对高维数据进行处理和分析的基本过程,主要包括3部分:(1)获取与处理所需的高维数据;(2)通过3种方法中的一种与可视分析技术相结合,可视化呈现高维数据中的低维信息图;(3)用户与可视分析系统的交互。

对于应用子空间聚类处理高维数据,本文根据文献[11]中所述分类方法,即维度空间探索、维度子集分析和非坐标轴对齐型子空间。

大致分为3部分:基于特征选择的方法、基于子空间探索的方法和基于子空间聚类的方法。

3.1基于特征选择的方法
高维数据的特征往往存在冗余性,这些冗余特征可能会影响聚类的准确性,并增加算法的时间复杂度。

如果预先对高维数据进行特征选择,选出合理的特征子集,则能够有效降低算法的时间复杂度,同时提高分析结果的准确度。

因此,特征选择的目的是从原始数据集中选取有意义的特征来降低数据维度。

特征选择大致分为3类:过滤型方法、封装型方法和混合型方法[12]。

2000年,Dy等[13]提出了使用期望最大化聚类的可视特征子集选择方法,
指导用户进行特征子集的搜索,图1基于子空间聚类的高维数据可视分析过程
20
2018,54(13)并且能够通过最大似然度等进行聚类效果和特征的评估。

为了提高特征选择的精度和速度,一种自适应软子空间聚类算法ASCOD [14]被研究人员提出,并应用于入侵特征选择领域,提高了入侵检测的速度和精度。

2011年,从指导用户选择较好的特征选择方法角度出发,研究人员提出了SmartStripes 可视化方法,帮助用户了解特征子集选择的过程[15]。

同样,Wang 等[16]使用交互式可视分析方法来进行特征选择,从而分析复杂的多变量时变数据。

更进一步,2014年,Krause 等[17]设计并实现了一个可视分析系统INFUSE ,能够帮助分析人员理解特征选择算法中的预测特征,从而创建自定义交互式模型。

Wang 等[18]设计并开发了两个系统,即特征分析系统和集成系统,分别用于在数据中交互选择静态特征和时变特征。

3.2基于子空间探索的方法3.2.1维度空间探索维度空间探索方法主要是通过交互手段探索维度
之间的相关性。

随着可视化领域的蓬勃发展,使用可视
化方法辅助数据挖掘过程,可以帮助用户更加直观地理
解数据[19]。

因此,交互式可视分析对于子空间聚类和维
度之间关系的研究提供了有力的支持与帮助。

2008年,一个称为Morpheus 的工具被设计出来,通
过可视化和子空间聚类的交互式探索来帮助理解知识
发现过程,用户可以浏览整个子空间聚类结果视图,深
入分析子空间聚类特征并放大到对象分组[20]。

2012年,
Tatu 等[21]介绍了一个名为ClustNails 的子空间聚类可视
分析系统,设计了Spike 和HeatNail 两种新颖的可视化技术,并通过用户交互方式,来帮助解释子空间聚类的
结果。

Turkay [22]等提出了一种可视化模型,该模型能够对多维数据集的维度以及实际数据值进行联合交互式可视化分析。

随后,Turkay 等[23]又进行了改进,提出一种基于代表性因素的交互式可视识别方法,能够对高维数据进行结构感知分析,并将代表性因素与维度相关联,通过使用代表性因素迭代分析数据。

2013年,Yuan 等[24]提出了层次化的交互式子空间可视分析方法,可以在数据空间和维度空间下同时对高维数据进行探索。

随着时间事件序列数据越来越普遍,如何处理高维中时
间事件序列数据也受到了广泛关注,一种支持高维时间
事件序列数据分析的可视化分析技术DecisionFlow [25]应
运而生,将可扩展的动态时间事件数据与交互式可视分
析相结合,进行任务分析。

Liu 等[26]引入了一个新颖的
基于子空间分析和动态投影的可视分析方法,并通过交
互式方法来探索与分析高维数据集,理解不同投影之间
的关系并发现其中的隐藏模式。

探索特征子空间是分析和理解多维数据分布模式的有效方法之一,在单一聚类的方法上,2015年,Watanabe 等[27]融合双聚类技术从多维数据中提取特征子空间,这种方法的自动化程度比较高,能够有效地支持他们进一步探索。

如图2所示的系统界面,界面主要以平行坐标
的可视化形式展现数据探索过程,并辅以历史树来帮助用户记录探索过程。

近几年,人们提出了一些新方法,比如Turkay 等[28]提出技术和设计注意事项,将渐进方法结合到高维数据的交互式分析过程中,然后提出一套设计建议和方法来支持分析师完成高维数据分析任务。

对原始子空间的维度进行组合并不能总是有效地找到预期子空间,因此在这项研究中,Zhou 等[29]帮助用户根据子空间的数据投影重建新的维度,以保留有意义的簇信息,并提供一个可视分析工具,帮助用户探索子空间簇。

Kewei 等[30]提出了一个交互式工作流程,允许用户设计多变量传递函数,所有变量对之间的关系以矩阵视
图的形式呈现出来,其中用户可以对不同的子空间进行
浏览,并可以使用基于熵的方法来选择要探索的子空间。

在分析高维数据时,许多分析方法假定数据集包含特定结构,并会产生一个反复试验的过程,耗费时间较长,因此Xia 等[31]提出一个LDSScanner 视图,用于导航和推理高维数据集的内部结构,并有助于数据模型和配置的优化选择。

如图3所示可视分析系统,通过配置面板调整参数,产生不同的可视化结果,通过overview+details
的形式展现在系统主界面上。

图2Watanabe
提出的双聚类系统界面
图3LDSScanner 系统探索界面
田帅,陈谊:基于子空间聚类的高维数据可视分析方法综述
21
Computer Engineering and Applications 计算机工程与应用
2018,54(13)总的来说,通过使用交互式可视分析方法进行维度空间探索,可以帮助用户在高维数据中进行低维结构的探索,从而发现数据中隐藏关系。

3.2.2非坐标轴对齐型子空间就子空间聚类而言,非坐标轴对齐型方法也是一种比较好的选择,其形成的子空间可能存在与任意方向。

与之对应的还有一种方法是坐标轴对齐子空间[32],如:CLIQUE [33]、ENCLUS [34]、PROCLUS [35]等聚类算法。

它们组成子空间的每个维度,相对于原始空间的维度,其方向在空间中没有发生改变。

相对于坐标轴对齐子空间来说,非坐标轴对齐型子空间更加灵活。

投影追踪[36]是最早的作品之一,给出了一个多元数据分析算法,旨在自动识别有趣的非坐标轴对齐型子空间。

GGOBI 系统[37]通过对XGobi 系统[38]的改进,嵌入其他软件或增加插件来进行扩展,并结合投影追踪[36]索引来向更“有趣”的方向转变。

另外,2013年,研究人员提出的TripAdvisor N-D 系统,通过引导用户在不同投影下进行高维数据的探索[50]。

最近,非坐标轴对齐子空间聚类方法取得了一些进展,如文献[39]研究了一种称为稀疏子空间聚类的算法来对位于低维子空间中的数据点进行聚类。

Lehmann 等[40]提出了一个数据驱动的方法来寻找某些数据模式的最小投影集合,并且通过采用相异性最大化方法,对多维数据进行可视化,如图4所示,显示了一个具有三维度的数据集,以及对应的两种投影表示结果和投影结果之间的距离表示结果图。

投影追踪是寻找多维空间中有意义的低维投影的有效方法,但是对于高维空间不易扩展,Anand 等[41]介绍了一种新的方法探索高维数据空间中有意义的方面。

3.3基于子空间聚类的方法在进行高维数据可视化时,与维度空间探索方式相比,还有一种较为流行的方法,通过子空间聚类方法自动将相关维度分组成簇,进行维度子集分析,发现较低维度的结构。

除了文献[42]中提及的一些经典子空间聚类算法,下面本文将介绍近年来子空间聚类算法与可视分析技术相结合的研究成果与应用。

2004年,Bohm 等[43]结合局部子空间思想,对高维数据中的离群点检测需求进行分析,提出一种利用信息熵
进行加权子空间的选取方法。

Kröger 等[44]引入SUBCLU
(密度连接的子空间聚类),这是一种有效的子空间聚类方法,使用DBSCAN 算法的密度连接概念,SUBCLU 能够在子空间中检测任意形状和定位簇。

随后,Assent 等[45]提出了维空间无偏子空间聚类,允许用户浏览整个子空间聚类,放大个别对象,并深入分析子空间聚类特征。

2010年,Ferdosi 等[46]提出一种排序子空间聚类方法,在密度场上应用连通形态学算子,为重要子空间的
分析提供可视化支持。

文献[47]在早期工作[46]基础上,利用子空间分析方法,引入了一种适用于平行坐标和散点图矩阵的维度排序方法。

2012年,Farber 等[48]利用SURFING [49]算法来对高维空间进行搜索,并自动识别有意义的子空间候选集合,允许用户比较涉及到的维度和对象集群的子空间。

2013年,多维数据探索工具Tri-padvisor N-D[50]采用观光隐喻来进行高维空间导航和探
索。

Liu 等[51]为了解决子空间聚类问题,提出一种新的目标函数Low-Rank Representation (LRR ),可以高效地进行子空间聚类操作并进行纠错。

一般来说,高维数据往往分布在多个低维子空间中,且具有稀疏性因此对高维数据进行稀疏表示也是一种探索方法。

Elhamifar 等[52]提出了一种基于稀疏表示(SR )的方法,来对嵌入高维空间的多个低维线性或仿射子空间的数据进行聚类。

更进一步,Elhamifar 等[53]提出了一种称为稀疏流形聚类和嵌入(SMCE )的算法,可以同时聚类和降维多个非线性流形中的数据。

张红等[54]提出了一个子空间结构引导的低秩正则项,保证了
数据的相似度矩阵的一致性。

Soltanolkotabi 等[55]介绍
了一种基于稀疏子空间聚类(SSC )的噪声数据聚类算
法,使用几何功能分析的思想,表明该算法可以准确地
恢复在其方向最低要求下的底层子空间,以及每个子空
间的样本数量。

近几年,对于子空间聚类方法的研究又进行了结合
与创新。

为了揭示数据子集维度的局部相关性,2016
年,夏佳志等[56]提出了一种局部相关性可视分析方法,
给出可能具有局部相关性的二维子空间推荐,最后实现了一个可视分析系统,如图5所示的可视分析系统界面,通过多视图协同方法进行探索数据中的低维结构表
示。

为了解决可视化子空间聚类工作流和直观的子空
间可视化描述,2017年,Xia 等[57]提出一个维度相关性度量来表示相应子空间中的聚类意义,可视化界面中清楚地显示了子空间之间的维度重叠和簇之间重叠的数据,以及提出超图和可视化来描述子空间的结构,如图6所示,显示了子空间边集和对于维度子集的编辑功能,以
图4相异函数视图(a )Data (b )A 1·Data (c )B ·Data (d )Q 1·A 1·Data+(r 1,…,r 1)(e )dist (B ,A 1)
Distance of a Record to
the Orgin in Data Space max 0
22
2018,54(13)及数据的分布情况。

罗靖等[58]提出了基于SUBCLU [44]算法改进的高维子空间聚类算法BDFS-SUBCLU ,采用基于回溯法的深度优先搜索策略,提高了算法的效率。

宋奎勇等[59]提出一种共享最近邻子空间聚类算法——SNNsC ,能够保证子空间搜索的及聚类准确性。

基于软子空间算法的研究也是最近几年的研究热点,在大多数情况下,我们很难确定一个高维数据的特征组信息,因此Gan 等[60]在FGKM [61]的基础上提出了AFGKM 软子空间聚类算法,能够对特征进行自动分组的高维数据子空间聚类算法。

Chitsaz 等[62]为了处理高维数据,提出带有噪声检测的模糊子空间聚类(FSSC-ND )、基于熵权软子空间聚类和噪声聚类。

Chen 等[63]提出了一种新颖的分类数据聚类算法,该算法基于分类属性的核密度估计,使用概率距离函数来测量分类数据对象间的不相似性,并通过软特征选择方案,为每个分类属性自动分配一个与聚类中相关的权重。

邱云飞等[64]以k -均值聚类算法为基础,提出了一个整合簇内紧密度和簇
间距离的软子空间算法,实现了算法的自适应学习,取
得了较好的实验效果。

关于软子空间算法和该领域近
年来的发展状况,可以参考文献[65]。

4小结
基于子空间聚类的高维数据可视分析方法,旨在利
用子空间聚类方法将高维数据中内在的低维结构表示
出来,解决高维数据因维数较多而产生人难以理解的信息。

如表1所示,进行了3种分类之间的差异性比较。

子空间聚类方法通过特征选择和聚类,找出簇中有意义
的子空间,并通过可视化方法展示数据之间的关联关系
和相关关系。

本文对近年来国内和国际上发表的关于
子空间聚类的高维数据可视分析研究的学术成果进行
了回顾与总结,对高维数据带来的挑战进行了分析,同
时阐述了子空间聚类中高维数据若干问题的研究现状,
从不同角度对子空间聚类的高维数据进行了详细的分析与对比。

本文将在下文进行存在问题的讨论与未来
研究方向的展望。

5存在的问题及未来研究方向
虽然基于子空间聚类的高维数据可视分析研究近
年来取得了一定的进展,但是仍然存在一些亟待解决的问题。

子空间聚类的高维数据可视分析方法未来方向
有:高维数据分析的扩展性,如何在数据规模爆炸式增长的情况下,保证运算结果的效率和正确率;子空间聚类方法的评价与优化,如何在子空间聚类算法的效率、聚类的形状、离群点的敏感性方面上进行提高;高维数据可视分析与深度学习方法结合,如何较好地实现深度学习模型与子空间方法之间的结合,进行数据的特征提
取。

现将以上今后研究方向详细阐述如下:
(a )数据信息面板(b )LSD-GD 视图(c )二维散点图(d )散点
图列表图5可视分析系统界面Subspace Edgcs Editing Dimension
Subset (a )(b )(c )(d )图6可视化组件和交互工具界面方法分类基于特征选择的方法基于子空间探索的方法基于子空间聚类的方法描述包括特征子集选择,即从原始数据集中选择一些有意义的特征包括维度空间探索,非坐标轴对齐型子空间。

通过交互方式探索维度之间的关系包括维度子集分析。

通过子空间聚类方法自动
将相关维度分组成簇典型参考文献特征选择文献[13]、[14]、[18]维度空间探索
文献[24]、[27]、[31]非坐标轴对齐文献[36]、[40]、[41]维度子集分析文献[50]、[55]、[57]适用数据类型适合数值型数据、语义数据,但是数据规模不能太大适合数值型数据、语义数据等适合数值型、语义数据等效率和复杂度效率较低,
复杂度相对来说也较低交互式探索方法效率较高,并且复杂度较高相较与其他两类方法,效率高且复杂度高优点通过选择的特征进行评估,减少不必要特征的影响交互式探索能够
发现更多细节,数据分布不一定是同一个低维空间
自动分组成簇,效
率相对来说较高,减少人工成本不足之处需要高维数据分布于同一个低维空间,
扩展性较差
自动分组成簇方面
有待改善
虽然自动分簇,但是
冗余相对来说较高
表1基于子空间聚类的高维数据可视分析方法分类比较
田帅,陈谊:基于子空间聚类的高维数据可视分析方法综述
23
Computer Engineering and Applications计算机工程与应用2018,54(13)
(1)高维数据分析的可扩展性
大数据时代的数据规模已经呈现爆炸式增长,数据量的无限积累与数据的持续增长,使得以往方法无法达到目的,运算能力达到瓶颈,因此对于大规模高维数据的处理,集群分布式并行处理的方法具有很好的扩展性。

比如一些研究人员利用集群系统,同时结合MapReduce编程模型的数据处理能力,设计并提出一种基于相关子空间的局部离群算法[66],有较好的扩展性。

Jo等[67]提出了一个大规模高维数据的响应式和增量式可视化探索系统——SwiftTuna,对于大规模高维数据有很好的扩展性。

因此,对于超高维数据的处理,如何结合大规模并行处理方法与超级计算机,将是下一步面临的挑战。

(2)子空间聚类方法的评价与优化
在处理高维数据时,使用子空间聚类方法是现阶段比较流行的方法,能够将高维数据在低维空间中的固有聚类属性表示出来。

另外,对于子空间聚类算法中,算法的效率、聚类的形状、离群点的敏感性等,都会对数据集产生影响。

但是涉及此方面的评价与优化研究较少,比如一种新的方法Cartification[68],基于频繁项集挖掘的子空间聚类方法,能够改善高维数据中的知识发现。

未来从多个方面考虑子空间簇的选择及子空间聚类的效率等,将会是一个挑战。

(3)结合深度学习等方法
现如今,机器学习、深度学习发展迅猛,提供了一些便捷、高效的处理方法,为高维数据可视分析方面提供了很好的帮助。

最近也有一些研究,通过可视化方法对深度学习进行展示,如文献[69]提出了一个可视化工具TensorFlow Graph Visualizer,借助数据流图的表达能力,从多个层面表现深度学习算法。

由于深度学习模型在特征提取方面的优越性,如何较好地实现深度学习与子空间方法之间的结合,对数据特征提取方面增加新的方法,将会是下一步需要研究的内容。

参考文献:
[1]梁吉业,冯晨娇,宋鹏.大数据相关分析综述[J].计算机学
报,2016,39(1):1-18.
[2]Walker R,Legg P A,Pop S,et al.Force-directed parallel
coordinates[C]//Proceedings of International Conference on Information Visualisation,2013:36-44.
[3]Palmas G,Bachynskyi M,Oulasvirta A,et al.An edge-
bundling layout for interactive parallel coordinates[C]// Proceedings of IEEE Pacific Visualization Symposium,2014:57-64.
[4]Elmqvist N,Dragicevic P,Fekete J D.Rolling the dice:
Multidimensional visual exploration using scatterplot matrix
navigation[J].IEEE Transactions on Visualization and Computer Graphics,2008,14(6):1141.
[5]Parsons L,Haque E,Liu H.Subspace clustering for high
dimensional data:A review[J].ACM SIGKDD Explora-tions Newsletter,2004,6(1):90-105.
[6]Vidal R.A tutorial on subspace clustering[J].IEEE Signal
Processing Magazine,2011,28(2):52-68.
[7]Thomas J J,Cook C A.Illuminating the path:The research
and development agenda for visual analytics[M].Los Alamitos:IEEE Computer Society,2005:1-180.
[8]Ward M O.XmdvTool:Integrating multiple methods for
visualizing multivariate data[C]//Proceedings of IEEE Conference on Visualization,1994:326-333.
[9]Agrawal R,Gehrke J,Gunopulos D,et al.Automatic
subspace clustering of high dimensional data for data mining applications[C]//Proceedings of ACM SIGMOD International Conference on Management of Data,1998:94-105.
[10]王卫卫,李小平,冯象初,等.稀疏子空间聚类综述[J].自
动化学报,2015,41(8):1373-1384.
[11]Liu S,Maljovec D,Wang B,et al.Visualizing high-
dimensional data:Advances in the past decade[J].IEEE
Transactions on Visualization&Computer Graphics,2017,23(3):1249-1268.
[12]Liu H,Yu L.Toward integrating feature selection algo-
rithms for classification and clustering[J].IEEE Transac-
tions on Knowledge&Data Engineering,2005,17(4):491-502.
[13]Dy J G,Brodley C E.Visualization and interactive fea-
ture selection for unsupervised data[C]//Proceedings of
ACM SIGKDD International Conference on Knowledge
Discovery and Data Mining,2000:360-364.
[14]黄红艳,胡吉朝.子空间聚类在入侵特征选择中的应用[J].
计算机工程与应用,2012,48(8):96-98.
[15]May T,Bannach A,Davey J,et al.Guiding feature subset
selection with an interactive visualization[C]//Proceedings
of Visual Analytics Science and Technology,2011:111-120.
[16]Wang J,Sisneros R,Huang J.Interactive selection of
multivariate features in large spatiotemporal data[C]//
Proceedings of Visualization Symposium,2013:145-152.
[17]Krause J,Perer A,Bertini E.INFUSE:Interactive feature
selection for predictive modeling of high dimensional
data[J].IEEE Transactions on Visualization&Computer
Graphics,2014,20(12):1614-1623.
[18]Wang J.Interactive feature selection and visualization
for large observational data[D].University of Tennessee,2014.
24。

相关文档
最新文档