多维信息可视化模型

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

科技情报开发与经济

ＳＣＩ－ＴＥＣＨＩＮＦＯＲＭＡＴＩＯＮＤＥＶＥＬＯＰＭＥＮＴ＆ＥＣＯＮＯＭＹ２００６年第１６卷第１０期

信息可视化（ＩｎｆｏｒｍａｔｉｏｎＶｉｓｕａｌｉｚａｔｉｏｎ）是利用图像、图形、动画等视觉形式来表示大量信息和信息之间的关系，并且寻找隐藏在数据背后的隐性部分。按照信息资源本身的特性可以划分为７类：一维信息可视化、二维信息可视化、三维信息可视化、多维信息可视化、时间顺序信息可视化、层次信息可视化和网络信息可视化［

１

］。随着ＸＭＬ、语义网的应用，规

范化、结构化、可被机器理解的数据越来越普遍，为从多种信息源提取数据，从而生成可视化的图形提供了良好的基础。

但是，其中的多维信息可视化仍是一个未能很好解决的信息可视化类别，本文针对这点提出了多维信息可视化模型。

１多维信息可视化存在的问题

（１）多维信息可视化的实现很大程度上仍依赖于一维、二维或三维

空间来实现。由于一维、二维或三维信息可视化都能很直观的通过线、面或者三维空间表示，但是多维信息由于其维度超过３个，而人们的习惯又只限于三维以内。另外，多维信息又不同于时间序列信息、层次信息、网络信息，有着很强的逻辑性。

如何将这种多维转化为三维或三维以内，或者用其他的方法让人们更好地接受，是多维模型需要进一步研究的。

（２）多维信息可视化的实现可以更高地实现隐性知识的挖掘。显性知识是可以通过语言表达和理解的知识，如专利、

发明和特种技术等都属于显性知识，它可以储存在光盘、硬盘、书本等介质中。而隐性知识不是很容易能用语言描述和理解的。除了少量的知识可被人理解和描述外，绝大部分是不易被理解和传播的，被叫做

“只可意会，不可言传”的知识，它只能被演示证明存在。多维信息可视化模型，正好利用这种被演示证明存在，通过多维从不同维度出发将信息演示出来［

２

］。在表达中，我们

更关注相关维的关系以及它们的排序和不同排序表达出来的信息效用。另外，由于用户对信息的需求不同，因而会产生对信息维的不同需求，针对不同用户提出符合用户的多维信息可视化模型。由于摆在我们面前的信息都属于显性的，我们还需要通过不同维度的排序方法和对信息进行挖掘的方法，实现对隐性知识的挖掘。

２多维信息可视化模型的提出

信息可视化的一个重要任务就是将信息以简洁的方式呈现在人们

的眼前，即可视化。下面，就针对多维模型多维表达困难的问题提出多维信息可视化模型，它是一种在二维平面内，表达多维的模型。

它的提出思路是来源于蜘蛛网，蜘蛛网上存在着多条维线，这些多条维线起着架构整个蜘蛛网的作用。把它的多条维线引入到多维模型里，能很好地解决多维的表达。

２．１基本模型（Ｎ维模型）

首先，为多维信息可视化模型设计一个正多边形，其顶点数与多维

信息的维数相同，记做Ｎ。取正多边形中心，记作Ｏ。连接Ｏ与多边形的各个顶点（Ａ，Ｂ，Ｃ…），再根据每个信息维对应的信息相关度Ｐｉ（百分比），从中心出发取中心到每个顶点长度的百分比长度，取点Ａ′，Ｂ′，Ｃ′…，并连接点Ａ′，Ｂ′，Ｃ′…，在正多边形里得到一个小的多边形，如同一个

蜘蛛网（见图１）。小的多边形与大的多边形面积的比为这个多维信息的整体相关度。

由于每个信息维的排列不同会引起小多边形面积的变化，所以它们的面积比也会有所浮动。针对这一问题，借用概率论的原理来解决，即每两个信息维相关度的乘积（Ｐｉ×Ｐｊ）出现概率相同。将（Ｐｉ×Ｐｊ）乘以它们出现的概率，就可以得到它们的面积比。其表达式为：

Ｓ＝ｉ＜ｎ，ｊ＜ｎ

ｉ＝０，ｊ＝ｉ＋１

!Ｐｉ×Ｐｊ×２／〔ｎ×

（ｎ－１）〕多维信息相关度算法实现为（Ｃ语言）：

ｉｎｔＳ＝０，Ｋ＝０；／／Ｋ为Ｐｉ×Ｐｊ的次数

ｆｏｒ

（ｉ＝０；ｉ＜ｎ；ｉ＋＋）｛ｆｏｒ（ｊ＝ｉ＋１；ｊ＜ｎ；ｊ＋＋）｛Ｓ＝Ｓ＋Ｐｉ・Ｐｊ；Ｋ＝Ｋ＋１｝｝Ｓ＝Ｓ・ｎ／Ｋ

在基本模型里，每个信息维在模型中的排序，是根据系统分析的相关性进行排列；同时，保存每次用户提出过的排列顺序和使用率较高的排列顺序。结合系统和使用过的数据，对已有的排列顺序进行重排列。

２．２选择模型（Ｎ－Ｍ模型）

由于多维信息中，用户并不是对其中的所有信息维都感兴趣，其中

不为用户所感兴趣的维如果在模型中表达出来，会影响到模型在特定用户面前表达出来的效用，并且不为用户所感兴趣的维如果加入计算，则会影响到这个信息相关度针对此用户相关度的计算。

针对这种情况，提出了用户选择模型（见图２）。解决方法有两种：一种是由系统通过分析用户，筛选与用户无关的信息，即在用户进入此系统时，先对用户的信息进行分析，看用户的查询目的、

职业、兴趣等，再根据他们的兴趣，去掉多维信息中多余的信息维，再对剩下的信息维进行排列；另一种是为用户提供一个选择界面，由用户自己选择感兴趣的信息维，再由用户根据自己对其进行排列，确认后系统生成一个完全由用户自己选择筛选出来的多维信息模型，即筛选掉的信息维数为Ｍ，得出一个Ｎ－Ｍ多维信息可视化模型。

２．３扩展模型（Ｎ＋Ｌ模型）

随着信息的剧增，人们对信息的要求越来越高，可能会出现已有的

文章编号：１００５－６０３３

（２００６）１０－０１７０－０３收稿日期：２００５－１２－３０

多维信息可视化模型

夏治坤

（武汉大学信息管理学院，湖北武汉，４３００７２）

摘

要：分析了多维信息可视化存在的问题，探讨了多维信息可视化模型的类型和特

点，论述了多维信息可视化模型涉及到的技术和方法。关键词：信息可视化；多维信息；多维模型中图分类号：ＴＰ３９

文献标识码：Ａ

Ｅ′

Ｅ

ＡＢ

Ｃ

ＤＦ

Ｆ′

Ａ′

Ｂ′

Ｃ′Ｄ′

图１

基本模型图

Ｏ

１７０