传统与可视化

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

传统信息检索与可视化信息检索之比较

摘要:阐述了传统信息检索系统的不足及可视化信息检索的优势,探讨了信息检索过程

中的信息检索可视化研究问题。

关键词:信息检索;传统信息检索;可视化信息检索

随着社会信息化程度的提高,信息检索手段也在不断进步,

目前,快速图形处理软件的日渐普及和高清晰度彩色显示器的

出现,使信息可视化已经成为现实。

1 传统信息检索系统的不足

传统信息检索的不足在于其结果是线性的、一维的,用户必须对返回的大量依次排列的文献进行浏览并全部列表后才能决定取舍和进行深入浏览,这给人们带来诸多不便。首先,它缺乏有效的反馈机制。有时用户找到一篇“好”文献,但同时也想查看与之相关的文献,这在传统检索系统中是无法实现的。其次,传统的检索系统设计往往仅考虑功能,没有从用户和寻找行为的角度出发去设计软件功能。在用户查到很多文献时,不能对全部检索到的文献结果进行浏览,也不能提供全部检索内容的概况。此外,传统检索模型还忽视了人在浏览选取检索出的文献时的交互作用。实际上,人们在查找信息时,只想用一个查询系统来帮助他达到检索目的。用户在检索过程中,通过浏览检索结果的标题或全文以及回顾提问、点击、链接等,吸取新的信息,在最初的基本目的完成之后,有可能继续检索,但其检索兴趣已发生变化。此时削弱初始提问的优先权是必要的,但在传统模式下这一功能是无法实现的。

2 可视化信息检索的优势

信息检索过程的可视化研究是把文献信息、用户提问、各类信息检索模型以及用检索模型进行信息检索的过程,展示在一个低维的可视化空间中,并向用户提供信息检索服务。可视化就是将抽象概念转化成一种符号,最终使用户看到过去不能看到的东西。可视化信息检索实际上是提供一种可见的语义关系,使提问与检索结果以及检索到的各文献之间的关系可视化,提供一种有效的信息反馈机制。可视化理论最早是2400年前的哲学家柏拉图提出的。他认为,人类是通过感觉,特别是通过视觉,运用思维来认识事物的,人类也是从表象到本质来认知真实世界的。信息检索过程的可视化研究始于20世纪60年代。这个时期开始在数据库方面进行可视化研究。到了20世纪80年代初,由于人们对信息检索过程的可视化进行了较为深入而广泛的研究,从而出现了基于布尔逻辑的检索系统:温式图、过滤文献流和基于布尔逻辑系统的文献检索系统,并于20世纪90年代后趋于实用性和智能化。众所周知,人获取的信息中,70%来自视觉,20%来自听觉,10%来自触觉。因此,人类是非常适应图像和可视信息的,可视的图像较易记忆,而且在传达某种信息时比任何方式都更加快捷和有效,人们正是利用了这一特点来研究可视化信息检索系统的。可视化信息检索结果清晰可见,可以让用户对所检索的文献分布一目了然,在可视的环境下浏览检索文献,有助于用户分析文献,判断一个词对文献检索的价值,了解隐藏在提问与文献以及各文献间的语义关系,从而更好地判断文献是否相关。可视化信息检索可以提供更丰富的直觉信息。直觉信息能使用户更快地达到兴奋点,有利于用户发现新的信息检索模型,提供进一步开发新系统的能力。同时,内部操作过程可由人来控制,更加有效、便捷。可视化信息检索不仅可以用二维或三维图像显示结果,还可以把人的视觉及认知过程融入检索过程、算法分析和设计系统当中,因而减少了用于了解检索结果的聚类或语义分析的时间。通过改善人机交互功能,实行个性化处理,调整文献的显示方式等,可以帮助用户理解文献之间的语义关系。可视化的文献分布图表有利于不同语言背景的理解。整个信息查询过程需要人的注意力、记忆力和想象力,而图形可以更简洁地显示一些语义关系。可视化检索结果是连续多维的,这与离散的文献有本质的区别。可视化检索可以使人的信息传输能力和检索能力发挥到最大程度,同

时考虑了人的认知过程在检索中的重要性。我们知道人和计算机的区别主要在于:计算机可以拷贝,但是计算机不具备学习能力与综合判断能力,对事物的形态判断力也较差,而人具有思维和综合判断能力,两者的结合才能达到最理想的检索效果。可视化信息的研究已经在许多方面取得了成功。如匹兹堡大学1991年研制成功了最早的一种可视化检索系统,其检索原理是根据提问,返回并显示出检索到的文献的全文或摘要。即在查询时,用户将提问也就是兴趣点放入一个图形空间,检索后生成的图标就是和提问相关的文献,这些文献会根据与各兴趣点的相关度投影到所确定的位置。用户则通过兴趣点位置的改变来查看文件的分布,从而可以了解文件与兴趣点的相关度,找出用户最关注的文件。这个系统的优点是操作性强、灵活方便,还可以建立用户文档,诸如爱好、兴趣、专业以及近期的课题研究等,不仅参考点多,而且可以移动。

3 信息检索可视化的发展

信息检索可视化研究面临的首要问题是选择情报检索系统,如布尔检索系统、向量检索系统、模糊查询系统、概率系统等,其次要确定以何种特性关系来显示出可视对象,即哪些特点适合抽取做投射,哪些特点容易可视化且效果明显等,这些都是要慎重考虑的。第三是定义或创造可视化空间,确定如何把所有的可视化对象影射到选定的空间,如何在有限的空间里组织有效的信息并使检索过程可视化。由于网络提供了一个不依赖于平台的界面,系统的设计已经从面向系统功能的设计为中心转换到面向用户的设计为中心,检索系统的用户界面设计,将直接影响到人们对这个系统的喜好与利用。所以,在系统设计时,应根据人们的不同喜好、能力、年龄和文化背景等情况,设计出灵活的交互式的用户界面,方便用户利用。可视化研究的最大问题是如何评价和衡量可视化检索工具。传统的标准是以查全率和查准率来衡量一个系统的优劣的,但这种标准对一个交互式可视化检索系统而言并不合适。尽管可视化信息技术是属于高层次的,人们也不一定非要选择这种检索方式,但是随着网络技术的发展,网上各种信息量的迅猛增加,以及元数据的成熟,可视化方面的科研成果将会更快地实现商品化。

相关文档
最新文档