网络环境下的多媒体信息检索技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

网络环境下的多媒体信息检索技术

摘要

当今时代网络技术的快速发展,使得网络能够随时随地高速、准确为用户提供服务,特别是网络数据库的发展,使得网络信息储备非常大,使用网络检索多媒体信息可以从海量的数据库中快速、准确的得到所需信息。比从其他途径得到的信息还要全面。网络环境下的多媒体信息检索:基于内容的文本检索、图形图像检索、音频、视频检索、了解这些检索技术有利于信息的收集和数据的挖掘.

关键字:网络检索多媒体

Multimedia information retrieval technology network

environment

Summary

The rapid development of network technology in today's era, making the network anytime, anywhere high-speed, accurate service to users, especially the development of the network database, making very large reserves of network information, you can use the network to retrieve multimedia information from the massive database quickly and accurately obtain the desired information. Even more comprehensive than the information obtained from other sources. Multimedia information retrieval network environment: content-based retrieval

of text, graphics, image retrieval, audio, video, search, retrieval techniques to understand these beneficial mining information collection and data.

Keywords:network retrieval multimedia

引言

多媒体信息检索技术是当今使用范围最广、使用量最大的网络检索技术。传统的检索方法主要是借助于主题目录、索引关键词等方法来实现的,由于其简单、快捷的特点一直沿用至今。但无法挖掘信息之间的内在联系,检索的结果不能准确、全面地反映用户的需求也使得用户头疼不已。引入先进的多媒体信息检索,可以改善传统的检索方法,有利于提高信息检索的效率和检索准确率。多媒体信息检索是指根据用户的要求,对文本、图像、音频、视频等信息进行识别并获取所需信息的过程。但多媒体信息检索系统并不是简单地对多种媒体进行检索,是一种既能对以文本信息为代表的离散媒体进行检索,也能对以图像、声音等为代表的连续媒体的内容进行检索的检索方式。

一、文本信息检索

文本信息检索主要使用基于内容的文本检索。基于内容的文本检索是涉及文本内容查询的检索技术。主要研究文本文档信息的表示、存储。组织和访问,就是根据用户的检索需要,从数据库中检索出相关信息。

全文扫描、检索、寻找关键索引、索引文件、文献簇等。使用限定词定位关键索引词,用倒排文件进行关键索引词与其文档的连接,用B-Tree把索引特征与文本的物理存储位置相连接来构造索引文档。基于内容文本信息检索的核心技术是检索模型的构造,包含3个方面的内容:文本与用户查询表示、查询匹配策略和匹配结果的相关度表示。典型的文本检索模型分为布尔模型、向量空间模型和概率模型3种。

(一)布尔模型

将文本中的特征简单地表示成二元变量,特征词出现标识为1,否则为0。文档的相似度则基于布尔量进行计算。简单、速度快是该模型的优点,其缺点是不够精确,不能反映不同“项目”对一个文档的重要程度的差异。后来陆续针对布尔模型的不足,提出改进算法即扩展的布尔模型。

(二)向量空间模型

向量空间模型也称为词袋表示法,该表示法有一个假设很关键,无关紧要的是文本中词条出现的先后次序。特征词对应特征空间的一维,将文本表示成欧氏空间的一个向量。该模型的思想是将文档D看作是由一定代表性的特征项组成;而特征项t(Term)是指出现在文档中能够代表文档性质的基本语言单(通常所指的检索词)。这样就可以将一个文档D表示为D(t1,t2,…,tn),

t(I=1,2,…n)表示文档的一个特征项。

i

(三)概率模型

概率模型考虑词项、文档之间的内在关联,依据关联信息计算文档类别归属大小,据此推算文档类别。

概率模型考虑到词条、文档之间的内在联系,利用词条间、词条与文档之间的概率依赖性进行信息检索。布尔模型和向量空间模型都将文档、词条视为相互独立的项,忽略了文档和词条间的关联性。在概率模型中二值独立检索模型(BIR)是一种实现简单且效果很好的概率检索模型。概率推理网络是一种新型的概率检索模型,它模拟人脑的推理思维模式,将文档内容与用户查询匹配的过程转化为从文档到查询的推理过程。

二、图像检索

数字图像种类十分丰富,数量非常大,包括图画、建筑物图、CAT扫描图等等,从医用X光片到星球地表图和天文物体图都属于这个范围。早期的图像检索一般使用基于图像外部属性的方法,以文本形式对图像进行标题、主题、时间等特性描述。用户以此作检索入口检索所需要的图像。其次利用超文本技术,通过沿链探访节点的方式来检索与用户需求相关的图像。这些方法都忽略了物理图像的分析、理解,应用方便是这些检索方法的优点,但是它们的缺点是检索能力十分有限,很多时候无法满足用户的需求。

(一)基于内容的图像检索技术

基于内容的图像检索具有较强的客观性。一般是指对于静止图像的检索。这种图像检索技术通过分析图像的内容,如颜色、形状、文理等可视特征,提取分析过得可视特征,建立特征索引存储于特征库中,用户只需在检索时将自对图像的模糊印象描述出来(绘制的草图或通过扫描仪等在线输入的图像),就可以通过多次的近似匹配,在网络

相关文档
最新文档