搜索引擎智能化
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
智能化趋势
智能化信息检索技术的提出背景目前网络上访问量最高、在网络用户中最为普及的搜索引擎有谷歌、百度、微软、雅虎等搜索巨头产品, 这些搜索引擎基本上采用的是传统的建立在全文检索理论基础上的搜索技术, 即关键词搜索法。用户在使用此类搜索引擎时, 可以将需要查找内容中的重点词汇, 即关键词, 输入到搜索栏中, 提交给搜索引擎后, 即可快速的查看到若干条与该关键词相关的信息列表。对于初次使用的用户来说, 这种工具无疑是一种非常有效的功用性产品, 对于查找内容比较简单, 或者词条含义独立性较强的用途范围来讲, 此类检索技术完全可以满足用户的需求。然而实际上, 更多的搜索词条是以比较自然的语态来呈现的, 当此类复杂的语义出现时, 搜索结果的准确性和相关性便很难达到用户的预期要求。
网络智能化信息检索技术的研究基于Internet 的智能信息检索技术运用人工智能的方法, 结合海量数据处理技术, 创新出更接近于人类思维的学习型的检索工具。智能信息检索系统的功能特点简述如下: 1 . 自然语言智能技术。该技术完整的构建了“布尔逻辑运算组合搜索”“临近搜索”和功能, 并且可以接受用户键入自然语言描述, 并能够正确理解该描述, 从而有效的提高了检索速度与精确度。 2 . 个性化检索机制。可以为用户提供更为友好的搜索界面, 根据不同用户的不同需求, 对检索内容提供个性化的功能模板, 以提高检索结果的适用性, 避免页面结果的单一性。同时, 用户可以根据自身需求对检索结果页面进行修改, 最大程度上提供人性化的检索服务, 满足用户个性化的检索要求。 3 . 强大的学习能力。通过人工智能技术, 提高检索系统的推理能力, 能够根据已有的信息演绎出用户需要检索的内容结果。这种学习型的机制将人类的认知网络通过计算机投射为语义网络, 对用户的检索对象进行近似人类思维方式的知识获取、联想、推理, 再向互联网进行信息检索。在检索的过程中, 检索能力也随着不断“学习”而增强, 从而有效的提高检索系统的查全率和查准率。4 . 跨平台的管理机制。不同操作系统上的管理者可以通过检索系统提供的管理程序实时控制, 同时按照不同的用户制定不同的使用权限, 并提供相应权限内的搜索范围。跨平台的系统设计可以简化管理模式, 降低管理负担。
网络智能化信息检索技术的实现近年来网络上已涌现出多种智能信息检索技术, 其中技术最为成熟、运作最为成功的是Autonom y 公司推出的Autonom y 智能检索产品。该产品的核心是建立在独特的信息论和概率论的基础之上的模式识别技术, 不依赖任何语言进行分析, 不需维护任何繁琐的词表。Autonom y 在系统内部创新建立了一个称为智能数据操作层(i ntelligent data operati ng layer , ID OL ) 的中心层, 将各个信息源和各种文件格式统一在一个智能的信息操作系统之下, 通过与各种数据源相连, 可以根据任何语言和格式进行内容搜索, 忽略内容的实际存放位置, 自动实时地将类似信息的链接呈现出来。ID OL 通过词条出现时的上下文环境而不是通过严格的语法定义来形成对该词的理解, 从而识别进入到Autonom y 架构中的任何数据的语言特性, 因此它可以保证对任何形式信息的实际内容的基本理解。Autonom y 中含有一个动态推理引擎, 即 D ynamic Reasoni ng Engi ne ( D R E) , 它是一个扩展性很强的、多线程的核心引擎, 信息的概念分析、内容提取、概念模式识别、相关度计算等关键工作都由动态推理引擎来完成。跨平台的设计, 使它可以在多种硬件和操作系统环境下优化运行, 支持从Intel PC 使用的Wi ndows N T 到多处理器小型机运行的U N I X 等不同的系统环境。它可以与互联网、数据库、内部网和本机数据库、文件系统等各种不同信息源相连。当用户提交检索条件后, 它可以通过概念分析、模式识别、相关度计算等方法, 从不同的数据源中找到与用户要求最匹配的信息。Autonom y 具有分类和聚类功能。ID OL 自动根
据非结构化文本中的概念对信息进行分类, 可以保证根据内容对所有数据进行最准确的分类。而自动聚类可以收集大量的文档数据或用户档案信息, 并且自动识别出信息内的主要类别, 让ID OL 自动的持续一致的计算新的信息应该属于哪个类别。Autonom y 通过保持数据原型以及架设自己的平台来对数据进行管理, 从而完成从信息与信息的互动, 到人与信息的互动, 最终达到人与人的互动。此外, Autonom y 还可以建立文字与视音频片段的对应, 从而完成新闻媒体里的新闻和谈话节目的数据管理工作。目前,Autonom y 在国外比较成功的应用案例集中在媒体、政府机构、金融和信息产业等需要集中处理大量非结构化数据的领域。五、结语通过与传统型检索技术的对比, 智能化信息检索技术优势更加明显, 这无疑是网络信息检索技术发展的重要方向之一。检索技术的发展还要依赖于统计机器学习技术、人工智能语法等人工智能技术以及数据库技术等相关学术的整体发展, 而这些技术的平行应用将有效的减少信息检索的差错率, 相关学科的有机结合将是网络智能检索技术的发展趋势。