移动搜索关键技术
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
移动搜索关键技术
The Key Technology Of Mobile Search
(华中科技大学电子与信息工程系,武汉430074)
摘要:移动搜索是搜索引擎技术向无线网络的拓展,利用先进的移动通信技术在移动终端上实现搜索引擎系统。随着移动终端的普及以及3G时代的来临,移动搜索技术逐渐步入人们的视野,并成为人类获取信息的重要工具之一,极大的方便了人们的日常学习生活。本文简单介绍了现有的一些移动搜索业务以及移动搜索的几种关键技术,希望能够帮助读者更为简单直接地了解移动搜索。
关键词:移动搜索;垂直搜索;综合搜索
Abstract:Mobile search is an expansion of search engine technology in wireless networks. It uses advanced mobile communication technology to implement the search engine system on the mobile terminals. With the popularity of the mobile terminals and the coming of 3G era ,mobile search technology has gradually stepped into humans’vision . The new technology is becoming one of the most important tools for people to access the information . Of course ,it makes people’s daily life more convenient. This article has briefly described some of the existing mobile search service, as well as several key technology of mobile search. However, I hope it can help the readers to understand mobile search more simply and directly.
Key words: mobile search ; vertical search ; comprehensive search
1.移动搜索概述
随着科技的高速发展,信息的迅速膨胀,手机已经成为了信息传递的主要设备之一。尤其是近年来手机技术的不断完善和功能的增加,利用手机上网也以成为一种获取信息资源的主流方式。在这一背景下,移动搜索的概念应运而生,国内外不少互联网公司均看好移动搜索这一领域。雅虎,Google,百度等传统搜索引擎也都相继推出了基于短信和WAP的移动搜索服务。毫无疑问,移动搜索将成为未来人们获取信息的主要工具之一。
1.1.移动搜索的基本定义
移动搜索基本定义:移动搜索是指用户在移动通信网络中,通过移动终端,利用SMS,WAP,IVR等多种特定的搜索方式获取所需信息的搜索行为。而移动搜素的核心是将搜索引擎与移动设备有机结合,生成符合产品和用户特点的搜索结果。
1.2.移动搜索的分类
1)依据搜索引擎的分类:
基于浏览器的移动搜索:现代手机里面都内置了类似网页浏览器的微浏览器(如UC浏览器等),手机用户可以通过微浏览器来连接互联网。
基于短信的移动搜索:移动搜索引擎通过短信接收用户的查询请求,然后将查询结果通过短信的形式返回给用户。这种方式可以被所有手机用户所接受,但是,短信的信息表现能力很差,提供的信息也非常有限。
短信与微浏览器相结合的移动搜索:用户可以使用移动搜索服务商的客户端提交查询请求,客户端会根据用户的检索行为去选择以微浏览器或者短信方式返回查询结果。
2)依据搜索内容的分类
综合搜索:类似于互联网搜索,用户通过编辑短信或键入关键词进入W AP或直接接入WEB网络,对W AP或WEB网络上的内容进行搜索,搜索引擎根据一定的规则将内容结果与链接结果反馈给用户终端。这种搜索模式可以看作是互联网搜索直接延伸到手机平台上的移动搜索模式。
垂直搜索:指用户通过多种接入方式(短信,彩信,W AP,IVR等)提出搜索特定类型的内容或服务的搜索请求,例如一些音乐,图片或本地信息等。这样的搜索模式可以使用户进行个性化的搜索定制,更加快速的得到自己需要的信息,此模式的搜索引擎可以更好的理解用户的搜索请求,提高搜索的的针对性和准确性。
1.3.现有移动搜索业务
1)AQA应答搜索:AQA全称Any Question Answered,该服务可以为用户提供各种问题的
答案,将计算机的自动化搜索和人工搜索很好地整合起来,从而为用户服务。该服务由英国手机运营服务商Orange等推出,每回答一个问题,用户需支付1.76英镑的费用。
2)比价搜索:用户通过向服务提供商发送商品名,就回收到该商品各零售商的不同报价。
3)位置搜索:这项服务提供用户想知道的位置信息,既可以是了解自己周围的地图又可以
是搜索他人的地理位置。
4)“空中搜”:该业务具有搜索引擎与传统黄页两种功能,是手机搜索引擎的商务版,能
在手机上搜索到全国大部分省市的企业、事业、政府机关、公共设施的相关信息。
5)企业信息搜索,图片搜索,音乐搜索,新闻搜索,游戏搜索等等
2.移动搜索关键技术分析
2.1.移动搜索引擎的基本原理与工作流程
1)综合搜索
综合搜索实际上是互联网搜索引擎在移动终端上的简单延伸,其结构与通用搜索引擎是一样的,只是用户访问时将Web页面转换为W AP页面。
(a)手机进行互联网搜索的结构示意图
(b)WAP搜索结构示意图
2)垂直搜索
(c)垂直搜索结构示意图
垂直搜索是针对某一行业的专业搜索引擎,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取需要的数据进行处理后再以某种形式返回给用户。垂直搜索的关键在于对网页信息进行结构化信息抽取,即以结构化数据为最小单位,将这些数据存储到数据库,进行进一步的加工处理:去重,分类,分词,索引,最后以搜索的方式满足用户的需求。
2.2.结构化信息抽取技术
结构化信息抽取技术主要应用于垂直搜索,将网页中的非结构化的数据按照一定的需求抽取成结构化的数据。结构化信息提取技术主要有两种方式可以实现,模板方式和网页库结构化信息抽取。
1)模板方式:该方式是对特定的网页进行模板配置,抽取模板内设置好的需要的信息,可以针对有限个网站进行精确的信息采集。该方式简单,精确,技术难度低且方便部署。但是,该方式需要针对每一个信息源的网站模板进行单独的设定,在信息源多样性的情况下,维护量巨大。所以这种方式适合少量信息源的信息处理,不是搜索引擎级的应用,很难满足用户对查全率的需求。
2)网页库结构化抽取:该方式是采取页面结构分析与智能节点分析转换的方法,自动抽取结构化的数据。对任意的正常网页进行抽取,完全自动化,不用对具体网站事先生成模板,对每个网页自动实时得生成抽取规则,完全不需要人工干预。智能抽取准确率高,不是机械