元搜索引擎
标准的检索工具
标准的检索工具
一些常见的标准检索工具包括:
1. 搜索引擎:如Google、Bing、百度等,用户可以通过输入关键词来获取相关信息。
2. 图书馆目录:图书馆提供的系统,用于查找图书、期刊、论文等资源。
3. 学术搜索引擎:如Google Scholar、Web of Science、Scopus 等,主要用于查找学术文献和学术资源。
4. 数据库:包括各种专业领域的数据库,如PubMed(生物医学)、IEEE Xplore(工程技术)、EBSCOhost(多学科领域)等。
5. 元搜索引擎:如Zotero、EndNote等,可以同时搜索多个数据库并整合结果。
6. 社交媒体搜索:如Twitter、Instagram、微博等,用于查找特定的社交媒体内容。
7. 文件管理工具:如Windows的文件搜索功能、Mac的Spotlight 等,用于在本地计算机上快速查找文件和文件夹。
8. 专业领域的检索工具:根据特定领域的需求,有一些定制化的检索工具,如化学领域的Reaxys、生物信息学领域的BLAST等。
这只是一些常见的标准检索工具,还有许多其他工具适用于特定的搜索需求。
元搜索引擎简介
著名元搜索引擎
8、ByteSearch ( ) 搜索速度快,可检索资源丰富,搜索范围包 括Web、城市信息、公司名录、域名、FTP 网站、多媒体、新闻组、包裹跟踪等,并提 供新闻浏览、URL提交、最新的20个检索浏 览、联机商店等内容方面的服务。支持完全 匹配(All)、部分匹配(Any)、短语检索 (Phrase)等特性检索功能,没有搜索引擎 列表,不能控制源搜索引擎的选择。
著名元搜索引擎
7、MetaCrawler ( ) 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持 调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服 务。其检索特性非常丰富,包括常规检索、高级检索、定制 检索、国家或地区的资源检索等检索服务模式。其中,高级 检索模式可实现:搜索引擎的选择调用,基于域名、地区或 国家的检索结果过滤,最长检索时间设置,每页可显示的和 允许每个搜索引擎返回的检索结果数量的设定,设定检索结 果排序依据(包括相关度、域名、源搜索引擎)等。以上内 容均可作为定制检索的个性化选项并予以保存。另外,检索 结果中包括一个以1000为最大值的相关度指标。
著名元搜索引擎
1、InfoGrid ( /) 提供与主要搜索网站的直接连结和目录检索,具 有强大的元搜索和新闻搜索功能。 2、Infonetware RealTerm Search ( /) 原为检验网络分类技术而设计。它以元搜索引擎 知名,但具有强大的对搜索结果进行主题分类的 功能。与众不同的是,用户可选择不同的主题, 并得到来自所有主题搜索结果,而不是仅仅把搜 索结果限制在一个主题范围之内。
元搜索引擎简介
相关定义:
元搜索引擎(Meteasearch Engine),是一种调 用其他独立搜索引擎的引擎,亦称“搜索引擎之母 (The Mother of Search Engines)”.在这里,“元” (Meta)为“总的”、“超越”之意,元搜索引擎 就是对多个独立搜索引擎的整合、调用、控制和优 化利用。相对元搜索引擎,可被利用的独立搜索引 擎称为“源搜索引擎”(Source Engine)或“搜索 资源”(Searching Resources),整合、调用、 控制和优化利用源搜索引擎的技术,称为“元搜索 技术”(Meta-searching Technique),元搜索技术 是元搜索引擎的核心。
搜索引擎分类和原理
一个好的搜索引擎,不仅数据库容量要大,更新频率、检索速度要快,支持对多语言的搜索,而且随着数据库容量的不断膨胀,还要能从庞大的资料库中精确地找到正确的资料。
⒈提高搜索引擎对用户检索提问的理解。为了提高搜索引擎对用户检索提问的理解,就必须有一个好的检索提问语言。为了克服关键词检索和目录查询的缺点,现在已经出现了自然语言智能答询。用户可以输入简单的疑问句,比如“如何能杀死计算机中的病毒”,搜索引擎在对提问进行结构和内容的分析之后,或直接给出提问的答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于,一是使网络交流更加人性化,二是使查询变得更加方便、直接、有效。就以上面的例子来讲,如果用关键词查询,多半人会用“病毒”这个词来检索,结果中必然会包括各类病毒的介绍,病毒是怎样产生的等等许多无用信息,而用“如何能杀死计算机中的病毒”检索,搜索引擎会将怎样杀死病毒的信息提供给用户,提高了检索效率。
11.分布式结构、精心设计的优化算法、容错设计保证系统在大访问量下的高可用性、高扩展性、高性能和高稳定性。每个部分均采用N+1的冗余设计,1台服务器时刻处于备用状态。因而整个系统能在99.9%的时间内提供高可用性和高稳定性的服务。
12.高可配置性使得搜索服务能够满足不同用户的需求。在搜索调度、相关性评价、内容过滤、显示方式等方面均为客户提供了可配置手段,使系统具有服务,由他们自行决定搜索结果的显示方式,加入自己的广告和公司图标(logo)。
8.可以提供一周、二周、四周等多种服务方式。可以在7天之内完成网页的更新,是目前更新时间最快、数据量最大的中文搜索引擎。
9.检索结果输出支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式。支持用户选择时间范围,提高用户检索效率。
元搜索引擎
元搜索引擎作者:姬洪强来源:《中小学信息技术教育》2007年第12期网络已逐渐成为教师教学中重要的信息来源,教师通常借助搜索引擎来检索所需求的资源。
然而,一种搜索引擎往往不能满足所有人或一个人所有的检索需求,经常需要使用多种搜索引擎,并对搜索结果进行比较、筛选和印证。
为解决逐一登录各种搜索引擎,并多次输入同一检索请求(检索字串)等操作繁琐的问题,元搜索引擎应运而生。
元搜索引擎的优点是返回的检索结果信息量大,检索效率高,服务多样化。
下面介绍几款国内外优秀的元搜索引擎以供中小学教师参考使用。
一、国内元搜索引擎1.Xooda 元搜索引擎()Xooda元搜索引擎支持16个国家/地区,可调用Baidu、Google、Yahoo、iAsk、Sogou、ZhongSou等12个源搜索引擎中全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目。
它还可以进行进阶搜索,自动实现符合特殊检索语法要求的转换,只调用支持特殊检索语法的搜索引擎。
支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新优化排序。
2.酷爱元搜索引擎()酷爱元搜索引擎提供自动搜索和人工搜索两种模式。
调用Baidu、Sogou、Yahoo等独立搜索引擎,各搜索引擎的结果会进行智能排序。
当用户输入关键词的时候,搜索框会自动列举出相关的关键词列表。
它的深入搜索功能可以为用户提供更精确的关键词,进一步细化结果。
当用户点击网页智能分析时,酷爱会把最相关的结果呈现给用户。
3.万纬元搜索引擎()万纬搜索引擎是最有名的中文元搜索引擎之一。
万纬中文集成搜索引擎包括了5个英文搜索引擎Argos、Google、Hotbot、NorthernLight、Yahoo和7个中文搜索引擎,如网典、新浪、雅虎(中文)、搜狐、天网、悠游搜索。
用户可根据需要自由选择其中最多6个引擎进行同步搜索,搜索结果可按相关度、时间、域名和引擎分类,还可以选择搜索的关键词之间是用and 还是用or来运算。
一个元搜索引擎的设计与实现
Ke r s S e i ie e c n i e T p c d s l t n; p c aie it n r I vsb e W e y wo d : p c a z d s a h e gn ; o i it l i S e il d d c i a y;n i l b l r ia o z o i
X AO Gu I o—q a g Z in , HANG F n ag
( eat etfCm u r c nead Tcnl y Wua 3 0 4 C i ) Dp r n o p t i c n eh o g , h n4 07 ,hn m o eSe o a
Ab t a t I h s p p r a mea — s a c n i e b s d o p ca ie e r h n n ie i i t - sr c :n ti a e , t e r h e gn a e n s e il d s a c i g e gn s n r z o
gae p ra h T e rs l tre d p e w y o s bi ig p fsin l dc o ay t xrc rtd a p o c . h e ut r u d a o tt a fe t l hn r eso a it n r o e t t se n h a s o i a
d cd Po si a sac n n i ema e i pca zdsac Ivs l We ”sac osne u e . r es n e heg ewlb d t sei i r h“n ibe b e r t l i — f ol r i l wh le e i h o t
基于多领域的元搜索引擎
第 6期
广 东石 油化 工学 院 学报
J u a f a g o gUnvri f erc e clT c n lg o r lo n d n iest o t h mia eh oo y n Gu y P o
V0. No. 121 6 De 2 1 c. 01
实验证 明 , 与使用单 独的搜索引擎相 比, 使用 该搜索引擎能够获得更 好的检索效果 。
关键词 : 信息检索 ; 元搜索引擎 ; 垂直搜索引擎
中图分 类号 :P 9 . T 3 13 文献标 识码 : A 文章编 号 :6 1 50 2 1)6 0 1 3 17 —69 (0 10 —05 —0
T — I d= TF * / F DF, DFt
其 中
表示 词条 t 文档 d中出现 的频率 : 在
词条 t 在文档 d中出现的次数 “ 一 文档 d中词泵的总数
/F是一个 词语 普遍 重 要性 的度量 , 一特 定词语 t /F, 以 由总文 档数 目除 以包 含该 词语 的文 D 某 的 D 可 件 的数 目, 再将得 到 的商 取对 数得 到 :
根据搜索范围的不同 , 又可分为通用搜索引擎和垂 的信 息量大 、 查询不准确 、 深度不够等提出来的新 的搜索引擎服务模式 , 通过 针对某一特定领域 、 某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。垂直搜索引擎聚 集了特定行业感兴趣的信息 , 并为用户提供 该领域内的有效检索服务。垂直搜索引擎通过其过滤器将网络
收稿 日期 :0 1 9— 1修 回日期 :0 1 0 0 2 1 —0 0 ; 2 1 —1 —1
作者简介 : 门秀萍 ( 8一 ) 女, 1 1 , 山东 烟台人 , 士, 师, 9 硕 讲 研究方 向为 电子及计算机技术应用 。
基于元搜索的专业搜索引擎的设计
因特 网迅猛 发展 , 索 引擎也 在不 断地发 展 , 搜 人
领 域 信 息 的 检 索 要 求 。 专 业 领 域 化 的 搜 索 引 擎 具 有
们 可 以 通 过 传 统 的 搜 索 引 擎 , Go ge B iu 如 o l、 a 、 d S g u等 , oo 方便 地 获 取 网络 信 息 。随 着信 息 社 会 的 进一步 发展 , 们 对 信 息 的需 求 又 有 了新 的 变 化 。 人 特别是 对某一 特定 学科 或特定 领域 的 网络 信息 资源
wa n r du e . For he a f r he e ha i g h ue y f iin y of r e so l e c ngie, t i y t m o bne s it o c d t s ke of u t r n ncn t e q r e fce c p of s i na s ar h e n hss se c m i s
ne a t ur lne wor t n tc a g ihm t itr a d s r h e ulsofm e a s a c . ks wih ge e i l ort O fle n o tt e r s t t e r h
Ke r s y wo d :
e n s A c o di O t e a ina prncp e ofs ar h n ne a e i fa e o k o p o e so l e r h ngi a e n ngie . c r ng t heop r to l i i l e c e gi s, d sgn r m w r f r f s ina s a c e ne b s d o
பைடு நூலகம்
Pr e son ls a c ng n of s i a e r h e i e; M ea s a c n ne;G e e i l ihm ; N e a e w o ks t e r h e gi n tc agort ur ln t r
基于Ontology的元搜索引擎设计
2M dmEuaoaTc o g Cn rfn M n A uu l n ei , uh 01, la .oe d tn eh l y e eoI埘 o#a #c r Ui rt Hho0 08ai ) c i l n o t I k a v sy t1 I I
Am r ̄: sWe suc8nm  ̄  ̄ cl,tsm r n oeiprn t s r bio mtn er n n r e lt a A br or c a e ei k ii o adm r m ott o e c We f i ,s c eg ei oeo t y e a a h nn o ah s I fh
维普资讯
计 算 机 与 现 代 化
2O 07年第 2 期 J U N IY IN MH A I A J UXA D U S
总第 18 3 期
文 章编号:02 5 o7 16 4 ( c) 0 _7 2 r咖
35 — 0
基于 O toy的元搜索引擎设计 nl og
范围、 算法等的不同, 导致同样一个检索请求在不同搜
1 元搜索引擎
元搜索引擎( es r on) M te c Z e是一种调用其它独 aah 立搜索引擎( 也称为 目的搜索引擎) 的引擎 , 亦称“ 搜索 引擎之母(1 o eo a he 1m t rfer 蛳 )。它没有 自己的 Ie h s c ” Wb e 文档索引数据库和机器人, 而是将用户的查询请求 经过处理发送到其他独立搜索引擎, 然后把它们的搜索
WA a . n , U Tn . NG Y hf X ig e , A .o Y NG Dm d r
( .co o pt c ne&Tc o  ̄ So n e i ,Szo 106 C i ; 1 ̄ho 0 Cm u r i c lf eSe el l y, oe U i rt uhu250 , h a m o  ̄w v sy n
元搜索引擎简介
相关定义:
元搜索引擎(Meteasearch Engine),是一种调 用其他独立搜索引擎的引擎,亦称“搜索引擎之母 (The Mother of Search Engines)”.在这里,“元” (Meta)为“总的”、“超越”之意,元搜索引擎 就是对多个独立搜索引擎的整合、调用、控制和优 化利用。相对元搜索引擎,可被利用的独立搜索引 擎称为“源搜索引擎”(Source Engine)或“搜索 资源”(Searching Resources),整合、调用、 控制和优化利用源搜索引擎的技术,称为“元搜索 技术”(Meta-searching Technique),元搜索技术 是元搜索引擎的核心。
著名元搜索引擎
7、MetaCrawler ( )
1995年由华盛顿大学推出,1997年被InfoSpace购买。支持 调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服 务。其检索特性非常丰富,包括常规检索、高级检索、定制 检索、国家或地区的资源检索等检索服务模式。其中,高级 检索模式可实现:搜索引擎的选择调用,基于域名、地区或 国家的检索结果过滤,最长检索时间设置,每页可显示的和 允许每个搜索引擎返回的检索结果数量的设定,设定检索结 果排序依据(包括相关度、域名、源搜索引擎)等。以上内 容均可作为定制检索的个性化选项并予以保存。另外,检索 结果中包括一个以1000为最大值的相关度指标。
著名元搜索引擎
6、Mamma ( )
1996年面世,自称为“搜索引擎之母”的并行元搜 索引擎,可同时调用7个最常用的独立搜索引擎, 并且可查询网上商店、新闻、股票指数、图像和声 音文件等资源。其特点是检索界面友好,检索选项 丰富,主要包括:可控制调用的独立搜索引擎、选 择使用短语检索功能、设定检索时间、设定每页可 显示记录数等。另外,Mamma支持常用检索语法 在不同搜索引擎中的转换,还提供了专门检索页面 文件标题的特殊检索服务,以及通过E-mail传输检 索结果的特色功能。检索结果以相关性排序,内容 包括网页名称、URL、文摘、源搜索引擎。
一种元搜索引擎框架模型的设计
元 搜索 引 擎是一 个搜 索其 他 引擎 的搜索 引擎 。一个 元 搜索 引 擎 以用 户输 入 的查 询关 键 字 作 为输 入 , 然后 将该关 键 字 同时 提交 给 多个 成员 搜索 引擎 , 将这 些搜 索 引擎 的返 回结 果按 照 一定 的算 法重 新排 序 并
并反馈给用户。元搜索引擎是用来提高单个搜索引擎的查准率 ( r io ) Pe s n 和查全率 ( ea ) 出现的一 ci R cl 而 1
种 新 的搜索 模式 。
1 搜索引擎的实现难点
由于元 搜索 引擎 环境 所特 有 的一些 特征 , 给创建 高效 的元 搜索 引擎 带来 一定 困难 。
1 1 成 员搜 索 引擎 的 自治 性 .
元 搜索 引擎 的成 员搜 索 引擎通 常都 是独立 建造 的 , 个搜 索引 擎 自己决定 该 索 引哪 类 文本 集 为用 户 每 提 供 服务 , 自己决定 文本 如 何表示 、 引及 更 新索 引 的时 间 , 索 自己决 定 相似 函数 的计 算 , 文 本 与 给定 查 而
文章 编 号 : 6 2— 3 5 20 ) 3— 4 8一o 17 9 1 (0 7 0 04 4
一
种 元搜 索 引擎 框 架模 型 的设 计
郭 晔, 李建廷 , 浩鸣 王
( 西安财经学院 计算机科学系 , 陕西 西安 70 6 ) 10 1
摘 要 : 索引擎是搜 索引擎之 上的搜 索引擎。用户递 交检 索请 求, 元搜 元搜 索 引擎接收该请 求 后, 它提 交给 多个预先选定的搜索 引擎成员, 中所有的查询 结果并以统一 的格式返 回给 用 把 集 户。首先概述 了元搜索引擎的原理和现状, 分析 了当前研究元搜 索引擎的难点所在 , 并提 出改进 方案。在此基础上 , 设计 了元搜 索引擎的总体框架, 出了查询代理 、 索代理、 提 搜 运算代理三大功
搜索引擎分类
搜索引擎分类摘要搜索引擎是一种能够帮助用户在互联网上定位和获取所需信息的工具。
随着互联网的迅速发展,搜索引擎也变得越来越多样化。
本文将介绍几种常见的搜索引擎分类,包括通用搜索引擎、垂直搜索引擎和元搜索引擎。
1. 通用搜索引擎通用搜索引擎是最常见的搜索引擎类型,它能够提供广泛的搜索服务,包括网页、图片、视频等多种内容。
通用搜索引擎致力于通过分析网页的内容和链接关系,为用户提供最相关的搜索结果。
目前,全球最大的通用搜索引擎是谷歌(Google),其他著名的通用搜索引擎还有百度、必应(Bing)等。
通用搜索引擎的工作原理通常包括三个主要步骤:抓取、索引和排名。
首先,搜索引擎会使用爬虫程序抓取互联网上的网页内容。
然后,对抓取到的网页进行索引构建,以便更快地检索和匹配用户的搜索关键词。
最后,对索引的网页进行排名,将最相关的搜索结果展示给用户。
虽然通用搜索引擎功能齐全,但是对于特定领域的搜索需求它的效果可能并不理想。
因此,针对特定领域的搜索需求,垂直搜索引擎应运而生。
2. 垂直搜索引擎垂直搜索引擎也称为专业搜索引擎,它专注于特定领域的信息检索。
相较于通用搜索引擎,垂直搜索引擎提供更加精确和专业化的搜索结果。
例如,知乎作为一个垂直搜索引擎,主要面向问题和答案的搜索需求。
而豆瓣则致力于提供电影、图书等娱乐领域的专业化搜索服务。
垂直搜索引擎的优势在于它能够更好地理解和满足特定领域用户的搜索需求。
通过针对特定领域的内容进行分析和聚合,垂直搜索引擎能够提供更加精准和有效的搜索结果。
此外,垂直搜索引擎通常提供更加丰富的专业化功能,如过滤器、排序选项等,以便用户更好地定位所需信息。
然而,垂直搜索引擎的局限性在于其覆盖范围相对较窄。
由于专注于特定领域,垂直搜索引擎往往无法提供其他领域的相关信息,因此对于跨领域搜索需求,用户可能需要同时使用多个垂直搜索引擎或通用搜索引擎。
3. 元搜索引擎元搜索引擎是将多个搜索引擎的结果进行整合和呈现的搜索工具。
中文元搜索引擎发展研究
理 系信息管理与信息系统专业 20 0 8级在读 本科生 , 河南省郑州
市科学大道 10号 ,5 0 1 0 400 .
An l sso nt r tPub i p n o a y i n I e ne lcO i i ns’I pa to t g to m c n heCo n i n i o ut i e . v r n e fYo h n W b2 0En i o m nt
3 3 5 h m1 3 61 .t . 1
( 责任编辑 : 胡建平 ) 第一作者简介 : 邢 萌 , ,90年生 , 女 19 现为郑州大学信 息管
中国互联 网信息 中心 ,0 1 21. [ ] 景秀明 , 7 张鸯 , 唐朱 勇. 秒时代 的微力量 : 微博对 突发性事件 的独特传播—— 以“ . 41 4玉树地震 ” 微博报道为例 [ ] 闻知识 , J. 新
科技情报开发与经济
文章编 号:0 5 6 3 (0 I 2 — 1 l0 10 ~ 0 3 2 1 )6 0 2 一 4
S IT C F R TO E E O M N C—E HI O MA IND V L P E T&E O O Y N CN M
21 年 0 1
第2卷 1
第 2 期 6
具有深远的意义。
2 1 ( :3 3 . 0 1 3) 3 - 6
[ ] C N C2 0 中国青少年上 网行为调查 报告 [ . 3 N I .09年 R3 北京: 中 国互联 网信息 中心 ,0 0 2 1. [ ] 康年 , 4 邓蕾 , 黄洪基 . 问题研 究 向学科 化研究 的转 向——青
沙: 湖南人 民出版社 ,0 6 2 . 2 0 :5 [ ] C N C第 2 6 N I . 8次中国互联 网络发展状况统 计报 告[ ] R. 北京:
元搜索引擎
可能是或者, 事实上,经链接证明这两个URL均是正确的。
济,文化,娱乐,体育等。
为了适应各个成员引擎的界面,可以采用交或并的方法,在翻译查询 时交的方法需要给成员引擎填缺省值,并的方法针对特定的引擎要做取舍。
2)搜索引擎选择:
最简单的方法是提供系统中可用的搜索引擎的列表让用户 自己来选择。元搜索引擎一般允许用户选择合适的搜索引擎集 合具体进行检索,选择方式包括选择一个搜索引擎、选择全部 搜索引擎、选择满足一定条件的若干个搜索引擎(例如最快的 或最好的三个)。 另外就是获取各个成员引擎内容的表示和查询匹配,选择最 相关的前n个引擎进行查询。这种方法很大程度取决于引擎内容 的表示。 有些元搜索引擎只能使用固定的搜索引擎集合。
飓风搜索通使用
ALL-IN-ONE 方式
• ALL-IN-ONE方式是指元搜索引擎界面以任意顺序或分类罗列多个 (一般都是数十个)搜索引擎,但元搜索引擎本身主要提供各类搜索 引擎的介绍信息和物理连接机制。这种ALL-IN-ONE方式的元搜索引 擎确切地说只是搜索引擎的罗列,它们具有以下特点: (1)仅仅提供一个简单的界面来帮助用户选择和使用各搜索引擎。 (2)只能选择一个搜索引擎进行检索。 (3)对各独立搜索引擎检索界面的复制可能是部分的或全部的。 (4)直接利用所选搜索引擎的显示格式呈送给用户
3)查询分发
• 把来自检索界面的查询串翻译成特定的引擎的串。 • 由于每个搜索引擎都有自己的查询语言,因此元搜索引擎需要将用 户通过统一界面以统一形式输入的全局检索指令转换为各个成员搜 索引擎的局部指令语言,这可利用“全局/局部指令字典”来实现。 • 全局指令既要准确地表达所有成员搜索引擎指令语言的共同特点和 指令形式,又要能够以一定方式执行有关成员搜索引擎指令的特殊 功能。目前,指令转换尚有较多不足之处。
MetaSearch元搜索引擎简介
Meta-search engine(元搜索引擎)是在前述搜索引擎基础上建立的可以同时查询多个搜索引擎的WWW站点,其英文原意是搜索引擎之后或之上的搜索引擎,因而也可以叫做后搜索引擎。
虽然元搜索引擎依赖其他独立搜索引擎而存在,但它们集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能,查一个元搜索引擎就相当于查多个独立搜索引擎,可以收到事半功倍的效果,故值得选用。
按照搜索机制划分,元搜索引擎包括并行式和串行式两类,并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将的结果按特定的顺序呈现给用户;串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。
显然,并行式元搜索引擎运行模式较好,搜索所需时间也较短。
现将主要的元搜索引擎介绍如下。
2.6.1 Cyber411()Cyber411是并行式元搜索引擎,它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个独立万维网搜索引擎和9个其他Internet功能搜索引擎,但它没有任何高级搜索选项或者定制选项,只适于作为元搜索的入门,让初学者查找简单而明确的目标。
其主页如图2.57所示。
Cyber411主页中栏有查询选择及输入框,输入查询词后点击now!按钮可查。
Cyber411的搜索功能包括:(1)支持简单搜索;(2)不支持高级搜索;(3)不支持目录搜索。
可以选择搜索引擎。
操作步骤:1)在Search for:下查找输入框中输入Internet and cosmic;2)点击Search按钮,开始进行搜索。
多个词汇作为一个统一概念查询时应该用括号括起来查。
页面中列出了满足搜索要求的Web网点。
第一个响应的搜索引擎一出现,就很快能得到只包含每个页面标题的搜索结果,而结果页面的其他部分会在接收搜索结果时载入。
由于Cyber411不能为其所查询的15个搜索引擎中的每个引擎都转化搜索语法,所以对于高级查询或复杂搜索来说,Cyber411返回的结果很多与所查问题不相关。
常用的搜索引擎有哪些
常用的搜索引擎有哪些
常用的搜索引擎有以下这些:
1、百度搜索
百度搜索是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。
“百度”二字源于中国宋朝词人辛弃疾的《青玉案》诗句:“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。
2、搜狗搜索
搜狗搜索是中国领先的中文搜索引擎,致力于中文互联网信息的深度挖掘,帮助中国上亿网民加快信息获取速度,为用户创造价值。
3、360搜索
360综合搜索,属于元搜索引擎,是搜索引擎的一种,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
4、谷歌搜索
谷歌搜索引擎是谷歌公司的主要产品,也是世界上最大的搜索引擎之一,由两名斯坦福大学的理学博士生拉里·佩奇和谢尔盖·布林在1996年建立。
谷歌搜索引擎拥有网站、图像、新闻组和目录服务四个功能模块,提供常规搜索和高级搜索两种功能。
元搜索引擎的个性化
文 献标 志码 :A
文章 编号 :0 9 . 17( 0 8)0 .6 60 4 32 3 2 0 50 1—5
P r o aia in o e a S a c g n e s n l to f z M t — e r h En i e
LI a — o g,F NG i o g, Z oh n Xi E Zh — n y HANG a g Lin
维普资讯
第4卷 第5 1 期 20 0 8年 5 月
天
津
大
学
学
报
V 1 1 No 5 b. 4 .
J u n o ini ies y o r  ̄ f a j Unv ri T n t
Ma 0 8 v2 0
元搜索引擎 的个性化
李晓红 ,冯 志勇 ,张 亮
( c o l f mp tr cec n eh oo y, ini Unv ri , ini 0 0 2 C ia S h o o Co ue in e dT c n lg Taj iesy T ajn3 0 7 , hn ) S a n t
Abs r c : A eho t e e ae dy m i e o l orpe s a ia i n we r o c e r h s d c be . c s ta t m t d o g n r t na c us rpr f esf r on z ton i b es ur e s a c wa es r d Ac e s i l i
运 而生 .
在个 性 化方 面 已经有 了一些 相 关 的工作 【 J文 2. 。 献 [】 4 中讨 论 了各 种 各 样 的个 性化 问题 , 中包 括 大 其 量 个 性 化 业 务及 其 一些 可用 技 术 . 有 的商 业 系统 现 We T ed利 用 原 型 工 具 来进 行 日志分 析 JWu等 b rn . 人 【通 过 基 于 内容 的协 作 过滤 技 术 来 对 网站创 建 用 6
元搜索引擎名词解释
元搜索引擎名词解释元搜索引擎名词解释:元搜索引擎,通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。
一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。
"请求提交"负责实现用户"个性化"的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。
"接口代理"负责将用户的检索请求"翻译"成满足不同搜索引擎"本地化"要求的格式。
"结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。
使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。
元搜索引擎的原理我们可将元搜索引擎看成具有双层客户机/服务器结构的系统,用户向元搜索引擎发出检索请求。
元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求;搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。
当然,某些元搜索引擎具有略微不同的机制。
元搜索引擎的分类在可以检索的目标搜索引擎、检索提问的处理方式以及如何编译和显示结果方面,元搜索引擎有着很大的差异。
有些元引擎一个接一个的搜索目标搜索引擎,另一些则同时进行搜索。
有些搜索引擎将检索提问转变成目标搜索引擎的提问语言,而有一些则原封不动的发送给目标引擎。
按功能划分,元搜索引擎包括多线索式搜索引擎和All-in-One式搜索引擎;按运行方式的差异可分为在线搜索引擎和桌面搜索引擎。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
元搜索引擎随着科学技术的发展,元搜索引擎技术应运而生。
元搜索引擎是基于搜索引擎之上的搜索引擎。
如今已逐渐成为了社会的热点话题,它已经渐渐地融入到人们的日常生活中。
A元搜索引擎定义:通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,它是是对分布于网络的多种检索工具的全局控制机制。
B元搜索引擎核心理论:元搜索引擎就是一个具有双层客户机/服务器机构的系统,一般由检索请求提交、检索接口代理、检索结果显示3部分组成。
(1)请求提交。
负责实现用户的检索设置要求,包括调用哪些独立搜索引擎、是否有最长检索时间设置、是否提供高级检索服务、设置每个搜索引擎返回的检索结果数量、在线帮助是否有效等。
若用户选择个性化检索,则推理机制将根据用户基本信息与动态知识库进行分析推理用户的当前意向,进行查询求精处理,并根据用户对返回结果的行为使用反馈机制动态更新知识库。
(2)检索接口代理。
负责将用户的检索请求“翻译”成能够满足不同搜索引擎“本地化”要求的格式,包括是否支持布尔检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。
它是元搜索引擎的一个重要指标。
(3)结果显示。
负责所有来源搜索引擎检索结果的去重、合并、输出处理等。
元搜索引擎如何将独立搜索引擎的检索结果以统一的格式显示给用户,是评测其检索性能的重要手段。
C元搜索引擎代表性文献:i 《元搜索引擎结果生成技术研究》张卫丰徐宝文等著ii 《中外元搜索引擎的比较研究》晏一平岳泉著D元搜索引擎主要模型:数学模型作为一个信息检索系统,元搜索引擎可以形式化的通过一个六元组来描述:MSE-System=(SEn,Qn,Hn,Fn,Rn,Tn)其中SEn、Qn、Hn、Fn、Rn和Tn分别表示待选择搜索引擎集合,信息检索需求集合,信息检索需求交换集合,待选择搜索引擎集合和信息检索需求集合之间的匹配处理框架,排序算法以及查询结果集筛选标准。
E元搜索引擎方法与工具:方法:1接受用户的原始查询;2把原始查询分别转换为各个成员搜索引擎能够接受的形式;3向成员搜索引擎发送查询;4收集各个搜索引擎的原始查询结果;5对原始查询结果进行合成,形成最终结果;6把最终查询结果递交给用户。
工具: ROST Search Engine Analysis Tools 0.1版F元搜索引擎最佳实践:国内最佳搜索引擎:1.搜魅网(someta):集合了百度、google、搜狐、雅虎多家主流搜索引擎的结果,提供网页、资讯、网址导航等聚合查询。
搜魅网突破了元搜索引擎没有自己的蜘蛛的瓶颈,提供了网站查询的功能。
2.佐意综合搜索(chinazss):佐意网提供的综合搜索,结合了Google\Baidu\yahoo\等知名搜索引擎,更细分了不同的搜索类别,如软件搜索,游戏搜索,视频搜索,新闻搜索,网页搜索,地图搜索,音乐搜索,企业搜索等。
看似页面简单,却搜索功能却很强大。
佐意综合搜索可以说是元搜索中的一个典范。
该搜索引擎还可直接查询手机号码归属地,IP查询等。
3.觅搜(MetaSoo):最近发现的一个使用了Ajax技术的中文元搜索引擎,可搜索谷歌、百度、雅虎一搜、搜狗、有道等。
用户可以自行设置各搜索引擎的可信度(权重),觅搜会根据各搜索引擎重复等情况计算得分,最高100分,然后按照得分排序。
这是Ajax技术在元搜索引擎中的第一次应用。
4.抓虾网聚搜:就是将百度、Google两家算法各异的搜索巨头的搜索结果去重,然后呈现到用户面前。
通过抓虾聚搜的搜索框,还可以方便的进行天气预报查询、手机归属地查询、网页计算器、ip地址查询、邮编区号查询、实时汇率转换、网站PR值、ALexa排名速查、网站快速预览、检索纠正功能、字典查询、诗词查询、成语词典、百家姓速查、快递单号查询等等。
致力快捷生活。
国外的最佳搜索引擎:1.MetaCrawler:提供涵盖近2 0个主题的目录检索服务,包括常规检索、高级检索、定制检索、国家或地区的资源检索等。
其中,高级检索模式可实现搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,检索结果排序依据(包括相关度、域名、源搜索引擎)设定等。
2.Dogpile:它首先并行地调用Google、Yahoo、MSN、Ask Jeeves等4个元搜索引擎,如果没有得到10个以上的结果,再调用另外的搜索引擎。
但Dogpile不提供可调用的源搜索引擎列表,不支持对各个源搜索引擎的自行指定和选择。
3.Mamma:Mamma是并行式元搜索引擎,自称为“搜索引擎之母”。
可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。
其特点是检索界面友好,检索选项丰富,主要包括可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。
4.Ixquick:Ixquick最大优点是支持中文检索。
支持各种基本的和高级的检索功能,包括关键词检索、短语检索、截词检索、布尔逻辑检索、概念检索、自然语言检索、指定字段检索、包含(+)或排除(-)检索等。
G元搜索引擎软件:K风元搜索引擎系统K-MetaSearch v3.1K-MetaSearch是由Kwindsoft自主研发的元搜索引擎产品。
主要功能特点:任意聚合成员搜索引擎、分类搜索快速建立行业网站群组搜索引擎、缓存技术静态化搜索、中文智能分词技术、广告管理、WAP移动搜索;后台程序采用多线程调用成员引擎,大大提高搜索速度、性能和系统负载能力。
H元搜索引擎热点问题:(1)检索时间有时过长。
虽然元搜索引擎采用了一系列的优化运行机制,能够在尽可能短的时间内提供相对全面、准确的信息,但是由于一次调用多个独立搜索引擎,并将用户的检索请求转换处理后进行搜索,然后将所有查询结果集中起来以统一的格式呈现在用户面前,而从各独立搜索引擎返回的结果中常有很多重复结果,数量庞大,因此,在去重、排序、聚类等处理时,系统将面临巨大负载,增加了检索时间。
(2)检索结果全面性和可靠性较差。
元搜索引擎检索时间的限制、检索结果数量的限制等,限定了从每个成员引擎返回的检索结果的数量。
此外,因各成员引擎彼此相对独立,最后返回给用户的检索结果往往不完整、常常有重复,不能完全满足用户需求,用户需要做更多的筛选,从而影响了检索结果的全面性和可靠性。
(3)不能灵活控制结果的输出。
由于元搜索引擎是通过一个统一用户界面帮助用户利用若干独立搜索引擎来实现检索操作,因此,在查询输入处理及输出显示时可能出现问题。
(4)检索结果排序不够理想。
因为不同搜索引擎在本身查询结果排序过程中采用的算法相差很大,元搜索引擎必须整合这些使用不同排序算法产生的结果,以统一的结果形式返回给用户。
如果仅按各搜索引擎自己的结果序列顺序显示输出,结果很可能有重复。
(5 )信息搜索覆盖面受到限制,影响了检索效果和质量。
因为元搜索引擎实现检索语法转换的能力仍然有限,不支持指定字段检索等特殊检索特性的高级检索功能,不同的搜索引擎在解析查询表达式的方式、处理大小写字母的方式、是否允许自然语言查询、是否可以采用邻接操作符等方面都可能有差异。
此外,元搜索引擎不能正确处理一些词组和布尔检索算符,发挥不了各个独立搜索引擎的高级检索特色。
为了尽可能多地挂接搜索引擎,元搜索引擎通常只使用简单、直接的搜索策略,一般仅支持not、and、or等简单的布尔逻辑语法操作,因此,许多大型搜索引擎被排除在外,影响了信息检索覆盖面。
(6)检索式处理较复杂。
由于大部分搜索引擎互不兼容,互操作性差,用户接口不一致,一些包含多个词或复杂逻辑的查询请求,其查询式常被一些成员引擎误解。
I元搜索引擎发展趋势:元搜索引擎依赖于数据库选择技术、文本选择技术、查询分派技术和结果综合技术等。
用户界面的改进、调用策略的完善、返回信息的整合以及最终检索结果的排序,仍然是未来元搜索引擎研究的重点。
(1)基于智能代理的信息过滤和个性化服务的元搜索引擎研究由于智能代理具有不断学习、适应信息和用户兴趣动态变化的能力,将智能代理技术应用于元搜索引擎的结构中,构建智能元搜索引擎,可使元搜索引擎能够不断学习用户的信息需求,检索时自动搜索相关信息源,依据检索模型智能地提供“命中”结果,从而提供个性化的服务;可以按照用户要求定期反馈,实现定期和定题检索;能依据用户的信息反馈,自动对知识库里的知识进行纠错、增加等维护和更新;能够分析整理成员搜索引擎的工作记录数据,建立调用策略模型,实施检索时动态地决定调用策略,将搜索请求递交给最适合的搜索引擎处理,并自动将用户感兴趣的、对用户有用的信息提交给用户。
元搜索引擎智能代理的核心是搜索引擎知识库的预处理和搜索引擎调用策略的确定。
其具体表现在查询定制、自动处理、结果过滤与排序上。
即允许用户灵活地设置查询条件和搜索选项,如选择合适的源站点、搜索范围及限定语言、地域或类型等,识别与理解用户需求并自动生成调用策略激活成员搜索引擎,整合成员搜索引擎的返回信息并按时间或关联度对结果排序。
因此,研究和构建智能元搜索引擎是元搜索引擎的一个重要发展方向。
(2)基于分布式体系结构P to P和网格计算技术的元搜索引擎研究首先,作为目前流行的一种新兴网络模型——计算机对等联网(Peer—To—Peer,P to P)是真正的分布式计算技术,P to P引导网络计算模式从集中式向分布式转移,使网络应用的核心从中央服务器向网络边缘的终端设备扩散。
P to P技术的优势是开发出强大的搜索工具,使用户能够深度搜索文档。
这种搜索无需通过Web服务器,不受信息文档格式和宿主设备的限制,达到传统目录式搜索引擎(查全率在20%~30%之间)无可比拟的深度(包括网上所有开放的资源)。
P to P对等搜索技术应用于元搜索引擎,将为Internet的信息搜索提供全新的解决之道,是元搜索引擎发展的趋势之一。
其次,源于美国联邦政府过去10年来资助的高性能计算项目——网格计算技术,试图实现互联网上所有资源的全面连通,包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等。
网格是把信息技术具体化、计算资源虚拟化,并把所有通过联网的计算资源都按共享原则参与进来,达到计算资源的全面共享,以满足不断变化的计算需求。
所以,开发基于网格的搜索引擎不仅可以大大提高资源检索的效率,实现即查即得,还可以实现对异构资源的检索,并获得很高的查全率和查准率。
构建基于网格的搜索引擎是目前研究的另一个热点。
(3)具有交叉语言检索功能的元搜索引擎研究交叉语言信息检索是指用户用母语提交查询,搜索引擎在多种语言的数据库中进行信息检索,返回能够回答用户问题的所有语言的文档。