元搜索引擎

合集下载

元搜索引擎

元搜索引擎

元搜索引擎随着科学技术的发展,元搜索引擎技术应运而生。

元搜索引擎是基于搜索引擎之上的搜索引擎。

如今已逐渐成为了社会的热点话题,它已经渐渐地融入到人们的日常生活中。

A元搜索引擎定义:通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,它是是对分布于网络的多种检索工具的全局控制机制。

B元搜索引擎核心理论:元搜索引擎就是一个具有双层客户机/服务器机构的系统,一般由检索请求提交、检索接口代理、检索结果显示3部分组成。

(1)请求提交。

负责实现用户的检索设置要求,包括调用哪些独立搜索引擎、是否有最长检索时间设置、是否提供高级检索服务、设置每个搜索引擎返回的检索结果数量、在线帮助是否有效等。

若用户选择个性化检索,则推理机制将根据用户基本信息与动态知识库进行分析推理用户的当前意向,进行查询求精处理,并根据用户对返回结果的行为使用反馈机制动态更新知识库。

(2)检索接口代理。

负责将用户的检索请求“翻译”成能够满足不同搜索引擎“本地化”要求的格式,包括是否支持布尔检索、短语检索、自然语言检索等高级检索特性,是否能够实现检索请求的“本地化”转换。

它是元搜索引擎的一个重要指标。

(3)结果显示。

负责所有来源搜索引擎检索结果的去重、合并、输出处理等。

元搜索引擎如何将独立搜索引擎的检索结果以统一的格式显示给用户,是评测其检索性能的重要手段。

C元搜索引擎代表性文献:i 《元搜索引擎结果生成技术研究》张卫丰徐宝文等著ii 《中外元搜索引擎的比较研究》晏一平岳泉著D元搜索引擎主要模型:数学模型作为一个信息检索系统,元搜索引擎可以形式化的通过一个六元组来描述:MSE-System=(SEn,Qn,Hn,Fn,Rn,Tn)其中SEn、Qn、Hn、Fn、Rn和Tn分别表示待选择搜索引擎集合,信息检索需求集合,信息检索需求交换集合,待选择搜索引擎集合和信息检索需求集合之间的匹配处理框架,排序算法以及查询结果集筛选标准。

标准的检索工具

标准的检索工具

标准的检索工具
一些常见的标准检索工具包括:
1. 搜索引擎:如Google、Bing、百度等,用户可以通过输入关键词来获取相关信息。

2. 图书馆目录:图书馆提供的系统,用于查找图书、期刊、论文等资源。

3. 学术搜索引擎:如Google Scholar、Web of Science、Scopus 等,主要用于查找学术文献和学术资源。

4. 数据库:包括各种专业领域的数据库,如PubMed(生物医学)、IEEE Xplore(工程技术)、EBSCOhost(多学科领域)等。

5. 元搜索引擎:如Zotero、EndNote等,可以同时搜索多个数据库并整合结果。

6. 社交媒体搜索:如Twitter、Instagram、微博等,用于查找特定的社交媒体内容。

7. 文件管理工具:如Windows的文件搜索功能、Mac的Spotlight 等,用于在本地计算机上快速查找文件和文件夹。

8. 专业领域的检索工具:根据特定领域的需求,有一些定制化的检索工具,如化学领域的Reaxys、生物信息学领域的BLAST等。

这只是一些常见的标准检索工具,还有许多其他工具适用于特定的搜索需求。

元搜索引擎的资料挖掘

元搜索引擎的资料挖掘

复排除 、 新排序等处理 。 重 详尽 全 面 的检 索 结 果 信 息 描 述 : 持 多 支 种语 言 检索 . 服务 方 式 为 面 向: 网页 的全 文 检 索 元 搜 索 引 擎 是 搜 索 引 擎 的 搜 索 , 点 显 著 : 搜 索 引 擎 没 有 特 元 自己 的 网页 数 据 库 和 R bt利 用其 他 的 数据 库 不 侵 权 . 按 内 容 oo. 但 集 中 了多 个 专 门 的搜 索 引 擎 的 查 询 界 面 . 实 现 一 站 制 对 各 数 据 可 库 进 行 搜 索 . 约 存 储 设 备 : 过 对 多 个 全 文 数 据库 按 一 定 标 准 节 通 ( D )进 行 标 引 后 ,组 成 一 个 元 数 据 集 ,通 过 一 个发 布 系 统 如 C ( B服 务 器 ) 客 户 端进 行 交 互 。 到 一个 集 成 后 的 多数 据库 查 WE 与 得 询 系 统 , 对对 原 始 数 据 的 描 述 信息 。通 过 一个 特 定 连 接 . 户 可 有 用 以 直 接 从 原 始 数 据 库 中得 到原 文 数 据 .结 果 是 二 次 搜 索 号 擎 加 } 工 :把 多个 搜 索 引 擎 的 检 索结 果 重 新 组 织 .按 照 相 关 性 大 小 重 新 排 序 , 果 显示” 结 负责 所 有 源 搜 索 引擎 检 索 结 果 的 去 重 、 并 、 合 输 出处 理 等 元 搜 索 引 擎 的 出现 . 按 用 户 意 愿 对 检 索 结 果 进 行 分 级 能 编排 . 以统 一 的 界 面 呈 现 给用 户 . 可 以说 元 搜 索 引 擎 仅 是 一 种 也 代 理 机 制式 的查 询
K yWo d : a d p n e t e r n n ; ac n n : fr t nrte a d t mi n e rsYun i e e d n a h e g e er e g e n ma o r v l a n g n s c i s h i io i ei a i

元搜索引擎简介

元搜索引擎简介

著名元搜索引擎
8、ByteSearch ( ) 搜索速度快,可检索资源丰富,搜索范围包 括Web、城市信息、公司名录、域名、FTP 网站、多媒体、新闻组、包裹跟踪等,并提 供新闻浏览、URL提交、最新的20个检索浏 览、联机商店等内容方面的服务。支持完全 匹配(All)、部分匹配(Any)、短语检索 (Phrase)等特性检索功能,没有搜索引擎 列表,不能控制源搜索引擎的选择。
著名元搜索引擎
7、MetaCrawler ( ) 1995年由华盛顿大学推出,1997年被InfoSpace购买。支持 调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服 务。其检索特性非常丰富,包括常规检索、高级检索、定制 检索、国家或地区的资源检索等检索服务模式。其中,高级 检索模式可实现:搜索引擎的选择调用,基于域名、地区或 国家的检索结果过滤,最长检索时间设置,每页可显示的和 允许每个搜索引擎返回的检索结果数量的设定,设定检索结 果排序依据(包括相关度、域名、源搜索引擎)等。以上内 容均可作为定制检索的个性化选项并予以保存。另外,检索 结果中包括一个以1000为最大值的相关度指标。
著名元搜索引擎
1、InfoGrid ( /) 提供与主要搜索网站的直接连结和目录检索,具 有强大的元搜索和新闻搜索功能。 2、Infonetware RealTerm Search ( /) 原为检验网络分类技术而设计。它以元搜索引擎 知名,但具有强大的对搜索结果进行主题分类的 功能。与众不同的是,用户可选择不同的主题, 并得到来自所有主题搜索结果,而不是仅仅把搜 索结果限制在一个主题范围之内。
元搜索引擎简介
相关定义:
元搜索引擎(Meteasearch Engine),是一种调 用其他独立搜索引擎的引擎,亦称“搜索引擎之母 (The Mother of Search Engines)”.在这里,“元” (Meta)为“总的”、“超越”之意,元搜索引擎 就是对多个独立搜索引擎的整合、调用、控制和优 化利用。相对元搜索引擎,可被利用的独立搜索引 擎称为“源搜索引擎”(Source Engine)或“搜索 资源”(Searching Resources),整合、调用、 控制和优化利用源搜索引擎的技术,称为“元搜索 技术”(Meta-searching Technique),元搜索技术 是元搜索引擎的核心。

元搜索引擎的个性化

元搜索引擎的个性化

文 献标 志码 :A
文章 编号 :0 9 . 17( 0 8)0 .6 60 4 32 3 2 0 50 1—5
P r o aia in o e a S a c g n e s n l to f z M t — e r h En i e
LI a — o g,F NG i o g, Z oh n Xi E Zh — n y HANG a g Lin
维普资讯
第4卷 第5 1 期 20 0 8年 5 月






V 1 1 No 5 b. 4 .
J u n o ini ies y o r  ̄ f a j Unv ri T n t
Ma 0 8 v2 0
元搜索引擎 的个性化
李晓红 ,冯 志勇 ,张 亮
( c o l f mp tr cec n eh oo y, ini Unv ri , ini 0 0 2 C ia S h o o Co ue in e dT c n lg Taj iesy T ajn3 0 7 , hn ) S a n t
Abs r c : A eho t e e ae dy m i e o l orpe s a ia i n we r o c e r h s d c be . c s ta t m t d o g n r t na c us rpr f esf r on z ton i b es ur e s a c wa es r d Ac e s i l i
运 而生 .
在个 性 化方 面 已经有 了一些 相 关 的工作 【 J文 2. 。 献 [】 4 中讨 论 了各 种 各 样 的个 性化 问题 , 中包 括 大 其 量 个 性 化 业 务及 其 一些 可用 技 术 . 有 的商 业 系统 现 We T ed利 用 原 型 工 具 来进 行 日志分 析 JWu等 b rn . 人 【通 过 基 于 内容 的协 作 过滤 技 术 来 对 网站创 建 用 6

一个元搜索引擎的设计与实现

一个元搜索引擎的设计与实现
引擎与专 门搜 索 “nib b 的检索工具相 结 Iv i eWe ” sl 合, 采用高效 的融合处理算法对它们 的检索结果进 行分析处理后 , 按各记录表现的主题进行分类, 同时 通 过跟 踪分 析用 户 的搜 索 行 为 , 各 主题 与用 户 可 将 能最感兴越的主题 的记录返回给用户。
Ke r s S e i ie e c n i e T p c d s l t n; p c aie it n r I vsb e W e y wo d : p c a z d s a h e gn ; o i it l i S e il d d c i a y;n i l b l r ia o z o i
X AO Gu I o—q a g Z in , HANG F n ag
( eat etfCm u r c nead Tcnl y Wua 3 0 4 C i ) Dp r n o p t i c n eh o g , h n4 07 ,hn m o eSe o a
Ab t a t I h s p p r a mea — s a c n i e b s d o p ca ie e r h n n ie i i t - sr c :n ti a e , t e r h e gn a e n s e il d s a c i g e gn s n r z o
gae p ra h T e rs l tre d p e w y o s bi ig p fsin l dc o ay t xrc rtd a p o c . h e ut r u d a o tt a fe t l hn r eso a it n r o e t t se n h a s o i a
d cd Po si a sac n n i ema e i pca zdsac Ivs l We ”sac osne u e . r es n e heg ewlb d t sei i r h“n ibe b e r t l i — f ol r i l wh le e i h o t

元搜索引擎简介

元搜索引擎简介
元搜索Байду номын сангаас擎简介
相关定义:
元搜索引擎(Meteasearch Engine),是一种调 用其他独立搜索引擎的引擎,亦称“搜索引擎之母 (The Mother of Search Engines)”.在这里,“元” (Meta)为“总的”、“超越”之意,元搜索引擎 就是对多个独立搜索引擎的整合、调用、控制和优 化利用。相对元搜索引擎,可被利用的独立搜索引 擎称为“源搜索引擎”(Source Engine)或“搜索 资源”(Searching Resources),整合、调用、 控制和优化利用源搜索引擎的技术,称为“元搜索 技术”(Meta-searching Technique),元搜索技术 是元搜索引擎的核心。
著名元搜索引擎
7、MetaCrawler ( )
1995年由华盛顿大学推出,1997年被InfoSpace购买。支持 调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服 务。其检索特性非常丰富,包括常规检索、高级检索、定制 检索、国家或地区的资源检索等检索服务模式。其中,高级 检索模式可实现:搜索引擎的选择调用,基于域名、地区或 国家的检索结果过滤,最长检索时间设置,每页可显示的和 允许每个搜索引擎返回的检索结果数量的设定,设定检索结 果排序依据(包括相关度、域名、源搜索引擎)等。以上内 容均可作为定制检索的个性化选项并予以保存。另外,检索 结果中包括一个以1000为最大值的相关度指标。
著名元搜索引擎
6、Mamma ( )
1996年面世,自称为“搜索引擎之母”的并行元搜 索引擎,可同时调用7个最常用的独立搜索引擎, 并且可查询网上商店、新闻、股票指数、图像和声 音文件等资源。其特点是检索界面友好,检索选项 丰富,主要包括:可控制调用的独立搜索引擎、选 择使用短语检索功能、设定检索时间、设定每页可 显示记录数等。另外,Mamma支持常用检索语法 在不同搜索引擎中的转换,还提供了专门检索页面 文件标题的特殊检索服务,以及通过E-mail传输检 索结果的特色功能。检索结果以相关性排序,内容 包括网页名称、URL、文摘、源搜索引擎。

一种元搜索引擎框架模型的设计

一种元搜索引擎框架模型的设计

元 搜索 引 擎是一 个搜 索其 他 引擎 的搜索 引擎 。一个 元 搜索 引 擎 以用 户输 入 的查 询关 键 字 作 为输 入 , 然后 将该关 键 字 同时 提交 给 多个 成员 搜索 引擎 , 将这 些搜 索 引擎 的返 回结 果按 照 一定 的算 法重 新排 序 并
并反馈给用户。元搜索引擎是用来提高单个搜索引擎的查准率 ( r io ) Pe s n 和查全率 ( ea ) 出现的一 ci R cl 而 1
种 新 的搜索 模式 。
1 搜索引擎的实现难点
由于元 搜索 引擎 环境 所特 有 的一些 特征 , 给创建 高效 的元 搜索 引擎 带来 一定 困难 。
1 1 成 员搜 索 引擎 的 自治 性 .
元 搜索 引擎 的成 员搜 索 引擎通 常都 是独立 建造 的 , 个搜 索引 擎 自己决定 该 索 引哪 类 文本 集 为用 户 每 提 供 服务 , 自己决定 文本 如 何表示 、 引及 更 新索 引 的时 间 , 索 自己决 定 相似 函数 的计 算 , 文 本 与 给定 查 而
文章 编 号 : 6 2— 3 5 20 ) 3— 4 8一o 17 9 1 (0 7 0 04 4

种 元搜 索 引擎 框 架模 型 的设 计
郭 晔, 李建廷 , 浩鸣 王
( 西安财经学院 计算机科学系 , 陕西 西安 70 6 ) 10 1
摘 要 : 索引擎是搜 索引擎之 上的搜 索引擎。用户递 交检 索请 求, 元搜 元搜 索 引擎接收该请 求 后, 它提 交给 多个预先选定的搜索 引擎成员, 中所有的查询 结果并以统一 的格式返 回给 用 把 集 户。首先概述 了元搜索引擎的原理和现状, 分析 了当前研究元搜 索引擎的难点所在 , 并提 出改进 方案。在此基础上 , 设计 了元搜 索引擎的总体框架, 出了查询代理 、 索代理、 提 搜 运算代理三大功

比较Google、百度、Excite等搜索引擎的异同

比较Google、百度、Excite等搜索引擎的异同

比较Google、百度、Excite等搜索引擎的异同一搜索引擎的概念搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。

百度、谷歌、Excite等是搜索引擎的代表。

二搜索引擎的分类1.全文索引全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。

它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。

根据搜索结果来源的不同,全文搜索引擎可分为两类,一类拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,能自建网页数据库,搜索结果直接从自身的数据库中调用,上面提到的Google和百度就属于此类;另一类则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos搜索引擎。

2.目录索引目录索引虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。

用户完全可以按照分类目录找到所需要的信息,不依靠关键词(Keywords)进行查询。

目录索引中最具代表性的莫过于大名鼎鼎的Yahoo!、新浪分类目录搜索。

3.元搜索引擎元搜索引擎(META Search Engine)接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。

著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的是搜星搜索引擎。

在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile;有的则按自定的规则将结果重新排列组合,如Vivisimo。

其他非主流搜索引擎形式(1)集合式搜索引擎:该搜索引擎类似元搜索引擎,区别在于它并非同时调用多个搜索引擎进行搜索,而是由用户从提供的若干搜索引擎中选择,如HotBot在2002年底推出的搜索引擎。

元搜索引擎名词解释

元搜索引擎名词解释

元搜索引擎名词解释元搜索引擎名词解释:元搜索引擎,通过一个统一用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

一个真正的元搜索引擎由三部分组成,即:检索请求提交机制、检索接口代理机制、检索结果显示机制。

"请求提交"负责实现用户"个性化"的检索设置要求,包括调用哪些搜索引擎、检索时间限制、结果数量限制等。

"接口代理"负责将用户的检索请求"翻译"成满足不同搜索引擎"本地化"要求的格式。

"结果显示"负责所有源搜索引擎检索结果的去重、合并、输出处理等元搜索引擎的出现,对于那些需要连续地使用不同的搜索引擎重复相同的检索的人来说,是一个福音。

使用元搜索引擎同时对几个搜索引擎进行检索,获得分级编排的检索结果。

元搜索引擎的原理我们可将元搜索引擎看成具有双层客户机/服务器结构的系统,用户向元搜索引擎发出检索请求。

元搜索引擎再根据该请求向多个搜索引擎发出实际检索请求;搜索引擎执行元搜索引擎检索请求后将检索结果以应答形式传送给元搜索引擎,元搜索引擎将从多个搜索引擎获得的检索结果经过整理再以应答形式传送给实际用户。

当然,某些元搜索引擎具有略微不同的机制。

元搜索引擎的分类在可以检索的目标搜索引擎、检索提问的处理方式以及如何编译和显示结果方面,元搜索引擎有着很大的差异。

有些元引擎一个接一个的搜索目标搜索引擎,另一些则同时进行搜索。

有些搜索引擎将检索提问转变成目标搜索引擎的提问语言,而有一些则原封不动的发送给目标引擎。

按功能划分,元搜索引擎包括多线索式搜索引擎和All-in-One式搜索引擎;按运行方式的差异可分为在线搜索引擎和桌面搜索引擎。

中文元搜索引擎发展研究

中文元搜索引擎发展研究

理 系信息管理与信息系统专业 20 0 8级在读 本科生 , 河南省郑州
市科学大道 10号 ,5 0 1 0 400 .
An l sso nt r tPub i p n o a y i n I e ne lcO i i ns’I pa to t g to m c n heCo n i n i o ut i e . v r n e fYo h n W b2 0En i o m nt
3 3 5 h m1 3 61 .t . 1
( 责任编辑 : 胡建平 ) 第一作者简介 : 邢 萌 , ,90年生 , 女 19 现为郑州大学信 息管
中国互联 网信息 中心 ,0 1 21. [ ] 景秀明 , 7 张鸯 , 唐朱 勇. 秒时代 的微力量 : 微博对 突发性事件 的独特传播—— 以“ . 41 4玉树地震 ” 微博报道为例 [ ] 闻知识 , J. 新
科技情报开发与经济
文章编 号:0 5 6 3 (0 I 2 — 1 l0 10 ~ 0 3 2 1 )6 0 2 一 4
S IT C F R TO E E O M N C—E HI O MA IND V L P E T&E O O Y N CN M
21 年 0 1
第2卷 1
第 2 期 6
具有深远的意义。
2 1 ( :3 3 . 0 1 3) 3 - 6
[ ] C N C2 0 中国青少年上 网行为调查 报告 [ . 3 N I .09年 R3 北京: 中 国互联 网信息 中心 ,0 0 2 1. [ ] 康年 , 4 邓蕾 , 黄洪基 . 问题研 究 向学科 化研究 的转 向——青
沙: 湖南人 民出版社 ,0 6 2 . 2 0 :5 [ ] C N C第 2 6 N I . 8次中国互联 网络发展状况统 计报 告[ ] R. 北京:

一种基于.NET的元搜索引擎的设计与实现

一种基于.NET的元搜索引擎的设计与实现

eSac rerh的搜索 结 果 。 N TFa w r . E r me ok是 Mi oot c sf r 力 推 的新 一 代开发 平 台 ,N T拥 有 强 大而 安 全 的 .E
多线 程 技术 、 捷 的数 据 访 问特 性 和完美 的对 迅
We 准 的支持 , 因为这 些 优 点 , 们 选 择 使用 b标 正 我 它来 构建 并实 现 Pw rerh o eSac。下 面 详 细 的分 析 了
原理 , 对元搜索 引擎和 一般的元搜索引擎进行 比较 , 指出元搜索引擎 的特点 , 出一种 由. E 给 N T实 现的元搜 索引擎 的系统框 架, 分析系统采用 的关键技 术。
关键词 搜索引擎
T 3 P1
元 搜 索 引擎
.E NT
中图 分 类 号
1 引 言
随着 It nt 飞速 发 展 , 们 越来 越 依 靠 网 ne e 的 r 人
络来查 找 他们所 需要 的信 息 , 搜索 引擎 (erhE — Sac n g e 称 S ) 用来搜 集 、 i 简 n E是 发现 It nt 息 资 源 , ne e信 r 并对 信息 进行理 解 、 提取 、 织和处 理 , 组 为用 户 提供
信息检索服务的工具 。 但是 , 一个单 一搜 索 引擎 的 网络覆 盖率 最多 只 能覆盖 到 整个 Itre 资源 的 3 5 % … , nen t 0— 0 因而 查
在尽 可能 短 的时 间 内提 供 相对 全 面 、 准确 的信 息 ,
可以作为相对可靠的参考源进行扩展搜索, 因此是 倍 受 推崇 的检 索首 选人 口。
图 1 元搜 索 引擎 的基 本工作 原 理 图 , 中可 是 从 以看 出 , 搜索 引擎 的工作 工程 分成 以下 几步 J 元 :

元搜索引擎

元搜索引擎

可能是或者, 事实上,经链接证明这两个URL均是正确的。
济,文化,娱乐,体育等。
为了适应各个成员引擎的界面,可以采用交或并的方法,在翻译查询 时交的方法需要给成员引擎填缺省值,并的方法针对特定的引擎要做取舍。
2)搜索引擎选择:
最简单的方法是提供系统中可用的搜索引擎的列表让用户 自己来选择。元搜索引擎一般允许用户选择合适的搜索引擎集 合具体进行检索,选择方式包括选择一个搜索引擎、选择全部 搜索引擎、选择满足一定条件的若干个搜索引擎(例如最快的 或最好的三个)。 另外就是获取各个成员引擎内容的表示和查询匹配,选择最 相关的前n个引擎进行查询。这种方法很大程度取决于引擎内容 的表示。 有些元搜索引擎只能使用固定的搜索引擎集合。
飓风搜索通使用
ALL-IN-ONE 方式
• ALL-IN-ONE方式是指元搜索引擎界面以任意顺序或分类罗列多个 (一般都是数十个)搜索引擎,但元搜索引擎本身主要提供各类搜索 引擎的介绍信息和物理连接机制。这种ALL-IN-ONE方式的元搜索引 擎确切地说只是搜索引擎的罗列,它们具有以下特点: (1)仅仅提供一个简单的界面来帮助用户选择和使用各搜索引擎。 (2)只能选择一个搜索引擎进行检索。 (3)对各独立搜索引擎检索界面的复制可能是部分的或全部的。 (4)直接利用所选搜索引擎的显示格式呈送给用户
3)查询分发
• 把来自检索界面的查询串翻译成特定的引擎的串。 • 由于每个搜索引擎都有自己的查询语言,因此元搜索引擎需要将用 户通过统一界面以统一形式输入的全局检索指令转换为各个成员搜 索引擎的局部指令语言,这可利用“全局/局部指令字典”来实现。 • 全局指令既要准确地表达所有成员搜索引擎指令语言的共同特点和 指令形式,又要能够以一定方式执行有关成员搜索引擎指令的特殊 功能。目前,指令转换尚有较多不足之处。

MetaSearch元搜索引擎简介

MetaSearch元搜索引擎简介

Meta-search engine(元搜索引擎)是在前述搜索引擎基础上建立的可以同时查询多个搜索引擎的WWW站点,其英文原意是搜索引擎之后或之上的搜索引擎,因而也可以叫做后搜索引擎。

虽然元搜索引擎依赖其他独立搜索引擎而存在,但它们集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能,查一个元搜索引擎就相当于查多个独立搜索引擎,可以收到事半功倍的效果,故值得选用。

按照搜索机制划分,元搜索引擎包括并行式和串行式两类,并行式元搜索引擎运行时是将查询请求同时发向各个独立搜索引擎,然后将的结果按特定的顺序呈现给用户;串行式元搜索引擎运行时是将查询请求先发向某个独立搜索引擎,待其返回结果后再将请求发往另一个独立搜索引擎。

显然,并行式元搜索引擎运行模式较好,搜索所需时间也较短。

现将主要的元搜索引擎介绍如下。

2.6.1 Cyber411()Cyber411是并行式元搜索引擎,它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler和Yahoo 6个独立万维网搜索引擎和9个其他Internet功能搜索引擎,但它没有任何高级搜索选项或者定制选项,只适于作为元搜索的入门,让初学者查找简单而明确的目标。

其主页如图2.57所示。

Cyber411主页中栏有查询选择及输入框,输入查询词后点击now!按钮可查。

Cyber411的搜索功能包括:(1)支持简单搜索;(2)不支持高级搜索;(3)不支持目录搜索。

可以选择搜索引擎。

操作步骤:1)在Search for:下查找输入框中输入Internet and cosmic;2)点击Search按钮,开始进行搜索。

多个词汇作为一个统一概念查询时应该用括号括起来查。

页面中列出了满足搜索要求的Web网点。

第一个响应的搜索引擎一出现,就很快能得到只包含每个页面标题的搜索结果,而结果页面的其他部分会在接收搜索结果时载入。

由于Cyber411不能为其所查询的15个搜索引擎中的每个引擎都转化搜索语法,所以对于高级查询或复杂搜索来说,Cyber411返回的结果很多与所查问题不相关。

搜索引擎分类

搜索引擎分类

搜索引擎分类按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类:1.目录式搜索引擎:以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。

信息大多面向网站,提供目录浏览服务和直接检索服务。

该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。

这类搜索引擎的代表是:Yahoo、LookSmart、Open Directory、Go Guide等。

2.机器人搜索引擎:由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。

服务方式是面向网页的全文检索服务。

该类搜索引擎的优点是信息量大、更新及时、毋需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。

这类搜索引擎的代表是:AltaVista、Northern Light、Excite、Infoseek、Inktomi、FAST、Lycos、Google;国内代表为:"天网"、悠游、OpenFind等。

3.元搜索引擎:这类搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。

服务方式为面向网页的全文检索。

这类搜索引擎的优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用搜索引擎的功能,用户需要做更多的筛选。

这类搜索引擎的代表是WebCrawler、InfoMarket等。

性能指标我们可以将WEB信息的搜索看作一个信息检索问题,即在由WEB网页组成的文档库中检索出与用户查询相关的文档。

所以我们可以用衡量传统信息检索系统的性能参数-召回率(R ecall)和精度(Pricision)衡量一个搜索引擎的性能。

常用的搜索引擎有哪些

常用的搜索引擎有哪些

常用的搜索引擎有哪些
常用的搜索引擎有以下这些:
1、百度搜索
百度搜索是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。

“百度”二字源于中国宋朝词人辛弃疾的《青玉案》诗句:“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

2、搜狗搜索
搜狗搜索是中国领先的中文搜索引擎,致力于中文互联网信息的深度挖掘,帮助中国上亿网民加快信息获取速度,为用户创造价值。

3、360搜索
360综合搜索,属于元搜索引擎,是搜索引擎的一种,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。

4、谷歌搜索
谷歌搜索引擎是谷歌公司的主要产品,也是世界上最大的搜索引擎之一,由两名斯坦福大学的理学博士生拉里·佩奇和谢尔盖·布林在1996年建立。

谷歌搜索引擎拥有网站、图像、新闻组和目录服务四个功能模块,提供常规搜索和高级搜索两种功能。

最受欢迎的元搜索引擎——Dogpile

最受欢迎的元搜索引擎——Dogpile

最受欢迎的元搜索引擎——Dogpile2006-08-27 作者:邢志宇Dogpile()是1996年12月由美国人Aaron Flin 创制的杰出的并行式和串行式相结合的混合式元搜索引擎。

在Dogpile诞生之前,已经有了美国科罗拉多州立大学毕业生Daniel Dreilinger于1995年3月推出的Savvy Search和华盛顿大学毕业生Erik Selberg与该校副教授Oren Etzioni合作研制,于1995年7月12日发布的Metacrawler两个元搜索引擎。

1998年11月Go2Net公司购买Metacrawler,1999年8月又并购了Dogpile。

2000年8月InfoSpace公司购买了Go2Net,拥有了Dogpile和Metacrawler的所有权,2002年5月InfoSpace又把拥有Webcrawler的Excite(webcrawler1995年被AOL收购,1996年底被转买给Excite)收归旗下。

目前所有隶属于InfoSpace的四个元搜索引擎,虽然都有独立的域名,采用相同的核心搜索技术,但搜索结果的显示方式和排序算法各有差异。

Dogpile一直是这个元搜索引擎家族的旗舰,被InfoSpace视为“门面工程”。

Dogpile暂不支持中文搜索。

Dogpile已可以调用Google、Yahoo、MSN、Ask Jeeves、LookSmart、About、overture、Teoma、FindWhat、FindWhat、Ditto、FindWhat、AltaVista、FAST、Infoseek、Real Names、Direct Hit、Deja、Lycos、Singingfish、Dmoz 、T opix、Fox、WebCatalog等20多个独立的Web Search Engine(万维网搜索引擎)、Usenet Search Engine(新闻组搜索引擎)和FTP Search Engine(FTP搜索引擎)源搜索引擎。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

元搜索引擎
作者:姬洪强
来源:《中小学信息技术教育》2007年第12期
网络已逐渐成为教师教学中重要的信息来源,教师通常借助搜索引擎来检索所需求的资源。

然而,一种搜索引擎往往不能满足所有人或一个人所有的检索需求,经常需要使用多种搜索引擎,并对搜索结果进行比较、筛选和印证。

为解决逐一登录各种搜索引擎,并多次输入同一检索请求(检索字串)等操作繁琐的问题,元搜索引擎应运而生。

元搜索引擎的优点是返回的检索结果信息量大,检索效率高,服务多样化。

下面介绍几款国内外优秀的元搜索引擎以供中小学教师参考使用。

一、国内元搜索引擎
1.Xooda 元搜索引擎()
Xooda元搜索引擎支持16个国家/地区,可调用Baidu、Google、Yahoo、iAsk、Sogou、ZhongSou等12个源搜索引擎中全部或任意几个搜索引擎,可选择每个搜索引擎返回结果的数目。

它还可以进行进阶搜索,自动实现符合特殊检索语法要求的转换,只调用支持特殊检索语法的搜索引擎。

支持本地搜索,一次输入,返回多个搜索引擎结果,并对结果进行重新优化排序。

2.酷爱元搜索引擎()
酷爱元搜索引擎提供自动搜索和人工搜索两种模式。

调用Baidu、Sogou、Yahoo等独立搜索引擎,各搜索引擎的结果会进行智能排序。

当用户输入关键词的时候,搜索框会自动列举出相关的关键词列表。

它的深入搜索功能可以为用户提供更精确的关键词,进一步细化结果。

当用户点击网页智能分析时,酷爱会把最相关的结果呈现给用户。

3.万纬元搜索引擎()
万纬搜索引擎是最有名的中文元搜索引擎之一。

万纬中文集成搜索引擎包括了5个英文搜索引擎Argos、Google、Hotbot、NorthernLight、Yahoo和7个中文搜索引擎,如网典、新浪、雅虎(中文)、搜狐、天网、悠游搜索。

用户可根据需要自由选择其中最多6个引擎进行同步搜索,搜索结果可按相关度、时间、域名和引擎分类,还可以选择搜索的关键词之间是用and 还是用or来运算。

4.比比猫元搜索引擎()
比比猫是采用聚类技术对结果进行处理,并且提供收藏、快照等功能的社会化搜索引擎。

它可以同时调用Google、Yahoo、Baidu、iAsk以及Sogou等5个搜索引擎。

使用时,网页左边会出现分析搜索内容后返回的结果列表,用户可以通过搜索分类查看所需要的结果,过滤掉与需求不相关的内容。

在访问多个搜索引擎的同时,它可以把最好的检索结果获取下来进行自动分类。

用户可以把喜欢的网页和个人文件保存在网站上,不管在哪儿,只要能上网,就能找回收藏。

5.K风元搜索(/k-metasearch)
K风元搜索是由K风软件在2007年1月2日开发的元搜索引擎软件产品,特色是任意聚合搜索引擎;快速建立网络、行业、站内搜索引擎;网页收藏夹;网页分享社区。

K风元搜索能够在后台自由集成成员搜索引擎,随意添加、删除或开启、关闭成员搜索引擎,个性化聚合搜索引擎。

K风的相关搜索调用切换功能,可以选择调用本地或其他网络上的关键词数据。

二、国外元搜索引擎
1.MetaCrawler( )
MetaCrauler由华盛顿大学推出,支持调用12个独立搜索引擎,提供涵盖近20个主题的目录检索服务,包括常规检索、高级检索、定制检索、国家或地区的资源检索等。

其中,高级检索模式可实现搜索引擎的选择调用,基于域名、地区或国家的检索结果过滤,最长检索时间设置,每页可显示的和允许每个搜索引擎返回的检索结果数量的设定,检索结果排序依据(包括相关度、域名、源搜索引擎)设定等。

以上内容均可作为定制检索的个性化选项并予以保存。

另外,检索结果中包括一个以1000为最大值的相关度指标。

2.Dogpile()
Dogpile是最老、最受欢迎的多元搜索引擎之一。

它是1996年12月由美国人Aaron Flin推出的并行式和串行式相结合的混合式元搜索引擎。

Dogpile可以调用20多个独立的源搜索引擎。

在收到查询提问时,它首先并行地调用Google、Yahoo、MSN、Ask Jeeves等4个源搜索引擎,如果没有得到10个以上的结果,再调用另外的搜索引擎。

但Dogpile不提供可调用的源搜索引擎列表,不支持对各个源搜索引擎的自行指定和选择。

3.Mamma()
Mamma是并行式元搜索引擎,自称为“搜索引擎之母”。

可同时调用7个最常用的独立搜索引擎,并且可查询网上商店、新闻、股票指数、图像和声音文件等资源。

其特点是检索界面友好,检索选项丰富,主要包括可控制调用的独立搜索引擎、选择使用短语检索功能、设定检索时间、设定每页可显示记录数等。

4.Ixquick ()
Ixquick最大优点是支持中文检索。

支持各种基本的和高级的检索功能,包括关键词检索、短语检索、截词检索、布尔检索、概念检索、自然语言检索、指定字段检索、包含(+)或排除(-)检索等。

Ixquick知道哪些搜索引擎能够处理短语、布尔逻辑、截词等等,Ixquick将负责把“翻译”后的查询请求直接递交到那些能够处理这些复杂请求的搜索引擎中,实现更加有针对性的搜索服务,瞄准更加高、精、专的检索结果。

自从第一个元搜索引擎Metacrawler推出以来,这一新型的网络检索工具异军突起,发展十分迅速,目前可用的元搜索引擎已非常多。

尽管元搜索引擎存在着一些功能局限,但其以涵盖较多的搜索资源,能够在尽可能短的时间内提供相对全面、准确的检索结果等诸多优异功能受到用户的青睐,已渐成为一种不可或缺的网络检索工具。

(作者单位:浙江师范大学教育学院)。

相关文档
最新文档