中外主流搜索引擎中文搜索能力对比研究

合集下载

国内外信息检索资源调研报告

国内外信息检索资源调研报告

国内外信息检索资源调研报告一、引言信息检索是指根据用户的需求,在信息资源中寻找与之相关的信息的过程。

随着互联网的快速发展,信息检索变得越来越重要。

为了满足用户的需求,国内外不断涌现出各种信息检索资源。

本文将对国内外的信息检索资源进行调研,以了解其特点和优势。

二、国内信息检索资源1. 中国知网中国知网是国内最大的综合性学术信息数据库,拥有大量的学术文献、期刊论文、学位论文、会议论文等资源。

其检索功能强大,可根据关键词、作者、期刊等进行检索。

此外,中国知网还提供了学术搜索、学术论坛等功能,方便用户交流和学术研究。

2. 万方数据库万方数据库是国内领先的综合性学术资源库,涵盖了学术期刊、学位论文、会议论文、专利等多种资源。

用户可以通过关键词、作者、学科等进行检索,并可获得相关的学术论文、期刊等。

3. 中文科技期刊数据库中文科技期刊数据库是中国科学技术信息研究所开发的学术资源库,提供了大量的科技期刊文章。

用户可以根据关键词、作者、期刊等进行检索,并可以在线阅读和下载相关的期刊文章。

4. 豆瓣图书豆瓣图书是国内最大的图书评论社区,用户可以在此搜索图书信息,并查看其他用户的评论和评分。

该平台还提供了图书推荐、书单分享等功能,方便用户选择合适的图书。

三、国外信息检索资源1. 谷歌学术谷歌学术是全球最大的学术搜索引擎之一,汇集了全球各学科领域的学术论文、期刊、学位论文等资源。

用户可以通过关键词、作者、期刊等进行检索,并可以在线阅读和下载相关的学术文献。

2. IEEE XploreIEEE Xplore是国际电气和电子工程师协会(IEEE)开发的学术资源库,包含了大量的电子和计算机科学相关的学术文献、期刊论文、会议论文等。

用户可以通过关键词、作者、学科等进行检索,并可以获取相关的学术论文和期刊。

3. PubMedPubMed是美国国立卫生研究院(NIH)开发的生命科学领域的学术资源库,包含了生物医学、生命科学等领域的学术文献和期刊。

中文搜索引擎的对比研究

中文搜索引擎的对比研究
C e i h n Hu
(ntu f c nicadTcn a Ifm tno l ,C aghn102 ,C i ) Istto i t ehi lno ao f in h cu 30 1 h a ie Se f n i c r i Ji n n
[ s at h tl e bre h a heg ecnet he aipi ie h m i pi ieadt u co ,ad Abt c]Ti ai e l oa dt s r i cp,t s r c l,t a r c l n h ntn n r s rc a t e e c n n o b c np e n np ef i
sac niei eeo me t e ce c , t sat l mp a cl lbrt esac n ieI w tcn lg hc Il e erhe gn nd vlp n f iny h r c e ht ayea oae t erhe gn e h ooyw hpo di i ie i l d h 1 e i sdi n
l w o hn s s rh e gn e ce c . fe fc i e ac n ie d f in y e e i
[ e od Jsa heg e om aav nl i a u odo K yw rs r ni ;c pr eaa s ;bi ;yua e c n i t ys d 因特 网是 目前 世界上 最大 的信 息资源 网 ,网上 资源异
的问题 ,并 针对 这些 问题 粗浅地 提出 了新形 式 的网络搜 索
接结构进行 分析 和大规模 的数据挖掘 , 而提供 页面等 级 从 的信息 ,帮助用户找 到相关 主题 的权威 网站 ,并且 可 以指
向众多权威 站点先进技术 。

国内外搜索引擎的特征及其比较

国内外搜索引擎的特征及其比较

国内搜索引擎的特征及其比较摘要随着信息的剧增,Internet的进一步普及,在浩如烟海的信息高速公路上,根据自己的需求快速准确地需找所需要的信息越来越依赖于借助多种多样的Internet信息检索工具,而搜索引擎是我们平时使用最多的一种。

下面就国内的四个著名搜索引擎来探究它们的特征和区别。

关键字引擎检索查询一百度(http://WWW.baidu.corn)百度由百度网络技术有限公司于1999年底在美国硅谷创建,是目前全球最大的中文搜索引擎。

数据库中收录约3亿个中文网页,平均2周更新一次,对部分网页每天更新。

搜索方式以关键词检索为主,同时可结合分类目录限定检索范围,分基本检索和高级检索两种,支持布尔算符和字段限制符。

特设百度快照功能,供用户迅速查看每条检索结果的内容。

检索时不区分英文字母的大小写,检索结果依相关度排列。

二中文Goog1.(hap://WWW.google.corn)Gcog1.由两位斯坦福大学的博士I丑rry Page和SergeyBrin在1998年创立,是目前世界上最大的搜索引擎。

数据库中收录约1O亿多个中文网页,采用高级的网页级别技术,用户界而出色,有新闻组、图像、新闻等搜索,以搜索相关性高闻名。

检索方式为关键词检索,分为基本检索和高级检索,基本检索以布尔检索为主,高级检索中包括:(1)排除某些站点;(2)限定检索结果于某一特定网站;(3)限定语言类型;(4)相关网页检索,检索结果依检索式相关性排列。

三新浪(http://WWW.sina.com)新浪搜索引擎是面向华人的网上资源查询系统。

提供网站、网页、新闻、软件、游戏等查询服务。

共有16大类目录,1万多个细目和数十万个网站。

搜索方式包括关键词查询和分类目录检索两种。

除基本检索以外,还具备“重新查询”“在结果中再查”和“在结果中去除”三种高级检索,支持布尔逻辑检索,用逻辑算符“And”、“Not”扩大或缩小检索范围,在同一页面上包含目录、网站、新闻标题、新闻全文、频道内容、网页、商品信息、消费场所、中文网址、沪深行情、软件、游戏等各类信息的综合搜索结果,按检索式相关度排列,以日期排序。

常用中文搜索引擎对比

常用中文搜索引擎对比

几大常用中文搜索引擎的对比随着互联网的不断发展扩大,网络上中文信息资源和上网的中文用户也大量增加,各类中文搜索引擎更是层出不穷。

以下我选取了Google中文,百度,搜狗,必应这几个常用的中文搜索引擎进行较为粗浅的比较。

先比较一下各搜索引擎的特点。

Google中文:包括网页、图片、新闻搜索,支持个性化搜索及本地搜索,提供论坛、邮箱、日历服务和桌面搜索工具,是万维网上最大的搜索引擎,但Google中文在中国却一直受到百度搜索的压制,最终由于黑客攻击和敏感词过滤问题退出中国内地转至香港。

百度:是全球最大的中文搜索引擎,除网页搜索外,还提供MP3、文档、地图、传情、影视等多样化的搜索服务,率先创造了以贴吧、知道为代表的搜索社区,是目前国内最大的商业化全文搜索引擎。

搜狗:搜狗是全球首个百亿规模中文搜索引擎,收录100亿网页,创造了全球中文网页收录量新高,搜狗以网页搜索为核心,在音乐、新闻、图片、地图等方面提供了垂直搜索服务,通过说吧建立用户间的搜索社区,2010年8月搜狐与阿里巴巴宣布将分拆搜狗成立独立公司,引入战略投资,注资后的搜狗有望成为仅次于百度的中文搜索工具。

必应(bing):必应是微软公司09年新推出的中文搜索引擎。

主打快乐搜索体验。

接着从各方面对比:1.外观排版:Google、百度、搜狗的外观都是以简单的白色背景为主,而必应的背景是一副定期更换的图片,乍看比较新鲜,可是用习惯后我发现搜索引擎还是简洁一点好。

不同于其他3家“相关搜索”出现在搜索结果的底部,必应在网页左侧和底部都出现了“相关搜索”,虽然略显重复,但在一定程度上为用户提供了方便。

2.搜索结果:在这4家引擎同时输入“集美大学诚毅学院”,可以看到Google用时0.10 秒获得约62,900 条结果,百度用时0.018秒找到相关网页约55,000篇,必应没有显示用时找到共50,900 条,搜狗用时0.027 秒只有30,636条。

可见在Google的搜索量大,而百度的时间最短,速度和数量比最好,搜狗略逊一筹3.搜索内容:四家网站的内容更新都比较及时,百度的优势在于很中国化很生活化,符合中国人的习惯。

国内外常用搜索引擎

国内外常用搜索引擎

常用中国搜索网站百度百度搜索引擎拥有目前世界上最大的中文搜索引擎,总量超过3亿页以上,并且还在保持快速的增长。

百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点,能够帮助广大网民快速的在浩如烟海的互联网信息中找到自己需要的信息,因此深受网民的喜爱。

一搜/“一搜”是雅虎中国推出的一个中文搜索网站。

目前设立了网页、图片、MP3和网址四个频道。

“一搜”采用雅虎花费数十亿美元打造出的搜索技术(YST),用户可以抓取到全球50亿网页(其中3亿个中文网页)、9000万张图片、100多万个免费音乐的海量资料。

中国搜索/2003年12月23日,刚刚上市的慧聪国际集团重拳出击,原慧聪搜索正式独立运做,成立了中国搜索,全力打造中文搜索第一品牌。

搜狐搜索/2004年8月3日,搜狐正式推出全新独立域名专业搜索网站“搜狗”,成为全球首家第三代中文互动式搜索引擎服务提供商。

提供全球网页,新闻,商品,分类网站等搜索服务。

新浪网搜索引擎/提供网站、网页、新闻、软件、游戏等查询服务。

有16大类目录,一万多个细目和数十万个网站。

其网页搜索结果由中国搜索提供。

网易搜索引擎/网易在国内首创“网易开放式目录管理系统(ODP)”。

提供网页搜索、分类网站、图片搜索、时尚搜索,其网页搜索结果由Google提供。

其它搜索引擎TOM搜索引擎/提供网页、网站、图片、MP3、新闻搜索,其网页搜索结果由百度搜索提供。

21CN搜索引擎/提供网页、网站、图片、MP3、FLASH、电影、软件、影集搜索,其网页搜索结果由百度提供。

QQ搜索引擎/提供网页搜索,其网页搜索结果由百度搜索提供。

国外搜索网站Google日本http://www.google.co.jp/全球著名搜索引擎Google在日本设立的分站。

日文版谷歌首页加上谷歌其他产品和服务的链接,搜索框也提供了关键词提示功能。

谷歌采取了一些专门针对日本市场的举措,例如允许日本最大社交网站Mixi的用户在其博客中使用谷歌地图,与日本最受欢迎的社会化书签服务提供商Hatena合作,以及推出了一个致力于防止全球变暖的“One Green Project”网站等。

搜索引擎对比

搜索引擎对比

百度、谷歌、搜狗、有道四大搜索引擎的比较分析学校:中南财经政法大学学号:2009357770832 姓名:李心彤随着经济与科技的发展,信息对于人们来说越来越重要,而随着计算机的普及,人们利用搜索引擎来获取信息也是越来越频繁。

因此,国内外的几家搜索引擎展开了角逐,在各自领域努力发挥着自己的优势。

本文通过对百度、谷歌、搜狗、有道四大搜索引擎的个人化体验,对其作出比较与分析。

体验主要从以下几个方面进行:一、政治敏感度搜索引擎百度搜狗有道谷歌词条数量323 1433 43 69100可以看出,在搜索较为敏感的政治事件时,各大搜索引擎表现出极大的不同。

作为国内最大用户最多的百度搜索引擎,是唯一一个表现出明确屏蔽态度的搜索引擎,会在搜索框下方显示“根据相关法律法规和政策,部分搜索结果未予显示”,且其搜索数量也是几个搜索引擎中较少的。

同时,在搜索出来的词条中,再未显示关键词中的任何一个字,仅在具体内容中偶有一两个相同字眼。

可见百度对政治敏感内容十分顾忌。

而搜狗则在搜索页的最末用灰色字体显示“根据相关法律法规和政策,部分搜索结果未予显示”,不太能够引起人的注意。

其搜索结果虽然在四个引擎中排名第二,但仍然并不算多。

且其跟百度一样,搜索出来的结果中并未出现过多的关键词。

有道虽然是所有引擎中结果数量最少的,但出人意料的是,有道所搜索出来的前几个词条,是完全符合搜索词的。

虽然其具体内容皆无法打开,但不得不说有道是国内引擎中最大胆的。

而谷歌作为国外开发的搜索引擎,一向对政治事件十分随意,因此,我们不难从图片中看出搜索政治敏感事件时,谷歌就像搜索随意的生活内容一样将各项结果显示,且有些资源是来自于国外的网站。

但是具体点击时,视频、图片以及部分文字类内容明显在检测和过滤后是打不开的,且检测与过滤速度十分缓慢。

但是,部分论坛里的讨论、对事件阐述并不太多也不太高调的文字类内容还是能够得以显现。

笔者随后更换搜索的关键词,使其更多与国家政治领导人相关,其搜索结果为:搜索引擎百度搜狗有道谷歌词条数量80200 3986 99 117000可以看出,这与上一个结果相差不大,同样显示有道搜索数量上的不足,以及百度搜狗的政治敏感度高,同时还有谷歌对政治人物事件的宽容态度。

国内外索引研究的比较与展望

国内外索引研究的比较与展望
第 3卷 0
第 15 3 期
高 校 图 书 馆 工 作
21 第 1 00年 期
【 理论 ・ 索 】 探
国 内外 索 引研 究 的 比较 与展 望
● 王 知 津 刘 念 黄 莹 莹 王 秀香 ( 开 学 天 章 基 于 文献 计 量 和 内容 分析 的 方 法 , 中文期 刊 《 国 索 引》 英 文 期 刊 《1 nee 近 年 来 所 发 文 对 中 和 1eIdxr 1 }
类 的划 分 主要 以( h nee} 刊 载 的文 献 内容 分 ( eIdxr所 T
析为 主 , 表 1 示 。 如 所
文献事 项或单 元知识 的检索工 具…。索 引研 究 的开
展不仅 有助于本 领 域 内研 究工 作 的深 入 发展 , 且 而 还有助 于相关 领域 内的研究 , 知识组 织 、 如 信息 检索
多 媒 体 标 引与 索 引 索 引 行业 与 标 准 索 引款 目 索 引 内容 与表 示
网络 检 索 与 搜 索 引 擎




引》 该 刊 由中国索 引 学会 出版 , 中国第 一本 也 是 , 是 唯一 的一本 索 引专业 刊物。希望本 文 的研究 工作 可 以对我 国的索引研 究起 到一定 的启 发和推 动作用 。
表 的论 文 进 行 统 计 分析 。在 此基 础 上 , 纳 总 结 了 国 内外 索 引研 究 的 重 点领 域 及 异 同 , 括 了 国 内外 索 引研 归 概 究 的 未来 发展 趋 势 。参 考 文 献 6 。 【 关键 词 】 引研 究 文 献 计 量 内容 分 析 索 统计 分析
索 引家 中国 索 类 别
索 引 评 价
索 引员 索 引标 准 、 规 则 与规 范

百度与谷歌的比较研究

百度与谷歌的比较研究

百度与谷歌的比较研究摘要:众所周知,日常生活中很多时候需要用到各种搜索引擎,现今访问量居高不下,傲视群雄的两大搜索引擎分别是谷歌和百度,可以说,它们占据的是绝大多数的用户量。

对于两者之间的争论、比较也从没停止:谷歌以检索功能强大,信息准确而备受赞誉,而百度目前是全球最大的中文搜索引擎。

本文将对二者从检索技术,检索功能和检索方式等方面进行比较分析。

两大巨头,在网络搜索领域各有优势,重要的是用户根据自己实际的搜索需要选择适当的搜索引擎,以获得高效的搜索结果。

关键词:百度,谷歌,网络搜索引擎第一部分什么是网络搜索近几十年来的各项信息技术的快速发展都或多或少地推动了网络百科的壮大,最重要的推动网络百科发展的是网络检索技术。

网络搜索引擎是指根据一定的策略,运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索的信息战展示回去的系统。

通常搜索引擎是由网络蜘蛛(spider)、索引与搜索引擎软件等部分组成。

网络蜘蛛是一个功能很强的程序,它定期根据预定地址查看相对应的网页,如果网页发生变化,则重新获取该网页,否则根据网页中的链接继续访问,直到访问完毕所有的链接,网络蜘蛛性能直接影响到获取网页的数量和网页的更新时间。

索引是对存放在临时数据库中由网络蜘蛛访问链接所得到的网页按一定规则组织起来的页面集合,索引的质量和存放结构会影响到检索的速度。

搜索引擎软件是用来筛选索引中的网页信息,把符合查询要求的网页进行分级排序并显示给用户,引擎的性能影响到检索的精度。

第二部分谷歌作为目前世界上使用率最高和搜索精度最高的全文搜索引擎,谷歌在检索技术、检索功能和检索方式上都很有自己的特点。

技术的先进表现在:首先,为了获取上亿的网页,谷歌为spider设计了一种分布式爬行系统,该系统通常由一个URL服务器将列表提供给爬行器(谷歌同时运行3个爬行器),每个爬行器同时保持与大约300个网络连接,这样就保证了广阔的搜索范围,几乎覆盖了102个国家和地区。

四种搜索引擎的比较研究

四种搜索引擎的比较研究
数据监控体系从而对 品牌现状进行即时诊断!
参考内容
基本内容
基本内容
随着互联网的快速发展,搜索引擎在人们的生活中扮演着越来越重要的角色。 传统的搜索引擎如Google、Bing等已经为广大网民所熟知,而近年来,智能搜索 引擎也逐渐崭露头角。本次演示将对传统搜索引擎和智能搜索引擎进行比较研究, 分析它们的优缺点,并探讨未来的发展趋势。
4、未来发展方向
(2)个性化搜索:通过对用户历史搜索记录、行为偏好等数据的分析,为每个 用户提供定制化的搜索结果,提高用户体验。
4、未来发展方向
(3)多模态搜索:融合文字、图片、音频、视频等多种信息形态,使搜索引擎 能够处理和理解更为丰富的信息,满足用户多样化的搜索需求。
4、未来发展方向
(4)交互式搜索:增强搜索引擎与用户的交互能力,允许用户在搜索过程中进 行实时反馈和调整,以获得更符合需求的搜索结果。
基本内容
基本内容
随着互联网的飞速发展,搜索引擎作为信息检索的重要工具,一直受到广泛。 按照搜索原理和技术特点,搜索引擎可分为传统搜索引擎和语义搜索引擎。本次 演示将对两者进行详细比较,并探讨未来发展趋势。
1、引言
1、引言
搜索引擎是一种自动化的信息检索系统,它通过爬取互联网上的信息,建立 索引数据库,为用户提供快速、准确的信息查询服务。从20世纪90年代初的目录 导航型搜索引擎,到后来的元搜索引擎和垂直搜索引擎,再到21世纪的语义搜索 引擎,搜索引擎的发展经历了多个阶段。
4、未来发展方向
(5)跨语言搜索:提高搜索引擎对不同语言的支持能力,使其能够理解和处理 多种语言的信息,满足全球用户的需求。
4、未来发展方向
综上所述,传统搜索引擎和语义搜索引擎各有优劣,未来的发展趋势是以语 义搜索引擎为主导,传统搜索引擎将逐渐向智能化方向转型。随着技术的不断发 展,搜索引擎将更好地理解用户需求,提供更为精准、个性化的搜索服务。

五大搜索引擎特点

五大搜索引擎特点

在SEO优化的时候,其实不同的搜索引擎对于网站收录的情况各有不同点。

今天我要谈的就是百度、谷歌、雅虎、有道、中搜这五大搜索引擎收录网站的一些比较,下面我们一个来简单的分析。

1、谷歌谷歌收录网站原则,对新站基本上能在一个星期给你收录大部分,对新站的权重相对于百度来说要重一些。

谷歌是先收录后打压,减小收录。

收录得快,删除收录数量也快。

可能谷歌的算法和国外人的习惯有关吧,总是体现在一个效率上。

谷歌我个人的感觉是对原创的内容,如果你是一个新站,在谷歌下的排名会非常差。

如果你的站坚持天天更新原创的话,你就能发现这一点。

在这方面谷歌给人的感觉就是等级制非常分明。

所以说如果你的站是想做谷歌收录的话,大可不必的复制内容上去,让它收录个够。

2、百度百度收录网站的原则基本上就是原创为王,复制内容的站基本上不收录或少收录。

百度现在占了中国大半江山,我们做站一定要把百度给养好了,坚持原创。

百度一旦把你的站拿入观察期,你可就要小心了,有可能要不了一个月就会全部给你清0。

百度对网站改关键字和改版可是最敏感的,改版时可一定要小心,一点一点的改,不要一下就给全部改头换面了。

百度收录网站从某种意义上来说,人为处理的因素多,有时显得不是很公平,以至搜索结果也不是那么让人感到理想。

3、雅虎雅虎收录网站原则,基本上是在百度和谷歌中间的位置,就是不向百度那么重视原创,也不向谷歌那么的等级制收录。

雅虎收录显得比较公正,人为处理搜索结果比较少。

在国外占的搜索市场份额比较高,在中国好象不是很高,光有收录,能给你网站带来的流量是少之又少。

但是我们可以常利用一下雅虎的收录,来衡量一个站。

4、有道有道收录网站原则,基本上突出在一个快字。

比如你的网站改版,基本上能在一个星期全部给你更新收录过。

在其它搜索引擎是做不到的。

有道对网站的一举一动比其它搜索引擎都要严格,有变化基本上能在三天内给你作出快速的反映。

虽然有道不能给我们带来更多的流量,但是它的快速,可以让我们更加早的发现网站的一些问题,以便及时的作出补救。

三大搜索引擎对比分析表

三大搜索引擎对比分析表

三大搜索引擎对比分析表
六度空间理论:
六度空间理论是一个数学领域的猜想,名为Six Degrees of Separation,中文翻译包括以下几种:六度分割理论或小世界理论等。

理论指出:你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。

这就是六度分割理论,也叫小世界理论。

这种现象,并不是说任何人与人之间的联系都必须要通过六个层次才会产生联系,而是表达了这样一个重要的概念:任何两位素不相识的人之间,通过一定的联系方式,总能够产生必然联系或关系。

显然,随着联系方式和联系能力的不同,实现个人期望的机遇将产生明显的区别。

手持移动电视市场:
移动电视是指采用数字广播技术(主要指地面传输技术)播出,接收终端一是安装在公交汽车、地铁、城铁、出租车、商务车和其他公共场所的电视系统,二是手持接收设备(如手机、笔记本、PMP、超便携PC等)等满足移动人群收视需求的电视系统。

本文主要讨论支持第二类的移动终端,即手持移动电视的技术应用状况。

目前手持移动电视产品中占绝对数量的是手机电视。

主流中俄文搜索引擎核心技术分析与比较研究

主流中俄文搜索引擎核心技术分析与比较研究
Abs r c : T e e n l tc n l g e a c a a t rs i s f tat h k r e e h o o i s nd h r c e tc o Ch n s s a c e g n Ba d a d i ie e e rh n i e i u n Ru sa s a c e g n Ya d x r si n er h n ie n e a e
( 还存 在另外一种索引 ) 。 Y n e 搜索 引擎是 俄罗斯使 用率最高最流行 的搜索 引擎 , a dx 也是东 欧地 区最普及 的俄文搜索 引擎之 一。Yadx 大的特 ne 最 色是 “ O 7 O r H Ⅱ” 即俄语词型 变化的处 理 , M OP 1 , 以及
a ay e fo n lz d rm te h viwp it f o aiai . Bad i bae o s e i c e on o lc lz t on iu s s d n p cf Chie e i n s wo d e me ain e hn l g , a d r sg ntto tc oo y n Ya d x s n e i
词技术 , a dx Y n e 依赖 于独一无二的俄语词 型变化 处理技 术。通过具体的查询 实例 对两者进行 分析 比较 , 出了各 自的优 指
缺点 。 关键词 :搜 索引擎; ;Y n e ;本土化 a dx
中图分类号 : P 9 T 39 文章编 号: A 文章编号 :0 6 8 2 ( 0 2 0 — 3 0 1 0 — 28 2 1 } 10 — 3
An l i and o a yss c mpar tv s ud o ke n l t c a ie t y n r e e hno o y f m a nsr a l g o i t e m c ne e nd us i n e r h ng ne hi s a r sa s a c e i s

国内外网盘搜索引擎分析与比较

国内外网盘搜索引擎分析与比较

国内外网盘搜索引擎分析与比较王妙娅来源:《大学图书馆学报》(京)年期【英文标题】【作者简介】王妙娅,洛阳师范学院信息技术学院,洛阳【内容提要】分析和比较了国内外个知名网盘搜索引擎的检索结果数量、速度、准确度和功能,对各项性能及综合性能进行了评分和排序,国外的、、、和国内的网盘精灵以较高的综合性能受到用户推崇。

总体来看,国内网盘搜索引擎的各项性能与国外网盘搜索引擎差距比较大,建议国内网盘搜索引擎以开发自有搜索技术为突破口,同时尽量扩大可搜索的国内外网盘资源范围来提高性能。

, , . . , , , . . .【关键词】网盘网盘搜索引擎分析比较前言网盘即网络硬盘,是目前非常流行的在线文件共享方式。

很多人会把自己搜集的软件、游戏、资料、视频、动漫、电影、音乐、电子书等等都放在网盘上,这些由千千万万网民上传的内容组成了一个非常巨大的资源宝库,并且其中的优秀资源越来越多,特别是一些论坛、博客推荐的资源大多保存在网盘中。

但是网盘服务网站通常不提供检索功能,通用网络搜索引擎“”、“百度”也没有对网盘资源进行专门的索引,检索效果不理想,往往出现信息纷杂、良莠不齐、陈旧过时等问题,为此专门针对网盘进行搜索的工具——网盘搜索引擎应运而生。

本文在对网盘和网盘搜索引擎进行简要介绍的基础上,重点分析和比较了国内外个知名网盘搜索引擎的性能,并以五星制进行了评分,希望对用户选择网盘搜索引擎提供参考,同时通过对比发现国内网盘搜索引擎的不足及原因,对国内网盘搜索引擎的发展进行了思考。

网盘和网盘搜索引擎网盘网盘,又称网络磁盘、网络空间、网络盘、网络优盘等等,是一些网络公司推出的在线存储服务,向用户提供文件的存储、访问、备份、共享等文件管理功能[]。

拥有网盘的用户可以把重要的资料上传到网盘永久保存,不用担心因电脑硬盘、盘等储存器问题而致资料丢失,还可以随时随地方便地提取使用。

免费网盘的可用空间较少,一般对文件大小、下载速度、存放时间等进行限制;收费网盘具有速度快、安全性能好、容量高、允许大文件存储等优点,适合有较高要求的用户。

Google Scholar,CNKI和读秀文献检索性能对比

Google Scholar,CNKI和读秀文献检索性能对比

Google Scholar,CNKI和读秀文献检索性能对比作者:黄杨程,曾冠博来源:《教育教学论坛》2014年第29期摘要:CNKI,读秀,Google Scholar是交通土木科研人员查找文献时经常使用的检索工具。

从检索功能、检索范围、结果界面、检索结果处理几个方面对他们进行对比,表明三者具有各自的优势,用户可以根据自己对检索的需求,利用不同的检索工具查找自己所需的资料信息,满足在科研时的需求。

关键词:检索工具;CNKI;读秀;Google Scholar中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2014)29-0132-02Google Scholar(下简称GS)通过Google在互联网的整体优势,利用对现有网页中的学术内容进行筛选,并通过与图书馆,传统学术、书籍出版商合作(Nature、Elsevier、OCLC、IEEE等),对现有学术资源进行了广泛而深入的整合。

读秀和CNKI对国内外各种中外文章数据库的优秀整合能力,是科研人员查找文献时较多使用的检索引擎。

本文主要针对交通土木学科,从检索功能、检索范围、结果界面及结果处理等方面对三种检索工具的性能进行比对,为交通相关学科人员进行检索提供一定的参考。

一、检索功能GS的基本检索页面设置简单,操作方式上与用户常用的网络检索方式类似,可以直接输入关键词,然后默认在全文中进行查找。

同时GS也提供高级检索页面,它提供时间、刊物、作者、全文以及标题五个检索字段,允许用户对检索结果进行限定。

读秀及CNKI都设置有基本检索页面,利用类似网络检索方式,优化了用户的使用体验。

也为用户提供了更为专业的高级专业检索页面,可以让用户根据已有检索结果,进一步优化自己的检索策略。

检索功能的好坏,会对检索的结果产生影响。

GS能提供简单方便的检索方式,但对于复杂的检索式,其检索界面会让普通用户感觉无法操作。

因此,在检索功能方面,读秀与CNKI的检索设置能使用户更加方便的制定复杂的检索策略。

百度谷歌雅虎三大搜索引擎比较

百度谷歌雅虎三大搜索引擎比较

网络搜索引的比较研究课题论文(报告、案例分析)院系信息学院专业电子商务班级电子商务1班学生姓名王烁晨薛越洋学号 2010211013 2010211190 任课教师师鸣若2013年 1月 19日网络搜索引擎的比较研究学生姓名: 王烁晨 2010211013 薛越洋2010211190 摘要: 搜索引擎已成为中国互联网用户获取网络信息的主要工具,利用搜索引擎查询网上信息资源已成为解决网络资源利用的有效方式, 信息界亦掀起了搜索引擎研究的热潮. 文中简单介绍了搜索引擎及其在全球与中国的现状, 并以目前国内外排名靠前的搜索引擎Google、百度和雅虎为研究对象, 从界面、内容、问答、用户结构、经营等多个角度进行比较, 旨在挖掘3者各自的特殊, 为搜索引擎的个性化比较研究提供依据. 最后作出总结并提出了搜索引擎的未来发展趋势及本文不足之处.关键词: 搜索引擎; Google;百度;雅虎; 比较研究引言Internet 与全球电信的迅猛发展使信息资源的“生产”、“传播”与“消费”出现了新的格局. 信息资源如雨后春笋, 信息在网络上的传播速度跨数量级的提升, 使得上网用户获取真正有用的信息越来越难. 如何在网上快速、有效地获取信息资源, 已经成为信息查询者的一大难题, 因此网络搜索引擎应运而生.搜索引擎已成为中国互联网用户获取网络信息的主要工具, 它对迅速筛选所需信息起到很重要的作用. 如今世界上的搜索引擎数以万计, 因此, 选择合适的搜索引擎就成为重中之重. Google、百度和雅虎中国是目前比较有影响力的三种著名的搜索引擎, 本文将对其主要的性能指标进行分析比较, 以期抛砖引玉, 使现有的中文搜索引擎发展得更快更好.1网络搜索引擎的含义及分类网络搜索引擎又称为网络检索引擎, 其英文译名为Search Engine. 广义上是指一种基于Internet的信息查询系统, 包括信息抓取、信息管理和信息检索; 狭义上是指一种为搜集Internet上的网页而设计的检索软件. 现有的网络搜索引擎基本上分为3 类:(1)独立搜索引擎(Single search engine). 其特点是仅在搜索引擎的本身数据库中查询, 如我们经常使用的Google、百度、雅虎等.(2)元搜索引擎(Meta search engine). 所谓元搜索引擎是对分布于网络的各种检索工具的全局控制机制, 它通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作. 其特点是对查询得到的结果进行不同程度的处理, 如:删除重复结果、检验连接、结果按相关1度排序等. 元搜索引擎本身按照其工作方式的不同又分为并行处理引擎和串行处理引擎.(3)网络搜索软件(Net search software). 其特点是网络用户可将相应的搜索软件下载至本地计算机上安装查询, 是一种具有网络查询功能的离线浏览器.2网络搜索引擎的搜索原理网络搜索引擎实际上是个专用的WWW服务器, 它存有庞大的索引数据库, 收集了全世界上百万甚至上千万个WWW 主页的文字信息. 为了收集这些信息, 有个自动检索程序(Robots)沿着WWW 的超文本链经常搜索整个WWW 上的主页, 然后为这些主页上的每个文字建立索引并送加集中管理的索引数据库. 索引信息包括文档的WWW 地址、每个文档中单词出现的频率和位置等. 使用WWW 搜索引擎时, 可以根据用户输入的关键词, 在自己的数据库中查询相关信息, 然后将结果( 网址) 提供给用户.3三大搜索引擎简介3.1 Google()简介Google 是由斯坦福大学计算机科学系Larry Page 和Sergey Brine 博士于1998 年创建. 支持30 多种语言检索, 包括中文简体和繁体, 并有中文Google网页. 当输入检索词后, Google 每次可以检索30 多亿个网页, 从众多的网页中选取与检索式匹配的链接, 检索效率极高. Google 富于创新的搜索技术和典雅的用户截面设计, 使Google 从当今的第一代搜索引擎中脱颖而出. 2000 年9 月, Google 开启中文搜索服务, 2004 年8 月在纳斯达克上市, 开创了第二代搜索引擎技术. 许多权威机构都将其评为最佳搜索引擎. Google利用“蜘蛛程序”在互联网上抓取各个网站的网页,对网页内容进行分词处理, 并对抓取到的网络进行超链接分析.Google是一个功能强大、网络信息资源非常丰富的搜索引擎, 包括35个国家和地区的语言资源, 占有全球搜索市场的80%. Google原意是表示1后面带有100个零的数字, 使用这个词代表公司想征服网上无穷无尽资料的雄心.正如其所期望, 许多权威机构都将其评为最佳搜索引擎, 全世界平均每天上网人次高达1.5亿. Google在中国搜索市场的市场份额突破30%, 并且增长速度迅猛, 在中文搜索市场有举足轻重的作用. 公司产品Google是全世界最受欢迎的搜索引擎, 使用一种自创的称为PageRank TM(网页级别)技术来索引网页, 索引是由程序“Google bot”执行的, 它会定期地请求访问已知的网页新拷贝. 页面更新愈快, Google bot访问得也愈多, 再通过在这些已知网页上的链接来发现新页面, 并加入到数据库. 索引数据库和网页缓存大小是以兆兆字节(terabyte)来衡量的.3.2 百度()简介百度是中国的两位海外留学生李彦宏和徐勇博士创建的中文搜索引擎, 它拥有目前世界上最大的中文信息库, 总量达到1 亿2 千万页以上, 并且还在以每天几十万页的速度快速增长. 2000年1月, 百度公司在中国成立了他的全资子公司百度网络技术( 北京) 有限公司, 随后于同年10月成立了深圳分公司, 2001年6月又在上海成立了上海办事处. 2005年百度在美国纳斯达克上市, 成为当年全球资本市场上最为引人注目的上市公司, 百度由此进入一个崭新的发展阶段.百度搜索引擎()的起名源于“众里寻她千百度”和突破“事儿做到九十九度就是做到头”的西方说法, 百度就是想要力争做到一百度, 做到顶上开花的境界.百度搜索引擎具有高准确性、高查全率、更新快以及服务稳定的特点, 能够帮助广大网民快速的在浩如烟海的互联网信息中找到自己需要的信息, 因此深受网民的喜爱.百度是目前全球最优秀的中文信息检索与传递技术供应商. 它在中文互联网拥有天然优势, 目前23收录中文网页已超过12亿个, 这些网页的数量每天正以千万级的速度在增长; 同时, 百度在中国各地分布的服务器, 能直接从最近的服务器上把所搜索信息返回给当地用户, 使用户享受极快的搜索传输速度. 目前, 中国所有提供搜索引擎的门户网站中, 超过80%以上都由百度提供搜索引擎技术支持. 3.3 雅虎(/)简介雅虎中国是网站分类目录导航的领头军, 它以分类目录、网站检索为主, 附带网页全文检索, 也是目前最重要的搜索服务网站. 雅虎有中文、英文等10余种语言版本, 每一版的内容互不一样. 可以说, 每一种不同的版本都是一种不同的、相对独立的搜索引擎.雅虎是最知名、最流行的互联网门户网站之一. 它最初只是一个主题目录, 现如今已集搜索引擎、目录和门户网站于一身. 想进入雅虎门户网站和主入口点, 只要输. 要想直接使用该搜索引擎, 请输入; 要想使用目录, 请输入. “ 雅虎” 中规中矩, 网页搜索表现不错,但死链率较高而且缺少一些应有的高级搜索功能. 另外, 该搜索的易用性有待提高, 虽然升级后改善了网页的界面,严格控制搜索页面中的排名广告, 规定每次搜索结果中的广告数量不能超过5个, 但用户打开雅虎中国的首页时还是要受到一些影响. 而且, 对搜索结果的描述和在用户搜索过程中的提示说明也不太清晰明了, 离雅虎“关注用户体验”这一宣传口号, 还有一定的距离.4 Google 、百度和中国雅虎的对比衡量一个搜索引擎质量的优劣主要看其检准率和检全率. 这既是搜索引擎要实现的目标, 也是它发展的动力. 检准率是指搜索到的信息与所需信息相关度高, 检全率是揩搜索到的有用信息尽可能全面, 因此搜索引擎的融合也可看成检全率与检准率的融合. 具体还可从以下6 个方面进行考虑: 4.1三大搜索引擎检索界面比较首页是搜索引擎的“门脸”, 也是其展现特色的一个地方. 雅虎引擎在打开速度上略逊于Google, Google 又略逊于百度. 如以下图片是2012年5月1日百度、Google 搜索引擎的首页, 百度和Google 都体现出该天为“五一劳动节”, 只有中国雅虎未体现,从这一点上可以看出百度和Google 搜索引擎对于实时性的关注程度是非常大的.Google 图片搜索引擎的界面简单、清晰. 在Google 的首页上点击“图片”链接就进入了Google 的图片搜索界面. 在关键字栏内输入想要搜索图片内容的关键字, 如“世博会中国馆壁纸”就可以搜索到大量与世博会中国馆相关的图片. 此外, 在界面上还提供“高级图片搜索”“使用偏好”“图片搜索帮助”3个辅助链接, 方便使用者根据自己的使用习惯调整和加强检索性能.百度图片搜索引擎的界面也十分简单、易用. 在百度的首页上点击“图片”链接就进入了百度的图片搜索界面. 同样在关键字栏内输入图片内容的关键字后就可以搜索到大量相关的图片. 百度提供的图片范围有“新闻图片”“全部图片”“壁纸”“表情”“头像”, 用户可以根据所要图片的大小和用途来缩小检索范围; 同时百度还提供分类浏览目录, 方便用户从类别上进行搜索.雅虎图片搜索引擎的界面非常简洁. 在雅虎的首页上点击“图片”链接就进入了百度的图片搜索界面. 同样在关键字栏内输入图片内容的关键字后就可以搜索到大量相关的图片. 雅虎为注册用户提供了个人图片存储中心, 可以将查到的图片存入雅虎相册. 雅虎图片搜索使用了图片过滤器, 雅虎会自动过滤掉不符合相关法律法规的图片网页等.4.2 三大搜索引擎内容比较Google 的检索结果按相关性由大到小排序输出, 其相关性判断依据的是检索词在网页中的出现词频、位置, 另外一个重要的依据是通过与该网页链接的网页与检索词的匹配程度来判断其相关度大小.百度采用了词频统计、超链分析和竞价排名相结合的方式对网页进行相关性评价, 能够比较客观地分析网页所包含的信息, 从而在一定程度上保证了检索结果的相关性.雅虎检索结果的相关性按其相关度计算, 一般的检索工具是通过计算检索词在每个结果中出现次数和出现位置来计算相关度的. 对用户来说, 只要把网页本身优化好, 就能在雅虎中取得很好的排名。

六大搜索引擎的比较

六大搜索引擎的比较

一、界面、广告以及速度搜索引擎在我们日常操作中的使用频率非常高,大家使用它的目的都非常明确,就是用它来搜寻需要的内容,而不会为搜索引擎的页面做过多的停留,因此搜索引擎的界面设计和速度就对我们的使用产生不小的影响,下面来看看这六款搜索引擎在界面和速度上的表现。

谷歌、百度和微软的Live Search,这三大搜索引擎的界面大家都已经相当熟悉,它们有着共同的特点,就是简洁至极:网站LOGO、搜索框和按钮以及个别功能服务链接,除此以外,页面上就没有其他多余和花哨的东西了,给人的感觉非常清爽,界面一目了然,特别是Live Search在不失简洁的同时还通过一些小脚本和背景图片使得页面整体更加美观。

三者使用起来都很方便,并且首页界面上没有任何第三方的广告。

搜索结果页面,三者同样是采用简洁的风格,页面左侧排列着搜索结果,百度搜索结果页面右侧有不少广告,谷歌视关键词的不同也可能出现右侧广告。

Live Search的界面十分简洁且美观百度搜索结果页面右侧的广告与上面三者相比,雅虎全能搜在界面上显得更为活泼、色彩更加多样,并且在首页内容上也更丰富。

首页上除了常规的搜索所需组成部分外,雅虎全能搜还加入了天气预报、邮箱登录的显示区域。

虽然这些占据了一点点页面,但是它们功能实用且不影响正常使用。

雅虎全能搜的搜索主页搜狗搜索的界面可谓结合了谷歌和Live Search:在布局上与谷歌类似,而在细节上与Live Search有着异曲同工之妙;而搜索新军——网易有道的界面与谷歌、百度站在同一阵线,风格、版式都十分一致。

在搜索结果页面中,搜狗搜索页面左侧有少量广告。

总的来说,六款搜索引擎的界面设计都比较合理、美观、大方。

雅虎全能搜的界面稍有不同,加入了天气预报和邮箱模块,而其他五款都尽量精简,其中谷歌、百度和有道趋于一致,采用最简的风格,而Live Search和搜狗在首页的一些细节上多加以了一些修饰。

此外,值得一提的是一些搜索引擎对于Logo文化的重视,在传统的节日或者一些特殊的纪念日时都会将首页的Logo徽标换成与该日子相关的设计。

主流中俄文搜索引擎核心技术分析与比较研究

主流中俄文搜索引擎核心技术分析与比较研究

主流中俄文搜索引擎核心技术分析与比较研究
颜素莉
【期刊名称】《计算机时代》
【年(卷),期】2012(000)001
【摘要】从本土化角度分析了中文搜索引擎百度与俄文搜索引擎Yandex的核心技术及其特点:百度基于特有的中文分词技术,Yandex依赖于独一无二的俄语词型变化处理技术.通过具体的查询实例对两者进行分析比较,指出了各自的优缺点.【总页数】3页(P3-4,7)
【作者】颜素莉
【作者单位】浙江师范大学职业技术教育学院,浙江金华321004
【正文语种】中文
【中图分类】TP399
【相关文献】
1.中外主流搜索引擎查准率比较研究 [J], 韩雪
2.搜索引擎Google的体系结构及其核心技术研究 [J], 王德峰;李东
3.基于solr下的搜索引擎核心技术研究与应用 [J], 汤玮;刘旭;尹志帆;张光辉;潘祯;彭琳钰
4.医学搜索引擎的分析与比较研究 [J], 郝继英
5.网络搜索引擎的分析与比较研究 [J], 郭万召
因版权原因,仅展示原文概要,查看原文内容请购买。

百度,GOOGLE,中搜等各种搜索引擎的优劣

百度,GOOGLE,中搜等各种搜索引擎的优劣

百度多文档搜索无论从搜索的质量和数量都是要与google相当,甚至超出google,说明,中文搜索引擎在应用的深层次挖掘上已经不再落后于外来服务商。

一搜也提供文档搜索,目前支持的文件类型不多,文档的数量也不够(或者可检出的数量不够)从我个人的经验来说,百度,google,中搜都有搜索引擎的共性,搜索范围十分广泛,而且技术可以说不分上下。

但是百度是中国中文搜索的老大,无论在分词技术还是检索的内容都是很令人满意的,唯一令用户不满的是广告太多,几乎前十页都是推广的。

而google搜索外文要强一些,现在也逐渐进入中国市场,但是他的搜索结果显示的页面很好,没有广告。

中搜,我不是很常用,但是现在中搜做的很好,分类分得很清楚。

回答者:angel031723 - 试用期一级11-22 10:31 目前市场上可以做搜索引擎推广的网站有sohu,sina,3721,baidu,google,网易,yahoo.像中国搜索联盟属于不入流,所以不谈.首先每个网站都有自己的推广的侧重点,像sohu,sina,网易适合普通用户使用(B to C).如果一家公司是做的产品或者服务是面向老百姓的那还是比较合适的.还有一类就是其他的网站,他们面向的客户群是比较专业的公司,这些公司的产品或者服务不是面对老百姓的而是像慧聪一样的BtoB的形式.使用率和市场占有率都是很高的,google34.8% baidu30.4% 很多客户也都是在这上面做广告.google优势:1,全球最大的搜索引擎,使用人群最多2,收录的信息最多3,yahoo和网易采用的是google的搜索结果.4搜索引擎中唯一的没有沾染PPC(竞价排名),没有失去起码的排名的公正。

5,根据国家互联网信息中心google市场占有率最大.百度:现有的推广方式有竞价排名(百度左侧),固定排名(百度右侧)。

优点是国内最大,知名度最高的专业搜索引擎,信息准确。

使用人群占到使用搜索引擎人数的30.4%。

中文搜索引擎数据对比

中文搜索引擎数据对比

中文搜索引擎数据对比2011国内搜索引擎排行及市场占有率分析1.百度是中国互联网用户最常用的搜索引擎.2、谷歌 Google 的使命是整合全球范围的信息,使人人皆可访问并从中受益。

3、SOGOU搜狗是搜狐公司于2004年8月3日推出的全球首个第三代互动式中文搜索引擎。

搜狗以搜索技术为核心,致力于中文互联网信息的深度挖掘,帮助中国上亿网民加快搜索速度.4、SOSO 腾讯推出的独立搜索网站。

提供综合、网页、图片、论坛、音乐、搜吧等搜索服务。

5、微软必应2009年6月1日,微软新搜索引擎Bing(必应)中文版上线。

6、YAHOO中国Yahoo! 全球性搜索技术(YST,Yahoo! Search Technology)是一个涵盖全球120多亿网页(其中雅虎中国为12亿)的强大数据库,拥有数十项技术专利、精准运算能力,支持38种语言,近10,000台服务器,服务全球50%以上互联网用户的搜索需求。

7、网易有道搜索网易自主研发的搜索引擎。

目前有道搜索已推出的产品包括网页搜索、博客搜索、图片搜索、新闻搜索、海量词典、桌面词典、工具栏和有道阅读。

8、新浪搜索全球最大的中文网络门户新浪汇集技术精英、耗时一年多完全自主研发完成,采用了目前最为领先的智慧型互动搜索技术,充分体现了人性化应用理念,将给网络搜索市场带来前所未有的挑战。

9、中国搜索中搜在2002年进入中文搜索引擎市场,为全球最大的中文搜索引擎技术供应和服务商之一,曾为新浪、TOM、网易等国内主流门户网站以及各地区、各行业上千家中国搜索联盟网站提供搜索引擎技术服务。

2004年中搜进入个人门户,2006年推出个人门户IG(Internet Gateway),完成了互联网从传统搜索引擎到个人门户的跨越,中搜一举从搜索引擎的推动者转变为个人门户领导者10、TOM搜索TOM最早建立的中国门户网站之一,与谷歌合作建立中文搜索引擎.根据中国互联网信息中心以及艾瑞网权威数据统计:百度作为中国老牌搜索引擎,其目前在中文搜索业务占有率接近70%。

百度搜索引擎与谷歌搜索引擎的比较分析

百度搜索引擎与谷歌搜索引擎的比较分析

百度搜索引擎与谷歌搜索引擎的比较分析搜索引擎是互联网时代的重要组成部分,是人们获取信息知识的主要途径之一。

由于搜索引擎的重要性,自从1990年代末期诞生以来,就掀起了一场搜索引擎发展的竞赛。

其中,百度搜索引擎和谷歌搜索引擎在全球范围内都具有重要地位。

本文将从检索结果、搜索算法、用户体验、社会责任等方面对这两个搜索引擎进行比较分析。

一、检索结果百度是国内最早的搜索引擎之一,是中国最受欢迎的搜索引擎,特别是中文搜索。

百度搜索引擎的搜索结果通常比谷歌多,因为它会优先显示更多国内站点的内容,但相应的,针对外文搜索的结果则不如谷歌精准。

百度搜索结果中会包含更多推广内容,这可能会干扰用户对搜索结果的判断,但也使得百度可以获得更多的广告收入。

另外,百度搜索结果中也有很多质量不高的内容,这些内容可能是由于SEO优化过度或者恶意操纵搜索结果导致的。

谷歌是全球最大的搜索引擎之一,在搜索结果的数量和质量上都具有明显的优势。

谷歌更擅长于处理复杂的搜索请求,而且搜索结果更加精准、全面。

谷歌搜索结果中过滤了更多的垃圾信息,用户可以更快速地获取真正的有效信息。

但是,谷歌将收录外文站点的内容放在了更显眼的位置,降低了百度在中文搜索上的优势。

综上,百度在中文搜索上具有天然的优势,但其搜索结果易受SEO 和恶意操纵的影响,谷歌则更加注重搜索结果的质量和准确性,但在国内搜索市场受到很多政策和市场因素的制约。

二、搜索算法搜索算法是搜索引擎核心的技术之一,也是影响用户使用体验的重要因素。

百度和谷歌有不同的搜索算法特点。

百度在搜索算法上较于惯用于SEO优化和排名策略,使得一些站点为了获得高点击量、提高排名而使用了通过诱导点击的方式来欺骗人工智能。

这就导致了引擎的搜索结果不够准确,有时搜索到的信息不一定受用或有时工作产生的障碍会更多。

然而,百度在各种类型的网络搜索中都拥有丰富的成功经验,并不仅局限于通常的搜索,例如图片、音乐等的处理和排序并不是所有的搜索引擎都擅长的,但是百度在这项技术上更为优秀。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

收稿日期:2005-05-30作者简介:徐雪梅(1967-),副研究馆员,发表论文多篇。

国外著名的搜索引擎纷纷进军中文搜索市场,中文搜索市场的竞争越来越激烈。

通过中外主流搜索引擎中文搜索能力的对比分析,找出国内搜索引擎的优势和存在的不足,为国内搜索引擎的发展和用户的使用提供借鉴。

1研究对象从2005年5月开始,Cwrank根据Alexa排行榜修正的[1]全球排行榜、[2]中国排行榜以及[3]互联网实验室,依据《互联网实验室CISI网站评测体系》中的评测原则将Alexa排行榜进行过滤,从提供的2005年每月的过滤版可知,内地著名的门户网站有:新浪、搜狐、网易、3721、TOM、21CN、中华网、上海热线等,它们历年提供搜索服务所使用的搜索技术如表1。

从表1可以看出,2005年专业搜索引擎中国搜索以及一搜虽为其他著名门户网站提供搜索技术支持,但提供技术支持的门户网站数比百度少,且在2005年Cwrank[1,2]与互联网实验室[3]的排行榜上,都排在百度之后,故选取百度作为国内专业搜索引擎的代表。

2005年3月Nielsen/NetRatings发布的数据显示[4],2000年开始中文搜索服务的Google继续在搜索领域排名首位。

曾经先后为Yahoo、AOL等国际知名网站提供搜索技术服务,目前为网易、AOL、A-mazon、AskJeeves、Earthlink、Cisco(思科)、P&G(宝洁)、T-Online(Europe)、网景Netscape等国内外著名的网站和公司提供搜索技术服务,支持简体中文和繁体中文网页的搜索,故选取Google为国外专业搜索引擎的代表。

2检索功能比较检索功能体现搜索引擎的质量和技术水平,Google、百度的检索功能见表2、表3、表4。

中外主流搜索引擎中文搜索能力对比研究徐雪梅1,刘雁书2,兰小筠2(1.南华大学图书馆,湖南衡阳421001;2.中南大学医学技术和情报学院,长沙410013)摘要:通过中外主流搜索引擎Google、百度中文搜索能力的对比分析,找出国内搜索引擎的优势和存在的不足,为国内搜索引擎的发展和用户的使用提供借鉴。

关键词:中文搜索引擎;搜索能力;搜索效果中图分类号:G254.1文献标识码:B文章编号:1002-1248(2005)09-0084-06StudyontheComparisonofChineseSearchCapacityofMajorSearchEnginesbetweenChinaandtheForeignCountriesXUXue-mei1,LIUYan-shu2,LANXiao-yun2(1.Library,NanhuaUniversity,Hengyang,Hunan421001,China;2.SchoolofMedicalTechnologyandInformation,CentralSouthUniversity,Changsha410013,China)Abstracts:ThroughthecomparisonanalysisoftheChinesesearchcapacityofmajorsearchenginessuchasGoogleandBaidubetweenChinaandabroad,thepaperhasfoundtheadvantagesandexistingdisadvantagesofdomesticsearchengine,whichhasprovidedreferencethedevelopmentofdomesticsearchengineandtheutilizationbydomesticusers.Keywords:Chinesesearchengine;searchcapacity;searcheffect农业图书情报学刊第17卷第9期Vol.17’No.9JournalofLibraryandInformationSciencesinAgriculture2005年9月Sep.2005搜索引擎新浪搜狐3721网易TOM21CN中华网上海热线开始搜索服务时间1999年1998年1998年2001年2001年2000年2002年2001年1999年新浪搜狐37212000年新浪、百度搜狐、百度3721百度2001年新浪、百度搜狐、百度3721Google百度百度百度2002年新浪、百度搜狐、百度、中国搜索3721百度百度百度百度、中国搜索百度2003年新浪、百度、中国搜索搜狐、中国搜索3721、中国搜索百度、Google、中国搜索中国搜索、百度百度中国搜索百度2004年新浪、中国搜索、visionnext、Google搜狐、中国搜索一搜、3721网易、中国搜索GoogleTOM、百度、中国搜索21CN、百度、中国搜索中国搜索、一搜百度、搜狐2005年新浪、中国搜索、visionnext、百度搜狗一搜、3721Google、网易、TOM百度一搜上海热线、搜狐、百度门户网站使用的搜索技术表1各著名门户网站历次使用的搜索技术3检索效果比较3.1检索式的确定对单个关键词进行搜索,结果往往成千上万,而多个关键词联合搜索既能大大减少搜索结果,又能更搜索类型网站搜索网页搜索新闻搜索Mp3搜索地区/地域搜索图像/图片搜索网上论坛搜索Google关键词、分类关键词关键词关键词、分类百度关键词、分类关键词关键词、分类关键词、分类关键词关键词、分类关键词、分类表2Google、百度的主要搜索功能类型高级搜索网页快照二次检索扩检功能关键词推荐搜索布尔逻辑运算字段检索限定检索精确检索Google可设置网页语言、文件格式、网页更新日期、字词位置、网域、类似网页、键链、每页显示结果数,在网站搜索、网上论坛搜索、图像搜索界面中都提供“高级搜索”网页快照支持提供该网站内的更多结果在搜索结果中推出类似网页搜索和网页类别搜索两种类型按类似网页搜索无支持在网页的标题中搜索(intitle:)在网页的内文搜索(intext:)在网页内的任何地方在网页内的网址(inurl:)在网页的链接内搜索(inanchor:)按链接搜索(link:)指定网域(site:)按文件类型搜索(filetype:)按时间搜索支持百度可以设置网页语言、关键词位置、网页更新日期、网页地区(可多选)、网域、每页显示的结果数,在网页搜索界面提供“高级搜索”百度快照支持提供该网站内的更多结果无无支持相关检索词智能推荐搜索支持在标题中搜索(intitle:)无无在url中搜索(inurl:)无按链接搜索(link:)指定网站搜索(site:)无按时间搜索支持表3Google、百度的辅助搜索功能搜索引擎GOOGLE百度实用功能计算器、中英文字典、天气查询、股票查询、邮编区号、手机号码计算器、天气预报、电视节目预报、网上地图、列车时刻表、飞机航班、宾馆查询、外汇牌价、股票查询、彩票查询、邮编查询、IP查询、手机号码查询、星座运程、万年历、词典搜索等表4Google、百度的实用功能第9期徐雪梅等:中外主流搜索引擎中文搜索能力对比研究85好地反映检索者的检索意图,因此多个关键词联合搜索在一定程度上更能反映搜索引擎的检索能力。

为了减少主观因素对测试结果的影响,并保证所选课题的现实性,在南华大学的信息检索登记表中进行筛选,最后选取医学领域的检索课题九个,并根据登记表中各个课题附有的关键词及其组配关系,组成测试二个搜索引擎的检索提问式集合。

九个检索提问式如下:E1:哮喘流行病学E2:卡托普利充血性心力衰竭E3:爱滋病鸡尾酒疗法E4:狂犬病疫苗免疫效果E5:肝癌致病基因E6:白血病造血干细胞移植E7:子宫肌瘤介入治疗E8:系统性红斑狼疮免疫吸附E9:早产儿视网膜病变测试时间:2005.4.10-2005.5.103.2检索环境的确定为了保证检索结果的可比性,所有检索实验都在统一的环境下进行。

由于网页搜索是Google、百度最基本的搜索功能,且繁体中文和简体中文的网页都是它们的收录范围,故对对它们进行中文(包括繁体中文和简体中文)网页的搜索效果进行测试。

为了减少网络的动态性变化所致误差,同时使用二个搜索引擎检索同一表达式,并将每个搜索引擎的检索结果保存下来,用于统计分析。

所有统计结果都是自然搜索结果。

3.3评价指标美国研究人员H.VernonLeighton和JaideepSri-vastava提出“相关性范畴”和“前X命中记录查准率”的概念。

“相关性范畴”给出一种判断检索结果与检索课题相关性的标准,而“前X命中记录查准率”,则在“相关性范畴”标准的判断下,计算“查准率”[6]。

凤元杰等在此基础上给出了“相对查准率”的评价指标,我认为这是判断检索准确度的一种较好评价方法,于是采用了这种方法[7]。

搜索引擎营销公司iPropect的调查研究显示:总计共81.7%的搜索引擎使用者会在看完前三页之前就停止阅读搜索结果,人们对前三屏兴趣较大,并且三个搜索引擎都可以以10为单位输出检索结果,故N取为30是理想的。

具体的计算方法如下:(1)相关性范畴等级和相关系数(见表5)(2)p(Ei)的计算方法将每个关键词的前30条记录分为4组(1-3,4-10,11-20,21-30),分别赋予权值0.45,0.25,0.2,0.1;R每个命中记录的相关系数(当命中记录数≥30时,N取为30,否则N为实际返回记录数)。

为属于范畴1的检索结果赋予相关系数0,为属于范畴2的检索结果赋予相关系数0.5,为属于范畴3的检索结果赋予相关系数1。

为N的函数,作为P(Ei)的分母。

当N=0时,P(Ei)=0。

P(Ei)的计算公式则为:P(Ei)=R(1-3)×0.45+R(4-10)×0.25+R(11-20)×0.2+R(21-30)×0.1M(Ei)(3)计算出P(A)=1nni=1"P(Ei),P(A)的值就称为搜索引擎A的相对查准率。

3.4检索结果Google、百度的搜索结果显示格式、文档类型及网页类型见表6,命中网页情况见表7、表8,处理后命中网页的前30条记录的相关系数见表9,相对查准率见表10。

相关性范畴范畴1范畴2范畴3定义重复或无用的信息检索出的信息对检索者有潜在用处检索出的信息对检索者有明显的用处种类重复链接死链不相关链接有一定的字面联系,但内容信息无用的链接给出了相关但不详尽的信息检索结果中包含了范畴3信息的链接详尽、丰富的相关链接详尽的探讨和论述相关系数00000.50.511表5相关性范畴等级和相关系数0.45N0<N≤30.25N+0.63<N≥100.2N+1.110<N≤200.1N+3.120<N≤30,M(Ei)令M(Ei)=农业图书情报学刊:信息教育第17卷86文档类型网页类型搜索结果显示格式GoogleHTML文档、PDF、PS、DOC、PPT等非HTML文档的收录搜索静态网页和动态网页文件格式、网页标题、网页摘要、网页网址、网页大小、网页生成日期、网页语言,以醒目的颜色显示检索词百度HTML文档、PDF、PS、DOC、PPT等非HTML文档的收录搜索静态网页和动态网页网页标题、网页摘要、网页网址、网页大小、网页生成日期、网页语言,以醒目的颜色显示检索词表6Google、百度的搜索结果的显示格式、文档类型、及网页类型搜索引擎Google百度E139808920E23941070E381602740E411101140E532602680E677409210E747005470E8406445E98431750合计3059333425平均33993714表7Google、百度命中网页数表8Google、百度处理后的命中网页数搜索引擎Google百度E1749760E2155242E3635717E4623406E5721378E6727750E7767760E8225156E9439493合计50414662记录号123456789101112131415161718192021222324252627282930E10.50.5111111000100.510.50.50.5110.5110.5000000.5E20.50.50.50.51100.5000.50.51110.50.50.510.5111000010.51E300.50.50000.5000.500.50.510.50.50000.50.500.50.500000.50E40.50.5110.50.50.5010.5100.50000.50.50.50.50.5000.5000.500.50E50.50.50.50.50.50.50.50.50.50.50.500000.500.500.50.50.50.50.50.500.50.500E60.50.50.50.50.50.50.500.50.50.50.50.50.50.5010.50.50.50.50.500.510.50.50.50.50.5E70.510.50.500.511110.500.50.50.500.50.50.50.510.501000.500.50.5E80000.50100000.50.50.50.500.50.500.50.50.5000.500.50000E900.51010.50.50.5101111011010010.5000.5000.50E1110010100.5011010.5001111000.50.510.50.511E21110.50100.51110.50.50.500.510.510.5000.50.5011111E3110.5000.50.500.50000000.50010010000110.50E410.5110.50.50.500.50.50.500.500.50.50.50.500.50.50.50.510.50.50.50.500.5E50.50.50.50.50.50.50.50.50.50.50.500.50.50.50.50.50.50.50.50.50.50.50.50.500000E6000.50.50.50.500.500.50000000.50.50.50.50.50100.50.50.50.50.50.5E70.5110.5110010.500.500.51000.500.500001000.500E80.50.500.500.50.510.51000.50.500.500.5000.5000000000E90.500.51110.5010000.5000.50.50.510.500.500010100表9Google、百度处理后的命中网页的前30条记录的相关系数Google百度第9期徐雪梅等:中外主流搜索引擎中文搜索能力对比研究874讨论4.1搜索功能表2、表3、表4可以看出,百度提供的主要搜索功能的种类超过Google,如百度的新闻搜索、MP3搜索和地区搜索是Google中文界面所缺少的;在辅助搜索功能方面,特别是限定检索和字段检索,百度比Google逊色得多;百度提供的使用功能更多,更符合国内用户的特殊搜索需求。

相关文档
最新文档