搜索引擎的功能特征及检索技巧
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
字段检索一律表现为前缀符的限制形式,如属于主题字段限制的“ %+76"” 、 “H"<G.;I3” 、 “ *0#J"D7” 、 “*0EE-;<: ”等;属于非主题字段限制的有: “ +E-?": ” 、 “ 7"K7: ” 、 “ -LL6"7”等。另外,搜索引擎还提供 了新的、带有典型网络检索特征的字段限制类型,如:主机名限制( /.37: ) ; C+,4 限制( 6+,4: ) ;超链 ) ;网 址 限 制 ( 3+7": ) ; 域 名 限 制 ( I.E-+,: ) ; 新 闻 组 限 制 ( ,"G3?;.0L3: ) ; M9C 限 制 限制( -,D/.;: (0;6: ) ; NE-+6 限制( 2;.E: )等。除此之外,还有得到广泛应用的范围限制、地域限制、学科限制、 语言限制和网站类型限制等。这些功能的运用可以有效控制检索结果的相关性,从而提高检准率,如 >..?6"、567-8+37-、’.7B.7 等搜索引擎。 !"% 字符串检索的广泛应用 字符串检索不仅规定了检索式中各个具体的检索词及其相互间的逻辑关系,而且规定了检索词之 间的临近位置关系。如自然语言格式的提问式检索、用户可直接输入提问式的语句检索、限定所输入 的两个或两个以上单词为词组时,搜索引擎要求用引号( “” )标示的词组检索。从目前情况来,几乎 所有的搜索引擎都支持字符串检索,而且有进一步引进记忆、学习功能而发展为智能检索的趋势。 !"& 元检索的实现 由于元搜索引擎处在用户与其它 !"# 搜索引擎之间,它可以跟踪用户的查询需求,利用合适的 缓冲器策略来提高用户的检索速度。这种元搜索引擎的集成,使得分布在因特网上众多有 !"# 搜索 引擎有机地连接在一起构成一个超大型的分布式、高度自治的并行处理系统。不同的 !"# 搜索引擎 对于同样信息的相关性存在着较大的区别,元搜索引擎可以通过对不同的 !"# 搜索引擎结果进行分 析、比较、归类,从而达到满足用户意愿的要求。如天网、 >..?6"、 567-B+37-、 ’.7B.7 等普遍使用元检 索技术。 !"’ 其他技术的使用 如包含或排除检索(加减检索) 、对大小写字母敏感、在上一检索结果中检索、模糊检索以及精 确匹配等功能普遍使用,如天网、天元维、>..?6" 等搜索引擎。
=
搜索引擎的功能特征
目前网上有许多搜索工具,几个著名的搜索引擎如 .>>F=,、天网、新浪( H9*C) 、搜狐( H>78) 、 中文 LC7>> 和西文的 LC7>>、 )*A>E,,D、 2=+CM9E+C 等。从载体形态上划分,搜索引擎可以分为关键词搜 索引擎、导航式搜索引擎、分类搜索引擎等;从功能上划分,搜索引擎可分为数据库检索功能的搜索
“” ” ”表示的字符串对大小写敏感, “ 1 ”表示的字符串对大小写不敏感) ,告知用双引号 2+3.4))5 中, 括起来的词或词组要精确匹配,如健入“” )0)(,6.+*( 78/89*+)” ”就把“ )0)(,6.+*( 78/89*+)”当做一个 关键词来搜索,否则,就会查出包含“ )0),6.+*(”及“ 78/89*+)”的网页;键入“电脑报” ” ,则“电脑 商情报”等信息就不会出现在结果中。 利用高级搜索,正确使用布尔逻辑算符 8+:(表示逻辑“与” ,可用“ ;”表 示,在中文中一般用半角的“ < ”表示,用于搜索两个以上关键词,如“” < 法国农业 < 巴西农业 < 中国农业” ”表示检索内容必须同时包括“法国农业、巴西农业、中国农业”= 个关键词) , .6(表示 逻辑“或” ,可用半角的“, ”来表示,有的搜索引擎使用空格,如““法国农业,巴西农业,中国农 业” ”表示检索内容不必同时包括 = 个关键词,只要包括其中一个即可) , +.,(表示逻辑“非” ,可用 “!”来表示,也可在要排除的关键词前加半角的“ 1 ” ,如“”新闻 +., 经济” ”表示检索内容包含 “新闻”但排除其中有“经济”这个词语的文档, “”电脑>硬件” ”表示要检索“电脑”但不包含“硬 件”的文档)等,有的搜索引擎不完全支持上述算符,如 ?8@.. 尚不支持 +.,,不同的搜索引擎表达方 式不同。 第三、通配符与其他组配符号的使用 为了保证查全率,对同一检索方式可使用几个不同的检索 工具来进行检索;可使用通配符(截词符) “"” (代替任意个字母) 、 “A (代替 C 个任意的字母)来 B” 进行模糊 检 索(英 文 检 索 还 可 通 配“? ” 检 索) ,如 输 入“ ’ 4)8" ’ ” ,搜 索 引 擎 将 检 出 包 含 4)8、 " ”可检出包含电脑、电影、电视等内容的文档;也可 4)86(@、 4)80*+/ 等关键词的网站,输入“’电 ’ 使用近义词来进行检索,如要搜索“软硬件使用技巧” ,可使用“’ D.6: 使用技巧’ ”来进行检索; 第二、高级检索
南京 "!&&(’)
摘要:随着计算机网络的飞速发展, )*+,-*,+ 信息呈现膨胀态势。为了满足用户及时、准确地获取信 息的需要,人们进行了大量有益的探索,积累了一定经验。在前人工作的基础上,对搜索引擎的检索 功能所表现出的特征作了初步探讨,就比较实用的信息技巧作了归纳和总结。 关键词:搜索引擎;功能特征;检索技巧 中图分类号:. "&" 文章编号:!&&’/!’0$ ("&&() &!/&!&%/&1 文献标识码:2
89.%,($%::9+7 +7, ;,<,=>?@,*+ >A )B, 9*A>-@C+9>* 9* )*+,-*,+ +CD,E >* 9*A=C+9*F ?>E+8-, G H> ?,>?=, C-, ,I?=>-9*F C F-,C+ ;,C= +> JC?+8-, 9*A>-@C+9>* A>- +7,@E,=<,E G B7, A8*J+9>*C= J7C-CJ+,-9E+9JE C*; +,J7*9K8, >A E,C-J7 ,*F9*, C-, ;9EJ8EE,; G :-; <’,/.: E,C-J7 ,*F9*,; A8*J+9>*C= J7C-CJ+,-9E+9J; -,+-9,<C= +,J7*9K8, 因特网是全球性的最大的计算机网络,它的出现从根本上改变了人们获取和交换信息的方式,获 得了“第四媒体”的美誉,但网络上信息呈指数上升简直让人无所适从。上世纪 %& 年代,人们开始 探讨手工检索的理论和实践,其间只涉及穿孔卡片检索和缩微胶卷检索等简单的的机械检索和光电检 索的知识。’& 年代,随着计算机信息检索服务的发展,特别是国外联机检索信息服务系统的终端伸 延到我国之后,信息检索方面的研究在内容上有了实质性的发展,即除了包含用手工检索之外,又论 述了计算机检索— — —包括联机批处理检索和联机检索的理论与方法,而且随着时间的推移,计算机检 索知识所占的比重日趋增强。进入 "! 世纪以后,计算机技术、 )*+,-*,+ 信息搜索技术得到了更充分的 发展,人们的注意力已经转向搜索引擎技术,尤其是 )*+,-*,+ 搜索引擎的检索功能特征及检索技巧。
! 收稿日期:"&&"/!"/"$
作者简介:钟哲辉(!0%& S ) ,男,湖南湘阴人,海南大学图书馆馆员,管理学硕士,从事检索技术研究。
・ QPO ・
南
京
农
专
学
报
RPPS 年
第Q期
引擎、网页(!"#)检索功能的搜索引擎、文件检索功能的搜索引擎( $%&) 、名录检索功能的搜索引 擎(!’()*)等。其功能特征包括: !"! 检索效率高 一般检索只需数秒钟,它拥有一个含时间变量的数据库,能保证所查询的资料都是最新和最全面 的,如新浪( *+,-) 、搜狐( *./0) 、中文 1-/.. 和西文的 1-/..、 ),2.3""4、 567-8+37- 等;为了提高检准 率,搜索引擎往往还要提供进阶查询( 9"2+," :0";<) ,利用管道符“ = ”(管道表示子集)检索,如 >..?6"、天网等。搜索引擎往往在输出检索结果的同时,还提供网站的摘要介绍,使你不必在一些死 胡同里费时。 !"# 检索技术先进 随着计算机及其网络技术的发展,以搜索引擎为基础发展起来的计算机网络信息检索技术得到了 突飞猛进的发展。 第一、布尔逻辑组配在搜索引擎的信息检索中得到普遍运用 尽管不同的搜索引擎对逻辑检索支 持的程度不同,但一般都支持 5@A、(9、 @(% 三种逻辑组配(如中国数字期刊群、国家科技文献资 源网络服务系统) ,有的搜索引擎只在其“高级检索”模式中是完全支持,而在“简单检索”模式中 部分支持,如 ’.7B.7, C<D.3 等。 第二、截词检索在 ),7";,"7 搜索引擎中已经开始应用于检索 目前,截词检索包括左截法、右截 法以及中间截词等。截词符采用通配符问号(? )和星号(!) ,中国学术期刊搜索引擎已经成功采用 截词检索。如 ,07;+! 相当于 ,07;+-、 ,07+",7、 ,07;+6+7"+、 ,07;+E",7 或 ,07;+;+.,……。 第三、位置检索 !"$ 。 567-8+37-、 B)(*)* &;"F+"G3 等提供临近位置运算( ,"-; 运算) 限制检索得到运用和发展
!"#$%&’#() *+(,($%-,&.%&$. (#/ 0-%,&-1() 2-$+#&3"- 4’, 5-(,$+ 6#7඀. 37,/789
(!# !"#$%$& ’( )%"*%* +*",-$."/& , )%"0’1 $%&""’, 23"*% ;"# 45"/’$"%6 7(("8- ’( 9"*6"*: ;*./"/1/- ’( <-83*’6’:& , =%*>"*: "!&&(’, 23"*%)
总第 GG 期
钟哲辉,等:搜索引擎的功能特征及检索技巧
・ CFE ・
!
搜索引擎的检索技巧
为了有效使用搜索引擎信息检索,在提高检全率和检准率基础上,全面提高检索效率,搜索引擎
提供了一些可靠而实用的信息检索技巧。 !"# 要正确选择用于搜索的软件 一个好的专业搜索引擎(有人物搜索引擎、旅行路线搜索引擎、域名搜索引擎、网址搜索引擎、 主机名搜索引擎、商业搜索引擎、 !"# 搜索引擎等)在某一行业的信息较之综合性的搜索引擎更全、 更新,而且因信息相对集中,检索起来也能够节省很多时间,查准率也有保证。进行信息检索过程 中,应根据课题的学科领域、专业范围、所需要的信息形式有针对性地选择搜索引擎和检索工具,如 中国教育信息网导航台( $$%& ’ ()*++ ’ +),)就是一个教育网站的搜索引擎。另外,有必要了解搜索 引擎本身的特性、功能以便检索工作做到有的放矢。如天网的学术性、 -../0) 的高效性。多个搜索引 擎联合使用,可以使搜索功能更大。在检索者英文水平不太同的情况下,可借助汉化软件来完成搜 索。 !"! 合理使用搜索语言 第一、关键词搜索 查找与关键词相同的字串,并将含有该字串结果列出。选用恰当的关键词是
最基本要求,对于准确定位信息至关重要。若在检索文本栏中键入的关键词不恰当或拼写不正确,搜 索出的东西一定是事与愿违。同时,习惯使用多关键词,若输入编辑框的词之间是“或”的关系,同 时打入多个关键词会更迅速准确地找到大量信息;第二、概念搜索 全查率;第三、精度搜索 然语言习惯输入需要查找的字串;第五、主题语言搜索 搜索词基本匹配的字串,提高查全率;第七、上位类搜索 !"$ 简单检索与高级检索综合运用 第一、简单检索 简单查询时,要使用半角的双引号或“ 1 ”来进行字符串(短语)检索(在 查找同义词和近义词,提高搜索 按自 查找和 查找和搜索词完全一致的字串,提高查准率;第四、自然语言搜索 按主题分类查询;第六、模糊搜索 扩大查找和搜索范围,提高全率。
第 !0 卷 第 ! 期 M>=#!0 6>G !
南
京
农
专
学
报
N>8-*C= >A 6C*O9*F 2F-9J8=+8-C= B,J7*>=>FP Q>==,F,
"&&( 年 ! 月 RC-G "&&(
搜索引擎的功能特征及检索技巧
钟哲辉!,马金玉",
(!# 海南大学图书馆,海南
!ห้องสมุดไป่ตู้
海口 $%&""’;"# 金陵科技学院学报编辑部,江苏