网络信息资源检索
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
科技情报开发与经济SCI-TECH INFORMATION DEVELOPMENT&ECONOMY2013年第23卷第2期
网络是当今获取信息的最主要途径,它已经成为全球范围内传播科研、教育、商业和社会信息的最主要的渠道。在服务内容、方式、深度、广度、效果和效益方面,网络信息资源几乎都胜过了以往所有传统的信息资源,成为人们查找信息的首选目标。如何快速、准确地找到并获得所需的信息,是目前广大网络用户共同关心和需要解决的问题。
1网络信息资源检索简介
网络信息资源,即指以数字化形式记录的、以多种媒体形式表达的、分布式存储在互联网上不同主机的,并通过计算机网络通信方式进行传递的信息资源的集合,是计算机技术、通信技术、多媒体技术互相融合而形成的在互联网上可查找、利用的信息资源[1]。
在网络环境中,信息资源类型多样,有文本信息、多媒体信息、数据库信息等,具有信息数量巨大、信息传递速度快、分布和传播范围广等特点。网络信息资源检索的过程是用户为解决生产、生活、研究和决策中的问题而与计算机信息系统进行交互的过程,也是期望通过这种交互获得启迪的复杂的认知过程。用户在查询过程中,能否根据信息需求,制定合理的检索策略,能否掌握和运用各种检索工具和检索方法,是检索成功与否的关键所在。
2网络信息资源检索的途径
2.1直接访问信息源
网络信息资源检索可以直接访问信息源,通过网址直接进入网站或网页,一般用于已知所查询信息的具体网址时使用。这就需要记忆大量的域名或网址。另外一种更简便的方法是安装网络实名插件(如3721网络实名),这样在浏览器的地址栏中直接输入网站名称即可进入该网站。2.2利用网络检索工具
搜索引擎(search engine)是在互联网上提供信息检索服务的一个系统机制,主要包括信息的采集与处理以及信息的检索。它是运用计算机的特定程序,按照一定的方法和策略,搜集互联网上的信息,在对信息进行加工和整理后,将用户检索的信息提供给用户进行查询的系统。通过搜索引擎可以为用户展现出一目了然的“信息地图”,供用户随时查阅。按照工作原理,搜索引擎大概可以归纳为3类:全文搜索引擎、目录索引类搜索引擎和元搜索引擎。
全文搜索引擎是一个真正意义上的搜索引擎,有国内常用的百度(Baidu)及国外著名的谷歌(Google)等,它们都具有一定的代表性。其工作原理是:在互联网上提取各网站的信息(以网页文字为主),并在所建数据库中得到和用户查询条件相对匹配的记录,然后按照一定的顺序加以排列,并将所搜索的结果反馈给用户。因此,全文搜索引擎常被称作为名副其实的搜索引擎目录索引类搜索引擎的搜索功能是用人工方式或半自动方式搜集信息,须由编辑人员查看后形成人工信息摘要,然后把这种信息放在事先确定的分类框架中。因此,严格地说,目录索引类搜索引擎虽然具有搜索功能,但算不上是真正意义上的搜索引擎,它不过是按目录分类的网站链接列表而已。用户无须进行关键词的查询,用分类目录就能查到所需信息。非常具有代表性的目录索引类搜索引擎有雅虎(Yahoo)、新浪、搜狐、网易搜索等。
元搜索引擎的主要特点是:在接受用户查询请求时,还需要调用其他的搜索引擎,然后把搜索的结果进行简单合并和去重后返回给用户。中文元搜索引擎中的搜星搜索引擎及较著名的元搜索引擎InfoSpace等都属于这类搜索引擎。
目前,除了以上提到的3类引擎外,还有一些其他形式的搜索引擎,如集合式搜索引擎、门户搜索引擎、免费链接列表等,这些网站同样也是为用户提供检索服务的,所以通常情况下也被称为搜索引擎。
2.3使用网络搜索软件
网络搜索软件是一种具有网络查询功能的离线浏览器,一
文章编号:1005-6033(2013)02-0116-03收稿日期:2012-07-25
浅析网络信息资源检索*
刘宏伟
(渤海大学图书馆,辽宁锦州,121013)
摘要:在数字化、网络化资源高度共享的今天,网络已经成为获取信息的最主要途
径,如何准确、迅速地获取所需信息是人们面对的重要问题。以网络信息资源检索为主
题,详细介绍了检索途径、检索策略和检索技巧等问题。
关键词:信息检索;搜索引擎;检索策略;检索技巧
中图分类号:G254.97文献标识码:A
────────────────
*基金项目:辽宁省社科基金项目“关于辽西地区学术文化
建设若干问题的研究”(项目编号:L10DWJ018)。
116
般是由对网络信息搜索有特别兴趣的个人、科研小组或部门设计、开发的,如生物大分子可视化软件Rasmol、Mage、Rester3d及Grasp,序列对比和数据库搜索软件BLAST、FASTA、BLITZ等,这些软件适于查询一些特定领域的网络信息,为专业研究人员提供了极大的方便。
2.4通过大型专业数据库搜索
大型专业数据库资源具有网络上其他资源无法替代的优势,包括题录文摘型数据库Ei、INSPEC、CSA、PQDD博硕士论文库、OCLC等;中文数据库维普中文期刊数据库、中国学术期刊数据库、万方数据资源系统等;英文全文数据库ELSEVIER SCIENCE、SPRINGER、KLUWER ONLINE、WSN等。这些数据库具有数据资源稳定、收录时间跨度大、可方便进行回溯检索、数据质量高、内容涵盖广且定期更新等优点。
3网络信息资源的检索策略
所谓检索策略,就是在明确信息需求实质的前提下,选择搜索途径、搜索用词以及明确各词之间逻辑关系和查找步骤的科学安排。
3.1明确检索的内容和目的
明确检索的内容和目的是为了确定查询范围。检索之前,要对检索课题进行认真分析,从而明确检索主题,形成若干个能代表信息需求且具有检索意义的主题概念,尽可能使分析的主题概念能准确反映检索的需要,弄清所需文献的数量、类型、语种、年代范围及其他外表特征,同时要明确检索内容涉及的主要学科范围等。
3.2选择合适的检索工具
要尽可能多地收集专题信息网址,尽量使用专题检索工具与专业数据库。所谓专题检索工具,是指专为查询某一学科或某一主题的信息而产生的查询工具。在解决实际查询问题方面,专题检索工具比综合性的检索工具更有效,其查准率和查全率更高。因此,选择数据库要以专业数据库为主,以综合数据库为辅。在对常用搜索引擎的检索功能及特点了解的基础上,还要掌握其查询信息的范围、检索系统的功能,按照不同的需求选择合适的搜索引擎。各搜索引擎的检索功能各有特长,对于同一个检索提问,在不同的引擎中会得到不同的检索结果。
目前,网上搜索引擎已有1000多个,常用的也有几十个,每个搜索引擎在索引资源、用户界面、功能设置、检索速度、检索数量、检索方式等方面都不尽相同,在查全率、查准率方面的差别也较大。因此,要了解并掌握常用搜索引擎的性质、功能与检索方法等,以便更好地使用搜索引擎。另外,人们在信息检索实践过程中,往往会遇到各种各样问题,对检索的结果往往会感到不满意,要想提高检索的精度和广度,加快检索速度,必须要通过反复实践,逐渐摸索,熟悉和掌握一些实用的检索方法与技巧,以增加获取有用信息资源的可能性,快速、准确、全面地查找到所需信息。4网络信息资源的检索技巧
4.1选择合适的搜索引擎
使用搜索引擎时,一定要根据检索的要求和检索的目的去选择合适的搜索引擎。因为不同的搜索引擎具有各自不同的规律和特点,无论是在信息的覆盖范围上,还是在检索的优势上都存在许多差异。目录式搜索引擎就非常适合于检索一些准确度较高的课题,比如在查找综合性和概括性的主题概念时,常用目录式搜索引擎(如Yahoo!)来进行搜索。在对某种特定的信息或一些具体以及类属不明的课题进行检索时,可以使用关键词索引式搜索引擎(如Google)。只有正确地选择搜索引擎及其适合的方法,才能更好地实现网络信息资源的准确、方便与快捷的检索。
4.2选择合适的检索数据库
现有的数据库种类繁多,因此,一定要根据用户检索内容的范畴来选取合适的数据库,同时要迅速找到主题分类目录,然后才能进行更为准确的检索。选择数据库时要遵循“4C”原则,即Content(内容、类型等)、Coverage(规模、文献量等)、Currency(更新的及时性)、Cost(收费标准)[2]。
4.3提炼准确的搜索关键词
关键词是指输入搜索引擎的搜索框中要寻找的文字。在进行检索之前,应首先把检索课题分解成一系列的基本概念,再为每个概念确定一个合适的关键词或词组,最后确定关键词之间的逻辑关系,利用各种逻辑运算和限定方法,来构造检索提问式。正确选择关键词是非常重要的,它对检索效果的好坏起着非常重要的作用。关键词是对信息加以概括和集中化的词,是能准确表达检索意图的词,它必须是非常规范的主题词,要具有代表性和指示性,尽量不要选择常用词汇进行搜索。而且,要学会使用两个以上关键词搜索。在检索的过程中关键词运用得越多,界定检索的范围也就越明显,得到的检索结果也越准确。
4.4正确构造检索表达式
通常采用布尔逻辑运算符、截词检索运算符、位置检索运算符、限制检索运算符、匹配检索运算符等同检索关键词的组配来构造检索表达式[3]。其中,布尔检索表达式是最常用的检索表达式,主要有逻辑或(OR)、逻辑与(AND)与逻辑非(NOT)3种。逻辑或在Google中用OR表示,在Baidu中用符号“|”表示;逻辑与在Google和Baidu中可都可以用空格来表示;而逻辑非在Google和Baidu中都用“-”来表示,前一个关键词和“-”间必须有空格。有很多支持布尔检索的数据库,如中国期刊网、维普资讯、万方数据、中国高校图书目录检索系统等。
好的检索表达式应准确反映检索的主题内容,应符合检索系统的功能及限制条件并将检索结果控制在较准确的范围内。要正确使用逻辑与(AND)、逻辑或(OR)、逻辑非(NOT)及其与之相对应的“+”“-”等逻辑符号命令。如果能正确使用这些逻辑命令,就能轻松获得良好的检索效果。如要检索含有“人口”和“老龄化”概念的文献,表达式为“人口AND老龄化”或“人口老龄
117