网络文献信息检索基础知识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
网络文献信息检索基础知识
随着信息技术的飞速发展,信息已成为人类社会不可缺少的一种资源。因特网是全世界最大的信息宝库,是人类进行科学研究、商务活动和共享资源的重要手段。如何从这个宝库中迅速、准确地查找所需情报信息,是人们普遍关注的问题。
1. 网上信息源种类
网上文献信息种类繁多,按文献信息加工层次,可以分为五类:
(1)网上报刊由于网上文献信息传送速度快,越来越多的出版商注重在网上发行报刊。
据统计现已有数百种报纸,近千种期刊,其中很多是免费的。
(2)动态信息各级政府机构、高等院校、团体、公司在网上发布的消息、政策法规、会议消息、研究成果、产品目录、出版目录、广告等。用户还可以通过Outlook设置所爱好的新闻热线。在新闻热线上不仅能获得动态信息,而且还能发表自己的看法,与网友进行交谈。
(3)馆藏书目数据库网上有包括美国图书馆在内的6000多所著名公共图书馆、大学图书馆。如中国数字图书馆(/)、美国国会图书馆(/)。
(4)网上文献数据库如我们常用的Dialog(http://www.dialogweb.com)、OCLC(http:/www.oclc.org)、STN(http://www.Jicst.go.jp;http://www.Fj2kar1sruhe.de;http://info.cas.org)等网络系统以及中情所的数据库检索系统(http://www.chinainfo.gov.cn)。
(5)参考工具书如大不列颠百科全书(http://www.eb.com),汉语词典(http://www.erols.com)等已进入了因特网。
2文献检索中常用符号
为了准确表达检索内容,缩短上网时间,经常需用一些检索符号。
(1)布尔逻辑符它是一种最基本的计算机检索传统技术,主要有逻辑或,用“OR”或“+”表示,如A+B表示检索包含有A或B、A和B的文献信息。逻辑与,用“AND”或“*”表示,如A*B表示检索包含有A和B的文献信息。逻辑非,用“NOT”或“ ”表示,如A B表示检索不含有B的A的文献信息。
(2)截词符用“?”表示;如computer?,可检索到computer、computers、computerize、com puterization。当对某词词尾不清楚时,截词很有作用。
(3)+/-号检索词前加+/-号表示该词必须/不能出现在被检文献信息中。
(4)“”或()表示输入的所有检索词为一个整体概念(术语),如中南工学院,若不加“”或()将检索到含有这五个字中的任意一个字的所有信息,在天网上将查到400余条信息,加上“”或()后,就只查到3条。
3网上信息资源检索
3-1已知某站点浏览获取动态信息
互联网上的各站点经常发布新闻及有关消息。若已知某WWW地址,就可以在地址框中键入该地址,然后回车。开始搜索,在主页上双击信息栏目。如国家自然科学基金会(http://www.nsfc.gov.cn)、中国教育与科研网(http://www.edu.cn)、中国信息网(http://www.chinainfo.gov.cn.)等,他们经常在网上发表消息。您可以将您常用站点放入您的书签中,以防忘记,同时便于今后使用。如果您不知某重要网址,可使用WWW搜索引擎。
3-2WWW搜索引擎
搜索引擎是一些在Web中主动搜索信息并将其自动索引的Web网站,其索引内容存储于可供检索的大型数据库中。搜索引擎建立的索引与目录服务不同,前者搜集网页上的单词,
后者搜集网页作者简短的特定描述内容。许多搜索引擎索引它搜到的每张网页的每一个单词,而另一些搜索引擎则可能只索引网页的前二百个至五百个单词。以网站管理员的角度来讲,搜索引擎就是一套用于检索的软件;而从普通用户的角度来讲,搜索引擎就是提供查询、搜索的网站,或称查询站点、导航站点,即因特网上具有检索功能的网页的总称。目前网上中文检索引擎在检索信息的准确性、功能完备性以及信息网络度等方面均存在较大差异。
3-2-1搜索引擎的类型
搜索引擎依其检索方式可以分为两种基本类型:一种是全文检索搜索引擎,比如Altavista(http://www.altavista.com)、Excite(http://www.excite.com,中文版为http://Chinese.excite.com);另一种是目录式分类搜索引擎,比如Yahoo(http://www.Yahoo,com,中文版为http://gbchinese.yahoo.com)、常青藤(http://www.tonghua.com.cn)。
全文搜索引擎和目录式分类搜索引擎都提供了一个文字输入框和按钮。检索者可以在文字输入框中键入要检索的字、词或短语,再点击按钮,搜索引擎便会自动搜索,并将检索结果传回给检索者。按钮的名称,有不同的叫法,有“开始”、“查找”、“搜索”、“查询”、“Start”、“Search”、“Go”、“Find”、“Getit”、“Submit”等称呼。全文搜索引擎能把网站的每一页都抓进去,能够对每个网站的每篇文章的每个词进行搜索。全文搜索引擎所检索到的结果,不是网站名、网址和内容提要,而是与在输入框中所键入的关键词相关的一个个网页的地址,和一小段文字。在这段文字中,也许没有所键入的那个关键词,但在该网页中一定有所键入的那个关键词,或者相关的词汇。当遇到一个网站时,目录式分类搜索引擎并不像全文搜索引擎那样,将网站上的全部信息都抓进去,而是首先把该网站划归来某个类目,再记录一些摘要,对该网站作概述性介绍。目录式分类搜索引擎所检索到的结果是与在输入框中所键入的关键词相关的站名、网址和内容提要。
3-2-1 怎样使用搜索引擎
如果要检索一个一般性(或综合性)的题目,不妨试一下像Yahoo这一类的目录式分类搜索引擎,准会意外地发现许多相关的网站;而要检索一个有关某个特定的(或不太清楚