常用网上信息检索方法综述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
常用网上信息检索方法综述
学生姓名:常**
专业:信号与信息处理学号:************ 教师:黄文清老师
摘要
因特网的普及和发展给人们带来了空前丰富的信息资源,越来越多的用户利用网络阅读和查询所需信息,网上阅读和检索已成为人们获取信息的重要途径。如何认识和利用浩瀚如海的网络信息,快速查找并准确获取所需资源,需要掌握一定的网络检索方法和技巧以便捷地对互联网进行检索查询,提高搜索的命中率。
关键词:因特网;信息资源;检索方法
ABSTRACT
The popularity of the Internet and development brings unprecedented rich information resources, more and more users use the network reading and required information query, online reading and retrieval has become an important way of access to information. Such as how to understand and use the vast sea of network information, quick search and accurately obtain the resources needed, need to master certain network retrieval methods and techniques to conveniently Internet search queries, improve search hits.
Keywords: Internet, Information resources, Retrieval methods
1. 因特网信息资源检索工具
因特网上蕴藏着极其丰富的信息资源,为了帮助用户准确、及时、方便地查找到广泛分布、存储于这一巨大信息宝库中的特定的资源,网络工作者为各类网络信息资源均研制了相应的检索工具,20 世纪90 年代中期起又出现了检索Web 信息资源的搜索引擎技术,尽管因特网上的信息资源浩如烟海,且没有全面组织、没有综合索引,但借助相应的检索工具,仍然可以“取之有道”。网络信息检索工具是一种对分散、无序的网络信息资源进行有效控制并提供检索功能的工具,具有数据组织机制和信息检索机制,它对庞大的网络信息资源进行收集、记录、标引,形成索引数据库,提供检索功能,指向相关网站或其中的相关资源。网络用户借助于这种检索工具,可以较为容易、迅速和比较准确地寻找到自己需要的信息。网络检索工具的开发成了近年来网络发展的热点,各种品牌的检索工具不胜枚举,并在此基础上形成了网络信息资源检索体系。网络检索工具一般由信息搜索软件、数据库和检索软件组成。
2. 因特网信息资源检索
在网络信息世界这个浩瀚、动荡的信息海洋中,准确、及时、有效地找到、获取与自身信息相关、切题、适用的信息对所有网络用户来说都十分重要的,同时也非常具有挑战意味。
要在网上获取信息,用户需先找到提供信息源的服务器。所以,应首先以找到各个服务器在网上的地址(URL)为目标,然后通过该地址去访问服务器提供的信息。一般检索方法可有以下几种:浏览、通过“链接”查找信息、通过网络资源指南来查找信息、利用搜索引擎查找信息。
3. 网络信息检索技术
目前常用的网络检索方法有两种:分类检索、关键词检索。
3.1 分类检索
分类检索是利用分类导航,点击要查询的类目名称,逐级深入到某个细类进行查找,直到满意为止。这种检索比较直观,但检索速度慢。当要查找某类信息,
又找不到合适的关键词时,可以采用这种方法逐步深化检索。
3.2 关键词检索
关键词检索就是在查询框中输入检索的关键词、短语或检索式,然后单击“查询”执行检索。这是网络检索最常用的方法,检索中还采用以下检索技术:
①布尔逻辑检索:与、或、非;
②截词检索:通常允许右截断;
③位置检索:也称全文检索或相邻检索,常用near,with,adj等算符;
④限制检索:采用“+”、“-”限定检索词是否可以出现在检索结果中。还可以限制检索信息的类型、年代、语种等;
⑤字段检索:常用的有title,domain,host,anchor,image,URL,link,newsgroups,E-mail 等,限定检索词出现的部位。例如输入“title:清华大学”,可以查出网页标题中带有清华大学的网页,输入“domain:”可以查到所以中国教育网的网页,输入“URL:mil”或者“u:mil”可以查到网址中带有mil的网页;
⑥短语检索:大多数搜索引擎都支持短语检索。当检索词为短语且希望精确匹配时,在输入的短语两端加上引号即可;
⑦概念检索:当用户输入一个检索词后,搜索引擎能够对该词及其同义词进行检索,把表达同一个概念的网页都检索出来。
4. 网络信息检索策略
网络环境下的信息检索与传统信息环境下的检索有很大不同,网络信息检索所具有的多样性、灵活性远远超出了传统的信息检索。虽然网络信息资源的范围广泛、数量巨大,网络检索工具及检索方法也是纷繁众多,但用任何单一的方式去迅速、准确并相对全面完整地找到相应资源仍不是很容易。表面看来似乎任何人都可进行检索并能得到一些检索结果,但多数人仍会对检索结果感到不满意或是感觉与自己最初的检索目标不相符合或差距太远。因此,在从事网络信息检索时有必要树立一些有别于传统信息检索的观念和认识。如某些检索专家指出:不要完全相信任何一个搜索引擎,没有任何一个搜索引擎能提供绝对完整、全面的检索。每个搜索引擎均有其一定的收录范围和规模、数量,索引方式也不相同。
要想获得较全面的检索结果,必须尽可能多的采用若干搜索引擎。再如:对于网络信息检索来说,不存在完善的检索策略。某些可能使某类网络检索更有效、更精确的检索措施或安排在应用于另一类检索时可能完全不奏效。
4.1 明确检索目的和要求,确定查询策略
不同目的的检索应使用不同的查询策略,不同的查询策略会产生不同的检索结果。明确了检索的目标和要求,不仅能帮助我们确定所需要的信息类型、查询方式、查询范围、查询时间及采用何种限制条件,而且能使我们更好地理解查询结果,并准确地捕捉到它。
4.2 选择检索工具
根据检索要求选择合适的检索工具。选择网络检索工具是取得检索成功的关键一步,选择正确,事半功倍;否则,很难取得满意的结果。选择合适的检索工具主要从网络检索工具的类型、收录范围、支持的检索技术等综合考虑。为正确地选择检索工具,必须熟悉各类网络检索工具的特点、功能,并明确所需信息的类型,可能存在形式(是Web,FTP,Usenet)等,从而选择相应类型的工具。
选择搜索引擎时,最好使用专门性搜索引擎。而且为了获得较好的查全率,应当同时选用几种主要的搜索引擎进行检索。当检索的主题范围较广或一般性浏览时,可以使用目录式检索工具;若只检索新闻组,可以使用专门查找新闻组的检索工具;若检索组织机构信息、查询较具体或特定的信息时,可以使用索引式检索工具;若查找较冷僻的站点或较稀缺的、不明的信息,可使用元搜索引擎等。
4.3 构造检索式
构造检索式就是把检索词用选定的搜索引擎所支持的各种检索算符连接起来,它是检索问题的最终表现,检索式的质量直接影响检索结果。首先要使用合适的检索词,尽量选用专指性较强的词,避免使用普通、泛指的词。确定了检索词后,就要将检索词使用检索工具所支持的检索算符、允许使用的检索字段标识符等组配起来。各个不同的网络检索工具支持的检索技术不同,检索时应参看各搜索引擎的检索说明。
4.4 优化检索结果
(1)提高查准率的方法