论简单检索与高级检索的检索方法
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
.
现代信息检索教
程
结课作业XX学院专业年级姓名学号
现代信息检索教程
简单检索
简单检索,检索的可选项少或者没有,输入查询词,就能快速得到结果。但检索的准确性较差,精度较低,得到的结果也较多,但是胜在操作简单。简单检索的原理主要有一下几种:
一、布尔检索
利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。例如,输入“文献”AND“检索”,表示查找文献容中既含有“文献”又含有“检索”词的文献。“文献”OR“检索”,表示查找文献容中含有“文献”或含有“检索”以及两词都
包含的文献。“文献”NOT“检索”,表示查找文献容中含有“文献”而不含有“检索”的那部分文献。
二、截词检索
截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型:
(1)后截断,前方一致。如:comput表示computer,computers,computing
等。
(2)前截断,后方一致。如:computer表示minicomputer,microcomputers 等。
(3)中截断,中间一致。如comput表示minicomputer,microcomputers等。
不同的系统所用的截词符也不同。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。
三、原文检索
“原文”是指数据库中的原始记录,原文检索即以原始记录中的检索词与检索词间特定位置关系为对象的运算。原文检索可以说是一种不依赖叙词表而直接使用自由词的检索方法。
原文检索可以弥补布尔逻辑检索、截词方法检索的一些不足,但是,原文检索的能力是有限的。从逻辑形式上看,它仅是更高级的布尔系统,因此存在着布尔逻辑本身的缺陷。
高级检索
在高级检索中,用户可以通过点选检索系统给定的检索算符对多词进行逻辑组配检索高级检索提供的检索框也较多,一般一个检索框可以输入一个词或一个词组,检索框最多控制在2~5个。
高级检索的一般步骤为:
1、选择检索围。
2、输入检索词。
3、确定检索词之间的逻辑关系。
4、进行检索。
5、进行二次检索。
以中国知网进行高级检索为例:
首先点击首页的高级检索,进入高级检索界面:
然后在左侧的文献分类目录选择文献容的种类(这里以“计算机然间及计算机应用为例):
然后选择文献的出版类型(这里以“期刊_特刊”为例):
然后输入容检索条件,如主题,词频等(这里以“Python语言开发”为例):
最后输入对检索容的控制条件,如发布时间,文献来源,作者,作者单位等等(这里以时间限制为例):
最后点击检索按钮,进行检索:检索结果如下:
结语:
相比简单检索,高级检索给出的结果数目更加的少,同时也更加精确。但是高级检索的操作也相对繁琐。在日常生活的应用中,想要搜索某一类文献时,如果只掌握有很少、很模糊的资料时,应该使用简单检索,这样可以得到的结果更多,不会错过有用的结果。而如果掌握有很详细的资料,那么久应该使用高级检索,这样得到的结果更加精确,也可以节省会多时间。
简单检索与高级检索互有优劣,而到底使用什么检索方式比较好还应该视具体情况而定。灵活的应用简单检索与高级检索才能事半功倍。