现代信息检索课程论文
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程论文
论文题目:略论网络信息的检索
课程名称:现代信息检索
课程式号:
学生姓名:
学生学号:
所在学院:电子工程与自动化学院
所在专业:光信息科学与技术
2011年11月14日引言
在现代的工作和学习当中,各类的信息检索是必不可少的,以前人们查询信息是通过期刊、杂志、报纸、图书等途径。但随着因特网的出现,特别是近年来的快速发展,对人类传统的信息组织检索和获取方法构成了很大的冲击,使得人们在世界范围内很方便地进行信息交流和资源共享。因此,如何能在因特网上较快地找到所需的专题信息是目前最困扰用户的难题。就此,来探讨一下检索方法。
检索步骤:
①弄清信息需求,明确检索目的, 确定大致的检索范围。
②明确所需的文献量。根据检索要求选择数据库,并确定检索途径。
③对用户提问进行概念分析,依据检索词表将分析出的主题概念转换成检索标识。
④运用布尔逻辑算符构造检索提问表达式。
⑤输入提问表达式, 由计算机对文档进行查找,检出相关文献。
⑥分析检索结果, 若不符合要求, 则对提问表达式进行修改, 并且重复第⑤步, 直到
满意为止。
1、信息需求
信息需求是人们索取情报信息的出发点,也是联机信息检索时选择数据库、确定检索策略以及评价检索效果的依据。不同类型的课题,其信息需求的范围和程度也不同。要正确的分析信息需求。
①明确检索课题内容涉及的主要学科范围,以便选择合适的数据库。
②分析检索课题的主要内容,用自然语言来表达这些内容要求。
③明确所需文献的语种、年代范围、类型、作者或其它外表特征,以便限定检索范围。
2、检索途径
根据用户的检索提问, 选择合适的检索途径。对某一特定的检索要求选择什么样的检索途径。决定于利用者对档案线索的掌握程度以及检索工具、检索系统的设置情况。对于手工检索来说, 检索途径的选择就是决定采用哪种检索工具进行检索, 可以是分类目录, 也可以是主题目录,可以是题名目录, 也可以是文号索引等等。而对计算机检索系统来说, 则包括对数据库的选择及检索项目的确定。检索项目包括待检数据库中各种规范化代码(如分类号、产品代码、国家或地区代码、机构名称代码等)以及表示主题概念的检索词。在计算机检索中, 检索词包括主题词和自由词, 一般总是优先选择主题词作为最基本的检索项目。因此, 主题检索途径是计算机检索的主要途径。
检索标识的选定
选择好检索途径后, 即可根据分类表或词表, 将表达用户提问的主题概念转换成检索标识。所选择的检索标识适当与否, 取决于对检索提问进行主题分析的正确性和全面性以及标引的准确性与专指性。
3、检索策略
网络信息检索策略即检索的基本思路,是根据检索要求选择便捷的方法、适当的工具、在适宜的地方查找需要的数据。检索策略是在分析课题内容的基础上,确定检索系统、检索文文件、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。检索策略考虑得是否周全,直接影响文献的查全率和查准率。
检索式的拟定
检索式是检索策略的具体表现形式, 它是对检索提问的逻辑表达, 也称检索提问表达式。根据检索课题的主题内容选定了检索标识后,就可以用布尔逻辑算符和一些检索指令, 将检索提问中各有关概念之间的关系表达为布尔检索式。检索式的拟定有一定的技巧, 其基本要求是
①应完整准确地反映出检索提问的主题内容;
②应遵守待检数据库的检索用词规则;
③应符合检索系统的功能及限制条件规定;
④应遵守概念组配原则, 避免越级组配;
⑤注意检索式的精练, 能化简的检索式应尽量化简。
检索的策略和技巧
①使用特定的词汇和专业术语;
②使用布尔逻辑和括号;
③使用双引号进行精确检索;
④使用加减号限定检索;
⑤尽量使用高级选项;
⑥细化查询。
检索效率
检索效率就是利用检索工具进行检索时产生的有效结果,它直接反映检索系统的性能。在信息检索中最理想的是数据库中收录的相关文献全被检索出来,即查全率和查准率都达到100%。
提高检索效率的措施:
①提高文献库的编辑质量,增大收录范围。
②提高标引质量,用词恰当,前后一致。
③提高索引语言的专指性。
④提高检索人员的工作水平和能力。
⑤调整查全率和查准率,使其达到最佳检索效果。
4、选择搜索引擎
“工欲善其事,必先利其器”。搜索引擎(Search Engine)是Internet上具有查询功能的网页的统称,它是一种利用网络自动搜索技术,对因特网各种资源进行标引,并为检索者提供检索的工具。
目前搜索引擎已多达数百种,如Web Search Engine(万维网搜索引擎)、Usenet Search Engine(新闻论坛搜索引擎)、Meta-Search Engine(元搜索引擎)等类型。通用的搜索引擎有百度、Google 等。
我们要熟练掌握搜索引擎的使用方法。如: Google 的基本搜索(+,-,OR),学会使用两个关键字进行复杂专题信息检索。检索复杂专题依靠单个关键词查准率很低,要提高查全检准率,需进行详细的主题分析,选择多个关键词构造检索式。其次,熟悉常用的辅助搜索方法: 通配符、大小写、句子、忽略字符以及强制搜索,并尽可能使用一些高级搜索语法,如Google 的site、link、inurl、allinurl、intitle等语法。
此外许多专题搜索引擎非常有用,专业搜索引擎又称垂直搜索引擎,是专为搜索高度相关的专业信息而设计的搜索引擎,它通过对网上某一领域的信息资源或行业的内容作了专业和深入的分析、挖掘后,精细分类、过滤筛选,信息定位更精准,虽内容量偏少,但能精确锁定内容。如视频搜索引擎Cblinkx、 Tvix等
选择什么方法、使用何种搜索引擎、利用哪些参考源去查找某类信息或数据是有一定规律可循的,而掌握网络检索规律的前提,是对搜索引擎和有关参考资源的认识和了解,而认识和了解搜索引擎和有关参考资源需要一定的检索经验的积累。
5、调整检索策略
在计算机检索过程中,常常会出现文献数据过多或过少的情况,此时检索人员应与用户进行分析,及时调整检索策略,通过增加检索项和运用布尔逻辑的组配,增加或缩小检索范围等,以达到增加或减少命中文献的目的。
一般来说, 需要进行回馈检索的课题有两种类型:一是未达到检索目标, 或用户又在原来检索的基础上提出了进一步的检索要求;二是由于构造检索策略不当所造成的检索失误。不管是哪种情况的回馈检索, 都需要对用户提问和检索结果进行进一步分析, 在原有的检索基础上扩大或缩小检索范围。对于需提高检全率的课题, 常用以下方法扩大检索范围:
①降低检索标识的专指度, 可从词表或检出文献中选一些上位词参加检索。
②删除检索式的某个组面调节检索网罗度。
③增加用逻辑和联结的相关检索词, 进行族性检索。
6、影响检索提问分析的因素:
①由于种种原因, 用户的检索提问往往不能准确全面地表达其真正的检索要求, 从而增加了检索提问分析的难度。主要表现在以下几方面:有些用户往往把提问局限于那些认为检索系统能够提供的信息范围内, 而不一定是他的全部需求。例如:有的用户对档案机构或检索系统提供档案信息的能力有所怀疑, 认为不能满足自己的要求;有的用户认为自己的时