信息检索考试资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、名词解释
信息检索:从广义上讲是指信息按一定的方式组织和储存起来,并根据用户的特定需要找出所需信息的过程。狭义的信息检索仅指信息的查找过程,就是根据信息用户的检索需求,利用已有的检索工具或数据库,从中找出特定信息的过程。(P11)
数据检索:是以数值或图表形式表示的数据为检索对象的信息检索,又称数值检索。
事实检索:是以文献中抽取的事项为检索内容的信息检索,又称事项检索。(P11)
信息检索系统:是为了满足各种信息需求而建立的一整套文献信息的搜集、加工、储存和检索使用的系统。它包括提供手工检索使用的目录、题录、文摘、索引等检索工具,也包括计算机检索系统。(P12)
信息检索语言:是根据检索需要而编制的用来描述文献的内容特征和外表特征的一种人工语言,是从自然语言中精选出来并加以规范化的一套词汇、符号。(P14)
分类语言:分类语言用分类号表达文献概念,将各种概念按学科进行分类和排列,以学科分类为基础,运用概念划分的方法,将各种概念按一系列标准和逻辑规则层层划分,形成一个严密而有序的直线式知识类目等级体系,每一类目分别以不同的符号(字母、数字或字母数字相结合)作标志,每个符号都表达了特定的知识概念。(P14)
主题语言:主题语言是一种描述语言,是用自然语言中的词、词语来描述文献内容的特征,即文献所论述或研究的事物概念。(P14)
目录:目录是书籍正文前所载的目次,是揭示和报道图书的工具,目录是记录图书的书名、著者、出版与收藏等情况,按照一定的次序编排而成,为反映馆范、指导阅读、检索图书的工具。在计算机应用中,目录的发展成了“文件夹”。
报道性文摘:报道性文摘是以原文为基础浓缩写成的文摘,主要报道原文的研究对象、目的、性质、手段、条件、方法、结论等各种资料,不带任何评论。(P13)
指示性文摘:是原文的内容梗概,指出原文的研究范围、目的、方法和主要结论等,以不使读者对原文内容范围做出错误判断为目的,为帮助读者判断是否需要阅读原始文献提供依据。一般不能代替原文。
查准率:是衡量某一检索系统的信号噪声比的一种指标,即检出的相关文献与检出的全部文献的百分比。普遍表示为:查准率=(检索出的相关信息量/检索出的信息总量)x100%
查全率:是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。普遍表示为:查全率=(检索出的相关信息量/系统中的相关信息总量)x100%
二、简答题
1、索引的结构?索引标目(或称为索引标题、索引词),必备
说明项(或称为索引上下文、修饰语),可选
参照项(或称为信息地址),必备。
2、文摘的主要内容包括?
文摘是索引的扩展,分为报道性文摘和指示性文摘和评论性文摘三类。文摘是简明、确切地记述原文献重要内容的语义连贯的短文。
3、信息检索技术主要包括:布尔逻辑检索、词间位置检索、截词检索、限定字段检索
布尔逻辑检索包括:与AND(*) 或OR(+) 非NOT(-)
截词检索按截词位置不同可分为:前方截词、后截词、中间截词
4、信息检索的一般方法包括:工具法(根据时间范围又分为:顺查法、倒查法、抽查法)、追溯
法(从参考文献角度进行检索:由近及远追溯法、由远及近追溯法)、综合法(也称综合法,这是上述追溯法和常用法的结合)
5、信息检索的途径主要包括(1)分类途径(2)主题途径(3)著者途径(P28)
6、常用的检索策略有:
(1)积木型:把用户的检索请求或检索课题剖析成若干个不同的概念面,先分别对这几个概念面进行检索,并在每个概念面中尽可能全和多的列举相关词、同义词、近义词,并用布尔算符“OR”连接成子检索式,然后再用合适的布尔算符把所有子检索式连接起来,构成一个总检索式,类似把各个积木块拼成图案。
(2)引文珠形增长:从已知的关于检索课题的少数几个专指词开始检索,以便至少检出一篇命中文献或一条相关信息,然后审阅这批文献或信息条目,从中选出一些新的相关检索词,补充到检索式中去。这些词加入到检索式中后,就能查出其他新的命中结果。不断重复上述过程,直到找不到其他适合包含于检索式的附加词为止,或者已经得到了数量适宜的命中结果。
(3)逐次分馏:先确定一个相当大的、范围较广的检索初始对象集合,然后提高检索的专指度,得到一个较小的命中结果;继续提高检索式的专指度,一步一步缩小命中结果集合,直到得到数量适宜、用户满意的结果。整个检索过程就像剥竹笋一样,逐步逼近核心部分。
(4)最专指面优先策略:指在检索时,首先选择最专指的概念组面进行检索,如果检索命中的文献相当少,那么其他概念组面就不再加到检索提问式中去,如果检索命中的文献较多,就把其他概念组面加到检索提问式中,以提高查准率。
三、问答题
1、结合CNKI和超星图书馆的使用,具体谈谈缩检和扩检的调整方法。
缩检: 1.限制条件,如字段、时间、类型等:尤其改变检索字段,如全文→关键词→摘要→题名
2.选择合适的检索词,尽量使用专指词、特定概念或非常用词,避免普通词、泛指概念
3.构造恰当的检索提问:利用and、or、not等逻辑符、匹配方式等——增加and运算,
减少or运算,选择精确匹配方式等利用“二次检索” 4.增加适当的检索词
扩检:1.限制条件,如字段、时间、类型等:尤其改变检索字段,如题名→摘要→关键词→全文
2.检索词:选全同义词、近义词(用or连接);使用规范主题词(有词表);降低检索
词的专指度,选一些上位词或相关词 3.构造恰当的检索提问:利用and、or、not等
逻辑符、匹配方式等——减少and运算,增加or运算,选择模糊匹配方式等 4.试检其它同类数据库 5.减少不必要的检索词
2、CNKI提出的检索途径和功能有哪些?
检索功能有:
(1)学科分类导航检索: 该检索系统为用户提供了详细的导航内容,最大范围的选择空间。检索时只需知道检索课题的所属学科专辑,不需要输入检索词,直接点击相关专辑的相应类目就可以完成检索操作。主要针对一些对做大类检索以及不熟悉检索语法的用户。
(2)初级检索。一次只输入一个检索词,查询特点是方便快捷,但查准率较低。检索途径可选择主题、篇名、关键词、摘要、作者、第一作者等。要取得更为精确的结果,可在原有的基础上进行二次检索,二次检索可重复进行。二次检索的检索词和检索方式可与上次不同。主要针对一些检索知识不大熟悉的读者。
(3)高级检索。必须选择二个以上(最多可选五个)检索字段进行逻辑组合共同完成检索,检索途径可选择主题、篇名、关键词、摘要等,检索词之间的逻辑关系(并且、或者、不包含、同句、同段)也可以按照检索需要进行设定。特点是检索条件多,检索速度快,查准率高。
主要针对熟悉多条件组合查询或SQL语句的用户
(4)专业检索。专业检索比高级检索功能更强大,可以直接在检索框中输入检索表达式,检索词之间支持布尔逻辑运算,采用的逻辑算符为:AND、OR和NOT,必须通过字段之间设置的逻辑选项按钮来选择。专业检索主要针对长期从事图书情报检索、熟练掌握检索技术的专业检索人员。
(5)辅助检索功能:1)、在结果中检索 2)、相似词检索