2014年中国人民大学信息检索618考研真题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014年
一、简答题
1、评价信息检索效果的主要指标
由于检索效果的评价涉及许多问题,可以选择不同的角度、采用不同的评价方法。美国著名情报学家兰卡斯特提出,用户可以从质量、费用和时间三方面来评价检索系统。据美国学者克莱弗登的研究,评价信息检索效果的指标主要有六个:收录范围、查全率、查准率、响应时间、用户负担和输出形式。一般认为,查全率和查准率,误检率和漏检率以及响应时间是判定检索效果的主要指标。其他与检索效果相关的指标如检索系统的收录范围、结果输出形式、易用性、用户负担,以及在网络环境下发展起来的重复链接率、死链接率等,也会影响信息检索的效果。
(1)查全率和查准率
查全率和查准率现已成为评价检索效果最常用的两项关键指标。确定查全率和查准率最常用的方法是有名的2×2表。查全率指检出的相关文献信息量与检索系统中相关文献信息总量的比率,它反映出信息检索系统检出相关文献信息的能力。查准率指检出的相关文献信息量与检出文献信息总量的比率,它反映出信息检索系统的精确度,说明系统排除干扰,减少噪声的能力。虽然查全率与查准率能较好地反映出一个检索系统的检索效果,但是在实际操作过程中,这两个指标也存在一定的局限性:首先,在计算查全率时,一个检索系统中总共有多少相关文献(a + c)难以确切计算,而只能是大概估算;其次,在计算查准率时,用户对文献的相关性估计与系统的相关性判断不一定是完全吻合的,而且,不同的用户对相关文献的认识也可能不一致,存在着太多的主观成分和一些模糊概念。因此,用上述方法求得的查全率与查准率并不是绝对的,而只能是相对近似地描述检索效果。
(2)误检率和漏检率
误检率指误检(检出不相关)文献信息总量与检出文献信息总量的比率,是衡量信息检索系统误检程度的尺度,与查准率相对。漏检率指漏检相关文献信息量与检索系统中相关文献信息总量的比率,它与查全率相对应。漏检和误检不仅影响文献数据库功能的发挥和信息检索的效果,而且会降低文献数据库的利用率。
(3)响应时间
响应时间指在一次检索过程中,用户从开始向信息检索系统提问到系统输出检索结果的全部时间。响应时间的长短是评价检索系统效果的重要指标,直接反映着信息检索的速度。一般来说,响应时间越短,查全率和查准率越高,那么信息检索的效果就越好。响应时间在很大程度上依赖于检索手段和检索技术的进步。在手工检索阶段,响应时间受检索者主观因素的影响比较大,主要取决于检索者制定的检索策略的优劣,以及对检索工具的选择和对检索工具使用方法的熟悉程度,响应时间一般比较长。在计算机检索阶段,信息检索的响应时间大大缩短,主要由系统对信息处理速度决定,对于网络信息检索而言,用户所处的网络条件和利用的相关设备也在很大程度上影响着响应时间。随着智能检索在信息检索领域的发展,响应时间将会更大程度地依赖信息检索系统的处理速度和运行效率。
2、中国期刊全文数据库特点、检索方法
(1)中国期刊全文数据库的特点
《中国期刊全文数据库》(CJFD)由清华同方光盘股份有限公司、中国学术期刊(光盘版)电子杂志社和清华同方教育技术研究院联合承担,是我国第一个连续的大规模的集成化、多功能学术期刊全文检索系统,是中国知识基础设施工程CNKI中最重要的数据库之一。1999年6月,在原光盘数据库的基础上,正式开通了它的网络版。它是目前世界上最大的连续动态更新的中国期刊全文数据库。《中国期刊全文数据库》收集面广、内容丰富、信息量大,收录有国内8200中期刊全文,其中核心期刊80%左右,年新增文献达一百多万篇,覆盖了自然科学、工程技术、农业、哲学、医学、人文社会科学等各个领域。用户可以在线浏览、章节下载、整本下载、分页下载。数据库每日更新。
①检索方式:主要提供初级检索、高级检索和专业检索,以及期刊导航等。
②检索入口:该数据库检索入口多,检索项有:主题、篇名、关键词、摘要、作者、第一作者、单位、刊名、参考文献、全文、智能检索、年、期、基金、中图分类号、ISSN、统一刊号。检索范围有:全部期刊、EI 来源刊、SCI来源刊核心期刊等。该数据库检索功能强大,它的引文文献具有强大的引文检索源,通过输入不同的检索项目,可以完成引文的需求,为查找文献原文提供了重要工具,又是评价期刊论文质量的便利工具。它的知识关联功能通过引用文献,被引文献及相关文献的关联将全文文献与其引证文献连接起来,使相关的知识关联起来,形成知识链。
③输出形式:采用CAJ2Viewer全文浏览器或AcrobatReader 阅读全文。CAJ 具有OCR识别功能,可进行位图复制,位图区域进行识别转换后可再复制保存。这样可以把图像的文字识别成文本的格式,从而实现扫描文字的编辑修改。CAJ 浏览器支持简体、繁体、中英文对照、英文显示方式,用户还可以根据需要选择合适的阅读方式。
(2)中国期刊全文数据库的检索方法
①导航检索:该检索系统为用户提供了详细的导航内容,最大范围的选择空间。检索时只需知道检索课题的所属学科专辑,不需要输入检索词,直接点击相关专辑的相应类目就可以完成检索操作。适用于作大类检索以及不熟悉检索语法的用户。
②初级检索:一次只输入一个检索词,查询特点是方便快捷,但查准率较低。要取得更为精确的结果,可在原基础上进行二次检索,二次检索可重复进行,二次检索的检索词和检索方式可与上次不同。适用于一些简单查询和不熟悉多条件组合查询或SQL 语句查询的用户。初级检索通常包括以下步骤:1)登陆《中国期刊全文数据库》;2)选取检索途径;3)输入检索词;4)进行检索;5)检索结果的优化与处理;6)相似词显示;7)检索相关信息的链接
③高级检索:必须选择二个以上(最多可选五个)检索字段进行逻辑组合共同完成检索,逻辑组合关系包括“并且”(and) 、“或者”(or) 、“不包含”( not) 三种。利用高级检索系统能进行快速有效的组合查询,特点是检索条件多,检索速度快,查询结果冗余少、命中率高。对于命中率要求较高的查询,建议使用该检索系统。适用于熟悉多条件组合查询或SQL 语句的用户。该系统可组合检索项:最多有10个检索项,可以依次输入检索条件,然后选择与(and)、或(or)、非(not)操作,这样就可以进行快速准确的组合查询。检索结果的处理:检索的结果可以在线浏览,也可以下载。
④专业检索:专业检索比高级检索功能更强大,允许用户按自己需要组合逻辑表达式,进行更精确的检索,但需要检索人员根据系统的检索语法编制检索式进行检索。适合于熟练掌握检索技术的专业检索人