信息检索复习资料

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章

1、信息的定义:信息是客观世界中各种事物的变化和特征的最新反映以及经过传递后的再现。

2、按信息产生的先后和加工深度划分:一次信息、二次信息、三次信息

3、信息的特性:a普遍性、b存储性、c传递性、d共享性、e开发性、f价值的不定性

4、信息组织的理论基础:a关于知识组织的理论、b系统科学理论、c耗散结构理论、d协同论、e 突变理论、f信息字组织理论

5、信息组织的方法基础:a语言学、b逻辑学、c知识分类

6、知识的定义:广义知识是指人们通过学习、积累、发现、发明各种知识的总和,包括普通知识和专业知识。狭义知识是指知识经济研究的知识,通常是专业知识

7、知识的分类:按载体划分,可将知识分为隐性知识和显性知识

8、知识的特性:a智慧性、b客观性、c依附性、d不磨损性、e非遗传性、f增值性、g共享性

9、知识的组织方法(了解):a知识表示、b知识聚类、c知识分类、d知识重组、e知识编辑、f 知识获取、g知识存检、h知识布局、i知识监控

10、网络信息资源组织的环境与传统文献管理环境的不同主要表现:a网络环境下,信息组织工作的对象有了很大变化。b网络环境下,用户需求发生了很大的变化;c信息组织的技术环境有了很大的变化;d网络信息资源,主要是由用户通过终端的屏幕获得(p10)

11、搜索引擎的定义:搜索引擎主要指利用自动搜索技术软件,对Internet网络资源进行收集、组织并提供检索服务的的一类信息服务系统。

12、元数据搜索引擎的定义:元数据搜索引擎又称集合式搜索引擎,他将多个搜索引擎集成在一起,,并提供一个统一的检索界面

13、元数据定义及常用的两个标准P19

元数据是关于数据的数据,是用于提供某种资源的相关信息的结构化数据,是对数据进行组织和处理的基础,是传统的书目方法在网络信息组织与管理中的发展。

常用的几个个标准:a、MARC(机读目录格式);b、DC(都柏林核心);c、PICS(internet 内容挑选平台);d、CDF(频道定义格式);e、MCF(元数据内容框架);f、RDF(资源描述框架)14、数据库组织方法:是将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询,就可以找到信息线索,并通过信息线索直接连接相应的网络信息资源

15超维组织方法:是一种基于知识单元的新型信息组织方法,它借助于超文本技术实现

16、网络信息资源标记格式的几种标准:a、SGML b、HTML c、XML d、PDF

17、电子图书的定义及两个问题:电子图书又称e-book,它是利用计算机高容量的存储介质来存储图书信息的一种新型图书记载形式。

两个问题:数字资源版权问题和电子图书阅读问题

18、数字图书馆的定义和基本类型:以统一的标准和规范为基础,以数字化得各种信息为底层,以分布式海量资源库群为支撑,以智能检索技术为手段,以电子商务为管理模式,以宽带高速网络为传输通道,将丰富多彩的多媒体信息传递到千家万户

基本类型:a资源服务型;b、服务研究型、c联合建设型

第二章网络信息资源存储

1、信息资源存储的意义和作用:意义a、有利于增大信息资源的拥有量;b、有利于集中管理信息资源;c、有利于开发高层次的信息资源;d、有利于充分利用信息资源,提高管理工作的效率

作用:a、方便检索;b、延长寿命;c、利于共享;d、方便管理

2、信息资源存储的主要类型:a、人脑载体存储;b、语言载体存储;c、文字载体存储;d书刊载体存储;e、电子载体存储

3、信息资源存储的主要技术:纸张印刷存储技术、缩微存储技术、声像存储技术、计算机存储技术、光盘存储技术

第三章信息检索基础

1、信息检索的实质原理:就是将用户的检索标识与信息集合中存储的信息标识进行比较和选择,

即进行匹配,完全匹配者作为检索结果被系统输出即检索命中,也就是说当查找的思路与存储的思路一致时,信息就会被查找出来,否则就查不出来。

2、信息检索的类型(重要):a、按检索的目标分书目检索和事实数据检索;b、按手段不同分为手工检索和计算机检索;c、按检索时间不同分为定题检索和回溯检索。

书目检索:以查找某一课题的相关文献为目标的检索,如某一主题某一时期。

事实数据检索:以某一特定的事实或数据为目标的检索;如:某一人物的资料。

手工检索:是检索者与检索工具直接对话。他依靠检索者手翻、眼看、脑子判断而进行,不需要借助任何的辅助设备,特点:方便、灵活、判别直观、可随时修改、查准率高

计算机检索:利用计算机通过各种数据库查找所需信息,检索过程是由人操作计算机完成的,匹配是由计算机进行的

定题检索:指根据用户的需要,预先将制定好的检索策略存入检索系统中,定期对检索系统的信息进行查询,把检索结果及时提供给有关用户,可以查出最新相关信息,具有连续性,新颖性

回溯检索:根据用户需求,检索系统的信息进行全面的检索,将检索结果一次性提供给用户,具有一次性,广泛性的特点、

3检索语言的定义:是应文献信息的加工、存储和检索的共同需要而发展起来的专门语言,它是表达概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。

4、检索语言的类型:a、按语言的结构原理划分为分类语言和主题语言;b、按语言标识的组配方式分为先组式检索语言和后组式检索语言

5、信息检索系统的4个基本要素:a、检索文档;b、技术设备;c、语言工具;d、其他人员

检索文档:是标有检索标识的信息集合;技术设备:是能从存储信息及其标识以及实现存储和检索操作的各种技术设备;语言工具:指检索语言、标引规则、输入和输出标准等;其他人员:包括信息加工标识人员、录入人员、检索人员、系统管理维护人员等

6信息检索的类型P64(重要):目录、题录、文摘、索引。

目录:是一批相关文献的著录集合,是以报道文献的出版信息为主要功能的工具;题录:是将图书、报刊等文献中论文的篇目按照一定的排检索方法编排而成的,供人们查找篇目出处的工具,按论文的片名顺序排列,具有大、全、快的特点。著录项包括篇名、著者、来源出处。文摘:是以精炼的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具,文摘可以分为指示性、报道性、和评论性3中类型;索引:是对一组信息集合的系统化的指引,一般只起指引特定信息内容及其存储地址的作用,7、评价检索系统的标准:检索的方便性、收录的全面性、检索的效率、报道及时性

检索的方便性由多方面因素决定,如信息的编排组织是否科学合理,索引系统是否完备、索引深度是否适中,标识的专指度是否足够等。

收录的全面性:指它收录的文献信息是否全面,有3个衡量指标;覆盖面、摘贮率、报道数

检索的效率:查全率、查准率2个衡量指标。查全率指从检索系统检出的有关某课题的文献信息数据与检索系统中实际的该题有关的文献信息总量之比率。查准率是指从检索系统检出的有关某课题文献信息数量与检出的文献信息总量之比率。

报道及时性:是指它所报到新出现文献信息的速度一般用时差来衡量,时差指文献信息从其发表到检索系统提供给用户的这段时间间隔

8、信息检索的基本程序;a.分析研究课题,明确检索要求b、选择检索工具或检索系统c、确定检索途径和检索策略d、选择检索方法e、索取原始文献(例如专利文献,标准文献和学术论文)9、描述信息检索的基本方法:a顺差法:指按照时间的顺序由远及近的利用检索进行文献信息检索的方法,特点:漏检率误检率低,但是工作量大b、倒差法:由近及远,从新到旧逆着时间的顺序利用检索工具进行文献信息检索的方法c、抽查法:针对检索课题的特点选择有关该课题的文献信息最可能出现或最多出现的时段利用检索工具进行重点检索的方法d、追溯法:指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献进行逐一的追溯查找“引文”的一种最简单的扩大情况来源的方法e、综合法:又称循环法,把上述方法加以综合运用的方法,既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段的交替使用几种方法

相关文档
最新文档