信息存储与检索复习资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.信息资源基本特征:(P4)

(1)共享性:这是信息资源区别于物质资源的根本属性之一,信息资源可以为众多使用者享有

(2)时效性:过时的信息可能分文不值

(3)智能型:是人类脑力劳动的产物,传播的是人的知识与智慧

(4)无限性与有限性并存:信息资源呈现又不枯竭的特点,但在一定条件下,相对于特定需求来说是有限的

(5)增值性:对信息资源的投入和使用,不但可以使自然资源、人力资源、资本资源增值,同时信息资源可以一次投入、多次开发利用,并不断产生新的信息使其自身增值

2.信息资源划分为纸质文献型信息资源和电子型信息资源两大类(P6)

3.按照网络信息资源的表现形式将网络信息资源分为:电子图书、电子期刊、电子报纸(P10)

4.根据存储介质及存储技术,现代信息存储可以划分为以下类型:(1)信息印刷存储(2)信息微缩存储(3)信息磁存储(4)半导体存储(5)光盘存储(P34)

5.信息检索模型和信息浏览模型:(P41)

信息检索模型信息浏览模型

基于文档内容的检索

模型基于文档结构的检索

模型

平面浏览模

目录导航模

网状结构模

布尔逻辑模型概率

统计

模型

向量

空间

模型

并列链表

模型

层次邻接

模型

6.信息存储与检索类型按查询信息的特征划分:(P44)

(1)书目存取:利用文献存取系统,从一个特定的书目集合中查找热定用户所需的特定主题、特定区域、特定时间文献的程序与方法

(2)数据存取:以查询各类物质与材料的特性、参数、常数、价格、统计数据等数值信息为主要对象的信息存取

(3)事实存取:以客观事实为对象的信息存取活动

(4)全文存取:利用计算机化的全文数据库,以机器可读的字符代码形式或文献页面扫描图像形式存储文献正文内容,以便于用户从任意字、词、句、段落等为存取点查询的全文信息的活动(5)图像存取:在基于文本式的检索基础上增加了基于内容的图像存取

(6)多媒体信息存取:分为基于文本方式的多媒体信息存取和基于内容特征的多媒体信息存取

7.索引款目一般由索引标题词、说明语和地址参照项组成,而简单的索引款目只有索引标题词和地址参照项组成(P50)

索引标题词:亦称款目、索引键、索引标题等,一般处于索引款目中最醒目的位置,是索引款目的核心,也是信息资源外部特征与内容的标志

说明语:亦称上下文或修饰语,用来说明、解释、限定索引标题词含义的辅助项目,说明语可用来区别同一索引标题词的不同含义

地址参照项:位于索引标题词和说明语之后,索引地址所指明的是索引标题词的出处

8.全文检索系统的开发包括选择数据、建立全文数据库和实现文本检索等功能(P70)

9.全面智能信息检索系统包括知识库、数据库、文本处理部分和检索推理机及人机接口(P75)

10.构造提问检索式的基本要素是检索词、布尔逻辑算符、位置逻辑算符和截词算符(P78)

布尔逻辑算符:现代计算机信息检索系统多采用这种方式,用户利用逻辑算法构造检索式可以将一些具有简单概念的检索词组配成为一个具有复杂概念的检索式,用以表达用户的检索需求位置逻辑算符:为了弥补逻辑算符的不足,规定了一些位置算符,主要用于全文数据库查询

截词算符:只在检索词的某个局部截断,利用检索词的词干或不完整的词形加上截词符号所进行的检索11.(简答题)信息检索步骤:(P90)

(1)分析检索课题,明确检索需求。任何检索活动开始之前,都必须认真分析检索课题的学科专业属性、主题概念和用户检索的具体目标、文献资源的语种类型与时间界限等

(2)制定检索策略。科学正确的主题分析是正确选用数据库、检索词和各类算符的先决条件,它决定着检索策略的质量与检索效果

(3)选择检索系统与数据库。选择检索系统与数据库必须综合考虑检索系统的特点、学科范围、文献类型、数据库特点、时间限定词以及所提供的检索路径、功能与服务形式等 (4)确定检索词和检索途径,编制逻辑检索式。

(5)检索策略的调整。检索策略初步拟定以后,还需要根据预检情况进行调整 12.(简答题)计算机存取系统结构 信息源 用户

13.(简答题)列出国内外存取系统(P 140) 国外联机存取系统:(1)DIALOG 系统 (2)STN 系统 (3)OCLC FirstSearch 国内联机存取系统:(1)万方数据资源统一服务系统 (2)CNKI 数据资源系统 (3)维普数据资讯系统

14.(简答题)DIALOG 系统基本索引字段的后缀和检索示例(P 148)

字段名 后缀代码

示例 功能说明

题名 /ti Computer/ti 查找题名字段中含有检索词Computer 的记录 叙词 /de Economics/de 查找叙词字段中含有检索词Economics 的所有记录 标引词 /id Content-based database/id 查找标题词字段含有检索词Content-based database 的所有记录

文摘

/ab

Information retrieval/ab 查找文摘字段中含有检索词Information retrieval 的所有记录

15.(简答题)DIALOG 系统常见辅助索引字段的前缀和检索示例(P 148) 字段名 前缀代码 示例 功能说明

作者 au= au=johnson 查找作者字段为johnson 的所有记录 公司名称 co= co=ford motor

查找公司名称字段为ford motor 的所有记录

团体作者 cs= Cs=Harvard and

medicine 查找团体作者为=Harvard and medicine 的所有记录

文献类型 dt= dt=review 查找文献类型为review 的所有记录 语种 la= la=Chinese 查找登记语种为Chinese 的所有记录 出版年 py= py=2000 查找出版年是2000年的所有记录

更新日期

ud=

ud=990123

查找更新日期是1999年1月23日的所有记录

15.(简答题)网络信息检索的一般方法(P 191)

(1)浏览检索。偶然发现信息,这是Internet 中检索信息的原始方法。

(2)通过资源指南(Resource Guide )来查找相应的信息。是专业人员利用自身对网络信息资源的产生、传递与利用机制的广泛了解,和对网络信息资源分布状况的熟悉,以及对各种网络信息资源的采集、组织、评价、过滤、控制、检索等手段的全面把握而开发出的可供浏览和检索的“书目之书目”。 (3)利用网络信息检索工具。利用WWW 、FTP 等性能优越的信息查询工具。

(4)RSS 订阅。是站定用来和其他站点之间共享信息的一种简易方式,通常被用于新闻和其他按顺序排列的网站。

(5)使用搜索软件。

(6)充分利用E-mail 获取信息资源。通过网络传递到用户的E-mail 信箱中。 16.(简答题)搜索引擎的构成(P 194)

搜索引擎有搜索器、索引器、检索器和用户接口4部分组成

搜索器:又称为Robot 、Spider 、Webcrawler 或Worm 。搜索器的功能是在互联网上漫游、发现和搜集信息。

索引器:又称为索引库或数据库。它的功能是认识理解搜索器所搜索的信息,从中抽取出索引项,用于

信息源 输入子系统

处理子系统

传输子系统

存储子系统

控制

子系

输出子系统

相关文档
最新文档