信息存储与检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课件第一章

1 纸质文献资源的存储与组织的4个基本要素:信息内容、载体材料、记录符号和记录方式

2 零次文献、一次文献、二次文献、三次文献的区分(课本P23)

零次文献:尚未经过系统整理形成正式文献的零散资料,包括草稿、记录和谈话等。它与一次文献的重大区别在于前者没有形成正式文献,没有正式发表。

一次文献:作者最初发表的原始文献。主要类型有期刊论文、专利文献、科技报告、会议录、学位论文等等,这些文献具有创新性、实用性和学术性等明显特征,是科技查新工作中进行文献对比分析的主要依据。

二次文献:对一次文献进行加工整理后的产物,用做文献检索工具。它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储文学类型,如书目、索引、文摘等都是二次文献。

三次文献:在运用一次文献成果并借助二次文献检索的基础上,用科学的研究方法,对一次文献进行综合分析、比较研究,从而揭示某种规律性认识的文献类型。如综述、述评、百科全书等。

从零次文献、一次文献、二次文献到三次文献,是一个由分散到集中,由无序到有序,由博而精的对知识信息进行不同层次的加工过程。它们所含信息的质和量是不同的,对于改善人们的知识结构所起到的作用也不同。

零次和一次文献是最基本的信息源,是文献信息检索和利用的主要对象;二次文献是一次文献的集中提炼和有序化,它是文献信息检索的工具;三次文献是把分散的零次文献、一次文献、二次文献,按照专题或知识的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,它既是文献信息检索和利用的对象,又可作为检索文献信息的工具。

3 (课件第二章)信息存储与检索定义

信息存储与检索是信息检索的全称形式或广义的信息检索,又称为信息存取,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与活动。

广义的信息检索包括信息的存储和检索两个过程。全称又叫“信息存储与检索”。信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。而信息检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。

狭义的信息检索则仅指该过程的后半部分,即从某一信息集合中找出所需的信息的过程,相当于人们通常所说的信息查询。

4 信息检索方法

1. 常规法(工具法),可分为顺查法、倒查法、抽查法;

顺查法:即由远及近,如对于发明创造或研究成果从最初的年代按时间先后顺序,往近查找;倒查法:即由近及远,如用于查找新课题;

抽查法:利用学科发展的特点,针对该学科兴旺发展时期以及研究处于领先的国家地区;2. 追溯法:当查到一篇参考价值较大的新文献时,以文献后面附的参考文献为线索,由近及远,进行逐一追踪;

3. 综合法:又称为分段法或循环法,将常规法和追溯法相结合;

5 信息检索语言的类型

按照文献信息的特征可分为:描述信息内容特征和描述信息的外部特征的两大类语言:

描述信息内容特征的检索语言有:分类语言和主题语言2种

1.分类语言

分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。

2.主题语言主题语言又可分为:标题词、单元词、叙词、关键词

描述信息的外部特征的检索语言主要是指文献的篇名(书名、刊名、篇名)、作者姓名、出版者、报告号、专利号、文献类型、出版年份等。

6 信息检索的类型(按照执行主体、对象和目标)

信息检索按执行主体划分主要有:手工检索、机械检索和计算机检索

信息检索按对象和目标划分主要有:事实检索、数据检索、文献检索。文献检索是信息检索的核心部分,就是从大量的文献集合中查找出符合特定需要的相关文献的过程。文献检索又可以分为图书检索、期刊检索、专利检索、标准检索、学位论文检索等;事实检索是指用户为了确定某个事件或事实发生的时间、地点和过程等方面的信息而进行的检索;数据检索是指用户利用某些检索工具去查找某个确定性的数值型数据而进行的检索。它的目的是为了查找某些确定性的数据,而且这种数据是数值型的。

7 几大著名的索引:

国外著名的四大索引包括:美国的《工程索引》(Ei)、《科学引文索引》(SCI)、《科技会议录索引》(ISTP)、《科学评论索引》(ISR)。

其他《社会科学引文索引》 SSCI、《科学文摘》SA及其对应的INSPEC存取系统。

8 提问检索式及其构造

提问检索式亦称检索式(项)或检索提问表达,它是一个直接面对数据库或检索系统的完整的检索条件表达式,是要求系统执行的检索语句。最简单的检索式由一个检索词和一个字段名(字段标识)构成。

编写提问检索式主要使用布尔逻辑算符、字段限定符、位置逻辑算符及截词符等,根据检索词之间的关系把若干检索词连接起来,以准确地表达检索提问的内容。检索提问式的构造:句子切分词汇剔除概念替换概念限定与补充组合式检索式

一般的检索提问式:检索词+字段限定符

9 关系算符——布尔逻辑算符、字段限定符、位置算符、截词算符

布尔逻辑算符

逻辑“与”(AND 或 *) 主要用于交叉概念或限定关系概念之间的组配。

逻辑“或”(OR 或 +) 主要用于并列关系的概念组配。

逻辑“非”(NOT 或 -) 主要用于排斥与选择关系的组配。

布尔逻辑算符执行的优先顺序为NOT、AND、OR。

检索字段限定符

基本索引字段的限定检索。为了指定在基本索引的哪个或哪几个字段中检索,可在检索词或检索式后面加上一斜杠“/”,再加上所需限定字段标识。一般将加有“/”线的字段标识称为后缀代码(简称后缀)。

/TI:题名 /AB:文摘 /DE:叙词 /ID:自由标引词 /NT:注释 /SH:类目标题

辅助索引字段的限定检索。为了指定在辅助索引字段中进行限定检索,可在该检索项(词)的前面加上字段标识与一个等号“=”,通常将这种字段标识符称为前缀代码(简称前缀)。AU=author(著者) CS=corporate source(著者所属机构) DT=Document Type(文献类型)

JN=Journal Name (期刊名称) CO=Company(公司) CC=Classification Code(分类号)

SO =Source publication(来源出版物) LA=Language(语种) PY=Publication year(出版年份)

UD=Update(更新日期) SP=Conference sponsor(主持单位)

位置逻辑算符

(W)或( ) —With算符表示在检索结果中(W)算符两侧的检索词必须按此前后邻接的顺序排列,且两个检索词之间不允许有其他词或字母,但可留有空格或连字符。

(nw) —(nw)算符表示在此算符两侧的检索词之间允许插入n个实词或虚词,两个检索词的词序不可颠倒。

(N) —Near算符由(N)连接的检索词在记录中出现的顺序可以调换,但必须彼此相邻。(nN) —(nN)算符表示算符两侧的检索词(或检索项)之间允许插入n个词,且两个检索项的位置可以调换。

(F) —Field算符表示两侧的检索词必须同时出现在文献记录的同一字段中,如同一文摘或同一标题字段等,算符两侧的检索词次序不变,夹在其中的其他词数量不限。

在位置算符的前面加上NOT即可构成位置算符的逻辑(非)

截词检索算符

所谓截词检索算符,是指在检索词的某个局部截断,利用检索词的词干或不完整的词形加上截词符号所进行的检索。截词检索的主要形式是右截词,部分支持中

相关文档
最新文档