信息检索复习要点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。这种附着在各种载体上的记录统称为文献。
2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。
3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。信息是物质存在的方式、形式和运动规律的表征。人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。
4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。
5、信息资源的构成可从不同的层次和角度来划分:
一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技
报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。
二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次
文献。(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。例如词典、手册、百科全书、年鉴、各种教科书及综述等。
三、按信息的表现形式划分:(1)文献型信息源;(2)非文献型信息源。非文献型信息
源包括电子信息源、数值型信息源、声像型信息源、多媒体信息源以及实例与口头信息源。
6、信息出版类型:是指记录有知识的文献出版类型。
7、信息检索:是指将信息按一定的方式进行加工、整理、组织并存储起来,再根据信息用户的需要找出有关信息的过程。它的全过程又称为信息存储与检索。
8、信息检索的基本原理:对信息集合与需求集合的匹配与选择。
9、信息检索的基本方式可分为传统信息检索和现代信息检索。传统信息检索,简称“手检”;现代信息检索,简称“机检”。
10、信息检索的研究范围包括一切与信息存储与检索有关的系统、过程、理论和方法。
11、计算机信息检索系统根据内容不同可划分为:联机检索系统、光盘检索系统和网络检索系统。
12、检索工具按用途可分为两大类:指示型检索工具(二次文献)和提供具体信息的参考型检索工具(三次文献)。
13、检索工具按编著方式可分为:(1)目录型检索工具。目录主要报道实有的文献或收藏文献的情况,以一个完整的出版单位作为著录的基本单位。此类检索工具对于查找、索取原始文献具有重要作用;(2)题录型检索工具。题录是用来描述某一文献的外表特征并由一组著录项目构成的一条文献记录。题录实质上是一种不含文摘正文的文摘款目,在揭示文献内容的深度方面,题录比目录做得深入一些,但又比文摘款目浅;(3)文摘型检索工具。文摘是指对文献的内容简洁而又正确的摘录,供人们浏览和查用,使读者能以较少的时间和精力掌
握有关文献的基本内容而进行系统查找。文摘型检索工具是系统报道、积累和检索科技文献的主要工具;(4)索引型检索工具。包括内容检索和篇章检索。其主要特点是加工简单,报道量大。以快和全占有一定的优势。
14、每种检索工具大体上都是由编辑说明与使用凡例部分、分类表和主题词表部分、正文部分、索引部分、附录部分组成的。
15、检索语言,又称标引语言、索引语言,信息检索语言等,是根据检索需要而编制的一种人工语言。检索语言是信息检索与信息存储的一种约定语言。
16、检索语言是由词汇和语法组成的。
17、检索语言按其反应信息内外部特征的不同可分为:分类语言、主题语言、名称语言和代码语言四大类。
分类语言和主题语言是表示文献实质意义的内容特征标识;名称语言和代码语言是表示文献外表特征的标识。
18、《中图法》:全称《中国图书馆分类法》,是我国一部大型的综合性图书分类法,它的主体是它的类目表,包括简表、详表、辅助表和编制说明,此外还有索引。《中图法》采用“五分法”形成五大部类。《中图法》属于等级列举式分类法。
19、主题语言类主要有标题词语言、叙词语言、关键词语言和单元词语言等。它们统称为主题法系统。
关键词语言是针对文献中的关键词选定或抽出,极少用作词汇控制,按字序排列,从而提供检索途径的一种检索语言。
20、检索语言的特点:检索语言不同于自然语言,它所表述的概念只是一种解释,不允许一词多义、多词一义而使概念的表述模糊不清。
21、检索语言的功能是通过检索语言标引文献的主题概念,不仅能简明地提示文献所包含的信息内容及其外表特征,而且还能将同一主题概念的文献集中在一起,使文献的存储集中化、系统化、组织化,以便于进行有规律的检索。
22、检索程序包括:(1)分析课题;(2)选择检索系统和数据库;(3)确定检索途径和检索词;(4)构建检索表达式;(5)检索并调整检索策略;(6)输出检索结果。
23、制定检索策略施应注意的问题:(1)先国内后国外;(2)检索时多选几个同义词、近义词;(3)巧妙地利用上下位词的关系;(4)尽量避免从字面出发选择检索词;(5)变换检索词的词序。
24、对检索结果的分析评价指标有:(1)查全率:查全率是对所需信息被检出程度的量度;(2)查准率:查准率是衡量检索系统拒绝非相关信息的能力;(3)相关性:是用户判断信息与信息需求之间关系的标准。
25、文档的基本组成单位是记录。
26、数据库的结构:(1)记录(record)例如文献的题名、作者、发表时间、语种、分类号、主题词等;(2)字段(field)例如文献号字段、题名字段、作者字段、出版字段、语种字段、文摘字段、主题词字段、分类号字段等;(3)文档(file)
27、按数据库包括的信息内容可分为:(1)参看数据库。参看数据库包括书目数据库和指南数据库;(2)源数据库;(3)混合数据库。
28、常用的布尔逻辑算符有:逻辑或“or”、逻辑与“and”、逻辑非“not”三种。
(1)逻辑或“or”:在检索表达式中通常用“+”表示。使用逻辑或可使检索命中结果的范围扩大,达到了扩检的目的,从而提高查全率。
(2)逻辑与“and”:在检索表达式中常用“*”来表示。通过对检索词之间的逻辑与运算,增强了查找的专指性,可提高查准率。
(3)逻辑非“not”:在检索表达式中通常用“—”来表示。在实际检索中,往往在一个检