信息检索名词解释
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关
信息的过程。所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。相当于我们所说的信息查询(information search)。
2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。如私人笔记,设计草图、实验记录、文章草稿、
会议记录、书信文书、以及档案等。其主要特点是内容新颖,但不成熟,不公开交流,难以获得。
3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文
献。如期刊论文、科技报告、专利说明书、会议论文、学位论文等。体现创作性。其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。
4)二次文献(Secondary Document):
就是检索工具。是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。如文摘,目录、索引等。它有存贮、检索、报道的功能。体现高度的浓缩性。其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。二次文献具有汇集性、工具性、综合性、交流性等特点。
5)三次文献(Tertiary Document):
在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。三次文献是情报研究的产物和成果。具有很强的的综合性。
总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。
6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我
们利用的文献类型。而后三种文献是一个从分散的原始文献到系统化、密集化的过程。
7)一般来说,一次文献是基础,是检索利用的对象。二次文献是检索一次文献的工具,也称之为检索工具。三次文
献是一次文献内容的高度浓缩,也是我们利用的一种重要资源。
8)(1)图书(book)
9) 凡篇幅达48页以上并构成一个书目单元的文献称为图书(Book)。图书阅读量占到10%-14%。
10)特点:系统、全面、成熟,出版形式比较固定,但出版周期长,传递情报速度比较慢。
11)(2)期刊(periodical,journal or magazine)
特点:出版数量大,周期短,内容新颖,能迅速反映国内外的各种学科专业的水平和动向。占阅读量的65%。
期刊分为:月刊(monthly)、双月刊(bimonthly)、季刊(quarterly)、年刊(annuals)。
12)1)学术性、技术性刊物,是科技期刊的核心部分。 刊名一般为:Acta(学报)、Journals(杂志)、annals(纪
事)、Bulletin(通报)、Transactions(汇刊)、Proceedings(会刊)、Review(评论)、Progress;Advances in ...
(进展)等。
13)2)快报型。Communication(通讯)、letters(通讯)、bulletin等。
14)3)消息性(newsy journals)。news(新闻)、news letters等。iv.资料性(data journals)。data、event等。
15)核心期刊:
《中文核心期刊要目总览》(2000)指出:“某学科(或专业或专题)的核心期刊是指该学科所涉及的期刊中,刊载论文较多的(信息量较大的),论文学术水平较高的,并能反映本学科最新研究成果及本学科前沿研究状况和发展趋势的,较受该学科读者重视的期刊”。
这一定义从信息量、学术水平和读者三个方面对核心期刊进行较为全面的描述,但现实的核心期刊是并非这样,而是有很大出人。
16)情报专家研究,认为在本学科专业中,20%的期刊占据了80%以上的有关信息,这就是核心期刊
17)(3)科技报告(science&technical report)
18) 指各学术团体、科研机构、大学研究所的研究报告及其研究过程中的真实记录。它的特点:内容详尽、
专深,能代表一个国家的研究水平,特别是一些新兴学科和尖端科学的研究成果往往首先在科技报告中反映出来。
理论性强,数据可靠,但保密性强,难以获取。
19)(4)会议文献(conference document)
国内外各种学术团体召开的专业会议上发表的论文与报告。特点:学术性强,内容比较新颖,通常代表
着一门学科的最新研究成果。
20)(5)专利文献(patent)
21)指发明人向政府部门(专利局)递交的、说明自己的创造的技术文件,同时也是实现发明所有权的法律性文件。专
利文献包括专利说明书、专利公报(摘要)、商标、设计公报以及检索专利的工具等。具有技术性、新颖性、独创性、实用性等特征,是重要的技术经济情报来源。
22)类型:发明专利、实用新型专利和外观设计专利三种
特点:
(1)排他性或独占性
(2)自成体系
(3)时效性。
(4)相关性
23)(6)标准文献(standard literature)
24) 标准是对产品、工程和管理的质量、规格、程序、方法所做的规定。一般由有主管部门颁布,是从事生
产、管理的一种共同依据和准则,包括标准(Standard)、规范(Specification)、技术要求(Requirement) 标准文献的特点
约束性、适用性、统一性、可靠性、协调性、时效性。
25)(7)学位论文(dissertation)
学位论文是指高等学校或研究机构的学生为取得学位,在导师的指导下完成的科学研究、科学试验成果的书面报告。它具有选题新颖、引用材料广泛、阐述系统、论证详细的特点。按授予学位的级别不同,分为学士学位论文、硕士学位论文、博士学位论文。
26)检索词、检索式、检索策略(第四章详细介绍)
检索词是用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录。
检索式也称检索提问式,是要求系统执行的检索语句。简单的检索式由一个检索词和一个字段名构成,复杂的检索式由多个检索词和字段名通过关系算符连接而成。如:要利用英文搜索引擎查找网络信息检索方面的资料,检索式为(Web OR Internet OR WWW) AND (Search* OR Retrieval*)。
27)检索策略:
所谓检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、学科领域、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。也就是为满足信息需求所制定的一系列检索方案
28)5)检中结果、查全率、查准率(第四章详细介绍)
检中结果又称检索结果集,是数据库中满足(检索式(即符合检索条件)的那些记录的集合
查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例
查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例
29)2、信息检索的类型:
(1)根据检索手段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索)
(2)根据检索对象、
形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。
30)文献型信息检索(Document Retrieval):以文献(包括题录、文摘)为检索对象的检索。凡是查找某一主题、
时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。
完成文献型信息检索主要借助于各种书目型数据库。
31)数据型信息检索(Data Retrieval):以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,
以及某一物质的化学分子式等,数据检索分为数值型与非数值型。完成数据型信息检索主要借助于各种数值数据库和统计数据库。
32)事实型信息检索(Fact Retrieval):以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检
索,其检索结果主要是客观事实或为说明事实而提供的相关资料。如:2001年7月通过的奥运会主办城市的结