福建农林大学信息检索期末重点介绍
信息检索期末复习材料
![信息检索期末复习材料](https://img.taocdn.com/s3/m/cf1b17d6c1c708a1284a447b.png)
信息检索第一章信息检索基础1、信息的含义:广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现得一种普遍形式。
狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实2、一次文献:指作者以本人的研究成果为基本素材而创作或撰写的文献。
(著作、报纸、期刊、会议资料、研究报告、政府出版物、专利说明书、产品样本、标准文献、学位论文等)二次文献:指对一次文献进行加工、提炼和压缩后所得到的报道性产物。
检索工具书和网上引擎是典型的二次文献。
(目录、题录、索引、文摘)三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的具体知识、数据。
如综述、百科全书、辞典等。
3、信息检索的含义:从大量的信息集合中找出所需信息的过程与方法。
广义:包含信息储存和检索两部分狭义:信息检索4、信息检索的原理:将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配5、信息检索的意义:①信息检索是有效利用信息资源、实现其最大价值的科学方法②信息检索是再学习的工具、是获取知识的有效途径③信息检索能有效地提高科研工作的效率、节省人力物力及时间6、信息检索的历程:手工检索、计算机检索7、信息检索的方法:直接浏览法、常用法(顺查法、倒查法、抽查法)、追溯法、综合法查全率和查准率的关系、局限性1)查全率=[检出的相关文献信息量/检索系统中相关文献信息总量]×100%=[a/(a+c)]×100%2)查准率=[检出的相关文献信息量/检出文献信息总量]×100%=[a/(a+b)]×100%3)查全率与查准率的局限性:①对文献相关性的判断不可避免的带有主观性和模糊性②全部相关文献的总量很难确定③“相关文献”总是被同等对待,实际上其相关程度是有区别的9、影响检索效果的因素:①标引上网质量②检索语言的性能③检索途径的数量④检索策略的优劣⑤检索人员的素质第二章检索语言1、检索语言的定义:广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。
(完整word)信息检索复习整理讲解
![(完整word)信息检索复习整理讲解](https://img.taocdn.com/s3/m/4ebd63ad3b3567ec112d8aec.png)
一、什么是信息(Information)?在西方英文中 information一词有情报、资料、消息、报道之意,我国大陆曾译为情报或信息,后经国家有关部门核准,统一译成“信息”。
在我国台湾、香港地区,该词被译为“资讯"。
信息是被反映物的属性再现,信息的属性在于表现它物。
也就是说,信息不是事物的本身,而是由事物发出的消息、情报、指令、数据、信号中所包含的内容,是对客观世界中各种事物发出的特征、变化及其相互联系的最新反映。
一切事物包括自然界和人类社会都会产生信息。
一个完整的信息过程,包括信息的传递、接收、贮存、加工和利用.2、信息具有以下特征:1)普遍性(2)时效性:信息在一定的时间内是有效的信息,在此时间之外就是无效信息。
而且任何信息从信源传播到信宿都需要经过一定的时间,都有其时滞性。
(3)传递性(4)可转换性:信息是可以由一种形态转换成另一种形态。
信息一般有4种形态:数据、文本、声音、图像。
这4种形态可以相互转化,例如,照片被传送到计算机,就把v图像转化成了数字.(5)可再生性(6)共享性:同一信源可以供给多个信宿,因此信息是可以共享的,且不因共享而减少(7)可识别性:信息是可以识别的,识别又可分为直接认别和间接识别,直接认别是指通过感官的识别,间接识别是指通过各种测试手段的识别。
不同的信息源有不同的识别方法。
(8)可存储性:信息是可以通过各种方法存储的。
二、信息检索广义:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。
其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。
取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程.狭义:仅仅指信息查找的过程。
即取的环节。
三、信息检索的发展1、第一阶段:完全手工检索阶段2、第二阶段:半机械检索系统-机电、光电检索系统的发展阶段3、第三阶段:计算机检索系统的发展阶段4、第四阶段:基于Internet 的网络化检索系统阶段信息资源的分类:1、信息源可分为自然信息源和社会信息源。
信息检索基础知识考点整理
![信息检索基础知识考点整理](https://img.taocdn.com/s3/m/1ffd1f2afe00bed5b9f3f90f76c66137ee064f07.png)
信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
信息检索课程重点整理
![信息检索课程重点整理](https://img.taocdn.com/s3/m/7b7da3fc0242a8956bece453.png)
信息检索课程重点整理一、信息概念:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。
特征:预先性、实用性、时效性、可传递性、共享性。
传递渠道:1、非正式过程(表现为个人的行为特征。
对话、通信、演讲、授课);2、正式过程(表现为文献流通。
借助文献系统进行正式交流)。
文献概念:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。
也可以称为固化在一定载体上的知识。
必须含有知识、记录方式、载体。
资料概念:固化在一定的实物或载体上的知识。
二、信息的类型:1、按信息的加工层次划分:一次信息(原始文献)、二次信息(检索工具)、三次信息(参考性文献)。
P42、按信息载体的出版编辑特点划分:十二大文献源。
P53、按信息载体的物理类型划分:印刷型、缩微型、电子型、声像型。
P64、按信息的性质划分:一、自然信息(自然界发出的信息,以自然物为载体);二、社会信息(经过人类利用语言、文字、符号、图像等方式加工过的自然信息)。
5、按信息所表征的服务对象划分:经济信息、科技信息、教育信息、军事信息、商业信息、金融信息、综合信息。
三、信息检索的定义及类型p2信息检索,就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。
它包括三个方面:数据检索、事实检索、文献检索。
三者中以文献检索为主。
数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。
四、文献检索的定义及类型p3定义:1、检索系统的建立及检索工具的组织和积累;2、文献的查寻,利用检索工具检出与课题相关的文献。
类型:直接检索:是从通过阅读原始文献直接获取所需信息;快捷、方便;漏查率高。
间接检索:是通过检索工具的指导再查找原始文献而获取所需信息。
系统、全面:滞后。
五、检索工具定义、具备条件及类型检索工具是按一定的学科、主题等进行搜集整理并给予文献的标志,是及时报道的二次文献,具有报道、存贮、检索的功能。
网络资源与信息检索 考试必备(福大版)
![网络资源与信息检索 考试必备(福大版)](https://img.taocdn.com/s3/m/3a9108020740be1e650e9a95.png)
一、信息1、信息在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就变成为信息。
现代科学指事物发出的消息、指令、数据、符号等被包含的内容。
信息是具有一定特征意义的载体。
2、文献指固化在一定载体上的知识。
大凡人类的知识用文字,图形,符号,声频,视频的手段记录下来的东西,统统可被称为文献。
文献三要素:载体,知识,记录。
3、资料是固化在一定的实物或载体上的知识。
是为工作,生产,学习和科学研究等参考需要收集或编写的一切公开或者内部的材料。
二、信息的传递渠道:非正式传递渠道和正式传递渠道。
三、信息检索1、含义:指从大量的文献中查找与信息提问所指定的课题(对象)有关的文献,或者包含用户所需事实与消息的文献的过程。
2、信息检索包括三方面:数据检索、事实检索、文献检索;文献检索提出包含所需信息的文献,而数据检索和事实检索提出包含在文献中的信息本身。
四、文献检索1、含义:包括两方面的内容,一是检索系统的建立和检索工具的组织和积累。
二是文献的查寻。
2、文献检索的类型:①直接检索:通过阅读原始文献直接获取所需信息②间接检索:通过检索工具的指导再查找原始文献而获取所需信息。
五、信息的类型1、按信息加工层次划分:①一次信息:原始文献;②二次信息:通过检索工具所传递的信息,包括目录、文摘、题录、索引等。
③三次信息:通过百科全书、手册、年鉴等所传递的信息。
2、按信息载体的出版编辑特点划分:(十二大文献源)期刊、图书、会议文献、专利文献、科技报告、学位论文、政府出版物、标准文献、产品资料、技术档案、报纸新闻稿、工作文稿3、按信息载体的物理类型划分:印刷型、缩微型、电子型、声像型。
4、按信息的性质划分:自然信息和社会信息。
六、检索工具1、含义:检索工具是二次文献,是人们用来报道,存贮和查找文献的工具。
有人把它称为小书库,二获取的原始文献即一次文献称为大书库。
2、分类:①按检索方法划分为:手工检索工具和机械检索工具。
②按其报道范围的宽窄划分为:综合性检索工具和专业性检索工具。
福建农林大学 信息检索与利用 复习纲要
![福建农林大学 信息检索与利用 复习纲要](https://img.taocdn.com/s3/m/aa0b9cdc240c844769eaee7b.png)
第一章信息与信息资源概述1、搜商的概念p5-6答:搜商,古已有之,问路、查地图、翻阅资料、使用搜索引擎都是人类搜商的体现。
(1)狭义的“搜商”概念仅指人们运用搜索引擎的能力。
(2)广义的“搜商”指运用物质工具进行搜索的能力,这里强调搜索工具的重要性。
(3)最广义的“搜商”概念是“泛搜商”,指人们所有搜索行为的智力。
2、大学生信息检索的教育意义?p7答:(1)、信息检索是大学生必备的基本素质(2)、信息检索是科学研究的重要前提(3)、信息检索是培养创新型人才的重要基础(4)、信息检索是个人终身学习的基本保障3、信息、知识、情报和文献四个概念、关系。
P8-12答:信息的概念:信息是自然界、人类社和人类思维活动中一切事物的存在方式和运动状态的本质属性和客观反映。
知识的概念:知识是人类社会实践经验的总结,是人类智慧的结晶,是人的大脑通过思维对客观事物本质与规律性的认识和掌握。
情报的概念:情报是人们为解决某一个特定的问题而搜索、传递有特定效用的知识或信息。
文献的概念:文献是人们记录、积累、传播和继承知识的最有效手段,也是人类社会活动中获取情报的最主要的来源。
关系:(1)、包含关系(信息包含了知识、情报、文献)(2)、转化关系(eg.图书馆藏书,作为一种静态的文献,当用户对其进行借阅,并为用户所利用时,就转为情报。
)(3)、交叉关系(情报与文献存在交叉关系)4、信息、情报的属性;构成文献的基本要素。
P8-12答:信息:客观性、时效性、价值性、传递性情报:知识性、传递性、效用性文献的基本要素:知识内容、记录符号、物质载体、记录手段5、一些文献类型的特征号码(ISBN组成,ISSN,CN,GB-,GB/T,GB/T *,GB/Z,ISO,IEC,ITU,)ISBN-----国际标准书号、ISSN号----国际标准刊号、CN号-----国内统一刊号、GB表示强制性国家标准、GB/T表示国家推荐性标准、GB/T*降为行业标准而尚未转化的原国家标准,GB/Z是中华人民共和国国家标准化指导性技术文件、ISO是国际标准化组织、IEC是国际电工委员会等。
信息检索和利用考试重点
![信息检索和利用考试重点](https://img.taocdn.com/s3/m/0404080a0166f5335a8102d276a20029bc646350.png)
信息检索和利用考试重点一、名词解释:文献:是记录有一切知识的载体,是属于存贮型的固态的载体,如印刷件、缩微制品、磁盘和光盘等具有存贮型和传播型的信息载体。
检索:是根据特定的需求,运用某种检索工具,按照一定方法,去寻找资料或信息的工作过程。
这种方法利用的是有序化的信息系统和信息业提供感到服务来满足用户的信息需求的。
信息检索:是通过分析、综合等手段进行信息加工后,获取隐含在信息源中的知识的过程。
信息意识:简单的说就是人们利用信息系统获取信息的内在动因,具体表现为信息的敏感性、选择能力和消化吸收能力。
信息素质(信息素养):从各种信息源中检索、评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。
具有信息素养的日呢,也就具备了终身学习的能力。
文献信息、书目:是指一批相关文献的记录,其基本功能是其基本功能是反映某一地区、某一时期在某一领域中出版物的信息。
馆藏目录:是查找文献应该首先考虑的检索工具,是某个图书馆或者档案馆收藏文献、图书的总体目录(是题录性的检索工具)。
图书馆的目录种类繁多,职能各不相同。
索引:是揭示文献内容出处,提供文献查考线索的检索工具。
没有索引,各种海洋一样的文献资料就无法被利用,分篇目索引和内容索引两种。
文摘:是一种揭示文献外部特征、又通过摘录文献要点报道文献内容的工具,文摘是集树木、索引和一次文献三者与一体的检索工具。
年鉴:是以描述和统计的方式逐年提供某一年度、某一领域信息的工具书,或者说是相应年度内的信息的汇编。
手册:是汇集某一学科领域或业务部门专门知识的工具书,是真带当前时间中的需要,以简明扼要的方式提供的具体、使用的资料,工随时翻检查阅的一种小型工具书。
百科全书:是会萃一切门类或某一门类知识。
以概要方式提供有关信息的多功能工具书。
著者途径:即以著者姓名为检索点查找文献的途径,一般有著者姓名和文献号组成。
题名途径:根据已知的书名、刊名、篇名按字顺规则在工具书中查找所需要文献的途径。
信息检索期末课件整理资料
![信息检索期末课件整理资料](https://img.taocdn.com/s3/m/0e3c434ef11dc281e53a580216fc700aba685255.png)
信息检索期末课件整理资料第一章1.2信息检索的原理就是将特定的信息市场需求与存储在检索系统的信息标识展开优劣的比较与相匹配,挑选出两者吻合或部分吻合的信息不予输入。
无论是手工检索还是计算机检索,其基本原理都就是一样的。
即为检索系统对所要存储的信息,按照其外部特征和内部特征展开叙述并剥夺特征标识,然后步入系统;检索时,将所须要信息特征标识与所余信息的特征标识展开比较。
凡是两边标识一致的,就将具备这些标识的信息从检索系统中输入。
涵盖信息存储和信息以获取两个环节。
(书本上的p14)1.3信息检索系统(手绘p17)1.3.2逻辑构成一个完备的信息检索系统通常由以下几个功能模块共同组成:信息挑选子系统、标引子系统、建库子系统、词表管理子系统、用户USB子系统、回答处置子系统。
1.信息选择子系统根据系统的目标和服务对象的须要,确认信息搜集范围,并广为地、定期地收集各种信息源,为系统提供更多充裕而适用于的信息。
2.标引子系统将收录的信息源利用检索语言表达和组织,并赋予检索标识的过程。
3.词表管理子系统管理保护系统中尚无的词表,并使它与标引、建库等子系统相连接,积极支持用户查阅操作方式,从加、对话或其他文本中收集代莱词汇信息,并输入各种形式的词汇数据或词表产品。
4.回答处置子系统专门负责处理用户输入的提问式,将提问式中的检索元和算符区分,并转换成系统内部的可接受的命令方式。
在对提问进行转换后,与数据库中存储的数据进行比较运算,然后,把运算结果输出给用户。
5.用户接口子系统分担用户与系统之间的交流功能。
通常由用户模型、信息表明、命令语言和反馈机制等部分形成。
6.建库子系统创建和保护可以轻易用作检索的数据库,包含系统所用的各索引文档。
其工作流程主要包含数据录入、错误检查与处置、数据格式切换、分解成并定期更新各种文档。
1.4信息检索方法1)顺查法:是指按照时间的顺序,由远及近地利用检索系统进行信息检索的方法。
这种方法能收集到某一课题的系统信息,适用于较大课题的检索。
《信息检索》复习题库讲课稿
![《信息检索》复习题库讲课稿](https://img.taocdn.com/s3/m/3b0a1baccfc789eb172dc894.png)
适用于福建农林大学文献检索期末复习1.下列属于布尔逻辑算符的是(D )。
A、与B、或C、非D、以上都是2、信息素养的核心是(C ).A、信息意识;B、信息知识;C、信息能力;D、信息道德3、20世纪70年代,联合国教科文组织提出:人类要向着( B )发展.A、终身学习;B、学习型社会;C、创新发展;D、信息素质4.参考文准著录格献的标式是( A )。
A、著者篇名来源出处;B、篇名著者来源出处5.请标出文献:马品仲. 大型天文望远镜研究. 中国的空间科学技术,1993,13(5)P6-14,ISSN1000-758X 属于哪种文献类型( C )。
A、图书;B、科技报告;C、期刊;D、报纸6.常用的检索系统有( D )。
A、目录检索系统B、文摘检索系统C、全文检索系统D、以上都是7、哪一种布尔逻辑运算符用于交叉概念或限定关系的组配?( A )。
A.逻辑与()B.逻辑或(OR)C.逻辑非(NOT)D.逻辑与和逻辑非8、根据国家相关标准,文献的定义是指“记录有关( C )的一切载体。
”A.情报B.信息. C.知识D.数据9、( D )是指通过文献信息资料的主题内容进行检索的途径。
A.题名检索途径B.作者检索途径C.分类检索途径D.主题检索途径10、搜索含有“data bank”的PDF文件,正确的检索式为:( A )A."data bank" filetype:pdf B.data and bank and pdf11、从文献的( B )角度区分,可将文献分为印刷型、电子型文献。
A.内容公开次数B.载体类型. C.出版类型D.公开程度12、按照出版时间的先后,应将各个级别的文献排列成( C )A.三次文献、二次文献、一次文献B.一次文献、三次文献、二次文献C.一次文献、二次文献、三次文献D.二次文献、三次文献、一次文献13、利用文献后面所附的参考文献进行检索的方法称为( A )。
A.追溯法B.直接法. C.抽查法D.综合法14、《中国学术期刊全文数据库》给出的检索结果为( D )。
信息检索期末考试重点
![信息检索期末考试重点](https://img.taocdn.com/s3/m/6f9e3bf6910ef12d2af9e720.png)
1,、十大信息源:图书、连续出版物、学位论文、科技报告、会议文献、政府出版物、专利信息、标准信息、产品样本、档案文献2、二次信息:是对一次信息进行加工、提炼、压缩和整理后所得到的信息,如目录、题录、文摘、索引和名录等检索工具。
二次信息主要功能是检索通报控制一次信息帮助人们在较少时间内获取较多信息,故又称为检索信息或通报性信息,其具有汇集性工具性综合性系统性等特点。
3信息素质;作为具有信息素质的人必须具有一种能够充分认识到何时需要信息并有能力有效地发现检索评价和利用所需要的信息解决当前存在的问题的能力4信息素质的内容:信息意识、信息能力、信息道德1、信息检索是指依据一定的方法从已经组织好的大量有关信息组合中直接查找并获取特定的相关信息的过程。
2、信息检索的基本原理可以从信息的替代、整序、标识的匹配三方面来讲述。
3、信息检索的类型文献检索、数据检索、多媒体检索4、信息检索的发展趋势表现在智能化、可视化、个性化、专业化5、信息检索的意义:有利于培养人才提高学生自学能力和独立的科研能力;帮助科研人员继承和借鉴前人的成果避免重复研究减少重复劳动;帮助科研人员迅速准确的获取所需的全部资料提高科研效率缩短科研周期;促进信息资源的开发利用推动社会进步和经济发展。
6、检索语言是根据信息检索的需要而创制的人工语言适应文献信息的加工存储和检索的共同需要而编制的语言是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标志系统。
7、检索语言的主要作用标识文献信息内容及其外表特征保证不同标引人员标引文献的一致性;对内容相关的文献信息加以集中或揭示其相关性;使文献信息的存储集中化系统化组织化便于检索着按照一定的排列次序进行有序化检索;便于将标引用语和检索用语进行相符性比较保证不同检索人员表述相同文献内容的一致性;保证检索者按不同需要检索文献时都能获得最高查全率和查准率。
8、信息检索技术布尔逻辑检索、截词检索、位置检索、限制检索9、信息检索的评价指标体系主要包括对信息检索数据库的评价对检索结果的评价对检索功能的评价和对用户负担的评价。
信息检索期末复习资料.doc
![信息检索期末复习资料.doc](https://img.taocdn.com/s3/m/47e058a99b89680203d825c2.png)
信息检索一. 名词解释1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出來,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。
2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪杳找的方式。
即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。
通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。
该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况F,利用此法能够获得一些所需要的文献资料。
3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。
一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。
它包括检索过程的可视化和检索结果的可视化。
可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考Z间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。
4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。
分为自动主题标引和H动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。
5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。
6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数最与检索系统屮实际与该课题相关的文献信息总量Z比。
对于数据库检索系统,杳全率为检索出的款目数与数据库屮满足用户检索式需求的款目数Z比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。
在这里人为因素的影响比较大。
相对査全率二(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量)*100%7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。
信息检索知识点
![信息检索知识点](https://img.taocdn.com/s3/m/fe22d38d3b3567ec112d8a3c.png)
信息检索知识点 Revised by Liu Jing on January 12, 2021信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。
2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。
3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。
存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
检索过程是存储过程的逆过程。
因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。
4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)着者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。
缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
福建农林大学文献检索复习题
![福建农林大学文献检索复习题](https://img.taocdn.com/s3/m/80e34a1d227916888486d73a.png)
文献检索复习摘要1.、信息、情报和文献的定义答 ⑴信息是自然界、人类社会以及思维活动中普遍存在的现象 是一切事物自身存在方式以及它们之间互相关系、相互作用等运动状态的表达。
⑵情报 运用一定的形式 传递给特定的用户并对特定的用户产生效用的知识或信息。
⑶文献 记录有一切人类知识信息的载体。
2.、情报的3个基本属性 知识性、传递性、效用性3.、构成文献的四要素 记录内容、记录符号、物质载体、记录手段4.、一些文献类型的特征号码 ISBN,ISSN,CN,B2763-1981,GB/T答 ⑴ISBN号是国际标准书号的简称 是专门为识别图书、小册子、缩微出版物、盲文印刷品等文献而设计的国际编号。
ISBN号有10位数字组成 分四个部分 组号 国家、地区、语言的代号 出版者号 书序号和检验码。
ISBN可以作为一个检索途径。
从2007年起 ISBN号升到13位。
如7-109-07953-8 ⑵ISSN:国际标准刊号⑶CN 中国统一刊号⑷GB 表示强制性国家标准⑸GB/T 表示国家推荐性标准5.、图书作为文献信息源的内容特征是什么 期刊的内容特征答 ⑴图书作为文献信息资源特征是 有限性、人工性、有序性、积累性⑵期刊的内容特征 ①内容新颖②信息量大③按期连续出版6.、掌握不同文献类型标志。
答 M——专著 含古籍中的史、志论著 C——论文集N——报纸文章J——期刊文章D——学位论文R——研究报告S——标准P——专利A——专著、论文集中的析出文献Z——其他未说明的文献类型7.、检索语言 外表特征语言有哪些 内容特征语言 主题语言有什么答 检索语言 是根据信息检索的需要创造出来的一种人工语言 是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。
检索语言有表达信息外表特征的语言和表达信息内容特征的语言。
外表特征语言有题名、责任者、编号、引文等。
内容特征语言有分类语言和主题语言。
主题语言有标题词语言、单元词语言、叙词语言、关键词语言。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
信息检索考试提纲一、【概念】1、信息——广义:通过信号带来的消息就是信息。
——概念:自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互联系、相互作用等运动状态的表达。
2、知识——人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。
3、文献——凡是记录有信息或知识的一切载体。
——具体而言,文献是指文字、图像、符号、声频、视频等作为记录手段,将信息记录或描述在一定的物质载体上,有其特定的表现形式,并能起到存储和传播信息情报和知识作用的一切载体。
——四个基本要素:知识内容、记录符号、记录手段、物质载体4、情报——为了解决一个特定的问题所需要的激活了的、活化了的特殊知识或信息。
——特征:知识性、传递性、效用性二、关系:P17①包含关系文献是记录有知识的载体,知识是信息的一部分;情报来源于信息,信息包含了情报;文献包含于信息内②转化关系文献是记录有知识的载体,当文献中的知识信息传递给用户并为用户所利用时,就转化为情报。
③交叉关系情报虽多来自文献,但也可能来自口头和实物信息,所以情报与信息、文献存在交叉关系。
例如:感觉到天气的冷暖(信息)知道是气候的变化引起了冷和热(知识)收听天气预报得知气温变化了(文献)为了研究果树的生长规律而收集的气象资料(情报)5、文献信息检索语言——用来描述文献特征和表达信息提问,沟通信息标引人员和信息检索者双方思想的一种人工语言。
6、检索工具——用来报道、存储和查找文献线索或全文的工具。
7、文献信息检索概念:依据一定的方法,从已经组织好的文献信息集合中,查处说需要特定文献信息的过程。
三、【文献类型的划分及判断】1、按文献的载体形式划分 P9①手写型信息资源手写记录,包括泥板、羊皮纸、甲骨、卜辞、碑铭、竹简、绢帛以及后来的笔记。
记录方式为人工抄写,包括手写稿、信件、日记、原始档案等。
②印刷型信息资源以纸张为载体,通过铅印、油印、胶印等手段。
例如各种书刊。
占据空间大,不易管理保存。
③缩微型信息资源以印刷型文献为母本,以感光材料为载体。
包括缩微胶卷、缩微平片、缩微卡片。
节省空间,保存时间长,不易损坏,但必须借助微缩阅读机,设备投资较大。
④声像型信息资源采用录音、录像、摄影、摄像等手段,将信息记录在光学材料、磁性材料上。
例如磁带、磁盘、光盘、软盘等。
存储密度高、直观、真切,尤其适于记录用文字、符号难以描述的复杂信息和自然现象,但是不能直接阅读,费用高。
⑤机读型信息资源以磁性材料为载体,以磁录技术为记录方式。
以数字代码方式将信息存储到磁、光、电介质上。
存储信息密度高、存储速度快、读取速度快、原有记录可更改、易于实现资源共享、易于网络化和网络化程度高、高速度远距离传输信息。
2、按文献的出版形式划分 P10(1)图书:作者、书名、出版地点、出版时间、出版社、版本号、ISBN内容比较成熟全面、系统可靠;但是出版周期长,传递信息速度慢分为 A.阅读型图书 a.教科书 b.专著(学术著作) c.技术书 d.文集 e.丛书B.参考工具书例如:字词典、类书、政书、百科全书、年鉴、手册、名录、图谱、传记资料etc。
(2)期刊:作者、论文提名、期刊名、出版年、卷号、期号、起止页码定期或不定期的连续出版物。
(3)报纸以刊载新闻和评论为主的定期出版物。
特点:时事性、普及性、大众性、服务性、传递速度快、信息量大、保存性、便览性、集纳性最具影响力的“第一传媒”(4)特种文献:○1科技报告对科学、技术研究结果的报告或研究进程的记录。
大部分报告秘密发行,小部分公开。
○2会议文献在各种科技会议上,宣读和交流的论文、报告及其他的有关资料,它是科技文献的重要组成部分。
特点:A. 内容新颖,及时性强B. 学术水平高,专业性强,可靠性强C.数量庞大,内容丰富;出版形式多样按出版时间的先后可分为:会前文献、会中文献、会后文献○3专利文献由政府专利机构出版的、有创造发明的设计、制造工艺的详细说明,表明在一定年限内发明所有者享有制造、使用、销售占有权的法律性文献。
特点:编写格式统一、出版快、内容新颖、技术性强、实用性强、具有法律效力。
寓技术、法律、经济情报于一体。
○4标准文献对重复性事物或概念所作的统一规定。
是一种规章性的技术文献,具有一定的法律约束力。
一个标准解决一个问题,标准的新陈代谢频繁。
按标准化对象分为:技术标准、管理标准、工作标准按审批机构的级别和标准的使用范围,我国分为:国际标准、国家标准、部颁标准、企业标准国外分为:国际标准、区域标准、国家标准、专业(部)标准、企业标准按内容特点可分为:方法标准、术语标准“GB”——我国的强制性国家标准(具有法律属性)“GB/T”——我国的国家推荐性标准“ZB”——专业标准“NY/T”——我国的一项农业推荐标准标准号—每个标准的编号,由权利机构代号、顺序号、制定年份组成例如:GB 3559-2001○5学位论文○6政府出版物各国政府部门及其所属机构所出版的文献。
分为行政性文件和科技性文件政府出版物大部分公开,少数保密,但若干时间后则予以公开○7产品资料各国厂商为了推销产品而出版发行的一种商业性宣传资料。
特点:图文并茂、形象直观、出版发行快、鲜明的商业性质,较散○8技术档案在自然科学研究、生产技术、基本建设等活动中形成的应当归档保存的科技文件。
特点:内容真实详尽具体可靠、保密性强、保存期长3、按文献的加工深度划分 P17①零次文献——未经出版发行或未进入社会交流的最原始的文献。
例如:私人笔记、工程图样、实验记录、论文草稿、发言稿、会议记录、私人信件、绝密文件、技术档案等。
特点:信息量丰富、内容新颖、不成熟、难以获得②一次文献(原始文献)——以作者本人的生产或科研工作成果为依据所记载的例如:科学专著、独创部分的学位论文、科研报告、专利说明书、会议文献、期刊论文等。
特点:“第一手资料”内容具体详尽注!无论是否参考或引用了他人的资料,无论其载体或出版类型如何,均属于一次文献。
③二次文献(检索信息工具)——对大量无序的一次文献的内外部特征(题名、作者、出处等)进行加工整理而成的各种书目、题录、索引、文摘等。
特点:报道性、检索性、汇编性、简明性④三次文献(既是信息检索和利用的对象,又是检索信息的工具)在二次文献的基础上,将搜集到的一次文献进行再加工的产物特点:综合性强、系统性好、知识面广、有的还具有检索功能例如:综述、专题述评、学科年度总结、进展报告、数据手册、年鉴、百科全书、名录、图录、表谱、指南等。
四、【文献重要外表特征】1、国际标准书号(ISBN)P112007年以前 10位数 ISBN 7-5341-1951-0/G.362①②③④⑤①——地区或语种号0-美语、1-英语、2-法语、3-德语、4-日语、5-俄语、7-汉语等②——出版者号①②合称“出版者前缀”,是一个出版者的标准代号。
③——书序号④——计算机校验码⑤——《中图法》基本大类类号和种次号2007年以后 13位数 ISBN 978-7-5341-1951-0/G.362 (13位)现有的出版机构在原ISBN号前+“978”,新成立的出版机构+“979”。
2、国际标准刊号(ISSN)P13ISSN 1001-8867 由8位数字组成3、国内统一刊号 CN P13CN11-2746/G2 由地区号(2位数)+序号(4位数),分类号4、专利号ZL+年代号(2位数)+专利类型(1位数)+流水号(5位数)+计算机校验码例子:ZL 02346023.7、 ZL 200420034660.3注:2004年以后,年代号使用4位数,流水号使用7位数专利类型:1—发明专利、2—实用新型专利、3—外观设计专利五、【文献信息检索语言类型及判断】P33A.按规范化程度分为:自然语言(未规范化语言)、受控语言(规范化语言)B.按表达信息的特征分为:描述外部特征语言、描述内部特征语言1、文献外部特征语言(较简单)以文献上客观存在显而易见的外部特征(题名、作者姓名、机构、出版地、出版社、ISBN号、ISSN号、专利号、标准号等)作为检索依据2、文献内部特征语言(较复杂)对文献的内容进行分析判断而得出的主题概念或学科类别,按一定结构和规则加以描述的人工语言。
如:分类号、主题词等六、【主题词检索语言类型】1、标题词:最早出现的,他是用规范化了的语词来标引文献主题,并按字顺序排列标识的方法2、单元词:从文献何种抽取出来的,经过规范化处理的,能表示文献主题的最基本、概念上不能再分的最小的语词单位,又称元词。
3、叙词语言:为了适应计算机检索的需要产生的,特点具有概念组配性,通过概念组配来表达主题,它吸收了标题语言的优点编制了常见著录项目。
4、关键词:是直接以能够表达文献主题概念的关键词作为主题表示的一种主题组织法。
(2)主题途径检索:题名、关键词、主题、摘要、全文任意字段.直观、灵活,检索词源于自然语言。
适合:专指性较强的,狭窄主题,或多科学、跨科学等多位复杂的特性检索。
七、【分类法的分类原则和分类号结构】P35+P93学科专业角度,适用:专业较单一、明确的文献主题检索,或泛指性较强的族性检索。
1、我馆书刊索书号图书:G210.7/X165期刊:F4/710.32、《中国图书馆分类法》中图法(最通用):基本部类5、基本大类22、简表、详表、复分表(1)22个基本大类,逐级展开为二级、三级、四级......类目例如:I “文学”——一级类目I2“中国文学”——二级类目I24“小说”——三级类目I242“古代至近代作品”——四级类目I242.4“章回小说”——五级类目被区分的类为上位类,区分出来的类为下位类(2)分类表的类号每增加一位字母或数字代表增加一级分类(3)“工业技术”所属的二级类目用双字母表示,如“TB、TD、TE...”(4)分类号的三位数后,用“.”隔开,例如I242.4(5)O17 数学分析(按学科专业归类)(6)《中图法》特点:A、能体现学科的系统性B、揭示事物纵向的隶属性和派生关系以及横向的平行关系C、简单明了D、直线型序列结构,难以适应复杂的主题概念E、类目预先确定,灵活性差3、中国科学院图书馆图书分类法51.6 数学分析(按学科专业归类)4、国际专利分类法IPC(最重要、使用最广泛的一种专利分类法)采用功能和应用结合的分类原则,按发明的技术主题设置类目,以等级形式逐级分类分类号采用英文大写字母和数字混排由部号、大类号、小类号、主组号、小组号组成,例如:A01B1/02 部号用大写字母A-H表示,分部只有标题没有类号;大类号=部号+2位数字例如:B01D01/02;小类号=大类号+1个字母,但A、E、I、O、U、X 6个字母不能用;主组号=小类号+ 1-3位数+/00,例如:F04D29/00分组号=主组号+一个除00以外的至少两位数字(斜线后的2-5位数字),例如:F04D29/30 PS:斜线后的数字不表示等级关系A63B53/12 金属长柄的高尔夫球棍(按功能和用途归类)八、【信息检索的类型】(根据检索对象和目的不同划分)P43检索类型文献检索数据检索事实检索检索对象原始文献的线索或原文数值数据已存在的事实利用工具检索工具或书目型数据库参考工具书或数据型数据库参考工具书或事实型数据库检索结果相关的文献确定的数据已确定的事实或有关的数据【检索工具的类型及判断和著录格式】P51(按著录文献的特征划分)1、目录(书目):以单位出版物为著录对象。