信息检索复习资料

合集下载

信息检索_复习资料

信息检索_复习资料

信息检索_复习资料第1章文献信息概论 (1)1.1 信息时代与信息文化课 (1)1.2 文献信息的基本概念 (2)1.2.1.1信息的定义 (2)1.2.2 文献的级别和载体类型 (2)1.2.3 印刷型文献的出版类型 (3)1.4、国内文献信息系统包括: (6)1.4.4 文献信息的学科分布规律 (6)第2章信息检索原理 (6)2.1.1信息检索的定义和类型 (6)1.信息检索的定义 (6)1.2.3文献的内部特征和外部特征 (6)2.2.1信息检索的一般原理 (6)2.2.3 检索语言 (7)2.2. 信息检索系统 (8)2.2.1 书目检索系统的内容组成 (8) 2.2.2印刷型信息检索系统的类型 (8) 2.3文献信息检索的方法 (9)2.3.1文献信息检索方法的类型 (10) 2.5 信息检索语言 (10)2.5.2分类检索语言 (11)2.6 著者检索原理 (12)2.6.1 著者索引的排序方式 (12)第三章事实数据检索与参考工具概述 (13) 3.2事实与数据检索概述 (13)3.2参考工具书概述 (13)3.3综合性参考工具举要 (16)第四章图书报刊文献检索原理 (19)第一节书目及其作用和类型 (19)第二节查近现代图书和报刊的出版 (20)4.1 计算机情报检索概述 (25)4.1.2 计算机情报检索的必备条件 (25)4.1.3计算机情报检索与手工检索的比较 (25)4.2 文献信息数据库原理 (25)4.2.1 数据库的定义和类型 (26)4.2.2 数据库构成: (26)4.3.5 检索策略构成和调整方法 (27)第4章(国内外网络全文数据库) (29)4、2电子图书和书目数据库 (29)第1章文献信息概论1.1 信息时代与信息文化课文献课是知识时代培养学生终身所需的信息意识与获取文献信息能力的重要课程,是一门科学方法课。

在社会信息化的进程中,文献信息检索的意义日益变得重要:1、文献信息数量激增。

信息检索期末复习材料

信息检索期末复习材料

信息检索第一章信息检索基础1、信息的含义:广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现得一种普遍形式。

狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实2、一次文献:指作者以本人的研究成果为基本素材而创作或撰写的文献。

(著作、报纸、期刊、会议资料、研究报告、政府出版物、专利说明书、产品样本、标准文献、学位论文等)二次文献:指对一次文献进行加工、提炼和压缩后所得到的报道性产物。

检索工具书和网上引擎是典型的二次文献。

(目录、题录、索引、文摘)三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的具体知识、数据。

如综述、百科全书、辞典等。

3、信息检索的含义:从大量的信息集合中找出所需信息的过程与方法。

广义:包含信息储存和检索两部分狭义:信息检索4、信息检索的原理:将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配5、信息检索的意义:①信息检索是有效利用信息资源、实现其最大价值的科学方法②信息检索是再学习的工具、是获取知识的有效途径③信息检索能有效地提高科研工作的效率、节省人力物力及时间6、信息检索的历程:手工检索、计算机检索7、信息检索的方法:直接浏览法、常用法(顺查法、倒查法、抽查法)、追溯法、综合法查全率和查准率的关系、局限性1)查全率=[检出的相关文献信息量/检索系统中相关文献信息总量]×100%=[a/(a+c)]×100%2)查准率=[检出的相关文献信息量/检出文献信息总量]×100%=[a/(a+b)]×100%3)查全率与查准率的局限性:①对文献相关性的判断不可避免的带有主观性和模糊性②全部相关文献的总量很难确定③“相关文献”总是被同等对待,实际上其相关程度是有区别的9、影响检索效果的因素:①标引上网质量②检索语言的性能③检索途径的数量④检索策略的优劣⑤检索人员的素质第二章检索语言1、检索语言的定义:广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。

信息检索复习资料

信息检索复习资料

信息检索公选课复习资料1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。

2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。

3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。

4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。

5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。

6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。

7.著录是对文献内容和形式特征进行选择和记录的过程。

8.数据检索是指特定的数值型数据为对象的检索。

9.按信息的加工层次分类:(含义)一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等二次文献:目录、题录、索引、文摘三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。

二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。

三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。

二次信息资源与三次信息资源的区别:对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案.10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。

11. 文献检索方法:指文献信息资源的一般检索方法,也是利用各种检索工具检索文献信息资料的最常用的方法。

信息检索重点复习资料

信息检索重点复习资料

信息检索重点复习资料第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。

信息素养:人们在解答问题时利用信息的技术和技能。

信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。

信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。

信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。

存储是检索的基础,检索是存储的目的。

信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。

信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。

其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。

信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。

信息检索的历史:最早的信息检索主要依靠信息分类。

1手工检索2机械信息检索。

3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型 1浏览型模型:扁平式模型、结构导向模型、超文本模型2检索型模型:结构化模型、基于内容的检索型模型。

信息检索模型是信息检索的核心。

信息检索系统:是具有信息存储和信息查询功能的一类服务设施。

信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS. 信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。

信息检索复习资料(有答案版)

信息检索复习资料(有答案版)

1.请说明一次文献、二次文献和三次文献的特点和功用。

(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。

如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。

二次文献的重要性在于可以帮助人们查找一次文献。

如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。

包括综述研究和参考工具两类。

如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。

特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。

特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。

特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。

如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。

(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。

4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。

信息检索复习要点

信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。

这种附着在各种载体上的记录统称为文献。

2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。

3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。

信息是物质存在的方式、形式和运动规律的表征。

人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。

如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。

由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。

4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。

5、信息资源的构成可从不同的层次和角度来划分:一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。

二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。

(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。

例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。

按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。

二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。

信息检索 复习资料

信息检索 复习资料

第一部分:基本常识1.文献按照出版形式可分为哪几种类型?举例。

图书、期刊、报纸、特种文献。

图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI 期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。

报纸:人民日报特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。

2现代科技文献具有的特点哪些?答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降3什么是核心文献、相关文献和边缘文献?答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。

如核心期刊等。

相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。

相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。

4 什么是文献?构成文献的有哪四个要素?答:文献的定义是记录有知识的一切载体称为文献。

构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。

5 电子文献的主要类型和文件格式是什么?答:(1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分;(2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的 gif文件、jpg文件以及标记文件格式的 html文件和xml文件之分;(3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分;(4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分;(5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类;(6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。

信息检索复习

信息检索复习

1、信息素质:个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。

包含四个层面的含义:第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。

第二,掌握了主要的信息源和信息工具的知识及技能。

第三,能够分析评价选择相关信息。

第四,利用信息的目的是为了有效地解决具体问题。

信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。

1)信息意识(前提)信息意识是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。

信息意识的强烈与否对能否挖掘出有价值的信息、对文献获取能力的提高起着关键的作用。

2)信息知识(基础)信息知识是关于信息的特点、性质、运动规律、信息方法与技术、信息系统的有关知识。

3)信息能力(核心)信息能力是人们获取、分析、加工、传递、创造信息等能力的综合。

包括:信息查询与获取能力、信息交流与传播能力、信息组织与整合能力、信息利用能力、信息评价能力等.信息能力是提高信息素质的关键所在。

4)信息道德(准则)信息道德是指在信息活动中调节和控制信息生产者、信息服务者、信息利用者及其相互关系、伦理道德和行为规范的总和。

具体:遵守国家有关信息的法律法规、不制作不传播不利用违反国家政策的信息和不健康信息、不制作不传播虚假信息、不侵犯知识产权、不利用信息技术谋取不正当利益和从事违法活动等。

2、文献信息链文献作为人类文化信息的承载物,从其产生、替代、反复被利用、再创造,直至产生新知识,是一个不断演进的运动过程。

有人把这一过程比喻为文化信息从低级到高级不断螺旋上升的信息链接。

美国《图书馆与情报科学百科丛书》第26卷把知识的产生及其有序化进程描述为动态的文献链。

对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。

补充材料:从人类整个知识体系的行程来看,现存文献中的知识来自于研究组织通过观察、实验而获得的发现与数据,它们被记录在实验室笔记或日记里,是具有第一手意义的文献信息。

信息检索复习资料

信息检索复习资料

信息检索复习资料科学信息检索与应用第一章绪论1.情报检索与科学研究关系2.个体研究阶段,世界上最早出现的手工检索工具:答:1821年瑞士出版的《物理科学进展年报》1830年德国创办的文摘杂志《药学总览》3.社会化阶段,研制大型检索工具:答:美国1884年创办了《工程索引》(EI)美国1907年创办了《化学文摘》(CA)美国1926年创办了《生物学文摘》(BA)英国1896年创办了《科学文摘》(SA)4.自动化阶段,产生新的检索理论:答:1951年 Taube,M 提出:单元词组配法1958年 Citron,J 提出:轮排索引1958年 Luhn,H 提出:定题服务(SDI)二战期间…案例: 曼哈顿工程 - 阿波罗计划5.科技文献概念答:记录在载体上的科技知识,包括科技事实、数据、理论方法、构思和假设等。

(文献/科技文献)6.文献信息源,按文献载体形式划分:答:印刷型文献:指印刷术发明之后,以纸张为存储载体,通过油印、铅印、胶印、静电复印等手段,将文字固化在纸张上所形成的文献。

缩微型文献:又称为缩微复制品文献,它是以感光材料为载体,以印刷型文献为母本,采用光学摄影技术,将文献的体积浓缩而固化到载体上。

机读型文献:机读型文献的全称为计算机阅读型,是以磁性材料为存储载体,以穿孔、打字或光学字符识别装置为记录手段而形成的文献。

声像型文献:又称为视听型文献,它是以磁性材料或感光材料为载体,借助特定的机械设备直接记录声音信息和图像信息所形成的文献。

7.文献信息源,按文献的出版形式划分:答:科技图书(Science and Technical Book)科学期刊(Science and Technical Journal)科技报告(Science and Technical Report)专利文献(Patent Document)会议文献(Conference Paper)学位论文(Degree Thesis)标准文献(Standard Literature)政府出版物(Government Document)产品样本(Product Stylebook )技术档案(T echnical Files)8.文献信息源,按文献的产生、加工、用途划分为:答:一次文献,又称原始文献。

信息检索复习

信息检索复习

一、电子信息资源特点1.存储形式多样化2.资源数字化3.可交流程度高4.方便利用5.内容丰富6.载体容量大二、信息检索步骤①分析检索课题,明确检索需求:1.检索的目的与意图;2.学科范围与主题概念;3.文献性质、类型与数量②制定检索策略③选择检索系统与数据库④确定检索词和检索途径,编制逻辑检索式⑤检索策略的调整三、我国计算机信息存储的进步经历的过程1.引进开发过外磁带、开展定题服务2.开发国际联机检索终端技术3.自建数据库4.微型计算机和国际联机往信息存取的发展四、计算机信息存取系统评价计算机信息存取系统是利用计算机对一定范围的信息集合进行选择、记录、存储与排序,以便用户采用科学手段与技术从中获取必要和充分信息资料的计算机信息系统。

1.系统研制目标性指标2.数据范围、更新频率与数据来源指标3.系统的技术水平和运行质量指标4.数据组织形式与用户界面指标5.检索方式和检索策略指标6.检索效果与辅助索引指标7.系统响应速度及费用指标8.输出格式指标综上所述:信息存取系统的评价指标由多方面因素构成,实际上影响系统质量与效益的情况也很复杂。

一个科学合理的评价指标体系的构成应该具有整体性、多向性、可测性及动态性等特点。

五、First Search联机存取的主要特色1.提供一体化服务2.强大的检索手段3.灵活多样的辅助索引4.专门配置了Web界面的管理模块5.数据库记录中包含馆藏信息6.信息量大7.面向最终用户8.收费低六、基于内容的多媒体信息检索特点①提供重建查询机制②查询方式的交互性③相似度检验④多媒体同步检索技术⑤多层次检索信息.七、基于内容检索的关键技术①信息模型和表示(超文本模型、文献模型、信息元模型)②检索技术③查询语言④信息压缩和恢复⑤信息存储管理⑥多媒体同步技术八、网络信息检索的策略1.明确检索目标,确定检索项2.选定适合的检索工具3.正确对待检索结果4.提高上网速度,选择最佳上网时间九、网络信息存取的特点1.存取范围覆盖Internet所有资源2.传统检索方法与全新检索技术相结合3.用户界面友好且操作方便4.具备良好的导航和编辑功能5.具有用户透明度十、纸质文献的特点和个性纸质文献类型的特点:1.携带、书写、保存方便;2.直观性;3.以纸质为载体的艺术作品的不可替代性;4.纸质文献作为收藏品的不可替代性个性:1纸质文献是知识信息的存在形式2传递信息是纸质文献的又一特征3纸质文献资源可以多次重复使用,可以进行复制和传递4纸质文献所包含的知识信息是一种相对固化的信息十一、简述中国专利文献特点及检索途径中国专利局发行的专利文献包括专利说明书,专利公报和专利年度索引等1,专利文献手工检索(分类途径,申请人和专利权人途径,专利序号途径)2,国内专利网检索(中国专利信息网,中国知识产权局专利检索系统,中国知识产权网)十二、存储技术发展趋势①纸质印刷存储、缩微存储、磁存储、光盘存储长期并存,互为补充,这是信息存储发展的一个趋势。

信息检索复习资料

信息检索复习资料

信息检索复习资料1.信息:信息是事物运动的状态与方式,是物质的一种属性。

2.知识:知识是人类对客观事物规律的认识,是人的主观世界对于客观世界的概括和如实反映。

3.情报:情报就是人们在一定的时间内为一定的目的而传递的有使用价值的知识或信息。

4.信息、知识、情报三者之间的关系:情报来源于知识,知识又来源于信息,用逻辑来表示:情报∈知识∈信息。

5.文献:文献,记录有知识的一切载体。

6.文献的三要素:知识(文献的内容),载体(文献的物质形式),记录(将内容固化在载体上的手段或方式)。

7.科技文献的特点:数量急剧增长;内容交叉重复;文献文版分散;文献失效加快;文献类型增多;文献语种增多。

8.科技文献的类型:1>按出版形式划分:科技图书;科技期刊;科技报告;会议文献;专利文献;学位论文;标准文献;产品资料;政府出版物;技术档案。

(主)2>按载体形态划分:印刷型文献;缩微型文献;声像型文献;机读型文献。

(主)3>按文献内容的加工深度划分:零次文献;一次文献;二次文献;三次文献。

4>按相对利用率划分:核心文献;相关文献;边缘文献。

*科技图书:一般分为阅读类图书和参考类图书。

前者包括教科书、专著和论文集等;后者包括各种参考工具书,如词典、百科全书、手册、年鉴、名录、表谱等。

9.信息检索:按检索对象的内容进行划分,信息检索分成了文献检索、数据检索、事实检索。

(作用、意义)文献检索是以文献为检索对象的一种检索,凡是查找某一年主题、某一学科、某一著者的有关文献均属于文献检索的范畴;文献检索是一种相关性检索,即检索系统不直接解答用户提出的技术问题本身,只提供与之相关的文献供用户参考;数据检索是以数据为检索对象,从已收藏的数据资料中查找出特定数据的过程。

数据检索是一种确定性检索,系统要直接回答用户提出的问题,提供用户所需要的确切的数据;事实检索即通过对信息集合中已有的基本事实或数据进行处理,然后得出新的(即未直接存入信息集合中的)事实的过程。

信息检索复习资料

信息检索复习资料

一、名词解释1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。

2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。

3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。

5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。

6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。

7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。

8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。

9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。

10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。

11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。

12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

信息检索复习资料

信息检索复习资料

A卷一、名词解释:1.信息资源 2.信息检索3.著录法4.关键词标引5.知识发现二、填空1.按组织方式分,信息检索有()、()、超媒体检索。

2.信息检索策略有两种方式即()和()。

3.表示主体的检索词有标题词、()、()关键词。

4.常用的逻辑运算符有:()、OR或+、()。

5.信息检索工具常用的排检方法有字序法、()。

6.中国特有的工具书是()、()。

三、问答1. 信息检索的研究内容有哪些?2. 数据库有哪些类型?3. 搜索引擎的类型有哪些?四、论述1、试例说明传统检索型工具书和参考型工具书的使用。

2、如何利用检索工具查找历史类文献?参考答案:一、名词解释(30%)1.信息资源。

是人类存储在载体(包括大脑)上的已知或未知的可利用的资源。

信息中的载体信息和主题信息资源的最基本的组成部分。

2.信息检索。

是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程。

3.著录法。

是对信息与文献的形式特征和内容特征进行分析、选择和记录的方法。

4.关键词标引。

使用非规范化的自然语言——关键词来表达文献或信息资源主题内容的过程。

5.知识发现。

是从数据中发现有用知识的整个过程,使多个步骤相互连接,反复进行人机交互的过程。

二、填空(20%)1.按组织方式分,信息检索有全文检索、超文本检索、超媒体检索。

2.信息检索策略有两种方式即手工检索策略和计算机检索策略。

3.表示主体的检索词有标题词、单元词、叙次、关键词。

4.常用的逻辑运算符有:AND或*, OR或+, NOT或-。

5.信息检索工具常用的排检方法有字序法、类序法。

6.中国特有的工具书是类书,政书。

三、问答(24%)1.信息检索的研究内容有哪些?检索理论研究、检索语言研究、数据库研究、著录法研究、检索系统研究、检索策略研究、检索服务研究。

2.数据库有哪些类型?传统数据库(情报数据库、图形数据库等);专门应用领域的数据库(统计数据库、工程数据库、空间数据库;新一代数据库(分布式数据库、多媒体数据库、面象对象数据库、实时数据库等)。

信息检索复习资料

信息检索复习资料

信息检索的概念:(1)广义:将信息按一定的方式组织,存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索的两个过程。

(2)狭义:有序化信息的检索查找。

信息检索的原理:将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中就检索所需的信息。

为什么检索和存储是不可分割的?因为信息检索的全过程包括存储和检索两个过程,存储过程主要是利用检索语言对文献进行标引。

检索过程按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。

其实,检索过程实际上是存储过程的逆过程。

信息检索的方法:顺查法,倒查法,抽查法,追朔法,循环法。

信息检索途径:(1)内部特征途径A.分类途径:按照文献资料所属学科类别进行检索的途径。

B.主题途经:通过文献资料的内容主题进行检索的途径。

(2)外部特征途径A.题名途径:根据文献题名来查找文献的途径。

B.著者途径:根据已知的文献著者来查找文献的途径。

C.文献编号途径:以文献的编号为特征编排和检索文件。

D.目录检索途径:利用目录来检索信息的方法。

E.机构检索法:F.引文检索途径:利用文献间的引证关系来检索文献的方法。

布尔模型的优缺点:优点:(1)简单,形式简洁,易于理解。

(2)可操作性强,应用广泛。

(3)构成的逻辑提问式可以表达与用户思维相一致的查询要求,提供非常精确的语义概念。

(4)能处理结构化提问。

缺点:(1)表达用户复杂需求的效果欠佳。

(2)准确匹配无法提供定量比较。

(3)匹配标准不尽合理。

(4)检索结果不易控制。

概率排序原则(1997,罗宾逊):如果一个检索系统对用户的每一个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。

计算机信息检索:在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。

信息检索复习参考资料

信息检索复习参考资料

信息检索复习参考资料1.信息检索的意义:(1)信息检索是开发资源的有效途径。

(2)信息检索是科学研究的重要环节。

(3)信息检索是科学决策的前提。

(4)信息检索是信息素养教育的主要内容。

2.信息意识:个人对信息的敏感性,体现在对信息价值的自觉认识及敏锐的判断力和分析力上。

3.信息检索的作用:(1)提高信息获取的效率。

(2)增强决策的科学性。

(3)促进信息意识的培养。

(4)提高工作的成功率。

(5)提升独立学习的能力。

4.手工信息检索的定义:利用印刷本的检索工具(目录、索引、文摘、参考工具书等)来查找信息资料的过程,这是一种传统而又基础的检索方式。

5.脱机检索的主要特点:自动化:检索词汇间关系表达;批处理;委托检索;数据存取与数据通信能力都比较差;时效性不强。

6.联机检索的主要特点:信息丰富,质量高;书目索引为主;更新速度较快;检索速度快,检索效率高;检索全面性系统性较为理想;命令式,操作复杂;界面不友好;费用高。

7.专利文献的定义:专利是专利权所保护的技术方案或设计,包括发明、实用新型和外观设计。

8.标准文献的定义:由主管标准化工作的权威机构主持制定颁布的,记录各类具有标准性质的文件。

9.学位论文分为:学士论文、硕士论文和博士论文。

10.政府文献的定义:政府文献是由政府支付出版的,或依据法律或国际组织(如联合国、欧盟、联合国教科文组织等)要求出版的文献,又称为政府出版物。

文献标识符[M]。

11.文献的特点:(1)内容系统。

(2)具有等级结构:a.一次文献也称原始文献。

b.二次文献是集合文献。

c.三次文献又称参考性文献。

(3)分布集中又分散。

(4)文献老化。

12.信息来源的特点:(1)普遍性。

(2)潜伏性。

(3)关联性。

(4)无序性。

13.线性检索工具:(1)目录。

(2)索引。

(3)文献。

14.指南的定义:指南是包含可全面满足用户进行某一操作需求的介绍信息的文献。

指南主要回答各种常识性的问题。

15.检索界面的风格主要有三种:单一检索框界面风格、多个检索框界面风格、分类导航界面风格。

信息检索复习提纲及答案

信息检索复习提纲及答案

信息检索复习提纲及答案第一篇:信息检索复习提纲及答案“信息获取与利用”复习大纲1.什么是信息素养?简述评判是否具备信息素养的标准是什么?结合自己的实际工作,谈谈提高信息素养的途径。

答:指个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力”。

标准:⑴能够独立决定所需信息种类和程度。

⑵能够高效地获取所需信息。

⑶能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选。

⑷能够有效地利用信息达到某一特定的目的。

⑸能够在信息利用过程中遵守相关的法律法规。

途径:⑴通过网络搜索⑵信息检索课⑶参加“图书馆利用系列讲座”等信息实践活动。

2.信息、知识、情报的概念?举例说明概念间的区别和联系文献?答:信息,由事物发出的消息、指令、数据等所包含的内容。

如花的生长方向。

知识,是人类社会实践的总结,是人的主观世界对于客观世界的概括和如实反映。

如每天吃一个苹果有利健康。

情报,是激活了、活化了的知识,是为特定目的服务的信息。

如搜索汽车替代燃料时,获得有关乙醇汽油的信息就是情报。

3.文献有那些类型?将文献划分成这些类型的依据是什么?答:纸张文献、缩微文献、电子文献、音像文献。

依据知识内容、记录载体、记录方式。

4.科技文献的作用是什么? 答:⑴科技进步的阶梯。

⑵传递科技信息或知识。

⑶加速科学技术的进步,促进了社会的发展。

5.比较图书和期刊,他们各自有哪些特征,其特点和用途是什么?答:图书特点,内容系统、全面、成熟、可靠,但时效性较差。

用途,对范围较广的问题获得一般知识、或对陌生的问题获得初步了解。

特征,书名、著者、出版社名称、出版地点、出版时间、图书总页数、ISBN。

期刊特点,品种多、数量大、出版周期短、报道速度快、内容新颖、及时反映当前科技水平。

用途,是科技人员吸取成果、掌握进展、了解动态、开阔思路的重要参考文献。

特征:论文题名、著者、期刊刊名、卷号、期号、起止页号、ISSN。

6.特种文献有哪几种类型,简述其中任意两种的特点。

信息文献检索复习资料

信息文献检索复习资料

一.名词解释1.文献:记录有知识的一切载体。

2.信息检索:广义:将信息按一定方式组织和储存起来,并根据信息用户的需要找出有关信息的过程。

狭义:从信息集合中找出所需要信息的过程。

3.信息检索语言:根据信息检索的需要而创造的人工语言。

一般又称为信息存储与检索语言、索引语言、标引语言、文献工作语言、标识系统。

4.分类检索语言:依据一定的意识形态观点,以科学属性为基础,结合信息内容特征的一种直接体现知识分类概念的检索语言。

5.专利文献:专立制度的产物,是实行专利制度的国家专利局及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。

6.标准:对重复性事物和概念所作的同一规定,它以科学、技术和实践经验的综合成果基础,经有关方面协商一致,由主管机构批准,以特定形式发布,作为共同遵守的准则和依据。

7.标准文献:指与技术标准、生产组织标准和管理标准有关的文献。

8.搜索引擎:对万维网站点资源和其他网络资源进行标引和检索的一类检索系统机制的总称。

9,参考工具书:根据人们的需要,把某一范围的知识或资料加以分析、综合概括或浓缩,并按一定的方法排检,能够迅速并直接提供有关基本知识或数据、事实的参考答案的图书。

二.填空1.信息的特征客观性、依附性、可传递性、可塑性、时效性、共享性2.关于信息、文献、知识之间的范畴关系:信息圈包含知识圈,知识圈包含文献圈3.信息检索按存储和检索的对象分类:文献检索、数据检索、事实检索。

4.按信息组织的方式分为:目录检索(具体单位出版物)、题录检索(单位出版物里的所有文献)、文摘检索、全文检索、超文本检索、超媒体检索。

5.常见的信息检索语言有:分类检索语言、主题检索语言、代码检索语言。

6.《中图法》将图书划分为5大部类:马列主义、毛泽东思想、邓小平理论;哲学;社会科学;自然科学和综合性图书。

再分为22个基本大类。

7.主题检索语言根据选词方法的不同可分为:标题词语言(人工|书面语言)、关键词语言(自然语言)、序词语言(人工|书面语言)、单元词语言。

信息检索期末复习资料

信息检索期末复习资料

信息检索一.名词解释1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出来,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。

2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪查找的方式。

即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。

通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。

该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况下,利用此法能够获得一些所需要的文献资料。

3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。

一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。

它包括检索过程的可视化和检索结果的可视化。

可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。

4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。

分为自动主题标引和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。

5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。

6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数量与检索系统中实际与该课题相关的文献信息总量之比。

对于数据库检索系统,查全率为检索出的款目数与数据库中满足用户检索式需求的款目数之比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。

在这里人为因素的影响比较大。

相对查全率=(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量) *100%7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章1、信息的定义:信息是客观世界中各种事物的变化和特征的最新反映以及经过传递后的再现。

2、按信息产生的先后和加工深度划分:一次信息、二次信息、三次信息3、信息的特性:a普遍性、b存储性、c传递性、d共享性、e开发性、f价值的不定性4、信息组织的理论基础:a关于知识组织的理论、b系统科学理论、c耗散结构理论、d协同论、e 突变理论、f信息字组织理论5、信息组织的方法基础:a语言学、b逻辑学、c知识分类6、知识的定义:广义知识是指人们通过学习、积累、发现、发明各种知识的总和,包括普通知识和专业知识。

狭义知识是指知识经济研究的知识,通常是专业知识7、知识的分类:按载体划分,可将知识分为隐性知识和显性知识8、知识的特性:a智慧性、b客观性、c依附性、d不磨损性、e非遗传性、f增值性、g共享性9、知识的组织方法(了解):a知识表示、b知识聚类、c知识分类、d知识重组、e知识编辑、f 知识获取、g知识存检、h知识布局、i知识监控10、网络信息资源组织的环境与传统文献管理环境的不同主要表现:a网络环境下,信息组织工作的对象有了很大变化。

b网络环境下,用户需求发生了很大的变化;c信息组织的技术环境有了很大的变化;d网络信息资源,主要是由用户通过终端的屏幕获得(p10)11、搜索引擎的定义:搜索引擎主要指利用自动搜索技术软件,对Internet网络资源进行收集、组织并提供检索服务的的一类信息服务系统。

12、元数据搜索引擎的定义:元数据搜索引擎又称集合式搜索引擎,他将多个搜索引擎集成在一起,,并提供一个统一的检索界面13、元数据定义及常用的两个标准P19元数据是关于数据的数据,是用于提供某种资源的相关信息的结构化数据,是对数据进行组织和处理的基础,是传统的书目方法在网络信息组织与管理中的发展。

常用的几个个标准:a、MARC(机读目录格式);b、DC(都柏林核心);c、PICS(internet 内容挑选平台);d、CDF(频道定义格式);e、MCF(元数据内容框架);f、RDF(资源描述框架)14、数据库组织方法:是将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询,就可以找到信息线索,并通过信息线索直接连接相应的网络信息资源15超维组织方法:是一种基于知识单元的新型信息组织方法,它借助于超文本技术实现16、网络信息资源标记格式的几种标准:a、SGML b、HTML c、XML d、PDF17、电子图书的定义及两个问题:电子图书又称e-book,它是利用计算机高容量的存储介质来存储图书信息的一种新型图书记载形式。

两个问题:数字资源版权问题和电子图书阅读问题18、数字图书馆的定义和基本类型:以统一的标准和规范为基础,以数字化得各种信息为底层,以分布式海量资源库群为支撑,以智能检索技术为手段,以电子商务为管理模式,以宽带高速网络为传输通道,将丰富多彩的多媒体信息传递到千家万户基本类型:a资源服务型;b、服务研究型、c联合建设型第二章网络信息资源存储1、信息资源存储的意义和作用:意义a、有利于增大信息资源的拥有量;b、有利于集中管理信息资源;c、有利于开发高层次的信息资源;d、有利于充分利用信息资源,提高管理工作的效率作用:a、方便检索;b、延长寿命;c、利于共享;d、方便管理2、信息资源存储的主要类型:a、人脑载体存储;b、语言载体存储;c、文字载体存储;d书刊载体存储;e、电子载体存储3、信息资源存储的主要技术:纸张印刷存储技术、缩微存储技术、声像存储技术、计算机存储技术、光盘存储技术第三章信息检索基础1、信息检索的实质原理:就是将用户的检索标识与信息集合中存储的信息标识进行比较和选择,即进行匹配,完全匹配者作为检索结果被系统输出即检索命中,也就是说当查找的思路与存储的思路一致时,信息就会被查找出来,否则就查不出来。

2、信息检索的类型(重要):a、按检索的目标分书目检索和事实数据检索;b、按手段不同分为手工检索和计算机检索;c、按检索时间不同分为定题检索和回溯检索。

书目检索:以查找某一课题的相关文献为目标的检索,如某一主题某一时期。

事实数据检索:以某一特定的事实或数据为目标的检索;如:某一人物的资料。

手工检索:是检索者与检索工具直接对话。

他依靠检索者手翻、眼看、脑子判断而进行,不需要借助任何的辅助设备,特点:方便、灵活、判别直观、可随时修改、查准率高计算机检索:利用计算机通过各种数据库查找所需信息,检索过程是由人操作计算机完成的,匹配是由计算机进行的定题检索:指根据用户的需要,预先将制定好的检索策略存入检索系统中,定期对检索系统的信息进行查询,把检索结果及时提供给有关用户,可以查出最新相关信息,具有连续性,新颖性回溯检索:根据用户需求,检索系统的信息进行全面的检索,将检索结果一次性提供给用户,具有一次性,广泛性的特点、3检索语言的定义:是应文献信息的加工、存储和检索的共同需要而发展起来的专门语言,它是表达概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。

4、检索语言的类型:a、按语言的结构原理划分为分类语言和主题语言;b、按语言标识的组配方式分为先组式检索语言和后组式检索语言5、信息检索系统的4个基本要素:a、检索文档;b、技术设备;c、语言工具;d、其他人员检索文档:是标有检索标识的信息集合;技术设备:是能从存储信息及其标识以及实现存储和检索操作的各种技术设备;语言工具:指检索语言、标引规则、输入和输出标准等;其他人员:包括信息加工标识人员、录入人员、检索人员、系统管理维护人员等6信息检索的类型P64(重要):目录、题录、文摘、索引。

目录:是一批相关文献的著录集合,是以报道文献的出版信息为主要功能的工具;题录:是将图书、报刊等文献中论文的篇目按照一定的排检索方法编排而成的,供人们查找篇目出处的工具,按论文的片名顺序排列,具有大、全、快的特点。

著录项包括篇名、著者、来源出处。

文摘:是以精炼的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具,文摘可以分为指示性、报道性、和评论性3中类型;索引:是对一组信息集合的系统化的指引,一般只起指引特定信息内容及其存储地址的作用,7、评价检索系统的标准:检索的方便性、收录的全面性、检索的效率、报道及时性检索的方便性由多方面因素决定,如信息的编排组织是否科学合理,索引系统是否完备、索引深度是否适中,标识的专指度是否足够等。

收录的全面性:指它收录的文献信息是否全面,有3个衡量指标;覆盖面、摘贮率、报道数检索的效率:查全率、查准率2个衡量指标。

查全率指从检索系统检出的有关某课题的文献信息数据与检索系统中实际的该题有关的文献信息总量之比率。

查准率是指从检索系统检出的有关某课题文献信息数量与检出的文献信息总量之比率。

报道及时性:是指它所报到新出现文献信息的速度一般用时差来衡量,时差指文献信息从其发表到检索系统提供给用户的这段时间间隔8、信息检索的基本程序;a.分析研究课题,明确检索要求b、选择检索工具或检索系统c、确定检索途径和检索策略d、选择检索方法e、索取原始文献(例如专利文献,标准文献和学术论文)9、描述信息检索的基本方法:a顺差法:指按照时间的顺序由远及近的利用检索进行文献信息检索的方法,特点:漏检率误检率低,但是工作量大b、倒差法:由近及远,从新到旧逆着时间的顺序利用检索工具进行文献信息检索的方法c、抽查法:针对检索课题的特点选择有关该课题的文献信息最可能出现或最多出现的时段利用检索工具进行重点检索的方法d、追溯法:指不利用一般的检索工具,而是利用已经掌握的文献末尾所列的参考文献进行逐一的追溯查找“引文”的一种最简单的扩大情况来源的方法e、综合法:又称循环法,把上述方法加以综合运用的方法,既要利用检索工具进行常规检索,又要利用文献后所附参考文献进行追溯检索,分期分段的交替使用几种方法10、影响检索效率的因素:检索的语言的功能、检索途径的数量、著录标引的质量、检索策略的优劣、检索人员的素质11、信息检索的基本策略:最专指面优先策略、最少记录面优先策略、积木型概念组面策略、引文珠形增长策略,逐次分馏策略12、扩检时,即提高查全率时,调整检索式的主要方法:选全同意词并以“or”方式与原词连接后加入到检索式中;降低检索词的专指度,从词表或检索文献中选一些上位词或相关词;采用分类号进行检索;删除某个不甚重要的概念组面,减少and运算;取消某些过严的限制符;调整位置算符,13、缩检时即提高查准率时,调整检索式的主要方法:调高检索词的专指度;增加或换用下位词和专指性较强的自由词;增加概念组面用and连接一些进一步限定主题概念的相关检索项;限制检索词出项的可检字段;利用文献的外表特征限制;用逻辑非not来排除一些无关的检索项;进行加权检索;调整位置算符第四章网络信息检索1、网络信息资源的定义:是指以数字化形式记录的,以多媒体形式表达的,存贮在网络计算机磁介质、光介质以及各类通信介质上的,并通过计算机网络通信方式进行传递的信息内容的集合。

2、因特网上拥有的信息资源类型:联机数据库;联机馆藏目录库;专利信息;网络期刊;网上报纸;教育信息;消闲娱乐性信息。

3、网络信息资源的新特点(重要):a、多样化特点b、因特网价值的差异性c、信息分布和构成缺乏结构和组织d、信息发布具有很大的自由性和任意性e、正式出版物和非正式信息交流交织在一起f、信息交流范围广4、网络信息资源的评价的方法:a、第三方评价法b、用户评价方式c、网络计量法5、计算机信息检索的发展阶段:a、脱机检索阶段b、联机检索阶段c、光盘检索阶段d、网络化检索阶段6、相关网络信息检索技术(重要):(P92)截词检索(前截词,后截词,中间截词)、布尔逻辑检索(and表示扩大检索范围,or表式缩小检索范围,not表示限定检索范围)7、搜索引擎的原理(由哪几部分组成):P988、搜索引擎的使用技巧:P999、网络目录的定义和主要方法:网络目录又称分类点目录、专题目录或主题指南、站点导航系统等它是由专家从茫茫网海中挑选出质量较高的网页,以某种分类法进行组织,并和检索法集成在一起的辅助信息查询方式。

10、网络目录分类所使用的主要方法:主题分类法;学科分类法;分面组配法;体系分类法11、用万方数据库检索的一般步骤:C卷简答8、搜索引擎主要包括哪四个模块:数据的采集和存储;信息索引的建立;检索界面的建立;检索结果的相关性处理9、信息资源存储的主要技术有哪些?答:纸张印刷存储技术;缩微存储技术;声像存储技术;计算机存储技术;光盘存储技术10网络信息资源有哪些新特点?(具体见P72)答:(1)复杂性和多样性空前增加;(2)11、信息检索有哪几种基本方法?答:(1)顺查法:指按照时间的顺序由远及近的利用检索系统进行文献信息检索的方法,特点:漏检率、误检率低,但是工作量大。

相关文档
最新文档