信息检索复习资料
信息检索_复习资料
信息检索_复习资料第1章文献信息概论 (1)1.1 信息时代与信息文化课 (1)1.2 文献信息的基本概念 (2)1.2.1.1信息的定义 (2)1.2.2 文献的级别和载体类型 (2)1.2.3 印刷型文献的出版类型 (3)1.4、国内文献信息系统包括: (6)1.4.4 文献信息的学科分布规律 (6)第2章信息检索原理 (6)2.1.1信息检索的定义和类型 (6)1.信息检索的定义 (6)1.2.3文献的内部特征和外部特征 (6)2.2.1信息检索的一般原理 (6)2.2.3 检索语言 (7)2.2. 信息检索系统 (8)2.2.1 书目检索系统的内容组成 (8) 2.2.2印刷型信息检索系统的类型 (8) 2.3文献信息检索的方法 (9)2.3.1文献信息检索方法的类型 (10) 2.5 信息检索语言 (10)2.5.2分类检索语言 (11)2.6 著者检索原理 (12)2.6.1 著者索引的排序方式 (12)第三章事实数据检索与参考工具概述 (13) 3.2事实与数据检索概述 (13)3.2参考工具书概述 (13)3.3综合性参考工具举要 (16)第四章图书报刊文献检索原理 (19)第一节书目及其作用和类型 (19)第二节查近现代图书和报刊的出版 (20)4.1 计算机情报检索概述 (25)4.1.2 计算机情报检索的必备条件 (25)4.1.3计算机情报检索与手工检索的比较 (25)4.2 文献信息数据库原理 (25)4.2.1 数据库的定义和类型 (26)4.2.2 数据库构成: (26)4.3.5 检索策略构成和调整方法 (27)第4章(国内外网络全文数据库) (29)4、2电子图书和书目数据库 (29)第1章文献信息概论1.1 信息时代与信息文化课文献课是知识时代培养学生终身所需的信息意识与获取文献信息能力的重要课程,是一门科学方法课。
在社会信息化的进程中,文献信息检索的意义日益变得重要:1、文献信息数量激增。
信息检索复习资料
一、名词解释:文献:是记录有一切知识的载体,是属于存贮型的固态的载体,如印刷件、缩微制品、磁盘和光盘等具有存贮型和传播型的信息载体。
检索:是根据特定的需求,运用某种检索工具,按照一定方法,去寻找资料或信息的工作过程。
这种方法利用的是有序化的信息系统和信息业提供感到服务来满足用户的信息需求的。
信息检索:是通过分析、综合等手段进行信息加工后,获取隐含在信息源中的知识的过程。
信息意识:简单的说就是人们利用信息系统获取信息的内在动因,具体表现为信息的敏感性、选择能力和消化吸收能力。
信息素质(信息素养):从各种信息源中检索、评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。
具有信息素养的日呢,也就具备了终身学习的能力。
文献信息、书目:是指一批相关文献的记录,其基本功能是其基本功能是反映某一地区、某一时期在某一领域中出版物的信息。
馆藏目录:是查找文献应该首先考虑的检索工具,是某个图书馆或者档案馆收藏文献、图书的总体目录(是题录性的检索工具)。
图书馆的目录种类繁多,职能各不相同。
索引:是揭示文献内容出处,提供文献查考线索的检索工具。
没有索引,各种海洋一样的文献资料就无法被利用,分篇目索引和内容索引两种。
文摘:是一种揭示文献外部特征、又通过摘录文献要点报道文献内容的工具,文摘是集树木、索引和一次文献三者与一体的检索工具。
年鉴:是以描述和统计的方式逐年提供某一年度、某一领域信息的工具书,或者说是相应年度内的信息的汇编。
手册:是汇集某一学科领域或业务部门专门知识的工具书,是真带当前时间中的需要,以简明扼要的方式提供的具体、使用的资料,工随时翻检查阅的一种小型工具书。
百科全书:是会萃一切门类或某一门类知识。
以概要方式提供有关信息的多功能工具书。
著者途径:即以著者姓名为检索点查找文献的途径,一般有著者姓名和文献号组成。
题名途径:根据已知的书名、刊名、篇名按字顺规则在工具书中查找所需要文献的途径。
序号途径:即指按号码顺序如报告号、专利号、标准号、入馆号查找文献的方法。
信息检索期末复习材料
信息检索第一章信息检索基础1、信息的含义:广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现得一种普遍形式。
狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实2、一次文献:指作者以本人的研究成果为基本素材而创作或撰写的文献。
(著作、报纸、期刊、会议资料、研究报告、政府出版物、专利说明书、产品样本、标准文献、学位论文等)二次文献:指对一次文献进行加工、提炼和压缩后所得到的报道性产物。
检索工具书和网上引擎是典型的二次文献。
(目录、题录、索引、文摘)三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的具体知识、数据。
如综述、百科全书、辞典等。
3、信息检索的含义:从大量的信息集合中找出所需信息的过程与方法。
广义:包含信息储存和检索两部分狭义:信息检索4、信息检索的原理:将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配5、信息检索的意义:①信息检索是有效利用信息资源、实现其最大价值的科学方法②信息检索是再学习的工具、是获取知识的有效途径③信息检索能有效地提高科研工作的效率、节省人力物力及时间6、信息检索的历程:手工检索、计算机检索7、信息检索的方法:直接浏览法、常用法(顺查法、倒查法、抽查法)、追溯法、综合法查全率和查准率的关系、局限性1)查全率=[检出的相关文献信息量/检索系统中相关文献信息总量]×100%=[a/(a+c)]×100%2)查准率=[检出的相关文献信息量/检出文献信息总量]×100%=[a/(a+b)]×100%3)查全率与查准率的局限性:①对文献相关性的判断不可避免的带有主观性和模糊性②全部相关文献的总量很难确定③“相关文献”总是被同等对待,实际上其相关程度是有区别的9、影响检索效果的因素:①标引上网质量②检索语言的性能③检索途径的数量④检索策略的优劣⑤检索人员的素质第二章检索语言1、检索语言的定义:广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。
信息检索复习资料
信息检索公选课复习资料1.信息是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。
2.知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认知和总结,是人的大脑通过思维重新组合的系统化的信息的集合。
3.情报是人们用来解决特定问题所需要的、经过激活过程活化了的具有使用价值的知识或信息。
4.文献是在存储检索利用或传递记录信息的过程中,可作为一个单元处理的,在载体内、载体上或依附载体而存有信息或数据的载体。
5.会议文献是指在国内外学术或非学术会议上发表的论文或报告。
6.学位论文是高等院校和科研机构的毕业生为获取各级学位在导师指导下撰写和提交和科学研究、科学实验的书面报告。
7.著录是对文献内容和形式特征进行选择和记录的过程。
8.数据检索是指特定的数值型数据为对象的检索。
9.按信息的加工层次分类:(含义)一次文献:原始文献,图书、报纸、期刊、会议纪录、专利报告等二次文献:目录、题录、索引、文摘三次文献:论文丛集、综述、年鉴百科全书一次信息资源 (原始文献):以作者本人在生产和科研中所取得的成果为依据而创作的原始文献所传递的信息资源。
二次信息资源(检索工具):将分散的、无组织的一次信息资源,按一定的原则加工、整理、简化、组织成为系统的、便于查找利用的信息资源。
三次信息资源(参考性文献):在合理利用二次信息资源的基础上,选用一次信息资源的内容,根据一定的需要、目的进行分析、综合或浓缩重组而得到的信息。
二次信息资源与三次信息资源的区别:对象不同:二次信息资源以“篇”或“本”为单位进行加工;三次信息资源则归纳了较多的一次信息内容用途不同:二次信息资源为检索一次信息的工具;三次信息资源能直接提供检索答案.10. 在印刷型资源时代,事实与数据检索工具主要依靠各类参考工具书完成各种数据或事实的查询。
11. 文献检索方法:指文献信息资源的一般检索方法,也是利用各种检索工具检索文献信息资料的最常用的方法。
信息检索重点复习资料
信息检索重点复习资料第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
信息素养:人们在解答问题时利用信息的技术和技能。
信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。
信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。
信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。
存储是检索的基础,检索是存储的目的。
信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。
信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。
其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。
信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。
信息检索的历史:最早的信息检索主要依靠信息分类。
1手工检索2机械信息检索。
3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型 1浏览型模型:扁平式模型、结构导向模型、超文本模型2检索型模型:结构化模型、基于内容的检索型模型。
信息检索模型是信息检索的核心。
信息检索系统:是具有信息存储和信息查询功能的一类服务设施。
信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS. 信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。
信息检索复习资料(有答案版)
1.请说明一次文献、二次文献和三次文献的特点和功用。
(1)一次文献(Primary Document):通常是指原始制作,即作者以本人的研究成果为基本素材而创作(或撰写)的文献。
如期刊论文、科技报告、会议论文、专利说明书(2)二次文献(Secondary Document):是指文献情报工作者对一次文献进行加工整理后所得到的产物,也是为了便于管理和利用一次文献,由文献情报工作人员编辑、出版和积累起来的工具性的文献。
二次文献的重要性在于可以帮助人们查找一次文献。
如目录、题录、文摘、索引、各种书目数据库(3)三次文献(Tertiary Document):是指利用二次文献,选用一次文献内容,经综合,分析和评述后形成的指南性文献。
包括综述研究和参考工具两类。
如综述、述评、词典、百科全书、年鉴、指南数据库、书目之书目2.请说明题录目录文摘的特点以及区别(1)题录是揭示和报导单篇文献外表特征的工具。
特点:以单篇文献为著录对象(2)目录是系统积累和提供图书、期刊和其它单行本的名称、收藏单位和索取号等外表特征的揭示和报导的工具。
特点:以单位出版物为著录对象,反映馆藏情况,主要揭示文献外部特征(3)文摘是以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索工具。
特点:带摘要的题录3. 布拉德伏特文献文献分散定律和期刊影响因子的概念(1)布拉德福文献分散定律:本专业文献的1/3刊登在本专业核心期刊上,另外的2/3则分散在其他的相关期刊和边缘期刊上。
如果将科技期刊按其刊载某专业论文数量多寡,以递减顺序排列,则可分出一个核心区和相继的几个领域,每区刊载的论文量相等,此时核心期刊和相继区域期刊数量成1:n:n2......的关系。
(2)期刊影响因子的概念是:某一种期刊在第三年得到的前两年的引文数与该刊前两年的总论文数之比。
4. 请阐述信息、知识、情报的概念,并分析它们三者之间的关系。
信息检索复习知识点
信息检索复习知识点1.信息(Information)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。
* 信息的属性——客观存在性* 信息的作用——消除不确定性* 信息的形式——数据、消息等事实2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源3. 信息用户Information User信息的使用者即是信息用户。
使用的情况可以包括需要信息、接受信息和利用信息。
4. 信息需求Information Demand人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。
我们把意识到的信息需要定义为信息需求5. 信息检索Information Retrieval对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。
6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。
* 信息意识* 信息能力* 信息道德7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。
8. 经济领域的特征a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势;b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;c.能源消耗少,污染得以控制;d.知识成为社会发展的巨大资源。
9. 社会、文化、生活方面的特征10.社会观念上的特征11当代信息环境特征描述* 信息超载严重信息超载又称信息泛滥或信息爆炸。
它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。
* 信息失衡明显所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。
信息检索复习要点
1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。
这种附着在各种载体上的记录统称为文献。
2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。
3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。
信息是物质存在的方式、形式和运动规律的表征。
人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。
如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。
由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。
4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。
5、信息资源的构成可从不同的层次和角度来划分:一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。
二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。
(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。
例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。
按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。
二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。
信息检索 复习资料
第一部分:基本常识1.文献按照出版形式可分为哪几种类型?举例。
图书、期刊、报纸、特种文献。
图书:专著、文集、教科书、普及读物、百科全书、年鉴、手册、词典等期刊:化学学报、煤炭学报、电工技术学报、高等教育研究、建筑工程与科学在CNKI 期刊全文数据库中检到共209条记录:国际城市规划、建筑结构学报、交通运输工程学报、建筑经济、土木工程学报、岩土工程学报、岩土力学、空间结构、地震工程与工程振动、中国给水排水、工程力学世界建筑工业建筑工程勘察中外建筑工程建设等。
报纸:人民日报特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。
2现代科技文献具有的特点哪些?答:(1)数量多、增长快, (2)出版形式多、文种多,(3)文献异常分散, (4)文献失效加快, (5)报道内容重复交叉, (6)文献总体质量下降3什么是核心文献、相关文献和边缘文献?答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。
如核心期刊等。
相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。
相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。
4 什么是文献?构成文献的有哪四个要素?答:文献的定义是记录有知识的一切载体称为文献。
构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。
5 电子文献的主要类型和文件格式是什么?答:(1)按照载体的形态,电子文献可以有软磁盘(FD)、只读光盘(CD-ROM)、可擦写光盘(CD-RW )等之分;(2)按照文献的电子格式,电子文献有文本格式的txt文件、doc文件、pdf文件,图像格式的 gif文件、jpg文件以及标记文件格式的 html文件和xml文件之分;(3)按照出版周期和内容特点,电子文献可以有电子期刊,电子图书,电子报纸以及数据库等之分;(4)按照内容的性质和时效性,电子文献可以有论文文献和动态消息之分;(5)按照版权状况,电子文献又可分为有版权电子文献和无版权电子文献两类;(6)从文献信息利用的角度来看,可分为有版权的电子期刊、电子图书、报告的学术价值相对较高,而单篇论文和动态性的电子文献有时虽然没有注明版权,也有相当的参考价值。
信息检索复习资料
信息检索复习资料一、名词解释1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。
2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。
3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。
4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。
5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。
6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。
7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。
8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。
9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。
10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。
11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。
12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
信息检索复习资料
信息检索复习资料科学信息检索与应用第一章绪论1.情报检索与科学研究关系2.个体研究阶段,世界上最早出现的手工检索工具:答:1821年瑞士出版的《物理科学进展年报》1830年德国创办的文摘杂志《药学总览》3.社会化阶段,研制大型检索工具:答:美国1884年创办了《工程索引》(EI)美国1907年创办了《化学文摘》(CA)美国1926年创办了《生物学文摘》(BA)英国1896年创办了《科学文摘》(SA)4.自动化阶段,产生新的检索理论:答:1951年 Taube,M 提出:单元词组配法1958年 Citron,J 提出:轮排索引1958年 Luhn,H 提出:定题服务(SDI)二战期间…案例: 曼哈顿工程 - 阿波罗计划5.科技文献概念答:记录在载体上的科技知识,包括科技事实、数据、理论方法、构思和假设等。
(文献/科技文献)6.文献信息源,按文献载体形式划分:答:印刷型文献:指印刷术发明之后,以纸张为存储载体,通过油印、铅印、胶印、静电复印等手段,将文字固化在纸张上所形成的文献。
缩微型文献:又称为缩微复制品文献,它是以感光材料为载体,以印刷型文献为母本,采用光学摄影技术,将文献的体积浓缩而固化到载体上。
机读型文献:机读型文献的全称为计算机阅读型,是以磁性材料为存储载体,以穿孔、打字或光学字符识别装置为记录手段而形成的文献。
声像型文献:又称为视听型文献,它是以磁性材料或感光材料为载体,借助特定的机械设备直接记录声音信息和图像信息所形成的文献。
7.文献信息源,按文献的出版形式划分:答:科技图书(Science and Technical Book)科学期刊(Science and Technical Journal)科技报告(Science and Technical Report)专利文献(Patent Document)会议文献(Conference Paper)学位论文(Degree Thesis)标准文献(Standard Literature)政府出版物(Government Document)产品样本(Product Stylebook )技术档案(T echnical Files)8.文献信息源,按文献的产生、加工、用途划分为:答:一次文献,又称原始文献。
信息检索复习
一、电子信息资源特点1.存储形式多样化2.资源数字化3.可交流程度高4.方便利用5.内容丰富6.载体容量大二、信息检索步骤①分析检索课题,明确检索需求:1.检索的目的与意图;2.学科范围与主题概念;3.文献性质、类型与数量②制定检索策略③选择检索系统与数据库④确定检索词和检索途径,编制逻辑检索式⑤检索策略的调整三、我国计算机信息存储的进步经历的过程1.引进开发过外磁带、开展定题服务2.开发国际联机检索终端技术3.自建数据库4.微型计算机和国际联机往信息存取的发展四、计算机信息存取系统评价计算机信息存取系统是利用计算机对一定范围的信息集合进行选择、记录、存储与排序,以便用户采用科学手段与技术从中获取必要和充分信息资料的计算机信息系统。
1.系统研制目标性指标2.数据范围、更新频率与数据来源指标3.系统的技术水平和运行质量指标4.数据组织形式与用户界面指标5.检索方式和检索策略指标6.检索效果与辅助索引指标7.系统响应速度及费用指标8.输出格式指标综上所述:信息存取系统的评价指标由多方面因素构成,实际上影响系统质量与效益的情况也很复杂。
一个科学合理的评价指标体系的构成应该具有整体性、多向性、可测性及动态性等特点。
五、First Search联机存取的主要特色1.提供一体化服务2.强大的检索手段3.灵活多样的辅助索引4.专门配置了Web界面的管理模块5.数据库记录中包含馆藏信息6.信息量大7.面向最终用户8.收费低六、基于内容的多媒体信息检索特点①提供重建查询机制②查询方式的交互性③相似度检验④多媒体同步检索技术⑤多层次检索信息.七、基于内容检索的关键技术①信息模型和表示(超文本模型、文献模型、信息元模型)②检索技术③查询语言④信息压缩和恢复⑤信息存储管理⑥多媒体同步技术八、网络信息检索的策略1.明确检索目标,确定检索项2.选定适合的检索工具3.正确对待检索结果4.提高上网速度,选择最佳上网时间九、网络信息存取的特点1.存取范围覆盖Internet所有资源2.传统检索方法与全新检索技术相结合3.用户界面友好且操作方便4.具备良好的导航和编辑功能5.具有用户透明度十、纸质文献的特点和个性纸质文献类型的特点:1.携带、书写、保存方便;2.直观性;3.以纸质为载体的艺术作品的不可替代性;4.纸质文献作为收藏品的不可替代性个性:1纸质文献是知识信息的存在形式2传递信息是纸质文献的又一特征3纸质文献资源可以多次重复使用,可以进行复制和传递4纸质文献所包含的知识信息是一种相对固化的信息十一、简述中国专利文献特点及检索途径中国专利局发行的专利文献包括专利说明书,专利公报和专利年度索引等1,专利文献手工检索(分类途径,申请人和专利权人途径,专利序号途径)2,国内专利网检索(中国专利信息网,中国知识产权局专利检索系统,中国知识产权网)十二、存储技术发展趋势①纸质印刷存储、缩微存储、磁存储、光盘存储长期并存,互为补充,这是信息存储发展的一个趋势。
信息检索复习资料
信息检索复习资料1.信息:信息是事物运动的状态与方式,是物质的一种属性。
2.知识:知识是人类对客观事物规律的认识,是人的主观世界对于客观世界的概括和如实反映。
3.情报:情报就是人们在一定的时间内为一定的目的而传递的有使用价值的知识或信息。
4.信息、知识、情报三者之间的关系:情报来源于知识,知识又来源于信息,用逻辑来表示:情报∈知识∈信息。
5.文献:文献,记录有知识的一切载体。
6.文献的三要素:知识(文献的内容),载体(文献的物质形式),记录(将内容固化在载体上的手段或方式)。
7.科技文献的特点:数量急剧增长;内容交叉重复;文献文版分散;文献失效加快;文献类型增多;文献语种增多。
8.科技文献的类型:1>按出版形式划分:科技图书;科技期刊;科技报告;会议文献;专利文献;学位论文;标准文献;产品资料;政府出版物;技术档案。
(主)2>按载体形态划分:印刷型文献;缩微型文献;声像型文献;机读型文献。
(主)3>按文献内容的加工深度划分:零次文献;一次文献;二次文献;三次文献。
4>按相对利用率划分:核心文献;相关文献;边缘文献。
*科技图书:一般分为阅读类图书和参考类图书。
前者包括教科书、专著和论文集等;后者包括各种参考工具书,如词典、百科全书、手册、年鉴、名录、表谱等。
9.信息检索:按检索对象的内容进行划分,信息检索分成了文献检索、数据检索、事实检索。
(作用、意义)文献检索是以文献为检索对象的一种检索,凡是查找某一年主题、某一学科、某一著者的有关文献均属于文献检索的范畴;文献检索是一种相关性检索,即检索系统不直接解答用户提出的技术问题本身,只提供与之相关的文献供用户参考;数据检索是以数据为检索对象,从已收藏的数据资料中查找出特定数据的过程。
数据检索是一种确定性检索,系统要直接回答用户提出的问题,提供用户所需要的确切的数据;事实检索即通过对信息集合中已有的基本事实或数据进行处理,然后得出新的(即未直接存入信息集合中的)事实的过程。
信息检索复习资料整理
信息检索复习资料第一章1、文献的定义:记录有知识的一切载体。
情报的属性:知识性、传递性、效用性。
文献的四个要素:知识内容、记录符号、物质载体、记录手段。
信息、知识、情报与文献的关系包含关系,转化关系,交叉关系信息的定义:信息是物质存在的一种方式、形态和运动状态,也是事物的一种普遍属性,一般指数据消息中包含的意义,可以是消息中所描述事件的不确定性减少。
知识的定义:P10知识是人类社会实践经验的总结,是人类智慧的结晶,是人的大脑通过思维对客观事物本质与规律性的认识和掌握。
情报的定义:人们为解决某一特定的问题而搜索、传递有特定效用的知识或信息。
文献信息分类——按物质载体及记录方式分类:手写型(古代手稿等)印刷型(图书、报纸等)缩微型(胶卷等介质类)声像型(唱片、录音带等)机读型(光盘、磁盘类)按加工程度分类:一次文献(个人期刊、科技报告、会议论文等等,首次公开发表的文献)特点:内容新颖、成熟、丰富,数量庞大。
二次文献(包括目录、索引、文摘等数据库,是数据库的搜索结果。
)特点:汇集性、检索性、报道性。
三次文献(图书是三次文献)特点:慨括性强、文字精炼、知识面广按出版形式分类:图书:ISBN(国际标准书号)表示汉语;209表示出版社号;03949表示书序号;X表示计算机校验码。
图书特点:成熟、可靠期刊:ISSN(国际标准刊号)期刊是最重要的信息源,从期刊中获得的信息量,占整个科技信息源的60%-70%以上。
期刊字段:题名、作者、刊名、卷期、机构期刊特点:速度快、能及时反应研究动态。
报纸:信息量大、通俗、传播面广、但资料庞杂零散。
科技报告:表述严谨、数据可靠,参考价值高。
学位论文:D是学位论文的缩写,有题名、作者、指导老师、学位授予单位等等字段。
会议文献:专业领域集中,针对性强。
包括题名、作者、会议名称等等字段。
专利文献:专利文献是世界上最大的信息技术源,具有新颖性、创造性、实用性等特点。
专利的类型:发明专利(延迟审查制;1)、实用新型专利(形式审查;2)、外观设计(形式审查;3)专利的特性:专有性、时间性、地域性CN 200910053606.0CN:中国;2009:年份;1:发明专利;0053606:申请专利的流水号;0:计算机校验码。
信息检索复习资料
信息检索的概念:(1)广义:将信息按一定的方式组织,存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索的两个过程。
(2)狭义:有序化信息的检索查找。
信息检索的原理:将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中就检索所需的信息。
为什么检索和存储是不可分割的?因为信息检索的全过程包括存储和检索两个过程,存储过程主要是利用检索语言对文献进行标引。
检索过程按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。
其实,检索过程实际上是存储过程的逆过程。
信息检索的方法:顺查法,倒查法,抽查法,追朔法,循环法。
信息检索途径:(1)内部特征途径A.分类途径:按照文献资料所属学科类别进行检索的途径。
B.主题途经:通过文献资料的内容主题进行检索的途径。
(2)外部特征途径A.题名途径:根据文献题名来查找文献的途径。
B.著者途径:根据已知的文献著者来查找文献的途径。
C.文献编号途径:以文献的编号为特征编排和检索文件。
D.目录检索途径:利用目录来检索信息的方法。
E.机构检索法:F.引文检索途径:利用文献间的引证关系来检索文献的方法。
布尔模型的优缺点:优点:(1)简单,形式简洁,易于理解。
(2)可操作性强,应用广泛。
(3)构成的逻辑提问式可以表达与用户思维相一致的查询要求,提供非常精确的语义概念。
(4)能处理结构化提问。
缺点:(1)表达用户复杂需求的效果欠佳。
(2)准确匹配无法提供定量比较。
(3)匹配标准不尽合理。
(4)检索结果不易控制。
概率排序原则(1997,罗宾逊):如果一个检索系统对用户的每一个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。
计算机信息检索:在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。
信息检索复习参考资料
信息检索复习参考资料1.信息检索的意义:(1)信息检索是开发资源的有效途径。
(2)信息检索是科学研究的重要环节。
(3)信息检索是科学决策的前提。
(4)信息检索是信息素养教育的主要内容。
2.信息意识:个人对信息的敏感性,体现在对信息价值的自觉认识及敏锐的判断力和分析力上。
3.信息检索的作用:(1)提高信息获取的效率。
(2)增强决策的科学性。
(3)促进信息意识的培养。
(4)提高工作的成功率。
(5)提升独立学习的能力。
4.手工信息检索的定义:利用印刷本的检索工具(目录、索引、文摘、参考工具书等)来查找信息资料的过程,这是一种传统而又基础的检索方式。
5.脱机检索的主要特点:自动化:检索词汇间关系表达;批处理;委托检索;数据存取与数据通信能力都比较差;时效性不强。
6.联机检索的主要特点:信息丰富,质量高;书目索引为主;更新速度较快;检索速度快,检索效率高;检索全面性系统性较为理想;命令式,操作复杂;界面不友好;费用高。
7.专利文献的定义:专利是专利权所保护的技术方案或设计,包括发明、实用新型和外观设计。
8.标准文献的定义:由主管标准化工作的权威机构主持制定颁布的,记录各类具有标准性质的文件。
9.学位论文分为:学士论文、硕士论文和博士论文。
10.政府文献的定义:政府文献是由政府支付出版的,或依据法律或国际组织(如联合国、欧盟、联合国教科文组织等)要求出版的文献,又称为政府出版物。
文献标识符[M]。
11.文献的特点:(1)内容系统。
(2)具有等级结构:a.一次文献也称原始文献。
b.二次文献是集合文献。
c.三次文献又称参考性文献。
(3)分布集中又分散。
(4)文献老化。
12.信息来源的特点:(1)普遍性。
(2)潜伏性。
(3)关联性。
(4)无序性。
13.线性检索工具:(1)目录。
(2)索引。
(3)文献。
14.指南的定义:指南是包含可全面满足用户进行某一操作需求的介绍信息的文献。
指南主要回答各种常识性的问题。
15.检索界面的风格主要有三种:单一检索框界面风格、多个检索框界面风格、分类导航界面风格。
信息检索复习
信息检索复习1.文献信息的类型和特点?划分文献类型的方法有哪些?文献信息资源是人类用文字、数据、图像、声频、视频等方式记录在一定载体上的信息资源。
特点:知识性:知识性是文献的本质,离开知识,文献便不存在。
传递性:文献能使人类的知识相互传播和发展。
动态性:文献所含的知识信息随着社会和科技的发展在不断地运动。
划分方法:按载体材料划分:印刷型、缩微型、声像型、电子型按撰写目的和文体划分:著作、学术论文、专利说明书、科技报告、技术标准按加工深度划分:零次文献、一次文献、二次文献、三次文献、高次文献2.一、二、三次文献信息的主要代表有哪些?它们各有何特点?一次:专著、学术论文、专利说明书、科技报告等。
具创造性的特点。
可直接借鉴和参考使用,是人们检索和利用的主要对象。
二次:各种目录、索引(题录)和文摘特点:汇集性和检索性。
其重要性在于:它提供了一次文献信息资源的线索,三次:参考工具书、百科全书、年鉴、手册、名录、评述或综述等。
具有综合性强、针对性强,系统性好的特点。
有较高的利用价值。
3.信息检索的类型有那几种?分别检索哪种数据? 各有何特点?书目信息检索:相关性检索,提供线索全文信息检索:直接查找原文数据信息检索:查找数值型信息事实信息检索:查找发生的事件4. 书目信息检索的对象是什么?标题、作者、来源出处、摘要及收藏地点5. 信息检索的技术有哪些?布尔检索、词位(近义)检索、截词检索、限制检索6. 如何正确使用各种逻辑符号编写提问式,正确表达研究课题对信息的需求?7 . 数据库的结构和类型及其特点?参考数据库:主要存储一系列描述性信息,指引用户到另一信息源以获得完整的原始信息的一类数据库.(书目,指南)源数据库:主要存储全文、数值、结构式等信息。
能直接提供原始文献信息或具体数据,用户不必再转查其它信息源的数据库8.在维普中文科技期刊数据库、中国期刊全文数据库中可采用系统提供的哪些功能来提高信息的查全率和查准率?同名词,模糊,同名作者。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
10国内通用的分类法有哪两种?它们的类号设置有什么主要区别?
国内通用两种分类法是《中国图书馆分类法》和《中国科学院图书分类法》。它们的类号设置的区别是《中国图书馆分类法》混合使用字母和数字,而《中国科学院图书分类法》使用纯数字作为类号。
报纸:人民日报
特种文献:科技报告、会议文献、专利文献、学位论文、政府出版物、标准文献、产品资料、科技档案
美国政府的四大报告1、国防部的AD报告2、商业部的PB报告3、国家航空及宇航局的NASA报告4、能源部的DOE报告。
2现代科技文献具有的特点哪些?
答:(1)数量多、增长快,(2)出版形式多、文种多,(3)文献异常分散,(4)文献失效加快,(5)报道内容重复交叉,(6)文献总体质量下降
26简述CNKI中国期刊全文数据库的二次检索?它是否只能检索二次?
二次检索是在前次检索结果的范围内再次进行查找,以达到缩小检索范围,使检索结果逐步接近课题要求的目的。其作用相当于在前后两次检索之间做逻辑与(AND)运算。不管是初级还是高级检索界面,只要检索结果的篇数允许,二次检索可以反复做,直到满足课题要求为止。
20什么是布尔逻辑算符?布尔逻辑算符一般有哪几种?
规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑或(OR)、逻辑与(AND)和逻辑非(NOT)。
21优先算符“( )”有什么作用?
优先算符“( )”的作用是在多个逻辑符号混合使用时,改变它们的运算顺序。布尔逻辑运算符的优先级顺序:()〉NOT〉AND〉OR.
索引与目录的根本区别就在于著录的对象不同,目录所著录的是一个完整的出版单位,如一种图书、一种期刊等,而索引所著录的则是完整的出版物的某一部分、某一观点、某一知识单元,因此,索引能解决目录只对文献作整体的宏观著录的不足,满足读者对文献内容单元的微观揭示和检索的要求,提高文献检索的深度和检索效率。
目录:按次序编排供查考的图书或篇章的名目
3什么是核心文献、相关文献和边缘文献?
答:核心文献通常是指与本学科发展水平、发展动向密切相关的一些文献。如核心期刊等。相关文献和边缘文献是指内容与学科的关系相对疏远一些的文献。相关文献和边缘文献是本学科和其它学科相互渗透、互相结合的结果。
4什么是文献?构成文献的有哪四个要素?
答:文献的定义是录有知识的一切载体称为文献。构成文献的四要素是:知识内容,信息符号,载体材料,记录方式。
27 CNKI中国期刊全文数据库初级检索和高级检索的区别在那里?
区别在二个方面:
1)检索的字段数量不同。初级检索的字段数量只有一个,因此,它每次只能检索对一个检索字段的检索词进行检索。高级检索的字段有两个,它可以同时对两个不同的检索字段的检索词进行检索。
2)检索的布尔逻辑算符不同。初级检索的字段数量只有一个,即利用二次检索对前一次检索结果的"与"检索。在高级检索中除了可以利用的字段有两个,利用二次检索对前一次检索结果的"与"检索之外,它可以同时对两个不同的检索字段的检索词进行"或"和检索。
22什么是位置算符?它在文献检索中起什么作用?
位置算符又称邻接算符,适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。位置算符是提高检索查准率的一种重要手段。
23需要扩大检索范围时,如何调整检索策略?
需要扩大检索范围,调整策略的方法有:①减少“与(AND)”算符,增加同义词或同族相关词用逻辑或(OR)将它们连接起来;②在词干相同的单词后使用截词符“?”;③去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。
25 CNKI中国期刊全文数据库共有几种基本的检索方法?
共有三种,它们是:
分类导航。利用系统提供的专辑栏目及其展开的分类导航树查找相关文献,适用于对一个学科的文献做全面调查的场合。
初级检索。是利用检索项对某个指定字段进行的检索。
高级检索。是指设置多个检索条件和逻辑组合关系,查找同时满足这些条件和逻辑关系的文献。
11分类法中的上位类、下位类和同位类?
在《中图法》以及任何类似的分类表中,被区分的类称为上位类。相对地说,区分出来的类就是下位类。处于同一上位类下的同一层次的下位类称为同位类。
12多概念主题的文献如何确定分类号?
给多概念课题确定分类号的方法,首先需要应用单概念课题分类方法,其次要区分属于并列概念课题还是应用性课题。如果是并列概念课题,凡是有主次者,应取其重点或主要研究对象归类;凡是无主次的,课题所涉及的类别都应该查找。如果属于应用性课题,应用于一个领域的应在所应用或受影响的类目中查找。应用于多个领域的则在该理论、方法、工艺等本身所属的类目中查找。
13什么是关键词?什么是主题词?简述它的特征和适用场合?
关键词,属于自然语言的范畴,未经规范化处理,也不受主题词表的控制,只从字面抽
取,直接以作者在文献中的用词作检索,基本上不对词语加以控制。如:对于“电子计算机”这一概念,可有电脑、计算机、微机、PC等不同形式来表达。
主题词,是规范化的检索语言,它对文献中出现的同义词、近义词、多义词以及同一概念的不同书写形式等进行严格的控制和规范,使每个主题词都含义明确,以便准确检索,防止误检、漏检。如:对于电子计算机、电脑、计算机、微机、PC等表达同一概念的不同书写形式规范为“计算机”。主题词表是对主题词进行规范化处理的依据,也是文献处理者和检索者共同参照的依据。
28 CNKI期刊全文及博硕士论文数据库、CNKI中国期刊全文数据库用的是什么浏览器?此全文浏览器有什么作用?万方数据资源系统阅读全文使用的是什么格式浏览器?超星电子图书使用什么阅读器?
17什么是数据库,它的结构由哪几部分组成?
按照国际标准组织标准ISO/DIS5127规定,数据库是指至少由一种文档(file)组成,能满足特定目的或特定功能数据处理系统需要的数据集合。
从使用者观点观察,数据库主要由“文档——记录——字段”三个层次构成。
18什么场合可以使用截词方法?(举例说明)
当某些英语检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以采用截词符,或称通配符扩展检索词。截词检索可以扩大检索结果。
19使用截词检索应注意的哪些问题?
使用截词方法时需注意四个问题:一是截词符要紧接在词干后面,截词符和词干之间不能有空格。二是避免将检索词的词干截得过短,一般应在三个字母以上。三是截词应该合理使用。一般不可能出现词尾变化的单词其后不必再使用截词。四是从希望出现的单词中取尽可能多的公共字母作为词干,以提高查准率。
7什么是ISSN和ISBN?
答:ISSN是国际标准连续出版物号(International Standard Serial Number,简称ISSN)。
ISBN是国际标准书号(International Standard Book Number,简称ISBN)。
8信息索原理是什么?
信息检索的原理可以表述为将检索提问标识与存贮在检索工具中的标引标识进行比较,含有两者一致或信息标引的标识包含着检索提问标识的信息就是检索命中的信息。
题录:只含著录事项而无摘要的文献款目。如果含摘要,则一般称为文摘。
文摘:又摘要,对文献的主要内容所做的简略而确切的叙述,一般不加评论、补充或解释。
索引:索引侧重于让你找到要找的文章,目录侧重于显示整篇文章的结构
15.论述信息检索的步骤?
(1)分析研究课题,明确检索要求:分析课题的主要内容、确定课题的文献类型、确定
出相应的修改和调整,知道得到满意的结果
(5)获取原文:利用全文数据库直接获取,利用文献传递系统获取、利用文摘数据库的
原文服务、利用OPAC检索系统,进行馆际互借。
16什么是追溯法?它有什么优缺点?
追溯法又称回溯法,它是从已有的文献后面所附的参考文献入手,逐一追查原文的方法。其优点是:在没有检索工具或检查工具不齐全的情况下,借助此种方法,也可以查得一批有关文献信息。其缺点是:原文作者引用的参考文献是有限的,不可能列出全部有关文献,而且有的引用文献又与原文关系并不密切,参考价值不大。因此用此法查找文献比较费时,漏检和误检的可能性较大。
6如何针对不同时间要求的文献信息,选用不同的文献信息源?
答:以信息利用者的观点,针对不同时间要求的文献信息应该使用不同的文献信息类型。例如,查找当前最新的信息(一、两个月之内的信息),应该通过互联网以及当前最新的报纸、期刊、广播、电视等媒体;两个月之前到十年之内的信息应主要通过网上图书、期刊类的数据库解决;5~20年前的信息应除了期刊之外,还可以通过印刷版的图书和手册性工具书来查找。
9什么是文献的内容特征和外表特征?这两者有何区别?
与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征,例如,著者、著者单位、期刊名称、专利说明书的专利号、政府报告的报告号等。与文献信息主题内容密切相关的信息称为文献信息的内容特征。文献信息内容特征主要有各种形式的主题词和分类号。文献的标题因常常能够反映文献的主题,常被归入内容特征的范畴。
检索时间范围、分析用户的检索评价要求
(2)选择检索工具:根据检索课题的要求,选择最能满足检索要求的检索工具书,不同
的资料类型就应该选用不同的数据库
(3)确定检索策略:确定检索途径、制定检索策略
(4)调整检索方案:确定了具体的检索方法之后,就要利用所用数据库,在一定的年代
范围内具体查找,以获得文献线索。用户对每次检索结果在作出判断,并对检索策略做
因此,为了达到较高的查准率和查全率,如果检索工具提供了主题词这一检索途径的话就应该选择主题词来进行检索,而不应该选择关键词。选用主题词途径检索,既能满足较高的查准率、查全率,又能提高检索速度。关键词它适合于检索新近出现的信息,或者实施查全率要求不高的检索。
14简述二次文献的类型?
二次文献分为目录、题录、索引、文摘四种。目录是一批相关文献信息的著录集合,它以报道文献出版或收藏信息为主要功能的工具。