山西大学《信息检索》考研复习重点笔记
信息检索重点复习资料

信息检索重点复习资料第一章信息检索概述信息检索(IR):将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
信息素养:人们在解答问题时利用信息的技术和技能。
信息检索与文献检索的主要区别:文献检索是以获取文献信息为目的的检索,信息检索是收集,组织,存储一定范畴的信息,并根据用户需求查询文献中的信息或知识单元,比文献检索更深入。
信息检索的分类:1、根据检索手段不同可分为1)手工检索2)光盘检索3)联机检索4)网络检索2根据检索对象形式不同可分为文本检索、数值检索、音频与视频检索。
信息检索的原理:通过对大量的分散无序的文献信息进行收集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储和检索这两个过程所采用的特征标识达到一致,以便有效的获得和利用信息源。
存储是检索的基础,检索是存储的目的。
信息检索语言是人们在加工、存储和检索信息时用来描述信息内容喝信息需求的词汇或符号及其使用规则构成的供标引和检索的工具。
信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。
其物理结构:是信息检索所用的硬件资源、系统软件以及信息资源集合(数据库)的总和。
信息检索语言的主要目的:把存储和检索联系起来,把标引人员和用户联系起来,以便取得共同理解,实现交流。
信息检索的历史:最早的信息检索主要依靠信息分类。
1手工检索2机械信息检索。
3脱机批处理检索是计算机初期使用的一种检索系统 4联机检索 5光盘检索 6 网络信息检索后四者统称为计算机信息检索信息检索的三个经典模型:1布尔模型 2向量空间模型 3概率模型 1浏览型模型:扁平式模型、结构导向模型、超文本模型2检索型模型:结构化模型、基于内容的检索型模型。
信息检索模型是信息检索的核心。
信息检索系统:是具有信息存储和信息查询功能的一类服务设施。
信息检索系统按功能划分5种类型:文献检索系统DRS、数据库管理系统DBMS、自动问答系统QAS、管理信息系统MIS、决策支持系统DSS. 信息检索物理结构1计算机硬件2软件3数据库信息检索的逻辑结构是指系统所包括的功能模块或子系统及其相互关系。
信息检索基础知识考点整理

信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。
信息检索学习笔记

信息检索学习笔记信息检索第一章信息检索的基础理论第一节基础概念一、信息概述(一)信息的定义:信息指的是事物的存在方式和运动状态,是对客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。
世界三大基本要素:信息物质能量(二)信息的特征1.客观性①信息来源于物质,又不是物质本身;它从物质的运动中产生出来,又可以脱离物质相对独立地存在。
②信息业来源于精神世界,但又不限于精神的领域。
③信息是具体的,并且可以被人所感知、提取、识别,可以传递、存储、变换、显示、检索和利用。
2.普遍性3.可存储性4.可传递性5.扩散性6.共享性7.时效性(三)信息的功能1.经济功能①运用信息可以使非资源转化为资源创造财富。
②使用信息取代劳动力、资金、材料等资源创造财富,实现经济效益倍增。
③直接让信息作为商品在市场流通中创造财富。
④通过信息进行科学决策,减少失误,创造财富。
2.管理与协调功能5M资源:人、财、物、设备、管理办法信息的管理与协调功能在组织活动中的作用:①传递整个组织的运行目的,有效管理5M资源。
②调节和控制物质流和能源流的数量、方向和速度。
③传递外界对系统的作用,保持组织的内部环境稳定。
3.选择和决策功能4.研究与开发功能二、知识1.知识的概念:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,是人类对自然界、人类社会以及思维方式与运动规律的认识。
2.知识的类型①显性知识和隐性知识。
②实体知识和过程知识。
③核心知识和非核心知识。
三、情报1.情报的概念:情报是具有特定传递对象的特定知识货有价值的信息。
2.情报的特征①动态性②按特定的方式传递③为特定目的服务的④常常有一定的时效性和机密性3.情报的类型零次情报:私人笔记、手稿、设计草图、会议记录、口头言论等。
一次情报:调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。
二次情报:书目、索引、文摘等三次情报:综述、专题评论、年度总结、研究进展报告、数据手册、专业年鉴等。
信息检索教程-考研笔记

信息检索教程-考研笔记考研季即将来临,为了帮助各位考生顺利备战考试,本篇文章将为大家介绍与信息检索相关的一些知识和技巧。
希望通过本教程的学习,能够帮助大家更加高效地获取所需的学习资源和资料。
一、信息检索的定义与意义信息检索,是指通过计算机或其他技术手段,从大量信息中准确快速地检索出符合用户需求的信息的过程。
在当今信息爆炸的时代,信息检索变得越来越重要。
对于考研学生而言,高效地获取相关的学术文献、重要资料以及历年真题等信息,对于备考至关重要。
二、常用的信息检索工具1.图书馆资源考研生首先可以利用学校图书馆的资源。
图书馆通常会提供各类学术期刊、论文数据库以及电子书籍等,这些资源对于到考生的研究工作非常有用。
2.学术搜索引擎除了图书馆资源外,考生还可以使用学术搜索引擎,如Google Scholar、百度学术、CNKI等。
这些搜索引擎会对全球范围内的学术论文、期刊进行索引,方便考生查找相关的研究成果。
3.在线论坛和社群考生还可以加入一些学术研究相关的在线论坛和社群,与其他同行交流心得和资源。
这些论坛和社群通常会有一些共享资源,能够为考生提供一些有用的资料和信息。
三、信息检索的技巧与方法1.关键词的选择在进行信息检索时,选择合适的关键词非常重要。
考生需要根据自己的研究课题和需求,选择与之相关的关键词,以获取更准确的检索结果。
同时,使用适当的逻辑运算符(如AND、OR、NOT)可以帮助考生缩小或扩大检索范围。
2.筛选与过滤大量的信息中往往夹杂着一些无用的内容,考生需要学会筛选与过滤。
通过设置筛选条件、选择合适的文献类型和年代范围等方式,可以快速定位到所需的信息,提高检索效率。
3.引用文献的检索引用文献是考研学习中重要的参考资源。
考生可以通过检索相关的论文,查找该论文被引用的文献,从而获得更多的研究成果和理论支持。
四、信息检索的注意事项1.了解数据库特点不同的数据库具有不同的特点和检索规则,考生在使用之前应该先了解清楚。
信息检索复习知识点

信息检索复习知识点1.信息(Information)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。
* 信息的属性——客观存在性* 信息的作用——消除不确定性* 信息的形式——数据、消息等事实2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源3. 信息用户Information User信息的使用者即是信息用户。
使用的情况可以包括需要信息、接受信息和利用信息。
4. 信息需求Information Demand人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。
我们把意识到的信息需要定义为信息需求5. 信息检索Information Retrieval对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。
6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。
* 信息意识* 信息能力* 信息道德7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。
8. 经济领域的特征a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势;b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;c.能源消耗少,污染得以控制;d.知识成为社会发展的巨大资源。
9. 社会、文化、生活方面的特征10.社会观念上的特征11当代信息环境特征描述* 信息超载严重信息超载又称信息泛滥或信息爆炸。
它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。
* 信息失衡明显所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。
信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。
这种附着在各种载体上的记录统称为文献。
2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。
3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。
信息是物质存在的方式、形式和运动规律的表征。
人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。
如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。
由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。
4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。
5、信息资源的构成可从不同的层次和角度来划分:一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。
二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。
(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。
例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。
按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。
二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。
信息检索复习要点

信息检索复习要点复习要点:1.如何查找纸本原⽂,必备信息是什么,刊名等同于什么刊名等同于ISSN号,必备的信息是,⽂章题⽬、期刊名称或是ISSN号,年/卷/期。
先查找有⽆电⼦全⽂。
⾕歌搜索、SFX全⽂搜索系统、先查本馆纸本期刊⽬录,获取论⽂全⽂中的查询本馆纸本期刊⽬录,联合⽬录。
2.哪些数据库有⾃动截词功能?EI3.中⽂科技期刊数据库、SCI和EI数据库的精确检索是如何实现的中⽂:可选择限定检索学科领域可选择逻辑算符可选择跨库检索的其他检索⽅式可选择匹配度⼆次检索其他限制条件EI:精炼检索结果位置:检索结果显⽰页左侧Refine Search的⼯具栏添加⼀个检索词的⼆次检索(Add a term )优化和调整检索结果(限定(Limit to)按钮或排除(Exclude)按钮:作者、作者机构、规范词、分类类名、国家、⽂献类型、语种、出版年、刊名、出版者等限定字段4.数据库检索结果的排序⽅式CNKI:主题发表时间被引下载EI:相关度和时间系统提供5种排序⽅式(按相关度、出版年代、作者字顺、刊名字顺和出版者字顺)5.主要的全⽂数据库CNKI、维普、万⽅:中⽂期刊全⽂数据库。
EBSCO、ScinceDirect、SpringerLinker:外⽂全⽂数据库。
6.Web ofScience数据库中包含有哪些数据库?SCIE/SSCI/A&HCL/CPCI-S(ISTP)/ CPCI-SSH7.查全查准率如何实现?提⾼查全率(扩⼤检索结果)的⽅法选择较⼤字段:如摘要、主题、全⽂、任意字段等尽量多⽤同义词、近义词、反义词、缩写词、上下位类词(增加逻辑或关系)减少逻辑与关系(限制条件)采⽤模糊匹配功能扩⼤检索年限使⽤截词符(*?$)提⾼查准率(缩⼩检索结果)的⽅法选择较⼩字段:如篇名(题名)、题名或关键词字段尽量增加核⼼检索词:从内容中挖掘核⼼词使⽤词位检索采⽤精确匹配/精确短语功能采⽤“AND”或“NOT”算符连接检索词或进⾏⼆次检索。
信息检索笔记

第一章信息资源的概述一.传统信息资源的概述1.概念与特征2.类型:(1)一类文献:原始文献(2)二类文献:对一类文献的加工整理,报道揭示一类文献,提供的是一类文献的线索和地址(书目,索引,文献)(3)三类文献:来源于一类文献,有丰富的权威的资料,可以解决各种问题。
如:百科全书,字典,词典,手册,年鉴,名录二.数字信息资源1.与传统信息资源相比具有的特征:(1)以多媒体为内容特征(2)内容复杂多样(3)更新速度快,时效性强(4)利用不受时空限制(5)具备检索系统(6)具备全方位的动态的信息服务功能2.数字信息资源的类型:(1)按性质和功能划分:a)一次文献:原始文献b)二次文献:参考数据库,搜素引擎,网资,导航等。
c)三次文献:元搜素引擎(关于搜素引擎的搜素引擎)(2)按载体划分:光盘,网络数据库,联机检索系统(三)主要数字信息资源1.参考型数据库:包含各种数据信息的来源和属性的数据库。
包括:书目数据库,索引数据库,文献数据库2.全文数据库:收录有原始文献全文的数据库3.事实数据库;直接提供原始文献的数据库,分为数值数据库,指南数据库,术语数据库4.电子图书5电子报纸6.搜索引擎/分类指南7.网络学术资源学科导航:对各类信息资源进行筛选整理之后,按学科属性对其进行分类、组织。
第二章信息检索概述一.信息检索:信息检索就是利用一定的检索工具,运用一定的检索技术和方法查找信息的过程。
二.信息检索的原理1.利用计算机进行信息检索的前提和基础是信息的组织和贮存。
没有贮存就没有检索对象。
2.信息的组织与贮存就是数据库的建立过程。
在这一过程中,系统对收集到的信息进行概念分析(即找出能够表达主题的关键词),然后赋予其特征标识(这一过程也叫对信息内容进行标引),并按特定的编排方法将其组织起来,形成有序的具有可检性特征的数据库。
3.计算机进行信息检索的原理就是指用户和检索人员将能够表达其信息需求的检索式提交给检索系统,检索系统即自动将检索式与系统中的信息进行匹配,凡是信息特征标识和逻辑组配关系与用户检索式一致的,既未命中内容。
信息检索教程-考研笔记

信息检索教程一、信息的含义广义:指自然界和一切人类活动所传达出来的信号和消息,是事物表现的一种普遍形式。
从本质上说,信息是事物自身(显示其存在方式)的属性,是客观存在的现象。
狭义:指经过搜集、记录、处理和存储的可供检索的文献,数据和事实。
它是人类对客观事物认识,是实践经验的总结,是认识的结果,是我们检索的对象。
二、信息的特征信息的两种基本状态:可存储性和可传递性1.可存储性:人们可以有意识地将流动的信息以某种方式存储在物质媒介上,使信息和物质媒介构成一种依附性很强的、相对稳定的关系,从而有效地避免信息流失,也使信息检索有源可寻2.可传递性:指信息可以通过一定的传输工具和载体进行传递,从而形成信息联系,被人们感受和接收。
信息传递有空间传递和时间传递等不同类型,需要依赖一定的物质载体,具有动态性和方向性的特征。
3.可转换性:表现在两个层面:信息在一定条件下可转化成物质,能量,金钱等其它东西,这种转换主要依靠人类对信息的正确利用。
信息可以从一种形态转换成为另一种形态,自然信息可转换为语言,文字和图像,也可转换为电磁波信号或计算机代码。
4.可处理性:信息可通过分类,整序,分析,综合,压缩,扩充等加工处理,而达到便于识别,效用更高的信息5.可共享性:同一种信息可以同时被许多人共同享用,这是信息不同于物质和能量的一个非常重要特征。
信息可以广泛地扩散和传播,信息交换的双方不会失去原有的信息,而且还会增加新的信息。
6.可识别性:信息做为表现事物特征的一种普遍形式,反映了事物的运动状态和存在方式,人类可以通过自身的器官去直接感觉和知觉信息,通过比较去认识信息,借助于先进的信息技术和手段去识别信息。
7.依附性:信息无法脱离物质而独立存在,在其存储和传递过程中必须依附于一定的物质载体,信息与物质载体构成一个整体。
8.普遍性:信息是物质的基本属性,普遍存在于自然界和人类社会之中,也存在于人类的思维或精神领域之中。
只要有物质存在的地方,就有信息的存在。
信息检索复习提纲一

信息检索复习提纲第一章 信息检索的基础知识1.1 信息检索的基本概念一、基本概念1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息 。
2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。
也可以称为固化在一定载体上的知识。
3、资料:固化在一定的实物或载体上的知识。
二、信息的传递渠道:非正式传递渠道和正式传递渠道(非正式过程、正式过程)(1)非正式过程a、科学技术工作者之间就他们从事的研究和研制进行直接对话,如交谈、参加学术会议等;b、科技工作者参观同行的实验室、科学展览等等;c、科技工作者对某些工众作口头演讲;d、交换书信、出版物欲印本和单行本;e、研究或研制成果在发表前的准备工作,包括发表形式以及发表的地点和时间的选择。
(2)正式过程a、为手稿的发表所作的编辑出版和印刷过程,包括写书评;b、科学出版物的发行过程,包括与发行过程有关的书刊商业活动;c、图书馆的书目工作和检索工作;d、信息工作本身,从搜集到检索,包括宣传工作。
三、信息检索(P2-4)(一)信息检索:就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。
它包括三个方面: 数据检索 、事实检索 、文献检索数据检索、事实检索、文献检索三者中以文献检索为主。
数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。
四、文献检索及其类型(1)定义:1、检索系统的建立及检索工具的组织和积累2、文献的查寻,利用检索工具检出与课题相关的文献。
(2)文献检索的类型1、直接检索:是从通过阅读原始文献直接获取所需信息。
(快捷、方便 漏查率高)a、直接检索原文易于掌握文献的实质内容,可直接判断其信息内容是否符合信息要求,并可能得到意外的收获;b、直接检索简便易行,并且时效高。
信息检索笔记

信息检索课老师:李琳第一章信息资源概论第一节电子图书图书的书名检索文献传递图书分类检索推荐书目:1.《中国哲学简史》——冯友兰2.《哈佛家训》04年版,妇女出版社3.《海洋科学导论》——冯世筰4.《新概念》英语考试等都是从这里衍生出来的5. 视频点播:北京师范大学6.《上下五千年》80年代7. 《文心雕龙》8. 《诗经》9. 班得瑞的音乐10. 三字经——视频、复旦大学11. 埃及金字塔——学校的视频网站12. 优酷——曾仕强《易经》易:千变万化13.三十六计——36个成语、成语故事第二节馆藏图书检索(分类号:p7是关于海洋方面的书)(p7-49代表科普)——海洋文库里推荐书目:1.《蔚蓝色的涌动》作者:侍茂崇2. 童裳亮的作品馆藏目录检索就是纸质图书的检索。
应用:····第三节多媒体资源步骤:多媒体资源——视频点播1.金字塔是怎样建造的?现在还能够建造吗,为什么?2.五子登科的故事出自《三字经》的什么典故?第四节教学教参资源包括精品课程+网易公开课第五节网上图书馆资源浙江大学图书馆网址:1.维基百科:每日图片、特色条目等。
输入学科名词可以搜出很多知识。
网络百科全书。
“分类索引”2.中国大百科:中国大百科图书出版社网址(/Schresult.aspx)3.世界数字图书馆网址:,知识性、学术性4.南京博物馆:/zh/nb/nbgs.html5.网上中国:6.网络学术资源:7./图书馆学科服务http://202.117.24.168/cm/main.jsp重点学科网络资源导航门户8./libweb/redir.php?catalog_id=40119&xuekefl=15浙江大学的第六节网络搜索引擎1.雅虎//(中文搜索加引号可以)2.谷歌/schhp?hl=zh-CN手气不错更多更多3./intl/zh-CN/about/products/相关度排列4.网络孔子学院5.网络素材文件夹:孔子博物馆文化阅读( 6./book/node_519721.htm )图片词条谷歌的学术搜索引擎:查的比较准维基百科、谷歌、雅虎是英文搜索引擎第二章文献数据库用来查课题。
山西大学《信息检索》考研复习重点题库

考试复习重点资料(最新版)资料见第二页封面复习题一一、名词:1.①信息检索:是指将信息按一定的方式和存储起来,并根据信息用户的需要找出有关信息的过程。
广义的信息检索包括信息的存储和检索。
2.①文献标引:是对文献的内容特征进行分析、描述、并按照所采用的分类法和主题法给该文献一标识符号的工作。
3.①检全率与漏检率:检索工具检索效率的评价指标。
检全率=检出的相关文献/相关文献总量。
漏检率=未检出的相关文献/相关文献总量。
4.①检准率与误检率:检索工具检索效率的评价指标。
检准率=检出的相关文献/检出文献总量。
误检率=检出的无关文献/检出文献总量。
5.①检索策略:是在分析情报需求实质,明确检索提问的基础上,选择检索工具,检索途径和检索用词,并明确各词之间的逻辑关系与查找步骤的科学安排。
6.①书目之书目:或称检索工具的检索工具,是检索工具的目录,是将目录、题录、文摘等检索工具,按照类型或取材的学科范围,或按文种等方式排列起来,并附上简介,指出所收录检索工具的内容、特点和使用方法。
7.①文献著录:按照一定的条例或标准,将一件文献区别与其他文献的外表特征、物质特征乃至文献摘要一一加以描述并记载下来的工作称为文献著录。
8.①文献指南:它的内容主要是介绍某一学科的期刊和其他类型的一次文献。
有关这些文献的各种检索工具和重要的参考书,信息检索的方法,以及利用图书馆的一般方法。
9.①引得深度:是衡量检索工具编制过程中分析文献内容所达到的深度的具体质量指标。
是指一篇文献所标引的索引词数目,即指定给每篇文献的“文献标识”数目。
10.①报道时差:是指从被摘文献发表道收录尽检索工具时所经历的时间间隔,检索工具只有尽可能的缩短报道时差,才能适应科学技术的发展和科技文献增长的需要,使科研工作者尽快获得最新的文献资料,促进科研工作的开展;否则,报道时差过长,检索工具本身就失去了现实意义。
11.②主题词:主题词是主题词表中表达一定概念的最小词汇单元,是自然语言中优选出的规范化词汇,这种词汇不仅反映着一定事物的概念,而且作为事物概念的表达形式而存在。
信息检索复习提纲及答案

信息检索复习提纲及答案第一篇:信息检索复习提纲及答案“信息获取与利用”复习大纲1.什么是信息素养?简述评判是否具备信息素养的标准是什么?结合自己的实际工作,谈谈提高信息素养的途径。
答:指个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力”。
标准:⑴能够独立决定所需信息种类和程度。
⑵能够高效地获取所需信息。
⑶能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选。
⑷能够有效地利用信息达到某一特定的目的。
⑸能够在信息利用过程中遵守相关的法律法规。
途径:⑴通过网络搜索⑵信息检索课⑶参加“图书馆利用系列讲座”等信息实践活动。
2.信息、知识、情报的概念?举例说明概念间的区别和联系文献?答:信息,由事物发出的消息、指令、数据等所包含的内容。
如花的生长方向。
知识,是人类社会实践的总结,是人的主观世界对于客观世界的概括和如实反映。
如每天吃一个苹果有利健康。
情报,是激活了、活化了的知识,是为特定目的服务的信息。
如搜索汽车替代燃料时,获得有关乙醇汽油的信息就是情报。
3.文献有那些类型?将文献划分成这些类型的依据是什么?答:纸张文献、缩微文献、电子文献、音像文献。
依据知识内容、记录载体、记录方式。
4.科技文献的作用是什么? 答:⑴科技进步的阶梯。
⑵传递科技信息或知识。
⑶加速科学技术的进步,促进了社会的发展。
5.比较图书和期刊,他们各自有哪些特征,其特点和用途是什么?答:图书特点,内容系统、全面、成熟、可靠,但时效性较差。
用途,对范围较广的问题获得一般知识、或对陌生的问题获得初步了解。
特征,书名、著者、出版社名称、出版地点、出版时间、图书总页数、ISBN。
期刊特点,品种多、数量大、出版周期短、报道速度快、内容新颖、及时反映当前科技水平。
用途,是科技人员吸取成果、掌握进展、了解动态、开阔思路的重要参考文献。
特征:论文题名、著者、期刊刊名、卷号、期号、起止页号、ISSN。
6.特种文献有哪几种类型,简述其中任意两种的特点。
信息检索复习要点

复习要点1.什么是原文出处?获取文献全文的途径有哪些?搜索引擎,本馆资源,全国范围内的纸本馆藏,申请图书馆的文献传递2.检索词的选择对查全率的影响(切分、删除、扩展)。
切分是对课题的语句以词为单位进行拆分,转换为检索的最小单元。
删除是对课题中不具有实质性检索意义的:虚词(如介词、连词、副词等)选择性删除:使用频率较低的词、专指性太高、过分宽泛的词、过分具体的限定词扩展:找到意思相同或相近的词汇;立足规范词,兼顾自由词;注意词的全称、简称及缩写字母;必要时应向上下位类词扩检;外来词的译写变化3.检索字段对查全率、查准率的影响。
可分为基本检索字段和辅助检索字段。
基本检索字段是指反应文献内容特征的字段。
如题名、文摘、主题词等。
辅助字段是指反应文献外部特征的字段,如作者机构、来源出版物、出版年等。
限制范围大小:题名<关键词≈摘要<(主题)<全文截词检索是防止漏检,提高查全率的一种常用检索技术,主要用于英文电子资源的检索。
用*或?表示。
不同检索系统使用的截词符种类和功能不同。
截词是在检索词的适当位置进行截断,节省输入的字符,达到较高的查全率。
根据截词符在检索词中的位置,可分为前截词、中截词和后截词。
常用的词位检索有:邻位检索和字段检索4.每个数据库的检索技术以和所使用到得符号,以及这些检索技术对查全查准率的影响。
概念交叉或概念限定关系:数据库中使用符号“* ”或“AND ”搜索引擎中使用“空格”表示,增强了专指度,提高了查准率。
具有概念并列关系的组配:数据库中使用符号“+ ”或“OR ”搜索引擎中可在关键词之间使用“OR”连接符,对于百度是用的“| ”连接符,注意连接符与搜索词之间必须要有空格。
扩大检索范围,提高了查全率。
具有概念排除关系的组配。
数据库中使用“- ”或“NOT ”搜索引擎中使用“- ”,注意前一个关键词和减号之间必须有空格,减号和后一个关键词之间,有无空格均可。
提高查准率,影响查全率检索技术:1.布尔逻辑2.同义词、同名作者检索3限制检索检索方式:传统检索,基本检索,高级检索,期刊导航5.什么是ISSN号。
信息检索重点

信息的基本概述一信息:1.信息的特征(5个普遍性与客观性、依存性与传递性、可知性与共享型、可扩充性与可压缩性、时效性与滞后性)2.数据信息、知识、文献、情报、智慧DIKW模型看截图3.信息检索的概念与本质(匹配过程)本质:是用户的信息需求和信息集合的匹配过程,进而满足用的信息需求的过程二信息资源(定义信息资源是人类在认识世界和改造世界过程中产生、整理、记录的有用信息的集合)1.信息资源的类型按时间的产生顺序先导信息资源、即时信息资源、滞后信息资源按传播形式口头信息资源、文献信息资源、实物信息资源按载体形式书写型、印刷型、缩微型、视听型、数字型按出版形式(十大科技情报源)图书、期刊、会议文献、学位论文、专利文献、科技报告、标准文献、技术档案、产品资料、政府出版物按加工深度(零次一次,二次)一次文献知识的首次固化期刊论文、标准、报告、文献等:是依据作者本人的科研成果而撰写的首次记录科研成果的原始文献二次文献检索工具题录,目录,书录,文摘,索引:是对分散的无组织的一次文献进行加工整理、压缩、提炼、简化、整理的产物三次文献直接提供答案百科全书,词典,手册:对大量一次文献经过综合、分析、提炼撰写而成零次文献实验数据,观察记录,手稿等:是形成一次文献之前的信息、知识、情报、即未公开记录或未公开与社会的最原始的文献,或没有正式的发表的文字材料信息资源的特点能够重复使用、具有整合性、具有流动性、共享性、实效性、动态性、不可分性、支配性信息资源的作用可以减少物质与能量的作用,从而极大提高社会劳动生产率,有利于实现国民经济的可持续发展。
信息资源已经成为了当今社会的核心资源。
信息资源的开发利用,可有效降低社会的运营成本三信息社会(概述与内容包括哪三类资源)信息素养的三个层次:基础性、自我满足性、自我实现性信息素养(IL)(定义美国图书馆协会:具有信息素养的人能够知道什么时候需要信息,能够有效的识别、获取、评价、和利用所需要的信息)信息素养的内涵:信息意识对信息的敏感程度,有效发现信息需求,是人们产生信息需求,形成信息动机和兴趣的动力和源泉信息知识信息的基本知识(相关理论、知识与方法),信息技术和知识(信息技术原理)等信息能力获取、理解、处理、表达、评价、利用、创新等信息法律与道德(又称信息伦理)了解利用信息所涉及的经济、法律和社会问题,合理、合法地获取和利用信息第二章信息检索绪论一信息检索概述信息检索概念广义:存储和查询将信息按一定的方式组织和存储,并根据信息用户需求查找所需信息的过程侠义:查询从信息集合中查询信息用户所需信息的过程(仅指从已经存贮的具有检索功能的信息集合中查询出所需要的信息的过程)信息检索原理信息需求与信息集合:匹配检索者将检索提问式与存储与检索系统的文献标引词进行匹配对比,取得一致性即为最符合要求的结果信息检索类型信息检索内容对象数据、事实、文献信息检索组织方式全文、超文本、超媒体信息检索的手段手工与计算机信息检索步骤6个分析课题明确需求、选择检索工具或数据库、确定检索方法、确定检索途径、查找文献检索、获取原始文献。
《信息检索》知识要点

《信息检索》知识要点1、文献是记录有知识的一切载体。
2、信息与材料、能源一起成为人数社会发展的三大支柱。
3、查找奇特事物,我们可以采用百科全书,也可以利用综合性手册。
4、广义的信息检索包括信息的存储与检索两过程。
5、搜索引擎一般提供两种检索方式:分类检索和关键词检索。
6、文献的属性有:知识性、实体性、记录性、发展性。
7、按信息检索的内容划分,可以将信息检索划分为数据检索、事实检索、文献检索类型。
8、信息检索的发展,经历了以下哪些阶段手工信息检索阶段、计算机信息检索阶段、机械信息检索阶段。
9、网络信息检索时,用AND、OR、NOT算符构造检索表达式进行检索的方法是布尔逻辑检索。
10、信息检索的基本原理就是要将查找的信息转换为检索系统能够识别的检索提问标识,然后通过与检索系统中的信息存储标识进行匹配比对,凡是双方标识一致的,就将具有这些标识的信息按要求从检索系统中输出。
11、评价一个网站的信息质量主要应从以下哪几方面考虑权威性、准确性、客观性、适时性。
12、信息检索工具是指用以报道、存储、查找信息线索的工具。
13、我校图书馆OPAC查询系统的主要查询功能有:馆藏查询、分类查询和读者查询。
14、如要查找书、刊等出版物的收藏地点,应选择的检索系统类型为馆藏目录、联机公共目录(OPAC)、联合目录。
15、评价网站提供的信息质量,可以不考虑的因素是合不合自己的意愿。
16、二次检索指的是在上一次检索的结果集上进行的检索。
17、利用词的某些部分进行非精确匹配检索,如acid*,这种形式叫截词检索。
18、专利的特点包括专有性、时间性和地域性,其中我国专利法关于时间性的规定中,发明类专利的保护期限一般为20年。
19、文献检索工具是通过著录文献的特征,依据一定的规律组织排列,使文献由无序变为有序。
20、评价一本工具书,一般来说最主要的是易用性、适时性、客观性。
21、追溯法是利用原始文献所附的参考文献进行追溯查找文献信息的方法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
考试复习重点资料(最新版)资料见第二页封面第1页第一章 信息资源概述第一节信息与知识、文献、情报一、什么是信息“信息”(Information)是当代使用频率很高的一个概念,也是很难说清楚的一个概念。
早在1948年,维纳(N.Weiner)在《控制论——动物和机器中的通信与控制问题》中提出了著名的经典命题:“信息既不是物质,也不是能量,信息就是信息,不懂得它,就不懂得唯物主义”。
那么,什么是信息(What then is information)?《现代汉语词典》中的“信息”是泛指一切音信和消息。
《Oxford Dictionary》中的“信息”(Information)是:sth told ;news or knowledge given.控制论创始人维纳认为:“信息是我们用于适应外部世界,并且在使这种适应为外部世界所感知的过程中,同外部世界进行交换的内容的名称。
”是“生物以及具有自动控制系统的机械系统,通过感觉系统和外界交换的一切内容”。
信息论创始人申农认为:“信息是能够用来消除不确定性的东西”。
与此相近的说法还有:信息是“传递的消息中使概率发生变化的东西”。
日本有学者从英语词源上分析了信息(Information)。
认为:“in是接收到消息,formation是整理成章。
也就是说,信息是把我们不明确的知识弄清楚后,整理成章再传递给需要获取信息的人。
”美国学者从管理学和计算机应用相结合的角度来研究信息资源及管理问题。
认为信息是有意义的数据,是经过收集、记录、处理和存储的可供检索的事实与数据。
国内有学者从哲学的角度定义信息。
认为:信息是普遍存在于自然界、人类社会和人类思维活动中的一种现象,它是信息源体存在方式或运动状态以一定形式与外界进行交换的讯号。
或:信息是事物属性和事物间关系的表征,人们正是通过信息来认识事物的运动现象及其规律的。
信息定义之所以多样化,主要原因是由于一是信息本身的复杂性;二是信息科学是一门新兴的大学科,有许多学科分支,因而定义信息的角度不同。
本书不深究“信息”的确切定义,而是从信息与知识、文献、情报的关系方面让大家了解信息,以便从资源的角度探讨各种信息的检索与利用。
二、信息与知识(一)知识《现代汉语词典》中的“知识”是指人们在改造世界的实践中获得的认识和经验的总和。
《Oxford Dictionary》中的“知识”(Knowledge)是:familiarity gained by experience ; range of information.本书从认知过程定义知识。
认为:人们对事物(自然、社会、思维)运动现象和规律的认识就是知识。
(二)信息与知识的关系由于知识是对事物(自然、社会、思维)运动现象和规律的认识。
从信息角度看,对事物(自然、社会、思维)运动现象和规律的认识实际上就是表征事物属性和事物间关系的各种信息的集合或有序化。
所以,本书认为,知识源于表征事物属性和事物间关系的各种信息,成于这各种信息的集合或有序化。
对事物(自然、社会、思维)运动现象和规律的认识,首先存在于人脑(或智能系统)。
为交流与传递,需再借助文字、语言、符号、代码、图像、电磁波、实物等加以表现(外化),而知识的这种表现(外化)形式,又成为其它知识接受者的“信息”。
其它知识接受者能否将这些“信息”转化为自己的知识,则取决于其认知能力。
所以,本书认为,信息与知识的关系存在于“信息—知识—信息—知识”这样一种循环关系之中。
本书打算从知识接受者的角度探讨如何检索并利用各种信息,进行知识的再创新。
三、信息与文献(一)文献古人认为文献是记录贤者言论的典籍。
到了近现代,文献概念的外延和内涵都发生了很大变化。
《现代汉语词典》中的“文献”是泛指“有历史价值或参考价值的图书资料”。
《Oxford Dictionary》中的“文献” (Document)是:sth written or printed ,to be used as a record or evidence.《中华人民共和国国家标准·文献著录总则》(GB3792.1-83)为文献下了一个简明的定义:文献是“记录有知识的一切载体。
”这就是说,文献具有两个要素:其一,知识内容。
没有记录有知识的空白纸张、空白磁带、磁盘、光盘等不能算是文献;胡乱涂写、存储的无实质知识内容的非空白纸张、磁带、磁盘、光盘等也不是文献。
其二,物质载体。
存在于人脑中或人们口头传播的知识也不能算是文献。
(二)信息与文献的关系“信息”是泛指一切音信和消息,是事物属性和事物间关系的表征。
并非一切信息都能够被人们感受、被人们有序化、被人们记录下来,只有那些被记录在各种各样的载体上的信息集合或有序化信息(知识),才形成文献。
记录、传递信息集合或有序化信息(知识)的物质载体可以是古代的甲骨卜辞、金石简牍、帛书卷轴、手抄文稿、书画文物、线装古籍,也可以是现代的印刷书刊、文书档案、电影胶卷、缩微胶片、录音带、录像带、计算机磁盘光盘等等。
记录、传递信息集合或有序化信息(知识)的方式,随着信息技术的发展,已经历了“语言的诞生—文字的创造—造纸与印刷术的发明—电子技术—计算机与互联网”的五次革命。
所以,信息集合或有序化信息(知识)构成文献的内核,形式多样的物质载体都可以记载这些信息并以不同方式进行交流、传播,这就是信息(Information)与文献(Document)的关系。
本书不深究信息技术对文献信息交流、传播的影响,仅打算从信息接受与利用者的角度出发,探讨如何从传递方式不同、物质载体相异的各种文献资源中检索所需信息并进行知识的再创新的方式、方法。
四、信息与情报(一)情报《现代汉语词典》中的“情报”,特指“战时关于敌情的报告。
”《Oxford Dictionary》中的“情报”(Intelligence )是: news ;information ,esp with reference to important events,即有关重要事件的消息与信息。
本书认为,情报是“有效传递的那部分有序化信息(知识)。
”(二)信息与情报的关系情报的内核是信息,是信息的集合(知识)。
杂乱无章的信息显然不是情报。
再重要的信息必须经过传递才有可能成为情报。
信息经传递并能够产生重大效用方可视其为情报,否则就仅仅是一般的知识或文献。
正因情报具有重大效用性,所以情报多带机密性质。
信息技术与WTO,使全球经济一体化。
在此背景下,关于技术、经济的“竞争情报”(Competitive Intelligence)受到高度重视。
实际上,“竞争情报”的实质,也是信息,只不过是组织(企业、团体乃至国家)为赢得竞争优势所需要的、具有对抗性的重要信息。
五、信息与知识、文献、情报的关系近2000年前,我国古代唯物论者王充曾经说过这样一句名言:“人有知学,则有力矣”(汉•王充《论衡•效力》)。
意思是,人如果有了知识学问,就有了力量。
300多年前,英国著名哲学家弗兰西斯•培根又说:“知识就是力量”(knowledge is power)。
以后,俄罗斯著名作家高尔基则说:“书籍是人类进步的阶梯。
”在信息时代的今天,人们同样又说“信息就是力量”(information is power);情报是有效传递的信息,或情报是有序化的信息。
我们不禁要问,信息与知识、文献、情报到底是什么关系?它们的区别又如何?目前,国内外对这些概念的关系多达上百种解释,终究没有一个公认的结论。
不过,从概念的种属关系看,一般地认为:信息是属概念,它包含种概念知识和文献,情报这个种概念则寓于属概念信息、知识和文献之中。
如果还要我们解释它们的联系与区别,想一想水——H2O的存在形式变化也许会有一些启示。
水在常规状态下是液体,改变环境条件后它是固体;再改变它的环境条件,H2O变成一种气体。
但无论怎样改变,其基本成分仍然贯彻始终,仅仅是条件改变了。
信息就好象是水,知识是它的液态存在,文献和情报是它的固体存在;再改变它的环境条件,信息就变成一种气体形式。
虽然变成了气体,但在经过一定大气循环条件变化后,它又会变成液体和固体。
信息转化为知识、文献和情报是信息的价值所在;知识、文献和情报转化为信息是信息的必然归宿。
由此可见,信息的生命过程中有两次转化。
信息的两次转化都离不开信息检索和信息利用。
第二节 信息资源及其类型物质、能源、信息是构成当代社会的三大基础资源。
所谓信息资源,可广义的理解为一切信息的总汇。
本书所探讨的信息资源,仅限于:传递方式不同、物质载体相异的各种已被记载下来的信息。
根据不同的标准,可以将信息资源划分成不同的类型。
一、不同记录形式的信息资源根据记录信息形式的不同,信息资源有以下几种类型:1.文字类信息资源。
主要用文字记录的信息资源。
可再分为汉文、藏文、英文、法文、德文、日文、俄文信息资源。
2.图表类信息资源。
主要用图、表记录的信息资源。
如各种图形、图谱、图片、图纸、图画、图表等。
3.代码类信息资源。
用特定的符号、代码记录知识。
如乐谱、电报码、数学符号、化合物的代号、软件源程序等等。
4.语音类信息资源。
用声音记录的信息资源。
5.影像类信息资源。
用影像记录信息资源。
6.多媒体 (Mutimedia) 信息资源。
既用文字、图、表、特定符号,也用声音、影像等记录知识。
是集文字、声音、影像于一体的信息资源。
7.数字化(Digital) 信息资源。
用数码设备将所有文字、图、表、特定符号、声音、影像等均转化为“0”、“1”数码存取,实现各种形式的信息资源数字化 。
二、不同知识组织形式的信息资源根据记录知识组织形式的不同,信息资源有以下几种类型:1.文本(Text)信息资源。
信息资源(如一种图书)内知识各单元按线形顺序排列。
读者阅读时,是跟随文本的线形流逐级向下浏览,当需要了解某一内容的相关信息时,需要另外查阅相关参考资料。
2.超文本(Hypertext) 信息资源。
信息资源(仍如一种图书)内各知识单元间的关系,以及信息资源内各知识单元与信息资源外相关各知识单元间的关系呈网络结构,通过链接把有关的信息(包括文字、图片、图形、表格等)联结起来。
读者可以从任一链接节点开始,从不同的角度,采用人机交互的方式,阅读、检索感兴趣的信息。
3.超媒体(Hyper-Mutimedia) 信息资源。
是多媒体信息资源与超文本信息资源的结合。
信息资源集文字、声音、图像于一体,某一信息资源内各知识单元间,以及信息资源内各知识单元与其外相关各知识单元间采用超文本方式链接。
也可以这样理解,当超文本信息资源链接节点中的信息是多媒体信息时,这样的超文本信息资源就是超媒体信息资源。
三、不同载体制作形式的信息资源根据载体及制作方式的不同,信息资源有以下几种类型:1.刻写型信息资源。