【云南大学】信息检索期末复习重点

合集下载

信息检索期末复习材料

信息检索期末复习材料

信息检索第一章信息检索基础1、信息的含义:广义的信息指自然界和一切人类活动所传达出来的信号和消息,是事物表现得一种普遍形式。

狭义的信息指经过搜集、记录、处理和存储的可供检索的文献、数据和事实2、一次文献:指作者以本人的研究成果为基本素材而创作或撰写的文献。

(著作、报纸、期刊、会议资料、研究报告、政府出版物、专利说明书、产品样本、标准文献、学位论文等)二次文献:指对一次文献进行加工、提炼和压缩后所得到的报道性产物。

检索工具书和网上引擎是典型的二次文献。

(目录、题录、索引、文摘)三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的具体知识、数据。

如综述、百科全书、辞典等。

3、信息检索的含义:从大量的信息集合中找出所需信息的过程与方法。

广义:包含信息储存和检索两部分狭义:信息检索4、信息检索的原理:将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配5、信息检索的意义:①信息检索是有效利用信息资源、实现其最大价值的科学方法②信息检索是再学习的工具、是获取知识的有效途径③信息检索能有效地提高科研工作的效率、节省人力物力及时间6、信息检索的历程:手工检索、计算机检索7、信息检索的方法:直接浏览法、常用法(顺查法、倒查法、抽查法)、追溯法、综合法查全率和查准率的关系、局限性1)查全率=[检出的相关文献信息量/检索系统中相关文献信息总量]×100%=[a/(a+c)]×100%2)查准率=[检出的相关文献信息量/检出文献信息总量]×100%=[a/(a+b)]×100%3)查全率与查准率的局限性:①对文献相关性的判断不可避免的带有主观性和模糊性②全部相关文献的总量很难确定③“相关文献”总是被同等对待,实际上其相关程度是有区别的9、影响检索效果的因素:①标引上网质量②检索语言的性能③检索途径的数量④检索策略的优劣⑤检索人员的素质第二章检索语言1、检索语言的定义:广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言。

(完整版)信息检索期末复习题及答案

(完整版)信息检索期末复习题及答案

《信息检索》期末复习题及答案(仅供参考)一、判断题1.综述和百科全书属于二次文献。

(× )2.从文献检索的角度来看,一次文献是检索对象,二次文献是检索手段。

(× )3.题录、目录属于一次文献;期刊论文属于二次文献。

(× )4.主题词规范化的目的是扩大检索范围。

(√)5.在众多的信息源中,期刊是最重要的信息源。

(√ )6.核心期刊是指经常使用的期刊。

(× )7.关键词和主题词都是表征文献实质性内容的词汇,前者是经过词表规范的,后者是未经词表规范的自由词。

(×)8.《中国图书分类法》(简称《中图法》)是由分类号(代码)和类名来揭示信息的主题概念。

(×)9.题录型的检索工具,其著录项目包括题目、作者、文献出处、文摘。

()10.一项发明创造要获得专利权必须具备新颖性、创造性和实用性。

()二、选择题1、广义的信息检索包含两个过程( B )A、检索与利用B、存储与检索C、存储与利用D、检索与报道2、文献是记录有知识的()。

A、载体B、纸张C、光盘D、磁盘3、下列哪种文献属于一次文献( A )。

A、期刊论文B、百科全书C、综述D、文摘4、下列哪种文献属于二次文献( D )。

A、专利文献B、学位论文C、会议文献D、目录5、下列哪种文献属于三次文献( C )。

A、标准文献B、学位论文C、综述D、文摘6、下列选项中属于连续出版物类型的选项有(C )。

A、人民日报B、学位论文C、科技期刊D、会议文献7、下列选项中属于特种文献类型的有( D )。

A、学位论文B、图书C、科技期刊D、标准文献8、纸质信息源的载体是()A、光盘B、缩微平片C、感光材料D、纸张9、《中国图书分类法》(简称《中图法》)将图书分成( A )A、5大部分22个大类B、5大部分26个大类C、6大部分22个大类D、6大部分26个大类10、《中国图书分类法》(简称《中图法》)是我国常用的分类法,要检索农业方面的图书,需要在( A )类目下查找。

(完整版)信息检索考试重点

(完整版)信息检索考试重点
2、利用从《中文期刊全文数据库》、《中国知网》、《维普科技期刊全文数据库》等查出 10 篇以上专业文章,写出 1500 字以上的综述。 答: 新经济学 新经济时代的到来与传统经济理论的缺陷 当今世界经济发展进入了一个新时代, 这就是知识经济与可持续发展经济的新时代。

hing at a time and All things in their being are good for somethin
(二)
1、什么是检索工具?它的主要作用是什么? 答:检索工具是用来存储、报道和检索一次文献的工具,属于二次文献。 主要作用:报导作用、累计作用、查询作用、选择作用。 2、目录、题录、索引、文摘、文献指南各有那种类型? 答:目录可以分为国家目录、馆藏目录、联合目录、出版社与书商目录和专题目录。 题录的类型一般都是用代号表示。 索引类型可分为篇目索引和内容索引 文摘按其内容的详简程度可以分为指示性文摘和报道性文摘;按其适用对象可以分为一 般性文摘和倾向性文摘;按内容性质可以分为综合性文摘和专业性文摘。 文献指南主要介绍该科学和专题的主要文献类型。 3、什么是参考工具书?它有哪些主要作用? 答:参考工具书是根据一定的社会需要,广泛汇集某一范围的知识材料,按一定方式加以 编排,专供人们解释疑惑的特定类型的出版物。 作用:查字词、查事项、查人物、查机构、查产品、查物名、查地名、查年代、查数据。 4、字典和词典、百科全书、年鉴、名录、图录有哪些主要类型? 答:字典类型一般分为两种:○1 详解词典○2 专门词典。 词典从语种文别角度分为:○1 单语言辞典○2 多语言辞典。 从词量规模角度:○1 大型词典○2 中型词典○3 小型词典。 从收录内容角度:○1 百科全书○2 语文词典○3 专门词典。 百科全书分为两种类型:一类是概括人类一切门类知识,包括哲学、社会科学、自然科学 和应用科学等所有门类知识的综合性百科全书。另一类是指内容只收内容某一学科或某个 门类、某个专业的知识信息的专科性百科全书。 年鉴类型分为综合性年鉴、专业性年鉴、统计性年鉴。 名录类型分为人名录、地名录、物名录、机构名录。 图录类型分为地图录、科学技术用图集、历史图谱、文物图谱及人物图录。 (三)

信息检索考试重点

信息检索考试重点

名词解释4*4’1.信息素质:个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。

2.信息检索广义的信息检索全称是“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。

狭义的信息检索“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。

3.登记性目录(概念)也叫国家书目,它是出版物国家登记制度的产物,反映国家出版的全部图书,实际上也反映了一个国家的文化、科学和出版业的水平。

4.联合目录(概念)汇总若干个单位馆藏而形成的目录,是馆藏目录的放大。

5.年鉴(概念)年鉴是汇辑一年内的重要时事文献、学科进展,汇辑各种统计资料和重要信息,并按年度出版的连续性出版物。

6.OPAC(公共联机书目查询系统)利用计算机终端来查询基于图书馆局域网内的馆藏数据资源的一种现代化检索方式,通过联机查找为读者提供馆藏文献的线索。

7.引文索引(概念)根据美国科学信息研究所(Institute for Scientific Information,简称ISI)的定义:对于文献A和B:若文献B提到或引用了文献A,则A是B的引文。

这里,文献A被文献B 提到或引用,A是被引用文献或参考文献。

同时由于B引用了A,故B又称为引用文献。

8.垂直搜索引擎(概念)也被称为专业搜索引擎,或主题搜索引擎。

它专门收录某一方面、某一行业或某一主题内的信息,专为查询某一个学科或某一主题的信息提供检索服务,在解决某些实际查询问题的时候比综合搜索引擎更有效。

简答4*9’信息素质包含四个层面的含义:第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。

第二,掌握了主要的信息源和信息工具的知识及技能。

第三,能够分析评价选择相关信息。

第四,利用信息的目的是为了有效地解决具体问题。

信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。

信息技术检索期末重点复习

信息技术检索期末重点复习

信息技术检索期末重点复习第一章导论1. 了解信息检索的相关研究领域,以及信息检索的应用;答:领域:数据管理,图书馆和信息科学,人工智能,自然语言处理,机器学习,软件工程计算机系统。

应用:自然语言处理,分布式计算,数据库,数据挖掘,情报学,社会学。

2. 了解相关性的定义、相关性判定的特点;答:定义:信息检索系统针对用户的查询(query)从文档集中检出的文档与查询之间的一种匹配关系。

判定特点:(1)客观性(2)及时性(3)可靠性(4)能否满足客户要求。

3. 理解齐普夫定律的内容,以及齐普夫定律在信息检索中的应用。

了解齐普夫定律在网络现象中的验证。

(结合第七章)答:定律:如果有一个包含n个词的文章,将这些词按其出现的频次递减地排序,那么序号r和其出现的频次f之积fr,将近似地为一个常数。

(齐普夫定律的理论基础是最省力法则)在信息管理中的应用:(1)最佳地理位置选择,使得使用者能以最省力的途径方便到达。

(2)设计图书馆、信息中心资料库的排架。

齐普夫定律应用:(1)文献自动标引(2)主题词频分析适用性:对于出现频率特别高特别低的词不能表现其分布规律。

在网络现象中的应用:(1)对网页中入度/出度数量的影响(2)对网页的长度有影响(3)对网页的点击率4. 掌握倒排文档的原理,以及在信息检索中的应用。

答:原理:将文档打散,然后找出关键词,经过还原、去重等词处理建立索引,存储这些单词在一个文档或者一组文档中的存储位置。

应用:当文章数目很大时,通过倒排文档方式建立索引可以大大节省检索时间。

5. 掌握IR系统的基本结构,了解各个关键部分的作用。

答:第一章PPT136. 理解关键词检索存在的问题及原因。

答:问题:(1)不能检索有同义词的相关文档(2)可能会检索出有歧义词的不相关文档。

原因:(1)检索出了基本的内容,但我们想要知道的更多更全(2)我们想要知道更多关于近期发展的信息(3)我们想要获得一个有效的基本的信息系统,而关键词检索做不到(4)我们更关注基本能力和算法比较系统的结果,而不是像工业模型那样允许缩放的系统数据。

信息检索复习知识点

信息检索复习知识点

信息检索复习知识点1.信息(Information)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。

* 信息的属性——客观存在性* 信息的作用——消除不确定性* 信息的形式——数据、消息等事实2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源3. 信息用户Information User信息的使用者即是信息用户。

使用的情况可以包括需要信息、接受信息和利用信息。

4. 信息需求Information Demand人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。

我们把意识到的信息需要定义为信息需求5. 信息检索Information Retrieval对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。

6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。

* 信息意识* 信息能力* 信息道德7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。

8. 经济领域的特征a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势;b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;c.能源消耗少,污染得以控制;d.知识成为社会发展的巨大资源。

9. 社会、文化、生活方面的特征10.社会观念上的特征11当代信息环境特征描述* 信息超载严重信息超载又称信息泛滥或信息爆炸。

它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。

* 信息失衡明显所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。

信息检索复习要点

信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。

这种附着在各种载体上的记录统称为文献。

2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。

3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。

信息是物质存在的方式、形式和运动规律的表征。

人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。

如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。

由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。

4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。

5、信息资源的构成可从不同的层次和角度来划分:一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。

二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。

(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。

例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。

按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。

二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。

信息检索复习提纲

信息检索复习提纲

信息检索复习提纲一、填空题:1.根据文件载体的物理形式,文件可分为现代机读文件、视听文件和微型文件,以及传统的印刷文件。

2.按照检索的查找对象,信息检索分为数据、事实及文献检索。

3.一个完整的信息检索系统主要由六个子系统组成:文档选择、信息检索语言、文档索引、信息检索、用户系统交互和匹配。

4.各种检索语言的基本特性是:分类语言按学科专业集中文献信息;主题语言按特定事物集中文献信息;引文语言按引用关系集中文献;自然语言按词语集中文献信息。

5.信息检索中使用的检索方法可归纳为三类:常用方法、回溯方法和循环方法。

6.《中国出版年鉴》于1981年首次出版,此后每年出版一次,反映了前一年图书出版业的情况。

7.《四库全书》是中国和世界上最大的一部剧集。

8.在《四库全书》中,政治书籍属于历史系,班级书籍属于分系。

9.信息检索的本质是问号与文献号的比较。

10.召回率和准确率的计算。

2、术语解释:1。

文件传输2。

信息检索3。

数字图书馆4。

信息素养教育5。

主题词6.参考咨询服务三、简答题:1.简要描述信息源和信息资源的概念和区别?2.手册和年鉴有什么区别?3.类书与百科全书的区别?4.类书与资料汇编的异同?5.尝试描述文献信息的水平及其关系?6.信息检索的步骤?附件:手册与年鉴的区别?(1)手册内容基本,得到人们的肯定;年鉴包含了正在发展和变化的东西。

(2)本手册注重应用性和实用性,具有指导实践的功能;《年鉴》强调信息的准确性和及时性,不起指导实践的作用。

(3)手册中没有评论。

这是纯粹的信息,而年鉴允许权威评论。

(4)本手册主要面向专业人士,一般都很简单练、科学的专业语言,年鉴主要以普通读者为对象,较少使用专业语言。

教科书和百科全书有什么区别?(1)类书侧重于资料性,它将文献资料以类相从不加改动地直接辑录,仍保留着原始文献的形式。

而百科全书则是概括人类的一切知识并系统地加以叙述,侧重于知识性;(2)类书重在编,它将不同来源的同一资料不避重复地汇编于同一主题下,是原始资料的堆砌。

信息检索复习提纲一

信息检索复习提纲一

信息检索复习提纲第一章 信息检索的基础知识1.1 信息检索的基本概念一、基本概念1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息 。

2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。

也可以称为固化在一定载体上的知识。

3、资料:固化在一定的实物或载体上的知识。

二、信息的传递渠道:非正式传递渠道和正式传递渠道(非正式过程、正式过程)(1)非正式过程a、科学技术工作者之间就他们从事的研究和研制进行直接对话,如交谈、参加学术会议等;b、科技工作者参观同行的实验室、科学展览等等;c、科技工作者对某些工众作口头演讲;d、交换书信、出版物欲印本和单行本;e、研究或研制成果在发表前的准备工作,包括发表形式以及发表的地点和时间的选择。

(2)正式过程a、为手稿的发表所作的编辑出版和印刷过程,包括写书评;b、科学出版物的发行过程,包括与发行过程有关的书刊商业活动;c、图书馆的书目工作和检索工作;d、信息工作本身,从搜集到检索,包括宣传工作。

三、信息检索(P2-4)(一)信息检索:就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。

它包括三个方面: 数据检索 、事实检索 、文献检索数据检索、事实检索、文献检索三者中以文献检索为主。

数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。

四、文献检索及其类型(1)定义:1、检索系统的建立及检索工具的组织和积累2、文献的查寻,利用检索工具检出与课题相关的文献。

(2)文献检索的类型1、直接检索:是从通过阅读原始文献直接获取所需信息。

(快捷、方便 漏查率高)a、直接检索原文易于掌握文献的实质内容,可直接判断其信息内容是否符合信息要求,并可能得到意外的收获;b、直接检索简便易行,并且时效高。

信息检索文字题复习提纲(名词解释、举例、简答、论述)

信息检索文字题复习提纲(名词解释、举例、简答、论述)

信息检索文字题复习提纲(名词解释、举例、简答、论述)信息检索复习题1、信息检索的原理是什么?(1)广义信息检索原理:在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。

(2)狭义信息检索原理:狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。

信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。

两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。

*2、信息检索有哪些工具?按处理信息手段分:手工检索工具、计算机检索工具。

按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。

3、信息检索的途径和方法有哪些?(1)信息检索途径分类途径:按学科分类体系来检索文献信息。

从分类途径检索文献信息,主要是利用分类目录和分类索引。

它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。

题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。

一些检索系统中提供题名字顺检索途径,如书名目录、刊名目录、篇名索引等。

(2)信息检索方法追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。

直接法:又称常用法,是直接利用检索工具检索文献的方法。

它又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。

【云南大学】信息检索期末复习重点

【云南大学】信息检索期末复习重点

云南大学信息检索重点第一章一、检索策略定义:在处理信息需求提问实质的基础上确定检索途径、检索词语并明确各词语之间的逻辑关系,查找步骤、系统输出顺序等方面的科学安排,与检索效果密切相关。

二、检全率与检准率1.检全率及其影响:检全率=(检出的相关信息数/信息库中相关信息总数)x100%2.检准率及其影响:检准率=(检出的相关信息数/检出的信息总数)x100%影响检出文献的检索效果的质量。

三、检索模型1.布尔检索模型(1)定义:布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表达用户提问,通过对文献表示与提问式的逻辑运算来检索文献。

(2)优点:简单、易理解、易实现、能处理结构化提问(3)缺点:A.布尔检索式的非友善性,即构建一个好的检索式是不容易的。

尤其是对复杂的检索课题,不易套用布尔检索模型。

B.易造成零输出或过量输出。

检索输出完全依赖布尔提问式与系统倒排挡中的文献匹配情况,输出量较难控制。

C.无差别的组配元,不能区分各组配元的重要程度。

D.匹配标准存在某些不合理的地方。

由于匹配标准是有或无,因此,对于文献中表因此的数量没有评判,都一视同仁。

E.检索结果不能按照重要性排序输出。

2.向量检索模型(1)定义:向量检索是以向量的方式确定检索内容的方法,系统中的每一篇文献和每个提问均用等长的向量表示。

(2)优点:A.采用自动标引技术维文献提供标引词B.改变了布尔检索非“1”即“0”的简单判断,标引词和文献的相关程度可在【0,1】闭区间中取值,使标引和检索者都可比较灵活地定义组配元(标引词)与文献的关系深度,改变了布尔检索模型僵化的特点。

C.由于以其相似的程度作为检索的标准,可从量的角度判断文献命中与否,从而使检索更趋于合理。

D.检索结果可按提问的相关度排序输出便于用户通过相关反馈技术修正提问,控制检索量。

E.布尔模型的逻辑关系依然可以使用,保留了直观性和方便性。

(3)缺点:A.如检索过程转化为向量的计算方法,不能反映出文献之间的复杂关系B.由于对任何一个提问都需要计算全部文献库中的每一篇文献,因此,计算量大、算法复杂度高。

信息检索期末考试重点

信息检索期末考试重点

1,、十大信息源:图书、连续出版物、学位论文、科技报告、会议文献、政府出版物、专利信息、标准信息、产品样本、档案文献2、二次信息:是对一次信息进行加工、提炼、压缩和整理后所得到的信息,如目录、题录、文摘、索引和名录等检索工具。

二次信息主要功能是检索通报控制一次信息帮助人们在较少时间内获取较多信息,故又称为检索信息或通报性信息,其具有汇集性工具性综合性系统性等特点。

3信息素质;作为具有信息素质的人必须具有一种能够充分认识到何时需要信息并有能力有效地发现检索评价和利用所需要的信息解决当前存在的问题的能力4信息素质的内容:信息意识、信息能力、信息道德1、信息检索是指依据一定的方法从已经组织好的大量有关信息组合中直接查找并获取特定的相关信息的过程。

2、信息检索的基本原理可以从信息的替代、整序、标识的匹配三方面来讲述。

3、信息检索的类型文献检索、数据检索、多媒体检索4、信息检索的发展趋势表现在智能化、可视化、个性化、专业化5、信息检索的意义:有利于培养人才提高学生自学能力和独立的科研能力;帮助科研人员继承和借鉴前人的成果避免重复研究减少重复劳动;帮助科研人员迅速准确的获取所需的全部资料提高科研效率缩短科研周期;促进信息资源的开发利用推动社会进步和经济发展。

6、检索语言是根据信息检索的需要而创制的人工语言适应文献信息的加工存储和检索的共同需要而编制的语言是表达一系列概括文献信息内容和检索课题内容的概念及其相互关系的一种概念标志系统。

7、检索语言的主要作用标识文献信息内容及其外表特征保证不同标引人员标引文献的一致性;对内容相关的文献信息加以集中或揭示其相关性;使文献信息的存储集中化系统化组织化便于检索着按照一定的排列次序进行有序化检索;便于将标引用语和检索用语进行相符性比较保证不同检索人员表述相同文献内容的一致性;保证检索者按不同需要检索文献时都能获得最高查全率和查准率。

8、信息检索技术布尔逻辑检索、截词检索、位置检索、限制检索9、信息检索的评价指标体系主要包括对信息检索数据库的评价对检索结果的评价对检索功能的评价和对用户负担的评价。

信息检索期末重点

信息检索期末重点

信息检索考试提纲【概念】1、信息——自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互联系、相互作用等运动状态的表达。

2、知识——人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。

3、文献——凡是记录有信息或知识的一切载体。

4、情报——为了解决一个特定的问题所需要的激活了的、活化了的特殊知识或信息。

关系:P7①包含关系文献是记录有知识的载体,知识是信息的一部分情报来源于信息,信息包含了情报文献包含于信息内②转化关系文献是记录有知识的载体,当文献中的知识信息传递给用户并为用户所利用时,就转化为情报。

③交叉关系情报虽多来自文献,但也可能来自口头和实物信息,所以情报与信息、文献存在交叉关系。

例如:感觉到天气的冷暖(信息)知道是气候的变化引起了冷和热(知识)收听天气预报得知气温变化了(文献)为了研究果树的生长规律而收集的气象资料(情报)5、文献信息检索语言——用来描述文献特征和表达信息提问,沟通信息标引人员和信息检索者双方思想的一种人工语言。

6、检索工具——用来报道、存储和查找文献线索或全文的工具。

【文献类型的划分及判断】1、按文献的载体形式划分 P9①手写型信息资源手写记录,包括泥板、羊皮纸、甲骨、卜辞、碑铭、竹简、绢帛以及后来的笔记。

记录方式为人工抄写,包括手写稿、信件、日记、原始档案等。

②印刷型信息资源以纸张为载体,通过铅印、油印、胶印等手段。

例如各种书刊。

占据空间大,不易管理保存。

③缩微型信息资源以印刷型文献为母本,以感光材料为载体。

包括缩微胶卷、缩微平片、缩微卡片。

节省空间,保存时间长,不易损坏,但必须借助微缩阅读机,设备投资较大。

④声像型信息资源采用录音、录像、摄影、摄像等手段,将信息记录在光学材料、磁性材料上。

例如磁带、磁盘、光盘、软盘等。

存储密度高、直观、真切,尤其适于记录用文字、符号难以描述的复杂信息和自然现象,但是不能直接阅读,费用高。

信息检索复习提纲及答案

信息检索复习提纲及答案

信息检索复习提纲及答案第一篇:信息检索复习提纲及答案“信息获取与利用”复习大纲1.什么是信息素养?简述评判是否具备信息素养的标准是什么?结合自己的实际工作,谈谈提高信息素养的途径。

答:指个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力”。

标准:⑴能够独立决定所需信息种类和程度。

⑵能够高效地获取所需信息。

⑶能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选。

⑷能够有效地利用信息达到某一特定的目的。

⑸能够在信息利用过程中遵守相关的法律法规。

途径:⑴通过网络搜索⑵信息检索课⑶参加“图书馆利用系列讲座”等信息实践活动。

2.信息、知识、情报的概念?举例说明概念间的区别和联系文献?答:信息,由事物发出的消息、指令、数据等所包含的内容。

如花的生长方向。

知识,是人类社会实践的总结,是人的主观世界对于客观世界的概括和如实反映。

如每天吃一个苹果有利健康。

情报,是激活了、活化了的知识,是为特定目的服务的信息。

如搜索汽车替代燃料时,获得有关乙醇汽油的信息就是情报。

3.文献有那些类型?将文献划分成这些类型的依据是什么?答:纸张文献、缩微文献、电子文献、音像文献。

依据知识内容、记录载体、记录方式。

4.科技文献的作用是什么? 答:⑴科技进步的阶梯。

⑵传递科技信息或知识。

⑶加速科学技术的进步,促进了社会的发展。

5.比较图书和期刊,他们各自有哪些特征,其特点和用途是什么?答:图书特点,内容系统、全面、成熟、可靠,但时效性较差。

用途,对范围较广的问题获得一般知识、或对陌生的问题获得初步了解。

特征,书名、著者、出版社名称、出版地点、出版时间、图书总页数、ISBN。

期刊特点,品种多、数量大、出版周期短、报道速度快、内容新颖、及时反映当前科技水平。

用途,是科技人员吸取成果、掌握进展、了解动态、开阔思路的重要参考文献。

特征:论文题名、著者、期刊刊名、卷号、期号、起止页号、ISSN。

6.特种文献有哪几种类型,简述其中任意两种的特点。

信息检索期末复习题

信息检索期末复习题

信息检索考试大纲一、单选题 (20小题,每题1分)非规范检索语言SCI 与其他文献刊物的不同之处在于?团体索引 引文索引 了解科研最新动态知识产权的范围?二、判断题 (10小题,每题1分)三、填空题 (共10分,每空0.5分)1信息论、系统论、 控制论的创始人是2信息的特征有 可存储性 可传递性 可转换性 可处理性 可共享性 可识别性 依附性 普遍性3检索提问式可由 和 两个构成 4 一起构成现代社会的三大支柱5从内部特征进行检索的最重要的两种途径是6广义的信息检索包括信息的7信息检索可区分为不同的类型8文献定义包括的三个基本要素9文献按照加工程度不同主要四个级别四、名词解释1查全率查全率是指被检出的相关文献数量与系统中的相关文献总量之比,反映了信息检索系统全面获取信息的能力。

用公式表示如下:%100⨯=系统中的相关文献总量被检出的相关文献数量R2查准率查准率是指被检出的相关文献数量与被检出的文献总量之比,反映了信息检索系统准确获取信息的能力。

用公式表示如下:%100⨯=被检出的文献总量被检出的相关文献数量P3知识:4文献:用文字、图形、符号、声频、视频等技术手段记录人类知识的一种载体,或理解为固化在一定物质载体上的知识。

也可以理解为古今一切社会史料的总称。

现在通常理解为图书、期刊等各种出版物的总和。

文献是记录、积累、传播和继承知识的最有效手段,是人类社会活动中获取情报的最基本、最主要的来源,也是交流传播情报的最基本手段。

正因为如此,人们把文献称为情报工作的物质基础。

5年鉴:年鉴是以全面、系统、准确地记述上年度事物运动、发展状况为主要内容的资料性工具书。

汇辑一年内的重要时事、文献和统计资料,按年度连续出版的工具书。

它博采众长,集辞典、手册、年表、图录、书目、索引、文摘、表谱、统计资料、指南、便览于一身,具有资料权威、反应及时、连续出版、功能齐全的特点。

属信息密集型工具书。

6索引:索引是把一种或多种文献中具有检索意义的内容,按一定顺序加以编排并注明出处以供查检的工具。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

【云南大学】信息检索期末复习重点第一篇:【云南大学】信息检索期末复习重点云南大学信息检索重点第一章一、检索策略定义:在处理信息需求提问实质的基础上确定检索途径、检索词语并明确各词语之间的逻辑关系,查找步骤、系统输出顺序等方面的科学安排,与检索效果密切相关。

二、检全率与检准率1.检全率及其影响:检全率=(检出的相关信息数/信息库中相关信息总数)x100%2.检准率及其影响:检准率=(检出的相关信息数/检出的信息总数)x100% 影响检出文献的检索效果的质量。

三、检索模型1.布尔检索模型(1)定义:布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表达用户提问,通过对文献表示与提问式的逻辑运算来检索文献。

(2)优点:简单、易理解、易实现、能处理结构化提问(3)缺点:A.布尔检索式的非友善性,即构建一个好的检索式是不容易的。

尤其是对复杂的检索课题,不易套用布尔检索模型。

B.易造成零输出或过量输出。

检索输出完全依赖布尔提问式与系统倒排挡中的文献匹配情况,输出量较难控制。

C.无差别的组配元,不能区分各组配元的重要程度。

D.匹配标准存在某些不合理的地方。

由于匹配标准是有或无,因此,对于文献中表因此的数量没有评判,都一视同仁。

E.检索结果不能按照重要性排序输出。

2.向量检索模型(1)定义:向量检索是以向量的方式确定检索内容的方法,系统中的每一篇文献和每个提问均用等长的向量表示。

(2)优点:A.采用自动标引技术维文献提供标引词B.改变了布尔检索非“1”即“0”的简单判断,标引词和文献的相关程度可在【0,1】闭区间中取值,使标引和检索者都可比较灵活地定义组配元(标引词)与文献的关系深度,改变了布尔检索模型僵化的特点。

C.由于以其相似的程度作为检索的标准,可从量的角度判断文献命中与否,从而使检索更趋于合理。

D.检索结果可按提问的相关度排序输出便于用户通过相关反馈技术修正提问,控制检索量。

E.布尔模型的逻辑关系依然可以使用,保留了直观性和方便性。

(3)缺点:A.如检索过程转化为向量的计算方法,不能反映出文献之间的复杂关系B.由于对任何一个提问都需要计算全部文献库中的每一篇文献,因此,计算量大、算法复杂度高。

C.由于标引加权和检索加权是分离的,因此,随意性较大,难以保证质量。

3.概率检索模型4.扩展布尔逻辑检索模型5.相关反馈模型四、信息检索的步骤1.分析研究课题,明确查找要求2.选择检索工具3.制定检索策略、途径和方法4.根据文献线索,查阅原始文献五.信息检索的方法1.布尔检索与(AND *):A*B,表明一篇文献中A和B同时存在或(OR +):A+B,表明一篇文献中A或B必须存在,也包含同时存在非(NOT-):A-B,表明一篇文献中包含A但不包含B 2.截词检索(1)类型A.按截断位置:后截断、前截断、中截断;B.截断的字符数量:有限截断、无限截断。

(2)实施A.后截断:将截词符号放在字符串右方,保持词的前方一致。

computer* computerise/computersB.前截断:将截词放在字符串左方,保持词的后方一致。

*computer◊microcomputer/minicomputerC.前后同时截断:*computer*D.中截断:又称通用字符法,将截词放在检索词的中间,主要解决一个词的英、美不同拼法及有些词的单复数问题。

organi?ation◊organisation/organization 3.限制检索4.全文位置检索5.加权检索6.多媒体检索第二章一.基本概念1.书目数据库(1)定义:书目数据库是指存储某个领域的三次文献(如文摘、题录、目录等)书目数据的一类数据库,属于参考性数据库中的一种。

(2)类型A.文摘、索引数据库:与书本式文摘、索引相同,提供确定的文献来源信息B.图书馆目录库(3)特点A.历史悠久,是机读数据库发展的先驱;B.文献数据量大,连续性累积性强;文献类型齐全,语种多C.使用上没有限制,开放性好D.记录结构简单固定;E.更新周期长,生产费用低;F.数据及主题词规范性好,索引系统完备。

2.全文数据库:其记录不仅包括原始文献的目录,而且收录了原始文献的全文。

3.一次文献:一次文献又称为原始文献。

它指作者以本人的研究成果为基本素材创作而成的文献。

包括阅读性图书、期刊论文、科技报告、会议论文、专利说明书、技术标准、学术论文、实验记录、日记、备忘录、内部报告、技术档案、信件等公开或不公开发表的文献。

译文一般也归入一次文献。

4.二次文献:指文献工作者对分散的、无组织的一次文献进行加工、提炼和浓缩之后得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性的文献。

一般包括:目录、题名、文摘、索引。

5.三次文献:是指对有关的一次文献和二次文献进行广泛深入的分析研究之后综合概括而成的产物。

如评述、综述、进展报告、百科辞典、名录、指南、手册。

6.核心期刊:在某一学科中,少数期刊覆盖了该学科的大部分最有参考价值的文献,而多数期刊仅包含该学科的少量最有参考价值的文献,这少数期刊就是该学科的核心期刊。

7.灰色文献:非正式出版物又叫零次文献、灰色文献,是指非正式出版物或非正式渠道交流的文献,未公开于社会,只是为个人或某一团体所用。

如手稿、私人笔记,信件等。

二.特种文献1.定义特种文献是一种介于图书与期刊之间的似书非书、似刊非刊的文献类型,通常在出版发行方面或获取途径方面比较特殊,因此称为特种文献。

它包括了除图书、期刊之外的所有其他类型的文献,如会议文献、学位论文、专利文献、标准文献、政府出版物、科技报告、产品样本和产品目录以及档案等。

2.类型(1)会议文献检索系统:OCLC-Papers-First、OCLC-Proceeding(2)学位论文A.定义:是高等学校或研究机构学生为获得某红学位二撰写的科学论文。

一般分为学士论文、硕士论文和博士论文。

B.检索系统:ProQuest Digital Diseertations;ProQuest博士论文全文数据库;中国学位论文数据库;中国优秀博硕士学位论文全文数据库;Calis高校学位论文库。

(3)专利文献A.检索系统:专利局;中国专利信息检索系统;世界知识产权组织网站专利数据库B.专利分类法a.原则:行业分类原则:根据发明的用途或应用领域分类;功能分类原则:根据发明的“直接功能、效用或产品”分类,即以装置、物质或工艺的本质效用作为分类依据。

b.IPC:InternationalClassfication of Patent for Invention 《国际专利分类表》原则:功能分类与行业分类相结合,功能分类优先为原则分类:IPC按照五个等级分类,部(Section)、大类(Class)、小类(Subclass)、主组(Main Group)、分组(Group),其中部是分类表中最高等级的分类层,按照领域不同,分为八个大部,用一位的英文字母标记,分别是A-H,分部不设类号。

因此,一个完整的IPC分类号由代表部、大类、小类、大组或小组的符号共同组成。

一个完整的IPC 分类号:F04D29/30 F(部)04(类)D(小类)29(主组)/30(分组)(4)标准文献A.定义:指按规定程序制定,经公认权威机构批准的一整套在特定范围(领域)内必须执行的规格、规则、技术要求等规范性文献。

B.检索系统:ISO;中国标准咨询网;万方数据资源系统中的标准库;NSSN(5)科技报告:科技报告是报道研究工作和开发调查工作的额成果或进展情况的一种文献类型。

美国四大报告(AD报告、PB报告、NASA报告和DOE报告)是世界上出版量最大、影响最广的科技报告。

第三章一.百科全书定义:是荟萃人类一切门类或某一类完整知识,概要加以叙述并有序编排的工具书。

二.类书1.定义:是摘录、汇集多种文献中的原文,按类目或按韵部编排而成的工具书。

2.举例:《太平御览》《永乐大典》《古今图书集成》三.政书1.定义:是记述历代或某一朝代的典章制度的沿革及政治、经济、军事、文化制度等方面史料的工具书。

2.三通:《通典》《通志》《文献通志》3.十通:《通典》《通志》《文献通考》《续通典》《续通志》《续文献通考》《清朝通典》《清朝文献通考》《清朝文献续通考》四.类书和百科全书的区别1.编撰方式的不同类书是原始资料的汇集,百科全书是对已有知识的加工、整理和浓缩。

2.编排方式不同类书是根据原始资料分类或音韵进行编排,百科全书则是以条目的字顺进行编排。

3.内容有别类书一般侧重于文史资料,而百科全书以反应人类全部知识力为己任,对自然科学方面的知识更为重视。

4.后期工作不同类书很少补充或者修订,百科全书有连续修订制度。

5.检索体系有无百科全书有完备的索引体系,部分条目有参考书目,指引读者进一步阅读等,类书不具备。

五.工具书的类型、各自的特点、编排及功能1.书目(1)定义:书目是揭示与记录一批相关文献,并按一定次序编排而成的检索工具(2)编排书目的正文;有的书目还有文献的提要或注释书目记录可根据不同的需要另多种编排方式;书目正文后一般附有辅助索引。

(3)功能是进行出版物等级、统计报告、指导阅读和科学管理图书的工具。

也是“辨章学术、考镜源流”,鉴别图书真伪异同的重要工具。

2.索引(1)定义:又名“引得Index”,原有面检、备检、韵编之称。

索引是将书、刊或其他文献中重要的或有意义的信息摘录下俩,按一定方式顺次编排,并注明出处的检索工具。

(2)编排:索引正文的结构是款目的有序编排;款目由标目、说明语和出处构成;款目依字顺、分类等方式编排;独立式索引多附有辅助索引。

(3)功能:提供文摘索引;指引篇名、文句、语词与专题论述的出处;增加检索途径;比书目能进一步细致地揭示图书报刊的内容;可分析某一文献的主题内容以及关于某一学科或课题的最新观点和发展趋势。

从词句索引可研究作者写作分割,寻找特定语句出处,还可供寻章揽句、采撷辞藻。

3.文摘(1)定义:文摘是将文献的主要内容简要确切地加以描述,并注明出处,以一定的方法编排的检索工具。

(2)编排每一款目分两部分,一部是对文献的内在特征和外在特征的描述,另一部分是关于文献内容的概括。

款目一般按分类编排;有些文摘还附有辅助索引。

(3)功能通报最新的科学文献;深入揭示文献内容,吸引读者阅读原文;节约阅读时间;确定原文与检索需要的相关程度,决定取舍;帮助读者克服语言上的障碍。

六.常用排检法1.字顺法:形序法部首、笔画字顺法号码法四角号码、中国字庋撷、起笔笔形法音序法汉语拼音、注音字母法、韵部排列法 2.分类法学科系统排列法(中图法等)事物性质排列法、四部分类法、自编分类体系 3.主题法索引4.时序法年表、历表5.地序法地方志、地图、地名录七.图情专业期刊中国图书馆学报、大学图书馆学报、图书情报知识、图书情报工作、图书馆杂志、图书馆建设、图书与情报、情报学报八.图情常用资源1.文摘数据库LISA:Library&information science Abstracts 图书馆与信息科学文摘 LISAT:Library,information science and technology abstracts 2.全文数据库Library Literature and information science full text ACM digital library ASIST digital Library’ Emerald E线图情国道特色数据库 3.网络资源书社会:图书馆和图书馆员的沙龙ODLIS(图情在线辞典)4.常用图情机构网站 IFLA UNESCO Libraries Portal ALA PLA 中国图书馆学会第五章一.文摘索引型检索工具/数据库1.SCI:Science Citation Index 自然科学方面的《科学引文索引》2.SSCI:Social Science Citation Index 社会科学方面的《社会科学引文索引》3.EI:Engineering Index 工程技术信息的《工程索引》4.BP:BIOSIS Preview 生物科学方面的《生物学文摘》 5.MEDLINE 医学信息6.CA:Chemical Abstracts《化学文摘》6.中文社会科学:《全国报刊索引》、《报刊资料索引》二.电子期刊1.英文电子期刊全文数据库:Springer Link;2.中文电子期刊:中国期刊全文数据库、中文科技期刊数据库、万方数字化期刊三.电子图书和报纸1.免费:Project Gutenberg古腾堡计划;e书时空2.收费:超星数字图书馆、书生之家、中国数字图书馆、方正Apabi数字图书馆第六章一.JSR指数期刊引文分析报告是综合了解学术期刊的评价性工具,利用JSR 了解学术期刊的重要性。

相关文档
最新文档