信息检索原理与技术考试大纲重点整理

合集下载

信息检索考试重点

信息检索考试重点

信息检索考试重点1. 按物质载体和记录形式划分,信息可分为印刷型、缩微型、声像型、机读型和手写型。

2. 文献是指“记录有知识的一切载体”,情报是“作为交流对象的有用知识”3. 内容、符号系统、物质载体、记录方式是构成文献的四个基本要素。

4. 按出版形式和内容的不同,信息可分为图书、期刊、报纸和特种信息。

特种信息也叫做灰色信息,包括:专利信息、学位论文、标准信息、会议信息、科技报告、政府出版物、产品样本资料和档案。

5. ISBN是国际标准书号,由13位数字组成,分成四段:组号(国家、区域、语言的代号);出版者号;书序号;检验码。

ISSN号是国际标准出版物号,由8位数字组成,分两段:分序号、校验码。

6. 图书按用途可分为3种类型:阅读用书,参考工具书,检索用书7. 按检索方法划分,检索工具可分为手工检索工具、计算机和网络检索工具。

8. 知识产权范围主要包括专利权、著作权和商标权9. 知识产权具有两大功能:保持功能和公开功能10. 广义的检索包括信息的存储和检索两个过程。

11. 检索方法分为常规法、引文法(追溯法和检索引文法)和交替法三种12. 检索途径可以分为主题途径、分类途径、责任者/著者途径、号码及其它途径13. 手工检索工具中的著录项目在数据库中称为字段,字段的集合称为记录。

14. 文献数据库内英文段码Abstract对应的中文段码名称是文摘。

Keyword对应的中文段码名称是关键词。

15. 按国际上通用的分类法,数据库分为参考数据库、源数据库和混合型数据库。

16. 中国现行主要的图书分类方法是《中国图书馆分类法》,它属于体系分类语言。

17. 《中图法》第四版将图书分为5部,22大类,L.M.W.Y没有,计算机属于TP类, 属于二级类目。

18. 索书号主要由分类号和著者号组成。

19. 在因特网中,政府机构和商业组织的二级域名分别是GOV、COM。

域名.hk所指的国家或地区是香港;.org的含义是非营利组织.20. 公告号为8510961的专利是发明专利,专利号为200420011414.6的专利是实用新型专利;申请号为99322746.5的专利是外观设计专利。

信息检索复习提纲总结

信息检索复习提纲总结

第一章信息检索导论(1)信息的概念是什么?概念:信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。

(2)信息素质的定义及其构成要素分别是什么?定义:信息素质是人们能够敏锐地察觉信息需求,并能对信息进行检索、评价和有效利用的能力。

构成要素:信息意识,信息能力,信息道德(3)信息环境特征信息超载严重,信息失衡明显,信息污染成灾,信息障碍加剧,信息犯罪增多(4)熟悉文献信息资源的划分方式,以及在不同划分方式下文献的表现形式从文献的物质载体特征:印刷型文献,缩微型文献,声像型文献,机读型文献从文献信息的表现形态:1.图书2.期刊 3.报纸 4.学位论文 5.会议文献 6.专利文献 7.标准文献 8.科技报告 9.政府出版物10.产品资料 11.其他文献从文献信息被加工的详略程度:一次文献是基础,是检索利用的对象,二次文献是检索一次文献的工具,三次文献是一次文献内容的高度浓缩(5)掌握文献检索的含义、文献检索系统的分类(6)了解常用的文献检索方法引文法——追溯法系统法——工具法引文法-系统法交替法——循环法(7)熟练运用常规的检索技术(布尔逻辑检索、截词检索、位置检索、限定检索)常用检索技术及其作用布尔逻辑检索截词检索位置检索限定检索如physic* 可检出的词汇有:physic, physical, physically,physician, physicians, physicist, physicists, physics如physic??可检出的词汇有:physic, physical, physics(8)了解提高信息检索效果的主要措施1.检索结果多时使用“AND”缩小检索范围2.检索下位词时不使用上位词3.使用“NOT”将不需要的检索标识排除4.使用位置符限定检索标识的位置5.使用限定符限定检索标识所在字段第二章常用国内全文数据库1、掌握中文全文数据库的常见类型电子图书数据库, 电子期刊数据库学位论文数据库中国专利文献数据库中国标准文献检索中国学术会议文献检索事实型数据库2、熟练操作常用的中文电子图书数据库选择检索项SU=主题TI=题名KY=关键词CF=被引频次FT=全文AU=作者AF=机构CLC=中图分类号RF=引文YE=年SN=ISSN CN=统一刊号IB=ISBN FU=基金AB=摘要FI=第一责任人JN=中文刊名&英文刊名3、熟练操作常用的中文电子期刊数据库4、掌握中文学位论文数据库的使用方法5、了解专利相关知识(包括专利概念、类型、特点、专利号等)以及专利文献数据库的使用专利的概念:专利是指国家授予发明创造申请人在一定时间内的对发明创造拥有的专有权利。

(完整版)信息检索考试重点

(完整版)信息检索考试重点
2、利用从《中文期刊全文数据库》、《中国知网》、《维普科技期刊全文数据库》等查出 10 篇以上专业文章,写出 1500 字以上的综述。 答: 新经济学 新经济时代的到来与传统经济理论的缺陷 当今世界经济发展进入了一个新时代, 这就是知识经济与可持续发展经济的新时代。

hing at a time and All things in their being are good for somethin
(二)
1、什么是检索工具?它的主要作用是什么? 答:检索工具是用来存储、报道和检索一次文献的工具,属于二次文献。 主要作用:报导作用、累计作用、查询作用、选择作用。 2、目录、题录、索引、文摘、文献指南各有那种类型? 答:目录可以分为国家目录、馆藏目录、联合目录、出版社与书商目录和专题目录。 题录的类型一般都是用代号表示。 索引类型可分为篇目索引和内容索引 文摘按其内容的详简程度可以分为指示性文摘和报道性文摘;按其适用对象可以分为一 般性文摘和倾向性文摘;按内容性质可以分为综合性文摘和专业性文摘。 文献指南主要介绍该科学和专题的主要文献类型。 3、什么是参考工具书?它有哪些主要作用? 答:参考工具书是根据一定的社会需要,广泛汇集某一范围的知识材料,按一定方式加以 编排,专供人们解释疑惑的特定类型的出版物。 作用:查字词、查事项、查人物、查机构、查产品、查物名、查地名、查年代、查数据。 4、字典和词典、百科全书、年鉴、名录、图录有哪些主要类型? 答:字典类型一般分为两种:○1 详解词典○2 专门词典。 词典从语种文别角度分为:○1 单语言辞典○2 多语言辞典。 从词量规模角度:○1 大型词典○2 中型词典○3 小型词典。 从收录内容角度:○1 百科全书○2 语文词典○3 专门词典。 百科全书分为两种类型:一类是概括人类一切门类知识,包括哲学、社会科学、自然科学 和应用科学等所有门类知识的综合性百科全书。另一类是指内容只收内容某一学科或某个 门类、某个专业的知识信息的专科性百科全书。 年鉴类型分为综合性年鉴、专业性年鉴、统计性年鉴。 名录类型分为人名录、地名录、物名录、机构名录。 图录类型分为地图录、科学技术用图集、历史图谱、文物图谱及人物图录。 (三)

信息检索考试重点

信息检索考试重点

名词解释4*4’1.信息素质:个体在现实需求的驱动下,能有效地发现、获取、评价和利用信息。

2.信息检索广义的信息检索全称是“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。

狭义的信息检索“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。

3.登记性目录(概念)也叫国家书目,它是出版物国家登记制度的产物,反映国家出版的全部图书,实际上也反映了一个国家的文化、科学和出版业的水平。

4.联合目录(概念)汇总若干个单位馆藏而形成的目录,是馆藏目录的放大。

5.年鉴(概念)年鉴是汇辑一年内的重要时事文献、学科进展,汇辑各种统计资料和重要信息,并按年度出版的连续性出版物。

6.OPAC(公共联机书目查询系统)利用计算机终端来查询基于图书馆局域网内的馆藏数据资源的一种现代化检索方式,通过联机查找为读者提供馆藏文献的线索。

7.引文索引(概念)根据美国科学信息研究所(Institute for Scientific Information,简称ISI)的定义:对于文献A和B:若文献B提到或引用了文献A,则A是B的引文。

这里,文献A被文献B 提到或引用,A是被引用文献或参考文献。

同时由于B引用了A,故B又称为引用文献。

8.垂直搜索引擎(概念)也被称为专业搜索引擎,或主题搜索引擎。

它专门收录某一方面、某一行业或某一主题内的信息,专为查询某一个学科或某一主题的信息提供检索服务,在解决某些实际查询问题的时候比综合搜索引擎更有效。

简答4*9’信息素质包含四个层面的含义:第一,用户有一定的信息需求,即在某个时候需要了解某方面信息。

第二,掌握了主要的信息源和信息工具的知识及技能。

第三,能够分析评价选择相关信息。

第四,利用信息的目的是为了有效地解决具体问题。

信息素质主要表现为信息理论素养和信息的实践能力,包括信息意识、信息知识、信息能力和信息道德等内容。

信息检索复习大纲

信息检索复习大纲

信息检索复习大纲第一章1.、信息的含义:信息是客观事物经过感知或认识后的再现。

2、知识的含义:知识是人们通过客观实践对客观事物及运动过程和规律的认识。

3、文献的含义:文献是记录有知识的一切载体知识、载体、记录是构成文献的三个基本要素。

4、信息资源的含义:信息资源是经过人类筛选、组织、加工,并可以存取和能够满足人类需求的各种媒介信息的集合。

5 、图书:图书是作者围绕一个中心主题进行研究和探索,比较成熟的、定型的,而不定期出版的出版物。

6、连续出版物的概念:连续出版物是一种具有统一名称、固定版式、统一开本、连续编号,汇集多位著者的多篇著述,定期不定期编辑发行的出版物。

7、学位论文是大学生或研究生为取得学位资格而提交的学术论文。

8、会议文献主要是指在国内外各类会议上宣读或交流的论文、报告或其他有关资料。

9、专利文献是实行专利制度的国家和地区及国际性专利组织在审批专利过程中产生的官方文件及其出版物的总称。

10、标准文献是为了在一定范围内获得最佳秩序,经协商一致制定并由公认机构批准,共同使用和重复使用的一种规范性文件(GB/T20001-2000)。

11、信息素质的含义:利用大量的信息工具及主要信息源使问题得到解答的技术和技能。

信息素质的内涵包括三个方面:信息意识、信息能力、信息道德。

12、信息能力的含义:指人们有效利用信息技术和信息工具获取信息、加工处理信息以及创造和交流新信息的能力。

主要包括以下内容:信息需求分析和表达能力、信息获取能力、信息分析和处理能力、信息利用能力13、互联网的应用包括:信息获取、交流沟通、网络娱乐、商务交易。

第二章1、信息检索广义概念:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,全称“信息的存储与检索”。

2、信息检索过程::(1)分析检索需求;(2)确定检索标示;(3)选择检索系统和检索工具;(4)实施检索操作;(5)索取原始文献。

3信息检索按检索对象内容划分包括:文献检索、数据检索、事实检索、多媒体检索。

信息检索复习提纲

信息检索复习提纲

信息检索复习提纲一、填空题:1.根据文件载体的物理形式,文件可分为现代机读文件、视听文件和微型文件,以及传统的印刷文件。

2.按照检索的查找对象,信息检索分为数据、事实及文献检索。

3.一个完整的信息检索系统主要由六个子系统组成:文档选择、信息检索语言、文档索引、信息检索、用户系统交互和匹配。

4.各种检索语言的基本特性是:分类语言按学科专业集中文献信息;主题语言按特定事物集中文献信息;引文语言按引用关系集中文献;自然语言按词语集中文献信息。

5.信息检索中使用的检索方法可归纳为三类:常用方法、回溯方法和循环方法。

6.《中国出版年鉴》于1981年首次出版,此后每年出版一次,反映了前一年图书出版业的情况。

7.《四库全书》是中国和世界上最大的一部剧集。

8.在《四库全书》中,政治书籍属于历史系,班级书籍属于分系。

9.信息检索的本质是问号与文献号的比较。

10.召回率和准确率的计算。

2、术语解释:1。

文件传输2。

信息检索3。

数字图书馆4。

信息素养教育5。

主题词6.参考咨询服务三、简答题:1.简要描述信息源和信息资源的概念和区别?2.手册和年鉴有什么区别?3.类书与百科全书的区别?4.类书与资料汇编的异同?5.尝试描述文献信息的水平及其关系?6.信息检索的步骤?附件:手册与年鉴的区别?(1)手册内容基本,得到人们的肯定;年鉴包含了正在发展和变化的东西。

(2)本手册注重应用性和实用性,具有指导实践的功能;《年鉴》强调信息的准确性和及时性,不起指导实践的作用。

(3)手册中没有评论。

这是纯粹的信息,而年鉴允许权威评论。

(4)本手册主要面向专业人士,一般都很简单练、科学的专业语言,年鉴主要以普通读者为对象,较少使用专业语言。

教科书和百科全书有什么区别?(1)类书侧重于资料性,它将文献资料以类相从不加改动地直接辑录,仍保留着原始文献的形式。

而百科全书则是概括人类的一切知识并系统地加以叙述,侧重于知识性;(2)类书重在编,它将不同来源的同一资料不避重复地汇编于同一主题下,是原始资料的堆砌。

信息检索复习题以及重点

信息检索复习题以及重点

信息检索复习题1、信息检索的步骤包括:界定问题、选择信息源、制定检索策略并实施检索、评价信息、分析利用信息五个步骤。

2、文献中ISBN、ISSN分别是指:国际标准书号、国际标准刊号。

3、文献按出版形式划分为哪几种?简述之。

答:按出版类型划分:图书、期刊、特种文献:(科技报告、会议文献、专利文献、标准文献、学位论文、政府出版物、产品资料、技术档案)4、给出“基于云计算的煤矿安全监测预警系统研究”一文的关键词。

煤矿监测预警云计算数据挖掘5、给出3种常用搜索引擎名称,什么情况下应该使用百度快照?答:百度、Google、360、搜狗搜索到的结果无法打开或打开速度很慢的情况下,可以使用百度快照。

6、利用百度搜索一份技术开发合同,应该在搜索框输入(技术开发合同 filetype:doc 或技术开发合同 filetype:ppt )。

(提示:技术开发合同的格式:doc或pdf)。

百度以“filetype:”来限制,后面是文档格式。

文档可以是pdf、doc、xls、ppt等。

首选gov(政府)、edu(教育)、org(非盈利性机构)、ac(学术类)网站;次选com(商业) net(网络)等7、CNKI中国知网主要收录哪些类型的全文学术文献?期刊文献,报纸,会议文献,国外学术文献,工具书,年鉴,专利,成果,标准文献,博士学位论文,硕士学位论文8、查找中文全文图书和期刊文献分别有哪几个数据库?中文全文数据库:CNKI中国知网.维普期刊资源整合服务平台.万方数据知识服务平台,读秀学术搜索9、学位论文有哪些特点?简述之。

4)学位论文(dissertation,thesis)指高等院校和科研机构的毕业生在获取相应学位时,必须提交的论文。

外部特征:著者、论文题名、颁发学位的机构名称、学位等级、授予年份等。

其主要辨识特征是学位名称,特征词:Ph,D,MS等。

从内容上看,学位论文具有以下四个特点:学术性,科学性,创造性,规范性10、依据GB/T7714-2005,分别给出图书、期刊和学位论文的著录格式,并各举一例。

信息检索复习提纲一

信息检索复习提纲一

信息检索复习提纲第一章 信息检索的基础知识1.1 信息检索的基本概念一、基本概念1、信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息 。

2、文献:大凡人类的知识用文字、图形、符号、声频、视频的手段记录下来的东西,统统可称为文献。

也可以称为固化在一定载体上的知识。

3、资料:固化在一定的实物或载体上的知识。

二、信息的传递渠道:非正式传递渠道和正式传递渠道(非正式过程、正式过程)(1)非正式过程a、科学技术工作者之间就他们从事的研究和研制进行直接对话,如交谈、参加学术会议等;b、科技工作者参观同行的实验室、科学展览等等;c、科技工作者对某些工众作口头演讲;d、交换书信、出版物欲印本和单行本;e、研究或研制成果在发表前的准备工作,包括发表形式以及发表的地点和时间的选择。

(2)正式过程a、为手稿的发表所作的编辑出版和印刷过程,包括写书评;b、科学出版物的发行过程,包括与发行过程有关的书刊商业活动;c、图书馆的书目工作和检索工作;d、信息工作本身,从搜集到检索,包括宣传工作。

三、信息检索(P2-4)(一)信息检索:就是从大量的文献中查寻与信息提问所指定的课题(对象)有关的文献,或者是包含用户所需事实与消息的文献的过程。

它包括三个方面: 数据检索 、事实检索 、文献检索数据检索、事实检索、文献检索三者中以文献检索为主。

数据和事实检索是检索出包含在文献中的具体情报;文献检索则是要检索出包含所需要情报的文献。

四、文献检索及其类型(1)定义:1、检索系统的建立及检索工具的组织和积累2、文献的查寻,利用检索工具检出与课题相关的文献。

(2)文献检索的类型1、直接检索:是从通过阅读原始文献直接获取所需信息。

(快捷、方便 漏查率高)a、直接检索原文易于掌握文献的实质内容,可直接判断其信息内容是否符合信息要求,并可能得到意外的收获;b、直接检索简便易行,并且时效高。

信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理

信息检索原理与技术考试大纲重点整理序移动,是一次、二次、三次文献信息的演变过程。

对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。

(1)信息检索:广义理解分为信息的存储与检索。

信息的存储主要包括在某一专业领域范围内的信息选择的基础上对信息的内外特征进行描述、加工并使其有序化,形成信息集合。

信息的检索是指借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息。

狭义的信息检索仅指该过程的后一部分。

存储是检索的基础、检索是存储的反过程。

信息检索的本质是用户的信息需求和一定的信息集合的匹配。

(2)信息检索系统:指为了满足用户的信息需求而建立的存储,经过加工了的信息集合,拥有一定的输入、匹配、输出的技术设备,提供一定的检索服务功能的一种相对独立的实体。

(3)信息检索入口:又称检索点或检索知识,是指用以标识信息的外部特征和内容特征的属性值的集合。

检索知识包括主题词、分类号、著者、标题、机构、代码等。

(4)信息检索的一般原理:P7(5)检索系统由物理构成(硬件、软件和数据库)和逻辑构成(文献与数据的选择与抽取子系统、词表子系统、标引子系统、查询子系统、用户与系统交互子系统、匹配子系统)(6)检索工具的构成:编辑说明与凡例、分类表与主题表、正文、辅助索引、资料来源目录与附录。

(7)检索系统的功能:报道功能、存储功能、检索功能。

(8)信息检索理论:标引理论、检索模型、检索结果的可视化。

(9)现代信息检索技术与方法:全文检索、多媒体检索、超文本及超媒体检索、联机检索、网络信息检索、智能检索、跨语言检索、跨平台检索。

第2章信息检索模型(1)最初的信息检索模型是以数学知识为基础的原因:第一,数学是个有几千年历史的学科,被大家所熟知,并且通俗易懂。

第二,人们的信息有很大的模糊性,甚至用文字不能表达,而文字具有很大程度的抽象性和概括性,这样就很容易表达出人们信息检索的需求,能够很方便快捷地组建信息检索模型。

信息检索考试要点讲解

信息检索考试要点讲解

信息检索考试要点(Word版)考试题型:考试分试卷一,试卷二两部分,试卷一:(客观题80分)(一)单选(20题,20分)(二)多选(20题,40分)(三)判断(20题,20分)试卷二:(20分)(四)填空题(20空,10分)(五)实务题1、写检索式(三题,6分)2、调整检索策略(4分)第一章绪论信息素质:在信息化时代,人们认识、利用和创造信息的品质与素养,它是创新人才应具备的素质。

信息素质由信息意识、信息知识、信息能力和信息道德素质四部分构成。

信息:是自然界、人类社会以及思维活动中普遍存在的现象,是一切事物自身存在方式以及它们之间相互关系、相互作用等运动状态的表达。

信息具有客观性、时效性、共享性、价值性、传递性、开发性知识:是人们在改造世界的实践中所获得的认识和经验的总和,是人的大脑通过思维重新组合的系统化的信息集合。

知识具有意识性、信息性、实践性、规律性、继承性、渗透性情报:是为了解决一个特定的问题所需要的激活了、活化了的特殊知识或信息。

情报具有知识性、传递性和效用性三个基本属性。

文献:凡是记录有信息或知识的一切载体均为文献。

文献具有三个基本功能:存贮知识、传递信息和交流信息;四个基本要素:知识内容、记录符号、物质载体和记录手段。

文献信息资源类型划分标准:一、按物质载体和记录形式划分类型1)印刷型载体纸张等记录手段手写、印刷、打印、复印种类图书、报刊、特种资料等优点便于阅读及广泛流传,成本低缺点存储密度低,所占空间大,保管耗较多人力物力,难于实现自动化类型2)缩微型载体感光材料记录手段缩微拍摄种类缩微平片、缩微胶卷、全息胶片优点体积小,存储密度高,成本低,传递较为方便缺点不能直接阅读,需要借助于缩微阅读机,存储要求较高类型3)声像型载体磁性、感光材料记录手段机械装置输入种类唱片、录音带、录像带、光盘等优点高密度存储,直观、真切,图文并茂,制作快缺点不能直接阅读,需要先进的技术设备,制作成本稍高类型4)机读型载体磁性、感光材料记录手段键盘、扫描等方式输入种类磁盘、磁带、光盘等优点存储密度高,存取速度快,变更记录,易于实现自动化,便于实现信息共享缺点需要先进的技术设备才能“读出”、制作成本较高二、按加工深度划分一次文献:以作者本人的科研、生产和工作成果为依据创作而成的文献。

信息检索复习提纲及答案

信息检索复习提纲及答案

信息检索复习提纲及答案第一篇:信息检索复习提纲及答案“信息获取与利用”复习大纲1.什么是信息素养?简述评判是否具备信息素养的标准是什么?结合自己的实际工作,谈谈提高信息素养的途径。

答:指个人“能认识到何时需要信息,和有效地搜索、评估和使用所需信息的能力”。

标准:⑴能够独立决定所需信息种类和程度。

⑵能够高效地获取所需信息。

⑶能够根据现有的知识背景和评价标准对信息及其来源进行评价及遴选。

⑷能够有效地利用信息达到某一特定的目的。

⑸能够在信息利用过程中遵守相关的法律法规。

途径:⑴通过网络搜索⑵信息检索课⑶参加“图书馆利用系列讲座”等信息实践活动。

2.信息、知识、情报的概念?举例说明概念间的区别和联系文献?答:信息,由事物发出的消息、指令、数据等所包含的内容。

如花的生长方向。

知识,是人类社会实践的总结,是人的主观世界对于客观世界的概括和如实反映。

如每天吃一个苹果有利健康。

情报,是激活了、活化了的知识,是为特定目的服务的信息。

如搜索汽车替代燃料时,获得有关乙醇汽油的信息就是情报。

3.文献有那些类型?将文献划分成这些类型的依据是什么?答:纸张文献、缩微文献、电子文献、音像文献。

依据知识内容、记录载体、记录方式。

4.科技文献的作用是什么? 答:⑴科技进步的阶梯。

⑵传递科技信息或知识。

⑶加速科学技术的进步,促进了社会的发展。

5.比较图书和期刊,他们各自有哪些特征,其特点和用途是什么?答:图书特点,内容系统、全面、成熟、可靠,但时效性较差。

用途,对范围较广的问题获得一般知识、或对陌生的问题获得初步了解。

特征,书名、著者、出版社名称、出版地点、出版时间、图书总页数、ISBN。

期刊特点,品种多、数量大、出版周期短、报道速度快、内容新颖、及时反映当前科技水平。

用途,是科技人员吸取成果、掌握进展、了解动态、开阔思路的重要参考文献。

特征:论文题名、著者、期刊刊名、卷号、期号、起止页号、ISSN。

6.特种文献有哪几种类型,简述其中任意两种的特点。

《信息检索》考试重点

《信息检索》考试重点

《信息检索》考试重点信息是指事物的存在方式和运动状态,是对客观世界中各种事物的变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。

这里强调信息是事物属性的表征,即信息不是事物本身,而是用来表现事物特征的一种普遍的形式。

信息的特征7个:客观性、普遍性、可存储性、可传递性、扩散性、共享性、时效性。

信息的功能4个:经济型功能,选择与决策、管理与协调、研究与开发。

知识是人类通过信息对自然界。

生物界、人类社会运动规律的认识和概括,是人的大脑通过思维重新集成整合的系统化信息,是信息中最有价值的部分。

也就是说信息是产生知识的原材料,知识是信息的加工的抽象化产物。

知识是一种特定的人类信息,它四对信息进行提炼和深化的结果。

知识的类型:显性知识和隐性知识、实体知识和过程知识、核心知识和非核心知识。

情报是具有特定传递对象的特定知识或有价值的信息。

情报的特征:动态性、按特定方式传递、为特定目的服务的、常常带有一定的时效性和机密性情报的类型。

情报的分类:根据情报的来源与加工程度划分,情报可以分为:零次情报、一次情报、二次情报、三次情报。

零次情报是指为公开于社会、没有经过记录整理、非正式传递的、直接作用于人的、非文献情报的总称。

如私人笔记、手稿、设计草图、会议记录、口头言论等。

一次情报:是指为经过加工或者加工程度等于零的原生情报。

这种情报直接反映实际情况和科研成果,有如生产过程中的原料。

固定原生情报的文献称为原生文献,也称一次文献。

如调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。

二次情报是一种派生情报,是针对一次情报加工的产品。

一二次情报的作用不仅在于报导,更重要的是为查找一次文献提供线索。

刊载二次情报的文献称为二次文献,二次文献按照加工的方式和深度又分为书目、索引、文摘等形式。

其中文摘是一份文献的内容缩短的精确的表达,它是二次情报的重要形式。

三次情报是在一次二次情报的基础上,经过分析研究和综合概括而编撰的情报。

信息检索考试重点

信息检索考试重点

信息检索的概念广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术;狭义的信息检索是指从信息集合中找到所需信息的过程。

第一章计算机信息检索的1.1 学科基础-信息学概述信息概述信息需要和检索1.2 技术基础-信息技术概述信息技术概述信息检索的关键技术-P14★具有广泛影响的定义:信息:是指应用文字、数据或信号等形式通过一定的传输和处理,来表达各种相互联系的客观事物在运动总所具有的特征性内容的总称。

知识(Knowledge)词典解释:知识是人类在改造世界的社会实践中获得的对事物本质认识的成果和结晶。

知识是人类对自然界、人类社会中各种现象、规律进行思维分析、加工提炼形成的系统化、理论化结果。

也就是通过大脑思维重新组合的系统化的信息集合。

因此,系统化、理论化的正确信息就是知识(1)按信息的表达形式划分•文献信息•声像信息•电子信息文献(document)是指记录有知识(或信息)的一切载体。

也就是说用文字、图形、符号、声频、视频等手段记录下来的人类知识都可以称之为文献。

三个要素:ϕ内容-被记录的知识(信息)κ载体λ记录知识信息的手段一个特点:记录(2)按信息加工的层次划分-P5零次信息指尚未以公开形式进入社会流通使用的信息。

如:实验记录、会议记录、内部档案、论文草稿、设计草稿等。

一次信息指以信息编制者的研究成果为依据而创作(撰写)的并公开发表或出版的信息。

如:图书、学术论文、专利说明书、科技报告等,是信息检索的主要对象和最终目标。

二次信息指对一次信息进行加工整理,使之简化(如著录信息特征,摘录信息内容要点等),或分类编辑之后所得的产物,或为了便于检索和利用一次信息而编辑出版的产物。

如目录、索引、文摘、书目型数据库等。

二次文献是对一次文献的浓缩和有序化,主要作用:是存贮和报道一次文献线索、提供查找的途径,是检索的主要学习对象。

三次信息指根据某种需要和目的,利用二次信息作为手段,将某方面的大量一次信息加以全面系统的再度选择、分析和综合,编写成具有专指性内容和使用目的更为明确、效果更为直接的三次信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《信息检索原理与技术》第1章信息检索概论(1)一次文献信息:是指作者以自己的研究成果为基础创作或撰写的、未经过加工的原始文献,如期刊论文、研究报告、学位论文等。

(2)二次文献信息:是指对一次信息加工整理而成的文献,如目录、文摘、索引等各种书目信息,具有汇集性、工具性、综合性、系统性的特点。

(3)三次文献信息:是对一、二次信息综合、分析等深加工的产物,如评论、进展报告、百科全书、期刊书目等。

(4)文献:记录有知识的一切载体,即知识信息必须通过文献载体进行存储和传递。

(5)构成文献的要素:构成文献内核的知识信息、负载知识信息的物质载体、记录知识信息的符号和技术。

(6)文献的特征:知识性(文献的本质,离开知识信息,文献信息便不复存在);传递性(帮助人们克服时间与空间上的障碍,在时空中传递人类已有的知识,使人类的知识得以流传和发展);动态性(其所蕴含的知识随着人类社会和科技的发展在不断地、有规律地运动着)(7)信息、知识和文献的联系:信息作为物质的一种普遍属性,是生物以及具有自动控制系统的机器通过感觉器官和相应的设备与外界进行交换的一切内容,它是有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制的;知识作为信息的一部分,是一种特定的人类信息,也是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,它是无形的、与行动和决策相关、经过处理能改变思维、精神产品、环境改变含义、经过学习才能转让、无法复制的;文献是知识的一部分,是进入人类社会交流系统的活动着的知识。

(8)文献信息流有序化阶段的三个环节:①替代。

描述文献特征,对一次文献信息进行不同程度的提炼或压缩,形成目录、文摘、索引等二次文献信息。

从文献信息流的运动角度看,“替代”是文献信息流的流量、流向得到测度并合理调节。

②改组。

从一次文献信息中提取数据、事实和有关结论,按照易于查阅的提醒重新组合,其改组的结果,产生了手册、名录、辞典、目录等类型的文献信息。

其目的是使一次文献信息更容易被理解和使用。

③综合。

利用二次文献对一次文献所包含的知识加以综合并融入到现有知识体系中去,成为整个知识体系的有机组成部分,产生的主要成果是不断再版的百科全书、专著、教科书及综述、评论性文章。

文献信息流失一个以研究活动为起点。

按顺时针的线性顺序移动,是一次、二次、三次文献信息的演变过程。

对于“文献信息链”的研究,有利于从整体的角度了解文献信息的有序化、动态性特征,从而探索文献信息的产生、演变规律及其结构形态。

(9)信息检索:广义理解分为信息的存储与检索。

信息的存储主要包括在某一专业领域范围内的信息选择的基础上对信息的内外特征进行描述、加工并使其有序化,形成信息集合。

信息的检索是指借助一定的设备与工具,采用一系列方法与策略从信息集合中查询所需的信息。

狭义的信息检索仅指该过程的后一部分。

存储是检索的基础、检索是存储的反过程。

信息检索的本质是用户的信息需求和一定的信息集合的匹配。

(10)信息检索系统:指为了满足用户的信息需求而建立的存储,经过加工了的信息集合,拥有一定的输入、匹配、输出的技术设备,提供一定的检索服务功能的一种相对独立的实体。

(11)信息检索入口:又称检索点或检索知识,是指用以标识信息的外部特征和内容特征的属性值的集合。

检索知识包括主题词、分类号、著者、标题、机构、代码等。

(12)信息检索的一般原理:P7(13)检索系统由物理构成(硬件、软件和数据库)和逻辑构成(文献与数据的选择与抽取子系统、词表子系统、标引子系统、查询子系统、用户与系统交互子系统、匹配子系统)(14)检索工具的构成:编辑说明与凡例、分类表与主题表、正文、辅助索引、资料来源目录与附录。

(15)检索系统的功能:报道功能、存储功能、检索功能。

(16)信息检索理论:标引理论、检索模型、检索结果的可视化。

(17)现代信息检索技术与方法:全文检索、多媒体检索、超文本及超媒体检索、联机检索、网络信息检索、智能检索、跨语言检索、跨平台检索。

第2章信息检索模型(1)最初的信息检索模型是以数学知识为基础的原因:第一,数学是个有几千年历史的学科,被大家所熟知,并且通俗易懂。

第二,人们的信息有很大的模糊性,甚至用文字不能表达,而文字具有很大程度的抽象性和概括性,这样就很容易表达出人们信息检索的需求,能够很方便快捷地组建信息检索模型。

(2)信息检索模型的类型:P18(3)布尔检索模型:采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻辑运算来检索文献。

(4)布尔逻辑运算符:逻辑与(AND)、逻辑或(OR)、逻辑非(NOT)(5)布尔运算的运算次序:P24(6)传统布尔检索模型的优缺点:优点:1)逻辑运算符较少,便于用户学习。

2)模式较易构造,可以通过简单的关系来体现检索项的联系。

3)可以将复杂的检索过程以简单的检索式表达出来。

4)检索提问式较灵活,方便修改。

缺点:1)布尔检索中的关键词没有权重区别。

2)检索结果分输出没有重要性是排序。

3)查全率很难控制。

4)布尔检索要求用户具有很高的素质和语义提取能力。

(7)向量空间模型:一种基于统计学方法的数学模型。

(8)向量空间模型的工作原理:P27(9)向量空间模型的优缺点优点:1)采用自动标引技术与文献提供标引词。

2)采用部分匹配策略,使得在算法层面上的基于多值相关性的判断处理得以实现。

3)改变了布尔检索只有两种情况0和1的简单判断,标引词和文献的相关程度可在0和1之间取值,使标引者和检索者都可以比较灵活地定义标引词与文献的关系深度,改变了布尔检索模型的僵化的缺点。

4)由于其相似的程度作为检索的标准,可从量的角度判断命中与否,从而使检索结果更趋合理。

5)检索结果可以按照与提问的相关度排序输出,便于用户通过相关反馈技术修正提问,控制检索量。

6)布尔模型的逻辑关系依然可以使用,保留了直观性和方便些。

7)向量空间模型的灵活性使它有很好的可扩展性和可改进性,为以后的更加完善奠定了基础。

缺点:1)检索过程转化为向量的计算方法,不能反映出文献之间的复杂关系。

2)由于对于任何一个提问度需要计算全部文献库中的每一篇文献,因此,计算量大,算法复杂性较高。

3)由于标引加权和检索加权是分离的,因此,随意性较大,难以保证质量。

4)有很多是假定的,在实际工作中有时会不能解决。

(10)扩展布尔检索模型:P31(11)扩展布尔检索模型的工作原理:P32(12)扩展布尔检索模型的优缺点:优点:拥有矢量处理的思想,体现了加权的特点;继续保留布尔检索的直观的操作符,具有很强的描述能力;对于输出结果可以很好的控制和排序;通过调整权重参数的取值,可以灵活选择并得到不同的检索结果;便于区分强制性短语和严格的同义解释与试探性短语和较不严格的同义关系;与传统倒排文档一致,更易接受。

缺点:扩展布尔模型由于是集成了两种经典模型的一种改进的“集成化模型”,所以它不可避免的存在着臃肿、不够自然简洁的缺点,而且不是很普及,目前在信息检索领域使用较少。

(13)概率模型:一种基于概率论原理的用以解决相对不确定性的信息检索的信息检索模型。

(14)贝叶斯定理:P37(15)概率模型的优缺点:优点:文档可以按照他们相关概率递减的顺序来计算秩,还可以通过反复反馈结果和用户需求,使结果得到很好的调整,相对合理得多。

缺点:索引词权值计算方法没有考虑到词频加权因素。

沿用了索引词之间相互独立的基本假设。

开始时需要猜想把文档分为相关和不相关的两个集合,过程比较烦琐。

(16)概率模型在处理实际问题时的困难:初始检索文件阀值比较大,由检索式检索的相关文件数量相对于精确估计的概率而言太小。

(17)古典逻辑模型的特点:1)逻辑模型不是一个经典模型。

2)逻辑检索要借助外部信息进行评价。

3)逻辑检索对关键词的语境更加重视。

4)对信息的联想法控制。

5)逻辑检索具有不确定性。

6)对多词一义的把握。

7)适应信息的不完全性。

(18)逻辑模型的优点:逻辑理论具有很强的推理能力,将检索过程逻辑化可以使人们能从新的角度认识检索,并在逻辑化的基础之上建立演绎信息检索系统。

在演绎信息检索系统中,用户可以增减可用规则,可以扩充或者缩小知识库,可以憎加或减少检索目标项,从而实现扩检和缩检。

同时,通过因入更多的谓词、丰富系统的知识库、允许查询目标语句中包含更多的谓词,演绎信息检索系统也容易被扩展为用途更广的专家系统,使得信息检索系统智能化程度更高,功能更强,换句话说,基于逻辑模型,我们可以建立智能化的、提供多种检索入口的、便于扩展的信息检索系统、(19)逻辑模型的缺点:在逻辑模型中,信息的重要程度这一特征并不能很成功地被表达出来。

基于实质蕴涵的情报检索古典逻辑模型自然也并不能完全表达出文献d与信息需求q之间的真实联系。

它关注的仅是前后件之间在真假方面的逻辑关系,而并不关心前件和后件中所涉及的信息延展性问题。

由于查询是依靠推理来获得相关性的文献,因此推理过程越是不确定,获得的相关性文献就越少,而这样的现象在传统的逻辑检索模型中屡有发生。

(20)限词检索模型:通过限制检索范围,达到优化检索结果的方法。

(21)字段检索:把检索词限定在某个或某些字段中,如果记录的相应字段中含有输入的检索词则为命中记录,否则检不中。

第3章自动索引和文档组织1、索引:著录书刊中的题名、语词、主题、人名、地名、事件及其他事物名称,并把它们按照一定的方式编排起来,指明出处是一种检索工具。

2、索引的发展历程:人工索引阶段、机辅索引阶段、自动索引阶段3、索引的功能:检索功能、分解功能、梳理功能、聚类功能、追踪功能、导航功能、预测功能4、常见索引的类型:主题索引、著者索引、名称索引、地名索引、题名索引、数字或代码索引、分类索引5、索引的过程:为了方便查询而对信息指定索引款目的过程。

包括信息采集、信息标引、建立索引。

6、索引建立的步骤:选题,建立主索引文件;对主索引关键词进行抽词倒排,建立目标格式文件;排序与归并。

7、信息标引分为受控标引和自然语言标引。

受控标引指采用受控语言中的标识表达主题概念的标引方式,主要有分类标引和主题标引;自然语言标引是指采用自然语言语词作为标识来表达主题概念的标引方式。

8、分类标引:依据一定的分类语言,对信息资源的内容特征进行分析、判断和选择,赋予分类标识的过程。

9、分类标引的要求:准确性、充分性、一致性、适用性。

10、分类标引规则:基本标引规则、一般标引规则、特殊标引规则。

11、主题标引:对信息内容进行主题分析、确定主题概念,然后按照一定的词汇控制方式,为标引对象赋予恰当的语词标识的过程。

12、标引方式:根据文献或信息特点和使用需要确定的标引和揭示主题的形成。

包括整体标引、全面标引、对口标引、综合标引和分析标引等。

相关文档
最新文档