信息检索复习知识点

合集下载

信息检索原理期末重点背诵知识点

信息检索原理期末重点背诵知识点

信息检索1、信息检索概念:P12、信息检索的原理一整节内容要自己理解:P3-P4图1-1要掌握文献替代和文献整序的概念要掌握3、信息检索在历史上的不同表现:联机检索、光盘检索、网络检索的区别和特征:P6-P94、信息检索的模型概念:P95、布尔模型、向量空间模型、经典概率模型要理解并掌握各自的优缺点:P11-P126、信息检索系统的概念:P127、检索效果的评价指标:P15-P164个指标:查全率、查准率、漏检率、误检率掌握它们的含义并懂得计算8、网络检索的表达式:布尔逻辑检索、邻近检索、短语检索、截词检索的特点、区别和联系:P17-P219、信息检索的技巧要理解尤其是要掌握及时调整检索策略:P33-P3610、搜索引擎的概念:P3711、数据库知识,实验内容,特点12、引文的概念13、搜索引擎的分类:P40-41搜索引擎划分的类别以及元搜索引擎的概念要掌握12、CBR概念P11312、多媒体信息检索的原理和方法:P110-P114其中要重点理解基于内容的多媒体信息检索的检索形式(可以结合课件)13、专利的概念:P12514、专利的类型:P126(理解一下各类型的区别)15、专利文献的概念:P12716、专利文献的类型:P127(理解一下各类型的区别)17、灰色文献的概念:P14718、会议文献的概念:P15819、科技报告的概念:P16320、查新的概念:P20021、科技查新的作用:P201(每一个小标题后面要自己展开一段)关于上课讲的那几个数据库大家自己看一下PPT,掌握一下。

以上纯属个人观点题型:名词解释:5*4=20简答题:4*10=40论述题:2*20=40考试时间:1月8日上午:9:00—11:001.信息检索的概念(P1)信息检索有广义和狭义两重含义。

广义上说,信息检索是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找相关信息的过程。

它包含信息存储和信息查找两个过程。

信息检索基础知识考点整理

信息检索基础知识考点整理

信息检索基础知识考点整理●2.1 信息检索的概念与原理●2.1.1 信息检索的概念(重要)●2.1.2 信息检索的原理●信息检索原理就是将特定的信息需求与存储在检索系统中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出●信息检索的类型●1.文献检索●2.数据检索●3.事实检索●2.1.3 信息检索的意义/作用(重要)●1.信息检索是有效利用信息资源,实现其最大价值的科学方法●2.信息检索是再学习的工具,是获取知识的有效途径●3.信息检索能有效地提高科研工作的效率,节省人力、物力及时间●2.1.4 信息检索的历程●1.手工检索●2.计算机检索●2.2 信息检索系统(重要)●2.2.1 信息检索系统的概念●1.信息检索系统的含义●2.信息检索系统的工作原理●2.2.2 信息检索系统的构成●1.信息选择子系统●2.信息索引子系统●3.词表管理子系统●4.用户接口子系统●5.匹配子系统●2.2.3 信息检索系统的分类●1.手工检索系统●1.书本式的手工检索系统●2.卡片式的手工检索系统●2.计算机检索系统●1.硬件●2.软件●3.数据库●1.参考数据库●1.书目数据库●2.指南数据库●2.源数据库●1.数值数据库●2.文本—数值数据库●3.全文数据库●4.术语数据库●5.图像数据库●6.多媒体数据库●2.3 信息检索方法(重要)●1.直接浏览法●直接查找法●2.常用法●顺查●倒查●抽查●3.追溯法●4.综合法(分段查找法、循环法、交替法)●2.4 信息检索效果(重要)●2.4.1 信息检索效果评价●信息检索效果的概念●1.检索结果有效性评价●2.检索系统实用性的评价●3.检索费用—效率评价●信息检索效果评价对于信息检索系统的建设和发展的意义●信息检索效果评价的核心问题是建立一套切实可行的评价指标●1.查全率和查准率●2.误检率和漏检率●3.响应时间●其他与检索效果相关的指标●2.4.2影响信息检索效果的因素●1.标引的质量●2.检索途径的数量●3.检索策略的优劣●4.检索人员的素质。

信息检索复习知识点

信息检索复习知识点

信息检索复习知识点1.信息(Information)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。

* 信息的属性——客观存在性* 信息的作用——消除不确定性* 信息的形式——数据、消息等事实2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源3. 信息用户Information User信息的使用者即是信息用户。

使用的情况可以包括需要信息、接受信息和利用信息。

4. 信息需求Information Demand人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。

我们把意识到的信息需要定义为信息需求5. 信息检索Information Retrieval对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。

6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。

* 信息意识* 信息能力* 信息道德7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。

8. 经济领域的特征a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势;b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;c.能源消耗少,污染得以控制;d.知识成为社会发展的巨大资源。

9. 社会、文化、生活方面的特征10.社会观念上的特征11当代信息环境特征描述* 信息超载严重信息超载又称信息泛滥或信息爆炸。

它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。

* 信息失衡明显所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。

信息检索复习要点

信息检索复习要点

1、文献:为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录在唱片上,或存储在磁盘上。

这种附着在各种载体上的记录统称为文献。

2、文献由四要素构成,即文献信息、文献载体、符号系统和记录方法。

3、信息、知识和文献三者之间的关系:由信息、知识和文献的概念可知,三者之间是密切相关的。

信息是物质存在的方式、形式和运动规律的表征。

人脑对事物属性的感知形成信息;人们对信息集合加工、整理形成系统化,表现形成人类社会实践的知识;知识被记录在载体上形成文献,文献被人类广泛传播、运用在理论和实践中又产生新的信息、知识和文献。

如此循环,不断创新,形成各种各样的新知识,从而推动人类社会前进。

由此可见,信息、知识、文献在社会系统中表现出一种不间断的延续性。

4、具有信息素质的人主要具有以下几个方面的能力:(1)运用信息工具;(2)获取信息;(3)处理信息;(4)生成信息;(5)创造信息;(6)信息增效;(7)信息协作;(8)信息免疫。

5、信息资源的构成可从不同的层次和角度来划分:一、按照信息的出版和加工划分:1 图书;2 报刊;3 会议文献;4 专利文献;5 科技报告;6 学位论文;7 技术档案;8 产品资料;9 标准文献;10 政府出版物。

二、按照信息加工层次划分:按信息加工程度可将信息分为一次文献、二次文献、三次文献。

(1)一次文献即以作者本人的生产与科研工作成果为依据而撰写并已公开发行进入社会流通使用的原始文献。

例如专著、学术论文、科技报告、会议论文、专利文献、学位论文等;(2)二次文献即将大量、分散、无序的一次文献收集起来。

按照一定的方法进行整理、浓缩和加工,使之系统化而形成各种目录、索引和文摘,即编制成具有多种检索途径的检索工具。

二次文献又称为检索性文献;(3)三次文献即根据一定的目的和需求,在大量利用一次、二次文献的基础上,对有关知识进行综合、分析、提炼、重组而再生的信息资源。

信息检索复习资料

信息检索复习资料

信息检索复习资料一、名词解释1.信息资源——是指经过人类的选取、组织、序化等整理与开发后的信息的集合。

2.白色文献——是指公开出版发行的、通过正常渠道可以得到的常规文献。

3.数据挖掘——就是从大量的、不完全的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

4.检索策略——就是在分析课题内容实质的基础上,确定检索系统、检索途径和检索词,并科学安排各词之间的位置关系、逻辑联系和查找步骤等。

5.截词检索——是指在检索式中用专门的符号(截词符号)表示检索词某一部分允许有一定词形变化。

6.参考数据库——有时又称为书目数据库,是指包含各种数据、信息或知识原始来源和属性的数据库。

7.特种文献——是指出版发行和获取途径都比较特殊的科技文献,一般包括专利文献、会议文献、科技报告、学位论文、标准文献、政府出版物等文献类型。

8.学位论文——是高等院校或研究机构的学生为获得学位资格而提交并通过答辩委员会认可的学术性研究论文,它是随着学位制度的实施而产生的。

9.科技报告——是关于某科研项目或活动的正式报告或记录,多是研究、设计单位或个人以书面形式向提供经费和资助的部门或组织汇报其研究设计和开发项目的成果进展情况的报告。

10.电子图书——是指以电子文件形式存储在各种磁性或电子介质中,以磁盘、光盘、网络等电子媒体形式出版发行,通过计算机或便携式阅读终端进行阅读的一种新型数字化书籍。

11.电子报纸—多媒体技术、网络技术和通信技术的产物,是指在排、印、投递等方面基本上实现了电子化的报纸。

12.参考工具书——是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

13.年鉴——是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

信息检索基础知识

信息检索基础知识

第一章信息检索基础知识一.概述1.信息与文献信息知识的分类:已掌握的知识和需查询的知识。

信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。

这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。

运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。

信息已成为与物质、能量同样重要的三大资源之一。

信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。

文献:将知识记录并保持在一定的载体上,就形成了文献。

文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。

科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。

2.信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。

信息检索基础必备知识点

信息检索基础必备知识点

1、信息检索的定义:是指将信息按一定的方式组织和存储起来,并根据信息用户的需求找出相关的信息的过程和技术。

信息检索的作用:a:节省查找文献的时间。

b:有利于文献专题查找。

c:克服语言障碍。

2、信息:所有事物的存在方式和运动状态以及关于所有事物的存在方式和运动状态的陈述。

信息的特征:普遍性、客观性、抽象性、依附性、可加工性、传递性、共享性。

信息的作用:(1)信息是人类社会生存的条件,信息是人类社会发展的资源(2)信息是主客体的中介,信息是思维的材料(3)信息是组织的保证,信息的管理的基础(4)信息是决策的依据,信息是控制灵魂文献的特点:(1)数量急剧增长(2)内容交叉重复(3)专业文献出版分散(4)文献老化加快(5)文献语种繁多(6)文献载体形态增加文献类型:(一)按照载体的形式不同,文献可分为:1、印刷型2、缩微型3、声像型4、电子型(二)按照内容、性质和加工深度的不同,文献可分为:1、一次文献2、二次文献3、三次文献4、零次文献(三)根据性质、特点和出版形式的不同,文献可分为:1、科技图书2、科技期刊3、科技报告4、政府出版物5、会议文献6、专利文献7、学位论文8、标准文献9、科技档案10、产品样本a、主题语言主题检索语言是用语词来表达文献主题概念,它不管各语词之间相互关系如何,一律按字顺排列成主题词表,故称主题检索语言。

分为标题词语言、关键词语言和叙词型语言三种。

○2关键词语言:由于关键词语言能适应使用计算机的需要,因而大大加速了文献标引过程,缩短了检索工具出版的时间,便于用来检索最新文献,大大增加了检索点,使用灵活方便。

查准率和查全率较低。

○3叙词型语言:用途较广,既适合于手工检索,又适合计算机检索语言。

6、信息检索的途径:书名途径,著者途径,序号途径,分类途径,主题途径。

7、信息检索方法:(一)常用法所谓常用法,顾名思义是检索中最为常用的方法,指利用成套的检索工具检索文献信息的方法,也称之为工具法。

信息检索重点

信息检索重点

一、信息检索四要素1、信息检索的前题:信息意识2、信息检索的基础:信息源3、信息检索的核心:信息获取能力4、信息检索的关键:信息利用二、信息基本特征:普遍性、客观性、扩散和传递性、增值性(创新)、可存贮性和可压缩性、可知性(信息能力)和共享性知识属性:意识性、信息性、实践性、继承性、渗透性情报属性:针对性、知识性、时间性、传递性、效用性信息、知识、情报的关系:信息经过人脑思维加工,即认识飞跃产生知识,情报属于知识的范畴。

广义的情报是信息的传递,因此,情报具有信息和知识两种性质。

三、按载体不同分为:口头信息源、实物信息源、文献信息源四、文献信息源:1、按出版形式不同可分为十种类型:图书、期刊、科技报告、会议文献、政府出版物、专利文献、标准、产品资料、学位论文、技术档案2、按记录信息的材料可分为三种类型:纸印本文献、缩微型文献、机读型文献3、按加工深度不同可划分为四种:零次文献、一次文献、二次文献、三次文献四者之间的关系:从零次文献到三次文献,是一个从分散的原始文献加工整理系统化的过程。

零次文献是一次文献的素材,一次文献是基础,是检索的对象;二次文献是检索一次文献的工具;三次文献是一次文献的浓缩,是情报信息的重要来源。

五、信息检索系统类型:⑴根据检索目标和检出文献信息形式的不同:文献检索、数据检索、事实检索⑵根据具体检索手段不同:手工检索、机械检索六、检索步骤:分析研究课题确定检索范围和检索标识选定检索工具确定检索途径查找和获取原始文献七、信息检索的方法:⒈常用法:是利用检索工具查找文献的方法.⑴顺查法⑵倒查法⑶抽查法⒉追溯法:从已知的现有文献后所列参考文献入手,逐一追查原文,从这些原文后所列参考文献再逐一追查,不断扩检的查找方法⒊循环法:指追溯法常用法混合使用的方法。

八、信息检索的途径:⒈根据外表特征划分著者途径;书名、篇名、刊名途径;序号途径⒉根据内容特征划分分类途径(SA、Ei);主题途径(SA、Ei);分子式途径(CA)九、文献检索的一般步骤:1、分析研究课题2、确定检索范围与检索标示3、选择检索工具4、确定检索途径5、查找和获取原始文献检索途径与方式:初级检索:默认的检索方式高级检索:两种检索方式组合使用,如“篇名”和“著者”。

大一信息检索知识点总结

大一信息检索知识点总结

大一信息检索知识点总结信息检索是指通过计算机技术和各种检索方法,从大规模文献资源中快速、准确地获取用户所需信息的过程。

在大一学习信息管理与信息系统专业的过程中,我们需要了解一些关键的信息检索知识点。

本文将对大一信息检索的相关知识进行总结,帮助同学们更好地理解和掌握这一领域的基础知识。

一、信息检索的基本概念与原理(1)信息检索的定义:信息检索是指根据用户的需求,在文献、数据库和其他信息资源中寻找与之相符合的信息的过程。

(2)信息检索的基本原理:包括索引构建和检索处理两个阶段。

索引构建阶段将信息资源进行结构化整理,并建立相应的索引表;检索处理阶段通过用户提供的检索词,结合索引表,通过匹配算法找到与之相关的信息资源。

二、信息检索的关键技术(1)词项选择与权重计算:根据用户需求,选择合适的检索词,并使用权重计算方法为词项赋予合适的权重,提高检索效果。

(2)检索模型:包括布尔模型、向量空间模型和概率模型等不同的模型,用于描述检索系统中信息资源与用户需求之间的匹配关系。

(3)评价指标:用于评价检索系统的性能,常见的指标包括召回率、准确率以及F值等。

(4)查询扩展:通过对用户查询词进行扩展,提高检索系统的召回率和准确率。

三、信息检索的常用工具和技术(1)搜索引擎:如百度、谷歌等,通过互联网收集、分析并索引网页信息,为用户提供搜索服务。

(2)数据挖掘:通过对大规模数据进行模式识别和深入分析,挖掘其中有价值的信息,为决策提供支持。

(3)文献管理工具:如EndNote、NoteExpress等,用于管理、组织和检索学术文献。

(4)信息可视化技术:通过可视化手段,将海量的信息以直观的方式展示给用户,提高信息的理解和使用效率。

四、信息检索的应用领域(1)图书馆信息服务:包括文献检索、馆藏资源管理、读者咨询等。

(2)企业信息管理:包括企业知识管理、产品信息检索、竞争情报等。

(3)科学研究与学术交流:通过信息检索工具,快速获取相关领域的最新研究进展和学术成果。

信息检索知识点范文

信息检索知识点范文

信息检索知识点范文信息检索是指从大量的信息中找到与用户需求相关的信息的过程。

以下是信息检索的一些重要知识点:一、信息需求分析:1.了解用户需求:包括明确用户的信息需求,了解用户的背景和需求的具体要求。

2.制定信息策略:确定的关键词、限定范围、排除冗余和无关信息的策略。

二、信息源:1.内部信息源:组织内部的数据库、档案等。

2.外部信息源:包括互联网上的网页、文档、图片等。

三、信息检索模型:1.自动索引:使用关键词或主题对文档进行描述和索引,并建立索引词表,方便用户检索。

2.布尔模型:将检索式表示为逻辑表达式,利用逻辑运算符对检索词进行组合,实现精确的文档检索。

3.向量空间模型:通过计算文档和查询的向量空间相似度,将文档按相关性排序。

4.概率检索模型:通过统计分析文档和查询的概率模型,计算文档的相关性概率。

5.链接分析模型:根据页面之间的链接关系和链接的权重等信息来评估页面的相关性。

四、检索评价:1.检索精度:通过计算检索结果的相关文档和非相关文档的比例,来评估信息检索系统的精确性。

2.检索效率:评估信息检索系统执行查询的速度和资源消耗程度。

3.检索一致性:评估系统在连续多次查询时的稳定性和一致性。

五、信息检索技术:1.关键词:通过输入关键词进行检索,系统会返回与关键词相关的文档。

2.高级:包括利用限定符进行、布尔逻辑、通配符等。

3.相关性反馈:根据用户的反馈信息,调整检索结果的排序,提高检索的准确性。

4.语义分析:通过对查询语句和文档的语义进行分析,找到语义上的相关性。

5.分布式检索:将索引和查询分发到多个节点上进行检索,提高速度和可靠性。

六、信息检索系统的应用:1. 网络引擎:例如Google、百度等,为用户提供互联网上的信息服务。

2. 文献检索系统:用于科研人员查找相关文献,例如PubMed、IEEE Xplore等。

3.图像检索系统:通过图像的内容特征进行检索,例如相似图片、人脸识别等。

4.音乐、视频检索系统:通过音乐或视频的特征进行检索,例如识别歌曲、相似视频等。

信息检索知识点

信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。

2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进展相符性比较,但凡信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,那么具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。

3.为什么说信息存储和检索是两个不可分割的有机体.检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。

存储过程主要是利用检索语言对文献进展标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进展标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进展比较。

检索过程是存储过程的逆过程。

因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。

4.信息检索的方法〔1〕顺查法〔2〕倒查法〔3〕抽查法〔4〕追溯法〔5〕循环法5.信息检索的途径〔1〕部特征途径a)分类途径b)主题途径〔2〕外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:〔1〕简单,形式简洁,易于理解;〔2〕可操作性强,应用广泛;〔3〕构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常准确的语义概念;〔4〕能处理构造化提问。

缺点:〔1〕表达用户复杂需求效果欠佳〔2〕准确匹配无法提供定量比较〔3〕匹配标准不尽合理〔4〕检索结果不易控制7.概率排序原那么:如果一个检索系统对用户的每个检索提问的反响是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。

8.什么是计算机信息检索.所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那局部信息的过程。

信息检索知识点

信息检索知识点

计算机检索1.信息素养(信息素质、信息能力):作为具有IL(information literacy)能力的人,必须能够充分地认识到何时需要信息,并有能力去有效地发现、检索、评价和利用所需要的信息,从而具有终身学习的能力,总能够为任何任务和决策找到所需信息。

2.信息检索广义:指将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程和技术。

包括存储和检索两个过程。

狭义:从信息集合中找出所需信息的过程。

信息查找(Information Search,Information Seeking)2.1信息现状分析1)信息爆炸导致文献量急剧增加,容相互渗透,语种增多;文献分布异常分散;文献寿命愈来愈段;2)由于条件限制,人们吸收和利用信息的能力并未得到相应的提高。

3.检索的作用1)促进智力资源的开发;2)协助管理者做出正确的决策;3)帮助科研人员借鉴前人的研究成果,避免重复劳动;4)信息检索是知识更新的手段。

4.数据库类型(1):作为图书馆数字资源的数据库特指为科学、教学、学习所需各种参考资料的集合,以数据库的形式管理和利用。

自建数据库:馆藏目录(OPAC),本校学位论文数据库。

商业性数据库:数据库商、出版商和其他机构以商业化方式提供的各种电子资源,图书馆需要支付一定的费用购买数据库的使用权再提供给一定的读者群。

免费数据库:开放获取资源、机构典藏和其他免费的网络资源。

5.数据库类型(2)从收录文献的容分,有综合性数据库和专业性数据库之分;从收录文献的类型分,有图书数据库、期刊数据库、学位论文数据库、报纸数据库、会议文献数据库、专利文献数据库、标准数据库等;从提供文献的形式分,有全文数据库、文摘数据库、引文数据库;各数据库举例:专业数据库:Petroleum Abstract(PA)、EnCSciFinder Schoiar(CA) 综合性数据库:读秀、Scopus、EI、SCI特定文献类型,如图书、期刊、学位论文等:超星、EIsevier ScienceDirect、PQDT全文数据库:CNKI、维普、SPE摘要性数据库:EI、PA引文数据库:Web of Science、CSSCI(中文社会科学引文索引)6.Science Citation Index Expanded(SCI-E)是个什么样的数据库?它是ISI检索平台中Web of Science核心合集中的一个子库它是一个摘要型数据库它是一个引文数据库它是一个期刊数据库它收录的学科围包括科学、技术的各学科7.查文献应该如何选择数据库?学科专业:有专业型数据库时,首选专业型数据库;数据量:选择数据量大的;文献类型:根据研究的需要。

信息检索知识点

信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。

2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。

3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。

存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。

检索过程是存储过程的逆过程。

因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。

4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。

缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。

8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。

信息检索复习重要知识

信息检索复习重要知识

一、名词解释(4题,20分)目录:以一个完整的出版单位或收藏单位作为著录的基本单位,将一批著录款目按照一定的次序编排而成的一种揭示及报道文献的工具。

索引:将某一信息集合中的相关信息按照某中可查顺序排列并系统地指引给读者的一种检索工具。

年鉴:一种按年度出版,概述或反映上一年度有关领域的重大事件、重大进展和重要成果,汇集重要文献、详尽数据很统计资料的连续出版物。

手册:是汇集某一范围内基础知识和基本数据资料,以便于人们在生产、科研、教学等具体工作过程中可以经常查证的实用便览型参考工具。

OPAC:由开放的公共查询目录演化而来,是20世纪70年代末由美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

CALIS:是经国务院批准的我国高等教育公共服务体系之一,在教育部的领导下,把国家的投资、现代图书馆理念、先进的技术手段、高校丰富的文献资源和人力资源整合起来。

信息检索:广义上,信息检索是指信息存储与查找的过程,狭义上,指信息查找的过程,信息查找是指通过查询机制从各种检索系统中查找出用户所需要的特定信息的过程。

搜索引擎:泛指网络上以一定的策略搜集信息,对信息进行组织和处理,并为用户提供信息检索服务的工具和系统,是网络资源检索工具的总称。

百科全书:是指收录了各个知识门类的知识,或者系统而完备地概述了某一知识门类知识的大型参考性工具,是最完备的参考工具,有“工具书之王”的美誉。

学位论文:学位论文是伴随着学位制度的实施而产生的,是高等院校或科研机构的毕业生为获取学位资格而撰写的学术性研究论文。

特种文献:一种介于图书与期刊之间的文献类型,通常在出版发行或获取途径方面比较特殊,因此也被称为灰色文献。

电子图书:是指以数字形式加工,通过计算机网络进行传播,,并借助于计算机或类似设备来阅读的图书,是电子出版物中最常见的文献形式。

参考工具书:是根据一定的社会需要以特定的编排方式和检索方法汇编某学科或特定范围的知识和资料,其目的是为人们解决疑难和提供数据或事实信息,是作为工具使用的专供查考的特定类型的图书。

信息检索知识点

信息检索知识点

信息检索考点整理1.信息检索的概念广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。

2.信息检索的原理就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。

3.为什么说信息存储和检索是两个不可分割的有机体?检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。

存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。

检索过程是存储过程的逆过程。

因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。

4.信息检索的方法(1)顺查法(2)倒查法(3)抽查法(4)追溯法(5)循环法5.信息检索的途径(1)内部特征途径a)分类途径b)主题途径(2)外部特征途径a)题名途径b)著者途径c)文献编号途径d)目录检索途径e)机构检索法f)引文检索途径6.布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2)可操作性强,应用广泛;(3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4)能处理结构化提问。

缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7.概率排序原则:如果一个检索系统对用户的每个检索提问的反应是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果是最好的。

8.什么是计算机信息检索?所谓计算机信息检索,就是在计算机和人的共同作用下,按照一定的方法组织和存储信息,并通过人机对话从计算机存储的大量数据中自动输出用户所需的那部分信息的过程。

《信息检索》知识要点

《信息检索》知识要点

《信息检索》知识要点1、文献是记录有知识的一切载体。

2、信息与材料、能源一起成为人数社会发展的三大支柱。

3、查找奇特事物,我们可以采用百科全书,也可以利用综合性手册。

4、广义的信息检索包括信息的存储与检索两过程。

5、搜索引擎一般提供两种检索方式:分类检索和关键词检索。

6、文献的属性有:知识性、实体性、记录性、发展性。

7、按信息检索的内容划分,可以将信息检索划分为数据检索、事实检索、文献检索类型。

8、信息检索的发展,经历了以下哪些阶段手工信息检索阶段、计算机信息检索阶段、机械信息检索阶段。

9、网络信息检索时,用AND、OR、NOT算符构造检索表达式进行检索的方法是布尔逻辑检索。

10、信息检索的基本原理就是要将查找的信息转换为检索系统能够识别的检索提问标识,然后通过与检索系统中的信息存储标识进行匹配比对,凡是双方标识一致的,就将具有这些标识的信息按要求从检索系统中输出。

11、评价一个网站的信息质量主要应从以下哪几方面考虑权威性、准确性、客观性、适时性。

12、信息检索工具是指用以报道、存储、查找信息线索的工具。

13、我校图书馆OPAC查询系统的主要查询功能有:馆藏查询、分类查询和读者查询。

14、如要查找书、刊等出版物的收藏地点,应选择的检索系统类型为馆藏目录、联机公共目录(OPAC)、联合目录。

15、评价网站提供的信息质量,可以不考虑的因素是合不合自己的意愿。

16、二次检索指的是在上一次检索的结果集上进行的检索。

17、利用词的某些部分进行非精确匹配检索,如acid*,这种形式叫截词检索。

18、专利的特点包括专有性、时间性和地域性,其中我国专利法关于时间性的规定中,发明类专利的保护期限一般为20年。

19、文献检索工具是通过著录文献的特征,依据一定的规律组织排列,使文献由无序变为有序。

20、评价一本工具书,一般来说最主要的是易用性、适时性、客观性。

21、追溯法是利用原始文献所附的参考文献进行追溯查找文献信息的方法。

信息检索的基本知识

信息检索的基本知识

信息检索的基本知识
信息检索是一种重要的技术,它用于从大量的数据中提取所需信息。

以下是一些信息检索的基本知识:
•索引:信息检索的首要步骤是构建索引。

索引是一个按关键字组织的数据结构,用于快速定位和访问文档。

•关键字:关键字是进行信息检索的基本单位。

它们可以是单个词或短语,根据检索目的和搜索引擎的功能来确定。

•搜索引擎:搜索引擎是信息检索的核心工具。

它利用索引和算法来找到与用户查询相关的文档,并按相关性排序。

•查询:用户通过查询向搜索引擎提供信息需求。

查询可以是简单的关键字、短语,也可以是复杂的语句。

•相关性:搜索引擎根据文档与查询的匹配程度计算相关性。

相关性分数用于确定排名,从而决定返回给用户的搜索结果顺序。

除了以上基本知识,信息检索还涉及更多高级技术:
•倒排索引:倒排索引是一种常用的索引结构,它将关键字映射到包含这些关键字的文档列表中,以支持快速的搜索。

•词频和权重:搜索引擎通常根据关键字在文档中出现的频率和位置,以及其他因素来计算关键字的权重。

•自然语言处理:信息检索利用自然语言处理技术来理解用户查询和文档内容,以提高搜索效果。

•评估和优化:为了提供更好的搜索结果,搜索引擎需要不断评估和优化算法,以适应不断变化的用户需求和文档集合。

总结起来,信息检索是一门复杂而关键的技术,它在数字化时代具有重要意义。

了解信息检索的基本知识对于学习和使用搜索引擎、开发相关应用都非常有帮助。

信息检索基本知识

信息检索基本知识
• 与叙词一样是以较正规和正式的科学名称为基 础的一种主题法检索标识,但存在主、副标题 词固定搭配,即属于先组式检索语言。 •如:
叙词
•叙词是主题语言的高级形式。是以较正规和正式的 科学名称为基础组织而成一种主题法检索标识系统。 •由在概念上不可再分的基本概念单元词汇组成,检 索时可以利用这些单元词进行组配,以表达一个复杂 的概念。
•如课题: 太阳能热水器研究 汉语主题词表中正式主题词是太阳能利用、太阳 能加热等代替。
标题词
中国图书馆图书分类法
• 简称《中图法》,由中国图书馆图书分类法编辑委 员会编。1975年科学技术文献出版社出版第一版。 • 使用字母与数字相结合的混合号码,基本采用层累 制编号法。 • 《中图法》主要供大型图书馆图书分类使用。另外 为适应不同图书信息机构及不同类型文献分类的需 要,它还有几个配套版本:《中国图书资料分类 法》、《中国图书馆图书分类法(简本)》和 《〈中国图书馆图书分类法〉期刊分类表》等。 • 自1988年起,中国出版图书的标准书号中采用《中 图法》的大类号。
关规定和格式撰写的,能完整而真实地反映其所从事科 研活动的技术内容和经验的特种文献。具有内容翔实、 具体完整,技术含量高,实用意义大,便于交流,时效 性好等特点。做好科技报告工作可以提高科研起点,大 量减少科研工作的重复劳动,节省科研投入,加速科学 技术转化为生产力。
•会议文献:指学术会议文献。
•学位论文:是高校研究生、毕业生为获得学位进行 科学研究而写出的学术性论文中,常含有独创性的学 术性文献资料。 •专利文献:专利是与产业活动密切相关的,实用性 非常强。根据专利的技术水平和应用情况,其类型有 invention(发明)、utility patent(实用新型)、和 design patent(外观设计)等。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.信息(Information)信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。

* 信息的属性——客观存在性* 信息的作用——消除不确定性* 信息的形式——数据、消息等事实2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源3. 信息用户Information User信息的使用者即是信息用户。

使用的情况可以包括需要信息、接受信息和利用信息。

4. 信息需求Information Demand人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。

我们把意识到的信息需要定义为信息需求5. 信息检索Information Retrieval对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。

6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。

* 信息意识* 信息能力* 信息道德7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。

8. 经济领域的特征a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势;b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势;c.能源消耗少,污染得以控制;d.知识成为社会发展的巨大资源。

9. 社会、文化、生活方面的特征10.社会观念上的特征11当代信息环境特征描述* 信息超载严重信息超载又称信息泛滥或信息爆炸。

它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。

* 信息失衡明显所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。

* 信息污染成灾信息污染是指社会信息流中充斥或伴随着的许多不利于人们健康而有效地进行工作、学习、生活的不良信息,危害人类信息环境、影响人们对有效信息予以及时而正常地吸收及利用的社会现象。

* 信息障碍加剧信息障碍是指在信息交流过程中,一方面由于各种原因,阻碍了信息的正常流通;另一方面由于信息用户各自的生活经历、文化背景等存在很大差异,妨碍了其信息利用的有效而产生信息交流障碍与信息利用障碍* 信息犯罪增多信息犯罪是信息社会中一种新的犯罪类型,它一般是指运用信息技术故意实施的严重危害社会、危害公民合法权益并应负刑事责任的行为。

12. 信息污染主要包括:陈旧信息、重复信息、干扰信息、虚假信息、错误信息、有害信息。

13. 解决信息环境问题的对策及措施:a.从政策与法规方面予以调节和控制b.宣传正确的信息伦理及信息道德观念c.强化技术手段以净化信息环境d.鼓励人们积极创作e.加强信息教育,提高信息素质14.信息检索能满足人们把握各种信息的需求15.信息利用是人们掌握知识、消化知识、创造知识的一系列过程16.信息检索的目的是信息利用17.信息利用能力的强弱直接关系到人们终身学习能力的高低18. 文献是记录有知识的一切载体19.文献信息是记录在物质载体上的知识信息20.文献信息的人际传播21.文献信息的组织传播22.文献信息的大众传播23. 按文献信息的物质载体划分* 印刷型文献* 缩微型文献* 声像型文献* 机读型文献24.按文献信息的表现形式划分* 图书* 报刊(报纸、期刊)* 学位论文 (专利文献)* 会议文献(标准文献/ 科技报告/ 产品资料/档案资料/ 政府出版物* 网络文本25. 零次文献是指未以公开形式或非正式发表及出版形式进入社会流通使用的文献。

26. 一次文献是指作者以本人生产与科研工作成果为依据,创作、撰写而形成的已经公开发表或出版的文献一次文献的特点:内容新颖、翔实、具体,一般说它是文献信息检索的终极目标。

27. 二次文献是指对一次文献信息进行加工、提炼、浓缩而形成的工具性文献。

29. 三次文献是指对一次文献和二次文献的内容进行综合分析、系统整理、高度浓缩评述等深加工而形成的文献。

30. 狭义的检索是指依据特定的需求,按一定的方法,从已经搜集并组织好的大量有关文献信息的文献集合中,查找并获取特定的相关文献的过程。

31. 广义的检索包括信息的存储和检索两个过程。

(1)信息存储是将大量无序的信息集中起来,根据信息本身具有的内外部特征,经过筛选、加工和整序等处理,使其集约化、有序化、系统化,形成一个个具有检索功能的数据库(检索系统),供人们检索和利用的过程。

(2)信息检索是信息用户根据各自的信息需求,利用已经编制好的检索工具或数据库(检索系统),查找出特定信息的过程。

32. 序是事物的一种结构形式,是指事物或系统组成要素之间的相互联系以及这种联系在时空结构中的具体表现。

33. 当事物组成要素之间具有某种约束性,在时间序列及空间结构上呈现某种规律时,便可称这一事物为有序34. 有序化,即把杂乱无序的事物,按一定标准、使用一定的方法手段,整理为某种容易或者说能被理解的序列的一种活动。

35. 文献检索系统就是有序的文献集合,具体是指用来存储、报道和查找文献信息的各种数据库。

36. 检索途径又可以称为检索入口,是数据库编制者为用户设立或提供的检索与查找其数据库中所有信息的路径37. 检索方法,就是采用什么形式、手段来查找信息及其原始文献38. 常用文献检索方法(1)系统法也叫“工具法”或“常用法”,即利用检索系统开展全面的文献信息检索的方法。

(2)* 引文法也叫“追溯法”,是以已经获得的文献中所注明的“参考文献”为线索,查找所需要的文献的方法。

(3)系统-引文交替法是将以上两种方法相结合的检索方法。

39. 电子图书是指以电子形式存放、展示的包括文本、图像、音频等格式的信息,通过磁盘、光盘、网络等电子媒体出版发行,并借助于一定的工具进行阅读的图书。

* 电子形式* 电子媒体* 阅读工具40. 逻辑运算:采用布尔逻辑运算式来表达检索者对检索对象之间关系的限定及对检索结果范围的限定。

* 逻辑“与”A and B;A*B;A与B检索结果必须同时含有检索项A和B* 逻辑“或”A or B;A+B;A或B 检索结果含有两词之一或同时包含两词* 逻辑“非”A not B;A-B;A非B检索结果含有检索词A而不含有检索词B41. 事实数据库的最大特点,在于它所提供的内容大多来源于对客观事实、统计数据、图像图谱、人物事件等等的忠实记录与汇总,更具有直接利用、可信度高的特点42. 国际三大检索系统a.SCI(Science Citation Index)——《科学引文索引》b.EI (Engineering Index)——《工程索引》c.ISI Proceedings——《国际会议文献数据库》43. 网络信息资源特点* 信息数量增长迅猛* 信息质量良莠不齐* 存在状态无序且不稳定* 具有高度开放性* 使用方便共享度高44. 搜索引擎是一种能够通过Internet接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统45. 搜索引擎原理* 信息搜集* 信息处理* 信息查询46. 搜索引擎原理及类型* 按检索工具数量分独立搜索引擎多元搜索引擎* 按收录内容分综合型搜索引擎专题型搜索引擎47. 百度常用的检索命令:a.在网页标题中搜索——intitle:b.在特定站点中搜索——site:c.专门文档搜索——filetype:d.在特定url链接中搜索——inurl:e.精确匹配——“”、《》48. Googlea.学术搜索b.在线翻译c.Google Earthd.网上论坛e.Picasa网络相册49. 垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。

特点:“专、精、深”,且具有行业色彩50. 生活搜索——爱帮电子商务搜索——亨者旅游搜索——去哪儿比价搜索——顶九娱乐搜索——视频搜索51. 查全率查全率是指从检索系统检出的与某课题相关的文献量与检索系统中实际与该课题相关的文献总量之间的比率。

52. 查准率查准率是指从检索系统检出的有关某课题的文献量与检出的文献总量之间的比率。

53. 提高检索技巧提高检索人员素质优选检索工具和数据库优化检索策略与步骤* 逻辑“与”——缩小范围,查准率高* 逻辑“或”——扩大范围,查全率高* 逻辑“非”——缩小范围,查准率高,慎用54. 学术论文及选题原则* 专业性原则* 创新性原则* 适用性原则* 可行性原则55. 选题避免问题:* 选题过大* 选题过难* 选题过旧* 选题过虚56.论文的类型学术性论文技术性论文综述性论文学位论文* 文献综述* 开题报告57. 撰写文献综述时应注意的问题* 搜集文献应尽量全* 注意引用文献的代表性、可靠性和科学性* 文献综述的“综”要围绕论文主题* 引用文献要忠实文献内容* 文献综述在逻辑上要合理* 参考文献应和论文研究问题直接相关58. 提高查全率的技巧使用低相关度的检索入口使用“同义词”和“近义词”使用“模糊检索”利用文后的参考文献59. 提高查准率的技巧使用高相关度的检索入口使用限制检索使用“二次检索”使用“精确检索”.。

相关文档
最新文档