名词解释(信息检索2017)

合集下载

信息检索名词解释与简答 答案

信息检索名词解释与简答 答案

●名词解释●信息检索●广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。

狭义的信息检索是指从信息集合中找到所需信息的过程。

●信息素养●信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。

●信息意识●信息意识又称信息观念,是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收的敏感性。

●信息能力●是人们有效快速的获取、加工、存储、利用和传递信息的能力。

●信息道德●是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律法规和行为准则。

●零次文献●是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。

●一次文献●指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。

●二次文献●是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。

如书目、索引、文摘、题录、简介等。

●三次文献●三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。

●主题词●是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。

●关键词●关键词是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。

●叙词●所谓叙词,是指从自然语言中优选出来并经过规范化处理的术语,又称主题词。

●查全率●查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。

●查全率=【检出相关文献量/文献库内相关文献总量】×100%●查准率●查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。

信息检索答案

信息检索答案

一、名词解释(5x4=20分)1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。

检索中,计算机会将所有含有相同部分标识的记录全部检索出来。

截词符一般用“?”或“*”表示,但不同的数据库中有所差别。

2.信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。

4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。

5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。

二、简答(5x6=30分)1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。

(1)国内外的学位论文数据库包括索引与摘要数据库和全文数据库,如CALIS的《学位论文库》,万方数据资源系统《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDD(ProQuest Digital Dissertations),美国学位论文网络数字图书馆NDLTD (Networked Digital Library of Thesis and Dissertations)等。

(2)会议论文数据库包括:会议论文索引与摘要,如CALIS会议论文数据库,万方数据资源系统《中国学术会议论文数据库》,OCLC会议数据库——《在会议上提交的文章索引》(Papers First),《会议出版物索引》(Proceedings),Web of Knowledge的会议录引文索引CPCI(Conference Proceedings Citation Index)。

2.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。

数据挖掘中的名词解释

数据挖掘中的名词解释

第一章1,数据挖掘(Data Mining),就是从存放在数据库,数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。

2,人工智能(Artificial Intelligence)它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。

3,机器学习(Machine Learning)是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

4,知识工程(Knowledge Engineering)是人工智能的原理和方法,对那些需要专家知识才能解决的应用难题提供求解的手段。

5,信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。

6,数据可视化(Data Visualization)是关于数据之视觉表现形式的研究;其中,这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。

7,联机事务处理系统(OLTP)实时地采集处理与事务相连的数据以及共享数据库和其它文件的地位的变化。

在联机事务处理中,事务是被立即执行的,这与批处理相反,一批事务被存储一段时间,然后再被执行。

8, 联机分析处理(OLAP)使分析人员,管理人员或执行人员能够从多角度对信息进行快速一致,交互地存取,从而获得对数据的更深入了解的一类软件技术。

8,决策支持系统(decision support)是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。

它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。

信息检索与利用的名词解释

信息检索与利用的名词解释

信息检索与利用的名词解释信息检索与利用是指通过特定的工具和技术,从大量的信息中准确地获取所需的信息,并将其应用到实际问题中。

在当今信息爆炸的时代,信息检索与利用成为了人们获取知识和解决问题的重要手段。

本文将对与信息检索与利用相关的重要名词进行解释。

一、信息检索信息检索是指通过各种信息存储介质和检索系统,根据用户需求,从大规模信息资源中查找并提供相关信息的过程。

它包括了信息需求分析、检索策略制定、检索行为和结果评价等阶段。

信息检索的目标是根据用户的需求,准确地找到相关的信息。

1. 查询查询是用户通过检索系统输入的查找信息的指令或问题。

查询可以是关键词、短语甚至一整个句子。

合理构建查询是信息检索的关键,它决定了检索结果的准确性和全面性。

2. 检索系统检索系统是用来存储和组织大量信息资源,并为用户提供检索服务的系统。

它们通常由索引、搜索引擎、检索算法和用户接口等部分组成。

常见的检索系统包括网络搜索引擎、图书馆信息系统和企业内部知识库等。

3. 信息过滤信息过滤是通过自动化的方式,根据用户的兴趣和关注点,从大规模信息中筛选出符合用户需求的内容。

信息过滤可以根据各种条件和规则进行,例如关键词、时间范围、作者等。

它通过过滤无用信息,提供用户可能感兴趣的内容。

二、信息利用信息利用是将检索到的信息应用到实际问题中解决问题或产生价值的过程。

信息利用是信息检索的延伸和发展,它强调将获得的信息应用到实际场景中,以满足用户的具体需求。

1. 信息处理信息处理是将获取的信息进行整理、分析和加工的过程。

它包括信息的分类、筛选、归纳和汇总等操作,以便用户更好地理解和利用信息。

2. 知识发现知识发现是通过对大规模信息的分析、挖掘和模式识别,从中发现新的知识和规律的过程。

它利用数据挖掘、机器学习和人工智能等技术,从信息中抽取价值,用于决策支持和创新等领域。

3. 信息可视化信息可视化是通过图表、图形和其他视觉化方式,将信息呈现给用户,以提高信息的理解和交流效果。

文献信息检索作业

文献信息检索作业

信息检索大作业一、名词解释1、信息检索信息检索最普通的理解就是信息查找。

它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。

信息检索又叫做信息存储与检索(information storage and retrieval)。

信息检索可以分为事实检索、数据检索、文献检索。

2、文献检索文献检索实在检索工具或文献数据库中查找含有情报用户特定需要内容的文献的方法和过程。

它是信息检索的信息检索中最重要的部分。

因此可以将信息检索和文献检索看做是同义词。

3、特种文献特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。

其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。

4、检索语言信息检索语言是根据信息检索的需要而创造的专门供信息标引和信息检索使用的一种人工语言。

检索语言是人与检索系统进行对话的基础。

5、专利的“国际三性”三性是指专利的新颖性、创造性、实用性。

新颖性是指专利申请的发明或者实用新型不属于现有技术,是前所未有的。

创造性是指同申请日以前的技术相比,该发明有突出的实质性特点和显著进步,该实用新型有实质性特点和进步。

实用性是指该发明或者实用新型能够制造或者使用,并且能够产生积极效果。

6、计算机检索计算机检索就是通过计算机进行的文献信息检索。

计算机检索包括光盘数据库检索、网络数据库检索和互联网信息检索。

7、数据库从信息的角度来说,数据的集合,指将大量的信息按照一定的方式组织并存储起来所形成的数据集合。

8、布尔逻辑算符布尔逻辑算符是在信息检索过程中为了提高检索效率而用来组合检索词,进行检索语言或者检索代码的组配,规定检索词之间的逻辑关系的算符。

布尔逻辑算符包括逻辑与(and *)、逻辑和(or +)、逻辑非(not -)。

二、简答1.信息、知识、情报和文献之间的关系。

信息是物质存在方式及其运动规律、特点的外在表现。

信息检索服务的名词解释

信息检索服务的名词解释

信息检索服务的名词解释信息检索服务是指通过计算机技术和网络技术,帮助用户查找并获取所需信息的一种服务。

在现代社会中,随着互联网技术的日益发展,信息爆炸式增长的时代已经到来。

在这样的时代背景下,我们需要一种高效、准确的方法来检索和获取我们想要的信息,信息检索服务就应运而生。

一、信息检索服务的定义和功能信息检索服务是指通过信息检索系统来提供信息搜索、过滤和定位等功能,以满足用户对信息查询和获取的需求。

它通过建立索引和应用信息检索算法,在海量的信息中快速定位和提供用户所需的信息。

1.1 信息检索的定义信息检索(Information Retrieval,IR)是一个广泛涵盖的概念,指的是在大规模的信息集合中找到满足特定信息需求的文档或资源。

它不仅仅是传统的文本搜索,也包括图片、音频、视频等多媒体内容的检索。

1.2 信息检索服务的功能信息检索服务的主要功能包括:(1)检索文档:通过关键词或其他查询方式对大规模的文档进行检索,提供用户所需的信息。

(2)过滤信息:根据用户的需求,对搜索结果进行筛选和过滤,提供更准确和相关的信息。

(3)排序文档:将搜索结果按照一定的排序算法进行排序,使用户能够更方便地找到最相关的信息。

(4)信息推荐:根据用户的历史搜索行为和兴趣偏好,向用户推荐个性化的信息,提供更好的搜索体验。

二、信息检索服务的基本原理信息检索服务是建立在信息检索系统的基础上的,它主要通过以下几个步骤实现信息的检索和提供。

2.1 建立索引信息检索系统首先需要对文档集合进行建立索引的操作。

索引是一种数据结构,它存储了文档中关键词的出现位置和频率等信息,以便于后续的快速检索。

2.2 查询处理当用户输入查询请求时,信息检索系统会对查询请求进行处理。

这个处理过程包括分析查询语句的语法、去除停用词、展开同义词等操作,以便于生成一个能够准确表示用户需求的查询表达式。

2.3 检索匹配在得到查询表达式后,信息检索系统会将其与索引中的关键词进行匹配,并根据匹配程度对文档进行排序。

医学信息检索名词解释

医学信息检索名词解释

信息(一):信息指物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反应,它提供了客观世界的消息、知识,是事物的一种普遍属性。

知识:是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的结果。

情报:情报是人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。

文献:文献是记录有知识的一切载体。

情报意识:是指人对信息敏锐的感受力、判断能力和洞察力。

信息素养:信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。

文献检索:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索”。

检索语言:是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。

一次文献:指以作者本人的研究成果为依据而撰写并公开发表或的信息。

二次文献:是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。

如书目、索引、文摘、题录、简介等。

三次文献:三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。

:由依法设立的单位。

特种文献:是指发行和获取途径都比较特殊的科技文献。

检索途径:是指检索系统为用户提供的得到所需文献的路径。

主题词:是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。

分类途径:是指按照文献资料所属学科(专业)类别进行检索的途径,它所依据的是检索工具中的分类索引。

主题索引:也称主题途径。

这是按照文献的主题内容查找文献的途径。

是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。

信息检索

信息检索

信息检索一、名词解释:1.信息检索:狭义的信息检索概念是指在信息的海洋中选取符合需要的信息的过程称为信息检索。

而如今发展为包括信息的储存、组织、查询、提取等多个工作过程,所以广义的信息检索又称为信息储存与检索。

2.CALIS:全称为中国高等教育文献保障系统(china academic library&information system),其联合目录数据库始建于1997年。

其资源类型包括原文、图片、阴文、文摘、馆藏、相关文献等;育种覆盖中文、英语和日语。

3.引文索引:利用文献引证关系检索相关文献的索引。

引文索引以某一文献(包括作者、题名、发表年份、出处等基本数据)作为标目,标目下著录引用或参考过该文献的全部文献及出处。

它主要供用户从被引文献查找引用文献。

4.截词检索:截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。

截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。

尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。

5.科技查新:科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告。

二、填空1.文献按内容层次可分为:一次文献、二次文献和三次文献。

2.计算机信息技术中常用的检索技术是:布尔逻辑检索、截词检索、限制检索、词位检索。

3.信息素质的内涵包括:信息意识、信息技能和信息道德。

4.SCI是什么的缩写:科学引文索引(science citation index)。

5.位置算符W:这个算符表示其两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒,3N:此算符两侧的检索词之间允许间隔最多3个其他词或字母,且两者词序可颠倒。

信息检索名词解释

信息检索名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。

它是将信息按一左的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。

信息检索又叫做信息存储与检索(information storage and retri)。

信息检索可以分为事实检索、数据检索、文献检索。

特性检索:也称强相关性检索,强调向用户提供髙度对口的信息。

强调检索的准确性,对检索结果的数量不作要求。

族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。

注重检索的全面性,要求检索岀一段时间期限内有关特泄主题的所有信息,对准确性要求较低。

特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。

其特点是内容涉及面广、种类多、数呈大、报道快、参考价值髙。

OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

参考工具书:是指根据人们的需要,把某一范羽的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备査阅、参考,用以解决有关事实和数据方面的疑难问题的图书°年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数拯和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

手册:是汇集某一方而常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

搜索引擎:就是通过运行一个不断在网络上通过域冬扫描和各种链接的软件,自动获得大量站点页而的信息,并按照一立规则归类整理,从而形成数据库,用以提供查询的站点。

图书:论述或介绍某一领域知识的岀版物。

期刊:期刊一般是指名称固立、开本一致的左期或不左期连续岀版物。

信息检索名词解释

信息检索名词解释

信息检索名词解释信息检索(Information retrieval,IR)是指从大规模数据集中找出与用户需求相关的信息的过程。

以下是一些与信息检索相关的重要名词解释:1. 文档(Document):信息检索中的基本单位,可以是文本、图片、音频、视频等形式的数据。

2. 查询(Query):用户提出的一个或多个关键词或短语,用于描述其信息需求。

3. 检索(Retrieval):在信息检索系统中,通过匹配查询和文档之间的相关性,找出最相关的文档。

4. 相关性(Relevance):衡量查询和文档之间匹配程度的度量,用于判断文档是否与查询相关。

5. 评价(Evaluation):对信息检索系统性能进行定量和定性评估的过程,通常通过与人工判定相关性的比较来衡量。

6. 召回率(Recall):信息检索系统检索到的相关文档数占所有相关文档数的比例,衡量系统的查全性能。

7. 精确率(Precision):信息检索系统检索到的相关文档数占所有检索到的文档数的比例,衡量系统的查准性能。

8. F-度量(F-Measure):综合考虑召回率和精确率的度量指标,通过调和平均计算,可以较好地衡量系统的全面性和准确性。

9. 布尔模型(Boolean model):一种基本的信息检索模型,根据查询中的布尔运算符(AND、OR、NOT)对文档进行匹配。

10. 向量空间模型(Vector space model):一种常用的信息检索模型,将文档和查询表示为向量,在向量空间中计算它们之间的相似度。

11. 词语权重(Term weight):表示一个词语在文档中的重要性的权重,常用的计算方法有词频、逆文档频率等。

12. 倒排索引(Inverted index):一种常用的索引结构,以词语为关键字,记录词语出现在哪些文档中,加快检索速度。

13. 停用词(Stop word):在信息检索中,指那些对判定一个文档是否与查询相关没有帮助的常见词语,如“a”、“and”、“the”等。

信息检索名词解释

信息检索名词解释

信息检索名词解释信息检索是一种通过计算机技术和算法,从大量的信息资源中获取用户所需信息的过程。

在信息爆炸的时代,人们对于获取和处理信息的需求日益增长,信息检索成为了重要的工具和技术。

一、信息检索的定义信息检索(Information Retrieval,简称IR)是指根据用户的需求,在大规模、不断增长的信息资源中进行搜索和获取需要的信息的过程。

它涉及到索引构建、搜索引擎、搜索算法等方面的内容。

二、信息检索的过程信息检索的过程主要包括以下几个步骤:1. 需求分析:用户明确自己所需的信息,并将其转化为一个或多个查询的形式。

2. 数据预处理:对于待检索的信息资源进行预处理,包括数据清洗、分词、去除停用词等操作,以便更好地进行索引构建和检索。

3. 索引构建:根据待检索的信息资源,构建相应的索引结构,以便加快后续的检索速度和准确性。

常用的索引结构包括倒排索引和正排索引。

4. 搜索算法:通过使用不同的搜索算法,按照一定的匹配度和排名准则,从索引中检索出与用户需求相关的信息。

5. 结果展示:将检索到的信息按照一定的排版规则和展示方式,以用户可读性较高的形式展示出来,帮助用户判断和选择。

三、信息检索的技术与应用1. 倒排索引技术:倒排索引是信息检索中常用的索引结构,通过将词项与文档的对应关系进行倒置存储,提高了检索效率。

倒排索引能够快速定位到包含指定词项的文档,是现代搜索引擎的核心技术之一。

2. 自然语言处理:信息检索中的文本数据通常需要进行自然语言处理,包括分词、词性标注、词义消歧等操作。

这些操作可以帮助提高检索的准确性和召回率。

3. 搜索引擎:搜索引擎是信息检索的重要应用,能够在互联网上搜索并展示与用户需求相关的信息。

常见的搜索引擎包括谷歌、百度等。

搜索引擎通过建立庞大的索引库和使用高效的检索算法,为用户提供便捷的信息检索服务。

4. 推荐系统:信息检索还常常与推荐系统结合,根据用户的历史行为和兴趣,为用户推荐可能感兴趣的信息资源。

信息检索名词解释

信息检索名词解释

一.名词解释1,信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。

2,体系分类法:体系分类法是一种直接体现知识分类的等级概念标识系统,它对概括文献信息内容及其外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成。

它提供某学科、专业的集中文献。

3,关键词:是指从文献的标题、文摘以及正文中抽取的对表达文献主题起关键作用且具有检索意义的词语。

关键词是标示文献关键主题内容。

4,TCP(传输控制协议):将文本分成包(数据包),再加上特别的信息,是数据可以准确无误地发送到接收方的计算机上。

5,IP(网际协议):在数据包上标有特别的信息(接收主机的IP地址)到目的地后,系统自动将IP地址去掉,再利用TCP检查数据包害是否完整,如有去损则要求发送方重新发送被丢损的数据包。

6,FTP(文件传输协议):它允许两台因特网主机相互传送/拷贝文件,可以把自己计算机上的某台计算机上的文件拷贝到自己的计算机上。

7,《馆藏目录》:图书馆或信息资料部门所收藏的全部书刊的统计目录。

8,《联合目录》:汇总某地区或若干地区甚至是全国图书馆或其他收藏单位所藏的全部书刊的统计目录。

9,信息检索:从大量的文献中查询与信息提问所指定的课题(对象)有关的文献,或者是包括用户所需事实与消息的文献过程。

10,搜索引擎:是一种利用网络自动搜索技术,对因特网各种资源进行收集和标引,建立网页数据库,并为检索者提供网络信息检索的工具。

二,选择题1,b/(a+b)x100%=(D)(a值为检出的相关文献,b值为检出的不相关文献) A,查全率 B,漏检率 C,查准率 D,误检率2,(B)研究人员对某一专题研究的过程中根据进展情况撰写的正式的报告。

A,会议文献 B,科技报告 C,期刊 D,学位论文3,( C )是通过文章后面所附参考文献目录的线索查找所需信息的一种方法。

A,直接查找法 B,间接查找法 C,引文追溯法 D,综合法4,下面不属于专利的三大特性的是(D)A,独占性 B,地域性 C,时效性 D,完整性 A,B,C,D5,( B )是指各国政府部门及其设立的专门机构发表的文献。

信息检索 名词解释

信息检索   名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。

它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。

信息检索又叫做信息存储与检索(information storage and retri)。

信息检索可以分为事实检索、数据检索、文献检索。

特性检索:也称强相关性检索,强调向用户提供高度对口的信息。

强调检索的准确性,对检索结果的数量不作要求。

族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。

注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。

特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。

其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。

OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。

图书:论述或介绍某一领域知识的出版物。

期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。

信息检索名词解释

信息检索名词解释

1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。

所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。

狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。

相当于我们所说的信息查询(information search)。

2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。

如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。

其主要特点是内容新颖,但不成熟,不公开交流,难以获得。

3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。

如期刊论文、科技报告、专利说明书、会议论文、学位论文等。

体现创作性。

其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。

4)二次文献(Secondary Document):就是检索工具。

是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。

如文摘,目录、索引等。

它有存贮、检索、报道的功能。

体现高度的浓缩性。

其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。

二次文献具有汇集性、工具性、综合性、交流性等特点。

5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。

三次文献是情报研究的产物和成果。

具有很强的的综合性。

总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。

6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。

信息检索名词解释

信息检索名词解释

《信息检索》名词解释[1] 信息答:答案:信息是指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动变化中所具有特征性的内容的总称。

[2] 信息检索答:答案:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程。

[3] 文献答案:文献就是用文字、图形、符号或声像、视频等技术手段记录知识信息的物质载体,或曰固化在物质载体上的知识信息。

[4] 检索语言答:即情报检索语言,是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。

[5] 检索工具答案:检索工具是指用以报导、存贮和查找文献线索的工具。

它是附有检索标识的某一范围文献条目的集合,是二次文献[6] 数据检索答案:数据检索是以数值或图表形式表示的数据为检索对象的信息检索。

数据检索是一种确定性检索。

[7] 事实检索答案:事实检索是以从文献中抽取的事项为检索内容的信息检索。

其检索对象既包括非数值信息,也包括一些数据信息。

事实检索是确定性检索。

[8] 索引答案:索引是从正文各文献条目中选出的词或代码的顺序表。

索引主要由检索标识和文献条目顺序号两部分组成。

灵活掌握检索工具索引的使用,是学会使用检索工具的实质。

[9] 计算机信息检索答:计算机信息检索是指利用计算机存储和检索信息。

具体地说,就是指人们在计算机或网络终端上使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,然后再由终端设备显示、打印的过程。

[10] 联机检索系统答:联机检索系统是由一台主机带多个终端的信息检索系统。

这种系统具有分时的操作能力,能够使许多相互独立的终端同时进行检索。

检索是以人机对话的方式进行的,用户在自己的终端上输入检索提问式,联机服务中心的计算机就可以立即处理用户的请求,在数据库中查找符合用户提问的数据,并将检索结果回送至用户的检索终端上。

信息检索技术名词解释

信息检索技术名词解释

信息检索技术名词解释信息检索技术通常指的是在大规模的文本数据集中,通过计算机和算法来获取和检索所需信息的技术。

以下是部分信息检索技术的名词解释:1. 关键词检索:通过输入关键词或关键词组合来搜索相关文档的技术。

2. 自然语言处理(NLP):利用计算机算法处理和理解人类自然语言的技术,用于处理和理解用户查询和文档内容。

3. 代码自动补全:在编程过程中,自动根据上下文和已有的代码片段,为用户提供可能的代码补全建议。

4. 基于内容的推荐:根据用户过去的行为和喜好,为用户提供与其兴趣相关的内容建议。

5. 聚类分析:将大规模文本数据集中的文档根据其语义和主题进行分类和分组的技术。

6. 文本挖掘:从大规模文本数据中提取出有意义的信息和知识的技术。

7. 信息抽取:从非结构化文本数据中自动提取出特定类型的信息,如人名、地点、时间等的技术。

8. 语义搜索:基于语义理解和语义关联性,将用户的查询与文档内容进行语义匹配的技术。

9. 知识图谱:将大规模的结构化和半结构化数据组织成一种图谱结构,以形成人机可读和交互的知识库。

10. 信息过滤:根据用户的需求和兴趣,对大规模的文档数据进行筛选和过滤,提供用户感兴趣的信息。

11. 排名算法:根据文档的相关性和其他指标,对搜索结果进行排序和排名的算法。

12. 召回率和精确度:召回率是指在搜索中找到相关文档的能力,精确度是指搜索结果中相关文档的准确性。

13. 倒排索引:一种常用的索引结构,通过记录每个单词出现在哪些文档中,以方便快速检索相关文档。

14. 分词:将连续的自然语言文本切分成有意义的词语的技术。

15. 同义词扩展:将用户查询中的关键词进行同义词替换,以增加搜索结果的覆盖范围。

信息检索的基本概念

信息检索的基本概念

一、信息检索的概念和类型穆尔斯(Calvin N. Mooers, 1919~1994) 在1948年提出此术语时,把它定义为一种“延时性通讯形式”。

其特点是:发信者在某一时刻发出信息,而接收者可以在晚一些时刻才收到该信息;发信者必须发出一切可能的信息,而接受者必须有某种检索装置以便从大量发送的信息中筛选出适合自己需要的信息。

(一)信息检索的概念信息检索是信息正式交流方式中的一种1、定义:信息检索(Information Retrieval)——广义上说,信息检索是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。

从本质上讲,信息检索是一种有目的和组织化的信息存取活动,其中包括“存”和“取”两个基本环节。

对于“存”来说,主要指面向来自各种渠道的大量信息资源而进行的高度组织化的存储;对于“取”来说,则要求面向随机出现的各种用户信息需求所进行的高度选择性的查找,并且尤其强调查找的快速与便利。

信息检索的全称是信息存储与检索(information storage and retrieval),包含两个方面,存储的过程是信息的组织加工和记录的过程,即建立检索系统(编制检索工具)的过程——输入的过程;检索的过程是按一定方法从检索系统(检索工具)中查出信息用户需要的特定信息的过程——输出的过程。

二者是相辅相成的,存储是为了检索,而检索又必须先进行存储。

只有经过组织的有序信息集合才能提供检索,因此了解了一个信息系统(检索工具)的组织方式也就找到了检索该检索系统(检索工具)的根本方法。

当然,对信息用户而言,后者更为重要,因此,狭义的信息检索一般仅指检索的过程。

检索的本质是信息用户的需求和信息集合的比较与选择,即匹配(match)的过程。

从用户需求出发,对一定的信息集合(系统)采用一定的技术手段,根据一定的线索与准则找出(命中)(locate,bit)相关信息的过程,就是检索。

2、信息检索的基本原理与检索处理流程分析*基本原理可以把信息检索的基本原理抽象概括为一句话:对信息集合与需求集合的匹配与选择。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1、信息检索:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。

其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。

取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。

2、查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示:
查全率=(检出相关文献量/系统中相关文献总量)*100%
3、查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示:
查准率=(检出相关文献量/检出文献总量)*100%
4、漏检率:是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示:
漏检率=(漏检相关文献量/系统中相关文献总量)*100%
5、跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果。

6、单库检索:在选定的单一数据库中进行检索。

7、经典论文优先:被引用数比较多,或者文章发表在档次比较高的杂志上等经典的、有价值的文献优先排在前面。

8、相关度优先:和查询的条件内容最相关的文献优先排在前面。

9、最新论文优先:发表时间比较新的文献优先排在前面。

10、精确匹配:检索结果中包含与检索词完全相同的词语
11、模糊匹配:检索结果包含检索词或检索词中的词素
12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。

13、倒查法从最新时间查找起,直到满足检索要求为止。

14、抽查法是针对有关学科的发展特点,抽查某些特定时期的文献信息。

15、二次检索是指在前一次检索结果的范围内,继续进行检索。

16、定题检索SDI (selective dissemination of information)查找有关特定主题最新信息的检索。

17、回溯检索RS (retrospective search)查找一段时期内有关特定主题信息的检索。

18、检索语言又称为情报语言、情报存储和检索语言、信息组织语言,是信息存储与检索过程中用于描述信息特征和表达用户信息提问的一种人工语言,是实现人与检索系统对话的交流语言。

19、手工检索:以手工操作的方式,利用检索工具书进行信息检索。

20、检索工具是用来报道、存和查找信息的工具,通常是指以书本或卡片形式呈现、采用手工方式进行的设施,如检索期刊、书目索引和卡片目录等。

21、全文检索是将存储于数据库中的整本书、整篇文章中的任意内容找出来的检索。

22、同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制。

23、搜索引擎是指Internet上的、在万维网中主动搜索信息并能自动索引、提供查询服务的一类网站,这些网站通过网络搜索软件(又称网络搜索机器人)或网站登录等方式,将Internet上大量网站的页面收集到本地,经过加工处理建立建成数据库从而能够对用户提出的各种查询作出响应,提供用户所需的信息。

24、初级检索:初学者适用。

该方法的特点是方便、快捷、效率高,但查询结果有很大的冗余。

在检索结果中要进行二次检索才能提高查准率
1.(1)图书[M]:包括专著、教科书、各种科普读物及专业参考工具书等,特点是:内容系统、成熟、定型、信息经筛选,可靠性强,出版周期长,更新速度慢,从检索角度,图书一般不作为主要检索对象。

分类:1)阅读性图书:包括教科书、专著、文集等。

2)工具书:包括字词典、百科全书、手册、年鉴等。

3)检索用书,如以图书形式刊行的书目、题录、文摘等。

(2)期刊[J]:定期或不定期刊行的连续出版物,如杂志、年度报告、年鉴、丛书、学会的会议录、学报和纪要等,特点是:数量大、品种多,内容丰富多样、出版周期短、报道速度较快、发行、流通面很广泛,连续性强,伴随着相应的学科领域发展前进。

职能:记录正式的公开的科学技术活动,传播科技信息的主要工具。

分类:1)学术性与技术性期刊:各种学报、通报、汇刊、评论、进展等。

2)杂志:者娱乐、新闻等。

3)检索性期刊:专门报道二次文献信息4)快报性期刊:如各种通讯、短讯等。

(3)会议文献的特点是传递情报比较及时,内容新颖,专业性和针对性强,种类繁多,出版形式多样。

它是科技文献的重要组成部分, 同一会议上的文献论题集中、新颖、丰富、专深、学术性强,一般是经过挑选的,质量较高,能及时反映科学技术中的新发现、新成果、新成就以及学科发展趋向,是了解各国科技发展水平和动向的重要文献来源。

文献按载体形势分为:刻写型、印刷型、缩微型、声像型、电子型。

14.美国四大科技报告(AD,PB,NASA ,DOE )
AD报告1951年开始出版。

现由美国国防技术情报中心负责收集整理和出版。

报告内容以国防部各个合同户的研究报告为主,其报告号冠以AD,A原先为Armed、D则为Document 之意,现在则可理解为入藏报告(Accession Document);PB报告产生于二战结束之后,当时美国政府为了整理和利用从战败国获得的数以千吨计的秘密科技资料,于1945年6月成立了一个专门的出版局,即美国商务部出版局(Publication Board),负责收集、整理、报导利用这些资料;NASA报告是美国国家航空航天局NASA科技情报处编辑、出版的专业性检索刊物,它是检索航空航天科技报告的重要工具。

;DOE 报告,是美国能源部DOE技术情报中心编辑出版的半月刊。

收录能源部部属科研机构和各大学等一切与能源有关的科技文献,以科技报告为主。

2.文献检索是以文献作为检索对象,查找含有用户所需信息内容的文献,文献是一种相关性检索而非确定性检索,系统不直接解答用户所提出的问题本身,只提供与之相关文献或文献的属性信息与来源指示供用户参考和取舍。

所以其检索对象是包含特定信息的各种文献。

数据检索是将经过选择、整理、鉴定的数值存入数据库中,根据需要查出可回答某一问题的数据的检索。

数据检索是一种确定性的检索,即直接提供用户所需要的确切数据。

而且检索结果一般也是确定性的,要么是有,要么是没有;要么是对,要么是错。

有些数据检索系统不仅能查出数据,还提供一定的运算、推导能力。

事实检索是检索关于某些客体(如机构、人物等)的指示性描述,或关于某一事件发生的时间、地点、经过等信息并将其查找出来的检索。

如:名词术语、概念、定义、理论、方法、公式、事件等。

事实检索属于数据,因为事实也是一种数据,即非数值性数据
3.信息检索语言(retrieval language)又称为情报语言、情报存储和检索语言、信息组织语言,是用来描述文献特征,表达主题提问的一种专门的人工语言,是由给定领域中的一切可用来描述信息内容和信息需求的词汇或符号,及其使用规则构成的供标引和检索的工具。

是沟通信息存储与检索两个过程,标引人员与检索人员的桥梁。

信息检索语言是检索系统的语言基础,主要作用是:表达描述信息内容和信息需求;用于信息的组织和整序;用于对检索系统中索引标识或提问标识的规范和控制。

相关文档
最新文档