信息检索名词解释
名词解释(信息检索2017)
1、信息检索:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。
其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。
取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。
2、查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示:查全率=(检出相关文献量/系统中相关文献总量)*100%3、查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示:查准率=(检出相关文献量/检出文献总量)*100%4、漏检率:是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示:漏检率=(漏检相关文献量/系统中相关文献总量)*100%5、跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果。
6、单库检索:在选定的单一数据库中进行检索。
7、经典论文优先:被引用数比较多,或者文章发表在档次比较高的杂志上等经典的、有价值的文献优先排在前面。
8、相关度优先:和查询的条件内容最相关的文献优先排在前面。
9、最新论文优先:发表时间比较新的文献优先排在前面。
10、精确匹配:检索结果中包含与检索词完全相同的词语11、模糊匹配:检索结果包含检索词或检索词中的词素12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。
13、倒查法从最新时间查找起,直到满足检索要求为止。
14、抽查法是针对有关学科的发展特点,抽查某些特定时期的文献信息。
15、二次检索是指在前一次检索结果的范围内,继续进行检索。
16、定题检索SDI (selective dissemination of information)查找有关特定主题最新信息的检索。
信息检索名词解释与简答 答案
●名词解释●信息检索●广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。
狭义的信息检索是指从信息集合中找到所需信息的过程。
●信息素养●信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。
●信息意识●信息意识又称信息观念,是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收的敏感性。
●信息能力●是人们有效快速的获取、加工、存储、利用和传递信息的能力。
●信息道德●是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律法规和行为准则。
●零次文献●是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。
●一次文献●指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。
●二次文献●是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。
如书目、索引、文摘、题录、简介等。
●三次文献●三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。
●主题词●是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。
●关键词●关键词是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。
●叙词●所谓叙词,是指从自然语言中优选出来并经过规范化处理的术语,又称主题词。
●查全率●查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。
●查全率=【检出相关文献量/文献库内相关文献总量】×100%●查准率●查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。
信息检索与利用的名词解释
信息检索与利用的名词解释信息检索与利用是指通过特定的工具和技术,从大量的信息中准确地获取所需的信息,并将其应用到实际问题中。
在当今信息爆炸的时代,信息检索与利用成为了人们获取知识和解决问题的重要手段。
本文将对与信息检索与利用相关的重要名词进行解释。
一、信息检索信息检索是指通过各种信息存储介质和检索系统,根据用户需求,从大规模信息资源中查找并提供相关信息的过程。
它包括了信息需求分析、检索策略制定、检索行为和结果评价等阶段。
信息检索的目标是根据用户的需求,准确地找到相关的信息。
1. 查询查询是用户通过检索系统输入的查找信息的指令或问题。
查询可以是关键词、短语甚至一整个句子。
合理构建查询是信息检索的关键,它决定了检索结果的准确性和全面性。
2. 检索系统检索系统是用来存储和组织大量信息资源,并为用户提供检索服务的系统。
它们通常由索引、搜索引擎、检索算法和用户接口等部分组成。
常见的检索系统包括网络搜索引擎、图书馆信息系统和企业内部知识库等。
3. 信息过滤信息过滤是通过自动化的方式,根据用户的兴趣和关注点,从大规模信息中筛选出符合用户需求的内容。
信息过滤可以根据各种条件和规则进行,例如关键词、时间范围、作者等。
它通过过滤无用信息,提供用户可能感兴趣的内容。
二、信息利用信息利用是将检索到的信息应用到实际问题中解决问题或产生价值的过程。
信息利用是信息检索的延伸和发展,它强调将获得的信息应用到实际场景中,以满足用户的具体需求。
1. 信息处理信息处理是将获取的信息进行整理、分析和加工的过程。
它包括信息的分类、筛选、归纳和汇总等操作,以便用户更好地理解和利用信息。
2. 知识发现知识发现是通过对大规模信息的分析、挖掘和模式识别,从中发现新的知识和规律的过程。
它利用数据挖掘、机器学习和人工智能等技术,从信息中抽取价值,用于决策支持和创新等领域。
3. 信息可视化信息可视化是通过图表、图形和其他视觉化方式,将信息呈现给用户,以提高信息的理解和交流效果。
文献检索作业
《文献检索》课程作业第1章至第2章一、名词解释1. 信息检索信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
2.信息素质(信息素养):从各种信息源中检索、评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。
具有信息素养的日呢,也就具备了终身学习的能力。
3.信息意识简单的说就是人们利用信息系统获取信息的内在动因,具体表现为信息的敏感性、选择能力和消化吸收能力。
4. 信息能力指理解、获取、利用信息能力及利用信息技术的能力。
5.信息道德是指在信息领域中用以规范人们相互关系的思想观念与行为准则。
6.《SCI》美国《科学引文索引》(Science Citation Index, 简称SCI )于1957 年由美国科学信息研究所在美国费城创办,是由美国科学信息研究所(ISI)1961年创办出版的引文数据库。
7.期刊由依法设立的期刊出版单位出版。
8.影响因子是美国ISI(科学信息研究所)的JCR(期刊引证报告)中的一项数据。
9.分类语言是用分类号和相应的分类款目名称来表达信息内容的主题概念,并按学科体系的逻辑次序将信息资源系统地加以划分和组织的语言.10.中图法《中国图书馆分类法》(原名《中国图书馆图书分类法》,是我国图书馆和情报单位普遍使用的一部综合性的分类法。
11.检索语言是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。
12.主题语言所谓主题语言,是以自然语言的语词为字符,以规范化或未经规范化的名词术语为基本词汇,以概念之间的形式逻辑作为语法和构词法,用语词字顺排列,主题概念以参照系统显示概念之间关系的一类检索语言。
13.关键词特指单个媒体在制作使用索引时,所用到的词汇。
14.一次文献指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。
15.二次文献是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。
信息检索服务的名词解释
信息检索服务的名词解释信息检索服务是指通过计算机技术和网络技术,帮助用户查找并获取所需信息的一种服务。
在现代社会中,随着互联网技术的日益发展,信息爆炸式增长的时代已经到来。
在这样的时代背景下,我们需要一种高效、准确的方法来检索和获取我们想要的信息,信息检索服务就应运而生。
一、信息检索服务的定义和功能信息检索服务是指通过信息检索系统来提供信息搜索、过滤和定位等功能,以满足用户对信息查询和获取的需求。
它通过建立索引和应用信息检索算法,在海量的信息中快速定位和提供用户所需的信息。
1.1 信息检索的定义信息检索(Information Retrieval,IR)是一个广泛涵盖的概念,指的是在大规模的信息集合中找到满足特定信息需求的文档或资源。
它不仅仅是传统的文本搜索,也包括图片、音频、视频等多媒体内容的检索。
1.2 信息检索服务的功能信息检索服务的主要功能包括:(1)检索文档:通过关键词或其他查询方式对大规模的文档进行检索,提供用户所需的信息。
(2)过滤信息:根据用户的需求,对搜索结果进行筛选和过滤,提供更准确和相关的信息。
(3)排序文档:将搜索结果按照一定的排序算法进行排序,使用户能够更方便地找到最相关的信息。
(4)信息推荐:根据用户的历史搜索行为和兴趣偏好,向用户推荐个性化的信息,提供更好的搜索体验。
二、信息检索服务的基本原理信息检索服务是建立在信息检索系统的基础上的,它主要通过以下几个步骤实现信息的检索和提供。
2.1 建立索引信息检索系统首先需要对文档集合进行建立索引的操作。
索引是一种数据结构,它存储了文档中关键词的出现位置和频率等信息,以便于后续的快速检索。
2.2 查询处理当用户输入查询请求时,信息检索系统会对查询请求进行处理。
这个处理过程包括分析查询语句的语法、去除停用词、展开同义词等操作,以便于生成一个能够准确表示用户需求的查询表达式。
2.3 检索匹配在得到查询表达式后,信息检索系统会将其与索引中的关键词进行匹配,并根据匹配程度对文档进行排序。
信息检索2答案
一、名词解释(5x4=20分)1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。
检索中,计算机会将所有含有相同部分标识的记录全部检索出来。
截词符一般用“?”或“*”表示,但不同的数据库中有所差别。
2.信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。
4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。
5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。
二、简答(5x6=30分)1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。
(1)国内外的学位论文数据库包括索引与摘要数据库和全文数据库,如CALIS的《学位论文库》,万方数据资源系统《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDD(ProQuest Digital Dissertations),美国学位论文网络数字图书馆NDLTD (Networked Digital Library of Thesis and Dissertations)等。
(2)会议论文数据库包括:会议论文索引与摘要,如CALIS会议论文数据库,万方数据资源系统《中国学术会议论文数据库》,OCLC会议数据库——《在会议上提交的文章索引》(Papers First),《会议出版物索引》(Proceedings),Web of Knowledge的会议录引文索引CPCI(Conference Proceedings Citation Index)。
2.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。
信息检索复习(名词解释)
1、同句检索是要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制。
2、查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示:查全率=(检出相关文献量/系统中相关文献总量)*100%3、查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示:查准率=(检出相关文献量/检出文献总量)*100%4、漏检率:是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示:漏检率=(漏检相关文献量/系统中相关文献总量)*100%5、跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果。
6、单库检索:在选定的单一数据库中进行检索。
7、经典论文优先:被引用数比较多,或者文章发表在档次比较高的杂志上等经典的、有价值的文献优先排在前面。
8、相关度优先:和查询的条件内容最相关的文献优先排在前面。
9、最新论文优先:发表时间比较新的文献优先排在前面。
10、精确匹配:检索结果中包含与检索词完全相同的词语11、模糊匹配:检索结果包含检索词或检索词中的词素12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。
13、倒查法从最新时间查找起,直到满足检索要求为止。
14、抽查法是针对有关学科的发展特点,抽查某些特定时期的文献信息。
15、二次检索是指在前一次检索结果的范围内,继续进行检索。
16、定题检索 SDI (selecti ve dissemi nation of informa tion)查找有关特定主题最新信息的检索。
17、回溯检索 RS (retrosp ective search)查找一段时期内有关特定主题信息的检索。
信息检索
信息检索一、名词解释:1.信息检索:狭义的信息检索概念是指在信息的海洋中选取符合需要的信息的过程称为信息检索。
而如今发展为包括信息的储存、组织、查询、提取等多个工作过程,所以广义的信息检索又称为信息储存与检索。
2.CALIS:全称为中国高等教育文献保障系统(china academic library&information system),其联合目录数据库始建于1997年。
其资源类型包括原文、图片、阴文、文摘、馆藏、相关文献等;育种覆盖中文、英语和日语。
3.引文索引:利用文献引证关系检索相关文献的索引。
引文索引以某一文献(包括作者、题名、发表年份、出处等基本数据)作为标目,标目下著录引用或参考过该文献的全部文献及出处。
它主要供用户从被引文献查找引用文献。
4.截词检索:截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。
截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。
尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。
5.科技查新:科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告。
二、填空1.文献按内容层次可分为:一次文献、二次文献和三次文献。
2.计算机信息技术中常用的检索技术是:布尔逻辑检索、截词检索、限制检索、词位检索。
3.信息素质的内涵包括:信息意识、信息技能和信息道德。
4.SCI是什么的缩写:科学引文索引(science citation index)。
5.位置算符W:这个算符表示其两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒,3N:此算符两侧的检索词之间允许间隔最多3个其他词或字母,且两者词序可颠倒。
计算机信息检索
一.名词解释1.信息检索:广义来说,指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程,包括“存”和“取”两个基本环节;狭义理解,一般只涉及“取”,信息检索也可称为“信息查询”或“信息查找”。
2.联机信息检索:指用户利用检索系统网络的终端设备,通过通信线路,运用一些特定的指令和检索策略与世界上的信息检索系统,进行质检的人机对话,从检索系统的数据库中查找出用户所需要的特定信息,并将检索结果与过程下载,显示和打印出来的过程。
3.CBR:基于内容的检索,指根据多媒体对象的听、视觉特征及其中蕴含的内容和语义特征进行检索,并希望能够借助于模式识别、语音识别、图像理解等相关领域的研究成果,对多媒体数据的听、视觉特征和语义特征进行自动(半自动)的分析、表达和组织。
4.网络信息源:指所有以电子数据的形式把文字、图像、声音、动画等多种形式的信息存贮在光、磁等非纸质介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
5.搜索引擎:搜索引擎有广义与狭义之分。
广义的搜索引擎泛指网络上提供信息检索服务的攻击或系统。
狭义的搜索引擎主要是指利用网络自动搜索软件对INTERNET(主要是WEB)网络资源进行收集、组织并提供检索服务的一类信息服务系统。
6.URL:统一资源定位符(Uniform Resource Locator,缩写为URL)是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。
互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
7. 顺排/倒排文档:文档的概念是指数据库内容的组织形式。
一般地说,一个数据库至少包括一个顺排文档和一个倒排文档。
(1)顺排档,也称为主文档、引文文档,它是按记录存取号的大小顺序排列记录而成的文档。
文档越是新,记录存入文档的时间越是晚,记录的存取号就越大。
(2)倒排挡,是指把数据库中记录的一切可检字段或属性值(称检索标识,如著者,主题词等,不包括存取号)抽出,按某种顺序(字母或数字顺序)重新加以组织后得到的特征标识文档。
信息检索名词解释
信息检索名词解释信息检索(Information retrieval,IR)是指从大规模数据集中找出与用户需求相关的信息的过程。
以下是一些与信息检索相关的重要名词解释:1. 文档(Document):信息检索中的基本单位,可以是文本、图片、音频、视频等形式的数据。
2. 查询(Query):用户提出的一个或多个关键词或短语,用于描述其信息需求。
3. 检索(Retrieval):在信息检索系统中,通过匹配查询和文档之间的相关性,找出最相关的文档。
4. 相关性(Relevance):衡量查询和文档之间匹配程度的度量,用于判断文档是否与查询相关。
5. 评价(Evaluation):对信息检索系统性能进行定量和定性评估的过程,通常通过与人工判定相关性的比较来衡量。
6. 召回率(Recall):信息检索系统检索到的相关文档数占所有相关文档数的比例,衡量系统的查全性能。
7. 精确率(Precision):信息检索系统检索到的相关文档数占所有检索到的文档数的比例,衡量系统的查准性能。
8. F-度量(F-Measure):综合考虑召回率和精确率的度量指标,通过调和平均计算,可以较好地衡量系统的全面性和准确性。
9. 布尔模型(Boolean model):一种基本的信息检索模型,根据查询中的布尔运算符(AND、OR、NOT)对文档进行匹配。
10. 向量空间模型(Vector space model):一种常用的信息检索模型,将文档和查询表示为向量,在向量空间中计算它们之间的相似度。
11. 词语权重(Term weight):表示一个词语在文档中的重要性的权重,常用的计算方法有词频、逆文档频率等。
12. 倒排索引(Inverted index):一种常用的索引结构,以词语为关键字,记录词语出现在哪些文档中,加快检索速度。
13. 停用词(Stop word):在信息检索中,指那些对判定一个文档是否与查询相关没有帮助的常见词语,如“a”、“and”、“the”等。
信息检索名词解释
信息检索名词解释信息检索是一种通过计算机技术和算法,从大量的信息资源中获取用户所需信息的过程。
在信息爆炸的时代,人们对于获取和处理信息的需求日益增长,信息检索成为了重要的工具和技术。
一、信息检索的定义信息检索(Information Retrieval,简称IR)是指根据用户的需求,在大规模、不断增长的信息资源中进行搜索和获取需要的信息的过程。
它涉及到索引构建、搜索引擎、搜索算法等方面的内容。
二、信息检索的过程信息检索的过程主要包括以下几个步骤:1. 需求分析:用户明确自己所需的信息,并将其转化为一个或多个查询的形式。
2. 数据预处理:对于待检索的信息资源进行预处理,包括数据清洗、分词、去除停用词等操作,以便更好地进行索引构建和检索。
3. 索引构建:根据待检索的信息资源,构建相应的索引结构,以便加快后续的检索速度和准确性。
常用的索引结构包括倒排索引和正排索引。
4. 搜索算法:通过使用不同的搜索算法,按照一定的匹配度和排名准则,从索引中检索出与用户需求相关的信息。
5. 结果展示:将检索到的信息按照一定的排版规则和展示方式,以用户可读性较高的形式展示出来,帮助用户判断和选择。
三、信息检索的技术与应用1. 倒排索引技术:倒排索引是信息检索中常用的索引结构,通过将词项与文档的对应关系进行倒置存储,提高了检索效率。
倒排索引能够快速定位到包含指定词项的文档,是现代搜索引擎的核心技术之一。
2. 自然语言处理:信息检索中的文本数据通常需要进行自然语言处理,包括分词、词性标注、词义消歧等操作。
这些操作可以帮助提高检索的准确性和召回率。
3. 搜索引擎:搜索引擎是信息检索的重要应用,能够在互联网上搜索并展示与用户需求相关的信息。
常见的搜索引擎包括谷歌、百度等。
搜索引擎通过建立庞大的索引库和使用高效的检索算法,为用户提供便捷的信息检索服务。
4. 推荐系统:信息检索还常常与推荐系统结合,根据用户的历史行为和兴趣,为用户推荐可能感兴趣的信息资源。
信息检索名词解释
一.名词解释1,信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。
2,体系分类法:体系分类法是一种直接体现知识分类的等级概念标识系统,它对概括文献信息内容及其外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成。
它提供某学科、专业的集中文献。
3,关键词:是指从文献的标题、文摘以及正文中抽取的对表达文献主题起关键作用且具有检索意义的词语。
关键词是标示文献关键主题内容。
4,TCP(传输控制协议):将文本分成包(数据包),再加上特别的信息,是数据可以准确无误地发送到接收方的计算机上。
5,IP(网际协议):在数据包上标有特别的信息(接收主机的IP地址)到目的地后,系统自动将IP地址去掉,再利用TCP检查数据包害是否完整,如有去损则要求发送方重新发送被丢损的数据包。
6,FTP(文件传输协议):它允许两台因特网主机相互传送/拷贝文件,可以把自己计算机上的某台计算机上的文件拷贝到自己的计算机上。
7,《馆藏目录》:图书馆或信息资料部门所收藏的全部书刊的统计目录。
8,《联合目录》:汇总某地区或若干地区甚至是全国图书馆或其他收藏单位所藏的全部书刊的统计目录。
9,信息检索:从大量的文献中查询与信息提问所指定的课题(对象)有关的文献,或者是包括用户所需事实与消息的文献过程。
10,搜索引擎:是一种利用网络自动搜索技术,对因特网各种资源进行收集和标引,建立网页数据库,并为检索者提供网络信息检索的工具。
二,选择题1,b/(a+b)x100%=(D)(a值为检出的相关文献,b值为检出的不相关文献) A,查全率 B,漏检率 C,查准率 D,误检率2,(B)研究人员对某一专题研究的过程中根据进展情况撰写的正式的报告。
A,会议文献 B,科技报告 C,期刊 D,学位论文3,( C )是通过文章后面所附参考文献目录的线索查找所需信息的一种方法。
A,直接查找法 B,间接查找法 C,引文追溯法 D,综合法4,下面不属于专利的三大特性的是(D)A,独占性 B,地域性 C,时效性 D,完整性 A,B,C,D5,( B )是指各国政府部门及其设立的专门机构发表的文献。
信息检索与利用 名词解释
是文献信息研究的成果和产物,具有参考性和指导性。
如教科书、综述、工具书、进展、调查报告、标准等。
4.目录答:是对图书、期刊或其他单独出版物特征的揭示和报道。
目录以单位出版物为著录对象,一般只记录其外部特征。
如题名、著者、出版事项、载体形态等。
5.专利权答:是指国家专利主管机关授予申请人在一定时间内享有的不准他人任意制造、使用或销售其专利产品或者使用其专利方法的权利。
1.检索工具答:是在一次文献的基础上,经过加工整理、编辑而成的二次文献,用于存储和检索文献线索。
2.一次文献(原始文献)答:是以著者本人的研究或研制成果为依据而创作或撰写的文献,是在科学研究中需重点查找的文献。
一次文献强调创造性,是对知识信息的第一次加工。
常见的一次文献有:期刊论文、专利说明书、会议论文、学位论文、技术标准、报告等。
3.题录答:是对单篇文献外表特征的揭示和报道,著录项目一般有篇名、著者、著者单位、文献来源、语种等。
1.文献文献是记录有知识的一切载体。
2.情报情报是人们以各种方式传递与交流的具有一定目的与时效的信息,是人们为一定目的搜集的有使用价值的知识或信息。
3.信息信息指物质存在或运动方式与状态的表现形式或反映,是现实世界事物的反应,它提供了客观世界的消息、知识,是事物的一种普遍属性。
4.索引将文献中具有检索意义的事项(可以是人名、地名、词语、概念、或其他事项)按照一定方式有序编排起来,以供检索的工具书。
5.倒排文档倒排文档就是把记录中一切可检字段或属性值抽出,按某种顺序重新加以组织后所得到的一种文档.倒排档从主文档中派生出来,所以,又叫做辅助文档.6.信息检索广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。
狭义的信息检索是指从信息集合中找到所需信息的过程。
7.信息素养信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。
8.信息意识信息意识又称信息观念,是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收的敏感性。
计算机信息检索
计算机信息检索一、名词解释1、信息资源:广义信息资源是指信息和与操作信息有关的物理设施、人力、机构、资金和运行机制等的总称。
狭义的信息资源是指信息本身极其载体的集合,也就是我们常说的信息源。
2、信息检索:从广义上理解,信息检索是指将信息按一定方式组织和储存起来,并根据信息用户的需要找出有关信息的过程。
所以它通常被称为“信息存储于检索”。
狭义的信息检索是指广义的信息检索的后半个过程,即从信息集合中找出所需要信息的过程,相当于人们所说的信息查检等。
3、搜索引擎:是指以一定的策略搜集互联网上的信息,在对信息进行和处理后,为用户提供检索服务的系统。
4、专利文献:是实行专利制度的国家,在接受申请和审批发明过程中形成的有关出版物的总称。
5、科技报告:也称技术报告或研究报告,它是科学研究工作和开发调查工作成果的记录或正式报告,这是一种典型的机关团体出版物。
二、填空题1.信息,物质和能量在客观世界中具有同等的重要性。
2.按信息检索的手段划分,信息检索可以分为传统信息检索和现代信息检索。
3.常用的逻辑运算符有and,or和not。
4.文献的三要素是知识,记录,载体。
5.搜索引擎分为全文搜索引擎、目录索引搜索引擎和元搜索引擎。
KI的中文全称是中国期刊网7.在CNKI检索系统中,如果排序方式选择“日期”,则发表日期最近的排在前面8.检索“潜艇中的非潜艇”,表达式可以写为潜艇not核潜艇9.计算机检索系统由硬件,软件和信息数据库三部分构成10.检索“打印机驱动程序”,表达式可以写为打印机and驱动三、简答题1、信息指示及文献之间的关系(第10页)2、全文型数据库的特点(第58页)3、“超星电子图书管“收藏资源的特点(第152—154页)4、“万字数字化期刊”收藏资源的特点(第121页)5、SCI,EI,SSCI的含义(第162—167)(有时间的同学可以再看一下26页的文献级次、44页的文献分类、59页的internet信息常用获取方式)。
文献信息检索名词解释
文献信息检索名词解释文献信息检索是一种从各种文献资源中查找和检索相关信息的方法。
它是建立在不同类型的文献资源之上,以发现、收集、组织、索引和利用这些资源中的有价值信息的过程。
文献信息检索是一种有效的获取信息的方法,可以帮助用户从报纸、杂志、图书、网络等文献资源中搜索有用信息。
文献信息检索包含以下几个方面:一是检索的资源类型;二是文献检索语言;第三是检索的文献资源;第四是检索的技术、政策、方法和工具;第五是检索结果分析和评价。
首先,关于检索的资源类型,根据文献检索的目的,可将文献资源分为以下几类:一是学术期刊;二是硕士、博士论文;三是报纸;四是图书;五是网络文献资源。
其次,对文献检索语言有:一是简单检索、通配符检索、模糊检索等检索语言;二是自然语言检索语言;三是结构化检索语言,如张量检索语言、文档检索语言、信息检索模型等;四是非结构化检索语言,如双因素检索、索引检索等。
第三,关于检索的文献资源,主要包括国内外文献资源,如国内的图书馆检索系统、期刊文献数据库、网上检索系统等;国外的期刊文献数据库、书目数据库、图书馆网络服务等。
第四,检索的技术、政策、方法和工具,包括检索技术、检索政策、检索方法和检索工具。
检索技术包括简单检索、通配符检索、结构化检索语言、非结构化检索语言等;检索政策是指检索的组织形式和实施的规则政策;检索方法是指检索的步骤和过程,如信息检索,信息检索过程的设计,信息检索数据的收集,信息检索结果的评价等;检索工具是指检索时使用的制作系统,如检索引擎、在线检索系统、聊天机器人等。
最后,关于检索结果分析和评价。
检索的结果分析指的是对检索结果进行内容分析和提炼以及检索评价。
分析结果可以用来实现检索结果的改进,如对检索结果的条数、准确度、评价等进行检查,以确定检索的效果。
最后,检索结果分析和评价也会涉及到人工分析,以确定检索的有效性。
信息检索名词解释
《信息检索》名词解释[1] 信息答:答案:信息是指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动变化中所具有特征性的内容的总称。
[2] 信息检索答:答案:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程。
[3] 文献答案:文献就是用文字、图形、符号或声像、视频等技术手段记录知识信息的物质载体,或曰固化在物质载体上的知识信息。
[4] 检索语言答:即情报检索语言,是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。
[5] 检索工具答案:检索工具是指用以报导、存贮和查找文献线索的工具。
它是附有检索标识的某一范围文献条目的集合,是二次文献[6] 数据检索答案:数据检索是以数值或图表形式表示的数据为检索对象的信息检索。
数据检索是一种确定性检索。
[7] 事实检索答案:事实检索是以从文献中抽取的事项为检索内容的信息检索。
其检索对象既包括非数值信息,也包括一些数据信息。
事实检索是确定性检索。
[8] 索引答案:索引是从正文各文献条目中选出的词或代码的顺序表。
索引主要由检索标识和文献条目顺序号两部分组成。
灵活掌握检索工具索引的使用,是学会使用检索工具的实质。
[9] 计算机信息检索答:计算机信息检索是指利用计算机存储和检索信息。
具体地说,就是指人们在计算机或网络终端上使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,然后再由终端设备显示、打印的过程。
[10] 联机检索系统答:联机检索系统是由一台主机带多个终端的信息检索系统。
这种系统具有分时的操作能力,能够使许多相互独立的终端同时进行检索。
检索是以人机对话的方式进行的,用户在自己的终端上输入检索提问式,联机服务中心的计算机就可以立即处理用户的请求,在数据库中查找符合用户提问的数据,并将检索结果回送至用户的检索终端上。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。
狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。
相当于我们所说的信息查询(information search)。
2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。
如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。
其主要特点是内容新颖,但不成熟,不公开交流,难以获得。
3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。
如期刊论文、科技报告、专利说明书、会议论文、学位论文等。
体现创作性。
其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。
4)二次文献(Secondary Document):就是检索工具。
是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。
如文摘,目录、索引等。
它有存贮、检索、报道的功能。
体现高度的浓缩性。
其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。
二次文献具有汇集性、工具性、综合性、交流性等特点。
5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。
三次文献是情报研究的产物和成果。
具有很强的的综合性。
总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。
6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。
而后三种文献是一个从分散的原始文献到系统化、密集化的过程。
7)一般来说,一次文献是基础,是检索利用的对象。
二次文献是检索一次文献的工具,也称之为检索工具。
三次文献是一次文献内容的高度浓缩,也是我们利用的一种重要资源。
8)(1)图书(book)9) 凡篇幅达48页以上并构成一个书目单元的文献称为图书(Book)。
图书阅读量占到10%-14%。
10)特点:系统、全面、成熟,出版形式比较固定,但出版周期长,传递情报速度比较慢。
11)(2)期刊(periodical,journal or magazine)特点:出版数量大,周期短,内容新颖,能迅速反映国内外的各种学科专业的水平和动向。
占阅读量的65%。
期刊分为:月刊(monthly)、双月刊(bimonthly)、季刊(quarterly)、年刊(annuals)。
12)1)学术性、技术性刊物,是科技期刊的核心部分。
刊名一般为:Acta(学报)、Journals(杂志)、annals(纪事)、Bulletin(通报)、Transactions(汇刊)、Proceedings(会刊)、Review(评论)、Progress;Advances in ...(进展)等。
13)2)快报型。
Communication(通讯)、letters(通讯)、bulletin等。
14)3)消息性(newsy journals)。
news(新闻)、news letters等。
iv.资料性(data journals)。
data、event等。
15)核心期刊:《中文核心期刊要目总览》(2000)指出:“某学科(或专业或专题)的核心期刊是指该学科所涉及的期刊中,刊载论文较多的(信息量较大的),论文学术水平较高的,并能反映本学科最新研究成果及本学科前沿研究状况和发展趋势的,较受该学科读者重视的期刊”。
这一定义从信息量、学术水平和读者三个方面对核心期刊进行较为全面的描述,但现实的核心期刊是并非这样,而是有很大出人。
16)情报专家研究,认为在本学科专业中,20%的期刊占据了80%以上的有关信息,这就是核心期刊17)(3)科技报告(science&technical report)18) 指各学术团体、科研机构、大学研究所的研究报告及其研究过程中的真实记录。
它的特点:内容详尽、专深,能代表一个国家的研究水平,特别是一些新兴学科和尖端科学的研究成果往往首先在科技报告中反映出来。
理论性强,数据可靠,但保密性强,难以获取。
19)(4)会议文献(conference document)国内外各种学术团体召开的专业会议上发表的论文与报告。
特点:学术性强,内容比较新颖,通常代表着一门学科的最新研究成果。
20)(5)专利文献(patent)21)指发明人向政府部门(专利局)递交的、说明自己的创造的技术文件,同时也是实现发明所有权的法律性文件。
专利文献包括专利说明书、专利公报(摘要)、商标、设计公报以及检索专利的工具等。
具有技术性、新颖性、独创性、实用性等特征,是重要的技术经济情报来源。
22)类型:发明专利、实用新型专利和外观设计专利三种特点:(1)排他性或独占性(2)自成体系(3)时效性。
(4)相关性23)(6)标准文献(standard literature)24) 标准是对产品、工程和管理的质量、规格、程序、方法所做的规定。
一般由有主管部门颁布,是从事生产、管理的一种共同依据和准则,包括标准(Standard)、规范(Specification)、技术要求(Requirement) 标准文献的特点约束性、适用性、统一性、可靠性、协调性、时效性。
25)(7)学位论文(dissertation)学位论文是指高等学校或研究机构的学生为取得学位,在导师的指导下完成的科学研究、科学试验成果的书面报告。
它具有选题新颖、引用材料广泛、阐述系统、论证详细的特点。
按授予学位的级别不同,分为学士学位论文、硕士学位论文、博士学位论文。
26)检索词、检索式、检索策略(第四章详细介绍)检索词是用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录。
检索式也称检索提问式,是要求系统执行的检索语句。
简单的检索式由一个检索词和一个字段名构成,复杂的检索式由多个检索词和字段名通过关系算符连接而成。
如:要利用英文搜索引擎查找网络信息检索方面的资料,检索式为(Web OR Internet OR WWW) AND (Search* OR Retrieval*)。
27)检索策略:所谓检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、学科领域、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以及查找步骤等。
也就是为满足信息需求所制定的一系列检索方案28)5)检中结果、查全率、查准率(第四章详细介绍)检中结果又称检索结果集,是数据库中满足(检索式(即符合检索条件)的那些记录的集合查全率:是指检出文献中合乎需要的文献数量占数据库中存在的合乎该需要的所有文献的比例查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例29)2、信息检索的类型:(1)根据检索手段的不同,分为手工检索、计算机检索(光盘检索、联机检索和网络检索)(2)根据检索对象、形式的不同,分为文献型信息检索、数据型信息检索、事实型信息检索。
30)文献型信息检索(Document Retrieval):以文献(包括题录、文摘)为检索对象的检索。
凡是查找某一主题、时代、地区、著者、文种的有关文献,以及回答这些文献的出处和收藏处所等,都属于文献型信息检索的范畴。
完成文献型信息检索主要借助于各种书目型数据库。
31)数据型信息检索(Data Retrieval):以数值或数据为对象的一种检索,包括文献中的某一数据、公式、图表,以及某一物质的化学分子式等,数据检索分为数值型与非数值型。
完成数据型信息检索主要借助于各种数值数据库和统计数据库。
32)事实型信息检索(Fact Retrieval):以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索,其检索结果主要是客观事实或为说明事实而提供的相关资料。
如:2001年7月通过的奥运会主办城市的结果与过程。
完成事实型信息检索主要借助于各种指南数据库和全文数据库。
33)4、网络信息检索的发展趋势智能化可视化简单化多样化个性化商业化34)(1)智能化智能化是网络信息检索未来主要的发展方向。
智能检索是基于自然语言的检索形式,机器根据用户所提供的以自然语言表述的检索要求进行分析,而后形成检索策略进行搜索。
目前已有一些搜索引擎支持智能检索,但其智能化程度不高。
而近年来internet上不断涌现的人工智能产品,如智能搜索引擎、智能浏览器、智能代理、知识共享智能体等,都将提高网络信息检索的智能化程度35)(2)可视化可视化的优点在于图象的表达方式生动、形象、准确、效果更高,能从多角度揭示,而纯文字的表达方式是模糊、一维的。
信息检索中的可视化是将数据库中不可见的语义关系用图象形式可视化显示并表达用户检索过程。
在可视化空间展示的信息可以看见它们是二维的或三维的。
(信息检索中,实现语义控制是人们的理想,而现实的信息检索是基于“字符串”的检索、匹配与表达)36)(3)简单化未来家用电脑将朝着智能化、网络化、人性化和绿色环保的方向发展;操作系统的用户友好性将不断增加,如微软和苹果公司都在致力于操作系统网络化研究,以便使其中的任意应用程序都能“连接”进行“网络检索”,并与网络“交互”;各搜索引擎检索界面更加“傻瓜化”,使用户学习和进行网络信息检索更加容易;网上自动标引、自动文摘、自动跟踪、自动漫游、机器翻译、多媒体技术、动态链技术、数据挖掘和信息推拉等技术逐步发展、完善,会越来越方便用户及时准确的检索信息。
这些硬件与软件技术的发展都有利于网络信息检索的简单化。
37)(4)多样化多样化首先表现在可以检索的信息形态多样化,如文本、声音、图象、动画。
多样化的第二个表现是检索工具向多国化、多语种化方向发展。
AltaVista不仅提供了包括中文在内的25种语言检索系统,还提供仂种拉丁语系的语言与英语互译的功能。
Google,Yahoo!,HotBot,Lycos《Excite和WebCrawler都在世界各地设立了分支机构,使检索服务本地化;并增加服务器,分流用户,提高上网查询速度。
多样化的第三个表现是网上检索工具的的服务多元化,为用户提供全方位的服务。
(不是单纯的检索工具) 38)(5)个性化个性化指各网站贯彻以用户为中心的理念,注重内容的特色化和注重个性化的服务。
39)(6)商业化网络检索系统不再仅仅是一种检索工具,而且成为一项产业,它的商业利益成为推动系统完善和扩展的主要动力,网络信息的检索与利用由公共性转向商业化Infoseek是第一个对网络信息检索收费的检索工具,但由于它在收费的同时未能为用户提供特殊的高质量信息服务,不久便自生自灭了。