信息检索名词解释与简答 答案
名词解释(信息检索2017)
1、信息检索:将信息按一定的方式组织和存储起来,并根据用户需要找出相关文献的过程。
其中包括存与取两个环节,存即信息存储,是对信息进行收集、标引、描述、及组织,并对其特征化表达集加以整序,形成信息检索工具或检索系统的过程。
取即信息查找,是通过某种查询机制从检索工具或检索系统中查找出用户所需的特定信息或获取其线索的过程。
2、查全率:是指检出的相关文献量与检索系统中相关文献总量的比率,是衡量信息检索系统检出相关文献能力的尺度,可用下面的公式表示:查全率=(检出相关文献量/系统中相关文献总量)*100%3、查准率:是指检出的相关文献量与检出文献总量的比率,是衡量信息检索系统精确度的尺度,可用以下公式表示:查准率=(检出相关文献量/检出文献总量)*100%4、漏检率:是指漏检相关文献量与在检索系统中相关文献总量的比率,是衡量信息检索系统漏检文献的尺度,可用下面的公式表示:漏检率=(漏检相关文献量/系统中相关文献总量)*100%5、跨库检索:可同时检索多个平台上的多种资源,输入一个检索式,便可以看到多个数据库的查询结果。
6、单库检索:在选定的单一数据库中进行检索。
7、经典论文优先:被引用数比较多,或者文章发表在档次比较高的杂志上等经典的、有价值的文献优先排在前面。
8、相关度优先:和查询的条件内容最相关的文献优先排在前面。
9、最新论文优先:发表时间比较新的文献优先排在前面。
10、精确匹配:检索结果中包含与检索词完全相同的词语11、模糊匹配:检索结果包含检索词或检索词中的词素12、顺查法是根据有关课题的起始年代利用选定的检索工具由远及近的进行逐年查找。
13、倒查法从最新时间查找起,直到满足检索要求为止。
14、抽查法是针对有关学科的发展特点,抽查某些特定时期的文献信息。
15、二次检索是指在前一次检索结果的范围内,继续进行检索。
16、定题检索SDI (selective dissemination of information)查找有关特定主题最新信息的检索。
信息检索答案
一、名词解释(5x4=20分)1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。
检索中,计算机会将所有含有相同部分标识的记录全部检索出来。
截词符一般用“?”或“*”表示,但不同的数据库中有所差别。
2.信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。
4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。
5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。
二、简答(5x6=30分)1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。
(1)国内外的学位论文数据库包括索引与摘要数据库和全文数据库,如CALIS的《学位论文库》,万方数据资源系统《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDD(ProQuest Digital Dissertations),美国学位论文网络数字图书馆NDLTD (Networked Digital Library of Thesis and Dissertations)等。
(2)会议论文数据库包括:会议论文索引与摘要,如CALIS会议论文数据库,万方数据资源系统《中国学术会议论文数据库》,OCLC会议数据库——《在会议上提交的文章索引》(Papers First),《会议出版物索引》(Proceedings),Web of Knowledge的会议录引文索引CPCI(Conference Proceedings Citation Index)。
2.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。
信息检索
一、名词解释1知识:知识是人类对自然界、人类社会;2情报:情报是人们在一定的时间内为一定的目的而传;3文献:凡属于人类的知识,用文字、图形、符号、声;4核心期刊:是科技期刊中一类特定的期刊,指刊登某;5专利:专利是指国家以法律形式授予发明人或其权利;20.以下哪种检索刊物属于文摘型检索刊?(C国外;21.下面哪项工具是不属于书目检索范畴?(B《中;22.下列一、名词解释 1知识:知识是人类对自然界、人类社会中各种现象、规律的信息反映进行思维分析,加工提炼,经过系统化、理论化的过程。
系统化、理论化的信息就称为知识。
2情报:情报是人们在一定的时间内为一定的目的而传递有使用价值的知识或信息。
情报具有保密性、时效性、传递性的特点。
3文献:凡属于人类的知识,用文字、图形、符号、声频、视频等手段记录保存下来,并用以交流传播的一切物质形态的载体,统称为文献。
4核心期刊:是科技期刊中一类特定的期刊,指刊登某学科文献密度大、载文率、被引用率及利用率较高,深受本学科专家和读者关注的期刊。
5专利:专利是指国家以法律形式授予发明人或其权利继受人在法定期限内对其发明创造享有的专有权。
录型检索工具)。
20.以下哪种检索刊物属于文摘型检索刊?( C国外医学)21.下面哪项工具是不属于书目检索范畴?( B《中国期刊网全文专题数据库》)22.下列哪项不是科技文献的特点?( C文献发表的时间缩短)[A.日益向多元化发展B.交流传播速度加快C.文献发表的时间缩短D.内容交叉渗透,分散重复]23.通过文献后面列出的一系列参考文献条目的指引,来查找到那些参考文献的原文,这种检索方法属于(A追溯法)。
[24.下面对查全率和查准率描述正确的是( D查准率和查全率之间存在互逆关系)。
25.20世纪(A 50年代)中期,我国开始出版医学索引刊物。
26.建国前,由于我国科学技术和科技情报工作非常落后,导致文献检索刊物出现较晚,种类少,直到( B 通过SCI引文索引,按著者姓名字顺来获得,下列所示选项为该著者的姓名,(A MA DL )符合SCI的著录规则。
信息检索名词解释
1)信息检索(information retrieval) 是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
所以,它的全称又叫信息存储与检索(information storage and retrieval), 这是广义的信息检索。
狭义的信息检索则仅指该过程的后一步,即从信息集合中找出所需要信息的过程。
相当于我们所说的信息查询(information search)。
2)零次文献:也叫灰色文献,未经公开发表或未交流于社会的文献。
如私人笔记,设计草图、实验记录、文章草稿、会议记录、书信文书、以及档案等。
其主要特点是内容新颖,但不成熟,不公开交流,难以获得。
3)一次文献(Primary Document): 以著者本人的研究或研制成果为依据而创作或撰写的文献,习惯上称做原始文献。
如期刊论文、科技报告、专利说明书、会议论文、学位论文等。
体现创作性。
其主要特点是内容新颖丰富,叙述具体详尽,参考价值大,但数量庞大、分散。
4)二次文献(Secondary Document):就是检索工具。
是将大量分散的无组织的一次文献经浓缩,整序的加工整理,编辑成目录、题录、文摘、索引等检索工具或数据库。
如文摘,目录、索引等。
它有存贮、检索、报道的功能。
体现高度的浓缩性。
其主要功能是检索、通报、控制一次文献,帮助人们在较少时间内获得较多的文献信息。
二次文献具有汇集性、工具性、综合性、交流性等特点。
5)三次文献(Tertiary Document):在一、二次文献的基础上,经过综合分析而编写出来的文献,如专题述评、动态综述、学科年度总结,进展报告以及数据手册、百科全书等参考工具书。
三次文献是情报研究的产物和成果。
具有很强的的综合性。
总之,一次文献(创造性),二次文献(有序化),三次文献(高度浓缩,提炼,再创造)。
6)以上四个级别的文献中,零次文献由于没有进入出版、发行和流通这些渠道,收集利用十分困难,一般不作为我们利用的文献类型。
信息检索 名词解释
一、名词解释信息检索:信息检索最普通的理解就是信息查找。
它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。
信息检索又叫做信息存储与检索(information storage and retri)。
信息检索可以分为事实检索、数据检索、文献检索。
特性检索:也称强相关性检索,强调向用户提供高度对口的信息。
强调检索的准确性,对检索结果的数量不作要求。
族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。
注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。
特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。
其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。
OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。
参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。
年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。
手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。
名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。
搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。
图书:论述或介绍某一领域知识的出版物。
期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。
信息检索名词解释与简答 答案
●名词解释●信息检索●广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的过程和技术。
狭义的信息检索是指从信息集合中找到所需信息的过程。
●信息素养●信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。
●信息意识●信息意识又称信息观念,是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收的敏感性。
●信息能力●是人们有效快速的获取、加工、存储、利用和传递信息的能力。
●信息道德●是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律法规和行为准则。
●零次文献●是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。
●一次文献●指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。
●二次文献●是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。
如书目、索引、文摘、题录、简介等。
●三次文献●三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。
●主题词●是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,作为信息存储和检索依据的一种检索语言。
●关键词●关键词是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。
●叙词●所谓叙词,是指从自然语言中优选出来并经过规范化处理的术语,又称主题词。
●查全率●查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。
●查全率=【检出相关文献量/文献库内相关文献总量】×100%●查准率●查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。
信息检索2答案
一、名词解释(5x4=20分)1.截词检索:是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。
检索中,计算机会将所有含有相同部分标识的记录全部检索出来。
截词符一般用“?”或“*”表示,但不同的数据库中有所差别。
2.信息检索:信息检索(Information Retrieval)是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
3.查准率:是指检出文献中合乎需要的文献数量占检出文献全部数量的比例。
4.查全率:是指检出的文献数量占数据库中全部相关文献数量的比例。
5.引文索引:是一种将科技期刊、专刊、专题丛书等文献资料所发表的论文后所附的参考文献的作者、题目、出处等项目,按照引证与被引证的关系进行排列而编制的索引。
二、简答(5x6=30分)1.查找国内外学位与会议论文分别有哪些数据库?每类中分别举2个英文数据库(包括全称、简称与中译)和1个中文数据库。
(1)国内外的学位论文数据库包括索引与摘要数据库和全文数据库,如CALIS的《学位论文库》,万方数据资源系统《中国学位论文数据库》,CNKI的《优秀硕博士论文数据库》,美国博硕士论文库PQDD(ProQuest Digital Dissertations),美国学位论文网络数字图书馆NDLTD (Networked Digital Library of Thesis and Dissertations)等。
(2)会议论文数据库包括:会议论文索引与摘要,如CALIS会议论文数据库,万方数据资源系统《中国学术会议论文数据库》,OCLC会议数据库——《在会议上提交的文章索引》(Papers First),《会议出版物索引》(Proceedings),Web of Knowledge的会议录引文索引CPCI(Conference Proceedings Citation Index)。
2.布尔逻辑检索的主要运算符有哪些?它们各代表什么含义?请分别举一例说明。
信息检索文字题复习提纲(名词解释、举例、简答、论述)
信息检索文字题复习提纲(名词解释、举例、简答、论述)信息检索复习题1、信息检索的原理是什么?(1)广义信息检索原理:在存储过程中,专门负责信息检索系统和数据库建立的人从各种各样的信息资源中,收集有用的信息,对有用的信息进行主题内容的分析,找出能够全面、准确表达主题内容的概念,借助于检索语言(通常是检索词表)把分析出来的概念转换成检索系统所采用的词语,或者直接使用自然语言,再按照一定的规则和方式将这些有用的信息组织成可供件所用的数据库,并存储在一定的介质上。
(2)狭义信息检索原理:狭义信息检索的原理就是广义信息检索中信息检索过程的那部分原理。
信息检索基本原理中的核心部分就是用户所使用的检索词或者由检索词和运算符所组成的检索式与数据库中的检索词及其逻辑关系之间的比较和匹配机理。
两者相匹配的信息被检索出来(命中),不相匹配的信息被拒绝。
*2、信息检索有哪些工具?按处理信息手段分:手工检索工具、计算机检索工具。
按著录方式分:目录型(国家书目、馆藏书目、联合书目、专题书目)、题录型、文摘型(指示性、报道性、评论性)、索引型(主题索引、分类索引、著者索引)。
3、信息检索的途径和方法有哪些?(1)信息检索途径分类途径:按学科分类体系来检索文献信息。
从分类途径检索文献信息,主要是利用分类目录和分类索引。
它以知识体系为中心,比较能体现学科系统性,反映学科与事物的隶属、派生与平行关系,便于从学科所属的范围来查找文献资料,并可起到“触类旁通”的作用。
题名途径:是根据文献名称包括书名、刊名、篇名等来检索文献的途径。
一些检索系统中提供题名字顺检索途径,如书名目录、刊名目录、篇名索引等。
(2)信息检索方法追溯法:也称引文法,是利用综述或已经掌握文献所附的引文注释和参考文献目录作为线索逐一追查原文,再利用这些原文所附的参考文献目录逐一扩检,产生滚雪球效果。
直接法:又称常用法,是直接利用检索工具检索文献的方法。
它又分为顺查法(由远及近)、倒查法(由近及远)和抽查法(重点时间段进行)。
信息检索
信息检索一、名词解释:1.信息检索:狭义的信息检索概念是指在信息的海洋中选取符合需要的信息的过程称为信息检索。
而如今发展为包括信息的储存、组织、查询、提取等多个工作过程,所以广义的信息检索又称为信息储存与检索。
2.CALIS:全称为中国高等教育文献保障系统(china academic library&information system),其联合目录数据库始建于1997年。
其资源类型包括原文、图片、阴文、文摘、馆藏、相关文献等;育种覆盖中文、英语和日语。
3.引文索引:利用文献引证关系检索相关文献的索引。
引文索引以某一文献(包括作者、题名、发表年份、出处等基本数据)作为标目,标目下著录引用或参考过该文献的全部文献及出处。
它主要供用户从被引文献查找引用文献。
4.截词检索:截词检索是预防漏检提高查全率的一种常用检索技术,大多数系统都提供截词检索的功能。
截词是指在检索词的合适位置进行截断,然后使用截词符进行处理,这样既可节省输入的字符数目,又可达到较高的查全率。
尤其在西文检索系统中,使用截词符处理自由词,对提高查全率的效果非常显著。
5.科技查新:科技查新是文献检索和情报调研相结合的情报研究工作,它以文献为基础,以文献检索和情报调研为手段,以检出结果为依据,通过综合分析,对查新项目的新颖性进行情报学审查,写出有依据、有分析、有对比、有结论的查新报告。
二、填空1.文献按内容层次可分为:一次文献、二次文献和三次文献。
2.计算机信息技术中常用的检索技术是:布尔逻辑检索、截词检索、限制检索、词位检索。
3.信息素质的内涵包括:信息意识、信息技能和信息道德。
4.SCI是什么的缩写:科学引文索引(science citation index)。
5.位置算符W:这个算符表示其两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序不可以颠倒,3N:此算符两侧的检索词之间允许间隔最多3个其他词或字母,且两者词序可颠倒。
信息检索题目答案
信息检索题目答案一、名词解释0、文献及其要素“文献”是泛指“有历史价值或参考价值的图书资料。
”要素:1、构成文献内核的信息、知识、数据、事实2、载体信息、知识、数据、事实的物质载体。
3、记录信息、知识、数据、事实的符号系统。
1、专利文献专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。
2、三大检索系统三大检索系统是:SCI(《科学引文索引》,英文全称为Science Citation Index)是美国科学情报研究所(Institute for Scientific Information,简称ISI)出版的一部世界著名的期刊文献检索工具,其出版形式包括印刷版期刊和光盘版及联机数据库,现在还发行了互联网上Web 版数据库。
EI是美国《工程索引》(TheEngineeringIndex)的简称。
EI创刊于1884年,由美国工程情报公司(EngineeringInformationCo.)出版发行。
EI是工程技术领域内的一部综合性检索工具,报道内容包括:电类、自动控制类、动力、机械、仪表、材料科学、农业、生物工程、数理、医学、化工、食品、计算机、能源、地质、环境等学科。
ISTP是IndextoScientific&TechnicalProceedings的缩写,是美国科学情报研究所的网络数据库WebofScienceProceedings中两个数据库(ISTP和ISSHP)之一。
专门收录世界各种重要的自然科学及技术方面的会议,包括一般性会议、座谈会、研究会、讨论会、发表会等的会议文献,涉及学科基本与SCI相同。
(自己总结一下)3、二次文献二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段.4、受控语言受控语言是一种规范化的人工语言,包括具有较强族性检索功能的分类语言和具有较强特性检索功能的主题语言。
计算机信息检索
一.名词解释1.信息检索:广义来说,指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程,包括“存”和“取”两个基本环节;狭义理解,一般只涉及“取”,信息检索也可称为“信息查询”或“信息查找”。
2.联机信息检索:指用户利用检索系统网络的终端设备,通过通信线路,运用一些特定的指令和检索策略与世界上的信息检索系统,进行质检的人机对话,从检索系统的数据库中查找出用户所需要的特定信息,并将检索结果与过程下载,显示和打印出来的过程。
3.CBR:基于内容的检索,指根据多媒体对象的听、视觉特征及其中蕴含的内容和语义特征进行检索,并希望能够借助于模式识别、语音识别、图像理解等相关领域的研究成果,对多媒体数据的听、视觉特征和语义特征进行自动(半自动)的分析、表达和组织。
4.网络信息源:指所有以电子数据的形式把文字、图像、声音、动画等多种形式的信息存贮在光、磁等非纸质介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。
5.搜索引擎:搜索引擎有广义与狭义之分。
广义的搜索引擎泛指网络上提供信息检索服务的攻击或系统。
狭义的搜索引擎主要是指利用网络自动搜索软件对INTERNET(主要是WEB)网络资源进行收集、组织并提供检索服务的一类信息服务系统。
6.URL:统一资源定位符(Uniform Resource Locator,缩写为URL)是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。
互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。
7. 顺排/倒排文档:文档的概念是指数据库内容的组织形式。
一般地说,一个数据库至少包括一个顺排文档和一个倒排文档。
(1)顺排档,也称为主文档、引文文档,它是按记录存取号的大小顺序排列记录而成的文档。
文档越是新,记录存入文档的时间越是晚,记录的存取号就越大。
(2)倒排挡,是指把数据库中记录的一切可检字段或属性值(称检索标识,如著者,主题词等,不包括存取号)抽出,按某种顺序(字母或数字顺序)重新加以组织后得到的特征标识文档。
信息检索名词解释
信息检索名词解释信息检索(Information retrieval,IR)是指从大规模数据集中找出与用户需求相关的信息的过程。
以下是一些与信息检索相关的重要名词解释:1. 文档(Document):信息检索中的基本单位,可以是文本、图片、音频、视频等形式的数据。
2. 查询(Query):用户提出的一个或多个关键词或短语,用于描述其信息需求。
3. 检索(Retrieval):在信息检索系统中,通过匹配查询和文档之间的相关性,找出最相关的文档。
4. 相关性(Relevance):衡量查询和文档之间匹配程度的度量,用于判断文档是否与查询相关。
5. 评价(Evaluation):对信息检索系统性能进行定量和定性评估的过程,通常通过与人工判定相关性的比较来衡量。
6. 召回率(Recall):信息检索系统检索到的相关文档数占所有相关文档数的比例,衡量系统的查全性能。
7. 精确率(Precision):信息检索系统检索到的相关文档数占所有检索到的文档数的比例,衡量系统的查准性能。
8. F-度量(F-Measure):综合考虑召回率和精确率的度量指标,通过调和平均计算,可以较好地衡量系统的全面性和准确性。
9. 布尔模型(Boolean model):一种基本的信息检索模型,根据查询中的布尔运算符(AND、OR、NOT)对文档进行匹配。
10. 向量空间模型(Vector space model):一种常用的信息检索模型,将文档和查询表示为向量,在向量空间中计算它们之间的相似度。
11. 词语权重(Term weight):表示一个词语在文档中的重要性的权重,常用的计算方法有词频、逆文档频率等。
12. 倒排索引(Inverted index):一种常用的索引结构,以词语为关键字,记录词语出现在哪些文档中,加快检索速度。
13. 停用词(Stop word):在信息检索中,指那些对判定一个文档是否与查询相关没有帮助的常见词语,如“a”、“and”、“the”等。
信息检索名词解释
信息检索名词解释信息检索是一种通过计算机技术和算法,从大量的信息资源中获取用户所需信息的过程。
在信息爆炸的时代,人们对于获取和处理信息的需求日益增长,信息检索成为了重要的工具和技术。
一、信息检索的定义信息检索(Information Retrieval,简称IR)是指根据用户的需求,在大规模、不断增长的信息资源中进行搜索和获取需要的信息的过程。
它涉及到索引构建、搜索引擎、搜索算法等方面的内容。
二、信息检索的过程信息检索的过程主要包括以下几个步骤:1. 需求分析:用户明确自己所需的信息,并将其转化为一个或多个查询的形式。
2. 数据预处理:对于待检索的信息资源进行预处理,包括数据清洗、分词、去除停用词等操作,以便更好地进行索引构建和检索。
3. 索引构建:根据待检索的信息资源,构建相应的索引结构,以便加快后续的检索速度和准确性。
常用的索引结构包括倒排索引和正排索引。
4. 搜索算法:通过使用不同的搜索算法,按照一定的匹配度和排名准则,从索引中检索出与用户需求相关的信息。
5. 结果展示:将检索到的信息按照一定的排版规则和展示方式,以用户可读性较高的形式展示出来,帮助用户判断和选择。
三、信息检索的技术与应用1. 倒排索引技术:倒排索引是信息检索中常用的索引结构,通过将词项与文档的对应关系进行倒置存储,提高了检索效率。
倒排索引能够快速定位到包含指定词项的文档,是现代搜索引擎的核心技术之一。
2. 自然语言处理:信息检索中的文本数据通常需要进行自然语言处理,包括分词、词性标注、词义消歧等操作。
这些操作可以帮助提高检索的准确性和召回率。
3. 搜索引擎:搜索引擎是信息检索的重要应用,能够在互联网上搜索并展示与用户需求相关的信息。
常见的搜索引擎包括谷歌、百度等。
搜索引擎通过建立庞大的索引库和使用高效的检索算法,为用户提供便捷的信息检索服务。
4. 推荐系统:信息检索还常常与推荐系统结合,根据用户的历史行为和兴趣,为用户推荐可能感兴趣的信息资源。
信息检索名词解释
一.名词解释1,信息:物质存在方式和运动状态的反应,在发生源和吸收源之间,当发生源发出的信号被吸收源所理解,信号就成为信息。
2,体系分类法:体系分类法是一种直接体现知识分类的等级概念标识系统,它对概括文献信息内容及其外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成。
它提供某学科、专业的集中文献。
3,关键词:是指从文献的标题、文摘以及正文中抽取的对表达文献主题起关键作用且具有检索意义的词语。
关键词是标示文献关键主题内容。
4,TCP(传输控制协议):将文本分成包(数据包),再加上特别的信息,是数据可以准确无误地发送到接收方的计算机上。
5,IP(网际协议):在数据包上标有特别的信息(接收主机的IP地址)到目的地后,系统自动将IP地址去掉,再利用TCP检查数据包害是否完整,如有去损则要求发送方重新发送被丢损的数据包。
6,FTP(文件传输协议):它允许两台因特网主机相互传送/拷贝文件,可以把自己计算机上的某台计算机上的文件拷贝到自己的计算机上。
7,《馆藏目录》:图书馆或信息资料部门所收藏的全部书刊的统计目录。
8,《联合目录》:汇总某地区或若干地区甚至是全国图书馆或其他收藏单位所藏的全部书刊的统计目录。
9,信息检索:从大量的文献中查询与信息提问所指定的课题(对象)有关的文献,或者是包括用户所需事实与消息的文献过程。
10,搜索引擎:是一种利用网络自动搜索技术,对因特网各种资源进行收集和标引,建立网页数据库,并为检索者提供网络信息检索的工具。
二,选择题1,b/(a+b)x100%=(D)(a值为检出的相关文献,b值为检出的不相关文献) A,查全率 B,漏检率 C,查准率 D,误检率2,(B)研究人员对某一专题研究的过程中根据进展情况撰写的正式的报告。
A,会议文献 B,科技报告 C,期刊 D,学位论文3,( C )是通过文章后面所附参考文献目录的线索查找所需信息的一种方法。
A,直接查找法 B,间接查找法 C,引文追溯法 D,综合法4,下面不属于专利的三大特性的是(D)A,独占性 B,地域性 C,时效性 D,完整性 A,B,C,D5,( B )是指各国政府部门及其设立的专门机构发表的文献。
信息检索简答题答案
信息检索简答题答案第一篇:信息检索简答题答案信息检索简答题答案1.1 什么是信息,信息具有哪些基本特点。
答:信息就是事物存在的方式和运动状态及其规律的表征,是事物的一种普遍属性。
信息的基本特点:1.客观性2.时效性3.传递性4.共享性1.2 计算机信息检索有哪些基本特点答:1.检索速度快2.检索途径多3.更新快4.资源共享5.检索更方便、灵活6.检索结果可直接输出3.1Internet信息资源有哪些基本特点答:1.信息源丰富多样2.以多媒体为信息表现形式3.信息交互性强4.信息开放性好5.信息组织的局部有序性与整体无序性3.2什么是搜索引擎?常见的搜索引擎有哪些?答:搜索引擎是指根据一定的策略,运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系统,常见的搜素引擎Google、雅虎、AltaVista、Alltheweb、Inktomi3.5为了提高检索效率,检索时应遵守哪些检索策略?答:1.对课题进行仔细分析,明确检索要求2.根据检索课题的要求、检索工具的特点等,选择检索工具3.选择检索途径和检索方法,确定检索词或检索式4.实施信息检索5.获取原始文献4.1运算符*和+的基本含义和作用是什么答:AND也可用*表示,是用来组配不同的概念的检索词,是一种概念相交和限定关系的组配。
其基本作用是对检索范围加以限定,逐步缩小检索范围,提高检索结果的查准率。
OR也可用+表示,是用来组配具有同义或同族概念的检索词。
其基本作用是扩大检索范围,增加命中文献量,提高文献的查全率。
5.1三大检索工具是什么各有什么特点答:1.SCI(科学引文索引)2.ISTP(科技会议录索引)3.EI(工程索引)科学引文索引:自然科学领域,基础理论学科方面的期刊文摘索引数据库,工程索引:主要收录工程技术领域的论文从索引的编排方式来看,SCI属于关系索引,同时兼具形式索引和类容索引的特征,ISTP和EI具有形式索引和类容索引的特征5.2简述SCI高级检索的基本过程答:7.1简述科技论文的常见形式答:学术论文、科技报告、专题研究论文、学位论文、简报综述、评论、设计计算、理论分析和理论推导 7.2科技论文由哪些部分组成答:科技论文一般由标题、作者、摘要、关键词、引言、材料与方法、结果、讨论、结论等部分组成。
计算机信息检索
计算机信息检索一、名词解释1、信息资源:广义信息资源是指信息和与操作信息有关的物理设施、人力、机构、资金和运行机制等的总称。
狭义的信息资源是指信息本身极其载体的集合,也就是我们常说的信息源。
2、信息检索:从广义上理解,信息检索是指将信息按一定方式组织和储存起来,并根据信息用户的需要找出有关信息的过程。
所以它通常被称为“信息存储于检索”。
狭义的信息检索是指广义的信息检索的后半个过程,即从信息集合中找出所需要信息的过程,相当于人们所说的信息查检等。
3、搜索引擎:是指以一定的策略搜集互联网上的信息,在对信息进行和处理后,为用户提供检索服务的系统。
4、专利文献:是实行专利制度的国家,在接受申请和审批发明过程中形成的有关出版物的总称。
5、科技报告:也称技术报告或研究报告,它是科学研究工作和开发调查工作成果的记录或正式报告,这是一种典型的机关团体出版物。
二、填空题1.信息,物质和能量在客观世界中具有同等的重要性。
2.按信息检索的手段划分,信息检索可以分为传统信息检索和现代信息检索。
3.常用的逻辑运算符有and,or和not。
4.文献的三要素是知识,记录,载体。
5.搜索引擎分为全文搜索引擎、目录索引搜索引擎和元搜索引擎。
KI的中文全称是中国期刊网7.在CNKI检索系统中,如果排序方式选择“日期”,则发表日期最近的排在前面8.检索“潜艇中的非潜艇”,表达式可以写为潜艇not核潜艇9.计算机检索系统由硬件,软件和信息数据库三部分构成10.检索“打印机驱动程序”,表达式可以写为打印机and驱动三、简答题1、信息指示及文献之间的关系(第10页)2、全文型数据库的特点(第58页)3、“超星电子图书管“收藏资源的特点(第152—154页)4、“万字数字化期刊”收藏资源的特点(第121页)5、SCI,EI,SSCI的含义(第162—167)(有时间的同学可以再看一下26页的文献级次、44页的文献分类、59页的internet信息常用获取方式)。
信息检索期末复习资料
信息检索一.名词解释1.索引(P150):索引是将书籍、期刊等文献所刊载的论文题目、作者,以及所讨论的或设计的学科主题、名词术语、所引用的参考文献等,根据一定的需要,经过分析分别摘录出来,注明其所在书刊的页码,按一定的原则和方法排列起来的一种检索工具。
2.回溯检查法:又称追溯法、引文法、引证法,是一种跟踪查找的方式。
即以文献后面所附的参考文献为线索,逐一追溯查找相关文献的方法。
通过回溯法所获得的文献有助于对课题的主题背景和立论依据等内容有更深的理解。
该方法获得文献针对性强、数量较多,在没有检索工具或检索工具不齐备的情况下,利用此法能够获得一些所需要的文献资料。
3.可视化:将数据库中不可见的语义关系以图像的形式可视化显示,并表达用户检索过程。
一个可视化的环境为用户展示更丰富、更直观的信息,一个透明的检索过程使检索更容易、更有效。
它包括检索过程的可视化和检索结果的可视化。
可视化信息检索技术缩短了用户理解信息的时间,提供了感觉和思考之间的有效反馈机制,它代表着信息检索的未来,将会取代以布尔逻辑为基础的、传统的信息检索系统。
4.自动标引:是指直接通过计算机的操作处理,自动实现赋予检索标志的活动。
分为自动主题标引和自动分类标引,即根据计算机内信息(标题、摘要或全文),借助算法自动给出反应主题内容的标引词和自动分配分类号。
5.全文扫描:是以从文本文档中找出与查询表示的字符串完全一致的部分为目的,检索结果返回包含查询字符串的文本及其位置的检索技术。
6.查全率:查全率是指从检索系统检出的与某课题相关的文献信息数量与检索系统中实际与该课题相关的文献信息总量之比。
对于数据库检索系统,查全率为检索出的款目数与数据库中满足用户检索式需求的款目数之比;而对于互联网信息检索系统来说,文献总量是很难计算的,甚至连估算都困难。
在这里人为因素的影响比较大。
相对查全率=(专业人员检出文献的数量数/全部实际检出文献集合并集中文献数量) *100%7.图像信息抽取:是指从数字图像中抽取包括基于文本的特征(说明,注释等关键词)和视觉特征或底层特征(颜色,文理,形状等),作为图像的特征描述,支持信息检索。
信息检索考试答案
一、情报:是人们在一定的时间内为一定的目的而传递有使用价值的知识或信息。
信息检索:是从大量相关信息中利用人—机系统等各种方法加以有序识别与组织以便及时找出用户所需部分信息的过程.族性检索:“族”为丛聚、集合、类别之义,族性检索是对具有某种共同性质或特征的众多事物、概念的检索。
关键词标引:使用非规范化的自然语言——关键词来表达文献或信息资源主题内容的过程。
搜索引擎:搜索引擎是以网页为著录单元,在Web中自动检索信息并将其自动索引到Web 服务器。
索引信息包括文档的地址,每个文档中单子出现的频率、位置等。
二、1.按组织方式分,信息检索有全文检索、超文本检索、超媒体检索。
2.信息检索策略有两种方式即手工检索和计算机检索。
3.表示主体的检索词有标题词、单元词、叙词、关键词。
4.常用逻辑运算符有:AND或*、OR或+、NOT或-5.信息检索工具常用的排验方法有字序法、类序法。
6.中国特有的工具书是类书、政书。
7.文献类型根据出版物载体的不同,主要划分为图书、期刊、研究报告、专利文献、学位论文、会议文献、标准文献、科技档案、产品技术资料、政府出版物、报纸、声像资料、电子出版物、网络出版物等。
三、1.信息检索的研究内容有哪些?答:检索理论研究、检索语言研究、数据库研究、著录法研究、检索系统研究、检索策略研究、检索服务研究。
2.数据库有哪些类型?答:传统数据库(情报数据库、图形数据库等);专门应用领域的数据库(统计数据库、工程数据库、空间数据库;新一代数据库(分布式数据库、多媒体数据库、面象对象数据库、实时数据库等)。
3.搜索引擎的类型有哪些?答:分类目录型、全文检索型、多元集成性、图像搜索型、智能搜索型。
四、1.试例说明传统检索型工具书和参考型工具书的使用。
检索型工具书有书目、索引、文摘、文献指南;参考型工具书有百科全书、类书、政书、年鉴、名录。
使用中要掌握各类工具书的收录范围、编制体例和使用方法。
2.如何利用检索工具查找历史类文献?考虑使用传统检索工具和网络检索工具。
信息检索名词解释
《信息检索》名词解释[1] 信息答:答案:信息是指应用文字、数据或信号等形式通过一定的传递和处理,来表现各种相互联系的客观事物在运动变化中所具有特征性的内容的总称。
[2] 信息检索答:答案:是指将信息按一定的方式组织和存储起来,并根据信息用户的需要找出有关的信息过程。
[3] 文献答案:文献就是用文字、图形、符号或声像、视频等技术手段记录知识信息的物质载体,或曰固化在物质载体上的知识信息。
[4] 检索语言答:即情报检索语言,是根据信息检索的需要创造出来的一种人工语言,是在文献检索领域中用来描述文献特征和表达信息检索提问的一种专用语言。
[5] 检索工具答案:检索工具是指用以报导、存贮和查找文献线索的工具。
它是附有检索标识的某一范围文献条目的集合,是二次文献[6] 数据检索答案:数据检索是以数值或图表形式表示的数据为检索对象的信息检索。
数据检索是一种确定性检索。
[7] 事实检索答案:事实检索是以从文献中抽取的事项为检索内容的信息检索。
其检索对象既包括非数值信息,也包括一些数据信息。
事实检索是确定性检索。
[8] 索引答案:索引是从正文各文献条目中选出的词或代码的顺序表。
索引主要由检索标识和文献条目顺序号两部分组成。
灵活掌握检索工具索引的使用,是学会使用检索工具的实质。
[9] 计算机信息检索答:计算机信息检索是指利用计算机存储和检索信息。
具体地说,就是指人们在计算机或网络终端上使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,然后再由终端设备显示、打印的过程。
[10] 联机检索系统答:联机检索系统是由一台主机带多个终端的信息检索系统。
这种系统具有分时的操作能力,能够使许多相互独立的终端同时进行检索。
检索是以人机对话的方式进行的,用户在自己的终端上输入检索提问式,联机服务中心的计算机就可以立即处理用户的请求,在数据库中查找符合用户提问的数据,并将检索结果回送至用户的检索终端上。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
●名词解释
●信息检索
●广义的信息检索是指将信息按一定的方式组织和存储起来,并根据用户的需要找到有关信息的
过程和技术。
狭义的信息检索是指从信息集合中找到所需信息的过程。
●信息素养
●信息素养是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力
的总和。
●信息意识
●信息意识又称信息观念,是人们对信息需求的自觉反映,即对信息的捕捉、分析、判断和吸收
的敏感性。
●信息能力
●是人们有效快速的获取、加工、存储、利用和传递信息的能力。
●信息道德
●是指在整个信息活动中,信息创建者、信息服务提供者和信息使用者所必须要遵守的社会法律
法规和行为准则。
●零次文献
●是指未公开出版的实验记录、原始录音(像)、书信、手稿、口头交流的信息或实物等。
●一次文献
●指以作者本人的研究成果为依据而撰写并公开发表或出版的信息。
●二次文献
●是对一定范围、时间或类型的大量一次文献按其特征收集整理、压缩、加工,并按一定顺序组
织编排、用于检索查找利用这些文献而编制的文献。
如书目、索引、文摘、题录、简介等。
●三次文献
●三次文献是在充分利用二次文献的基础上对一次文献做出的系统整理和概括的论述,并加以分
析综合编写而成的概括性文献。
●主题词
●是以自然语言为基础,以概念组配为基本原理,并经过规范化处理,表达主题的最小概念单元,
作为信息存储和检索依据的一种检索语言。
●关键词
●关键词是出现在文献题名、文摘、正文中,能够表达文献主题,具有检索意义的语词。
●叙词
●所谓叙词,是指从自然语言中优选出来并经过规范化处理的术语,又称主题词。
●查全率
●查全率是指系统在进行某一检索时,检出的相关文献量与系统文献库中相关文献总量的比率,
它反映该系统文献库中实用的相关文献量在多大程度上被检索出来。
●查全率=【检出相关文献量/文献库内相关文献总量】×100%
●查准率
●查准率是指系统在进行某一检索时,检出的相关文献量与检出文献总量的比率,它反映每次从
该系统文献库中实际检出的全部文献中有多少是相关的。
●查准率=【检出相关文献量/检出文献总量】×100%
●字段
●字段是组成记录的数据项。
书目数据库中的字段反映一篇文献的具体特征,如标题字段、著者
字段、文献来源字段、主题词字段、关键词字段、文摘字段、语种字段等。
●专利文献
●专利文献是实行专利的国家、地区及国际专利组织在批审专利过程中产生的官方文件及
出版物,包括专利说明书、专利权利要求书、专利公报、专利分类表、专利检索工具等。
●二次文献
●二次文献又称二级次文献,它是文献检索工具,能比较全面、系统地反映某个学科、
专业或专题在一定时空范围内的文献线索,是积累、报道和检索文献资料的有效手段.
●信息素质:是指一个人的信息需求、信息意识、信息知识、信息道德、信息能力方
面的基本素质。
●信息素养:是指判断何时、何地需要信息,并能有效的定位、获取、评价和利用信息的
一系列能力的总和。
●按文献出版形式分,特种文献有:
●答案:特种文献有:科技报告、专利文献、标准文献、会议文献、学位论文、政府出
版物、产品资料、其他资料(如档案资料、地图、乐谱等零散文献)
●二次文献包括
●书目、文摘、题录、索引、论文集、参考书中的百科全书、专科全书、手册、大全、
字典、词典、表格、图谱、数据等;电子形式有二次文献数据库、搜索引擎、信息门户检索工具书、网上检索引擎
●三次文献包括:一般包括专题述评、专题调研、动态综述、进展报告、学科年度总结
等。
此类文献的印刷形式和电子形式基本重合,都包括综述、述评、字辞典、百科全书、年鉴、标准、数据手册等;
●1.信息资源有哪些类型?
答:(1)按性质划分:信息资源可分为自然信息资源和社会信息资源两类。
(2)按载体划分:按载体不同,可划分为人脑信息资源、实物信息资源、文献信息资源、电子信息资源。
(3)按表现形态划分:按表现形态可以划分为潜在信息资源与现实信息资源。
(4)按构成要素划分:信息资源可分为信息内容资源、信息技术资源和信息人才资源。
(5)按组成关系划分:可将其划分为元信息资源、本信息资源和表信息资源。
(6)按空间位置划分:有国际信息资源、国家信息资源、地区信息资源、单位信息资源、个人信息资源。
●医学文献资源有哪些特点?
答:1。
信息大传播广2,。
信息层次多,品种多样3.自由发布,交流直接4.信息传播速度快,文化频繁5.检查方便,适用性强6.分散无序,缺乏管理7.内容庞杂,良莠不齐。
请简述文献检索的步骤
答:1.分析检索课题,明确检索要求。
2选择检索工具,明确检索方法。
3选择检索途径,确定检索标识。
4检索文献,5获取原始文件
20、信息素质体现在?通过哪些途经培养?
答:体现:1、信息资源意识,看能否整体了解所需信息的信源。
2、信息传递与沟通意识,看能否整体了解各种有效信息传递渠道及方式,能都有效的进行信息交流与沟通。
3、利用信息进行分析与创新意识与能力,看利用各种信息进行综合分析、创新等习惯、冲动、激情与能力。
4、信息保密意识与技能、信息安全意识与技能。
5、竞争合作意识与工作中的沟通与团队协作能力。
6、信息职业道德观,含价值、法制观及诚信意识。
途径:通过《信息检索与利用》课程的学习,做到整体了解所需信息的信源,整体了解各种有效信息传递渠道及方式,利用各种信息进行综合分析、创新等习惯、冲动、激情与
能力。
做到信息保密意识与技能、信息安全意识与技能。
培养竞争合作意识与工作中的沟通与团队协作能力
21、文献检索一般可划分为哪几个步骤
1)明确查找目的与要求
2)选择检索工具
3)确定检索途径和方法
4)根据文献线索,查阅原始文献
23、文献检索的途径。
1、主题途径
2、分类途径
3、作者途径
4、题名途径
5、引文途径
6、号码途径
7、其他途径(专门项目途径)
中国期刊全文数据库:跨库检索,收录相对较全,有期刊范围限定,精确或模糊匹配,查全率较高,可进行全文检索,有相关文献、相关作者、相关机构、参考文献链接
● 2. 检索过程中当检索结果偏少时,简述进行扩检的方法?至少举出4种方法。
3. 根据检索出的文献线索(题目、作者、出处),试举4条获取原始文献的途径。
● 4. 信息检索的重要性及其在学习、研究中的作用。
(6分)
2. 当检索结果偏少时,可以:
⑴删除某个用and 连接的不重要的检索词;
⑵增加用or 连接的检索词;
⑶位置算符放宽;
⑷检索词后用截词符;
⑸多用几个副主题词,甚至选用所有副主题词;
⑹用相应的上位主题词扩检
⑺同时用主题词和自由词检索,用or 连接;
⑻从在某个分类类目中输词检索改为在所有分类类目中输词检索;
⑼用别的途径补充检索,如著者途径;
⑽多选几个数据库或工具书进行检索;
⑾扩大检索年限;
⑿用模糊检索。
(任意4个,②——2分,其余每个1分)
● 3. 获取原始文献的方法和途径:
①利用文献线索,查询馆藏目录②借助馆藏联合目录
③申请文献定购、传递服务④试查网上免费电子期刊
⑤试查全文数据库⑥利用文献资源保障系统
⑦E—mail向著者索取(任意4个,⑤——2分,其余每个1分)。