信息检索重点知识

信息检索重点知识

信息:信息是事物存在的方式,运动状态及其特征的反映,是事物发出的信号,消息

信息的特征:载体依附性无线共享性永不枯竭性开发增值性应用时效性存在普遍性

知识:知识是信息的升华和结果,系统化理论化的的信息就称为就称为知识

文献:用一定的方式记录在一定的载体上的知识都称之为文献

信息源:个人为满足信息的需要而获得信息来源称之为信息源

信息源类型:①个人信息源②组织机构信息源③实物型信息源④文献信息源⑤电子型信息源①及时、新颖、传递迅速、但带有主观随意性,久传易出错②内部信息源,共管理人员分析③直观性强,信息量大,有一定隐蔽性④当今数量最大,利用率最高的信息资源⑤内容广泛、使用简便

信息资源:即作为资源的信息。

信息资源的构成要素: 信息生产者,信息,信息技术。

文献信息源分为:图书期刊学位论文科技报告专利文献标准文献产品样本会议文献政府出版物

零次文献:未经出版发行或者未进入社会交流的最原始的文献

一次文献:以作者本人取得的成果为依据而创作的作文报告等公开发表或出版的各种文献

二次文献:按照特定的目的进行筛选,即所谓用一定的检索工具进行过加工的文献

三次文献:根据二次文献提供的线索,选用大量一次文献的内容,经过筛选分类综合和浓缩而再度出版的文献

信息素养DY:能认识到何时需要信息和有效的搜索评估和使用所需要信息的能力

医学信息素养内容:信息意识信息知识信息能力信息道德(DY以医学信息获取、评价和利用等处理能力为核心)

信息检索DY:信息检索包括信息储存和信息获取两个过程,信息的存储:根据信息的外表和内部特征,按照一定的组织编排,使之成为有序化信息集合的过程。信息的获取:根据特定的需要,运用组织好的检索系统和工具,将特定信息找出来的过程。

信息检索的类型:文献检索事实检索数据检索

信息检索原理:是通过对大量分散无序的文献信息进行收集,加工,组织,存储,建立各种各样的检索系统。并通过一定量的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效的获取和利用信息源。

数据库由文档记录和字段组成

信息检索语言分类:分类语言(体系分类语言和组配语言)和主题语言信息检索的主题语言:标题词、元词、叙词、关键词

信息检索的途径:分类途径主题途径关键词途径著者途径题名途径号码途径

信息检索技术:布尔逻辑检索截词检索位置检索限定字段检索

信息检索的策略(步骤):一分析检索课题,明白目的和要求二,检索系统和数据库的选择三选择检索途径确定检索标识四编制检索表达式调整检索策略五获取原始文献

信息检索的基本要求:全面准确快速

查准率:表示检出的文献中所需要相关文献所占的比例。

查全率:表示检出的相关的文献与全部文献库中实际存储的相关文献的比例

提高查全率的措施:1尽量采取主题词语关键词相结合进行检索 2主题词检索时要进行扩展检索和使用全部副主题词检索 3 分类检索时要进行扩展检索和全部复分检索 4删除某个不甚重要的概念组面,减少AND运算 5多用同义词进行“OR”运算检索6 采用截词检索

提高查准率的的措施:1采用规范化的主题词与副主题词组配进行检索,少用或不用自由词 2采用限定主要概念主题词字段的加权方式进行检索 3增加概念组面,用AND运算符进行连接 4用NOT算符排除无关概念 5限制检索字段如文献类型语种作者刊名等 6调整放宽位置算符等

信息检索的作用

信息检索是信息素养教育的主要内容

信息检索是创新型人才的基本技能

信息检索是科学研究的重要环节

信息检索是开发信息资源的重要途径

信息检索是科学决策的重要前提。

信息素养DY是指判断何时、何地需要信息,并有效地定位、获取、评价和利用信息的一系列能力的总和。

Site:https://www.360docs.net/doc/5712793663.html, filetype:ppt

信息检索与利用复习重点

一、工具书概念:根据一定的查阅需要,系统汇集有关的知识资料,以特定的编排方式和检索方法,为人们迅速提供知识信息或资料线索,专供查阅的图书(文献)。工具书的特点:①信息密集②资料性强③查考为主④方便检索工具书类型:1 检索工具书又称线索性工具书,主要提供查找文献的线索:书目、索引、文摘。2 参考工具书主要向读者提供可资参考的知识内容,如数据、史实、结论、定义、人物简介等数据和事实信息:字典、词典、百科全书、年鉴、手册、名录、数表统计资料、表谱、图录等类型。3 边缘工具书——形式上不是工具书但具有查考检索作用的图书。丛书、总集、汇编、综述、史志、学科史及要籍等。工具书的结构:①序、跋②凡例③目录④正文⑤辅助索引⑥附录、参考文献工具书的鉴别与选择原则:1)看其主流,考察内容材料,看内容是否完备、材料新颖可靠,解释引证准确2)客观、正确,有无立场、观点问题3)了解编制体例,编排方式、检索方法、印刷规则、文体。4)同一种工具书的不同版本。鉴别与选择的方法1)查考编辑者与出版者2)编纂和出版的年代、审察版本3)查考序跋、凡例和目次4)辨别正文——选条试查、定条比较 5)参阅书评二、机器检索及光盘、联机与网

络检索计算机检索:人们在计算机或计算机检索网络终端机上,使用特定检索指令、检索词和检索策略,从计算机检索系统数据库中检索出需要的信息,继而再有终端设备显示或打印的过程。信息检索工具:指用以报道、存储和查找文献线索的工具。它是附有检索标识的某一范围文献条目的集合,是二次文献,如书目数据库、搜索引擎、索引、文摘。检索工具的分类:1)(文献检索工具)提供线索的指示型检索工具(二次文献):书目、馆藏目录;索引;文摘;工具书指南2)(事实与数据检索工具)提供具体信息的参考工具(三次文献):1词典2类书、政书、百科全书3、年鉴4传记资料5表谱、图录6、政府文献7名录、手册8数表、统计集9丛集汇要10地理资料信息检索途径:1)外部特征途径:题名途径,著者途径,序号途径2)文献内容特征途径:分类途径,主题途径,关键词途径,分类主题途径,其他途径。信息检索步骤:1)分析检索课题,明确检索要求(2)制定检索策略:确定检索工具、方法、途径、用词及逻辑关系、位置关系(3)实验性查找,调整检索策略,正式查找;(4)辅助性查找(最新期刊、年鉴);(5)整理答案或索取原文。信息检索步骤:1)分析检索课题,明确检索要求2)制定检索策略:

温医 2018文献检索知识点整理

答题格式 填空题、选择题只用填写答案即可,不用写其他 操作题三要素: 检索结果数量、检索表达式、题录信息(题目会要求你写什么就写什么) 举例: #1 34567 分类号=R512.6/扩展/复分-025/ 题名:xxxxxxxxxxx 作者:xxx 文摘型数据库 只有题录信息、全文链接信息,没有全文信息的数据库。 1.中国生物医学文献服务系统(CBMweb) 2.PubMed 1.中国生物医学文献服务系统(CBMweb) 基本检索 智能检索:在“缺省”字段,自动实现检索词、检索词对应主题词及该主题词所含下位词的同步检索。不支持逻辑组配检索。 精确检索:适用于关键词、主题词、特征词、分类号、作者、第一作者、刊名、期字段。 限定 每次限定检索结束后,谨记点“清除”按钮 主题检索 加权检索 主题词“加权”表示主题词的重要程度,反映文章论述的主要内容。加权主题词用“* ”表示 加权检索表示仅对加星号(*) 主题词( 主要概念主题词) 检索 非加权检索表示对加星号主题词和非加星号主题词(非主要概念主题词)均进行检索。 扩展检索 扩展检索是指同时检索当前主题词及其下位词,可提高查全率。 非扩展检索则仅限于当前主题词的检索。 分类检索 期刊检索 作者检索

检索历史 系统退出后,检索历史清除 CBM检索检索规则 布尔逻辑符 优先级:() > NOT > AND > OR 截词检索 ?:表示一个字符 例:血?动力,可搜索“血液动力、血流动力”等 % :表示任意个字符 例:肝炎%疫苗,可搜索“肝炎疫苗、肝炎病毒疫苗、肝炎灭活疫苗”等等模糊检索/精确检索 短语检索 用半角双引号将检索词括起来,系统视其为不可分割的固定短语在指定字段中检索。 例:”1,25-(OH)2D3” 2.PubMed 基本检索 可对任何具有实质意义的词都可以进行检索,分类如下: 自动词语匹配检索自动匹配功能 著者检索 期刊检索 精确检索用“”进行强制短语检索 截词检索用通配符?,*检索 字段限定检索P47 表4-2 布尔逻辑检索AND OR NOT 高级检索 MeSH主题词检索 确定规范检索词 款目词(入口词)、主题词(叙词) 查看词义注释、树状结构表 副主题词、扩展、主要主题词 其他检索方法 Single citation matcher(单篇引文匹配器) 查找某一篇文献的准确信息 Clinical queries 专门为临床医生设计的检索服务。 临床研究、系统评价、医学遗传学三类临床医学资源中进行检索 每次筛选检索结束后,需进行clear all 操作。

信息检索知识点优选稿

信息检索知识点 文件管理序列号:[K8UY-K9IO69-O6M243-OL889-F88688]

信息检索考点整理 1.信息检索的概念 广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程;而狭义的信息检索仅指有序化信息的检索查找。 2.信息检索的原理 就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。 3.为什么说信息存储和检索是两个不可分割的有机体? 检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。检索过程是存储过程的逆过程。因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。 4.信息检索的方法 (1)顺查法 (2)倒查法

(3)抽查法 (4)追溯法 (5)循环法 5.信息检索的途径 (1)内部特征途径 a)分类途径 b)主题途径 (2)外部特征途径 a)题名途径 b)着者途径 c)文献编号途径 d)目录检索途径 e)机构检索法 f)引文检索途径 6.布尔模型的优缺点 优点:(1)简单,形式简洁,易于理解; (2)可操作性强,应用广泛; (3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念; (4)能处理结构化提问。 缺点:(1)表达用户复杂需求效果欠佳 (2)准确匹配无法提供定量比较

信息检索复习重点1

信息检索 第二章信息用户 一、用户信息需求的概念 1、概念:是指人们在实践活动过程为解决遇到的各种问题而产生的信息不足感与求足感 2、主要特点:广泛性、社会性、发展性、多样性、主观性、客观性 二、用户信息需求的基本类型 1、按信息的属性分 自然信息需求:对客观存在的自然物信息的不足感与求足感,强调物质属性 社会信息需求:生活中的信息需求、职业活动中的信息需求、个体社会化的信息需求 2、按信息需求的目标分 主题需求:战略性信息需求、战术性信息需求、工作性(经营性)信息需求 已知资料需求:信息查对需求 3、按信息需求的表现形态分(沃格特) 新信息需要:需要能及时获得、迅速传递的最新信息,强调及时性 片断性信息需求:某一理论、方法、事件等的片断信息,以解决具体问题,强调准确性 完整性信息需求:对特定相关信息的系统把握,强调全面性 三、用户信息需求状态(Mizzaro) 1、客观信息需求(Real Information Need,RIN):用户解决某特定问题所需要的信息 2、意识到的信息需求(Perceived Information Need,PIN):户在问题及外界刺激下所感知到的信息需求 3、表达出来的信息需求(Request):用户在一定条件下对意识到的信息用自然语言表达出来的信息需求 4、信息提问(query):用户用所选择信息检索系统的检索语言相对应的语法形式描述的信息需求 四、用户需求提问 1.需求提问的类型划分 1)、从提问的规定性上分类 明确性提问:问题初始条件与目标状态清楚 不确定性提问:问题初始条件或目标状态不清楚 2)、从功能上分类 认知性提问:咨询提问和评价提问 非认知性提问 2.需求提问的结构分析 主题分析:描述用户信息需求的内容范畴。包括主题概念、学科范围

文献检索综合考试题

文献检索综合考试题 Revised by BETTY on December 25,2020

文献检索综合考试题 一.总结你在《信息检索》课中学到的知识点,谈谈学习感受。第一章:大学生信息素养:信息意识、信息能力、信息道德文献基础知识;信息、知识、情报、文献等概念 文献的类型文献检索途径馆藏文献排列规律;《中国图书馆分类法》和书目数据库的使用等等,我们学会了大学生必备的信息素养。 第二讲:搜索引擎,检索方法与检索途径,包括逻辑运算符的使用与如何使用检索词和如何提高查全率与查准率。 第三讲:权威信息源 1.教育信息源 教育部网站是发布教育信息的权威网站。新职业网站提供全方位的大学生就业信息。 精品课程网是教育部2003-2010年建设的课程资源,具有1万多门3级精品课程。教育部的爱课程网站资源提供精品课程的视频录像,包括视频公开课和资源共享课。 MeTel目前国内最大的双语教学的多媒体课程数据库。 中国研究生招生信息网——考研报名和调剂指定网站。 1.新闻信息源

新华网是国内最权威的新闻网站,提供全世界范围的动态新闻。 人民网提供国内全方位的新闻信息,是国内最早的新闻网站。 光明网号称“知识分子网上精神家园权威思想理论文化网站”。 计世网报道最新的信息技术动态 2.工具资源 词典类以注释词义为主,主要用于语言的学习和概念的掌握;熟练应用不同翻译站点 百科全书的内容包罗万象,广泛提供系统知识; 年鉴能及时提供可靠的数据信息。 国家统计局网站全面提供国内第一手经济数据信息。 国研网是国内权威的经济研究网站,向决策者提供经济决策帮助的信息平台。 第四讲:科学文献资源 图书:超星、Springer电子图书 期刊论文:中文:CNKI、维普、英文:EBSCO、 Emerald、Springerlink、ScienceDirect、Wiley 学位论文:CNKI、万方、Proquest 会议论文:CNKI、万方 科技报告:Peter-科技报告数据库

计算机信息检索复习资料

计算机信息检索复习知识点 第一章 1、人类生活的3个基本要素是材料、能源和信息。(单选) 2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。(名词) 3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。(多选) 4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。 5、信息的功能有哪些?(简答) (1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源; 6、信息的类型有哪些?(论述) (1)按信息的表达形式划分,可以分为 ①文献信息②声像信息③电子信息 (2)按信息的应用范围划分,可分为 ①白色信息②灰色信息③黑色信息 (3)按信息的加工层次划分 ①一次信息②二次信息③三次信息 7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。(名词) 8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选) 9、现代信息技术的基础是微电子技术(单选) 10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。(名词、单选) 11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源 12、信号的接收者称为信宿 13、信息传输的通道称为信道 14、信号在传输过程中受到的干扰称为噪声 15、数据库简称DB 16、数据库的四种基本操作是:检索、更新、删除、插入 17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。 18、数据结构化有利于实现数据共享 19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复 20、构成数据库的三个主要层次是:文档、字段、记录 21、记录的基本单元是:字段 22、文档的基本单元是记录 23、一个文档中你好,认识一下!包含大量的记录 24、检索系统提供的数据库相关文档组成包括的文件数是3个 25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。 26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。 27、倒排文档只包括记录的标识、信息的数量及信息存取号。 28、存储了数据库所有记录的特征标识的是倒排文档 29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档 30、传统的检索对象主要是文献型的信息源 31、传统的检索对象的存储介质是纸张 32、对超文本、超媒体信息资源实施的检索是超维检索 第二章 1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段 2、计算机信息检索必备的条件是物质和人员 3、计算机检索的类型有哪些?(论述) 计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分 1根据计算机信息检索的内容划分,检索可以分为 (1)数据检索;(2)事实检索;(3)文献检索 2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索 3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统 4、事实检索的对象是事实 5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索 6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法 7、计算机批处理的信息检索系统称为脱机检索系统 8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统 9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。 10、信息检索系统的职能有:报道职能、存储职能、检索职能 11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库 12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库 13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。 14、信息系统的构成模式是什么?(简答) (1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统 15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储 16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构 17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构 18、非线性结构中最常用的的是树形结构和网形结构 19、将信息用二进制表示称为编码 20、计算机处理信息的最小单位是一位二进制数 21、两级存储器是指主存储器和辅助存储器 22、信息检索的概念起源自文献信息检索 23、对信息进行主题分析,提取代表该信息的特征的过程称为标引 24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成 关键词索引或倒排文档。 25、对一本书或一篇文章所做的扼要摘述称为文摘 26、利用计算机自动编制文摘称为自动文摘 27、在信息检索自动化处理中,常用的运算是排序 28、常用的自动排序的方法有选择排序和快速排序 29、存储区域网简称为SAN 30、目前大多数中小企业见利网络环境的协议基础是 TCP/IP 31、信息检索系统的组织:为了控制信息的流速和流向、数 量和质量等,把传递中的杂乱无序的信息整理为系统有序状 态的活动。 32、信息检索系统的组织目的是什么?(简答) (1)减少社会信息流的混乱程度; (2)提高信息系统的质量和价值; (3)建立信息检索系统与用户的联系; (4)节省社会信息活动的总成本。 33、信息检索系统的组织的要求有哪些 (1)信息内容有序化; (2)信息流向明确化; (3)信息流速适度化; (4)信息质量最优化。 34、信息检索系统组织方法:是指对每一信息的各种外表特 征和内容特征进行描述并确定其标识,然后按一定方式或规 则将其内容组织起来以供检索的方法 35、信息检索系统的传统组织方法有哪些? (1)分类组织法;(2)主题组织法;(3)字顺组织法;(4) 号码组织法;(5)自然组织法 36、进行网络信息资源组织的方式主要有:文件组织方式、 主题树组织方式、超文本组织方式、超媒体组织方式、元数 据组织法 37、以文件为单位共享和传输信息的组织方式称为文件组织 方式; 38、超文本的信息组织方法是非线性; 39、元数据又称描述数据; 40、对初选信息的鉴别、筛选和删除称为优化; 41、优化选择的方法有:比较法、分析法、核查法、引用摘 录法、专家评估法 42、检索语言:检索信息所使用的人工语言; 43、登录在类表、词表中的所有标识称为词汇 44、检索语言的作用有哪些?(简答) (1)对信息内容进行主题分析;(2)便于将标引、检索用 的标识符进行相符性比较,保证检索和标引的一致性;(3) 保证检索结果和检索要求的一致性;(4)保证信息存储集中 化和系统化 45分类语言的基础是科学分类 46主题语言是使用词语标识的一类信息检索语言,称为主题 法 47、把主题词按照一种便于检索的方式编排起来,称为主题 词 48、关键词:从信息的题名、摘要和内容中抽取出来的,能 够表达信息主题内容的具有检索意义的关键性词汇。 49、叙词:是指从自然语言中优选出来并经过规范化处理的 名词术语,属于后组式语言的一种,是采用表示单元概念的 规范化语词的组合来对信息主题或内容进行描述的标识系 统。 50、叙词的特点:专指性、直观性、多维检索、适应性、网 络结构 51、按照学科体系进行系统排列的语言称为分类语言 52、按照主题词的字顺序列排列的语言称为主题语言 53、计算机信息检索是指利用计算机存储信息和检索信息 54、进入检索的入口称为检索途径 55、按学科分类体系查找信息的途径称为分类检索 56、利用信息主题内容进行检索的途径称为主题检索 57、选择实现检索计划的具体方法和手段是选择检索方法 58、利用检索系统查找信息的方法称为工具法 59、信息检索策略:将课题的提问及其检索词与检索系统的 收录内容、编排特点相匹配而确定的检索方案或程序。 60、检索效果:是指信息系统检索信息的有效程度,反映了 信息系统的检索能力 61、查全率:检索出的相关信息量与信息系统中的相关信息 量之比 62、查准率:检索出的相关信息量和检索出的信息总量之比。 63、衡量检索效果的相对合理指标是差准率和查全率 第三章 1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检 索词与检索词之间逻辑关系的检索方法。 2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非 3、INTERNET上信息出传输的主要方式是FTP 4、检索者将检索词在他认为合适的地方截断称为截词 5、限制检索:在检索系统中,使用缩小和限定检索范围的方 法称为限制检索 6、邻近检索:通过专门符号来规定检索词在结果中的相对位 置 7、中级检索技术包括哪些内容? (1)加权检索技术;(2)自然语言检索技术;(3)相关信 息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。 8、自然语言处理应用领域之一是信息检索 9、概念层次网络简称HNC 10、自然语言处理技术可以分为机器翻译、语义处理以及人 机会话 11、搜索引擎用到的自然语言处理技术是机器翻译与语义处 理 12、实现只能搜获的过程主要分为:语义处理、知识管理、 知识检索 13、从用户角度看,用户可以分为最终用户和职业用户 14、信息检索发展史上的突破是应用了自然语言检索 15、智能代理资源管理器的基本结构是:适配器、引擎、知 识、库、视图 16、智能代理信息检索系统的特点有哪些?(论述) (1)智能代理侧重于面向用户。 (2)智能代理主要借助知识库、数据库,并参考用户需求习 惯和一段时期内的偏好,推断用户提问的真实意图,提高检 索的专指性。 (3)智能代理采用机器学习、用户框架模型、推理机制主动 协助用户查找信息。 (4)智能代理不仅是关键字的匹配,而且是基于概念和知识 的检索。 (5)智能代理能不断了解用户需求的变化,并根据用户的反 馈信息及时修正检索目标策略。 (6)智能代理能分离发送请求和接收结果,使它们异步进行。 (7)智能代理能使用户按照个人的兴趣爱好进行信息分类。 17人们进行信息检索时总是期望获得较高的查全率和查准率 18对信息进行采集、标引、存储、处理,最后形成信息集合 体 19、通过模拟自然进化过程搜索最优解的方法称为遗传算法 20、搜索引擎和挖掘引擎处理的都是字串和文本 21、数据挖掘也称知识发现 22、聚类:按照事物的某些属性,把事物聚集成类,使类间 的相似性尽量小,类内相似性尽量大 23、一种很有效的预测模型技术是神经元网络 第四章 1.INTERNET起源于ARPANET 2、我国的四大互联网络是:中国科技网、中国教育科研网、 中国公用互联网、中国公用经济信息网 3、INTERNET提供的基本信息服务有:电子邮件、文件传输、 远程登陆、电子公告板、网络新闻组 4、可以在异地主机上登陆注册的服务是TELNET 5、通过专用电缆与INTERNET主干网直接连接在一起的称 为专线连接 6、综合业务数字网简称ISDN 7、非对称数字用户环路简称ADSL 8、网络信息资源主要类型是联机检索系信息资源和网络信 息资源 9、联机检索信息资源的主要表现形式是联机数据库 10、文件传输协议是FTP 11、网络信息资源进行组织的主要方式有:文件方式、主题 树方式、超文本方式、数据库方式、超媒体方式、元数据方 式。 12、元数据:就是关于数据的数据,是对数据内容的描述。 13、元数据的作用有哪些?(论述) (1)描述数据的内容、质量和特征,以及数据所适用的范围。 (2)管理和存储大量科学数据 (3)提供一种对数据进行检索、查询的方法 (4)帮助数据的使用者更好的了解和使用数据。 (5)促进数据共享 (6)为数据交换和数据传输提供辅助信息 (7)元数据是数据发挥其作用的一个必要条件 (8)维护科研成果,维护在数据方面的投资。 14、DC的特点有:简易性、通用性、兼容性、灵活的可扩展 性 15、知识产权:是公民和法人对在科学和文学等领域内创造 的精神财富以及智力成果依法享有权利的总称。 16、INTERNET上每位用户都有的帐号称为域名 17、数据库开发主要是开发书目数据库、文摘数据库和全文 数据库 18、开发网络信息资源的一个重要途径是制作知识导航库 19、数字图书馆开发利用网络信息资源的一种主要形式是馆 际互借 20、网络信息资源开发利用中的知识产权保护策略是什么? (简答) (1)加强开发利用网络信息资源的立法工作 (2)加强国际交流,逐步与国际接轨; (3)建立和完善知识产权集体管理制度 (4)使用技术手段防止侵权 (5)重视解决网络信息知识产权保护的两个基本原则,即网 络发表权问题和复制权问题。 第五章 1、中国期刊网全文数据库检索系统是基于INTERNET 2、专业检索的具体步骤是: (1)通过单击页面右上角的状态栏,即可进入专业检索条件 界面; (2)选择检索范围 (3)填写检索条件 3、二次检索:通过简单检索、高级检索及专业检索,在这些 检索结果上还可以继续进行操作。 4、二次检索的操作方式有:并且、或者、不包含 5、保存题录中最大保存记录数为50 6、向导式检索的检索操作顺序是由上到下 7、中共高等教育文献保障体系简称CALIS 8、中文社科报刊数据库检索方法的具体步骤是什么?(论述) (1)系统进入、检索途径的选择和结果的输出 (2)主题词、题名和著者检索途径 (3)分类号检索途径 (4)人名检索途径 (5)刊名检索途径 (6)检索结果的显示、标记、打印和保存 (7)索引词列表的使用方法 (8)历次检索策略的选用 9、最重要的统计工具和学术分析及评价工具是SCI 10、普通检索中检索来源文献的途径可分为:主题词、著者、 来源出版物、著者地址 11、执行检索后命中的记录在屏幕上显示的格式是简单格 式 12、联机公共检索目录简称OPAC 第六章 1、产权主要有哪几种:动产权、不动产权、知识产权 2、著作权:也叫版权,是指文学、艺术、科学作品的作者, 对其创作的作品,依照法律享有的专有权利。 3、以法律的形式保护发明人在一定期限内享有对其发明的专 利权称为专利权 4、专利的特征有:排他性、地域性、时效性 5、专利的类型有:发明专利、实用新型专利、外观设计专利、 集成电路布图设计 6、国内检索专利信息的网站有哪些? (1)中国知识产权网; (2)中华人民共和国知识产权局 (3)中国专利信息网 (4)中国专利信息检索系统 (5)中国专利文摘数据库 (6)中国香港特别行政区知识产权署 7、美国专利与商标办公室简称USPTO 8、对专业人员根据其专业学术水平而授予的一种称号称为 学位 9、学位论文分为哪几种类型?(简答) 一类是理论研究型的,作者通常在搜集、阅读了大量资料之 后,依据前人提出的论点和结论,再通过自己的深入研究或 大量实验,进一步提出自己的新论点和新假说。另一类是调 研综述型的,作者主要以前人关于某一主题领域的科研课题 做出概括性的总结,提出自己独特的论点和新见解。 10、会议文献:是指在各种学术会议上宣读的论文、产生的 记录及发言、论述、总结等形式的文献。 11、会议文献按照出版时间的先后分为:会前文献、会中文 献、会后文献 12、科技报告:对科学、技术研究结果的报告或研究进展的 记录 13、美国政府的四大科技报告分别是:PB报告、AD报告、 NASA报告、DOE报告 14、标准文献:按照规定程序编制并经过一个工人的权威机 构批准的,供在一定范围内广泛而多次使用,包括一整套在 特定活动领域必须执行的规格、定额、规划、要求的技术文 件。 15、标准文献主要分为:国际标准、区域标准、国家标准、 专业标准、行业标准、基础标准 第七章 1、目前INTERNET网络资源主流是网络信息资源 2、网络信息检索的主要特点是什么?(简答) (1)交互式作业方式 (2)用户透明度 (3)信息检索空间的拓宽 (4)友好的用户界面且操作方便 3、网络检索工具共有的特点是交互式作业 4、网络信息检索工具的类型有哪些? (1)按照检索机制划分可分为: 1、分类目录检索工具; 2、搜索引擎检索工具; 3、混合型检 索工具\(2)按照检索的内容划分可分为1、综合型检索工具; 2、特殊型检索工具; 3、多元检索工具; 4、万维网和非万维 网检索工具 5、能够利用多个检索工具进行网络信息查询的检索工具称 为:多元检索工具 6、网络信息检索工具按照检索机制划分可分为:分类目录检 索工具、搜索引擎检索工具、混合型检索工具 7、搜索引擎按照信息内容组织方式划分为按检索词检索和 按分类检索 8、分类目录型检索工具的典型网站是:YAHOO 9、目前网络上适用最多的引擎的检索形式是按检索词检索 10、搜索引擎使用最多的分类是按照主题 11、搜索引擎主要由三个部分构成,分别是:搜索软件、索 引软件、检索软件 12搜索软件,通常称为机器人 13、检索软件决定搜索引擎的检索功能和返回结果的相关性 14机器人是一种计算机的程序 15、在遍历算法中,一般用到的两种方式是深度优先和广度 优先 16、内容索引项可以分为单索引项和多索引项 17、索引技术可以使用集中式索引算法或分布式索引算法 18、输入接口可以分类两种,分别是简单接口和高级接口 19、ALTA VISTA是常用的单个搜索引擎 20、EXCITE提供基本检索和高级检索 21、检索式中,专有名词的首字母必须大写 22、EXCITE突出特点是采用了概念检索 23、EXCITE特有的功能是范例检索 24、便于用户在各个搜索引擎间进行灵活快捷的切换的引擎 称为多元搜索引擎 25、用户的浏览器和多元搜索引擎系统交互的界面称为用户 接口 26、多元搜索引擎实际上是一种网络查询接口工具 27、功能较强的多元搜索引擎一般采用的处理方式是并行和 串行 28、查询操作大多仅支持简单的布尔逻辑操作 29、多元搜索引擎一般可分为并行处理和串行处理 30、常用多元搜索引擎又:MAMMA、SEARCH、 METACRA WLER、ASK JEEVES、PROFUSION 31、提高搜索结果准确性的方法主要有哪些?(简答) (1)运用引擎的词组检索、字段检索和邻接算符等控制检索 的范围 (2)使用有些搜索引擎的REFINE功能 (3)可以使用概念检索和相似页检索 32、基于链接评价的搜索引擎的优秀代表是GOOGLE 33、搜索引擎的研究发展方向是:智能化搜索、个性化搜索、 结构化搜索、垂直化专业领域搜索、本土化搜索 34、结构化搜索:是指充分利用XML等技术使信息结构化, 同时使查询结构化,从而使搜索的准确度大大提高。 35、搜索引擎的发展新趋势是垂直搜索引擎 第八章 1、联机检索系统包括的三个部分是:检索终端、通信网络、 联机检索中心 2、系统拥有的各种数据库称为联机数据库 3、联机系统中数据库的选择方法有:数据库类型、收录范围、 文档结构、记录内容、更新周期 4、DIALOG的特点有哪些?(简答) (1)拥有最多的数据库;(2)拥有的用户数量最多;(3)服 务项目较多;(4)检索模式较多 5、世界上规模最大的综合性商业联机检索系统是DIALOG 6、DIALOG的检索模式有:菜单式检索、命令式检索、目标 检索、WWW检索 7、DIALOG的八种服务方式都是什么?(论述) (1)回溯性检索。利用回溯性检索,系统能够保证满足用户 查全某一课题或者领域方面的文献需要 (2)定题信息检索。DIALOG系统的数据库根据文献信息内 容更新周期或者根据用户检索要求,定期的向用户提供所需 的信息。 (3)商界链接服务。它是系统为满足用户的商业信息需求而 提供的一种菜单式信息检索服务。 (4)电子邮件服务。它是DIALOG系统提供的电子邮件传 递服务。 (5)原文订购服务。它是DIALOG系统提供的联机文献订 购服务 (6)多文档检索服务。它允许用户使用一个检索策略同时检 索多个数据库,而没有必要每检索一个数据库就重复输入检 索指令。 (7)DIALINDEX。它是DIALOG系统为用户提供的数据 库选择工具。 (8)其他服务。DIALOG还提供图像输出服务、报表生成服 务、光盘检索服务、通信软件和图像处理软件服务以及各种 培训服务。 8、DIALOG系统中,检索字段分为基本检索字段和辅助检 索字段 9、保证获得满意检索结果的前提是正确选择数据库 10、选择数据库应该遵循的原则有:内容原则、范围原则、 时效原则、费用原则 11、获取检索结果通常采用的方式有:联机显示、脱机打印、 订购原始文献

《化学文献检索》知识点总结

《化学文献检索》 第一章绪论笔记 第二章期刊笔记 第三章题录索引 美国《化学文摘》Chemical Abstracts(CA) 一、C A概况 CA的出版者和创刊年二次文献 CA创刊于1907年,由CAS即Chemical Abstracts Service,美国化学文摘社创办。 CA的收录范围 收录世界各国化学化工方面的出版物约20,000余种,包括期刊论文、会议录、资料汇编、报告、新书、专利等,CA被称为“世界化学化工文献的钥匙”。 出版周期频率 CA是周刊,半年一卷,一卷26期。 载体形式 印刷版----手工检索光盘版----计算机检索网络版----计算机检索CA特点 1 收录内容广泛,文献量多。 2 CA是可得性和可用性很好的二次专利文献源。CA可帮助查找大量专利文献。 3 CA印刷版的平均时差不超过3个月,报道及时 4 CA索引索引齐备,有完善的期索引,卷索引和累积索引,方便查找。 CA正文的编排结构和著录格式: CA正文由(文摘主体)和(期索引)两部分组成。 文摘主体部分(分为五大部分共80大类,分单、双周出版) 单周1、生物化学2、有机化学 双周3、高分子化学4、应用化学和化学工程5、物理化学和分析化学 CA的编排格式 早期的CA每页通栏编排(1-27卷)后来的CA每页分左右两栏,每条文摘都有一个文摘号

CA的著录格式 期刊论文文摘的著录格式 126: 1939m (1) Use of antivirals in influenza in the elderly Prophylaxis and therapy. (2) Nichoson. Karl. (3) (Department of infectious disease ..,UK) (4) Gerontology( Basle) (5) 1996,42(5),280-289 (6) (English) (7) 期刊论文文摘的著录格式各部分意义: ①卷号和文摘号,同一卷连续编号。 ②篇名,非英语文献篇名按原意翻译成英文。 ③著者姓名。 ④著者的工作单位或论文寄发单位。 ⑤⑥文献出处,刊名大多用缩写,全称可查“CAS Source Index”. ⑦原文献语种。 CA中的一条文摘: 各个编号代表的意思:1卷文摘号2标题3作者4作者所在单位5期刊名缩写6年份7卷期号8页码9文种缩写 专利文献的著录格式 126:139853u Process for identifying RAR receptor antagonists using skin test application of RAR agonist. 专利标题 (1) Demarchez, Michel; Jomard, Andre 专利发明人 (2) (Centre International De .........,Fr) 专利权人 (3) Eur.Pat.Appl.EP749,755 专利国别和专利号 (4) (CL.A61K49/00) 国际专利分类号 (5) 27 Dec 1996,Fr 专利公布日期<6> Appl.95/7, 302,19, Jun 1995; 专利申请号和申请日期<7> 5pp 专利说明书页数 (8) (Fr) 专利文献的著录格式

信息检索复习知识点

1.信息(Information) 信息是物质存在的一种方式、形态或运动状态,也是事物的一种普遍属性,一般指数据、消息中所包含的意义,可以使消息中所描述事件的不确定性减少。 * 信息的属性——客观存在性 * 信息的作用——消除不确定性 * 信息的形式——数据、消息等事实 2.各种客观存在的、可供人们直接或间接开发与利用的信息的集合总称为信息资源 3. 信息用户Information User 信息的使用者即是信息用户。 使用的情况可以包括需要信息、接受信息和利用信息。 4. 信息需求Information Demand 人们在社会实践活动中,为了解决各种实际问题,会产生对信息的需要,这种需要可表现为对信息的必要感和不满足感。我们把意识到的信息需要定义为信息需求 5. 信息检索Information Retrieval 对信息用户而言,信息检索就是根据各自的目的和要求,选择恰当的信息资源,采用适当的检索手段、检索技术、检索方法,对所需要的信息进行查找、筛选和索取的过程或活动。 6. 信息素质:人们能够敏锐地察觉信息需求,并能进行相应的信息检索、评估以及有效利用所需信息的水平。 * 信息意识 * 信息能力 * 信息道德 7. 信息社会是以知识和信息为基础从而促进社会高速发展的一种社会形态。 8. 经济领域的特征 a.劳动力结构出现根本性的变化,从事信息职业的人数与其它部门职业的人数相比已占绝对优势; b.在国民经济总产值中,信息经济所创产值与其它经济部门所创产值相比已占绝对优势; c.能源消耗少,污染得以控制; d.知识成为社会发展的巨大资源。 9. 社会、文化、生活方面的特征 10.社会观念上的特征 11当代信息环境特征描述 * 信息超载严重 信息超载又称信息泛滥或信息爆炸。它是指在信息时代,伴随着科学技术的迅速发展,出现的数据爆炸、信息平庸化以及噪音化趋势,人们无法根据自己的需要和当前的信息能力选择并消化自己所需要的信息。 * 信息失衡明显 所谓信息失衡是对由于各国经济水平、科技水平和其它多种相关因素的影响,不同国家、不同地区以及不同阶层的人群在信息占有水平以及利用程度上存在极大差距的描述。 * 信息污染成灾 信息污染是指社会信息流中充斥或伴随着的许多不利于人们健康而有效地进行工作、学习、生活的不良信息,危害人类信息环境、影响人们对有效信息予以及时而正常地吸收及利用的社会现象。 * 信息障碍加剧

信息检索知识点

信息检索考点整理 1.信息检索的概念 广义的信息检索是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储和检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。 2.信息检索的原理 就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就是初步命中检索所需的信息。 3.为什么说信息存储和检索是两个不可分割的有机体? 检索的全过程包括存储和检索两个过程,存储和检索是相辅相成、不可分割的。存储过程主要是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。检索过程是存储过程的逆过程。因此,检索者只有在全面了解存储者是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。 4.信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法 (4)追溯法 (5)循环法 5.信息检索的途径 (1)内部特征途径 a)分类途径 b)主题途径 (2)外部特征途径 a)题名途径 b)著者途径 c)文献编号途径 d)目录检索途径 e)机构检索法 f)引文检索途径 6.布尔模型的优缺点 优点:(1)简单,形式简洁,易于理解; (2)可操作性强,应用广泛; (3)构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确

【重磅】文献检索-在线作业

文献检索_在线作业_1 交卷时间:2016-10-3111:30:47 一、单选题 1. (5分) ? A.“维普中文科技期刊”全文数据库 ? B.中国统计数据库 ? C.中国学术会议论文全文数据库 ? D.中国期刊网全文数据库 纠错 得分:5 知识点:文献检索 展开解析 答案B 解析 2. (5分) ? A.作者 ? B.作者 单位 ? C.发表时间 ? D.题名 纠错 得分:5 知识点:文献检索 展开解析 答案C 解析 可检索到国家及各省市地方统计机构的统计年鉴、海关统计、经济统计快报等月度及季度统计资料的数据库是()。 从CNKI 数据库中记录以下字段,()是跟查找原文无关的。

3. (5分) ? A.标准文献能 ? B.期刊论文 ? C.专利文献 ? D.会议文献 纠错 得分:5 知识点:文献检索展开解析 答案B 解析 4. (5分) ? A.二次文献 ? B.三次文献 ? C.一次文献 ? D.零次文献 纠错 得分:5 知识点:文献检索 展开解析 答案C 解析 5. (5分) ? A.逻辑非 ? B.逻辑与 特种文献不包括()。 直接以自己的生产、科研、社会活动等实践经验为依据生产出来的文献,为()。布尔逻辑算符不包括()。

? C.位置算符 ? D.逻辑或 纠错 得分:5 知识点:9.2文献检索策略的制定 展开解析 答案C 解析 6. (5分 ) ? A.查准率 ? B.误检率 ? C.查全率 ? D.漏检率 纠错 得分:5 知识点:文献检索 展开解析 答案A 解析 7. (5分 ) ? A.查全率 ? B.漏检率 ? C.查准率 ? D.误检率 纠错 得分:5 知识点:1.4文献检索基础知识 展开解析 ()是检索出的相关信息量与检索出的信息总量的百分比。 ()是检出的相关文献与检出的全部文献的百分比。

信息检索基础知识练习题

1. 文献是记录有知识的(A) A 载体 B 纸张 C 光盘 D 磁盘 2. 下列哪种文献属于一次文献( A ) A 期刊论文 B 百科全书 C 综述 D 文摘 3. 下列哪种文献属于二次文献( D ) A 专利文献 B 学位论文 C 会议文献 D 目录 4. 下列哪种文献属于三次文献( C ) A 标准文献 B 学位论文 C 综述 D 文摘 5. 下列选项中属于连续出版物类型的选项有(C) A 图书 B 学位论文 C 科技期刊 D 会议文献 6. 下列选项中属于特种文献类型的有(D) A 报纸 B 图书 C 科技期刊 D 标准文献 7. 以刊载新闻和评论为主的文献是(B) A 图书 B 报纸 C 期刊 D 会议文献 8.《中国图书馆分类法》(简称《中图法》)将图书分成( A ) A 5大部分22个大类

B 5大部分26个大类 C 6大部分22个大类 D 6大部分26个大类 9. 利用文献末尾所附参考文献进行检索的方法是(C) A 倒查法 B 顺查法 C 引文追溯法 D 抽查法 10. 至少由一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合,称为(A) A 数据库 B 记录 C字段 D 文档 11. 广义的信息检索包含两个过程(B) A 检索与利用 B 存储与检索 C 存储与利用 D 检索与报道 12. 中国国家标准的代码是(A) A GB B CB C ZG D CG 13.下列数据库中可以检索期刊论文的是(A) A 万方数据库资源系统 B 超星数字图书馆 C书生之家数字图书馆 D 方正Apabi数字图书馆 14. 期刊论文记录中的“文献出处”字段是指:(C) A 论文的作者 B 论文作者的工作单位 C 刊载论文的期刊名称及年卷期、起止页码 D 收录论文的数据库 15. 以下检索出文献最少的检索式是(C) A a and b B a and b or c

文献检索知识点复习

2020年文献检索课程知识点梳理 第一章绪论 1.信息素养的内容:信息意识,信息知识,信息能力,信息道德 2.情报的三个基本要素:知识性、传递性、效用性 3.文献的三要素:内容、载体、记录方式 例题:以下关于文献的说法正确的有( B ) A.可以没有物质载体,但一定要有知识内容 B.记载知识内容的物质载体 C.可以没有物质载体,但一定要有知识内 D.凡是被人们加以利用的知识均可称为文献 第二章文献检索基础知识 4.《中国图书馆分类法》简称《中图法》,它将知识按照学科属性分为马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书五大部类,22个基本大类,其中R代表医学,H代表语言、文字,I代表文学。 图书馆对馆藏资料进行加工的时候,会依据一定的标准分配给每本图书一个索书号,作为工作人员进行图书上架的依据,同时也是读者查找和获取图书的依据。 5. 数据库类型:数值型数据库、事实型数据库、图像型数据库、全文型数据库。 6.按文献内容的加工深度和内容性质划分: (1)一次文献:即原始文献,是以作者本人的工作经验、观察或实际科研成果为依据而创作的具有一定发明创造或一些新见解的文献。如:期刊论文、专著、科技报告、专利说明、会议论文、学位论文、技术标准等。(特点:内容先进、成熟,叙述具体、详尽,数量庞大、分散) (2)二次文献:即对一定范围、时间和类型的大量一次性文献按其特征收集整理、压缩、加工,并按一定顺序组织编排、用于检索查找利用这些文献而编制的文献。如:书目、索引、文摘、题录、简介等。(特点:汇集性、工具性、综合性、系统性) (3)三次文献:是在充分利用二次文献提供的基础上对一次文献做出的系统整理和概括的论述,并加以分析综合编写而成的概括性文献。主要包括三种类型:①综述研究,如:专题述评、总结报告、动态综述、进展通讯、信息预测、

相关文档
最新文档