信息存储与检索

合集下载

信息检索---名词解释

信息检索---名词解释

一、名词解释信息检索:信息检索最普通的理解就是信息查找。

它是将信息按一定的方式组织起来,并根据信息用户的需求查找出有关的信息的过程和技术。

信息检索又叫做信息存储与检索(information storage and retri)。

信息检索可以分为事实检索、数据检索、文献检索。

特性检索:也称强相关性检索,强调向用户提供高度对口的信息。

强调检索的准确性,对检索结果的数量不作要求。

族性检索:也成弱相关性检索,强调向用户提供系统、完整的信息。

注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息,对准确性要求较低。

特种文献:特种文献是一种不以书刊形式出版的文献,一般不公开发行,它包括专利文献、会议资料、科技报告、技术标淮、学位论文、政府出版物、产品样本及其说明书等。

其特点是内容涉及面广、种类多、数量大、报道快、参考价值高。

OPAC:联机图书馆公共检索目录,有开放的公共查询目录演化而来,是20世纪70年代末美国一些大学图书馆和公共图书馆共同开发的供读者查询馆藏数据的联机书目检索系统。

参考工具书:是指根据人们的需要,把某一范围的知识或资料加以分析、综合或浓缩,并按一定的排检方法编排,以备查阅、参考,用以解决有关事实和数据方面的疑难问题的图书。

年鉴:是系统汇集一年内的主要时事文献、学科进展情况、研究成果及有关统计资料,提供详尽的事实、数据和统计数字,反映近期政治、经济发展的动向及科学文化进步的年度出版物。

手册:是汇集某一方面常需要查考的基本知识和数据资料,以供读者手头随时翻检的一种工具书。

名录:是汇集机构名、人名、地名等专名基本情况和资料的一种工具书。

搜索引擎:就是通过运行一个不断在网络上通过域名扫描和各种链接的软件,自动获得大量站点页面的信息,并按照一定规则归类整理,从而形成数据库,用以提供查询的站点。

图书:论述或介绍某一领域知识的出版物。

期刊:期刊一般是指名称固定、开本一致的定期或不定期连续出版物。

《信息存储与检索》课程案例教学探索

《信息存储与检索》课程案例教学探索

契机 。经 过教 学实 践 , 者摸 索 出 了一 套适 合 本课 笔 程案 例教 学 的独 特方 法 , 以满 足 日益 发 展 的 教 学需
要。
笔者 针对《 息存储 与 检 索》 信 实验 课程 学生 上机
操作 的实 例 , 该课 程 中关 于“ 索词 精化 ” 对 检 的内容 ,
看检 索条 件 2是 否 出现 漏检 、 检 的 问题 。 了解 到 误 在手 术 治疗 近视 眼 的技 术 中 , 用 比较 多的是 “ 采 准分
益经 验 , 也为科 研 工 作 者查 找 学 术 资 料 提供 一 些参 考思 路 。
1 这种 技术 的治疗 效 果众 说 纷纭 , 还是 有不 少 人 想 通 过 这 种技 术 摘 除框 架 但
子激 光术 ” “ 、 角膜 磨 镶 术 ” 。对 于 检 索条 件 2来说 , 篇名 中只 出现关 于治 疗 “ 近视 眼 ” 激 光 术 ” 以及 的“ 、
镜 。特别 是很 多学 生 觉 得 戴 着 一 副框 架 镜 , 不仅 影 响外貌 , 且 运 动 起 来 非 常 不 方 便 , 想 摘 除 框 架 而 很
203 ) 3 0 8
《 息存储 与 检索 》 信 课程 是信 息管 理 与信息 系统 专业 的教 学 计划 中一 门综 合 性 和实践 性很 强 的核心 课程 之一 , 是信 息 管 理领 域 理 论研 究 与技 术发 展 也 最具 活力 的分支学 科 。但正 是 由于其 具 有较 强 的理 论性 和复 杂 的实践 性 , 门课 程 也 成 了讲 授 难 度较 这 大 的一 门课程 。近年 来 , 内外 日渐 兴 起 了 案 例教 国
( 题名 一 近视 眼) 且 ( 名 一术 ) 得 到 1 7篇结 果 。 并 题 , 0

信息检索知识点

信息检索知识点

信息检索知识点信息检索考点整理 1 、信息检索的概念广义的信息检索就是指将信息按一定的方式组织、存储起来,并根据信息用户的需要找出有关信息的过程,包括信息的存储与检索两个过程; 而狭义的信息检索仅指有序化信息的检索查找。

2. 信息检索的原理就就是将检索者的检索提问标识与存储在检索工具中的信息特征标识进行相符性比较,凡就是信息特征标识与检索提问标识相一致或者信息特征标识包含着检索提问的标识,则具有该特征的信息就从检索工具中输出,输出的信息就就是初步命中检索所需的信息。

3 、为什么说信息存储与检索就是两个不可分割的有机体?检索的全过程包括存储与检索两个过程,存储与检索就是相辅相成、不可分割的。

存储过程主要就是利用检索语言对文献进行标引,形成文献特征标识并输入检索工具,为检索提供有规律的检索途径;检索过程主要就是利用检索语言对检索提问进行标引,形成检索提问标识,再按照存储所提供的检索途径,将检索提问标识与文献特征标识进行比较。

检索过程就是存储过程的逆过程。

因此,检索者只有在全面了解存储者就是怎样把文献存入到检索工具中去以后,才知道怎样从检索工具中把所需要的信息检索出来。

4 、信息检索的方法 (1)顺查法 (2)倒查法 (3)抽查法(4)追溯法 (5)循环法 5 、信息检索的途径 (1)内部特征途径a) 分类途径 b) 主题途径 (2)外部特征途径 a) 题名途径 b) 著者途径 c) 文献编号途径 d) 检索途径 e) 机构检索法 f) 引文检索途径 6 、布尔模型的优缺点优点:(1)简单,形式简洁,易于理解;(2) 可操作性强,应用广泛;(3) 构成的逻辑提问式可以表达与用户思维习惯相一致的查询要求,提供非常精确的语义概念;(4) 能处理结构化提问。

缺点:(1)表达用户复杂需求效果欠佳(2)准确匹配无法提供定量比较(3)匹配标准不尽合理(4)检索结果不易控制7 、概率排序原则: 如果一个检索系统对用户的每个检索提问的反应就是以文献集合中的文献按相关性递减的顺序排列的,那么系统的总体效果就是最好的。

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。

( B ) A.文摘、索引等 B.图书 C.百科全书 D.手册3. 以下属于特种文献的是( B )。

A.图书B.科技报告C.报纸 D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权~6. 利用分类途径进行检索,其检索标识为( C ) A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献( C )A. Journal B. Report C. Conference D. Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么( D )A.测试你当天的手气 B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接D.直接跳转到系统认为是最相关的页面…11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况( D )A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程( C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。

A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统…15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好( C )A.关键词摘要 intitle: 知识管理B.论文知识管理 PDFC.学术论文知识管理D.学术论文 intitle:知识管理16. 在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。

信息检索

信息检索

专业科训信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据信息用户的需要找出有关的信息的过程和技术。

狭义的信息检索就是信息检索过程的后半部分,即从信息集合中找出所需要的信息的过程,也就是我们常说的信息查寻(Information Search 或Information Seek)。

信息检索有广义和狭义的之分。

广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。

狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。

狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。

一·按存储与检索对象划分,信息检索可以分为:1·文献检索·2数据检索 3·事实检索以上三种信息检索类型的主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。

二·按存储的载体和实现查找的技术手段为标准划分:1·手工检索 2·机械检索 3·计算机检索其中现在发展比较迅速的计算机检索是“网络信息检索”,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。

按检索途径划分:(1)直接检索,(2)间接检索三·检索方法信息检索方法包括:普通法、追溯法和分段法。

1.普通法是利用书目、文摘、索引等检索工具进行文献资料查找的方法。

运用这种方法的关键在于熟悉各种检索工具的性质、特点和查找过程,从不同角度查找。

普通法又可分为顺检法和倒检法。

顺检法是从过去到现在按时间顺序检索,费用多、效率低;倒检法是逆时间顺序从近期向远期检索,它强调近期资料,重视当前的信息,主动性效果较好。

信息检索-简答题(整理)较全版本

信息检索-简答题(整理)较全版本

四、简答1. 简述信息组织、存储与检索的关系。

答:信息组织、存储与检索三者是不可分割的。

信息检索是通过信息存取系统(即检索工具)来实现的,任何一种信息存取系统都包括信息存储子系统和信息检索子系统,它们是同一事物中既相互对立又相互联系、互为依存的两个方面,而信息存取系统的建设,需要信息组织。

信息组织在信息资源开发中具有重要的地位,在信息管理中具有承上启下的作用,它是建立信息系统的重要条件,是信息存储与检索的基础。

所以,三者是不可分割的。

2. 简述信息存储的含义及作用。

答:信息存储是指通过多种形式记录和排序信息的过程。

它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和内容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。

存储子系统的建设,要求根据一定的原则记录和描述信息或知识载体的内容与形式特征,然后按特征序化成各类信息集合并组织成系统。

信息存储部分是揭示信息特征、整序信息、建设系统的过程。

只有经过记录、描述与组织序化的知识集合,才能提供有效的信息检索。

因此,信息存储是基础,信息检索是目的。

3.文献的概念及分类4.什么是文献类型标识符,在什么情况下使用如何使用答:文献类型标识符:标识各种文献类型的符号。

使用范围:仅在含有各种文献类型的目录及其他检索工具中使用。

使用方法:著录在正题名后面,并用中括号“[ ]”括起来。

5.目录:是图书、期刊或其他单位出版物外表特征的揭示与报道。

它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉及书中的章节或期刊中具体的文章。

6.信息检索语言7.追溯法:8.文献信息资源9.信息的概念是什么信息有哪些特征10.影响查全率和查准率的因素有哪些11试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以及混合分类语言。

关于信息管理与信息系统专业《信息存储与检索》课程的研究

关于信息管理与信息系统专业《信息存储与检索》课程的研究

ma n a g e me n t a n d i n f o r ma t i o n s y s t e m o f t e a c h i n g ma t e i r a l s , a c c o r d i n g t o t h e s e l e c t e d ma t e i r a l s d e s c ib r e d he t me ho t d o f t e a c h i n g c o n t e n t s
软件 2 0 1 3年第 3 4卷 第 5期
S O F T WA R E
国际 I T传媒 品牌
关于信息管理与信息系统专业 信息存储与检索 课程的研究水
张继燕 , 欧莹元
( 毕 节学 院数 学 与计算 机科 学学 院 , 贵州 毕节 5 5 1 7 0 0 )
摘 要 :本文从信息管理与信 息系统的专业 目标开始分析 , 确立 《 信息存储 与检 索》课程在该专业 中的地位 ,然后阐述 《 信息 存储 与检 索》课程 的跨 多学科 的特 点 ,分析 当前 大学的主要教材 ,选择最适合信 息管理 与信 息系统专业的教材 ,针对所选教材 阐
o f” i n f o r ma t i o n s t o r a g e a n d r e t r i e v a l ”c o u r s e p o s i t i o n i n he t p r o f e s s i o n a 1 .a n d t h e n o n” i n f o r ma t i o n s t o r a g e a n d r e t r i e v a l ”c o rs u e mu l t i — d i s c i p l i n a r y c h a r a c t e r i s t i c s ,a n a l y s i s o f c u r r e n t u n i v e r s i t y t e a c h i n g ma t e r i a l ,c h o o s e t h e mo s t s u i t a b l e f o r he t s p e c i a l t y o f i n f o r ma t i o n

《信息学概论》第3章_信息组织、存储与检索

《信息学概论》第3章_信息组织、存储与检索

3.1 信息组织概述
(2) 耗散结构理论 Dissipative Structure
7
Ilya Prigogine 1969。耗散结构理论主要讨论一个系统从混 。 沌向有序转化的机理、条件和规律, 沌向有序转化的机理、条件和规律,研究耗散结构的性质及 其形成、稳定和演化的规律。它指出, 其形成、稳定和演化的规律。它指出,一个远离平衡态的开 放系统,当某个变量变化到一定的临界值时, 放系统,当某个变量变化到一定的临界值时,会通过涨落发 生突变,即发生非平衡相变。原来的混沌无序状态就有可能 生突变,即发生非平衡相变。 转变为一种空间、时间、功能有序的新状态。 转变为一种空间、时间、功能有序的新状态。这种在远离平 衡态的非线性区形成的宏观有序结构, 衡态的非线性区形成的宏观有序结构,需要与外界不断交换 物质和能量才能保持一定的稳定性, 物质和能量才能保持一定的稳定性,或不再因外界的微小扰 动而消失。 动而消失。这种需要耗散物质和能量才能维持其有序性的结 构称为耗散结构。 构称为耗散结构。
3.1 信息组织概述
14
信息学研究信息系统由旧结构不断演变为新结构这一过程的 规律性, 规律性,而协同理论正是以不同学科中现象复杂多样但宏观 质变行为却遵从共同规律的系统为研究对象。 质变行为却遵从共同规律的系统为研究对象。这就提供了运 用协同理论方法研究信息学问题的可能性。 用协同理论方法研究信息学问题的可能性。这种研究的优越 性还在于,信息系统是随时间变化的动态的开放系统, 性还在于,信息系统是随时间变化的动态的开放系统,其内 部存在着众多相互作用的子系统,运用协同理论无需从微观 部存在着众多相互作用的子系统, 上具体掌握其中每一个子系统的细节, 上具体掌握其中每一个子系统的细节,使用少量序参量就可 以表征系统的宏观特性(有序度),进而可以用序参量方程 以表征系统的宏观特性(有序度),进而可以用序参量方程 ), 描述系统由旧结构向新结构转变的复杂过程。 描述系统由旧结构向新结构转变的复杂过程。

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:〔D〕A.万方数据库B.中国期刊全文数据库C.复印报刊资料全文数据库D.中文科技期刊全文数据库2. _______提供一次文献的线索.〔B〕A.文摘、索引等B.图书C.百科全书D.手册3. 以下属于特种文献的是〔 B〕. A.图书 B.科技报告 C.报纸D.期刊4. 用主题词检索只可以检索出对应的〔〕5. 我国制定专利法的主要目的就是为了保护发明创造的〔D〕A.著作权 B.发明权 C.发现权 D.专利权6. 利用分类途径进行检索,其检索标识为〔C〕A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献〔C〕A.Journal B.Report C.Conference D.Patent8. 下列选项中,不属于信息能力的有〔 B〕A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指〔专利注明书〕10. Google搜索引擎的首页面上有一个"手气不错"的按钮,这个按钮的作用是什么?〔D〕A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的 D.直接跳转到系统认为是最相关的页面11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况〔D〕A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程〔C〕A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为〔C〕.A.主题词 B.关键词 C.分类号D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名与其他信息,应在下列哪个数据库中查找?〔C.〕A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?〔C〕A.关键词摘要intitle:知识管理B.论文知识管理PDFC.学术论文知识管理D.学术论文intitle:知识管理16.在中国知网提供的检索服务中,〔检索词扩展〕起到扩展检索的作用.17. 下列哪种语言不属于规范化语言______〔B〕A.分类语言B.叙词语言C.关键词语言D.标题词语言18. 数据库检索中,布尔逻辑检索的逻辑关系中A OR B 又可以表示成〔A〕A.A+B B.A-B C.A*B D.B OR A19. 下列哪些不属于主题途径?〔D〕A.标题B.关键词C.摘要D.ISBN20. 《中华人民共和国专利法》开始实施的时间是〔B〕A.1984年4月l日B.1985年4月1日C.1990年9月7日D.1987年1月1日21. 赵一.科技成果向现实生产力转化.科学学研究,1996,14〔2〕:33-38是< A >A.期刊论文B.专著C.书目D.论文集22. 在检索式中,下列哪一个不能为提高检索的查全率而起到扩展检索范围的作用.〔D〕A.逻辑或B.截词检索C.位置运算符W D.逻辑与23. 在中文网络数据库中,能查到企业名录的是哪一个?〔C〕A.中国知网B.维普中文科技期刊数据库C.万方数据库D.超星数字图书馆24.读者阅读万方资源数据库的全文,需要安装的阅读器是〔PDF〕25. 检索最新的学术动态方面的信息,最好用哪种检索工具书?〔A〕A.手册 B.年鉴 C.期刊 D.书目26. 根据"Anon D..Biomedical applications of nanoscale devices[J].Materials Technology, 2004, 19<2>: 118-119."的著录特点,可以判断,该文献属于〔A〕.A.期刊论文B.图书C.科技报告D.会议论文27. 哪种不属于常规检索方法〔D〕A.直接检索法B.顺查法C.抽查法D.引文法28.根据"林福宗.多媒体技术基础[M].:清华大学,2006."的著录特点,可以判断,该文献属于〔B〕.A.期刊论文B.图书C.科技报告D.会议论文29. 世界三大检索刊物是指SCI<科学引文索引>、EI<工程索引>、ISTP<科技会议录索引>30. 检索2009年中国房地产方面的统计信息,最好用哪种检索工具书?〔A〕 A.年鉴B.手册C.书目D.百科全书31. 课题"查找王安石的相关资料"应用____〔B〕A.分类途径B.主题途径C.作者途径D.高级途径32.在《科学引文索引》中,下列哪个索引能提供从著者单位名称检索文献〔〕33. 查找中文科技期刊全文文献的数据库有〔维普〕二、名词解释1. 主题标引:是依据一定的主题词表或主题标引规则,赋予信息资源语词标识的过程.具体而言,主题标引是在主题分析的基础上,以一定的词表或标引规则作为依据,将信息资源中具有检索意义的特征转换成相应的主题词,并将其组织成表达信息资源内容特征的标识的过程.2. INTERNET〔因特网〕:泛指由多个计算机网络相互连接而成的一个网络,它是在功能和逻辑上组成的一个大型网络.3. 顺查法:就是以课题研究的起始年限为出发点,利用选定的检索工具如书目、索引、文摘又远与近的逐年查找.4. 三次文献:是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为"情报研究"的成果5. 文献信息资源:文献是记录有知识的一切载体,文献信息资源是以文字、图形、符号、声频、视频等方式记录在各种载体上的知识和信息资源.6. 倒查法:一种逆时间顺序由近而远地查找信息的方法.7. 一次文献:即原始文献.它是作者以生产或科研为依据而创作的原始文献.如专著、期刊论文、学位论文等.8. 检索语言:又称为情报语言、情报存储和检索语言、信息组织语言等.它是根据检索的需要而创作的人工语言,把信息的存储和检索联系起来,把标引人员与检索人员联系起来,以便取得共同理解、实现交流的语言.9. 手工检索:是由检索者通过卡片式或书本式的目录、题录、文摘、索引等检索工具查找文献线索的过程.10. 信息检索语言:信息检索语言是用来描述信息的内容特征、外部特征和表达信息检索提问的一种专门语言.11. 特种文献:特种文献是指和获取途径都比较特殊的科技文献.特种文献一般包括会议文献、科技报告、专利文献、学位论文、标准文献等.12. 间接检索法:利用一定检索工具进行文献检索13. 专利:有三层含义:一指受专利法保护的发明,二是指专利权,三指专利说明书等专利文献.这三层含义的核心是受专利法保护的发明,而专利权和专利文献是专利的具体体现.14. 搜索引擎:是一种 Web 上应用的软件系统,它以一定的策略在 Web 上搜集和发现信息,在对信息进行处理和组织后,为用户提供Web信息查询服务.用户可以通过主题浏览和关键词检索的方式搜索所需信息.15. 技术档案:指生产、设计、建设、科研等专业部门,在科技活动中形成的文件、图书、照片、数据等原始记录文献,包括项目规划、设计、实施方案、任务说明书、协议书、技术指标、实验计划等,具有##性和内部使用的特点.16. 索引:根据标题法的原理,将类目与其注释改成标题形式,按字顺排列,并注明相应的分类号.这样不仅可方便查表,而且还可将分类表中因为按学科分类而被分散的同一事物不同方面的类目集中,使分类法在某种程度上兼有主题法的性能.17. 抽查法:针对研究课题发展的特点,选择有关的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法.18. 回溯检索:又叫追溯法,是以某一篇文献末尾所附的参考文献为依据,由近与远进行逐一追踪的查找方法.19. 循环检索:先利用检索工具查出一批有用文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找.20. 追溯法:以已获文献后面所附参考文献为线索进行追溯查找,又称为参考文献法.21. 分类标引:对档案给予分类号标识的过程.22. 目录:是图书、期刊或其他单位出版物外表特征的揭示与报道.它是以一本书、一种刊物为著录的基本单位,记录图书、期刊、资料等的名称、著者、出版项与馆藏项等内容,并按照一定的编排体例进行编制,但不涉与书中的章节或期刊中具体的文章.23. 竞争情报:竞争情报是20世纪80年代在国际上迅速发展起来的一种信息业务,是关于竞争环境、竞争对手和竞争策略的情报研究.三、简答题1. 光盘检索与手工检索相比有哪些优势?使用光盘检索系统,可免除联机检索系统所必须使用的电讯设备,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式光盘存贮容量大,耐用,复制费用低可以把文本,图形,图像,声音与动态形象结合在一起如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又要受到经费限制在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供数据库费用大手工检索的优势〔1〕手工检索能了解标引规则,按规则进行各项的著录,便于检索者根据文献标引规则查阅相关文献.〔2〕手工检索能了解各类检索刊的收录范围、专业覆盖面、特点和编制要点,检索回溯期长,可以提高查全率和查准率.〔3〕手工检索灵活性高、费用低.〔4〕手工检索也便于检索策略的制定和修改,所得到的文献信息一般能符合检索者的信息要求,并且手工检索过程中发现问题,可以与时地修改和提出.手工检索过程中,直接查找任务的是人,在查找过程中,人的思维一直起着主导作用.检索者可以在检索过程中,结合检索的结果不断明确自己的信息需求和不断地修改自己的检索提问.检索提问标识与检索系统中文献特征标识的组配完全可以做到内容、概念和形式上的一致,而无须严格的字面的组配.因此,检索到的文献信息一般能符合检索者的信息要求.〔5〕在载体内容的直观性方面,手工检索也优越于计算机检索.利用手工检索工具,人们无须借助任何转换设备便可一目了然地判读具体文献的描述内容,也能够比较准确地了解其全部.而计算机检索则不然,必须借助于相应的读取工具,如计算机、光盘阅读器等,才能得以判读.手工检索的缺憾:<1> 检索速度慢 <2 >检索受时空的限制 <3> 检索受馆藏资源的限制 <4> 更新周期长 <5> 检索途径少2. 信息的特征有哪些?答:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性3. 简述联机检索的基本原理.信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程.一个典型的计算机信息系统,能完成数据收集,分析,加工处理,存储,传递通信和检索信息的全过程.4. 信息的概念是什么?信息有哪些特征?广义的信息概念:即信息是事物运动的状态和方式,也叫本体论信息狭义的信息概念:即信息是认识主体对事物运动状态和方式的反映,也叫认识论信息信息具有如下几个特征:普遍性、无限性、传递性、可知性与可贮性、动态性、共享性5. 检索系统必备四大要素是什么?答:检索文档〔数据库〕、检索设备〔检索硬件与通讯设施〕、系统规则、相关人员、.6. 简述信息检索语言的功能.信息检索语言是沟通信息存储和信息检索的桥梁;对信息组织人员来说,它是表达信息主题内容,形成标识并赖以组织信息的依据;对信息检索人员来说,它是表达检索需求的依据.7. 简述信息检索的作用.答:全面掌握必要信息;提高信息利用效率;提高信息素质;具有一定经济性.8. 简述信息检索原理〔可以用图描述〕.9. 简述网络信息资源的特点.<1>信息量大,有污染.在Internet上的信息资源数量究竟有多少,谁也说不清楚,因为它是世界上联系在网络上的所有主机里存储的信息总和.有人估计,在Internet上每天发布的新信息约有14万件,它的信息量是过去任何一种存储信息方法所无法比拟的.但同时也产生了信息的污染,任何人只要同网络相联系,就既是网上的信息使用者,也是信息生产者.这就使网上存在有大量信息的同时也产生了一定的垃圾,出现了信息污染.当我们在检索时,往往会出现许多无关的信息,而信息的真伪是需要鉴别的.<2>信息共享性好,更新快.Internet上的信息共享性最好,只要在网上的任何一个主机上发表信息,在全世界范围内都能看到.许多聪明的商家充分利用这一特点在网上大做广告,树立企业形象,推销产品.Internet网络信息的另一特点是新陈代谢快,可以说Internet网络信息资源要比其他信息资源更新得快.<3>信息源分散无序.Internet上的信息源是在每个独立的计算机服务器上,使网上的信息源呈现出分散、无政府状态.用户无法判断网上有多少同自己需求有关的信息,给用户的信息检索带来一定的困难.<4>信息商品化.刚刚利用Internet查询信息时,你可能会感到网上的大量信息在利用时都不需要付费,只要付少量的通讯费就可以了.但只要细心观察就会发现,免费信息多数都是具有一定宣传作用的,真正有用的信息多数是要付费的,可以说Internet上的网络信息具有一定的商品化.10. 什么是检索策略?以Google搜索引擎为例,论述检索策略的优化方法.检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以与查找步骤等.检索策略考虑得是否周全,直接影响文献的查全率和查准率.优化方法略11. 简述信息检索的本质.答:本质就是提问标识语文献标识的对比和匹配.12. 举例说明什么是一次文献、二次文献、三次文献.一次文献指以作者本人的研究成果为依据而创作的原始文献,如期刊论文、研究报告、专利说明书、会议论文等.二次文献是对一次文献进行加工整理后产生的一类方面,如书目、题录、简介、文摘等检索工具.三次文献是在一、二次文献的基础上,经过综合分析而编写出来的文献,人们常把这类文献称为"情报研究"的成果,如综述、专题述评、学科年度总结、进展报告、数据手册等.13. 如果要查找有关"转基因生物和细胞与其制备方法"方面的中外文文献,如何查找?请写出具体的检索步骤.1、分析课题,明确检索要求;2、选择检索系统:要考虑文献类型3、选择检索途径4、选择检索方法5、查找文献线索6、获取原始文献14. 简述文献检索步骤答:明确信息检索需求、选择检索系统、确定检索词、构造检索表达式、实施检索策略并分析结果、检索策略的修改与完善15. 影响查全率和查准率的因素有哪些?查全率:R=检出的相关信息量/检索系统中相关信息总量使用泛指性较强的检索语言<如上位类、上位主题词>能提高查全率,但查准率下降.使用专指性较强的检索语言<如下位类、下位主题词>能提高查准率,但查全率下降主要从以下几个方面考虑:选词、选择数据库是否全面;时间,文献类型16. 信息检索系统都包含哪些子系统?答:文献信息选择子系统;检索语言和名称规范子系统;标引著录子系统;查询子系统;交互子系统;匹配子系统.17. 简述信息检索的特征.答:相关性;不确定性;逻辑性.18. 信息检索智能化主要体现在哪些方面?答:检索技术智能化;检索结果处理智能化;检索服务智能化.19. 某同学在检索一个课题时,第一次检索的结果有200条文献,你建议一下她采用何种方式来缩小检索范围?增加文献的检准率,减少文献的检全率第一,变逻辑或为逻辑非,增加"and"的检索词第二,限定文献的类别,〔如该文献是医学方面的,就将其限定在医学这个大类下〕第三,或变模糊检索为精确检索第四,增加其他的限度,这就要看你自己的,如有没有年限现在啊,作者之类20. 什么是检索策略?计算机检索策略的制定一般经过哪几个步骤?检索策略,就是在分析课题内容具有哪些概念单元的基础上,确定检索系统、检索文档、检索途径和检索词,并科学安排各检索词之间的位置关系和逻辑关系以与查找步骤等.检索策略考虑得是否周全,直接影响文献的查全率和查准率.检索步骤〔1〕弄清信息需求,明确检索目的〔2〕选择数据库,确定检索途径〔3〕确定课题的概念组面和检索标识21. 简述专利的新颖性、创造性与实用性的含义,并说明中国保护的专利有哪几种类型?专利的新颖性,是指申请日前没有同样的发明或者实用新型在国内外出版物上公开发表过、在国内公开使用过或者以其他方式为公众所知,也没有同样的发明或者实用新型由他人向国务院专利行政部门提出过申请并且记载在申请日以后公布的专利申请文件中. 专利的创造性:是指在有新颖性的情况下,不同的技术之间实际上是没有产生意想不到的技术效果,简单说,就是两者之间的差异不明显,而且效果无进步. 专利的实用性:指该理论或者观点的提出对实践的知道程度. 中国保护的专利类型有3种类型,分别是:发明专利、实用新型专利和外观设计专利.22. 什么是信息检索查全率和查准率?两者之间的关系如何?查全率<Recall Ratio> 当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示.这种对信息库检索全面性的测量指标即为查全率.查全率与系统能够检索出的相关文献能力有关.可定义为:查全率 =<检出的相关信息数/信息库中相关信息总数>×100%查准率<Precision Ratio> 当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标.这种对检索结果中的相关信息的测量指标即为查准率.也有称为信号噪声比<signal-to-noise ratio>.查准率与检索出的相关信息数有关.可定义为:查准率 =<检出的相关信息数 /检出的信息总数>×100%查全率和查准率必须结合使用,单独使用两者中的任何一个都不能全面说明检索效果的好坏.若检出 1 篇相关信息,必能达到100% 的查准率,但查全率却会非常低;同样,若检出的信息数等于库##息的总量 a + b + c + d ,则必能获得 100% 的查全率,但很显然查准率必定也低得可怜.查全率和查准率是评价检索效果好坏的指标,而漏检率和误检率则是测量检索误差的指标.23. 影响信息检索效果的因素有哪些?<1> 影响查全率的因素从文献存储来看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等.此外,从情报检索来看,主要有:检索策略过于简单;选词和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等.<2> 影响查准率的因素主要有:索引词不能准确描述文献主题和检索要求;组配规则不严密;选词与词间关系不正确;标引过于详尽;组配错误;检索时所用检索词〔或检索式〕专指度不够,检索面宽于检索要求;检索系统不具备逻辑"非"功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑"或"不当等等.实际上,影响检索效果的因素是非常复杂的.根据国外有关专家所做的实验表明,查全率与查准率是呈互逆关系的.要想做到查全,势必会要对检索范围和限制逐步放宽,则结果是会把很多不相关的文献也带进来,影响了查准率.企图使查全率和查准率都同时提高,不是很容易的.强调一方面,忽视另一方面,也是不妥当的zx.应当根据具体课题的要求,合理调节查全率和查准率,保证检索效果.24. 信息检索的方法有哪几种?从检索手段看,信息检索分为: 手工信息检索机械信息检索计算机信息检索25. 什么是信息检索漏检率和误检率,二者之间的关系如何?误检率为检出的结果中,不相关信息占检出信息的比例.这种对检索结果中不相关信息数的测定即为误检率.可定义为:误检率 =<检出的非相关信息数/检出的信息总数>× 100%漏检率为系统未检索出的相关信息占库中相关信息总数的比例.这种对检索结果中不包含系统中存在的相关信息数的测定即为漏检率.可定义为:漏检率 =<未检出的相关信息数/信息库中相关信息总数>× 100%其实,查全率和漏检率是互补的;而查准率和误检率也是互补关系.即:查全率 + 漏检率 = 1 ;查准率 + 误检率 = 1 .漏检率和误检率则是测量检索误差的指标.26. 试比较分类语言与主题词语言分类语言是运用概念划分的原理,以分类号为标识,将各种概念按学科性质加以划分和排列,用以分门别类地、系统地组织信息的一种检索语言,它又可以分为体系分类语言和组配分类语言以与混合分类语言.主题语言是直接以表达主题内容的语词作为检索标识,以字顺为主要检索途径的标引和检索信息的语言.主题语言是一种描述性语言,它使用自然语言中的词语或规范化的词语来描述文献所论述或研究的事物概念,具有较强的直观性、专指性和灵活性.。

信息检索上机指导书

信息检索上机指导书

1
基础
必修
基础
握搜索引擎的使用,通 过搜索引擎搜寻指定信
息;行
搜索信息。
1) 练习使用各种中文 引擎搜索工具检索国内 信息管理的相关文献资 1 专业 必修 基础 料; 2) 学会将搜索到的信 息总结整理成一篇小论
文。
1) 练习使用各种国外
3.主要仪器设备及耗材
检索终端、网络、CNKI数据资源系统、维普数据资讯系统、
CAJViewer6.0(CAJ浏览器)、Adobe Reader7.0(PDF浏览器)。
4.上机方案或技术路线
实验者自拟若干检索实例,运用典型联机检索系统的不同检索方 法、检索途径进行检索,获取预期的检索结果。
5.上机内容及步骤
信息存储与检索是当代大学生必须具备的能力之一,除了需要了解信息存储与检索的基本 原理与特点以外,更重要的是如何利用工具软件去实现具体的实际信息需求,信息存储与检索 课程能培养学生的信息意识,逐步提高学生的信息素养,以增强其自学和独立研究的能力。因 此,上机实习就具有十分重要的意义。
通过上机实习,提高学生的动手能力、信息存储和检索能力以及获取、利用信息的兴趣, 并灵活运用所学的知识,快速准确地存储与检索所需信息,培养学生利用计算机解决问题的基 本思路和能力。 (二)实验性质:
据库迅速获取相关文献信息。 三、基本原理
信息存储与检索上机实验一般包括以下几个步骤: 1.进入Internet工作环境,熟悉window系统网络环境; 2.分析信息需求,确定信息检索主题,建立信息存储库(数据库/文件); 3.选择相应的检索工具,并输入相关关键信息字段; 4.检查一遍已输入的信息是否有错,如发现有错,则及时修改; 5.进行信息检索,获取信息。如果在检索过程中发现错误,则根据提示找到出错位置和原

信息存储技术与信息检索方法

信息存储技术与信息检索方法
应用领域
信息检索方法广泛应用于图书馆、档案馆、博物馆、新闻媒体、电子商务、社交网络等领域,为用户提供快速、 准确的信息获取服务。
信息检索方法挑战与趋势
挑战
随着互联网信息的爆炸式增长,信息过 载、信息质量参差不齐等问题给信息检 索带来巨大挑战。同时,用户需求的多 样性和个性化也对信息检索提出了更高 的要求。
目录标签
为每个目录添加简短的描述性标签,以便用户快 速了解目录的主题和内容。
目录导航
提供目录导航功能,帮助用户在目录结构中定位 和浏览。
全文检索方法
全文索引
对文档集中的所有文档进行全文 索引,以便快速定位包含用户查 询关键词的文档词进行高亮显示,以便用户快 速浏览和定位关键信息。
信息存储技术与信息检索方法
目 录
• 信息存储技术概述 • 传统信息存储技术 • 现代信息存储技术 • 信息检索方法概述 • 传统信息检索方法 • 现代信息检索方法 • 信息存储技术与信息检索方法融合应用
01 信息存储技术概述
信息存储技术定义与发展
定义
信息存储技术是指将数字、文字、图像、声音等多媒体信息以数字化的形式存 储在计算机硬件设备上,并通过相应的软件进行管理、访问和共享的技术。
02 传统信息存储技术
磁带存储技术
01
02
03
磁带存储原理
利用磁带的磁性材料来记 录数据,通过磁带机读写 数据。
磁带类型
包括数据流磁带、备份磁 带、归档磁带等。
磁带存储优缺点
优点是存储容量大、成本 低、可长期保存;缺点是 读写速度慢、易损坏、管 理复杂。
光盘存储技术
光盘存储原理
01
利用光盘表面的光敏材料来记录数据,通过光盘驱动器读写数

15春西电《信息存储与检索》在线作业答案

15春西电《信息存储与检索》在线作业答案

西电《信息存储与检索》在线作业
一、单选题(共20 道试题,共100 分。


1. 在整个数据库中查找含有特定信息的过程,称之为
A. 检索
B. 指令
C. 标引
D. 分类
正确答案:A
2. ISBN7-302-02372-7是
A. 标准号
B. 专利号
C. 国际标准刊号
D. 国际标准书号
正确答案:D
3. 当检索词必须紧挨着,且词序可变时,应使用算符
A. (1W)
B. (W)或()
C. (N)
D. ?
正确答案:C
4. 检索出具有同一词干的所有形式的词,应使用()
A. 复数形式
B. 概念词
C. 同义词
D. 截词符
正确答案:D
5. 感光材料为载体,利用光学技术将文字、图形、影像等信息符号按比例缩小的文献形式是()
A. 印刷型
B. 缩微型
C. 声像型
D. 计算机存储型
正确答案:B
6. 记录在非正式传播媒体上未经任何加工处理的信息是
A. 零次信息
B. 一次信息。

信息存储与检索的原理

信息存储与检索的原理

信息存储与检索的原理
信息存储与检索的原理是一种用于组织、存储和检索大量信息的方法和技术。

它的主要目标是实现对信息的高效访问和利用。

信息存储与检索过程包括以下几个主要步骤:
1. 数据采集:首先需要采集所需的信息。

这可以通过人工收集、自动获取或来自第三方的数据提供商等方式进行。

2. 数据处理:采集到的原始数据需要进行处理和转换,以满足信息存储与检索系统的需求。

这可能包括数据清洗、数据整合、数据转换等操作。

3. 文档编制:在信息存储与检索系统中,文档是最基本的信息单位。

通过对原始数据进行分析和分类,将其组织成一定格式和结构的文档。

4. 索引构建:为了方便信息的检索,需要对文档进行索引构建。

索引是对文档内容的关键词、属性、特征等进行提取和描述,以便于快速准确地检索。

5. 检索操作:当用户需要获取某一特定信息时,可以通过在索引中进行搜索来找到相关文档。

检索可以根据关键词、属性、范围、逻辑关系等进行。

6. 评价与排序:根据用户的查询意图和相关性进行文档的排序和评价。

这可以使用一些算法和模型来衡量文档的相关性和价值,以便将最相关的结果排在前面。

7. 结果展示:将检索到的文档进行合理的展示和呈现给用户。

这可能包括显示文档的摘要、关键信息、相关链接等。

信息存储与检索的原理依赖于信息的组织、索引和检索能力。

通过采集、处理、编制、构建索引以及执行检索操作,可以帮助用户高效地获取所需的信息。

同时,不断改进和优化相关的算法和模型也是提高信息检索效果的重要措施。

信息存储与检索试卷A

信息存储与检索试卷A

河北经贸大学2013-2014学年第二学期《信息存储与检索》试卷A系别:班级:学号:姓名:(所有答案写到答题纸上,否则无效)一、填空:(每空1分,共15分)1,按文献的加工深度,可将纸质文献划分为______、______、______和______。

2,信息存取模型的信息浏览模型可分为______、________和_______。

3,计算机检索常用的方法有菜单检索、_______、______、_______。

4,计算机信息存取系统按文档组织方式划分有_____和_____。

5,_____、_____和______是搜索引擎的三大支柱技术。

二、选择题(每题1分,共15分)1、利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止的检索方法是()A、逆查法B、顺查法C、追溯法D、抽查法2、下面哪项不是规范检索语言?()A、单元词语言B、关键词语言C、标题词语言D、叙词语言3、下列哪个途径是从文献的内部特征进行检索的?()A、刊名途径B、号码途径C、作者途径D、分类途径4、如果需要检索某位作者的文摘被引用的情况,应该检索:()A、分类索引B、作者索引C、引文索引D、主题索引5、用google检索题目含有“清华大学”、“研究生”的doc格式的文件,应该输入:A、intitle:清华大学研究生site: filetype:docB、ti=清华大学研究生site: filetype:docC、intitle=清华大学* 研究生*site=*filetype=docD、intitle:(清华大学研究生) site: filetype:doc6、下列哪种图书不属于工具类图书?A、科技专著B、字典C、手册D、年鉴7、下列属于信息检索的是()A、在班级中填写家庭情况登记表B、用电子邮件预定宾馆C、到携程网查询航班起飞时间D、用Excel处理成绩统计表8、下列哪个数据库是开放式的数字图书馆?A、万方数据B、超星C、维普D、ELSEVIER9、在机检中,当检索结果太少,查全率较低时,检索式可做如下调整()。

信息检索-检索基本知识

信息检索-检索基本知识
·凡带有“-”,应排在该类0之前,同级号码之后。
19.6.22
排列举例:
1. H1、H12、H、H134、H2、H219、H0、 H-44、 H 2-44 2. TP311.1、F0、G624、F2、O-44、I2457 、 TN912、TP319、
F 181、O13-43 、O-62 3. I247.5/J3、 I247.5/G5、F0/L21、FO/L12
1:H、H-44、H0、H1、H12、H134、H2、H 2-44、H219、 2:F0、F 181、F2、G624、I2457 、O-44、O-62、O13-
43、 TN912、TP311.1、 TP319 3:F0/L12、F0/L21、 I247.5/G5、 I247.5/J3
19.6.22
《科图法》
早,只好用倒查法,新兴学科,起始年代不远,可 用顺查法,波浪发展的学科,可选择发展高峰,用 循环法
19.6.22
检索语言
信息检索要克服的三个语言障碍: ★自然语言障碍 ★学科专业语言障碍 ★检索语言障碍
19.6.22
又称文献存储和检索语言,是根据文献信 息存储与检索的需要而创制的一种人工语言, 是汇集、组织、存储、检索文献信息的工具和 手段。
19.6.22
★00 马列、毛泽东思想 ★10 哲学 ★20 社会科学
21 历史、历史学 … 48 艺术 49 无神论、宗教学 ★50 自然科学 51 数学 … 54 化学 65 农业科学 71 技术科学 ★90 综合性图书
以字符构建主题语言:
1.关键词:直接从文献信息的标题、摘要或内 容本身抽取出来的用于揭示信息主题内容的自 由词。
磁盘式
19.6.22
19.6.22

信息存储与检索技术

信息存储与检索技术

信息存储与检索技术信息存储与检索技术是指通过合理的方法和手段,将大量信息进行有效的存储和快速检索的一门技术。

随着信息时代的到来,人们获取和利用信息的需求日益增长,传统的纸质存储方式已经无法满足人们的需求。

信息存储与检索技术的出现,为人们提供了高效、便捷地获取所需信息的手段。

一、信息存储技术1. 数字化存储:信息存储的基础是数字化。

数字化存储技术将信息转化为能够被计算机识别和处理的数字形式,从而实现信息的高效存储和传递。

数字化存储技术包括扫描、采样、编码等步骤,通过这些步骤将模拟信息转化为数字信号,并将其存储在计算机或其他存储介质中。

2. 数据库技术:数据库是指按照结构化的方式组织和存储数据的集合。

数据库技术可以将大量的数据按照一定的规则和格式存储起来,并提供快速的检索功能。

常见的数据库技术包括关系型数据库、面向对象数据库、NoSQL数据库等。

3. 分布式存储技术:随着信息量的不断增加,传统的集中式存储方式已经难以应对大规模数据的存储需求。

分布式存储技术通过将数据分散存储在多个节点上,提高了存储的可扩展性和容错性。

常见的分布式存储技术包括分布式文件系统、分布式数据库等。

二、信息检索技术1. 关键词检索:关键词检索是信息检索中最常用的一种技术。

用户通过输入与所需信息相关的关键词,系统根据关键词匹配查询目录或索引,找到与关键词相关的信息并返回给用户。

关键词检索技术的优点是方便快捷,但也存在着词义模糊、信息丢失等问题。

2. 自然语言检索:自然语言检索是一种更加智能化的信息检索技术。

用户可以使用自然语言描述所需的信息,系统通过自然语言处理技术将用户的描述转化成可以被计算机理解的语义结构,再进行相关信息的检索。

自然语言检索技术的优势是提高了信息检索的准确性和用户体验,但其实现难度较高。

3. 结构化检索:结构化检索是一种基于信息结构或特定语法的检索技术。

用户需要按照特定的格式或结构组织所需信息,并通过相应的查询语法或规则进行检索。

第三章文献信息检索的基本知识

第三章文献信息检索的基本知识

第三章文献信息检索基本知识随着信息技术的发展,互联网的应用得到广泛普及,信息环境发生了相当大的变化,应用现代化技术手段获取各种信息、知识成为高等院校师生与广大科技工作者的一种必备知识和技能。

为此,首先就必须了解文献信息检索的基本知识。

第一节信息检索的基本原理一、信息检索的概念信息检索(Information Retrieval)全称为“信息存储与检索”(Information Storage and Retrieval),其概念有广义和狭义之分。

广义上认为,信息检索包括文献信息的存储和检索两个方面,即一个完整的信息检索系统由信息存储子系统和信息检索子系统两部分组成。

信息存储子系统:首先对一定数量的信息进行筛选,把能够描述文献信息的外部特征和内部特征进行加工、整理,使之有序化,形成信息特征标识集合,然后将之存储在某种载体上,编制成为检索工具或建立一个数据库。

信息检索子系统:根据信息用户的特定需求,对用户需求进行主题分析,利用一定的检索方法和检索技术,对存储子系统中的特征标识进行比对,把需要的文献线索或知识信息从系统中查找出来的过程,即信息检索。

这就是通常人们所说的信息检索过程,也就是狭义上的信息检索。

信息存储与信息检索是意义不同却又相互联系、相互依存、不可分割的两个过程。

信息存储是为了检索,信息检索又必须先有信息存储。

如果没有存储,检索就无法实现;没有检索,信息存储也就变得没有意义。

所以说存储是检索的前提和基础,检索是存储的目的。

信息检索系统的工作原理如图3-1所示。

图3-1 信息检索系统的工作原理二、 信息检索的类型信息检索可以按不同的划分标准划分为不同的类型。

(一)、 根据检索内容划分根据检索信息内容不同可划分为文献信息检索、事实信息检索和数据信息检索。

1、文献信息检索(document retrieval ):是以文献(包括目录、索引、文摘等二次文献或全文)为检索对象,查找有关文献的出处和收藏处等信息,都属于文献信息检索范畴。

信息存储与检索复习资料答案

信息存储与检索复习资料答案

一、单项选择题1. 以下哪个数据库提供同名作者检索功能:(D )A.万方数据库 B.中国期刊全文数据库C.复印报刊资料全文数据库 D.中文科技期刊全文数据库2. _______提供一次文献的线索。

(B)A.文摘、索引等B.图书C.百科全书D.手册3. 以下属于特种文献的是( B)。

A.图书 B.科技报告 C.报纸D.期刊4. 用主题词检索只可以检索出对应的()5. 我国制定专利法的主要目的就是为了保护发明创造的(D )A.著作权 B.发明权 C.发现权 D.专利权6. 利用分类途径进行检索,其检索标识为( C )A.主题词B.关键词C.分类号D.分子式7. 在一般的著录格式中可以通过_______来判断该文献为会议文献(C )A.Journal B.Report C.Conference D.Patent8. 下列选项中,不属于信息能力的有( B ) A.鉴别 B.传递 C.评价 D.有效利用9. 从狭义上说专利文献就是指(专利注明书)10. Google搜索引擎的首页面上有一个“手气不错”的按钮,这个按钮的作用是什么?(D)A.测试你当天的手气B.提供最相关的一组检索结果列表C.提供最相关的一个检索结果的链接 D.直接跳转到系统认为是最相关的页面11. 利用___索引,我们可以检索任一知名专家的文献被引用的情况(D)A、Citation Index;B、Corporate Index;C、Permuterm Subject Index;D、Source Index;12. 文献信息检索的全过程包括文献信息的______两个过程(C )A.存贮和检索B.存贮和编排C.标引和编排D.存贮和标引13. 利用分类途径进行检索,其检索标识为( C )。

A.主题词 B.关键词 C.分类号 D.分子式14. 已知名叫孙钱章的作者99年出版了一本书,若想找到书名及其他信息,应在下列哪个数据库中查找?( C. )A.中文科技期刊全文数据库B.复印报刊资料全文数据库C. 超星数字图书馆D.万方数据资源系统15. 利用搜索引擎检索有关知识管理方面的学术论文,其检索式采用哪种比较好?(C)A.关键词摘要intitle:知识管理B.论文知识管理PDFC.学术论文知识管理D.学术论文intitle:知识管理16.在中国知网提供的检索服务中,(检索词扩展)起到扩展检索的作用。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课件第一章1 纸质文献资源的存储与组织的4个基本要素:信息内容、载体材料、记录符号和记录方式2 零次文献、一次文献、二次文献、三次文献的区分(课本P23)零次文献:尚未经过系统整理形成正式文献的零散资料,包括草稿、记录和谈话等。

它与一次文献的重大区别在于前者没有形成正式文献,没有正式发表。

一次文献:作者最初发表的原始文献。

主要类型有期刊论文、专利文献、科技报告、会议录、学位论文等等,这些文献具有创新性、实用性和学术性等明显特征,是科技查新工作中进行文献对比分析的主要依据。

二次文献:对一次文献进行加工整理后的产物,用做文献检索工具。

它是将大量分散、零乱、无序的一次文献进行整理、浓缩、提炼,并按照一定的逻辑顺序和科学体系加以编排存储文学类型,如书目、索引、文摘等都是二次文献。

三次文献:在运用一次文献成果并借助二次文献检索的基础上,用科学的研究方法,对一次文献进行综合分析、比较研究,从而揭示某种规律性认识的文献类型。

如综述、述评、百科全书等。

从零次文献、一次文献、二次文献到三次文献,是一个由分散到集中,由无序到有序,由博而精的对知识信息进行不同层次的加工过程。

它们所含信息的质和量是不同的,对于改善人们的知识结构所起到的作用也不同。

零次和一次文献是最基本的信息源,是文献信息检索和利用的主要对象;二次文献是一次文献的集中提炼和有序化,它是文献信息检索的工具;三次文献是把分散的零次文献、一次文献、二次文献,按照专题或知识的门类进行综合分析加工而成的成果,是高度浓缩的文献信息,它既是文献信息检索和利用的对象,又可作为检索文献信息的工具。

3 (课件第二章)信息存储与检索定义信息存储与检索是信息检索的全称形式或广义的信息检索,又称为信息存取,它既包括采用多种形式记录信息、排序信息的信息存储过程,也包括通过一定的设备、采用一定的手段与技巧从信息系统中快速、准确地搜寻所需信息的方法与活动。

广义的信息检索包括信息的存储和检索两个过程。

全称又叫“信息存储与检索”。

信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表特征和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。

而信息检索是指运用编制好的检索工具或检索系统,查找出满足用户要求的特定信息。

狭义的信息检索则仅指该过程的后半部分,即从某一信息集合中找出所需的信息的过程,相当于人们通常所说的信息查询。

4 信息检索方法1. 常规法(工具法),可分为顺查法、倒查法、抽查法;顺查法:即由远及近,如对于发明创造或研究成果从最初的年代按时间先后顺序,往近查找;倒查法:即由近及远,如用于查找新课题;抽查法:利用学科发展的特点,针对该学科兴旺发展时期以及研究处于领先的国家地区;2. 追溯法:当查到一篇参考价值较大的新文献时,以文献后面附的参考文献为线索,由近及远,进行逐一追踪;3. 综合法:又称为分段法或循环法,将常规法和追溯法相结合;5 信息检索语言的类型按照文献信息的特征可分为:描述信息内容特征和描述信息的外部特征的两大类语言:描述信息内容特征的检索语言有:分类语言和主题语言2种1.分类语言分类语言是指以数字、字母或字母与数字结合作为基本字符,采用字符直接连接并以圆点(或其他符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语言。

2.主题语言主题语言又可分为:标题词、单元词、叙词、关键词描述信息的外部特征的检索语言主要是指文献的篇名(书名、刊名、篇名)、作者姓名、出版者、报告号、专利号、文献类型、出版年份等。

6 信息检索的类型(按照执行主体、对象和目标)信息检索按执行主体划分主要有:手工检索、机械检索和计算机检索信息检索按对象和目标划分主要有:事实检索、数据检索、文献检索。

文献检索是信息检索的核心部分,就是从大量的文献集合中查找出符合特定需要的相关文献的过程。

文献检索又可以分为图书检索、期刊检索、专利检索、标准检索、学位论文检索等;事实检索是指用户为了确定某个事件或事实发生的时间、地点和过程等方面的信息而进行的检索;数据检索是指用户利用某些检索工具去查找某个确定性的数值型数据而进行的检索。

它的目的是为了查找某些确定性的数据,而且这种数据是数值型的。

7 几大著名的索引:国外著名的四大索引包括:美国的《工程索引》(Ei)、《科学引文索引》(SCI)、《科技会议录索引》(ISTP)、《科学评论索引》(ISR)。

其他《社会科学引文索引》 SSCI、《科学文摘》SA及其对应的INSPEC存取系统。

8 提问检索式及其构造提问检索式亦称检索式(项)或检索提问表达,它是一个直接面对数据库或检索系统的完整的检索条件表达式,是要求系统执行的检索语句。

最简单的检索式由一个检索词和一个字段名(字段标识)构成。

编写提问检索式主要使用布尔逻辑算符、字段限定符、位置逻辑算符及截词符等,根据检索词之间的关系把若干检索词连接起来,以准确地表达检索提问的内容。

检索提问式的构造:句子切分词汇剔除概念替换概念限定与补充组合式检索式一般的检索提问式:检索词+字段限定符9 关系算符——布尔逻辑算符、字段限定符、位置算符、截词算符布尔逻辑算符逻辑“与”(AND 或 *) 主要用于交叉概念或限定关系概念之间的组配。

逻辑“或”(OR 或 +) 主要用于并列关系的概念组配。

逻辑“非”(NOT 或 -) 主要用于排斥与选择关系的组配。

布尔逻辑算符执行的优先顺序为NOT、AND、OR。

检索字段限定符基本索引字段的限定检索。

为了指定在基本索引的哪个或哪几个字段中检索,可在检索词或检索式后面加上一斜杠“/”,再加上所需限定字段标识。

一般将加有“/”线的字段标识称为后缀代码(简称后缀)。

/TI:题名 /AB:文摘 /DE:叙词 /ID:自由标引词 /NT:注释 /SH:类目标题辅助索引字段的限定检索。

为了指定在辅助索引字段中进行限定检索,可在该检索项(词)的前面加上字段标识与一个等号“=”,通常将这种字段标识符称为前缀代码(简称前缀)。

AU=author(著者) CS=corporate source(著者所属机构) DT=Document Type(文献类型)JN=Journal Name (期刊名称) CO=Company(公司) CC=Classification Code(分类号)SO =Source publication(来源出版物) LA=Language(语种) PY=Publication year(出版年份)UD=Update(更新日期) SP=Conference sponsor(主持单位)位置逻辑算符(W)或( ) —With算符表示在检索结果中(W)算符两侧的检索词必须按此前后邻接的顺序排列,且两个检索词之间不允许有其他词或字母,但可留有空格或连字符。

(nw) —(nw)算符表示在此算符两侧的检索词之间允许插入n个实词或虚词,两个检索词的词序不可颠倒。

(N) —Near算符由(N)连接的检索词在记录中出现的顺序可以调换,但必须彼此相邻。

(nN) —(nN)算符表示算符两侧的检索词(或检索项)之间允许插入n个词,且两个检索项的位置可以调换。

(F) —Field算符表示两侧的检索词必须同时出现在文献记录的同一字段中,如同一文摘或同一标题字段等,算符两侧的检索词次序不变,夹在其中的其他词数量不限。

在位置算符的前面加上NOT即可构成位置算符的逻辑(非)截词检索算符所谓截词检索算符,是指在检索词的某个局部截断,利用检索词的词干或不完整的词形加上截词符号所进行的检索。

截词检索的主要形式是右截词,部分支持中间截词,左截词十分罕见。

截词检索算符包括:1.后截词—前方一致检索,如“milan?”2.前截词—后方一致检索,如“?ment”3.中截断—前后方一致检索,如“wom?n”4.前后截断—中间一致检索,如“?wave?”5.有限截词:在检索词干的左、右方或词中间加截词符“?”或“*”,截词符的个数与允许变化的字符数相同。

如”analy?er”或”teach???”6.无限截词:在检索词词干后面加一个“?”,表示允许在词干后的字符数不限。

10 信息检索步骤1.分析检索课题,明确检索需求。

①检索目的与意图。

②学科范围与主题概念。

③文献性质、类型与数量。

2.制定检索策略。

3.选择检索系统与数据库。

4.确定检索词和检索途径,编制逻辑检索式。

5.检索策略的调整.11 文献检全率和检准率的计算(参见第三章课件及第一次作业)常用的信息检索效果的评价指标有查全率、查准率、漏检率、误检率和响应时间等,最主要的是前四种。

查全率=a/(a+c)*100% 漏检率=c/(a+c)*100%查准率=a/(a+b)*100% 误检率=b/(a+b)*100%12 数据型数据库与事实型数据库的区别 P 44、111、 117-118数据型数据库:存取的内容主要是各类数据,原材料、产品的价格行情,各类经济数据、股市行情、气象数据、经济分析等人口、商品价格、气象数据库,化学分子结构数据库事实型数据库:存取的内容是有关人物、机构、地域、事件等一般性描述的信息,人物传记、机构名录、产品指南、成果介绍数据库,用于人事档案管理、科研项目管理、企业决策、城建管理,13 国内外联机存取系统有哪些,了解概况Internet环境下的联机信息检索与网络信息检索的异同国外联机存取系统:DIALOG系统、STN(系统国际科技信息网络)、OCLC(联机计算机图书馆中心)、FirstSearch(第一检索服务)国内联机存取系统:万方数据资源系统、CNKI 数据资源系统、维普数据资讯系统Internet环境下联机存取系统与网络信息检索系统的差异Internet环境下联机存取系统是通过Internet 获取联机系统数据库中的信息(via the Internet),Internet起“道路”的作用网络信息检索系统是任何用户终端可以通过web搜索引擎或直接进入已知网站获取Internet上的信息(on the internet)联机信息检索与网络信息检索的相似之处1)检索实质相同:都是将文献标识与提问标识相比较、匹配2)逻辑组织大体相同:在逻辑上的核心部分可分为文献库及其索引两部分,两者都使用了词表;3)提供检索的逻辑组配手段相似:均为用户提供构造检索表达式的逻辑方法;4)检索入口相同:提供分类和主题检索两种途径;联机信息检索与网络信息检索的差异1)标引所依据的语言不同:DIALOG等联机系统采用叙词表等人工语言,网络信息检索采用自然语言;2)系统界面设计不同:联机信息系统一直使用非图形界面;网络信息检索采用图形界面。

相关文档
最新文档