第二章 信息检索理论基础
信息检索基础 PPT课件
2.4.2 信息财富
物质、能量、信息是现代社会发展的三大支柱,缺一 不可,而信息资源起着主导作用.
人类财富观:
古代农业社会—农业财富观、货币财富观。 工业社会—股票成为这一时期的财富代言。 20世纪50年代以来—信息资源成为财富的象征。
2.5 信息查询与利用的重要性
数字化时代生存的基本技能:是终身学习的技能, 即具有较强的信息发现、吸收、创新能力。在信息时 代一个人生存的质量如何取决于其信息化程度与信息 素质能力的高低。在信息社会中,个人的信息获取能 力,会对个人的事业成功、经济收入、社会地位即个 人的生存能力产生直接的影响,信息获取能力的差异 有可能形成社会中信息富有和信息贫穷的对立的不平 等情形:一部分人因拥有知识及技巧而能在许多方面 处于有利地位,另一部分人则有可能陷入不利境地。
2.2.4信息、知识与文献的关系
★事物发生发出信息;
★信息经人脑加工变为知识
信息只有经过加工,上升为对自然和社会发展客观规律的 认识,才构成知识。
★知识被记录形成文献;
★文献经传递、应用于理论与实践产生新的信息。
2.4信息社会和信息财富 2.4.1信息社会的特点:信息总量剧增,多媒体
技术和信息高速公路网络被广泛应用,成为信息 社会的重要表征,同时,信息渗入到社会生活的 各个角落,影响和改变了人们的生活和生存方式 。 一个国家的信息化程度,代表着其社会生产力的发 展水平,也决定着这个国家在下一个世纪中存在 与发展的实力和地位,而国家的信息化需要大批 具有信息素质的创造性人才。
3.信息检索方式
(1)根据信息的存储载体和检索技术手段的不同分类 手工检索:传统检索方法,是指手工翻检的方式,利用工具书 等各种印刷版适用于纸质印刷的 书刊文献。 例如:《计算机应用文摘》、《电子科技文摘》等。 计算机检索:使用的是检索系统。系统包括计算机设备、终端 、通信设施、数据库和检索、应用软件等。检索是针对数据 库进行的。即利用计算机检索系统从数据库中检索所需文献 信息。 例如:Dialog、Ei、ISTP、万方数据资源系统等。
文献检索,信息检索(2)第二章 信息检索原理
数据库
检索提问
匹配过程
输出检索结果
二、信息检索的类型
按检索内容划分 1、文献检索
是以文献为检索对象的信息检索。
2、数据检索
是以数据为检索内容的信息检索,要求
从检索系统存储的大量原实检索
是以具体事项为检索内容的信息检索, 要求从检索系统存储的各种原始信息资源中查出专门的 事实材料。
三、检索工具的结构
(一)计算机检索工具结构 1、检索软件 (二)手工检索工具结构
1、使用说明(凡例)
2、目次表 3、正文 4、辅助索引 5、附录
2、数据库
(1)字段 (2)记录
(3)文档(顺排、倒排)
(4)帮助文件
工具书的类型
类型 概念 内容 举例 提供可资参考的知 根据特定的社会需要, 识 内 容 , 如 数 据 、 字典、词典、百科 广泛汇释一定范围内 史实、观点、结论、 全书、类书、政书、 比较成熟的知识,按 定 义 、 公 式 、 分 子 年鉴、手册、名录、 一定的规则编排组织 式 、 人 物 简 介 等 数 表谱、图录等 的工具书。 据和事实信息。 又称线索性工具书 提供查找文献线索 书目、索引、文摘
分类途径 信息内部特征 检索途径 信息外部特征 主题途径 关键词途径 题名途径 著者途径 其它途径
一、根据信息内容特征的检索途径 二、根据信息外部特征的检索途径
第四节
检索工具
检索工具:是在不同学科范围内对 一、检索工具的功能 某阶段出版的有关文献进行收集、整理 二、检索工具的类型 或对新文献加以及时报道的二次文献。
一、检索算符 逻辑与
(一)布尔逻辑算符
布尔逻辑组配运算是采用布尔代数中的 逻辑“与”逻辑“或”、逻辑“非”等算符,
信息检索基本原理
2.1.2 信息检索的基本类型
按照信息检索的对象划分:文献检索、数据 检索、事实检索、全文检索、图像检索和超 文本检索。 按照检索工具划分:直接检索和间接检索。 按照信息检索手段划分:手工信息检索和计 算机信息检索。
按照信息检索对象划分
文献检索:是以文献为检索对象,从已存储 的文献库中查找出特定文献的过程。
例如:“关于自动控制系统有些什么参考文 献”这就需要我们根据课题要求,按照一定 的检索标志(如主题词、分类号等),从所 收藏的文献中查出所需要的文献。
数据检索:是以数据为检索对象,从已收藏 数据资料中查找出特定数据的过程。 例如:查喜马拉雅山有多高,杭州六和塔建 于何年等。
事实检索:即通过对存储的文献中已有的基 本事实,或对数据进行处理(逻辑推理)后 得出新的(即未直接存入或所藏文献中没有 的)事实过程。 例如:本学年成绩优秀的学生有多少,某同 类产品中,哪种品牌的销量最大。
什么是穿孔卡片?
一种由薄纸板制成,用孔洞位置或其组 合表示信息,通过穿孔或轧口方式记录和存 储信息的方形卡片。是手工检索和机械化检 索系统的重要工具。
1)穿孔卡片
2)穿孔纸带
在上世纪70年代磁盘获得广泛应用之前,穿孔 卡片是数据和程序的最主要的信息载体。在那个时 代,电脑既没有配置显示器,也没有打印机,更没 有今天广泛使用的硬盘、软盘和U盘。大学里的学 生去上电脑课时,都要带着从书店里买来的空白卡 片,进入电脑机房后,第一步要做的事情是利用打 孔机在卡片机上凿出一些小孔(这个过程就是编 程)。由于每张卡片只能容纳程序的一小段,需要 把一大叠卡片一张一张地顺序插入卡片阅读机中, 才能将程序全部输入到计算机中,运算结果也通过 纸带穿孔机输出的纸带展现出来。
文献、数据、事实检索区别:
第二章 信息检索原理
2013-11-4
2、主题语言 主题语言是直接以代表信息内容特征和科 学概念的概念词作为检索标识,并按字顺 组织起来的一种检索语言。 分为:规范主题语言和非规范主题语言
2013-11-4
23
1)、规范主题语言 • 以自然语言为基础,经过标准化、规范化处理 的词语,具有概念性、规范性、组配性、语义 性和动态性。
信息源 用户
信息分析、 著录、标引
检索语言 数据库
用户需求分析
信息的表示
存储
检索
检索提问式
匹配过程
输出检索结果
2013-11-4 4
信息检索的实质是一个匹配(match)的过程:
也就是信息用户的需求和信息集合的比较与选择,用户 根据检索需求,对一定的信息集合采用一定的技术手段, 根据一定的线索与准则找出相关的信息。
2013-11-4 27
第三节 检索途径
• 一、信息检索方法
• 二、信息检索途径
2013-11-4
28
1.信息检索的方法
顺查法:从过去某一时间起往现在检索
倒查法:从现在往过去逐年逐月地检索 用户注重新信息,如:写论文
常规法:
信 息 检 索 的 方 法
抽查法就是抽查某一时段的信息.在事 物发展的关键、鼎盛时期,用户注意的 是某些重要的、关键性信息资源
计算机检索简称“机检”,是利用计算机和一定的通信 设备查找所需信息的检索方式.
特点:速度快、效率高、查全较高,成本高,费用大,
查准率通常不尽人意, 现代信息检索即计算机信息检索,是指利用计算机和网 络来处理和查找文献信息的检索方式。目前广泛使用的 计算机检索系统包括光盘系统、联机检索系统和网络检 索系统。
2013-11-4 9
第三节课 第二章 文献检索原理与方法
思考题
1.《中国图书法》(简称《中图法》)将图书分为() A. 5大部类,22个大类 B. 5大部类,26个大类 C. 6大部类,22个大类 D. 6大部类,26个大类 2.《中国图书法》(简称《中图法》)是我国常用的分类法,要 检索农业方面的图书,需要在( )类目下查找。 A. S类目 B. Q类目 C. T类目 D. R类目
第一步,《全国新书目》的新书是安排在"新书视窗"专栏,在 2000年第3期《全国新书目》的目录中寻找到"新书视窗"专栏, 在第41~77页。 第二步,在第41~77页的"新书视窗"专栏里,我们可以看到, 该专栏是按照出版社的顺序排列的。高等教育出版社在第45页, 广东经济出版社第46页,教育科学出版社在第52页。 第三步,在第45、46、52页,你可以看到这几个出版社最 近所出版的新书目录。 如广东经济出版社的目录中有以下记载: 知识经济与改革创新 黄铁苗主编 2000 20cm 25.00元 本书围绕改革开放中的热点、难点问题进行探索,具体内容 包括:所有制问财政金融问题、农村经济问题、就业问题、地方 经济问题和其他问题。
2.检索工具-类型
目录 (bibliography,catalogue) 文摘(abstract) 索引(index)
2.1 目录
目录是一批相关文献信息的著录集合,是以报道文献 出版信息为主要功能的工具。 特点:以单位出版物为著录对象,反映馆藏情况,主 要揭示文献外部特征 目录的著录项目:出版名称、责任者、出版项和稽核 项 目录的类型:《全国总书目》《全国新书目》《全国 西文期刊联合目录》
主题词法与分类法的比较
主题词法 分类法
第二章:信息检索基础
从性质上说: 文献检索是一种相关性检索,检索的结果 是与课题相关的文献或文献线索,而不直 接解答用户所提出的技术问题本身; 事实检索与数据检索则是确定性检索,检 索的结果是用户所需的确切的数据或事实。
2.1.3 信息检索的发展简要历程
手工检索阶段
世界四大检索工具(SCI\EI\ISTP\ISR),1665年《学者周刊》
补充
补充同义词或相关词 补充原词或缩略语
例:基于DSP芯片的虹膜识别系统
补充DSP的全称:数字信号处理(digital signal processing)
毫米波,补充MMW
补充
补充同一词的不同拼写
例1:虹膜识别:iris recognition 或 iris
identification 例2:3维、3D
一定要彻底,必Leabharlann 到词为止,同时也要适度,不能因 切分而改变语义。
例:基于DSP芯片TMS320DM642开发的虹 膜识别系统
基于| DSP |芯片| TMS320DM642 |开发|的|虹 膜|识别|系统
删除
删除虚词 删除过分宽泛和过分具体的限定词 删除存在蕴涵关系的可合并词
例:基于DSP芯片TMS320DM642开发的虹膜识别 系统 DSP |芯片| 虹膜|识别|
题名途径 著者途径 机构途径 代码/序号途径 其他途径
信息外部特征
检索途径
信息内部特征
分类途径 主题途径 关键词途径
分类途径
以学科性质和内容的相应类目、类号为 特征标识的检索方法。分类途经检索与分 类法是相对应的。
目前,我国通用的分类法主要有三种: A《中国图书馆图书分类法》(简称《中图 法》) B《中国科学院图书馆图书分类法》(简称 《科图法》) C《中国人民大学图书馆图书分类法》(简 称《人大法》)
第二章文献信息检索基本理论与方法
4.
《中图法》将学科划分为5个基本部类,22个基 本大类,再进行层层划分,逐级分开。
16
《中图法》五大部类、二十二个基本大类
A、马克思主义、列宁主义 毛泽东思想、邓小平理论 B、哲学、宗教 C、社会科学总论 D、政治、法律 E、军事 F、经济 G、文化、科学、教育、体育 H、语言、文字 I、 文学 J、 艺术 K、历史、地理 N、自然科学总论 O、数理科学和化学 P、天文学、地球科学 Q、生物科学 R、医药、卫生 S、农业科学 T、工业技术 U、交通运输 V、航空、航天 X、环境科学、安全科学 Z、综合性图书
12
分类语言 描述文献内 关键词语言 标题词语言 单元词语言 叙词语言
容特征的语言
检索语言
主题语言
代码语言 书/刊/篇名 描述文献外 表特征的语言 著者姓名
引文 代码/序号
13
(1) 分类语言:是按文献的学科性质给予相应的分 类号,用分类号表达文献主题概念的检索语言, 根据分类表中的顺序编排成分类索引,提供分类 途经供检索文献使用。 它运用概念划分与概括的方法,按照知识门 类的逻辑次序从抽象到具体,从一般到特殊,从 简单到复杂,对知识进行科学划分,从而产生不 同级别且存在隶属关系和体现知识登记体系的类 目一个类目以不同的符号(分类号)作标识,从 而形成了以分类号为标记的体系分类语言。
29
索引分两种: 一种是作为工具书的主体,如文献题名(篇 目)索引。 另一种是作为工具书的一部分,一种检索 途径,内容索引如:主题索引、著者索引 等。 3. 题录是对单篇文献外表特征所作的著录。 著录项目包括文献题目、著者及其所在单 位、出处及文种等。
第二章 信息检索的基本知识
O
数理化 ……………………… … 一级类目 O1 数学 ……………………… … 二级类目 …… O3 力学 ……………………… … 二级类目 O31 理论力学 ……………… … 三级类目 O311 运动学 ……………… … 四级类目 .1 质点运动……… … 五级类目 …… O4 物理学 ………………… … 二级类目
文 献 源
文献 的选 分析 择与 收集
检索工具
文献 特征
标识
数据库
匹配 输出
用 户
信 分析 息 需 求
检索 提问
标 识 语 言
标识
检索提 问式
检 索 结 果
反 馈
从这个图中,我们可以看出两条主线。一条主线是文献检索,通过分析自身 的文献需求,提出检索请求。另一条主线是数据库的建设,通过获取文献源, 对文献进行分类标引入库,建成可检索的数据库。当检索请求与数据库相匹配 后,就返回检索结果,得到需要的文献。
2.按检索方式分
按检索方式分为手工检索(手检)和计算机检索 (机检)两种方式。 (1)手工检索:即用人工来直接查找所需信息的方式,多 利用各种检索工具的印刷版来实现,如印刷型的目录、题 录、文摘、索引等。手检直观,不需要辅助没备,但速度 慢,漏检严重,查全率受信息资源储备数量的限制。 (2)计算机检索:就是将大量的文献资料或数据进行加 工整理,按一定格式存储在机读载体上,建成机读数据库, 利用计算机对数据库进行检索的信息检索方式。与手工检 索相比,计算机检索速度快、效率高、查全率高,不受时 空限制,检索结果输出方式多样等。但查准率与网络及数 据库质量的高低直接相关。
内容特征 标题词 主题语言 关键词 叙词 描述文献外表特征的检索语言,例如篇名、著者姓名、文 献号等作为文献标识与检索依据直接明了,使用时较为简单。 而文献内容特征的语言,也就是分类语言和主题语言的原理和 使用方法是下面主要介绍的内容。
信息检索基本理论
章节:第二章信息检索基本理论学时:2学时教学目的:1 了解信息检索工具的概念、类型。
2 了解检索语言的分类,掌握分类语言、主题检索语言的概念、特点、使用方法。
3 了解《中国图书分类法》、《汉语主题词表》的主要结构。
4 了解信息检索的原理和途径,学会信息检索的方法和检索步骤。
5 掌握信息检索效果的主要评价指标,了解提高检索效果的策略。
重点难点:1 简述信息检索工具的类型。
2 论述分类语言、主题检索语言的原理与特点。
3 简述信息检索的主要步骤。
4 论述提高信息检索效果的方法。
教学进程:1 信息检索工具(15分)。
2 信息检索语言(30分)。
3 信息检索的步骤(25分)。
4 检索效果的评价(25分)5 小结(5分)。
思考题:1简述信息检索工具的种类。
2简述分类语言与主题语言的含义及其特点。
3简述信息检索的步骤、方法。
4简述查全率、查准率的概念,分析影响查全率和查准率的因素,并提出解决办法。
参考资料:1 沈固朝.信息检索(多媒体)教程.北京:高等教育出版社2 华薇娜.网络学术信息资源检索与利用.北京:国防工业出版社3 刘俊熙,王立义.信息检索.北京:北京图书馆出版社备注:第二章信息检索基本理论1 信息检索工具信息检索工具是指人们用来存储、报道和查找文献信息的工具或系统。
在文献检索里面就是我们前面讲到的二次文献。
按照对收录文献的提示方式划分,信息检索工具可分为目录、题录、文摘、索引。
检索工具的作用:1、存储作用检索工具将分散的不同种类、学科文献经过压缩加工系统排列组织到一起。
只有先进行了存储我们才能进行查找。
这样我们不必在查找资料时阅读大量原始文献,只需利用检索工具查找相关主题的目录介绍等来确定我们所需的资料。
在有限时间内提高了工作效率。
2、检索作用存储在检索工具中的资料,可根据我们的需要按一定的方法和规则进行查找。
既然是检索工具集必然具有检索的作用。
3、报道作用检索工具搭建了文献管理者和文献利用者之间沟通联系的桥梁。
第2章 文献信息检索基础
第2章 文献信息检索基础
2) 一次文献 一次文献又称为原始文献,是人们对研究或创造性活动成果的直接记录,一般指公开 出版的著作、期刊论文、科技报告、会议文献、学位论文、发明专利等。 3) 二次文献 二次文献是指通过科学的方法,将分散无序的一次文献经过筛选、分析、整理,按其 内容特征和外部特征进行提炼、浓缩,编制而成的有系统的文献,主要包括目录、文摘、 索引等。 4) 三次文献 三次文献是通过二次文献提供的线索,对某一范围的一次文献进行分析、综合研究、 归纳、整理等深加工所生成的文献。三次文献具有资料性和实用性等特点,是对一次文献 进行浓缩、提炼和重新组织的结果。 三次文献是按知识门类或专题将一次文献信息重新组织、高度浓缩而成的,是人们查 考数据信息和事实信息的主要信息源。 3. 根据出版形式划分 根据出版形式,文献通常划分为图书、连续出版物、特种文献三大类。 1) 图书 图书是对已有研究成果、生产技术知识、实践经验的论述和概括。按其内容性质和作 用,图书可分为普及读物、教科书、丛书、专著、论文集、参考工具书等。
第2章 文献信息检索基础
2) 连续出版物 连续出版物一般是指定期或不定期连续出版的刊物,包括期刊、报纸、年度出版物(年 鉴、指南等)以及成系列的报告、学会会刊和会议录等。连续出版物内容新颖,出版周期短、 速度快,能及时反映最新知识、最新科研成果和最新时事。 期刊(也称杂志)通常有连续的数字编号和发行的顺序时间,是一种以印刷或其他形式逐 次出版发行的出版物。期刊出版周期短,报道速度快,内容新颖广泛,信息量大,发行面 广。 报纸是一种以刊载新闻和评论为主的定期出版物。它比期刊时间性更强,出版周期更 短,报道信息更快。 3) 特种文献 特种文献通常指那些出版发行方式或获取途径比较特殊的文献。类型复杂多样,主要 包括专利文献、标准文献、会议文献、学位论文、科技报告、政府出版物、产品样本和档 案文献等。 专利文献蕴含着大量的技术、法律和经济信息,是记录有关发明创造信息的文献。专 利说明书是主体。与一般文献相比,专利文献具有及时性、新颖性、详尽性、系统性、实 用性、可靠性等特征。 标准文献是对工农业产品和工程建设的质量、规格、检验方法及其技术要求等方面做 出统一规定的规范性文献,具有一定的法律约束力。
最新第2章信息检索基本知识ppt课件
布尔逻辑运算符优先级
• 布尔运算符优先级比较
–有括号时:括号内的先执行; –无括号时:NOT > AND > OR
• 例:检索“唐宋诗歌”的有关信息。 – 关键词:唐、宋、诗歌; – 检索表达式:
• (唐 OR 宋)AND 诗歌; • 唐 AND 诗歌 OR 宋 AND 诗歌; – 错误表达式: • 唐 OR 宋AND诗歌; • 唐 AND 宋AND诗歌; • 唐 OR 宋OR诗歌; • 唐AND 宋OR诗歌;
3、事实检索
是以具体事项为检索内容的信息检索。
(二)按是否使用检索工具划分 1、直接检索
就是指利用一次文献进行检索,这是以前比较常用的一 种查找方法。所花时间多和精力大,检出文献少。
2、间接检索
就是指利用各种检索工具获得文献线索,再根据线索去 查找原始文献线索的方法。
(三)按信息检索手段划分 1、传统信息检索
一、检索工具的功能
1、报道功能 2、存储功能 3、检索功能
二、检索工具的特点
1、详细而又完整地记录了文献的外部特征和内部特征。 2、对所著录的文献,标引了可供检索的检索标识。 3、提供必要的检索手段,配备各种体系的索引。
三、检索工具的类录 2、文摘 3、索引
目索文录引摘:::是把是按一一照种种某或著种多录明种文白文献 题易献录懂中和的具内顺有容序检摘编索要排意的义检文的索献特 工清征具单分。或别清著册录,、通排常序以并一注 如个明:完出人大整处复的以印资出供料版查单检位的或工收具 藏书单。位索为引著的录基的本组基织本单单 元位是。条目,每个条目一般 如由:序《全号国、新书标目识》或索引词、 注释《社、科出新书处目等》 若干环节
2、三者提供的资料不同: 目录提供某一方面较成熟系统的知识,索引、文摘提供相对分散 的资料线索。
第二章 信息检索的基本原理与方法
可见,信息检索的全过程应包括两个主要方面: 可见, 信息标引和存储过程。标引是用检索语言和分类号、 (1)、信息标引和存储过程。标引是用检索语言和分类号、主题词等标识符号 来表示信息,通过对大量无序的信息资源进行标引处理,使之有序化, 来表示信息,通过对大量无序的信息资源进行标引处理,使之有序化,并按 科学的方法存储起来,并组成检索工具或检索文档——组织检索系统的过程; 组织检索系统的过程; 科学的方法存储起来,并组成检索工具或检索文档 组织检索系统的过程 (2)、信息的需求分析和检索过程。分析用户的信息需求, (2)、信息的需求分析和检索过程。分析用户的信息需求,利用组织好的检索 系统,按照系统提供的检索方法和途径检索有关信息 系统,按照系统提供的检索方法和途径检索有关信息——检索系统的应用过 检索系统的应用过 程。
3、信息检索的类型 、
作或过程。
(一)、按检索对象划分,信息检索可以分为:文献检索 、数据检索 、事实检索 )、按检索对象划分,信息检索可以分为: 按检索对象划分 (1)、文献检索:文献检索的概念就是信息检索的概念。 )、文献检索: 文献检索
(2)、数据检索(data retrieval):是从文件、数据库或存储装置中查找和选取所需数据的操 (3)、事实检索:是情报检索的一种类型。广义的事实检索既包括数值数据的检索、算术运
计算机检索的特点: 检索方便快捷; 检索 功能强大; 获得信息类型多; 检索范围广 泛。 其中现在发展比较迅速的计算机检索是 “网络信息检索”,也即网络信息搜索,是 指互联网用户在网络终端,通过特定的网络 搜索工具或是通过浏览的方式,查找并获取 信息的行为。
4、检索的基本原理 、
信息检索基本原理的核心是用户信息需求与文献信息集合的 信息检索基本原理的核心是用户信息需求与文献信息集合的 比较和选择, 是两者匹配(match)的过程。 (match)的过程 比较和选择, 是两者匹配(match)的过程。 一方面是用户的信息需求, 一方面是组织有序的文献信息集 合,检索就是从用户特定的信息需求出发,对特定的信息集 合采用一定的方法、技术手段,根据一定的线索与规则从中 找出(search, locate, hit) 相关的信息。 匹配有其匹配标准,这里涉及到两者一致性、相关度等问题, 按一定的标准筛选出符合要求的信息。
第二章 信息检索基础知识
返回
第二章 信息检索基础知识
文摘:通过描述文献的外部特征和简明深入地 文摘 通过描述文献的外部特征和简明深入地 摘录文献内容要点来报道文献的一种检索 工具。
【题 名】变电站开关操作对屏蔽电缆电磁干扰的预测 【作 者】齐磊 崔翔 华北电力大学高电压与电磁兼容,北京市昌平区 北京市昌平区102206 【机 构】华北电力大学高电压与电磁兼容 北京市昌平区 中国电机工程学报.2007,27(9).-46-51 【刊 名】中国电机工程学报 【ISSN号】0258-8013 号 【C N 号】11-2107 研究变电站瞬态电磁场对屏蔽电缆的电磁耦合问题, 【文 摘】研究变电站瞬态电磁场对屏蔽电缆的电磁耦合问题,对于提高变电站 内二次设备的抗电磁干扰能力具有极为重要的意义。 内二次设备的抗电磁干扰能力具有极为重要的意义。文中将矩量法与传输 线理论相结合, 线理论相结合,应用场线耦合理论计算变电站开关操作产生的空间电磁场 对站内屏蔽电缆的电磁干扰。通过与国际上通用的电磁暂态计算程序EMTP 对站内屏蔽电缆的电磁干扰。通过与国际上通用的电磁暂态计算程序 的计算结果进行比较,验证了计算方法的正确性,同时克服了EMTP只能处 的计算结果进行比较,验证了计算方法的正确性,同时克服了 只能处 理屏蔽电缆与母线平行放置的不足。最后,将该计算方法应用于500kV变电 理屏蔽电缆与母线平行放置的不足。最后,将该计算方法应用于 变电 站开关操作时, 站开关操作时,在屏蔽层不同接地方式的屏蔽电缆上产生的电磁干扰的数 值预测,获得了一些有益的结论,可为工程应用提供一定的理论依据。 值预测,获得了一些有益的结论,可为工程应用提供一定的理论依据。 返回
第二章 信息检索基础知识
第二章 信息检索基础知识 2.1 信息检索的基本原理 2.2 信息检索语言 2.3 信息检索工具与数据库 2.4 计算机检索技术 2.5 信息检索的方法和途径 2.6 计算机信息检索的基本过程 2.7. 检索效果的评价 2.8 文献传递与原始文献的获取
第二讲 第二章 信息检索原理74.ppt.Convertor
第2章信息检索原理2.1 信息检索的基本概念2.1.1信息检索的定义和类型1.信息检索的定义检索的含义“检索就是查找”,这仅仅是一种狭义的解释。
从广义的角度讲,检索包括“存贮”和“查找”两个过程。
没有存贮就没有查找,存贮是为了查找,但查找必须有存贮,两者缺一不可。
“检索”(Retrieval)一词是一个外来词,来源于英语“Information Retrieval”(信息检索)第2章信息检索原理信息检索是指从任何信息集合中查出所需信息的活动、过程与方法。
广义的信息检索还包括信息存贮,两者又往往合并称为"信息存贮与检索"(Information storage and retrieval)。
第2章信息检索原理1.2.3文献的内部特征和外部特征文献的内容特征:就是可以从某种角度反映文献内容的特征。
文献的内部特征包括文献的题目、摘要、由著者或图书情报人员给出的主题词及其分类号。
文献的外部特征:是与内容特征关系不是十分密切的一些特征,包括文献的作者姓名、作者所在的工作单位名称,期刊刊名、会议录名称、专利说明书的专利号和科技报告的报告号等。
这些特征通常在文献的封面或扉页出现。
第2章信息检索原理2.2.1信息检索的一般原理无论是手工检索,还计算机检索,各种检索系统的检索原理基本相同。
简单地讲,就是检索提问标识与存贮在检索工具中的标引标识进行比较,两者一致或信息标引的标识包含着检索提问标识,则具有该标识的信息就从检索工具输出,输出的信息就是检索命中的信息。
存贮过程就是按照检索语言(主题词表或分类表)及其使用原则对原始信息进行处理,形成信息特征标识,为检索提供经过整序(即形成检索途径)的信息集合的过程。
信息检索同样包括存储和检索两个过程。
第2章信息检索原理(1)信息检索根据检索对象不同,可分为:文献检索、数据检索、事实检索A.文献检索(Document Retrieval)。
文献检索是以文献为检索对象的信息检索。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
按照报道内容的深度划分:
国外检索刊物文摘型的多于题录型的。文摘 型的检索刊物,具有报道内容详细、检索途径多、 使用方便等特点,如《化学文摘》、《科学文摘》 等。而题录型检索刊物以出版快、索引多采用关 键词索引、使用方便等特点,如《科学引文索引》 等。
按照报道内容的专业划分:
国外检索刊物专业性的多于综合性的。专业 性的检索刊物除常用的《化学文摘》、《医学文 摘》等以外,多数刊物因为报道范围的限制,文 献量少而较少被国内使用。综合性的检索刊物, 因为历史悠久、报道内容质量高、检索途径多、 使用更为普遍。
三、数据库的建设
我国数据库建设取得了很大成绩,尤其是 20世纪90年代中后期,我国各类文献数据库、 事实型和数值型数据库的比例不断增大,图像 数据库日益受到重视,全文数据库、多媒体数 据库有了很大的发展。数据库内容也由科技领 域为主向经济和社会领域转变。数据库的容量 明显扩大。数据库的分布由以国务院各部门为 主向全社会扩展。在实际应用方面呈现如下特 点: 一是我国数据库的应用领域不断扩大; 二是国产数据库逐渐进入国际市场。
原理
信息存储基本原理
书本式文献的传统存储方法是图书馆纸质文献 管理法和印刷型检索工具的编制,包括图书、期刊、 专利、科技报告、政府出版物、技术标准、会议论 文、学位论文、产品样本、档案十大信息源的分类 存储,由这套系统决定的手工检索体系使文献分类 等描述文献内容的特征处于核心地位,文献篇名、 作者名等描述文献外表特征则是天然的补充要素, 加上主题,构成手检时按分类、主题、号码、作者 名检索的四大途径。 机读信息则以数据库(Database)形式存储。信 息被分类、编码、标识且以数据形式存入数据库后, 计算机就能按电子数据方式进行处理并检索。
1934年,中国化学学会会刊上开辟一个“中国化学摘要”的 栏目,开启了我国文摘型检索工具的先河。国内文献检索刊 物创办于1958年,经过几十年的发展,目前拥有100余种检 索刊物,已形成了具有自己特色较为完整的体系。具体说来, 具有如下特征: 专业覆盖面广,区分细,分册多。但是每一分册的报 道量较少,许多文献甚至没有被报道。 国内检索刊物除少数以题录和目录形式报道文献以外, 多数为题录、简介、文摘相结合的形式报道文献。著录 格式按照国家标准,格式规范,但出版时间较长。 检索刊物一般以分类编排,分类法以国家标准为基础, 但许多检索刊物不设主题索引、著者索引,减低了使用 价值。 大型、综合性的检索刊物《全国报刊索引》(哲社版、 科技版)、《复印报刊资料》系列内容丰富、出版形式 多样、具有权威性受到广泛欢迎,在国内外学术界具有 很大影响。
17世纪许多学者都尝试着编制能反映各国出版 物的“万国书目”,这一努力一直持续到20世纪。 虽然最终没有出现真正意义上的“万国书目”,却 促进了各国国家书目的诞生,在收录范围、分类方 法、检索途径、所提供的书目信息以及编目技术等 方面都有较大的发展。 随着科学技术的发展,教育的普及以及图书贸 易的兴起,书目的功能从单纯记录图书发展到推广 和宣传新版图书,于是营业书目的数量大大增加, 其种类、载体形式趋于多样化,定期报道和评价新 书的书评刊物也出现了。
按照报道文献类型划分:
多数检索刊物对期刊论文、图书、会议文献、 学位论文、科技报告、技术标准等作全面报道, 如《工程索引》、《科学文摘》等;少数检索刊 物专门报道单种文献类型,使用方法比较特殊, 如《世界专利索引》、《科技会议录索引》等。
按照检索语言划分:
大多数检索刊物的正文部分按刊物自编的分 类体系编排,一般都附有主题索引、著者索引。 大型的综合性或专业性检索刊物的主题索引通常 采用叙词语言,如《工程索引》、《科学文摘》 等;题录型检索刊物的主题索引通常采用关键词 语言,如《科学引文索引》、《生物学文摘》等。 大多数检索刊物都提供多种检索途径,以满足读 者多方面的需求。
第二章 信息检索理论基础
信息存储与检索概念的起源
一、基本概念
信息存储与检索的含义
信息检索概念的起源
信息检索
(Information retrieval) 起源于原文献检索、情报检索,在1998年设 置的专业目录中得以改变。
不同的称谓产生于不同的历史背景。
在20世纪中叶以前,信息存储传播 主要以纸质为载体,信息检索活动也围绕 文献的获取和控制展开。因此,信息检索 研究关注的是如何检索利用文献中记录的 信息,从而导致文献检索成为信息检索的 同义词,早期的研究文献中几乎不使用 “信息检索”这一概念。
信息检索的发展
早期的信息检索,人们主要根据文献的 内、外表特征,用手工方式实现。以计算机 技术为核心的信息技术,使信息处理与信息 检索进入了一个新时期。从电脑处理数字信 息发展到处理字符信息,到处理静、动态图 像信息、声音信息等。这一过程不仅拓展了 检索的领域,丰富了检索的内容,提高了检 索的速度。
检索过程
文 献 信 息 特 征
文献信息
分析
标引著录
检索课题
分析
检 索 提 问 特 征
选用
检 索 语 言 和 名 称 规 范
形成
文献 信息标 识(标 引词)
形成
检索 提问标 识(检 索词)
检 索 系 统 ( 标 识 匹 配 )
输出
检 索 结 果
检索系统 三、相关概念 检索工具 检索系统的评价
检索系统
检索系统是指拥有特定的存储和检索技 术设备,存储有经过加工的信息资源,供用 户检索所需信息的工作系统。
检索工具
广义检索工具是指用以报道、存储、查询文献信息的 一切工具和设备。它以各类型原始文献为素材,在广泛 收集并进行严格筛选后,通过特定的信息工作方法,分 析和提示文献的外形特征和内容特征,用选定检索语言 进行描述和标引,形成文献信息单元款目,再将这些款 目按特定规则组织编排而成。它是一个综合的概念,可 以分为手工检索工具、计算机检索工具。从此可以看出, 广义检索工具和检索系统的含义是一致的。 狭义检索工具主要指手工检索工具,又称印刷型检 索工具或书本式检索工具,即印刷装订成册的纸质检索 工具及相应的设施。
英语“书目”(bibliography)一词是由 希腊文 “biblion”(书)和"graphein"(抄写) 两个单词融合而成的,其含义是“图书的抄 写”(the writing of books)。后来其词义 演变成“关于图书的描述”( writing about books)。希腊学者加伦(Galen,129-199)在公 元2世纪就编纂了一些专科书目。8世纪盎格 鲁· 撤克逊学者比德(Bede,673-735)的著作 《宗教史》(Ecclesiastical history)也附 有书目。
二、检索刊物体系的形成
随着大众传播时代的来临,期刊的出现,出现 了以文摘和题录为主的检索刊物。 国外检索刊物出现于19世纪末,但形成较完整 体系并被大量使用则在二战以后。经过一百多年 的发展,目前我们经常使用的国外检索刊物有几 十种,其中除了俄罗斯、日本有全国统一编写的 大型检索刊物以外,其它大多数为专门的出版公 司、学术团体编辑出版。 根据报道内容的深度、专业范围、文献类型、 使用的检索语言,可以将我们常用的国外检索刊 物作如下的划分和情况总结:
检索系统的评价
检索系统的质量影响着检索系统的使用 效果,根据检索课题选择检索系统时需要考 虑检索系统的质量。一般地说,可以从下述 几个角度对检索系统进行评价。
1.检索效率
检索效率是指检索过程和检索结果具有便、快、 全、准、省等特点,即用检索方便性、检索速度、 查全率、查准率、检索成本与效益等指标来衡量。
20世纪50年代以后,社会信息传播与 存储载体呈现多元化,人们不再拘泥于载体 研究信息检索,于是开始使用情报检索一词。 由于汉语中“信息”一词较“情报”一词含 义更为宽泛,加之英语词汇“Information” 具有“情报”、“信息”的含义,因此,近 年来人们越来越倾向于将文献检索、情报检 索转变为信息检索这一更具兼容性的概念, 以便对信息检索实践起到更全面的指导作用。
目前的现状是,上述几个概 念同时使用,因为它们的目的是获 取信息。由信息检索改为信息存储 与检索是为了更好地明确信息存储 与信息检索的关系,从而更有效地 进行信息的获取。
信息存储与检索的含义
信息存储是指依一定的要求把信息整序编排成文 献集合体的过程,即编制检索工具和建设数据库、 建立检索系统的过程,也即广义的信息检索。广义 的信息检索包括信息存储与信息检索两个环节。 狭义的信息检索是指利用编制好的检索工具和检 索系统来查找所需信息的过程。 目前广义的信息检索和狭义的信息检索概念被同 时使用着。
一、早期书目检索工具的编制 信息检索活动是以信息检索工具为依托的。
信息检索工具是信息资源生产者和用户之间的中 介。公元前26年,我国第一部综合性书目检索工 具《七略》问世,这也是世界上第一部印刷型的 书目检索工具。此后,我国先后编制了《七志》、 《七录》、《中经新簿》、《四库全书总目》等 著名的书目检索工具,为人们查询图书、了解图 书流传情况提供了极大方便。
信息检索基本原理
信息检索的基本原理就是,为了文献信息的充分交流和 有效利用,让信息用户能在文献信息的“海洋”中准确、全 面、及时地获取满足特定需要的信息,通过对广泛、大量、 分散、无序的文献信息进行搜集、加工、组织、存储,建成 各种各样的检索系统,在统一存储过程和检索过程所用检索 语言和名称规范的基础上,将用户表达检索课题的标识与检 索系统中表达文献信息内容和形式特征的标识进行相符性比 较(匹配),凡是双方标识一致(完全一致或部分一致)的, 就将具有这些标识的文献信息按要求从检索系统中输出。检 索系统输出的文献信息既可能是用户需要的最终信息,也可 能是用户需要的中介信息(比如文献线索),用户依此中介 信息的指引,可进一步获取需要的最终文献和信息。
我国数据库建设虽然取得了较大进步,但 还存在以下几个突出问题:小型、地方性、 专业性数据库所占比重较大,甚至大型、全 国性数据库存在功能相近的数据库重复建设 的问题。数据库的标准不统一,规范性差。 为了满足社会对信息资源的需求,国家 应对数据库建设进行统一规划、统一管理, 加强数据库的标准建设、加强对数据库知识 产权的保护等等,使我国数据库建设更好地 走规模化、产业化的发展道路。