第四章信息检索原理与检索语言
信息检索之检索语言
![信息检索之检索语言](https://img.taocdn.com/s3/m/1cb417274b73f242336c5fdd.png)
Hale Waihona Puke 数据库的成从使用者观 点观察,数据 库主要由“----记录-----字段----” 三个层次构成。
记录实例 作者: 赵少庆
篇名:信息技术对公共行政的影响论纲。
文章出处:国家行政管理学杂志,2005.12(5) : 345---347
内容摘要:社会信息化是当代社会的一种大趋势, 他正推动着公共行政现在化的进展。信息技术发展 对诸如行政人员、行政决策、行政组织、行政方法、 行政公文、行政管理模式等公共行政管理要素和过 程产生着深远影响。
检索语言是应文献信息的加工、存储和 检索的共同需要而编制的专门语言,是表 达一系列概括文献信息内容和检索课题内 容的概念及其相互关系的一种概念标识系 统。
什么是分类语言?
分类语言也称分类法。用分类号和相应的分类 款目来表达各种概念,以学科体系为基础将各 种概念按学科性质和逻辑层次结构进行分类和 系统排序,能反映事物的从属派生关系,便于 按学科门类进行族性检索。按照分类方式的不 同,分类语言又分为体系分类语言、组配分类 语言和混合分类语言。
布尔逻辑运算:逻辑非
1:组配方式:A NOT B, A-- B表示。检索结果 即为再还有概念A的文献中,排除同时含有B的 概念。 2:作用:排除无关概念,用来缩小检索范围, 提高查准率。 3:实例:ands NOT hearing 检索含有“aids” 的数据,排除含有”hearing”的文献。
信息检索
![信息检索](https://img.taocdn.com/s3/m/4dddc0d626fff705cd170a03.png)
2、 报刊 报刊是一种以印刷形式或其它形式逐次刊行的,通常 有数字或年月日顺序编号的,并打算无限期地连续出 版下去的出版物。 报刊特点:数量大、品种多、内容丰富多样;出版周 期短,报道速度较快;发行、流通广泛、连续性强, 伴随着相应的学科领域发展而发展。 在检索工具的文摘中,往往有卷、期、页的标志(如 Vol. 10, No. 2, 201-209 )
信息检索(Information Retrieval):是指将信息按一 定的方式组织、存储起来,并根据用户的需要找出有 关信息的过程。它的全称又叫做“信息存储与检索” (Information Storage and Retrieval),这是广义的 信息检索。狭义的信息检索仅指该过程的后半部分, 从信息集合中找出所需信息的过程。
4、一、二、三次文献之间的关系 一次文献带有创造性;二次文献是在一次文献基础上 形成的,具有选择性、浓缩性;三次文献是在一、二 次文献基础上经过分析、提炼、总结形成的,具有概 括性。从一次文献到三次文献,是一个由分散到集中、 由无序到有序的过程。
三、按信息的表现形式划分
1、 文献型信息源 存储语言文字形式信息的各种载体的集合。 2、 非文献型信息源 数值型信息源、 声像型信息源、 多媒体信息源、 实物及口头信息源。
三、文献
1.文献的含义 在《文献情报术语国际标准(草案)》 (ISO/DIS5127)中对文献是这样定义的,即“为 了把人类知识传播开来和继承下去,人们用文字、 图形、符号、声频、视频等手段将其记录下来,或 写在纸上,或晒在蓝图上,或摄制在感光片上,或 录到唱片上,或存储在磁盘上。这种附着在各种载 体上的记录统称为文献”。 在《信息与文献术语》(GB/T4894— 2009)中对文献是这样定义的,即“文献,在 文献工作过程中作为一个单位的记录信息或实物对 象”。这里文献工作指的是为了存储、分类检索、 利用或传递而对记录信息所进行的连续和系统的汇 编和处理。
信息检索概论思考题答案
![信息检索概论思考题答案](https://img.taocdn.com/s3/m/9c9ba2194431b90d6c85c78c.png)
第一章信息检索概论思考题:1.什么是信息?简述信息的特点和分类?我们认为,信息是事物或事物之间不确定性的量度,即负熵。
掌握的信息越多,所需认识的事情的确定性就会越少。
信息由信源,信宿和信道(载体)构成。
信息的特点:(1)客观真实性:客观、真实是信息的最重要的本质特性(2)普遍性:信息是物质的普遍属性,物质是具有普遍性,所以信息也拥有该特性(3)针对性:信息的作用和价值可以随着接受者的不同而不同(4)传递性:过程:信息源(信息的发出者)——>编码—>信道(载体)—>译码—>信宿(信息的接收者)信息源:是信息的发出者信宿:是信息的接收者信息的传播是双向的,多维的。
信息源和信宿是相对的,也是可以相互转换的。
信道:就是在传播过程中,编码经过的物理通道(5)时效性:指信息发出、接收到利用的时间间隔及效率,也包括信息的本身更新速度。
客观物质不断的变化,反映事务的运动状态和运动方式的信息也会发展变化一般而言,随着时间的推移,信息的价值会逐渐减少也有反例:如考古信息(恐龙、古钱币),年代越久,使用价值越大衡量信息的时效性参数不只是时间参数,还有地理环境(6)可转换性:信息可以从一种形态转换成另一种形态(7)可处理性(可识别性):可以通过人们的感觉器官所感知,也可以通过仪表、器械来检测进而予以识别。
(8)可共享性:指同一内容的信息可以在同一时间里被若干个用户使用,此时信息载体本身的信息量不会被磨损、消失信息的类型:(1)按信息表现形式划分,可分为文字信息,图象信息,数值数据信息,语音信息。
▪文字信息:文字是人们为了实现信息交流、通信联系所创造的一种约定的形象符号。
▪图象信息:图象(形)是一种视角信息,它比文本信息直接,易于理解。
如,一幅画、一部电影。
▪数值数据信息:数值数据是“信息的数字形式”或“数字化的信息形式”。
▪语音信息:人讲话实际是大脑的某种编码形式的信息转换成的语言信息的输出,是一种最普遍的信息表现形式。
信息检索语言
![信息检索语言](https://img.taocdn.com/s3/m/5751ebfb700abb68a982fb5e.png)
中图法分类简表
(/view.do?id=516)
A B C D E F G H I J K 马克思主义、列宁主义、毛泽东思想、邓小平理论 哲学、宗教 社会科学总论 政治、法律 军事 经济 文化、科学、教育、体育 语言、文字 文学 艺术 历史、地理
中国情报检索语言之近代阶段的特点
①从分类体系来看,冲破了四部分类法的束缚,提出了 新的分类理论,能尽量建立在科学的基础之上,为新 旧书籍、中外图书的统一分类开辟了可行的途径; ②从类目设臵与标记制度来看,比较简单、科学、准确、 便于利用,是中国图书分类法史上的一次重大变革; ③从类分表的结构来看,分类法已经形成为一个完整的 系统,并且有一定的科学理论作为其指导依据及一 定的使用范围作为其实践基础; ④从编制技术上看,既继承了古代分类法的优良传统与 经验,更吸收了国外的先进技术,具有科学性;
信息检索语言的类型
分类语言
分类语言是用分类号和相应分类款目来表达 各种概念的,它以学科体系为基础将各种概 念按学科性质和逻辑层次结构进行分类和系 统排序。分类语言能反映事物的从属派生关 系,便于按学科门类进行族性检索。按照分 类方式的不同,分类语言又分为体系分类语 言、组配分类语言和混合分类语言。
中国情报检索语言之近代阶段的特点(续)
⑤受杜威分类法带来的局限与影响,在类目体系的确立 上表现有机械、呆板、生硬的一面; ⑥对分类法理论中的一些重大问题与实践中出现的情 况未能展开充分的讨论并科学的加以解决,从而在 实际操作中各行其是,影响了图书分类法理论研究 的整体性进展; 在主题法方面:我国近代图书馆的主题编目技术也是于 20世纪初由西方传入的。继而从30年代到50年代, 我国虽然有三、四部中文标题表问世,但是都未能 得到实际的应用。
信息检索电子课件
![信息检索电子课件](https://img.taocdn.com/s3/m/592f2fec856a561252d36f08.png)
信息检索语言 主题 语言 描写文献 内容特征 分类 语言
单元词语言 标题词语言 关键词语言 叙词语言 体系分类语言 组配分类语言 混合分类语言 Return
表2-1 《中图法》结构示意图
基本大类 简表 详表
A 马克思主义、列宁主义 毛泽东思想、 邓小平理论 B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理 N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 U1 综合运输 S 农业科学 U2 铁路运输 T 工业技术 U4 公路运输 U 交通运输 U6 水路运输 V 航空、航天 [U8] 航空运输 X 环境科学、安全科学 Z 综合性图书
工具书概述
第二节
第三节
中文工具书举要
网络工具书
Return
第一节
工具书概述
一、工具书的定义与性质
工具书的定义 工具书的性质
二、工具书的类型
三、工具书综合利用要领
Return
第二节
一、中文检索工具书
目录
中文工具书举要
索引
文摘
二 、中文参考工具书
词语与学科知识检索工具——辞书与百科全书 年度统计资料与统计数据的检索工具——年鉴 数据规格、技术方法的检索工具——手册 人物、机构和地域信息检索工具——名录 实、历法和历史沿革信息的检索工具——表谱 图像信息检索工具——图录 Return
J-D J-E J-F
J-G
经济政治与法律辑
经济、商贸、金融、保险、政论、党建、外交、军事、法律
J-H
教育与社会科学综合辑
信息检索复习题
![信息检索复习题](https://img.taocdn.com/s3/m/65ede74c767f5acfa1c7cdfb.png)
第一章绪论1.1 信息素养与信息教育信息素养,又称信息素质、信息能力,是一个综合性的整体概念,它是将信息意识、信息道德、信息需求动力、信息工具和信息源以及信息评估、吸收与利用有机结合而获得的一种综合能力。
1.2 信息的基本概念信息与知识、情报、文献的联系与区别:信息是指对各种事物的存在方式、运动状态和相互联系特征的一种表达和陈述,是自然界、人类生活和人类思维活动普遍存在的一切物质和事物的属性。
知识来源于信息,是信息的一部分。
是一种特定的人类信息,信息只有经过科学的系统的加工才能上升为知识。
情报是为了解决一个特定问题所需的知识,是激活了的知识,是知识经传递并起作用的部分。
有三个基本属性:知识性、传递性和效用性。
它虽然属于信息的范畴,但不是一般的信息,而是一种特定信息。
文献是记录有信息的一切载体,文献中蕴含着大量的知识和信息,这些知识、信息被用户利用时就转化为情报。
情报源于知识,知识源于信息,文献是信息、知识情报的主要载体形式。
1.3 信息源与信息媒体信息源,就是信息的来源,即人们在科研活动中、日常工作以及其他一切社会实践中所产生的成果和各种原始资料,以及对这些成果和原始资料加工整理而得到的成品等,是能为满足人们特定需要而产生信息的源泉。
按照其存在形式可分为三类:口头信息源、实物信息源和文献信息源。
一次信息媒体:即原始信息媒体或第一手资料,主要是指报道新发明、新创造、新知识、新技术的原始资料,以及直接记载的科研成果调查报告经验总结等,通常亦称原始文献、一次文献。
如期刊文献、会议文献、科技报告/研究报告、专利文献、学位论文、政府出版物、标准文献、科技档案、产品资料等。
第二章信息检索系统概述2.1信息检索系统类型计算机检索系统:其核心是数据库,它是由一个或多个文档构成的大量数据的集合。
按计算机检索系统所含信息资源内容的形式不同分为五种类型:1书目型数据库:存某个学科领域的二次文献信息(文摘或题录)的数据库,提供原始文献信息的梗概和线索。
信息检索原理
![信息检索原理](https://img.taocdn.com/s3/m/f2225226cfc789eb172dc82a.png)
④限定检索技术
使用截词检索,简化了布尔逻辑检索中的逻辑 或功能,并没有改善布尔逻辑检索的性质。使用位 置逻辑检索,只能限制检索词之间的相对位置,不 能完全确定检索词在数据库记录中出现的字段位置, 特别在使用自由词进行全文检索时,需要用字段限 制查找的范围。常用的字段代码有标题( TI )、文 摘(AB)、叙词或受控词(DE或 CT)、标识词或自 由词(ID或 UT)、作者(AU)、语种(LA)、刊名 ( JN )、文献类型( DT )、年代( PY )等。这些限 制符在不同的系统有不同的表达形式和使用规则, 在进行字段限制检索时,应参阅系统及有关数据库 的的使用说明,避免产生检索误差。
②信息检索系统
信息检索系统是根据一定社会 需要和为达到特定的信息交流目的 而建立的一种有序化的信息资源集 合体。信息检索系统通常应是一个 拥有选择、整理、加工、存储、检 索信息的设备与方法,并能向用户 提供信息服务的多功能开放系统。
3、信息检索技术
①布尔逻辑检索技术
②位置逻辑检索技术 ③截词检索技术 ④限定检索技术
对虾 水产
养殖
②位置逻辑检索技术
位置逻辑检索持续术是以数据库原始记录中的检 索词之间的特定位置关系为对象的运算,又称全文检 索。它是一种可以不依赖叙词表而直接使用自由词进 行检索的一种技术。这种检索技术增强了选词的灵活 性,采用具有限定检索词之间位置关系功能的位置逻 辑符进行组配运算,可弥补布尔检索技术只是定性规 定参加运算的检索词在检索中的出现规律满足检索逻 辑即为命中结果,不考虑检索词词间关系是否符合需 求,而易造成误检的不足。在不同的检索系统中,位 置逻辑算符的种类和表达形式不完全相同,使用位置 逻辑检索技术时,注意所利用系统的使用规则。 在位置逻辑符中,常用的位置逻辑算符有(W)与 (nW)、(N)与(nN)、(S)、(F)。
信息检索考试学习资料
![信息检索考试学习资料](https://img.taocdn.com/s3/m/ec70df07a6c30c2259019e71.png)
第二章信息与信息资源第一节信息、知识、情报和文献一、信息、知识、情报和文献的1、信息信息是客观存在的事物现象,是生物体或具有一定功能的机器可以感知的客观事物发出的一切有意义的信号和信息。
2、知识知识就是人类认识的成果或结晶,知识也就是信息,是信息的高级形式。
3、情报情报是指用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的知识。
4、文献人们用文字、图形、符号、声频和视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或设置在感光胶片上,或录制在胶片上,或存储在磁带、磁盘上。
这种附着在各种载体上的知识,统称为文献。
文献就是记录有知识的一切载体。
5、信息社会建立在以知识生产、分配、加工和利用基础的新型社会。
第二节信息资源的类型一、按出版形式分1、图书2、期刊3、科技报告4、会议文献5、学位论文6、专利文献7、标准文献8、技术档案9、产品资料10、政府出版物二、按加工内容的深度分1、零次文献未经公开发表或未交流的文献2、一次文献是指以作者本人的研究成果为依据而创作的原始文献。
如学术报告、报刊论文、科研报告、学位论文、档案资料、会议论文等。
3、二次文献二次文献是对具有信息检索价值的一次文献进行搜集、整理、加工、提炼,按一定顺序组织起来的文献。
主要包括书目、索引、文摘、题录等。
是用来报道和检索一次文献的检索工具或检索系统。
4、三次文献是指利用二次文献,搜集大量一次文献进行研究,经过系统整理综合分析而撰写出来的文献。
主要包括综述、年鉴、词典、手册等。
第三章信息检索第一节信息检索概述一、信息检索的定义广义的讲,信息检索就是将信息按照一定的方式组织和存储起来,并根据信息用户的需要找出有关信息的过程。
它包括信息存储和检索两个过程。
狭义的讲,信息检索是从信息集合中找出所需要的过程,即信息的检索过程。
二、信息检索原理信息检索的基本原理就是将信息存储和检索两个过程中的存储特征标识和检索提问标识进行对比,二者匹配达到一致,即可获取符合条件的信息。
信息检索语言
![信息检索语言](https://img.taocdn.com/s3/m/7d562ad70c22590102029d6e.png)
等级列举式分类法 U448.1 各种桥梁 U448.1 桥梁、按用途分 U448.11 人行桥 U448.12 两用桥 U448.13 铁路桥 …… U448.2 桥梁、按结构分
分面组配分类法
地区分面
E1 中国 E2 朝鲜 E3 韩国 E4 日本 ……
体裁分面
D1 诗歌 D2 戏剧 D3 小说 D4 散文 ……
中国
《中国图书馆图书分类法》 《中国科学院图书馆图书分类法》 《中国人民大学图书馆图书分类法》
印度 《冒号分类法》 《国际专利分类法》
9.《中国图书馆分类法》
五大部类:
22个基本大类: A 马克思主义、列宁主义、毛泽东思想、邓小平理论; B 哲学、宗 教; C 社会科学总论; D 政治、法律; E 军事; F 经济; G 文 化、科学、教育、体育;; H 语言、文字; I 文学; J 艺术; K 历史、地理; N 自然科学总论; O 数理科学和化学; P 天文学、地球科学; Q 生物科学; R 医药、卫生; S 农业科 学; T 工业技术; U 交通运输; V 航空、航天; X 环境科 学、安全科学; Z 综合性图书
标题词语言; 单元词语言; 叙词语言; 关键词语言
三、分类语言
1.基本概念: 亦称体系分类语言,是以学科范畴和学科体系为基础来划分事物的 一种检索语言。在信息存储和检索中,它是一种对信息内容的概念进行 逻辑分类和有规律地系统排列而构成的检索语言,并以分类表(分类法)的 形式体现。 分类语言最显明的特点是系统性,具有族性检索的功能,有利于人 们从学科专业的角度进行全面性的检索。
2.分类语言的局限性: 间接性。使用分类语言进行信息检索,检索者需要两重转换。 分类语言不能按主题集中信息。 从实际需要看,大量的检索课题需 要按主题进行特性检索,体系分类语言不适合这种多维性的专题概念的 特性检索。 3.分类语言的类型: • 按照编制方法分: – 等级列举式分类法 – 分面组配分类法 – 列举-组配分类法
信息检索基础 检索语言及其分类
![信息检索基础 检索语言及其分类](https://img.taocdn.com/s3/m/d8a9643553ea551810a6f524ccbff121dd36c5a3.png)
《中国图书馆图书分类法》
R91下分为R911药物数学、R912药物物理学、R913 药物物理化学、R914药物化学、R915药物生物学。 R914下又分为{R914.1}药物分析、R914.2药物设 计 、 R914.3 无 机 药 学 化 学 、 R914.4 有 机 药 物 化 学 、 R914.5有机合成药物化学。
医学信息检索
检索语言及其分类
教 学
目 标
1
了解检索语言的分类
2
熟悉《中国图书馆图书分类法》
3
熟悉《医学主题词表》(MeSH)
了解检索语言的分类
检索语言是信息检索中用来描述文献特征和表达检索提问内容的一种专门性的人工语言,是一组有规则 的、能够反映出信息内容及特征的标识符,用于联系文献信息与用户需求的“语言括主题词和关键词语言。主题词语言与关键词语言的区别在于规范化程度不同。 ○关键词又名自由词,中选取的具有实质意义的名词,这种词不受主题词表限制,一般是未经规是从文献范
化或略规范化的词,常用于一般检索或精度要求不高的检索。 ○主题词是规范化词汇,最大的优点是概念准确、专指度高。它对文献中出现的同义词、近义词、多义词以
思 考 题
1
简述检索语言的分类及其特点
2
《中国图书馆图书分类法》分类体系是怎样的
3
主题词与关键词的区别是什么
图1主题:氟哌酸*胃肠炎 图2 主题:诺氟沙星*胃肠炎
《医学主题词表》(MeSH)
主题检索语言是信息检索语言中检索效率较高、使用频率较多的一种语言。人们为了更快更 好地检索文献,将概念更准确、专指度更高的反映文献内容的主题词编制成专门的主题词表, 供大家使用。目前国内最常用的主题词表是《医学主题词表》(MeSH)、《中医药学主题 词表》和《汉语主题词表》。 《医学主题词表》(MeSH)是美国国家医学图书馆从1960年起编制,并于1963年正式使 用的一部规范化的可扩充的动态性叙词表,是生物医学领域具有权威性的主题词表。MeSH 主要包括主题词表和树状结构表两个部分。
信息检索
![信息检索](https://img.taocdn.com/s3/m/1e4fa91d866fb84ae45c8d41.png)
文献:记录信息和知识的一切载体。
文献检索:以文献为检索对象,查找含有用户所含信息的文献。
文摘:是将论文或专著的内容加以浓缩,以精炼的语言把文献信息的重要内容,学术观点,数据及结构准确的描述下来并按一定目录规则与排列起来,供读者查阅的一种信息系统.核心期刊是科技期刊中少数高质量的特定期刊,指各学科领域刊载本专业高水平学术论文,能反映本学科最新研究成果及前沿研究状况与发展趋势的期刊,其载文率、被引用率以及参考利用价值都很高.浏览法:直接浏览最新期刊,特别是核心期刊上的一次文献。
追溯法:当查到一篇参考价值较大的新文献后,以文献后面附的参考文献为线索,由近及远,进行逐一追踪的方法。
顺查法:是由旧到新的查找。
多用于已知所查主题起始年代。
倒查法:是由新到旧的查找。
多用于查找新课题或某课题的新内容。
抽查法:有选择地在某课题文献发表较集中的年限查找。
多用于事先了解该学科或课题的发展历史背景。
循环法:又称分段法,是交替使用“常用法”和“追溯法”来进行检索的综合检索方法。
即利用检索工具查到一批文献资料,又利用这些文献所附的参考文献追溯查找。
信息:是客观存在的事物现象,是生物体或有一定功能的机器可以感知的客观事物发出的一切有意义的信号和消息。
特点:客观性、可认知性、传递性、时效性知识:是人们对自然界、人类社会中各种信息进行思维分析、加工提炼、并加以系统和深化而形成的信息集合。
情报:用不同的方法和手段,在有效的时间内所获得的有针对性和有价值的信息或知识。
特点:传递性、时效性查全率:在信息检索结果中,检索出的相关信息占信息检索系统中相关信息的比例.查准率:是指系统进行检索时,系统中检出的相关文献量与检出的文献总量的比率。
数据库:是计算机存储设备上按一定方式存储的相互关联的数据集合,同时又反作用于新形象检索.搜索引擎:指根据一定的策略、运用特定的计算机程序搜索互联网上的信息,对信息进行组织和处理后显示给用户,是为用户提供检索服务的系统。
文献检索1-4 文献信息检索原理
![文献检索1-4 文献信息检索原理](https://img.taocdn.com/s3/m/989dc4ec49649b6648d74751.png)
1.1 信息检索的含义
信息检索:信息检索通常是指从任何方式
组成的信息集合中,查找特定用户在特定时 间和条件下所需信息的方法与过程。因此, 完整的信息检索应包括以下两个方面:
1. 信息标引和存储过程 2. 信息的检索过程
信息检索基本原理的核心是:用户信息需求与文献 信息集合的比较和选择, 是两者匹配(match)的过程。
1)分类检索 2)主题检索 3)作者检索 4)名称检索 5)号码检索
反映文献内部(信息内容)特征 反映文献的外部特征
10
示例 一
研究课题名称: 计算机辅助工艺设计系统
提问特征
1.计算机 2.辅助工艺 3.设计系统
1.3 信息检索的类型和特点
1、文献信息检索
是指依据一定的方法,从已经组织好的文献信 息集合中,查出所需特定文献信息的过程。
一般
如果不刻意区分:你完全可以认为它们没有区别!
1.2 信息检索的实质
将描述特定用户所需信息的提问特征,与 信息存储的检索标识进行异同的比较,从 中找出与提问特征一致或基本一致的信息。
提问特征是指从欲检索课题中选择出能代 表信息需求的主题词、关键词或分类号等。
检索点
检索点(access point)是检索的出发点,常被 称为“检索途径”(approach )。 常用的检索途 径有:
缺点:缺乏专指性,查准率不高,不能满足专 深课题以及新兴学科、交叉学科和边缘学科知 识的检索。
分类检索语言
国外常用的分类法: 《国际十进分类法》(Universal Decimal
Classification, 简称UDC) 《杜威十进分类法》(Dewey Decimal
Classification, 简称DDC) 《美国国会图书馆图书分类法》(Library of
信息检索
![信息检索](https://img.taocdn.com/s3/m/a0b1613483c4bb4cf7ecd122.png)
2.按信息的加工级别划分
• 零次文献(实验记录、手稿、原始录音、谈话记录等) • 一次文献(图书、期刊论文、会议论文、科技报告、专
利、标准等)
• 二次文献 (目录、题录、文摘等) • 三次文献 (文献综述、年鉴、词典)
三次文献之相互关系
读者查找
一次文献
二次文献
三次文献
作者发表
三、 信息检索的技术与方法
信息检索的技术
• 布尔逻辑检索 • 截词检索 • 限制检索
(一) 布尔逻辑检索
• 布尔逻辑组配运算是采用布尔代数中的逻辑 “与”、逻辑“或”、逻辑“非”等算符,将 检索提问式转换成逻辑表达式,限定检索词在 记录中必须存在的条件或不能出现的条件。
• 凡符合布尔逻辑所规定的条件的文献,即为命中文献。
以事实作为检索对象,查找用户所需的描述性 事实,其检索对象为机构、企业、人物的基本 情况、历史变迁等。 百科全书、工具书
(二)信息检索的意义
1.节约研究人员的时间,避免重复劳动 科学研究具有继承和创造两重性,科学 研究的两重性要求科研人员在探索未知或 从事研究工作之前,应该尽可能地占有与 之相关的信息。信息检索是研究工作的基 础和必要环节,成功的信息检索无疑会节 省研究人员的大量时间,使其能用更多的 时间和精力进行科学研究。
1. 逻辑“与”(并且)
• 符号:“and” 或“*”表示 • 表达式:A*B 或者 A and B
• 意义:检索记录中必须同时含有检索词AB的 文献,才算命中文献 • 作用:增加限制条件,即增加检索的专指性, 以缩小提问范围,减少文献输出量,提高查 准率。
2. 逻辑“或”(或者)
• 符号:“or” 或 “+”表示 • 表达式:A OR B 或 A+B • 意义:检索记录中凡含有检索词A或含有检索 词B,或同时含有检索词A、B的,均为命中文 献文章。 • 作用:放宽提问范围,增加检索结果,起扩 检作用,提高查全率。
信息检索学习笔记
![信息检索学习笔记](https://img.taocdn.com/s3/m/e0d1ce2bcc17552707220859.png)
信息检索第一章信息检索的基础理论第一节基础概念一、信息概述(一)信息的定义:信息指的是事物的存在方式和运动状态,是对客观世界中各种事物变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。
世界三大基本要素:信息物质能量(二)信息的特征1.客观性①信息来源于物质,又不是物质本身;它从物质的运动中产生出来,又可以脱离物质相对独立地存在。
②信息业来源于精神世界,但又不限于精神的领域。
③信息是具体的,并且可以被人所感知、提取、识别,可以传递、存储、变换、显示、检索和利用。
2.普遍性3.可存储性4.可传递性5.扩散性6.共享性7.时效性(三)信息的功能1.经济功能①运用信息可以使非资源转化为资源创造财富。
②使用信息取代劳动力、资金、材料等资源创造财富,实现经济效益倍增。
③直接让信息作为商品在市场流通中创造财富。
④通过信息进行科学决策,减少失误,创造财富。
2.管理与协调功能5M资源:人、财、物、设备、管理办法信息的管理与协调功能在组织活动中的作用:①传递整个组织的运行目的,有效管理5M资源。
②调节和控制物质流和能源流的数量、方向和速度。
③传递外界对系统的作用,保持组织的内部环境稳定。
3.选择和决策功能4.研究与开发功能二、知识1.知识的概念:知识是人类社会实践经验的总结,是人的主观世界对于客观世界的概括和如实反映,是人类对自然界、人类社会以及思维方式与运动规律的认识。
2.知识的类型①显性知识和隐性知识。
②实体知识和过程知识。
③核心知识和非核心知识。
三、情报1.情报的概念:情报是具有特定传递对象的特定知识货有价值的信息。
2.情报的特征①动态性②按特定的方式传递③为特定目的服务的④常常有一定的时效性和机密性3.情报的类型零次情报:私人笔记、手稿、设计草图、会议记录、口头言论等。
一次情报:调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。
二次情报:书目、索引、文摘等三次情报:综述、专题评论、年度总结、研究进展报告、数据手册、专业年鉴等。
信息检索知识
![信息检索知识](https://img.taocdn.com/s3/m/bb51fa68a45177232f60a279.png)
tumor(瘤)or carcinoma(癌) or neoplasm (新生物)。
A OR B
8
逻辑“非” NOT/检索式“A not B”表示包含检索词A同时不包 含检索词B的文献为命中文献。 如:查“动物的乙肝病毒(不要人的)”的文献 的检索式为hepatitis B virus(乙肝病毒)
not human(人类)。
A NOT B
9
邻近度算符 With 检索式“A with B”表示检索词A和检索词B 不仅要同时出现在一条记录中,还要同时出现 在一个字段里的文献才是命中文献. 如:“drug with abuse”检索出的是同一个字 段中同时出现这两个词的记录。
10
邻近度算符Near
Willian Henry Harrison →Harrison W H 姓前有前缀M’、Mc、Mac,在索引中一律按Mac的字顺排 在一起 姓前带 冠词 De、Della、Des、La、Van、Vanden、Von 与姓名字顺一起排列; 有等级制称号的著者排在无等级制称号的著者之后,先排 Johs W 后排Johs W jr 音译中国人著者-按汉语拼音著录;俄国人-按英俄文音译 对照表;日本人-按黑本氏英日文音译对照表对译。 学术团体,企业单位等名称按原名著录,并加国名以示区 别。
33
主题词检索
34
检索步骤: 1、点击[主题词]按钮 2、输入检索词(中文或外文),点击[浏览]按钮 3、选中所要检索的主题词,点击[主题词注释]按钮之后, 可对该词进行不扩展、扩展、加权检索及树状结构选择 4、点击[检索]按钮,选择相应的副主题词与主题词进行组 配检索
35
索引词检索
36
检索步骤: 1、点击索引词[浏览] 2、输入检索词,点击[浏览]按钮 3、通过浏览选择检索词,点击[检索]按钮 备注: 检索多个索引词时,使用[加入列表]、 [浏览列 表]和[检索列表] 按钮
第四章_中文文献信息检索
![第四章_中文文献信息检索](https://img.taocdn.com/s3/m/bf6827afdd3383c4bb4cd209.png)
(7)OPAC书目数据库系统
• OPAC(Online Public Access Catalogue)即联
机公共检索目录,是供图书馆用户查询馆藏的联机 目录检索系统。 • 检索字段说明 • 题名--包括正题名、并列题名、从属题名、其它题 名、丛书名等等。责任者—即文献的编者、著者、 译者、撰者、校注者等。既包括个人责任者,也包 括团体责任者,出版者--是指文献的出版或印刷机 构。分类号--文献的学科属性标识。如:红楼梦, 分类号为I242.47。 • 查询古籍文献时,在“分类号”中输入部和类,中 间加间隔号“·”,例如“经部· 易类”,在检索时所 有“经部· 易类”的古籍或“易类”下各细类的古籍, 都为符合条件的书目信息。具体参见“中文古籍分 类简表”。
数据库检索
•
键入网址, 登录到CALIS联机公共数据库查询系统主页, 选择中文、英文或 日文联合目录数据库。 检索方式 高级查询界面: a.在第一个列单中选择检索字段:包括题名、著者、丛编题名、主题、 订购号、ISBN、ISSN等或在所有字段里进行全面检索。 b.确定检索词的匹配模式:选择开头为表示前方一致,选择结尾为表示 与检索词后方一致, 选择包含表示检索词出现在检索字段的任意位臵,严格 等于表示与检索词精确匹配,模糊匹配是指与检索词基本相同但不完全等于 的一种匹配方式。 c.在输入框里输入检索词。 d.如果要进行多个检索条件的复合检索,根据检索条件的逻辑关系,在第 四个选择框里选择并且、或者、非 e.点击查询按纽。 高级查询可以从更多选项进行进一步限制。 a.限定资料类型: • b.限定语言: • c.限定出版年 • 显示结果 点击想要查看的记录,系统显示详细书目信息,并显示CALIS院校的馆藏信 息。
• ISBN—International Standard Book Number国
信息检索的基本原理
![信息检索的基本原理](https://img.taocdn.com/s3/m/e468462ba55177232f60ddccda38376baf1fe0d7.png)
信息检索是通过使用计算机技术和算法来从大量信息中获取有用的信息。它 是一个重要且日益发展的领域,对于帮助人们解决问题和做出决策至关重要。
定义与重要性
信息检索是通过搜索和排序算法从大型数据库中检索相关信息的过程。它对于研究、教育、商业等领域具有重 要意义,可以帮助人们快速找到所需的信息。
利用机器学习和自然语言处理技 术进一步提升检索结果的准确性。
通过虚拟现实技术改善用户体验, 实现更直观的信息检索。
随着语音识别技术的发展,语音 搜索将成为趋势。
评价指标
1 查准率
检索结果中相关文档的比 例。
2 查全率
检索到的与查询相关的文 档比例。
3 平均检索时间
检索一个查询的平均时间。
挑。
多语言处理
支持多种语言的检索和处理。
个性化推荐
根据用户兴趣和历史记录进行 个性化推荐。
未来发展趋势
人工智能
虚拟现实
语音搜索
基本流程
1
需求分析
明确用户的信息需求,确定搜索范围和关键词。
2
信息检索
使用搜索引擎或数据库执行信息检索。
3
评价与调整
评估检索结果的质量并根据需求调整检索策略。
关键技术
索引技术
构建高效的索引结构以加速信息检索。
查询优化
通过优化查询语句和算法提高检索效率。
自然语言处理
处理查询和文本中的自然语言,提高检索准确性。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章信息检索原理与检索语言
一、 计算机信息检索概述(分为存储和检 索两个部分)
计算机信息检索系统是信息检索所用 的硬件资源(如计算机,网络)、系统软 件(如windows系列软件)以及信息资源 数据库的总和,它能存储大量的信息,并 对信息条目分类、编目或编制索引;并进 行检索。)
电讯技术
TP3计算机
TP33电子数字计算机
TP自动化技术 TP6射流技术
TP34电子模拟计算机
计算技术
TP7遥感技术
TP35混合电子计算机
TQ化学工业 TP8运动技术
TP36小型、微型、台式计算机
TS轻工业、手工业
TP38其他计算机
TU建筑科学 TV水利工程
第四章信息检索原理与检索T语P言39计算机应用
D 政治、法律
E 军事
F 经济 G 文化、科学、教育、体育
社会科学
H 语言、文字
I 文学
J 艺术
K 历史、地理
第四章信息检索原理与检索语言
N 自然科学总论 O 数理科学和化学 P 天文学、地球科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学
进行相符性比较等。是标引文
献的依据,检索文献的条件,
是沟通情报人员与用户思想的
桥梁。
第四章信息检索原理与检索语言
3、检索语言的类型 按文献内容特征 1 主题法语言 (较准确,具体到点)
标题词语言 关键词语言 单元词语言 叙词语言
2 分类语言 (较全面,具体到面) 体系分类语言 组配分类语言 混合分类语言
TN0 一般性问题
TN40 一般性问题
TN1 真空电工技术
TN42 微模组件
TN2 光电技术、激光技术 TN43 半导体集成电路
TN3 半导体技术 TN4 微电子学、集成电路 TN6 电子元件、组件 TN7 基本电子电路
第四章信息检索原理与检索语言
其特点如下:1)服务针对性强, 能根据检索课题提供专门服务;2) 定期向用户分发结果,保证用户 总能及时了解最新情况;3)保证 数据库中的资料能全面、准确地 满足用户要求。
第四章信息检索原理与检索语言
2 回溯性情报服务:也称为RS (Retrospective Searching),通常是针对 某一课题,对情报数据库进行若干年的回 溯性检索。检索内容不一定要最新。适于 课题调研、对某一问题作全面了解、编制 专题资料等。 3 问答式检索服务:(Question and Answering Service)是一种实时性检索服 务。用户当场,随时提问,随时得到结果。
三 计算机信息检索中常用的服务方式 计算机信息检索系统输出检索结果并
向用户提供的过程叫信息提供。根据用户 的要求,可有多种提供方式。 1定题情报服务:即SDI服务(Selective Dissemination of Information。常用的服 务方式。
过程一般是:用户需求――编写检索 提问式――存贮在计算机中――每隔 一段时间让计算机将其调出――对新 记录进行检索――最后将命中的记录 输出并提供给相应的用户――保证他 们及时了解研究课题的最新情况。它 是一种追踪学科发展动态的有效方式。
Z 综合性图书
自然科学 综合类图书
第四章信息检索原理与检索语言
P20 一般性的问题
P21 普通测量学
地形测量学
P1 天文学
P22 大地测量学
P229海洋测量学
P2 测绘学
P23 摄影测量与遥感
P3 地球物理学 P25 专业测绘与工程测量
P P4气象学
P27 地籍学
P5地质学
P28 地图制图学 [P29]地图与地图集
TM0 一般性问题 TM1 电工基础理论 TM2 电工材料 TM3电机 TM4 变压器、变流器及电抗器 TM5 电器 TM 电工技术 TM6 发电、发电厂 TM7 输配电工程、电力网及电力系统 TM8高电压技术 TM91独立电源技术 TM92 电气化、电能应用 TM93 电器测量技术及仪器
第四章信息检索原理与检索语言
计算机信息检索的主要环节包括:
信息分析(确定输入系统的信息条目
的格式和内容,为建立索引作准
备)|
信息存储(建立信息库,以备检索)
信息检索(脱机检索和联机检索两种
方式
第四章信息检索原理与检索语言
二 、计算机检索系统的构成
1 计算机硬件:系统中采用的各种硬件设备的总称,包 括具有一定性能的计算机主机、外围设备以及与数据处理 或数据传输有关的其他设备。主机,是计算机检索系统的 中枢。外围设备包括外部存储器,输入输出设备如键盘、 光笔、鼠标、光学字符识别装置,显示终端、打印机等。 2 软件:系统中有关的程序和各种文件资料的总称,包 括系统软件(如操作系统,输入输出控制程序)和应用软 件。 3 数据库:“一组文件的集合”,
把它扩充为大型分类法。1975年正式出版了
《中图法》第一版。
特点:(1)《中图法》采用拉丁字母与阿拉伯数
字相结合的混合制标记符号,以拉丁字母标记
基本大类。 ( 2)分为五大部类,22基本大类。
属于五分法
第四章信息检索原理与检索语言
A 马克思主义、列宁主义、毛泽东思想、邓小平理论
B 哲学、宗教
C 社会科学总论
第四章信息检索原理与检索语言
四 计算机信息检索语言: 1 什么是检索语言:检索语言是检索 系统存贮与检索运用的共同语言。换 言之,描述信息系统中信息的内容特 征及外表特征和表达用户信息提问的 一种共同语言。
2 功能:简单明了而又比较专
指的描述文献的主题概念;容
易将概念进行系统排列;检索
时便于将标引用语和检索用语
4分类语言(P21):将各种概念按学科性质进 行分类和系统排列,并用分类号来表达各种 概念的一种先组式语言。从学科门类的角度, 强调面的作用,泛指度高,查全率高,满足 族性检索。
4.1《中图法》是为统一全国文献分类编目创造
条件而编制和发展的。1957年文化部主持编制
了《中小型法》,在此基础上一些图书馆陆续
P7海洋学
P9自然地理学
第四章信息检索原理与检索语言
TB一般工业技术
TD矿业工程
TE石油
TF冶金工业
TG金属学、金属工艺
TH机械、仪表工艺
TJ武器工业
Байду номын сангаас
TK动力工程
T
TL原子能技术 TM电工技术
TP1自动化基础理论 TP31程序设计
TN无线电电子学 TP2自动化技术及设备 TP32一般计算机和计算器