文献检索1-4 文献信息检索原理
文献检索-第二章__文献检索基本知识
Z——综合性图书
O 数理科学和化学 (一级类目) O1 数学 (二级类目) O3 力学 O4 物理学 O6 化学 O61 无机化学(三级类目) O611 化学元素与无机化合物 (四级类目)
图书馆图书的排架与查询:
图书是按索书号排列在书架上的 图书查询先确定索书号 索书号:由图书分类号和书次号组成;分类号在上,书 次号在下。
⑶事实检索
事实检索以特定客观事实为检索对象,检索结果是某一具体 的、客观存在的事实。 如:查找“前事不忘、后事之师”最早的出处。
信息检索的类型
按照检索方式的不同,分为手工检索和计算机检索。
手工检索:用人工来处理和查找所需信息的检索过程。主要 依靠印刷型的二次文献,如文摘、目录等。
计算机检索:利用计算机和一定的通信设备查找所需的信息。 如联机检索和网络检索。
(2)主题途径
从文献中抽选出来的,代表文献内容实质词 汇——主题词,包括关键词、标题词、叙词等作 为检索标识,进行文献检索的一种途径。
(3)著者途径
根据已知文献著者(作者)的姓名来查找 文献的途径。
(4)名称途径
根据文献的名称来查找文献的途径。如: “书名目录”、“刊名目录”。
(5)序号途径
以文献的编号为特征编排和检索文献的途 径。如:“专利号索引”、“报告号索引”等。
(6)其他途径
有些检索工具还附有一些特殊索引,可提 供从特殊途径查找所需文献的线索。如《CA 》中的分子式途径、环结构式途径等。
3、文献的检索步骤
(1)分析研究待查课题
检索的目的是什么? 课题属于什么学科专业? 需要什么类型的文献?(中文,外文文献) 所需文献的年代范围等 另外,还需要了解与检索课题相关的专业背景知 识、有关的专业名词、术语等。
文献信息的检索原理、方法及技术(不完整)
计算机与通信学院 陈多
检索方法 1.基本方法 ⑴ 常用法:该方法利用现有的各种文献检索工
具查找文献信息,这是文献检索中经常用到的 方法,可细分为: 顺查法倒查法 ③抽查法 ⑵ 追溯法 ⑶ 循环法 2.排检法 ⑴ 字顺法: ⑵ 类序法⑶ 自然顺序法
计算机与通信学院 陈多
3.数据库与网络资源的检索方法 ① 快速检索 ② 专业检索 ③ 期刊导航检索⑥高 级检索 计算机检索技术 利用数据库和网络资源的主要检索技术有:逻辑 组配检索、截词检索、位置运算符检索、限制 检索。
计算机与通信学院 陈多
⑵二次检索:是在上一次检索的文献结果基础上, 改变检索概念或检索标识进行再次检索,缩小 检索范围、筛选文献的方法。二次检索可反复 进行。 ⑶用索引工具:索引是检索工具中的辅助性工具, 常称为检索的入口,检索工具书中各种索引都 是条目式的简捷明了,数据库中的索引体现为 检索途径。
计算机与通信学院 陈多
⑴ 应分析待查项目的目的、意义、背景 ⑵ 明确研究课题的内容、性质,分析已知情报 ⑶ 划定检索的文献类型与时限范围 2.选择检索工具 3. 确定检索途径和检索标识 检索点或叫检索入口
计算机与通信学院 陈多
描述文献外部特征 对应的检索途径 责任者 责任者检索途径 题名(书名、篇名等) 题名途径 文献代码(如标准号、专利号等) 代码途径 引用文献 引文途径 出版日期、出版地 年代途径
第4章 文献信息的检索原理、方法 及技术
信息检索的原理是什么? 信息检索的方法有哪些? 信息检索的基本步骤是什么?
计算机与通信学院 陈多
4.1文献信息检索的原理
“匹配”—— 文献信息的检索原理是将检索提问标识与存 储在检索工具中的标引标识进行比较,当检索 提问标识与标引标识概念相一致,经过检索系 统的运算查检后就会命中相关的信息,输出理 想的文献信息结果。
文献检索原理及中文医学文献数据库检索
轮排索引
树 状 结 构
2、文献检索原理
2.1.4、主题描述语言 2.1.4.2、关键词法 是指出现在文献或网页的标题(篇名,章节名)或
文摘、全文中,能表达文献实质内容的,并且能 被人们作为检索入口的关键性名词术语。 最大优点:科学发展新出现的专业名词能及时进入 索引系统。 缺点: a.用词不规范,造成漏检。 b.标引过多造成误检增加 c.不对文献的实质内容进行分析,检索准确性较差
5)特征词:用于表达文献的某些特征,起作用在于 检索时对文献集合中有某种特征的文献进行限定 或排除。
a.对象特征词 是指文献研究的对象,例如:人类, 动物等
b.时间特征词 包括年代、时代、朝代等,例如,清、 南北朝等
c.位置特征词 包括国家、地区等方面 例如,美国、 中国、北京等
d.文献类型特征词 包括教材、综述等
2、文献检索原理
2.2.1.1基本大类 共分为22个
A 马列主义 毛泽东思想
B 哲学、宗教 C 社会科学总论 D 政治、法律 E 军事 F 经济 G 文化、科学、教育、体育 H 语言、文字 I 文学 J 艺术 K 历史、地理
N 自然科学总论
O 数理科学和化学 P 天文学、地理科学 Q 生物科学 R 医药、卫生 S 农业科学 T 工业技术 U 交通运输 V 航空、航天 X 环境科学、安全科学 Z 综合性图书
例如:甲状腺疾病的分类号是R581,甲状腺疾病诊断的分类号是R581.04。
2、文献检索原理
2.2.2《医学主题词表》 《医学主题词表》(Medical Subject Headings)
简称MeSH词表,是美国国立医学图书馆 (NLM)编制的用于对生物医学文献进行 标引和检索的权威性术语控制工具。 MeSH词表由字顺表和树状结构表两部分组成。
文献检索的基本原理_图文
2.2.2 信息检索工具
检索工具的定义 检索工具是人们用来存储、报道和查
找文献的工具,它具有存储和检索的功能。 4个基本条件: (1)能够详细著录文献的外部特征和内容 特征 (2)具有即定的检索标识 (3)全部文献必须根据标识,系统科学地 排列成为一个有机地整体 (4)能够提供多种检索途经
检索工具的作用:
A 在检索字段中
B
检出同时含有检 索词A和检索词B
的记录
2 逻辑“与”
作用 缩小检索范围,提高查准率。
举例 检索“人口控制”或者“控制人口”方面的文献信息 。
人口 and 控制
2 逻辑“或”
运算符:OR 或 +
用于检索词并列关系(同义词、近义词)的组配,
实现检索词概念范围的并集。
A or B 或 A+B
四、主题检索语言
标题词:是从文献的题目、正文或摘要中抽选出来,经 过规范化处理的词或词组,先组式语言。 叙 词(单元词):叙词语言是以规范化科学名词为基 础的一种主题法检索语言,叙词是主题词表中的所有正式 主题词可以根据需要将它们组配起来,用以表达复杂的概 念。是后组式语言,可自由灵活组配。 关键词:未经规范化处理,直接从文献题名、原文或文 摘中选取的能反映原文主题内容的自由词汇
举例
同词位检索
(W)/()
此算符两侧的检索词必须 按输入时的前后顺序排列 ,而且所连接的词之间除 可以有一个空格或一个标 点符号或一个链接号外不 得夹有任何其他单词或字 母
文献检索的基本原理_图文.ppt
2.0 文献检索的基本概念
信息检索的定义
广义概念:将信息按一定的方 式组织和存储起来,并根据信 息用户的需要找出有关的信息 过程,故全称:“信息的存储与 检索”。
第一章-文献信息检索概论
• 特点:具有新颖性、创造性(是人类创造 性劳动成果)和先进性(内容上是新成果, 新发明);
• 缺点:数量大,分布散,难以查找。
• 二次文献: 报道和查找一次文献的检索工 具书、书刊。
• 它是按照一定的目的对一定范围或学科领 域的一次文献进行鉴别、筛选、分析、归 纳、加工整理重组,使之有序化后出版的 文献。如各种索引、题录、文摘。形式上 有卡定义为文献是记录有知识的一切载体。
• 文献的基本构成要素
第一,知识内容 第二,记录载体 第三,记录符号 第四,记录手段
• 随着生产力的发展,存贮和表达人们思想的物质 载体不同了,从金石、竹简、羊皮、丝帛、纸张 发展到用感光介质和磁性介质。从非人工材质的 泥版、岩石、石板、兽骨、木板、竹片、 兽皮、 树叶、桦树皮等到各种人工材质,如无机材质 (陶、砖瓦、瓷,玻璃等)、金属材质(青铜、 铁、铝、金银等)、高分子材质(帛、纸、胶片、 醋酸纤维等)、复合材质(磁带、光盘等)。纸 质文献已经多得不便于快速传输信息、高效查阅 和高密度存贮了,于是其他介质的文献应运而生, 这些文献主要包括:纸质文献具有价格低廉、质 地柔软、易于书写、携带和收藏等其它一些载体 所无法比拟的性能而成为文献家族的主干。
• 特点:汇集性、工具性、系统性
• 三次文献:根据二次文献提供的线索,选 用大量一次文献,根据一定的需要和目的 进行筛选、分析、综合和浓缩而再出版的 文献。
• 如词典、手册、指南、年鉴、百科全书、 大全、综述、工具书目录、书目之书目、 专题述评、进展报告等。
• 特点:综合性、 价值性、 针对性
/
• 序号途径:
• 许多文献除普通的外表特征外,还具有序 号特征,如,专利文献有专利号、标准文 献有标准号、馆藏文献有索书号。序号索 引一般按照文献序号的大小顺序排列。
文献信息检索实用教程 第三版 第4章 文献信息的检索原理、方法及技术
新世纪应用型高等教育基础类课程规划教材
文 献 信 息 检 索 实 用 教 程 (第三版)
目录
CONTENTS
第4章 文献信息的检索原理、方法及技术
4. 1 文献信息的检索原理 4. 2 文献信息的检索方法及技术 4. 3 文献信息检索的步骤 4. 4 文献信息检索的效果分析
第4章 文献信息的检 索原理、方法及技术
间和精力查出与课题相关的资料。
第4章 文献信息的检 索原理、方法及技术
4. 4 文献信息检索的效果分析
衡量检索效果的指标有查全率、查准率、漏检率和误检率,其中查全率、 查准率是两项主要评价指标。
查全率=检出的相关文献量/检索系统中相关文献总量
查准率=检出的相关文献量/检出文献总量
第4章 文献信息的检 索原理、方法及技术
3.数据库检索的方法
01 检索词的确定
02
编制规范合理的检 索式
03
选择检索系统和数 据库
第4章 文献信息的检 索原理、方法及技术
4. 3 文献信息检索的步骤
分析待查项目,明确主题 概念
选择检索工具
确定检索途径,填入检索词 或检索表达式
选择检索方法
调整检索策略,筛选文献 结果
查找文献线索,索取原文
第4章 文献信息的检 索原理、方法及技术
4. 4 文献信息检索的效果分析
4.4.3 提高文献检索效果的途径
(1) 选择好检索工具或检索系统。
(2) (3) (4) (5)
准确使用检索语言。 善于利用各种辅助索引。 通过打一检和缩检.提高查全率和查准率。 提高检索策略的制定水平。
新世纪应用型高等教育基础类课程规划教材
4. 2 文献信息的检索方法及技术
文献信息检索基本原理
2.1 文献信息检索的原理和意义
存储过程 文献内容 主题概念 信 息 检 索 语 言 文献特征标志 信 息 检 索 工 具
检索结果
检索过程
检索需求
主题概念
提问特征标志
2.2 检索语言
• 检索语言的概念和作用
检索语言( 检索语言(retrieval language)是一种人工语言,它 )是一种人工语言, 是各种信息组织、存储和信息检索时所用的一种语言。( 。(在 是各种信息组织、存储和信息检索时所用的一种语言。(在 文献信息存储于检索过程中共同使用、 文献信息存储于检索过程中共同使用、共同理解的统一的标 志) 检索语言的作用是标引文献内容、数据和其他信息, 检索语言的作用是标引文献内容、数据和其他信息,把 信息的内容特征及其外表特征简明而有效地揭示出来; 信息的内容特征及其外表特征简明而有效地揭示出来;是连 接标引人员和检索人员的思想桥梁, 接标引人员和检索人员的思想桥梁,是标引人员和检索人员 之间共同遵循的标准语言。 之间共同遵循的标准语言。保证了文献信息存储的集中化和 系统化,并使众多的文献信息高度的标准化、 系统化,并使众多的文献信息高度的标准化、集中化和系统 避免检索的漏检和误检,是有规律的检索成为可能。 化,避免检索的漏检和误检,是有规律的检索成为可能。
2.3 检索系统
• 检索系统概念
为了满足各种各样的信息需求而建立的一整套信息的收 整理、加工、存储和检索的完整系统。 集、整理、加工、存储和检索的完整系统。
• 检索系统的分类
1、手工检索系统 、 由手工检索设备(书本式目录、文摘、索引、 由手工检索设备(书本式目录、文摘、索引、卡片柜 )、检索语言 文献库等构成, 检索语言、 等)、检索语言、文献库等构成,以人工方式查询和提供文 献信息。 献信息。 (1)文献筛选子系统(2)词表子系统(3)标引子系统 )文献筛选子系统( )词表子系统( ) (4)查寻子系统(5)用户与系统间交互子系统(6)匹配子系 )查寻子系统( )用户与系统间交互子系统( ) 统
文献信息检索的原理
文献信息检索的原理
文献信息检索的原理是基于关键词的检索。
首先,检索系统会将用户输入的关键词与文献数据库中的文献进行匹配。
文献数据库中的每篇文献都有一组关键词,这些关键词标注了文章的主题和内容。
在检索时,系统会根据关键词的匹配程度来确定文献与用户需求的相关程度。
一般而言,如果用户输入的关键词与某篇文献的关键词完全一致,那么这篇文献会被认为高度相关。
然而,仅仅根据关键词匹配来确定文献的相关性是有局限性的。
因此,现代的文献检索系统通常使用更加复杂的算法,如向量空间模型、语义相似度计算等,来提高检索的准确性。
这些算法会根据关键词之间的关联性以及文献之间的语义相似性来计算文献与用户需求的匹配度。
文献信息检索系统还会使用一些其他的技术来提高检索效果,比如使用索引加速检索过程,通过处理用户的查询意图来进行相关性排序等。
总的来说,文献信息检索的原理是通过关键词匹配及其他相关技术来寻找与用户需求相关的文献。
文献信息检索基本原理及方法
事实信息检索:又称事项检索。是指系以事实为检索内容的情报检索, 其检索对象包括事实、概念、思想、知识、人物的基本信息等内容,事实 检索也是一种确定性检索,,用户获得的是有关某一事物的具体答案。
3.2 文献信息检索原理
文献信息检索的基本原理:就是用户根据课题需要,将代
表需要查找的检索提问标识与文献库中所存储的文献特征标识 进行比较,当文献库中所存储的文献特征标识与检索提问标识 相一致,或文献特征标识包含了检索提问标识时,那么具有这 些特征的标识就被检出,即是命中的结果。
信息存储与检索原理流程图
一种较好的检索语言应具有对多种检索要求的 广泛适应性,保证有较高的查全率和查准率; 具有对多种学科和多种信息类型的适应性;具 有与其他检索语言的兼容性和国际通用性。
检索语言
检索语言的分类划分
区分依据 按内容和结
构划分
按标识组配 方式
按描述文 献的特征
类型
分类语言
主题语言
先组式 检索语言
后组式 检索语言
➢相关性检索——是系统不直接回答用户所提出的 技术问题本身,而是只提供与之相关的文献供用 户参考。
➢确定性检索——是以数据或事实为检索对象,系 统要直接问答用户提出的技术问题,即直接提供 用户需要的确切的数据或事实。
文献信息检索的类型
根据检索对象划分 书目检索:是以文献线索为检索对象的文献检索,即检索检索系统存储
第三章文献信息检索基本原含义
一、文献信息检索的基本含义
“检索”即“查找”之意。信息检索,是将信息按照一定的方式 组织、存储起来,并针对用户的需要查找所需信息的过程。因此信 息检索包含了信息的存储和检索两个不可分的部分。我们通常所说 的信息检索是指狭义的信息检索,即从检索工具和检索系统中查找 所需信息的过程及其所采取的一系列方法和策略。
文献检索原理
With算符 :表示此符两侧的检索词在命中记录中 必须出现在同一字段中,即同时出现在篇名或文 摘中等,前后位置可以颠倒。 Near算符:表示此符两侧的检索词的距离最近。A near B的检索结果是A与B必须同时出现在一句话 中,无论语序,两者之间的距离最多可相隔n-1个 单词。 例如:sequence near3 analysis ,表示序列分析之间 最多允许插两个词,并且出现在同一句子里。
• 布尔逻辑得名于 George Boole,他是考克大学(现 爱尔兰国立考克大学)的 英国数学家,他在十九世 纪中叶首次定义了逻辑的 代数系统。现在,布尔逻 辑在电子学、计算机硬件 和软件中有很多应用。在 1937 年,Claude Shannon 展示了布尔逻辑 如何在电子学中使用。
• 逻辑“与” :是一种具有概念交叉或概念限定的组 配;例如要检索“吸烟与肺癌”方面的有关信息,提 问式可写为:“吸烟 AND肺癌 ”或者“ 吸烟﹡肺癌 ” 。此方法缩小了检索范围,增强了检索的专指性 ,提高查准率 。 • 逻辑“或” :是一种具有概念并列关系的组配。表
本 章 主 要 内 容
1
文献检索概述 文献的主要来源 文献管理软件
2 2 3 3
第一节 文献的概述
一、文献信息的基本知识
什么是信息? 什么是知识? 什么是文献?
• 信息:“信息是物质存在的一种方式、形态 或运动状态,是事物的一种普遍属性,一般 指数据、信息中包含的意义,可以使消息中 所描述事件的不定性减少”。 • 知识(knowledge): 知识来源于信息,知 识是人类对客观世界的正确认识,是人们在 认识世界和改造世界的实践中所获得的认识 和经验的概括和总结。是人们通过对大量信 息进行思维分析,并加以系统和深化而形成 的结果,是对客观事物本质和规律的认识。
文献信息检索基础
从上表看出分类号的变化体现了 各学科体系的从属关系,分类号位 数每增加一位,则分类级别便低一 级。
首创,它由大类、门、纲、目、子目等组成。 它将全部学科的书刊分为九大类,用1到9间的数 字表示,不属于这九类中的图书为第0类。每一大 类下再分1到9个子类,依此类分下去。
000 总类 001 知识问题 002 关于书籍 003 系统论 004 数据处理 ——计算机科学 005 计算机程序统计、程序、数据 006 专用计算机方法 011 综合性目录 540 化学与相关学科 541 物理化学与理论化学 542 技术、设备、材料 543 分析化学 544 定性分析 545 定量分析 546 无机化学 547 有机化学
TQ 化学工业 – TQ0 一般性问题 – TQ11 基本无机化学工业 – TQ2 基本有机化学工业 – TQ31 高分子化合物工业 – TQ314 原料与辅助材料 TQ314.2 合成高分子化合物 –TQ314.24 助剂 TQ314.24+1 引发剂 – TQ32 合成树脂与塑料工业 – TQ33 橡胶工业 – TQ34 化学纤维工业 – TQ35 纤维素质的化学加工工业
相关分类号
相关分类号
X 环境科学、安全科学 – X1 环境科学基础理论 X17 环境生物学 –X172环境微生物学 – X5环境污染及其防治 – X7废物处理与综合利用 X79 轻工业废物处理 –X792 食品工业废物处理
文献检索的原理和步骤
文献检索的原理和步骤文献检索是科研工作中不可或缺的一环,它通过系统地搜集、整理和评估相关文献,为研究者提供有关主题的最新信息和研究成果。
本文将介绍文献检索的原理和步骤,帮助读者更好地利用文献资源。
一、文献检索的原理文献检索的原理是基于信息检索技术,通过建立索引、构建查询和评估检索结果等过程,实现对文献信息的有效获取。
主要包括以下几个方面的原理:1.1 索引建立原理索引是文献检索的基础,它通过对文献内容进行关键词提取和分类,将文献信息组织成一种结构化的形式。
索引建立的原理是将文献的关键词和主题词进行规范化处理,构建起一个包含索引词和其对应文献的数据库。
这样,在检索时可以通过索引词快速定位到相关文献。
1.2 查询构建原理查询构建是指根据研究主题和问题,将相关的关键词和主题词进行组合和筛选,构建出一个能够精确描述研究内容的查询语句。
查询构建的原理是通过对查询语句的优化和调整,提高检索的精确性和召回率。
常用的查询构建方法包括布尔查询、短语查询和模糊查询等。
1.3 检索评估原理检索评估是为了评估检索结果的准确性和相关性,以确定检索效果的好坏。
检索评估的原理是通过比较检索结果与已知标准文献之间的相关性,计算出相应的评估指标,如准确率、召回率和F值等。
通过对检索评估结果的分析,可以调整查询策略和优化检索效果。
二、文献检索的步骤文献检索的步骤是按照一定的顺序进行,以确保检索的全面性和准确性。
下面将介绍文献检索的六个主要步骤。
2.1 确定研究主题和问题在进行文献检索之前,首先需要明确研究的主题和问题。
明确研究主题和问题有助于缩小检索范围,提高检索效果。
2.2 确定检索库和工具根据研究主题和问题,确定合适的检索库和工具。
常用的检索库包括学术期刊数据库、图书馆目录和专业数据库等。
常用的检索工具包括Google学术、万方数据库和CNKI等。
2.3 构建查询语句根据研究主题和问题,构建查询语句。
查询语句应包含相关的关键词和主题词,并根据需要进行逻辑运算符的组合和筛选。
文献检索的基本原理(本)
参阅第1、3章一、文献检索的基本原理1.文献检索的基本原理文献检索实际上是通过检索工具找出所需要的信息。
其原理简单地讲,就是把检索者的提问标识与存储在检索系统中的文献标识进行比较,两者一致或文献标识包含着需要检索的标识,则把具有该标识特征的文献就从检索系统中输出,该文献即为检索初步命中的文献。
这其中包括文献存储和检索,如图所示。
比较与选择特征化 表示 特征化 表示存储过程: 检索过程:文 献 信 息 检 索 课 题分析分析文献信息特征 检索提问信息文献信息标识(检索点) 检索提问标识(检索词)检 索 结 果(完全匹配、相关、无关)2.信息存储与检索1)信息存储检索工具书文摘号:020001篇名:染料生产中的微机控制作者:张明;王小民;刘建业机构:北京化工学院(北京100001)文献来源(出处):化工技术,2002.33(6) 32-36摘要:本文研究了染料生产过程中微机在加料控制、温度控制技术中的应用。
关键词:染料生产微机加料控制温度控制分类号:TQ7 TP3文献特征、检索字段、检索项:篇名、作者、机构、文献来源、摘要、关键词、分类数据库DN--02174618AN--E187********TI – IMPRIVING LIGHT – METAL CASTINGS.AU – Vaccari , John A.CS – American Machinist & Automated Manufacturing, New York, NY USASO – Am Mach Autom Manuf v 130 n 6 Jun 1986 p 87 –89PY -- 1986SN – 0886-0335LA -- ENGLISHDT -- JA^(Journal Article)TC -- A^(Applications)AB –With high –strength aluminum-and magnesium - casting alloys having reached the limit of their mechanical performance by conventional …. ^5 refs.DE -- ALUMINUM AND ALLOYS – CastingID --^FOUNDRY PRACTICE - Permanent MouldCC -- 541 (Aluminum & Alloys) ^534 (Foundry Practice)2)信息检索a;外表特征1.题名(书名、刊名、文献篇名等)索引染料生产中的微机控制——020001 2.著者索引张明——020001王小民见:张明刘建业见:张明* 姓在前名在后3.机构索引北京化工学院——0200014.文献号码(登记号、ISSN号、专利号、报告号等)b;内容特征1.主题索引染料生产——02001 02***** 02*****微机——02001 02***** 02*****加料控制——02001 02*****温度控制——02001 02*****2.分类索引TQ7 化学工业02001 02 *****TP3 自动控制02001 02 *****计算机检索:1.字段检索:篇名、关键词、摘要、全文、著者、机构、刊名、年代、文种等2.简单检索:字段、分类、主题3. 高级检索:检索式例:S1.染料生产AND(计算机OR电脑OR微机)AND加料AND 温度AND控制S2. (张明OR王小民OR刘建业)/AU AND北京化工学院/CS S3. S1 AND S2检索课题:计算机在染料生产中的应用如何检索?文献特征、检索字段、检索项:篇名、作者、机构、文献来源、摘要、关键词、分类3.检索语言检索语言是文献检索领域中人们用来描述文献主题(内容)特征或外部特征和信息提问的一种专用语言。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.1 信息检索的含义
信息检索:信息检索通常是指从任何方式
组成的信息集合中,查找特定用户在特定时 间和条件下所需信息的方法与过程。因此, 完整的信息检索应包括以下两个方面:
1. 信息标引和存储过程 2. 信息的检索过程
信息检索基本原理的核心是:用户信息需求与文献 信息集合的比较和选择, 是两者匹配(match)的过程。
1)分类检索 2)主题检索 3)作者检索 4)名称检索 5)号码检索
反映文献内部(信息内容)特征 反映文献的外部特征
10
示例 一
研究课题名称: 计算机辅助工艺设计系统
提问特征
1.计算机 2.辅助工艺 3.设计系统
1.3 信息检索的类型和特点
1、文献信息检索
是指依据一定的方法,从已经组织好的文献信 息集合中,查出所需特定文献信息的过程。
一般
如果不刻意区分:你完全可以认为它们没有区别!
1.2 信息检索的实质
将描述特定用户所需信息的提问特征,与 信息存储的检索标识进行异同的比较,从 中找出与提问特征一致或基本一致的信息。
提问特征是指从欲检索课题中选择出能代 表信息需求的主题词、关键词或分类号等。
检索点
检索点(access point)是检索的出发点,常被 称为“检索途径”(approach )。 常用的检索途 径有:
缺点:缺乏专指性,查准率不高,不能满足专 深课题以及新兴学科、交叉学科和边缘学科知 识的检索。
分类检索语言
国外常用的分类法: 《国际十进分类法》(Universal Decimal
Classification, 简称UDC) 《杜威十进分类法》(Dewey Decimal
Classification, 简称DDC) 《美国国会图书馆图书分类法》(Library of
二. 文献信息检索原理
2.1 检索语言 2.2 检索工具(系统) 2.3 检索途径 2.4 检索方法 2.5 检索效率
2.1 检索语言
检索语言又称标引语言,是系统存储和检 索时共同使用的一种约定语言,以达到信 息存储和检索的一致性,提高检索效率。
检索语言的类型
题名
外部
著者
特征
号码
检索 语言
Information Need 信息需求
Representation 表述
Query 信息提问
Document Objects 文献对象
Representation 标引
Indexed Objects 标引对象
Evaluation/Feedback 评价/反馈
Comparison 比较匹配
Retrieved Objects
2、文献信息检索原理
检索原理:检索提问标识与存储在检索工具中的 标引标识进行比较,两者一致或信息标引标识中 包含提问标识即是命中的信息。标引,即文献信 息的整序加工。
(1)存储过程:标引员广泛收集信息,形成检索标识 ,把这些标识按一定方法组织成形成各种检索系统, 即信息源的形成过程
(2)检索过程:检索人员分析课题,用检索提问标识 ,从检索系统中查获所需的信息。
一方面是用户的信息需求
一方面是组织有序的文献信息集合,检索就是从 用户特定的信息需求出发,对特定的信息集合采用 一定的方法、技术手段,根据一定的线索与规则从 中找出(search, locate, hit) 相关的信息。
信息 集合
相关信息
需求 集合
6
信息检索的过程往往需要一个评价反馈途径, 多次比较匹配,以获得最终的检索结果。其 图示如下:
素质目标
培养根据检索需求制定检索策略,准确选择检索工具、检索途径,快 速获取所需信息的能力。
教学任务描述
信息检索概述 信息检索原理 信息检索技术 信息检索步骤
知识回顾
什么叫文献?文献和信息和情报之 间的关系?
文献的类型有哪些?
一、信息检索概述
1.1 信息检索的含义 1.2 信息检索的实质 1.3 信息检索的类型和特点
分类语言
内部 特征
主题语言
体系分类语言 混合分类语言 组配分类语言
标题词语言 单元词语言 关键词语言
叙词语言
分类检索语言的优缺点
Advantages and Disadvantages of Classification
优点:系统性强,族性检索,便于按学科、专 业直接检索比较广泛的课题。查全率较高。
检出对象
7
检索和查找的比较
检索
英文
Retrival 或 Retrieval
过程和方法 有一定的策略,是系统的查 找资料。
技能
需要一定的专门知识和技能
用途
课题或专题
结果
检索前通常不知道会有什么 结果
效率
迅速、准确
查找、搜索、 搜寻 Search 随机或更随意一些。
简单,任意词 日常生活 通常知道结果
教学目标
知识目标:
了解文献信息检索及其类型;了解文献检索语言,掌握《中国图书资 料分类分》;了解文献检索工具及检索系统以及如何评估检索效率;
掌握各项检索技术;掌握文献检索的方法和步骤。
能力目标
能够快速按照《中图法》排架和找书; 能够准确构建检索式; 能够准确制定检索策略。
前二种类型的信息检 索往往在文献型信息 检索的基础上展开,
三者之间在原理、方 法和实践等方面有着 密切的关系。
前两种信息检索类型 都能够得到确切的答 案,或者是文献中的 具体信息。
随堂测试
分辨以下问题分别属于哪种检索
世界上最长的大桥是哪一条? 世界上最长的大桥有多长? 关于铁路大桥有多少文献? 世界上有多少条铁路大桥?
这里的文献信息是指关于文献的信息和文献记 录着的信息。
2、文献信息检索的类型
检索手段
手工检索
检索对象
文献信息组织 方式
文献检索
全文检索
计算机检索 事实检索
超文本检索
数据检索
超媒体检索
数据检索 事实检索
文献检索参考 工具书 Nhomakorabea全文数据库
文摘数据库等
在以上三种检索类型 中,文献型信息检索 是事实型信息检索和 数据型信息检索的基 础。
Congress System, 简称LC)和自编分类表为多 见。
《中国图书馆分类法》的体系结构
《中图法》将知识门类分成5大部类,22个基本大 类(分别用除L、M、W、Y外的其他英文字母表 示,),在这一基础上再按照从总到分,从一般 到具体逐级展开而构成的一个纲目分明的体系。 图书分类时主要根据图书的内容进行分类标引