第二章文献检索基础知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

• 计算机检索:是利用计算机系统检索公开 出版物的数据库。使用的是检索系统,系统包
括计算机设备、终端、通信设施、数据库和检索 、应用软件等。
• 联机检索:是利用终端同大型计算机系统联机
或用计算机网络来检索数据库的资料。
检索的基本原理
• 文献检索的基本原理是以检索语言为基 础,将文献的标引与检索提问之间进行 相关性匹配,检索语言是标引者与检索 者共同使用的语言。
文献检索的基本程序
• • • • 提出问题 分析研究课题,确定检索途径 实施检索 检索结果的分析与筛选
明确信息检索课题所涉及的学科范围 明确所需信息的类型,包括文献类型、时间范围、 语种、著者、机构等 明确信息检索课题对查新、查准和查全的指标要 求
分析研究课题
选择检索工具
确定检索途径
索取原始文献 按“由近及远、省 时省力”的原则
提问(检索) 语言
匹配过程
文献标识 语言
文献中经常出现的,起关键 作用的语言,如《三聚氢胺 的测试方法》,其关键词是 “三聚氢胺”
检索原理图(流程图)
文献存储过程
检索过程
检索需求 主题分析 主题概念
用检索语言对 文献进行描述 情报工 作人员
主题分析 主题概念
用检索语言对 文献进行描述
文献标识
检索工具(系统)
• 3.事实数据库 (fact database): 这类 数据库能直接向用户提供可用的数据 (包括 文字、图形、图象、声音、计算机程序等)。 如:百科全书、辞典、手册、指南、地图 集、人名录、企事业名录、计算机程序、 音乐等。 • 如:中经专网(教育版)、中国资讯行、 万方。
4.数值数据库(numeric database):
系统中相关文献总量
100%
检 准 率
• 它是指检中的相关文献量与检出的文献总 量的比率。(查准率) • 是衡量信息检索系统检出文献准确度的尺 度 • 可用下式表示
检中相关文献量
检准率
检出文献总量
100%
• 由于许多客观因素的影响,在实际检索中,他 们是不可能达到100%的,两者之间存在着一 种互逆的关系。同一检索中,当两者达到一定 的程度之后,会出现此消彼长。
数据库的类型
1. 题录、文摘数据库 (bibliographic database): 是一种二次文献数据库,主要存贮相关主题领域 的各类文献资料的书目信息,包括机读版的文摘、 题录、目录、索引等。用户可从大量文献记录中 筛选出有参考价值的文献源,并依据记录提供的 来源指示获取一次文献。如:Ei CPX Web(工 程索引)、《中文期刊数据库(文摘题录版)》 等。
据或经过处理的各种数据、数值表格。
这类数
据库主要提供来自原始文献的统计数据、调查数 数字数据:参数、电话号码,银行帐号、观测数据、 统计数据等
非数字数据:图表、图谱、化学分子式、市场行情、
物质的各种特性等
一、文献检索定义
• 文献检索:指以文献为对象收集、整理 、排序和按一定要求进行查找与识别的 过程。简单的一句话:针对需求找出所 需要的文献的过程。 • 广义的文献检索包括:文献信息的存储 和文献检索两个过程 • 目的:为了解决特定的文献需求和满足 用户的需要。
• 这种方法费力、费时,工作量大,多在缺少评 述文献采取此法。
2. 倒查法
• 倒查法与顺查法相反。这种方法多用于新课题、 新观点、新理论、新技术的检索,检索的重点 在近期信息上,只需查到基本满足需要时为止。
• 此法查处的信息新颖,但查全率不高。
3. 抽查法
• 是利用检索工具进行重点抽查检索的方法。针 对某学科的发展重点和发展阶段,拟出一定时 间范围,进行逐年检索的一种方法。 • 此法检索效率较高,但漏检的可能性大,检索 人员必须熟悉学科的发展特点。
检索语言的分类
题名语言:一般按题名字顺逐字排检
描述文献外部 特征的语言
著者语言:一般按姓前名后的字顺逐字排检 号码语言:如专利号、标准号、ISBN号、ISSN号
描述文献内容 特征的语言
分类语言:根据学科内容等对文献进行分类。
如图书分类号、国际专利分类号、标准分类号等 (以代码语言为特征)
主题语言:自然语言,人工语言
狭义的文献检索:是根据课题的要求,采 用科学的方法,利用专门的检索工具,从大 量的文献资料中找到所需文献的过程。如: 书刊或数据库。 包括:书目检索、题录或索引检索、文摘 检索、全文检索等。
二、文献检索的基本形式
• 手工检索:是利用馆藏目录、书目、索引 等二次文献来查找资料。通常使用的是一些印
刷载体的工具书和检索期刊,检索过程由人脑和 手翻书刊的配合来完成的,匹配是人脑的思考、 比较和选择。
华商学院图书馆
http://tsg.gdhsc.edu.cn/
3)联合目录:是汇总若干图书馆或其它收藏单位所藏书的 目录 CALIS联机公共数据库
http://opac.calis.edu.cn/
4)出版社目录:是根据出版社出版的图书或书店发行的图 书馆编制而成的目录
题录型
• 题录是将图书、报刊等文献中论文的篇目 按照一定的排检方法编排而成的,供人们 查找篇目出处的工具。如:文献题名、著 者姓名、文献出处等,无内容摘要。
料。不仅熟悉检索工具还要具备文献知识和检索技能
• 灵活性:灵活地运用各种检索工具进行查检资
料。灵活就是为了达到检索全面、准确、快速的 目的。
信息检索效果的评价
• 信息检索效果就是利用检索系统进行检索 服务时所获得的有效结果。 • 评价信息检索效果的目的:是为了准确掌 握检索系统的各种性能水平,分析影响检 索效果的因素,调节检索策略,改进检索 系统的性能,提高检索效果,满足用户信 息检索的需求。
Hale Waihona Puke Baidu摘型
• 文摘是以精练的语言把文献信息的重要内 容、学术观点、数据及结构准确地摘录下 来,并按一定的著录规则与排列方式编排 起来,供读者查阅使用的一种检索工具。 • 不包括对原文的补充、解释或评论。
文摘可以揭示文献内容,吸引读者阅读原文 。是二次文献的核心,检索工具的主体。
索引型:
是根据一定的需要把特定范围内的某些重要文献 中的有关款目或知识单元按照一定的方法编排 并指明出处,为用户提供文献线索的一种检索 工具。
什么是文献的内容特征和外表特征? 这两者有何区别?

外表特征:与文献信息主题内容没有关系或关系 不大的信息称为文献信息的外表特征,例如,著 者、著者单位、期刊名称、专利说明书的专利号 、政府报告的报告号等。 • 内容特征:与文献信息主题内容密切相关的信息 称为文献信息的内容特征。
内容特征和外表特征的区别是:与文献信 息内容特征的关系密切的是内容特征,反 之是外表特征。
• 2.全文数据库(full-text database): 是将 一个完整的信息源的全部内容转化为计算 机可识别和处理的信息单元而形成的数据 集合,即机读化的一次文献。用户可直接 检索出原始文献,也可检索全文中的段、 节、章等内容。 • 如:《中国学术期刊数据库》、《维普 中文科技期刊(全文版)》等。

21世纪的今天,没有危机感就是最大的危机。 现代 社会发展迅速,让自己时刻作好准备,时刻都有危机感 ,才不至于被这个社会淘汰。当更多的老虎来临时,我 们有没有准备好自己的跑鞋呢?
牢记: 机会是给有准备的人
什么是检索语言 ?有什么作用?
• 检索语言:是用来描述文献的内容特征、外表
特征和表达情报提问的一种人工语言。(因为 自然语言的随意性大) • 由于信息提供者和检索者的主体都是“人”, 他们的知识结构、工作经历以及语言习惯有所 不同,如果没有同一的标准,无法保证“供与 需”的一致性。 作用:它是沟通信息处理人员和员检索人的桥梁 。
提高检索效果的措施
• 选择好的检索工具(手工或计算机) • 准确使用检索语言(用题名或作者) • 善于利用各种辅助索引(综合应用) • 提高检索策略制订水平
习题二
掌握获取原文的线索
确定检索方法
记录原始信息材料的 有关特征,如篇名、 著者、信息出处等, 以便查找原文
第五节
文献检索的基本要求
• 全面性:尽可能查检出有关课题的文献资料,
努力提高查检率。
• 准确性:查检到的文献应该针对课题的需要,
准确、可靠,根据实际情况进行适当地鉴别考证
• 快速性:指从众多的文献中迅速检索到所需资
如:书名、刊名、人名、地名、语词等。
有分类索引、主题索引、关键词索引、科学引 文索引科技评论索引等
文献检索的方法
• 常用法 主要有: 顺查法、 倒查法、 抽查法
1. 顺查法
• 根据检索课题的起始年代,利用选定的检索工 按照从旧到新、由远及近、由过去到现在顺时 序逐年查找,直至满足课题要求为止的查检方 法。
第二章 文献检索基础知识
• 本章主要掌握文献信息检索的基本原 理,掌握信息检索系统流程以及各基 本要素,掌握几种信息检索系统的评 价方法,了解影响检索效果的因素和 解决方法。
文献检索概论
• • • • • 第一节 文献检索的概念 第二节 文献检索的原理 第三节 文献检索的基本途径与方法 第四节 文献检索的基本程序 第五节 文献检索的基本要求
一、评 价 指 标
• 评价指标:是衡量检索系统性能和检索效果 的标准。 • 一般包括: (最常用前两种)
1. 检全率 2.检准率 3.漏检率 4.误检率



• 检出的相关文献量与检索系统中相关文献 总量的比率 • 是衡量信息检索系统检出相关文献能力的 尺度。 • 可为下式表示:
检出相关文献量
检全率
信息检索的类型
• 数据检索:检索的结果是数据。如某种材料的电阻;某变 压器的参数;化学分子式、数据图表等<手册> • 事实检索:检索的结果是事实结论。查询某一事物(事件) 的性质、定义、原理以及发生的时间、地点过程等。如某 产品是哪个厂家生产,哪个牌子的最好;中国第一颗人造 卫星是什么时候升空的<年鉴> • 文献检索:检索的结果是文献资料。查找相关文献的内容、 出处、收藏单位等。如系统地查找水压伺服控制阀原理方 面的相关文献<论文>(信息检索的最主要的方式)
• 追溯法:
又称回溯检索法、引文法、引证法、 是一种跟踪查找的方法。即以文献后面所 附的参考文献为线索,逐一追溯查找相关 文献的方法。在没有检索工具或检索工具 不齐全的情况下,利用此法能够获取一些 所需要的文献资料,但往往查全率不高, 回溯年代越远,所获取的文献越陈旧。
• 循环法:
又称交替法或分段法。是将常用法和 追溯法循环交替使用的方法,既是先用第 一种方法查出一定时期内地文献,再用第 二种方法查出前一时期的文献,如此交替 往前推移。
检索表达式
(提问标识) 否
是否匹配 是
输出结果为零
得到检索结果
三、文献检索的作用、意义
• • • • 是获取科学知识的最佳捷径。 避免科研工作重复,少走弯路。 提高科研、生产的效率,节省时间。 提高信息素养。
• 跑鞋的故事
两个旅行者,在丛林中遇到一只老虎,其中 一个急忙换上跑鞋,另一个人问道:“你换上 跑鞋也跑不过老虎呀?”那人答道:“我的确 跑不过老虎,但我只需要跑得过你就行了”。
• 用户只能根据自身的需要进行相应的调整两者 之间的比例。
检全率和检准率是评价检索系统 的检索效率的主要指标。
影响检索效果的主要原因
• 检索语言不当(沟通过程) • 检索系统收录文献不全,检索途径不齐全(
工具)
• 文献的标引深度不够,前后不一致或遗漏 了原文的重要概念或选词不当等(信息源) • 检索人员不具备选择检索词以表达文献主 题的能力(人)
全部文献根据标识系统地科学地排列,成为一个有机的 整体
提供多种检索途径
检索工具的类型
目录 二次文献 题录 文摘 索引 参考工具书 搜索引擎
目录型
目录是一批相关文献信息的著录集合,它以报道文献出版或 收藏信息为主要功能的工具。 常见的几种目录型检索工具 1)国家书目:是一种不加选择地记载一个国家出版的全部 图书的目录,可反映一个国家的出版业水平 2)馆藏目录:同图书馆、情报所等单位自己编制的本馆藏 书、资料的目录
(以事物名称术语为特征)
外部特征 文献 检索 途径
题名 著者 号码 出版社 ISBN ……
分类途径
内容特征
主题途径
信息检索工具
• 定义:是人们用来存储、报道和查找文献的工具。因此它 具有存储和检索的功能 特点: 详细地著录了文献的外部特征和内容特征
具有既定的检索标识,如主题词、分类号、作者姓名等
相关文档
最新文档