第二章文献检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1)存取号字段
AN=Access Number
(2)基本字段:描述文献主题性质或内容的字段
文献标题(TI)title
文摘(AB)abstract
主题词(DE)descriptor 关键词(KW)keyword
(3)辅助字段:描述与主题内容无关的字段
Au=Author
著者字段
SO=Source
文献出处字段
第三节 计算机检索的技术和步骤
一、计算机检索的技术
二、计算机检索步骤
一、计算机检索的技术
1、布尔逻辑检索
计算机检索的基本技术就是在制定检索策略时 利用布尔逻辑算符进行检索项的逻辑组配,即进行 概念组配。就是要考虑单一概念、复杂概念、并列 概念如何组配,以构成检索提问式。目的是为了扩 大检索或缩小检索范围,提高查准率、查全率,提 高检索速度。
JN=Environment Management 在期刊名称字段中检索刊名为Environment Management 的刊物
DT=Patent 在文献类型字段里检索专利文献
(2)二次检索: 检索结果中再检索。有二种表示方式:
在结果中再查、在结果中去除
课后练习
1.常用的布尔逻辑算符有哪些?它们的优先 级是什么?
3、混合数据库(mixed databases): 是指能同时存储多种不同类型数据
的一种源数据库。
三、数据库结构:
若干字段→若干记录→若干文档→数据库
1、字段
也称数据项、检索项,是计算机检索的最基本单位。 每条文献的每个著录项,在计算机检索中称为字段。
字段是检索信息的入口,信息在存储到数据库中 时,将能反映其特征的项目进行分解,并按字段的形式 存储,以供在需要时可以从不同的角度进行检索。
2.数据库的类型有哪三种? 3.范围符的形式和含义? 4.截词符的含义? 5.常用的位置算符及含义?
二、计算机检索步骤
1、分析研究课题
(1)课题的主题内容 (2)课题所涉及的学科的范围 (3)课题所需的信息的内容 (4)确定课题所需信息的类型 (5)明确课题对检索深度的要求
2、选择检索系统:
例如:输入 pollution(F)control 污染控制 表示在同一字段中检索出含有:pollution control的文献。
在题名字段中,题名为control and management of industrial pollution 符合要求。
(3) (S) (Subfield 或 Sentence的缩写)
能直接提供原始信息或具体数据的一类数据库。用
户不必再查阅其他信息源即可获得原始信息。
全文数据库(full-text databases) 数值数据库(numeric databases) 文本-数值数据库(textual-numeric databases)、 术语数据库(terminological bank) 图像数据库(graphics databases) 事实数据库(fact databases)。
(1)(W)或()和(nW):
(W)或():表示在算符两侧的检索词 必须按词序排列,不能颠倒,两词之间不 允许有其他词或字母,但允许有空格和 “-”符。
例如:computer()aided()design 计算机辅助设计
(nW):表示在算符两侧的检索词之间最多允 许插入n个词,包括实词和虚词,两个检索词 不能颠倒。 例如: 输入communication(2w)satellite 检索出:
例如:检索90年到97年的文献 PY=1990:PY=1997
3、位置检索: 用来限定检索词相互间的邻近关系,在记录中出
现的顺序、位置。
位置算符
with near field subfield
表示方法 (W)或()
(nW) (N) (nN) (F) (S)
说明
两个词在命中结果中相邻(可有空格、标点和连字符),词 序不得颠倒。 两个词之间最多可夹入n个词,词序不得颠倒。 两个词在命中结果中相邻,词序可颠倒。 两个词之间最多可夹入n个词,词序可颠倒。 两个词在同一字段出现,位置不固定。 两个词在同一子字段出现,位置不固定。
二、电子信息资源的类型
1、按信息表现形式分:
(1)文本信息资源:
是按知识单元的线性顺序排列组织的资源。
(2)超文本信息资源 :
它是一种非线性方式建立和表示离散信息关 系的技术。逻辑连接 任意连接
(3)多媒体信息资源:
包括文本、图像和声音等各种信息表达的总称
(4)超媒体信息资源:
源于超文本,又是它的扩充。是超文本和多媒体 技术的结合,具有超文本和多媒体两种信息资源的特 点.包括了文本、静态图形、动画、动态图像和声音等 多种信息。
第二章 计算机检索基础知识
第一节 电子信息资源概述
一、电子信息资源的概念 二、电子信息资源的类型 三、电子信息资源的特点
一、电子信息资源的概念
电子资源就是电子化了的信息资源。
是机读型信息资源。是一种通过编码和程序设 计,把文字、图形、声音、动画等多种形式的信息转换成 数字语言和机器语言,以磁性材料为介质,以电信号、光 信号的形式传输,并通过网络通信、计算机或终端等方式 再现出来的一种信息资源。
(3)正式出版信息:
受到知识产权保护,信息质量可靠,利用率较高的知识性、 分析性网络信息。
一次出版信息: 电子图书、电子期刊、电子报纸等; 二次出版信息: 搜索引擎、检索数据库、网络导航等; 三次出版信息: 网络述评、参考数据库、网站推荐等。
三、电子信息资源的特点
(1)信息组织形式发生变化: 由传统的文本形式发展为超文本、超多媒体等多
例如:要检出中国科学技术大学化工方面的文献,除钱逸泰的文 献
中国科学技术大 学化工方面
钱逸 泰
布尔逻辑算符,其优先级为not、and、or, 有括号先运行括号里的。
例子:蒸馏中的温度、压力、流动影响方面的文献:
蒸馏*(温度+压力+流动)
2、截词检索和范围检索:
截词符“?”: 用来截去检索词中某些字符,来表示检索词单、 复数形式或英美不同拼法或同一词词尾的多种变 化等
2、按信息存储载体分:
光盘信息资源 网络信息资源
(即在第一章光盘检索系统、网络化信息检索系统中的信息资源)
3、按信息交流方式分 (1)非正式出版信息:
包括电子邮件、网络论坛、电子会议和电子布告版新闻等
(2)半正式出版信息:
受到一定知识产权保护,但没有纳入正式出版信息系统的 描述性网络信息。包括内部电子期刊、会议文集和各类报告、 机构情况及产品介绍等。
一、数据库的概念
在计算机存贮设备上按一定方式存 贮的相互关联的数据集合,就是数据库。
数据库则是计算机与信息检索技术相结合的 产物。
是计算机检索的基础。要建立计算机检索系 统,必须对所收集到的大量文献资料按一定的 体系和规则加以处理,使之成为机读形式的数据。
二、数据库的类型
1、参考数据库(reference databases)
(1)无限截词:用一个“?”表示
例如:comput? 表示含有 computercomputers computing computation 都符合要求
(2)有限截词:
用二个“? ?”,中间空一格,表示截1 位。 第一个“?”表示截1位, 第二个“?” 表 示终 止。
例如:dye? ? (染料,染色 ) 表示含有 dye、dyed、dyes都符合要求。
candied (adj. 糖果的,甜蜜的) 都符合要求。
(3)中间截词:
例如:wom?n 表示含有women 、woman都符合要求。
又如: fib??board
表示含有fibreboard(纤源自板)、fiberboard都符合要求。
范围符 “:”
用范围符来限定检索的类目、时间、存取号等的范围。
国际专利分类号字段
CT=Conference Title
会议名称字段
CY=Conference Year
会议召开年字段
2、记录
作为一个单位来处理的一组相关的数据,它是字段 的集合体,也是信息的完整体现。文档中的一个记录就 是一篇文献的题录或文摘。
3、文档
经过组织加工后存储在计算机中的一组文献称为文 档。信息数据库是由文档组成的,一个计算机检索系统 中的数据库可能是由一个文档组成,也可是由多个文档 组成。同样内容的文件,称为一个文档。
(1)书目数据库(bibliographic databases ): 用于存储二次文献(目录、题录、文摘等书目数
据)的一类数据库
(2)指南数据库(reference databases): 是指存储有关机构、人物、出版物、项目、产品、
活动等对象的简要描述 。
2、源数据库(source databases):
(1)逻辑与: 用“and”或“*”表示。概念交叉和限 定
关系的一种组配 。
例如:生物学中计算机图象处理 生物学* 计算机*图象处理
(2)逻辑或,用 “or” 或用“+”表示。是具有概念 并列关系的一种组配。
例如:检索三废处理方面文献 废气+废水+ 废物
废气
废水
废物
(3)逻辑非,用“not”或用“-”表示。是具有概念 删除关系的一种组配,从原概念中删除一部分不需要 的内容。
“? ?” 表示截二位,即词尾最多2个字母。 例如:univers??
表 示 含 有 universe( 宇 宙 , 万 物 , 世 界 )、 universal (adj. 普遍的,通用的 )都符合要求。
“???”,表示截三位, 即词尾最多3个字母。
例如:cand??? 表示含有candy(糖果)、 candies
PY=Publication Year
出版年字段
LA=Language
语种字段
CS=Corporate Source
团体著者字段
JN=Journal Name
期刊名称字段
DT= Document Type
文献类型字段
PN=Patent Number
专利号字段
Product Name
产品名称字段
IC=IPC
例如: 输入 cotton(2n)processing 检索出:cotton processing、 cotton of processing、 processing of Egyptian cotton
(3) (F) (Field)
表示在算符两侧的检索词必须同时出现在文献记录 的同一字段,两词词序不限,中间插入词的数量不限。
种形式。
(2)数字化: 信息资源由纸张的文字变成磁性介质上的电磁
信号,存储的信息资源密度高,容量大,可无损耗 反复的使用。
(3)内容丰富多彩 (4)数据结构具有通用性、开放性、动态性 (5)信息资源体积小,数量巨大 (6)传播方式的无限性 (7)交互性
第二节 数 据 库
一、数据库的概念 二、数据库的类型 三、数据库结构
根据所具备的条件选择手工检索工具还是 计算机检索系统,计算机检索是选光盘检索还 是网络数据库检索。也可采取二者结合的方式。
3、选择数据库或检索工具
(1) 数据库或检索工具收录的文献学科范围 (2) 数据库或检索工具收录的文献年度 (3) 数据库或检索工具收录的文献类型 (4) 索引系统是否完备,能否提供多种检索途径 (5) 要了解数据库的使用介绍,弄清标引特征
communication satellite
communication through satellite
communication on the satellite
(2)(N)和(nN)
(N): (Near)表示算符两侧的检索词必须紧密相连, 但词序可以颠倒,不得插入其它词。
(nN) :表示在算符两侧的检索词之间最多允许插入n 个词包括实词和虚词,两个检索词词序可颠倒。
关键词(KW)
分类号(CC) 全文(full-text)
DE: Descriptor
CC: Classification Code
例如:
television/TI 在篇名字段中找出电视的文献
television/AB 在文摘字段中找出电视的文献
Au=Smith, J.C 在著者字段中找出Smith, J.C 发表的文献
表示在算符两侧的检索词必须同时出现在文献 的同一子字段中,即同一句子或短语中,检索范围比 (F)小,检索结果准确。
4、限制检索:
是指检索系统中提供的缩小或约束检索结果的检索方法。
(1) 字段检索:
用于限制检索词出现的字段。每一个字段都有特定的代码。
基本检索字段:
文摘 (AB)
篇名(TI) 叙词或主题词(DE)
相关文档
最新文档