第二章 书目型数据库及参考工具书

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

检索结果
调整检索方案
1.选择检索模式 浏 览 ◆ 基本检索 ◆ 高级检索 ◆ 专家检索

理念:面向最终用户
(1)浏览(Browse)
按学科浏览
按出版物类型浏览
(2)基本检索(Basic Search,Simple Search )
适合于初次使用检索的新手或检索式非
常简单、仅使用于少数常用字段
(3)高级检索(Advanced)
4.数据库的结构
数据库是由一个或若干个文档组成的,具有最小冗余 度的数据的集合,其中的数据是按照一定的数据结构 进行分级存贮的。
文档(File) 文档是一种数据和信息的容器,是可以包含文本、图
像、视频、音频、动画等复杂非结构化数据的集合。
记录(record)
对某一文献的记录,字段的集合,包括该文献的主要
事商业服务。ORBIT系统是美国系统发展公司1965
年建立的一个联机检索服务系统。ESA-IRS系统:成
立于1965年,969年以后经多次变革,目前ESA-IRS
发展成为欧洲最大的联机检索中心,是仅次于 DIALOG。
2.光盘检索系统
系统配置简单,费用低:只要购买一台个人电脑,配
上光盘驱动器和相应的软件,就能组成一个小型的光
一类是数据型数据库(numeric database),是一种以自然数
值形式表示的信息源数据库。
二类是事实型数据库(fact database),库内记
录各种有检索和利用价值的事实。
三类是术语型(概念型)数据库,实际上就是一种电 脑化的名词术语词典或词库。 四类是图像型数据库,库内存有某些图像信息。如卫 星图片、工程设计图等。一般为内部使用。
•提供更多的检索选项
•从下拉菜单中选择合适的字段
•选择检索限制,使用布尔算符组合检索项,限制检索的年代、
语种。
在线 帮助
(4)专家检索(Expert)
•命令式检索,可构建复杂的检索式 •适合熟悉系统命令的有经验的检索人员 •使用布尔算符、位置符、括号和字段标识符
(例如ab=或 ti=)
2.确定检索途径
。截词检索在西文数据库中广泛使用。
通配符(wildcard character)-实现模糊检索
截词检索(truncation)多为前方一致检索。截词符 多采用“*”,可以用它代表多个字符。
comput*---computer,computation等单词
逻辑算符在数据库中是有执行顺序的
NOT → AND → OR 用括号变更顺序
logical operator
(Computer-aided or Computer-assisted or computerbased) and English testing

(2)位置算符( proximity operator) 用来决定两个检索词间的邻近位置关系
subject, descriptor (主题词)
用可代表这些中心思想、基本问 题、研究对象的词语(被称为主 题词),对每一篇文献进行标引。 按主题词排序,可将论述同一主 题词的文献排在一起;用主题词 检索,可将论述同一主题的文献 检索出来
ห้องสมุดไป่ตู้
主题指文献所要表达的中 心思想、所讨论的基本问 题、研究的对象等
3.编制检索式
检 索 式 的 编 制
检 索 词 连 接 组 配 符 号
(城市改造 or 城市建设 or 城市规划) and ( 旧城 or 老城 )
+
如何确定检索词
• 两大类: 描述文献主题内容的词 主题词、关键词、分类号等
描述文献外部特征的词 著者、著者单位、出处、访问号 (access number)等
表2-1 计算机检索发展阶段及特点 时 间 名 称 特 点
1954-1964
脱机检索
专业检索人员定期批量处理用户情报需求,用户 不能立刻获得检索结果。检索结果为题目、作者、 文摘等。 多个检索终端通过通讯网络与检索系统中央计算 机连接。采用分时技术实现多个用户同时检索。 用户随时浏览检索结果。 系统配置简单,费用低:只要购买一台个人电脑, 配上光盘驱动器和相应的软件,就能组成一个小 型的光盘检索系统。用户界面友好,易操作:光 盘检索一般自成系统,并且往往自带软件系统和 必要的工具,帮助系统也很完善,检索功能强, 速度快,效果好。 计算机通过电信系统与网络相连获取信息的一种 检索方式。在遵守共同的通信协议的前提下同一 个用户可以访问多个服务器,一个服务器也可以 被多个客户访问。客户既是网络信息的检索者。 也是网络信息的提供者。
subject descriptor (主题词)
主题词是经过规范化的语词 (controlled-terms) 主题标引的依据是“主题词表”
主题词检索是主要检索点,可以 保证很高的查准率和查全率
检索文摘含有“机械”,并且关键词含有“CAD或
CAM”、或者题名含有“雷达”,但关键词不包含
“模具”的文献。
(k=( CAD+CAM)+T=雷达)*R=机械-K=模具 此检索式也可以写为: ((K=(CAD+CAM)*R=机械)+(T=雷达*R=机械))-K=模 具 (K=(CAD+CAM)*R=机械)+(T=雷达*R=机械)-K=模具
• 需注意: 同义词:计算机辅助教学
• Computer aided instruction、Computer assisted instruction
Near(N) tax N5 reform “tax reform”、“ reform of income tax” Within(W) tax W8 reform 对于全文型数据库,特别是进行全文字段检索时,
使用位置算符往往更理想
(3)截词检索 截词检索是用截断词的一个局部进行的检索,凡是满 足这个截词所有字符(串)的记录,系统都为命中。是 在词干后可能变化的位置加上截词符号。这样既可减 少检索词的输入量,又可扩大查找范围,提高查全率
第二章 书目数据库及参考工具书
第一节 计算机信息检索
一、计算机信息检索的概念 计算机信息检索就是指人们在计算机和计算机网络 或终端上,使用特定的检索指令、检索词和检索策
略,从计算机检索系统的数据库中检索出所需要的
信息,然后再由终端设备显示和打印的过程。
二、计算机信息检索发展历程
计算机信息检索出现于 20世纪50年代,发展大体经历了四个 阶段。
1.逻辑“与”
运用AND 或 * 算符 实现逻辑“与”组配
检索时,检索同时含有检索词A 和检索词B的文献用
于交叉概念或限定关系的组配,专指性强。
如:logistics AND e-commerce
traffic AND control
逻辑“或”(or、+)
检索时,命中信息包含所有关于逻辑A或逻辑B或同 时有A和B的,用于并列或平行关系的组配,检索范 围比AND扩大。 如:rapid transit OR light rail OR subways
下位词:
– china or shanghai or guangdong or zhejiang or ……
全称与简称:麻省理工学院/MIT 异称:电脑、计算机 不同拼写形式:center and centre
(1)布尔逻辑检索
在计算机文献检索中,用户的检索需求是通过检索提
问式表达的,逻辑算符在检索提问式中起着逻辑组配
(2)数据独立
(3)统一管理
(4)数据共享
3. 数据库的种类 按照数据库的内容性质分,有文献型数据库和非文献 型数据库。 (1)文献型数据库,主要以文献形式存贮,如一次文 献或二次文献,可分为书目数据库(bibliographic database)和全文数据库(full-text database)。 (2)非文献型数据库可以分为四类:
菜单。这种检索方式常用在多媒体电子出版物中,这 类出版物不光采用超文本,而且常采用超媒体,提供 文本和图形界面,INTERNET上的WWW就是典型例 子。
四、数据库
(一)数据库概述
1.数据库的概念
数据库( database )是指计算机存贮器中合理组织
相互有关的数据集合。 2.数据库的特点
(1)最小冗余
railway OR railroad
逻辑“非”(not 、 -) 命中信息包含逻辑A、不包含逻辑B或同时有A和B 的,从含有检索词A的文献记录中删去含有检索词B 的文献记录。用于排斥关系的组配
如:fruit NOT apple
windows NOT Microsoft
图(a)
图(b)
图(c)
逻 辑 运 算 符 (
分类号等。假设有3篇文献,它们的文献号和主题
词分别如下 :
001 002 003
A、B A、B、C B、C
A B C
001、002 001、002、003 002、003
倒排文档的结构
顺排文档的结构
(二)数据库检索基本知识
输出 需 求 分 析
选 择 数 据 库
确 定 检 索 途 径
编 制 检 索 式
1965-1973
联机检索
1980-
光盘检索
1990-
互联网检索
三、计算机检索的系统、原理、类型与方式 (一)计算机信息检索系统构成 1.检索终端:是用户与检索中心进行“人机对话”的 设备。 2.检索中心:由主机、机读数据库等组成
3.通讯接口:服务器及检索终端与通讯网络之间的接
口。
4.通讯网络:是联接检索终端与检索中心的“桥梁
和逻辑运算条件者即为命中信息。如图2-2所示
文献群
入选文件 文献存储 内容分析
文献标引
全文数据库
二次文献数据库
系统词表
检索策略
概念分析
用户
提问
文献检索
图2-2 计算机信息检索原理图
(三)计算机检索类型 1.联机检索系统 DIALOG联机系统:DIALOG是目前世界上最大的联 机系统, 拥有数据库600个创建于1964-1965年间, 1972年正式发展成为国际联机检索系统,并对外从
特征。 字段 (field) 文献特征的记录,题名(title)、作者(author)、 来源( source)、关键词( keywords )、Full-text 等。
5.数据库文档的组织方法
计算机检索系统中的数据库通常有两种编排方式,即
顺排文档和倒排文档。 ( 1)顺排文档 顺排文档又称主文档或线性文档,是数据库的核心 文档,基本单元是“记录”。 (2)倒排文档 在倒排文档中,文献的某种属性或特征被用作文献 标识,即当成可检索的字段,主题词、著者名、
作用,它们能把一些具有简单概念的检索词(或检索
项)组配成为一个具有复杂概念的检索式,用以表达
用户的检索需求。
运用布尔逻辑算符(logical operator)AND/*(与)、
OR/+(或)、NOT/—(非)对检索词进行逻辑组配, 表达两个概念之间的逻辑关系,确定各检索词之间的 逻辑关系,Boolean operators
‘”数据库。如图2-1所示
机读 数据库
通讯线路 检索终端 通 讯 接 口 通 讯 接 口 主机(服务器) 及系统软件
检索中心
图2-1 计算机信息系统的结构示意图
(二)计算机检索的原理 计算机检索的基本原理是计算机将输入机检系统的用
户提问标识(检索词)与已存储在系统中的文献特征
标识(标引词)进行机械性匹配比较,符合比较原则
,适用于有经验的检索人员。 2.菜单式检索 是一种方便易掌握检索方式,称“easy-to-easy”检索 。普通用户只要根据菜单的指引,通过确定适当的选 项和功能键便能一步一步地完成检索。
3.超文本式检索
超文本的内容排列是非线性的,它按知识(信息)单
元及其关系建立起知识结构网络,操作时用鼠标点击
相关的知识单元,检索便可追踪下去,进入下面各层
盘检索系统。
3.网络化信息检索系统 是指用户的计算机通过电信系统与网络相连获取信息 的一种检索方式。在遵守共同的通信协议的前提下同
一个用户可以访问多个服务器,一个服务器也可以被
多个客户访问。客户既是网络信息的检索者。也是网
络信息的提供者
(四)计算机信息检索的方式 1.命令式检索
是使用一些特定的操作命令(包括指令)来实施检索
author, title, keywords, journal title
subject, descriptor (主题词) All fields
3.掌握检索技术 在计算机文献检索中,用户的检索需求是通过检索提 问式表达的,逻辑算符在检索提问式中起着逻辑组配 作用,它们能把一些具有简单概念的检索词(或检索 项)组配成为一个具有复杂概念的检索式,用以表达 用户的检索需求。
相关文档
最新文档