第九章 基于DIALOG系统的信息检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

2 、DIALOG检索技术
• 2.1 布尔检索技术 • 2.2 截词检索技术 • 2.3 词位检索技术
3 DIALOG检索操作
• 操作DIALOG系统的基本检索模式主要有三种: • 一是经典的命令检索(Command Search),即DiaolgClassic, 通常用Telnet方式进行,这是一种可以准确快速获取信息 的方法,用户可以按照系统提供的独特的检索命令,查找 自己所需要的资料; • 二是Web化检索,URL为 ,它使 得检索DIALOG系统更容易操作; • 三是菜单式检索(Menu Search),这是适用于新用户或检索 不常用数据库时可用的一种理想模式,其Web版URL为 。
3.2 选择数据库或文档
• 连通DIALOG系统之后,就可以选择需要检索的数据库或文档 。如果用户对DIALOG系统数据库或检索主题比较熟悉,就可 以直接进库检索。但是,如果用户对DIALOG系统数据库或检 索主题不太熟悉,就需要选择数据库或文档。 • 首先,通过《数据库目录》(Complete Database Catalog)和《数 据库蓝页》(Database Bluesheets)等工具,全面掌握DIALOG数据 库的类型、收录范围、文档结构、记录内容、更新周期和检索 费用等情况。 • 其次,通过DIALOG系统总索引和选库指令,选择检索文档的 范围。例如,检索式“? sf business”、“? sf scitech 24, 25, 27” 就表示从分类角度检索商业或科技方面的文献。sf后面的 business、scitech是数据库的类目。 • 最后,掌握选库的基本原则,节约检索投入。在选择数据库或 文档时,一个总的原则是:先免费后收费,先文摘后全文。
3.1 接通DIALOG联机系统
• 以经典联机操作方式为例,通过DialogLink等通讯软件进入DIALOG系统 。 • 输入DIALOG的用户标识及号令,经系统验证确认后,终端将显示 “Welcome to DIALOG”,表示用户终端与系统主机正式连通,此时用 户就可以开始自己的正式检索。 • 接通DIALOG联机系统主要包括建立用户终端与中心计算机设施之间 的线路连接和键入各种密码表明用户标识两个方面。 • 接通DIALOG系统后,用户会首先会进入一个价格较低的缺省文档。 DIALOG为1989年2月之前的用户指定的缺省文档是ERIC(File 1),为1989 年2月之后的用户指定的缺省文档为HOMEBASE(File 405)。如果缺省文 档为HOMEBASE,则显示HOMEBASE的菜单,介绍DIALOG的功能、 指令、培训和新闻等基本内容。DIALOG系统指令的格式是:?指令< 空格>数据<回车>。例如,键入2,回车后系统显示DIALOG的数据库 特点。 • 也可通过网址 操作DIALOG系统Web版。
• (3) 分步检索指令SELECT STEPS(SS) • SS指令与S指令的功能相同,区别在于SS指令是分步给号查找 文献信息的指令,系统给被组配的每个检索项都赋予一个集合 号,以供修改检索策略和重新组配时调用。例如: • ? SS petroleum and prices and opec • S1 2711 PETROLEUM • S2 2683 PRICES • S3 151 OPEC • S4 110 S1 AND S2 AND S3 • (4) 逻辑组配指令COMBINE(C) • C指令的功能是对各检索词进行逻辑组配,但在C指令后面只 能是集合号,而不能直接使用检索词。 例如,“? C (1 and 2 and 3)”。集合号与运算符之间可以空格,也可以不空格。
3.3 构造检索式并实施检索

• •
• •
包括选择检索词,使用各种检索技术确定组配方式等内容。在DIALOG系统中使 用的主要选词指令和逻辑组配指令(命令)如下: (1) 进库指令BEGIN(B) 如果用户对数据库或检索主题比较熟悉,就可以使用进库指令BEGIN(简写为B) 进行检索。其格式为:? BEGIN n或? B n,其中,?为DIALOG系统检索命令提示 符,n代表某一个具体的文档号。例如,检索式“? B 7”,表示开始检索 DIALOG系统中编号为7的数据库或文档,即Social SciSearch(《社会科学引文索引 》)数据库。 (2) 选词指令SELECT(S) 在S指令后输入适当的检索词或代码(即检索策略),系统就会从数据库文档中检 出含有这些检索词或代码的文献,并赋予一个集合号(Set No.),或称提问编号。 检索词可以是单元词或多元词,要求不超过240字符;可以是前缀码或后缀码, 例如,“? PY=2000”或“? S information/TI, DE, ID”;还可以是与词位算符、 截词算符或布尔算符等连用的检索式。例如,“? S petroleum and prices and opec and py=2000”、“? S EUROPEAN (W) ECONOMEC (W) COMMUNITY ”等。
Dialog信息资源按数据类型分主要有四种类型: (1) 题录文摘型数据(Abstract,主要是科技、专利类信息) (2) 名录手册型数据库(主要是各种工商企业名录、专用手册、百科全书、药典 等)。此数据类型与全文型数据、数值数据经常混编。 (3) 全文型数据(主要是市场行业报告、分析报告和工业报告、新闻报道、期刊 、报纸)。 Dialog有100多个数据库均含有全文记录,加上10多个纯粹全文数据库 囊括几千种期刊和全球数百种报纸,据不完全统计至少有7000多种期刊的全文 供你选用。 (4) 数值类信息(Numeric,主要是各种统计诸如价格、进出口数据、生产、销售 数据等信息)。 除个别统计数据库外,大部分市场库都有不少分析文章带有统计和表格数据。
• •
• •
• •Байду номын сангаас
• •
(7) DIALMAIL 系统提供的方便简单的电子邮政服务,通过它可以与 Knight-Ridder 公司的信息职员、信息提供商以及其它的 DIALOG 用户进行通信联 系; DIALMAIL 还提供将检索结果打印件及时传送到用户的电子信箱 的服务。 (8) DIALOGLINK 这是 DIALOG 系统提供的一种联机检索通信软件。它具有自动登 录主机、登录前检索策略的预处理、脱机后重复显示检索信息、将检 索全过程存贮到磁盘中、费用跟踪、观看图像等功能。用户可以通过 Internet 进行网上拷贝,也可以向 Thomson 公司索取,还可以从 ONDISC 光盘上获取。 (9) ONDISC 已将系统的一些数据库制成光盘产品,用户可以在自己的微机上不 受通信条件及联机时间的限制进行检索,这是专门为那些具有特定学 科和专业检索要求的用户而提供的一种选择。目前,这些光盘数据库 涉及商情、教育和人文科学、健康和生物医学、法律和行政管理、报 刊杂志、科学技术 6 个大类数十个光盘数据库。 (10) 其他服务 图像输出技术服务、报表生成服务、图像处理软件服务以及其他各种 培训服务等。
• 1.1.1 庞大的数据库体系
• DIALOG系统拥有995个大型数据库,经常使用的重要数据库就达600多 种,数据记录超过3亿条。DIALOG系统数据库类型多种多样:既有书 目数据库(Bibliographic Database),也有全文数据库(Full-text Database); 既有指南数据库(Directory Database),也有数值数据库(Numeric Database) 和复合数据库(Composite Database)等。
• (5)去重指令REMOVE DUPLICATES(RD) • RD指令的功能是用于对来自不同数据库的文献进行比较,使 同一文献只出现一次,使用格式为? RD [Set No.]。集合号缺省 时约定为前一检索,每次RD操作不能超过5000个记录。该指令 在同时打开多个数据库进行检索操作时特别有用,可以避免输 出重复。 • 此外,DIALOG系统还提供有限定指令LIMIT(L)、扩词指令 EXPAND(E)、更换文档指令File n、排序指令Sort、执行保留指 令Execute、保留检索指令Save和Save Temp等。
基于DIALOG系统的信息检索
主要内容
• • 1 DIALOG检索系统 • 2 DIALOG检索技术 • 3 DIALOG检索操作
DIALOG检索基础
• DIALOG系统是目前世界上规模最大的联机信息 检索系统,拥有近千个数据库,覆盖所有学科领 域,文献总量超过了3亿条,占世界机读文献总量 的50%以上。 • 1.1 DIALOG系统的发展特征 • DIALOG系统创建于1964~1965年,原为美国洛 克希德导弹与宇航公司(Lockheed Missiles & Space Company Inc)的一个信息科学实验室,总部设在美 国旧金山的Palo Alto市(通讯地址:3460 Hillview Ave,Palo,Alto,CA94304 USA)。
• 1.1.2 优良的服务网络 • DIALOG系统通过TYMNET、TELENET等公用数据网和 DIALNET、VNINET等专用数据网在美国、加拿大、日本 等国家和地区建立了巨大的服务网络,拥有用户达5万个 ,遍布世界120多个国家和地区的200多个城市,拥有10多 万个联机终端。
• 1.1.3 丰富的服务方式 • DIALOG系统提供了多种多样的信息服务,除了系统提供的常规的联 机检索服务外, DIALOG系统还提供有下列几种基本的服务方式: • (1) Knowledge Index(KI) • 这是系统在1982年推出的一种晚间联机检索服务,即知识索引。时间 自晚上至凌晨5时,可检索的数据库有80多个,检索方法比较简单。 既可用简化的指令语言,也可以用菜单选择,很适于拥有微机的家庭 用户和办公室人员亲自上机进行信息检索。这种服务也可称为“家庭 检索服务”或“个人自助式检索服务”(Online Self-Service)。 • (2) Dialog Business Connection(DBC) • 这是系统专门为满足商界的信息需要而设计和提供的一种商界联接服 务。它提供简便的菜单驱动式人机接口,使用户可以方便快捷地查询 DIALOG系统中的各种经营管理类的数据库,从而获取大量的有关商 业竞争和财政分析所需要的事实和数据,以及有关公司兼并和购买方 面的信息。 •
• •
• •
• •
• •
(3) One Search 这是系统在1987年提供的一种独特的多文档检索服务,它允许用户用一个检 索策略同时从多个数据库中(最多为20个)进行检索,还可以修改检索策略,显 示检索结果并对重复内容进行删除。检索时既可以直接用指定的文档号作为 检索词,也可以用DIALINDEX中的数据库分类标识做检索词。例如,用户输 入BEGIN ENG这一检索指令,就可以同时检索工程领域中的10多个数据库, 如COMPENDEX、INSPEC、NTIS等。 KI、DBC和One Search既是3种专项的 服务方式,又是DIALOG联机检索软件系统中3种独立的检索软件。 (4) Dialog Alert Service 系统提供的一种定题检索服务,即针对用户的特定研究课题进行自动定时 更新,并将打印结果及时传送给用户. (5) DIALORDER 系统提供的一种联机原文订购服务,用户通过 DIALORDER 就可以从众多 的文献提供商那儿获取原始文献的复印件。 (6) DIALINDEX 系统提供的数据库总索引,即 411 文档,通过 DIALINDEX 这一数据库选 择工具,用户可以同时扫描多个数据库,以此获知哪些数据库中有自己所需 要的文献信息。
相关文档
最新文档