计算机信息检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

中国科技信息研究所
中国科技信息研究所(ISTIC) 其网址是: 。 ISTIC是我国最大的一个科技信息服务 中心,向全国联机终端提供检索服务。

开发应用的数据库:

· 中国科技文献数据库(光盘) · 中国学位论文目录数据库(软盘、光盘) · 中国学术会议论文数据库(软盘、磁带、光盘、 联机检索) · 中国学术会议论文数据库(软盘、磁带、光盘、 联机检索) · 中国科技信息机构数据库(光盘、联机检索) · 西文文献目录数据库(联机检索) · 科技动态数据库(联机检索) · 科技声像资料联合目录数据库(软盘)
2.3国际互联网检索

2.3.1互联网检索特点 也称因特网,它具有全球性的分布结构、开放性的信 息环境及跨国界的信息流。互联网的检索可同时使用 网上多个主机,甚至所有主机的某种资源而并不需要 用户预先知道它们的具体地址。这就极大扩宽了其检 索的空间和信息量,包括各种文献信息资源及其指向 的网络页面。而传统的联机检索、光盘检索只局限在 对一台或几台主机上的特定数据库的检索。但在另一 方面,互联网信息庞杂,正式与非正式信息及其交流 渠道共存,信息缺乏有效的组织管理,因此很难用一 般意义上的查全、查准这些概念来衡量其检索。目还 没有一个对所有在线服务行之有效的简单检索模式。

2.1.2联机数据库的结构
数据库主要由“文档——记录——
字段”三个层次构成。
文档(File)
文档是数据库内容的基本组成形式。是由若干 个记录构成的信息集合。分顺排和倒排。 顺排:将数据库记录按记录号大小排列而成。 倒排:以记录的特征标识为排列依据,在后面列 出含此标识的记录号。 一个数据库一般含有一个顺排文档及数个倒排文 档。
中文数据库:

· 中国经济信息库 · 中国科技期刊题录库 · 中国专利文摘库 · 参考消息 · 参考资料 · 靶场试验与管理 · 中际人物 · 国际专题 · 台港澳 · 中国组织机构 · 中国专题

北京文献服务处是中国国防科技信息中 心与北京市科协联合组建的机构,始于 1981年。它是国内主要的联机检索系统, 可向全国100多终端提供联机检索服务。 国内可通过电话线与其连通。 服务处目前有44个数据库, 其中20 多个为全文数据库,包括2500万篇文献。

2.2光盘检索

2.2.1光盘种类 只读式光盘简称 CD-ROM,它的数据只能被 读取,一般电子出版物的载体多为CD-ROM, 检索用光盘都为只读式的。 一次写光盘简称 WORM, 它的数据写入后就 不能再改写,即成为CD-ROM。目前,普遍采 用刻盘技术用来写光盘,它可实现光盘的复制, 以及各种媒体信息的光盘制作。 可擦写光盘。可多次读和写。
我国联机检索系统

我国的联机检索服务从80年代开始,一方面利 用国际联机检索系统,另一方面加紧自己的信 息网络建设,引进并开发研制自己的数据库和 联机检索系统。 北京文献服务处(Beijing Document Service,简称BDS)的网址是: http://210.79.226.16, 其主页如图:

中文数据库:

· 世界国防科技工业数据库 · 武器装备多媒体信息库 · 可靠性数据库 · 国防科技成果综合推广库 · 外军工程装备 · 《现代军事》 · 中国工程院院士学术报告 · 世界军事技术和武器装备数据库 · 《科技简讯》 · 国内成果交流库 · 中国国防科技信息中心中文馆藏库 · 中国国防科技中文文摘库
2.3.2基于WEB的联机检索

Web版数据库检索大量采用超文本。 超文本内容排列 是非线性的,它按知识(信息)单元及其关系建立起知 识结构网络,如又具有图形、画面的信息又称作超媒 体(hypermedia),超文本( 媒体)的检索是通过超文 本链接(hyperlink) 来实现的。其形式有的在网页的文 字处有下划线,或以图标方式标志,用户点击(pointand-click)这些标志便能进入到与此信息相关的下一页, 在该页面上通过超文本链接进入再一个页面,超文本 起信息导向作用。这样,用户从一个页面转向另户一 个页面的控制过程中获取自己所需要的信息。

记录(Record)

记录是文档的基本单元。是对某一完整 信息的描述。在书目数据库中,一个记 录相当于一条文摘或题录,在全文数据 库中相当于一篇文献。由若干字段组成。
字段(Field)
字段是记录的基本单元。 在书目数据库中一条记录含题名、著者、 出版年、主题词、文摘等字段。 不同数据库字段内容是不一样的。
3、由于光盘系统费用是一次性投入,其使 用时间一般不受限制,因而用户在检索 时能够从容不迫地发挥系统提供的多种 检索功能的重复检索的优势,提高检索 的效果。而联机情报检索的费用一般是 由使用机时和占用通信线路的时间以及 数据库版权费等组成,它要求用户必须 尽可能减少操作时间和通讯时间,以便 节省费用,这给用户心理上造成了较大 的压力,因此也会影响检索效果。

2.1.2联机检索的方式

联机检索传统上采用命令检索方式,通过一些系 统能够识别的命令(指令),完成对检索式的运 算,实施检索。命令方式能比较恰当的反映检 索词之间的概念范围, 表达检索各概念间的关 系。检索灵活、简捷、快速、利落,检索的精 度较高。由于联机检索的机时通常被计入收费, 因此,准确、快速的检索十分必要。但在另一 方面,它对检索技能的要求也相应较高,常需 要掌握检索技能、熟悉命令的有经验的人员来 执行,以发挥命令检索的优势,避免把过多的 经济负担转嫁给用户。

4、具体操作,连通系统主机,进入网络, 输入选择好的数据库文档命令。不同系 统有不同的命令,可以借助系统提供的 索引来选择文档。
5、编制输入检索提问(利用组配符组织 检索词汇)进行人机对话。 6、处理检索结果(包括输出、打印、评 价)。 7、退出检索系统。

DIALOG系统

美国DIALOG是世界上处于领导地位的 国际性联机检索服务系统,始建于1966 年,于1972年开始商业性经营,提供综 合性联机信息。它的总部设在美国加州 的Palo Alto,现是Thomson 公司的一 部分,它的用户达2万,遍布世界100多 个国家。DIALOG公司站点的网址是: ,

3、选择合适数据库:一个系统往往有几百个 数据库,因此检索者要仔细了解数据库的内容。 明确:数据库的类型(是二次文献数据库还是 源数据库)、收录范围(学科、时间、选收重 点、完备程度)、文档结构(组成字段、可检 字段)、记录内容(记录的详略程度)、更新 周期(直接影响着数据准确性)、费用(使用 费打印费检索费上机费等)。

DIALOG发展很快,数据库以每年20%的速度增长, 现有全文、题录、事实及数据型数据库500多个,文 献量超过3亿篇。主题内容覆盖知识产权、新闻和媒体、 化学、政府和地区、商业和金融、医学、食品和农业、 工程、科学、技术等领域。其中科技文献数据库占 40%,社会科学与人文科学文献库占用10%,公司及 产品等商情数据库占24%,其它为新闻、传媒以及参 考工具等类型数据库。文献数据库有题录、文摘及全 文等多种形式,科技文献包括期刊、会议录、图书、 专利、科技报告、学位论文、标准、产品手册等各种 文献类型。数据库中的数据最早可回溯至60年代,数 据库多数按周更新 。
第六章 计算机信息检索
1 计算机信息检索系统的构成 2计算机信息检索的类型 3 计算机信息检索技术

1 计算机信息检索系统的构成
图5-1 计算机信息检索系统示意图
1 计算机信息检索系统的构成
1.1 数据库 1.2 通信系统 1.3 检索终端

1.1 数据库

数据库是计算机检索的基本操作对象。 是检索系统中的信息源,它存储在计算机 的磁带、磁盘或光盘上,借助于数据库 的管理软件技术和检索系统,对于不同 的信息需求,数据库可以随时按不同的 目的提供各种组合信息,以满足检索者 的需求。
4、光盘检索通常采用菜单方式, 根据菜单 提示、指引,通过选择、确定或键入填 写以及一些功能键的使用,一步一步地 执行检索,修改检索提问,直至完成全 过程。光盘检索界面友好,允许人机对 话,不需要专门的学习和培训,只要认 真遵循界面的指示做下去,总能达到检 索目的。
总之,光盘数据库与联机数据库相比,存在着更 新时间慢、数据容量小、专业范围窄等缺点, 但它使用时操作方便、易学易用、费用低廉。 目前,国内外光盘数据库产品已达几千,与此 同时,光盘数据库检索系统与检索技术也不断 发展、不断完善,国外许多大型信息服务公司 均开发有使用方便、功能齐全的检索系统,以 专门用来对本公司光盘数据库产品进行检索。 一般,各公司所开发的光盘检索软件适用于该 公司所出版的所有光盘数据库。这样对于用户 来说,只需掌握了该公司的光盘检索系统的使 用方法,便可有效利用该公司的所有光盘数据 库产品。
2.2.2光盘检索系统的特点方式
1、光盘检索系统是一个独立的计算机检 索系统,它在整个检索过程中不涉及远 程通讯网络问题,也不需要专线电话之 类的通信线路,这样就避免了国际联机 所常有的通讯线路不畅、通讯费用高昂 等不利因素。
2、光盘检索系统软件功能比较齐全、操作 简单易学,而且不受检索时间的限制, 使得即使没有受过专门训练的情报用户 也能按照屏幕的提示或利用系统的帮助 功能独立进行检索操作。而联机检索通 常都需要采用较复杂的检索方法和命令, 致使只有经过专门的学习、培训,才能 较好地达到检索目的。
2.1.3联机检索的步骤

1、明确需求,确立检索目标
分析课题,了解检索的最终目的,以及所需 文献的数量、语种、年限、类型等,分析检 索点与主题词,并转换成计算机可识别的格 式。

2、选择合适信息检索系统:与手工选择 工具书一样,选择系统也应考虑时间范 围、可检字段、打印格式、记录的信息 量、检索功能、联机订购、价格等因素。
中国万方服务系统Chinainfo
Chinainfo由中国科技信息研究所和万方 数据库(集团)公司共同开发,是基于 Web的数据库资源检索服务系统。其主 页地址是: 。 万方数据系统Chinainfo的新版界面将数 据库分为三个子系统,包括:科技信息 子系统 、商务信息子系统、数字化期刊 子系统。
2.2.3光盘检索系统分类:

单机光盘检索系统 有微机、光驱、光盘数据库等硬件设备和驱动 程序、操作程序、检索程序等软件组成,自成 一体,提供单用户、单机的使用,系统结构简 单,但数据量少、利用率低。

联机光盘检索系统将光盘上网,一般只提供在 局域网上的检索,如图书馆网、校园网等,它 可以连接到许多用户终端,网上用户可以分时 共享光盘数据库的信息。光盘有服务器管理运 行,它们的光驱是多盘的,有光盘塔 和光盘库。 光盘塔分别有4张、7张、14张、28张光盘为 一组的,以电子方式驱动。光盘库可安插上千 张光盘,有机械手检出需用的,一般用它来安 装数据量巨大的全文数据库光盘。
1.2通信系统

通信系统是沟通检索终端与计算机的桥 梁,其作用是确保信息传递的畅通。
国际上大型联机检索系统的主机都与本地区 数据通信网络相连,在网络上有端口,检索用 户通过公用电话线路或专用线路与本地的数据 通信网络相连,然后按拨号,通过卫星通信与 主机联机。
1.3检索终端

检索终端包括计算机、电话线、MODEM或 ISDN(ADLS)、打印机等。调制解调器的 作用主要是在计算机和通信网络之间进行模 拟信号和数字信号转换。
2 计算机信息检索的类型
2.1 2.2 2.3

国际联机检索 光盘检索 网络信息检索
Байду номын сангаас
2.1联机检索

联机检索指利用计算机终端,通过通讯线路, 从信息中心的主机数据库中检索出所需要的信 息的过程。
2.1.1联机检索的特点
1、内容广泛、信息量大 2、报道及时 3、查找迅速 4、使用方便 5、检索途径多 6、信息质量好 7、安全性好
相关文档
最新文档