计算机检索原理与检索系统
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
▪ 调制解调器的作用是把终端的信息在传输前加载到 一个载波信号上,接受时通过检测收到的信息偏离 精确载波信号的程度,分离出原先发送的信号(称 之为解调),以解决信息传输过程中的衰减问题。
docin/sundae_Hale Waihona Puke Baidueng
(4)软件
▪ 软件的作用是充分发挥硬件的功能,进行信息 的存储、处理检索以及整个系统的运行管理。
docin/sundae_meng
(4)网络信息检索(NETWORK SEARCHING) 互联网的发展使人类社会信息的存储、传递、
交流和利用发生了革命性的变化,世界变小 了,实现了全球通讯和资源共享。互联网上 的信息资源呈现爆炸性增长,传统的相对独 立的联机检索系统纷纷变成了互联网上的一 个站点,计算机检索进入了网络信息检索阶 段。
计算机检索原理 综合性数字资源 检索图书的数字资源 检索期刊的数字资源 检索特种文献的数字资源
docin/sundae_meng
一、计算机检索原理
1.计算机检索概念
计算机检索:利用电子计算机、高速信息网络等信息 技术存储和检索信息的过程。
人们在计算机检索网络或终端上,使用特定的检索指 令、检索提问,从计算机检索系统的数据库中检索 出所需要的信息,然后再由终端设备显示、下载或 打印。
▪ 二期建设将“中英文图书数字化国际合作计划” (简称CADAL)列入重要组成部分,。
▪ 全国高校图书馆通过CALIS内部信息库,依据程序 申请成为CALIS成员馆,可获得CALIS提供的各种 服务。
▪ 网址:calis.edu
docin/sundae_meng
4. DIALOG检索系统
• DIALOG系统于20世纪60年代由美国洛克希德导弹与 空间公司创建,该系统以其检索软件命名。1972年开 始为世界各地的用户服务,成为第一个商用数据库。 1981年正式成为洛克希德公司的子公司,开始独立经 营。
docin/sundae_meng
( 2 )联机检索(Online Retrieval)
使用终端设备,运用一些规定的指令输入检索词和检 索策略,通过通讯网络与相关检索系统直接连接进行" 人机对话",同时通过运行检索软件从信息检索系统的 预先储存文献的数据库中查找所需信息的过程。
优点:1.克服了地理上的障碍;2.消除了时间上的 延迟现象;3.保证检索者获得最新、最及时的文献信 息;4.检索者可修改检索策略,达到一定的查全率和 查准率。
术语数据库——专门存储名词术语信息、词语信息 以及术语工作和语言规范工作成果。
图像数据库——用来存储各种图像或图形信息及有 关文字说明资料。
docin/sundae_meng
3 .计算机检索的发展
(1)脱机检索(Off-Line Retrieval) ▪ 脱机检索又称批式检索:用户只需要把检索要求
docin/sundae_meng
二、综合性数字资源
1.中国知网(中国知识基础设施,CNKI )
国家知识基础设施的概念,由世界银行提出于2019年。 CNKI工程由清华大学、清华同方发起,始建于 2019年6月。采用自主开发并具有国际领先水平的 数字图书馆技术,建成"CNKI数字图书馆",并正式 启动建设《中国知识资源总库》及CNKI网格资源共 享平台,通过产业化运作,为全社会提供信息资源 和数字化学习平台。
▪ 国际上通常将其划分为两大 类:参考数据库、源数据库。
docin/sundae_meng
▪ 参考数据库:指引用户到另一信息源以获 得原文或其它细节的一类数据库。包括:
书目数据库——存储某个领域的二次文献(如文 摘、题录、目录等书目数据)。 指南数据库——存储关于某些机构、人物、出版 物、项目、程序、活动等对象的简要描述,指引 用户从其它有关信息源获取更详细的信息。
docin/sundae_meng
(1)资源分布
docin/sundae_meng
(2)中国期刊全文数据库
CNKI系列全文数据库之一,它收入1994年至 今国内公开出版的八千多种核心期刊和专业 特色期刊的全文, 按学科内容分九大专辑,分 别是:理工A(数理化天地生)、理工B(化 学化工能源与材料)、理工C(工业技术)、 农业、医药卫生、文史哲、经济政治与法律、 教育与社会科学 、电子技术与信息科学。
▪ CALIS管理中心设在北京大学,下设了文理、工程、 农学、医学四个全国文献信息服务中心,华东北、 华东南、华中、华南、西北、西南、东北七个地区 文献信息服务中心和一个东北地区国防文献信息服 务中心。
docin/sundae_meng
▪ 2019年开始建设以来,CALIS引进和共建了一系列 国内外文献数据库,包括大量的二次文献库和全文 数据库;主持开发了联机合作编目系统、文献传递 与馆际互借系统、统一检索平台、资源注册与调度 系统,形成了较为完整的CALIS文献信息服务网络。 迄今参加CALIS项目建设和获取CALIS服务的成员 馆已超过500家。
▪ 收录范围涉及期刊、会议、文献、书目、题录、报 告、论文、标准、专利、法规等。
▪ 可以单库、跨库检索,也可以在所有数据库中检索, 还可以按行业检索。
docin/sundae_meng
▪ 科技信息子系统
面向广大科技工作者、 高校师生、公共图 书馆、科研机构及 政府管理部门服务。
文献资源包括:学位 论文、会议文库、 科技文献、成果专 利、科技名人、政 策法规、中外标准、 科教机构等共30 多个数据库。
docin/sundae_meng
▪ 源数据库:能直接提供原始资料或具体数据 的数据库,用户不必再查阅其它信息源。
数值数据库——指专门提供以数值方式表示的数据 (或包括其统计处理表示法)的一种。
事实数据库——指专门提供事物发展过程中产生的 事实数据。
全文数据库——存储文献全文或其中主要部分,简 称全文库。
送往检索中心,由专职计算机人员进行检索。往 往把一批检索提问集中起来,对提问不立即回答, 而是定期成批地在计算机上查找。由于种种缺陷, 已于20世纪60年代末、70年代初渐渐停止使用, 脱机检索系统逐步转化成联机检索系统。 ▪ 1954年,美国海军武器实验站图书馆在一台电子 管计算机上建立了世界上第一个计算机检索系统。
▪ 国际上大型联机检索系 统的主机与本地区数据 通信网络相联,在网络 上有端口,检索用户通 过网线和网络设备检索 数据库信息。
docin/sundae_meng
(3)检索终端
▪ 检索终端是用户与检索系统传递信息进行“人—机 对话”的装置,有电传终端、数传终端和微机终端 等。
▪ 常用的微机终端,由计算机、打印机以及调制解调 器组成。
▪ 拥有的资料量是目前Internet网上数据的50多倍,是 Web搜索引擎数据的500倍。
▪ 作为世界最权威的专业资料来源提供者,Dialog主要 提供一下信息:新闻、商业、金融、知识产权、政 府和法规、科学技术、能源和环境、医药、药品, 化学化工、食品和农业、社会科学等。
▪ 提供数据库目录检索(Dialindex)、定题通报(Alerts)、 原文订购(KR Source One)、文献传递服务(通过电子 邮件、传真或邮寄等)、数据库直接检索(Searching) 等服务。
docin/sundae_meng
5.STN
STN系统(The Scientific and Technical Information Network-lnternational)系统由美国化学文摘社(CAS), 德国卡尔斯鲁厄专业信息中心(FIZ Karisruhe)和日本 的国际化学信息协会(JALCI)多家合作。
docin/sundae_meng
(1)服务器
▪ 服务器是检索系统的核心 部分,在检索过程中需要 处理大量的指令和数据。
▪ 服务器要具有较高的运算 速度和处理能力,并且具 有相当大的信息存储容量。
▪ 服务器决定了系统的检索 速度和存储容量。
docin/sundae_meng
(2)通信网络
▪ 通信网络是终端与服务 器之间的桥梁,其作用 是确保信息传递的畅通。
•1989年成为Knigth Ridder公司的子公司,后来又几易 其主,现在与ISI、Derwent、Janes、Gale Group等都 隶属于Thomson集团。 •Dialog已经成为世界上最大、最完善、历史最悠久的 在线数据库信息服务公司。
docin/sundae_meng
▪ Dialog已经拥有1000多个大型专业数据库系统.通过 Dialog您能探寻到90亿页纸本和图像及全球7000多 份期刊杂志的全文数据和近600个数据库的内容。
docin/sundae_meng
2.万方数据资源系统
▪ 以中国科技信息研究所(万方数据集团公司)全部信 息资源为依托建立起来的。2019年8月在国际互联 网上投入服务。 1993年注册成为中国第一家数据库 专业公司。
▪ 网址:wanfangdata/
▪ 以科技信息为主,集经济、金融、社会、人文信息 为一体。分科技信息系统、数字化期刊、企业服务 系统、医药信息系统4部分,拥有100多个数据库。
docin/sundae_meng
优点:
(1)检索快捷:处理速度快、运算准确、可靠性高。
(2)多元灵活:采用了逻辑运算和限制检索等功能,使 检索词之间能够灵活地进行组配。
(3)量大面广:可迅速浏览相关领域的所有数据库记录, 网络中每台个人计算机都可成为信息源。
(4)更新迅速:如美国OCLC网络的First Search检索系 统,新刊出版后3天内,即可出现。
docin/sundae_meng
▪ 数字化期刊
以刊为单位上网,按基 础科学、工、农、医、 哲学政法、社会科学、 经济财政、教科文艺 划分为8大类70多个 类目。
约4600多种种科技期 刊,期刊论文的全文 全部上网。
数字期刊可以按期刊的 刊名、学科分类、地 区进行检索。
期刊论文可以按篇名、 作者、作者单位、摘 要、关键词等检索。
(5)资源共享:利用本地计算机可以查询、获取网上丰 富的信息资源,实现资源共享。
(6)方式多样:提供联机回溯检索、定题检索、联机订 购、直接获取全文等多种服务,可按要求输出。
docin/sundae_meng
2.信息检索系统
计算机信息检索系统构成: ▪ 服务器 ▪ 通信网络 ▪ 检索终端 ▪ 系统软件 ▪ 数字资源
docin/sundae_meng
3.中国高等教育文献保障系统
▪ China Academic Library & Information System,简 称CALIS,是国务院批准的我国高等教育“211工程” 中公共服务体系之一。宗旨是把国家的投资、现代 图书馆理念、先进的技术手段、高校丰富的文献资 源和人力资源整合起来,建设以中国高等教育数字 图书馆为核心的教育文献联合保障体系,实现信息 资源共建、共知、共享,以发挥最大的社会效益和 经济效益,为中国的高等教育服务。
库即构成光盘检索系统。
优点是:①使用方便、简单,易于操作; ②不受机时的限制,可反复修改检索策略, 达到很高的检全率与检准率;③检索费用低 廉,没有通讯费用,一次订购,反复使用。
缺点是:①数据更新周期较慢,时差长, 文献的新颖性不够;②同一时间只能一人使 用,资源浪费较大。但是,现在的光盘网络 技术已经解决了这一问题。
缺点:1.检索费用较高;2.受地区通讯线路质量的 影响较大;3.检索技术较为复杂,难以普及。
20世纪60年代对联机信息检索进行了研究开发试验; 70年代末进入了联机检索地区性应用阶段;90年代以后, 藉以高速信息网络以崭新面貌出现。
docin/sundae_meng
(3)光盘检索(CD-ROM SEARCHING) 微机、检索软件、光盘驱动器和光盘数据
▪ 操作系统软件:Windows2000,WindowsNT等。 ▪ 数据库管理系统软件:Oracle、Sybase等。 ▪ 数据库检索软件和阅读软件:
ssreader(超星),vip(维普)
docin/sundae_meng
(5) 数据资源
▪ 数据库、电子书刊、网络资 源等。
▪ 数据库是一系列信息记录的 集合,是检索系统中的信息 源,它存储在计算机的磁带、 磁盘或光盘上,借助于数据 库的管理软件技术和检索系 统进行利用。
docin/sundae_Hale Waihona Puke Baidueng
(4)软件
▪ 软件的作用是充分发挥硬件的功能,进行信息 的存储、处理检索以及整个系统的运行管理。
docin/sundae_meng
(4)网络信息检索(NETWORK SEARCHING) 互联网的发展使人类社会信息的存储、传递、
交流和利用发生了革命性的变化,世界变小 了,实现了全球通讯和资源共享。互联网上 的信息资源呈现爆炸性增长,传统的相对独 立的联机检索系统纷纷变成了互联网上的一 个站点,计算机检索进入了网络信息检索阶 段。
计算机检索原理 综合性数字资源 检索图书的数字资源 检索期刊的数字资源 检索特种文献的数字资源
docin/sundae_meng
一、计算机检索原理
1.计算机检索概念
计算机检索:利用电子计算机、高速信息网络等信息 技术存储和检索信息的过程。
人们在计算机检索网络或终端上,使用特定的检索指 令、检索提问,从计算机检索系统的数据库中检索 出所需要的信息,然后再由终端设备显示、下载或 打印。
▪ 二期建设将“中英文图书数字化国际合作计划” (简称CADAL)列入重要组成部分,。
▪ 全国高校图书馆通过CALIS内部信息库,依据程序 申请成为CALIS成员馆,可获得CALIS提供的各种 服务。
▪ 网址:calis.edu
docin/sundae_meng
4. DIALOG检索系统
• DIALOG系统于20世纪60年代由美国洛克希德导弹与 空间公司创建,该系统以其检索软件命名。1972年开 始为世界各地的用户服务,成为第一个商用数据库。 1981年正式成为洛克希德公司的子公司,开始独立经 营。
docin/sundae_meng
( 2 )联机检索(Online Retrieval)
使用终端设备,运用一些规定的指令输入检索词和检 索策略,通过通讯网络与相关检索系统直接连接进行" 人机对话",同时通过运行检索软件从信息检索系统的 预先储存文献的数据库中查找所需信息的过程。
优点:1.克服了地理上的障碍;2.消除了时间上的 延迟现象;3.保证检索者获得最新、最及时的文献信 息;4.检索者可修改检索策略,达到一定的查全率和 查准率。
术语数据库——专门存储名词术语信息、词语信息 以及术语工作和语言规范工作成果。
图像数据库——用来存储各种图像或图形信息及有 关文字说明资料。
docin/sundae_meng
3 .计算机检索的发展
(1)脱机检索(Off-Line Retrieval) ▪ 脱机检索又称批式检索:用户只需要把检索要求
docin/sundae_meng
二、综合性数字资源
1.中国知网(中国知识基础设施,CNKI )
国家知识基础设施的概念,由世界银行提出于2019年。 CNKI工程由清华大学、清华同方发起,始建于 2019年6月。采用自主开发并具有国际领先水平的 数字图书馆技术,建成"CNKI数字图书馆",并正式 启动建设《中国知识资源总库》及CNKI网格资源共 享平台,通过产业化运作,为全社会提供信息资源 和数字化学习平台。
▪ 国际上通常将其划分为两大 类:参考数据库、源数据库。
docin/sundae_meng
▪ 参考数据库:指引用户到另一信息源以获 得原文或其它细节的一类数据库。包括:
书目数据库——存储某个领域的二次文献(如文 摘、题录、目录等书目数据)。 指南数据库——存储关于某些机构、人物、出版 物、项目、程序、活动等对象的简要描述,指引 用户从其它有关信息源获取更详细的信息。
docin/sundae_meng
(1)资源分布
docin/sundae_meng
(2)中国期刊全文数据库
CNKI系列全文数据库之一,它收入1994年至 今国内公开出版的八千多种核心期刊和专业 特色期刊的全文, 按学科内容分九大专辑,分 别是:理工A(数理化天地生)、理工B(化 学化工能源与材料)、理工C(工业技术)、 农业、医药卫生、文史哲、经济政治与法律、 教育与社会科学 、电子技术与信息科学。
▪ CALIS管理中心设在北京大学,下设了文理、工程、 农学、医学四个全国文献信息服务中心,华东北、 华东南、华中、华南、西北、西南、东北七个地区 文献信息服务中心和一个东北地区国防文献信息服 务中心。
docin/sundae_meng
▪ 2019年开始建设以来,CALIS引进和共建了一系列 国内外文献数据库,包括大量的二次文献库和全文 数据库;主持开发了联机合作编目系统、文献传递 与馆际互借系统、统一检索平台、资源注册与调度 系统,形成了较为完整的CALIS文献信息服务网络。 迄今参加CALIS项目建设和获取CALIS服务的成员 馆已超过500家。
▪ 收录范围涉及期刊、会议、文献、书目、题录、报 告、论文、标准、专利、法规等。
▪ 可以单库、跨库检索,也可以在所有数据库中检索, 还可以按行业检索。
docin/sundae_meng
▪ 科技信息子系统
面向广大科技工作者、 高校师生、公共图 书馆、科研机构及 政府管理部门服务。
文献资源包括:学位 论文、会议文库、 科技文献、成果专 利、科技名人、政 策法规、中外标准、 科教机构等共30 多个数据库。
docin/sundae_meng
▪ 源数据库:能直接提供原始资料或具体数据 的数据库,用户不必再查阅其它信息源。
数值数据库——指专门提供以数值方式表示的数据 (或包括其统计处理表示法)的一种。
事实数据库——指专门提供事物发展过程中产生的 事实数据。
全文数据库——存储文献全文或其中主要部分,简 称全文库。
送往检索中心,由专职计算机人员进行检索。往 往把一批检索提问集中起来,对提问不立即回答, 而是定期成批地在计算机上查找。由于种种缺陷, 已于20世纪60年代末、70年代初渐渐停止使用, 脱机检索系统逐步转化成联机检索系统。 ▪ 1954年,美国海军武器实验站图书馆在一台电子 管计算机上建立了世界上第一个计算机检索系统。
▪ 国际上大型联机检索系 统的主机与本地区数据 通信网络相联,在网络 上有端口,检索用户通 过网线和网络设备检索 数据库信息。
docin/sundae_meng
(3)检索终端
▪ 检索终端是用户与检索系统传递信息进行“人—机 对话”的装置,有电传终端、数传终端和微机终端 等。
▪ 常用的微机终端,由计算机、打印机以及调制解调 器组成。
▪ 拥有的资料量是目前Internet网上数据的50多倍,是 Web搜索引擎数据的500倍。
▪ 作为世界最权威的专业资料来源提供者,Dialog主要 提供一下信息:新闻、商业、金融、知识产权、政 府和法规、科学技术、能源和环境、医药、药品, 化学化工、食品和农业、社会科学等。
▪ 提供数据库目录检索(Dialindex)、定题通报(Alerts)、 原文订购(KR Source One)、文献传递服务(通过电子 邮件、传真或邮寄等)、数据库直接检索(Searching) 等服务。
docin/sundae_meng
5.STN
STN系统(The Scientific and Technical Information Network-lnternational)系统由美国化学文摘社(CAS), 德国卡尔斯鲁厄专业信息中心(FIZ Karisruhe)和日本 的国际化学信息协会(JALCI)多家合作。
docin/sundae_meng
(1)服务器
▪ 服务器是检索系统的核心 部分,在检索过程中需要 处理大量的指令和数据。
▪ 服务器要具有较高的运算 速度和处理能力,并且具 有相当大的信息存储容量。
▪ 服务器决定了系统的检索 速度和存储容量。
docin/sundae_meng
(2)通信网络
▪ 通信网络是终端与服务 器之间的桥梁,其作用 是确保信息传递的畅通。
•1989年成为Knigth Ridder公司的子公司,后来又几易 其主,现在与ISI、Derwent、Janes、Gale Group等都 隶属于Thomson集团。 •Dialog已经成为世界上最大、最完善、历史最悠久的 在线数据库信息服务公司。
docin/sundae_meng
▪ Dialog已经拥有1000多个大型专业数据库系统.通过 Dialog您能探寻到90亿页纸本和图像及全球7000多 份期刊杂志的全文数据和近600个数据库的内容。
docin/sundae_meng
2.万方数据资源系统
▪ 以中国科技信息研究所(万方数据集团公司)全部信 息资源为依托建立起来的。2019年8月在国际互联 网上投入服务。 1993年注册成为中国第一家数据库 专业公司。
▪ 网址:wanfangdata/
▪ 以科技信息为主,集经济、金融、社会、人文信息 为一体。分科技信息系统、数字化期刊、企业服务 系统、医药信息系统4部分,拥有100多个数据库。
docin/sundae_meng
优点:
(1)检索快捷:处理速度快、运算准确、可靠性高。
(2)多元灵活:采用了逻辑运算和限制检索等功能,使 检索词之间能够灵活地进行组配。
(3)量大面广:可迅速浏览相关领域的所有数据库记录, 网络中每台个人计算机都可成为信息源。
(4)更新迅速:如美国OCLC网络的First Search检索系 统,新刊出版后3天内,即可出现。
docin/sundae_meng
▪ 数字化期刊
以刊为单位上网,按基 础科学、工、农、医、 哲学政法、社会科学、 经济财政、教科文艺 划分为8大类70多个 类目。
约4600多种种科技期 刊,期刊论文的全文 全部上网。
数字期刊可以按期刊的 刊名、学科分类、地 区进行检索。
期刊论文可以按篇名、 作者、作者单位、摘 要、关键词等检索。
(5)资源共享:利用本地计算机可以查询、获取网上丰 富的信息资源,实现资源共享。
(6)方式多样:提供联机回溯检索、定题检索、联机订 购、直接获取全文等多种服务,可按要求输出。
docin/sundae_meng
2.信息检索系统
计算机信息检索系统构成: ▪ 服务器 ▪ 通信网络 ▪ 检索终端 ▪ 系统软件 ▪ 数字资源
docin/sundae_meng
3.中国高等教育文献保障系统
▪ China Academic Library & Information System,简 称CALIS,是国务院批准的我国高等教育“211工程” 中公共服务体系之一。宗旨是把国家的投资、现代 图书馆理念、先进的技术手段、高校丰富的文献资 源和人力资源整合起来,建设以中国高等教育数字 图书馆为核心的教育文献联合保障体系,实现信息 资源共建、共知、共享,以发挥最大的社会效益和 经济效益,为中国的高等教育服务。
库即构成光盘检索系统。
优点是:①使用方便、简单,易于操作; ②不受机时的限制,可反复修改检索策略, 达到很高的检全率与检准率;③检索费用低 廉,没有通讯费用,一次订购,反复使用。
缺点是:①数据更新周期较慢,时差长, 文献的新颖性不够;②同一时间只能一人使 用,资源浪费较大。但是,现在的光盘网络 技术已经解决了这一问题。
缺点:1.检索费用较高;2.受地区通讯线路质量的 影响较大;3.检索技术较为复杂,难以普及。
20世纪60年代对联机信息检索进行了研究开发试验; 70年代末进入了联机检索地区性应用阶段;90年代以后, 藉以高速信息网络以崭新面貌出现。
docin/sundae_meng
(3)光盘检索(CD-ROM SEARCHING) 微机、检索软件、光盘驱动器和光盘数据
▪ 操作系统软件:Windows2000,WindowsNT等。 ▪ 数据库管理系统软件:Oracle、Sybase等。 ▪ 数据库检索软件和阅读软件:
ssreader(超星),vip(维普)
docin/sundae_meng
(5) 数据资源
▪ 数据库、电子书刊、网络资 源等。
▪ 数据库是一系列信息记录的 集合,是检索系统中的信息 源,它存储在计算机的磁带、 磁盘或光盘上,借助于数据 库的管理软件技术和检索系 统进行利用。