化学文献检索讲义- 计算机检索基础与因特网的使用
1化学文献检索
⑥卓创资讯
⑦化工词典网
2.
国外化学信息资源
⑪美国化学文摘
美国《化学文摘》(Chemical Abstracts ,简称CA) CA 有“世界化学化工文献宝库的钥匙”之美称。 其报道的内容有纯化学领域科研成果和工艺成 就;应用化学领域科研成果和工艺成就;生物、医学 领域科研成果和工艺成就;轻工、冶金、物理领域科 研成果和工艺成就。 它现在摘录了100 多个国家50 多种文字的近 15000种期刊论文、会议录、政府出版物等资料。 此外还摘录了28 个国家的专利说明书、评述、技术 报告等,据称《CA》摘录了世界化学文献的98 %。
㈡
网上化学信息资源
1.国内化学信息资源 ⑪中国知识资源总库
CNKI 网络数据库包括期刊、报纸、会议论文、 博硕论文及专利等系列。 网址: http :/ / www. cnki. net (中国知网) ⑫超星数字图书馆 资源主要提供图书信息方面的检索服务,可以浏 览书目信息,并且对图书进行全文浏览、下载。另外, 超星还有一个规模较大的论文资源数据库。 网址:http :/ / www. ssreader. com http :/ / www. sslibrary. com
信息量太大: --每年新增100多万篇学术论文 --每年新增200多万个专利文献; --每年新增大约20多万篇会议文献
研究人员时间有限
“首先必需认识到,科研工作者都十分宝贵自 己的时间,除极少数和自己工作关系十分密切 的论文以外,绝大多数读者都不会阅读全文。” - 邹承鲁 “我的科学之路” 2003年10月
⑮
英国皇家化学会(RSC) http :/ //
欧洲最大的化学组织.是一个国际权威的学术机构.
化学文献检索讲义- 计算机检索基础与因特网的使用
第二章计算机检索基础与因特网的使用第一节计算机检索基础知识一、数据库的一般结构在计算机检索系统中,数据库是一种经过编辑组织以机读形式出现的记录集合。
不同的数据库,其结构也不相同,所提供的检索途径也有差别,但无论什么类型的数据库其基本结构具有共同的特征:1.字段、记录、文档字段是文献著录的基本单元,反映文献外部特征和内容特征的每一个项目,在数据库中就称为字段,在数据库中每一个字段,往往都给予一个字段名。
如Title,字段名为TI;Author,为AU;SO为文献来源,AB是文摘字段,PY为出版年份,SN为国际标准书号ISSN,DE为叙词或主题词,CS为著者单位。
在某些数据库的检索中,在上机检索前必须了解数据库的字段名。
记录是由若干不同字段组成的文献单元,一个记录在数据库中往往代表一篇文献,在数据库中每一个记录都有一个记录号,与检索工具中的文摘号类似。
文档,由若干数量的记录所构成的数据集合,在一些大型联机检索系统中称作文档。
如DIALOG系统中399号文档是美国化学文摘(CA),211号文档是世界专利索引(WPI)。
2.顺排挡、倒排挡以固定的字段顺序,按文献输入先后排列的文档,称为顺排挡。
顺排挡是文献数据库的基本单位,相当于手工检索工具的文摘正文部分,全面记录着文献的各个特征,但要在顺排挡中检索文献,检索速度相当慢。
将顺排挡中某些文献特征的字段抽取出来,再按一定的规律排列而形成的文档,称为倒排挡。
倒排挡相当于手工检索工具中的索引部分,因而往往也称作索引。
倒排挡大大加快了数据库的检索速度,在数据库的编制中,建立倒排挡的字段越多,相应的检索途径越丰富,检索效率就越高。
3.基本索引、辅助索引(Basic Index,Additional Index)Basic Index,是由数据库中的某些字段的倒排挡组成,这些字段通常是能够以主题概念检索的字段,如主题词(DE)字段、关键词(ID)字段、篇名(TI)字段等。
化学文献检索及利用-讲义
每个图谱注明样品来源、纯度和使用技术(如溶剂、 浓度、吸收池厚度等)
10/11/2019
18
一、重要的参考工具书
检索工具:
(1)总索引(四个): 化合物名称字顺索引 化合物分类索引 分子式索引 号码索引
10/11/2019
19
一、重要的参考工具书
(2)专用索引(三个): IR标准光谱的“谱线索引”
10/11/2019
16
一、重要的参考工具书
3、International Critical Tables of Numerical Data, Physics, Chemistry and Technology
《国际物理、化学及工艺学数据判定表》
1924年以前数据,按主题分为300个项目,每个项 目分别由各国专家执笔,数据经过严格审定。数据
30
一、重要的参考工具书
(2)Comprehensive Inorganic Chemistry (Edited by: M.C. Sneed; J.L. Maynard; R.C. Brasted )
1953年起出版,共11卷,用原子--分子 结构的近代观点编写,参考价值较大。
已由张乾二、周绍民等译成中文,书名为 《无机化学大纲》,由上海科技出版社出版, 1964年起发行。
10/11/2019
29
一、重要的参考工具书
本书有三种索引体系: (ⅰ)元素系统号的分子式及题目索引(按Hill系统排列); (ⅱ)专题分类字顺索引; (ⅲ)化学式总索引(12卷为英文)。
大多数系统号的卷册没有索引,但目录编排得非 常详细,有德英对照。化合物所在系统按“最后位置 优先”原则。
10/11/2019
(ⅱ)补编(Eb)
化工文献检索--信息检索知识介绍
采用逻辑“与”组配:细菌 and 破坏 and 染料 检索结果:命中同时用这三个词标引的文献 – 有“细菌对染料的破坏”方面的文献 – 也会有“染料对细菌的破坏”方面的文献
• 要排除后一部分的文献,就需用位置算符限定词与词之间 的位置关系。
又称邻接算符(adjacent operators),适用于两个检索
1、布尔逻辑检索
是当今检索理论中最成熟的理论之一,
也是构造检索表达式最基本、最简单的 匹配模式。布尔逻辑检索是通过布尔逻 辑算符来实现的,这些运算符能把一些 具有简单概念的检索词(或检索项)组 配成为一个具有复杂概念的检索式,用 以表达用户的检索要求。 逻辑运算符有三种:与、或、非
(1)、 逻辑与:一般用and或 *表示
–化工文献检索
–信息检索 知识介绍
常用的检索方式 命令检索(command search) – 使用特定的操作命令来实施检索 – 灵活快速地进行检索
CS=(general (w) electric (f) Portland)
菜单检索(menu search) – 方便,易掌握,称“easy-to-use”检索 – 多用于光盘检索和web检索
3.使用适当的检索语言,
构造检索表达式
分析各个检索词之间的位置关系和逻辑
组配关系 分析检索词应该限定在哪个字段中检索 (是在所有基本索引中检索还是限定在 分类、主题、自由词、文摘还是其他辅 助索引字段中检索?)
4.上机检索
上机检索是用户的实际操作过程,检索策略输
入检索系统后,系统响应的检索结果通常很难 一次就能满足课题的要求,例如,有时输出的 篇数太多,而且不相关的文献所占的比例很大, 而有时输出的文献数量太少,甚至为零。 因此在检索的过程中用户需要不断地根据检索 结果对检索策略进行调整和修改,包括检索词 的重新选取以及检索提问式的重新构造,经过 反复的检索最终获得比较满意的检索结果。
化学文文献检索与利用_internet1(1)
写成十进制数则为:159.226.100.11
淮阴师范学院化学系
10
第五讲 Internet上的化学化工信息检索
化学文文献检索与利用
域名和域名系统
使用Internet像使用电话要知道并拨打对方电话号码一样, 要知道对方的IP地址并输入计算机。由于数字形式的IP地址 对于用户来说既不直观,也不便于记忆。因此有人设想若用 一些有意义的名字来标识计算机,将会大大方便人们的记忆 和使用。于是产生了域名和域名系统.Internet的域名系统 DNS(Domain Name System)较好地解决了IP地址不便 记忆的问题。域名系统实际上是Internet规定的一套命名机制。
Gopher
Gopher由美国明尼苏达大学于1991年4月开发成功,是 WWW的先驱。Gopher又称金花鼠。它是一种菜单引导式的检 索服务系统,用于检索,浏览位于Internet网上任意一个Gopher 服务器的信息资源。Gopher虽不能像WWW那样提供功能强大 的超文本服务,却可通过一系列菜单直奔目标而获取信息。
淮阴师范学院化学系
3
第五讲 Internet上的化学化工信息检索
化学文文献检索与利用
淮阴师范学院化学系
4
第五讲 Internet上的化学化工信息检索
化学文文献检索与利用
Internet在中国的发展
• 1983年中国学术网(China Academic Network) • 1990年4月,中国国家计算机网NCFC建立
淮阴师范学院化学系
6
第五讲 Internet上的化学化工信息检索
化学文文献检索与利用
化学文献检索基础知识
化学文献检索基础知识1.文献的基本分类、举例:答:零次文献:指未经公开发表或交流的文献。
如实验记录、草稿、私人日记、笔记、书信、草图等。
一次文献(又称原始文献):是以著者本人的研究或研制成果为依据而创作或撰写的文章,是在科学研究中需重点查找的文献。
如:期刊论文、专利说明书、会议论文、技术标准、科技报告等。
二次文献(又称检索性文献):如:书目、文摘、索引、题录等。
三次文献(又称参考性文献):如:综述、专题述评、学科年度总结、数据手册、百科全书等参考工具书。
2.检索工具主要有哪些:答:目录检索、数据库检索、光盘检索、全文检索。
3.什么是布尔逻辑算符?其主要有哪些?每种算符的作用是什么?答:逻辑算符:用来表示两个检索词之间的逻辑关系,用以形成一个概念。
常用的有三种:分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。
1.逻辑与(AND),常用“*”、“&”表示,检索时,命中信息同时含有两个概念,专指性强。
可以缩小检索范围,提高查准率。
2.逻辑或(OR),常用“+”、“/” 表示,检索时,命中信息包含所有关于逻辑A或逻辑B 或同时有A和B的,可以扩大检索范围,提高查全率。
3.逻辑非(NOT) ,常用“-” 表示,命中信息包含逻辑A、不包含逻辑B或同时有A和B的,排除了不需要的检索词,可以排除不必要的信息,提高查准率。
4.什么是影响因子?答:期刊的影响因子IF(Impact Factor)指的是该刊前两年发表的文献在当年的平均被引用次数。
举例:影响因子是以年为单位进行计算的。
以2014年的某一期刊影响因子为例,IF(2014年)= A / B其中,A = 该期刊2012年至2013年所有文章在2014年中被引用的次数;B = 该期刊2012年至2013年所有文章数。
5.列举三个常用的化学外文数据库ACS:美国化学会(The American Chemical Society)CA:化学文摘(Chemical Abstracts)Science Direct: 科学指引(数据库)6.常用文献搜索工具:SciFinder、Web of Science、CNKI( 中国知网)7.化学类期刊:综合类:Nature、Science、Chemical Review等;还有JACS( Journal of the American Chemistry Society)、Angewandte Chemie-International Edition、Chemical Comminucations等。
化学信息文献检索方法
化学信息学的文献检索总结化学信息学是化学领域中近几年发展起来的一个新的分支,是建立在多学科基础上的交叉学科,利用计算机技术和计算机网络技术,对化学信息进行表示,管理,分析,模拟和传播,以实现化学信息的提取,转化与共享,揭示化学信息的实质与内在联系,促进化学学科的知识创新。
化学信息学的发展给化学的发展带来很大的影响,大大的减少信息传递的时间,和因为信息传递过慢而导致的再次研发而浪费人力和物力。
1.化学信息学简介:化学信息学是一门应用信息学方法来解决化学问题的学科。
20世纪中后期,伴随着计算机技术的发展,化学家开始意识到,多年来所积累的大量信息,只有通过计算机技术才能让科学界容易获得和处理,换言之,这些信息必须通过数据库的形式存在,才能为科学界所用。
这一新领域出现以后,没有一个恰当的名称。
活跃在这个领域的化学家总是说他们在“化学信息”领域工作。
然而,因为这一名称难以将处理化学文献的工作和发展计算机方法来处理化学信息的研究分别开来。
所以,一些化学家就称之为“计算机化学”,以强调采用计算机技术来处理化学信息工作的重要性。
但是,这个名称容易与理论化学计算,即“计算化学”混淆。
1 973年,由NATO高级研究所夏季学校在荷兰Noordwijkerhout举办的一次研讨班,首次将在在不同化学领域工作,但都是采用计算机方法处理化学信息,或是用计算机技术从化学数据中获取知识的科学家集中在一起。
这次研讨班的名称就定为“化学信息学的计算机表征与处理”。
参加这次会议的科学家主要从事化学结构数据库,计算机辅助有机合成设计,光谱信息分析和化学计量学等方面的研究,或者开发分子模拟软件。
研讨班期间,这些化学家意识到,一个新的研究领域已经形成,而且,它隐含在化学各分支之间。
从那之后,应用于解决化学问题的计算机科学和信息学方法悄然进入了化学的各个领域。
2.化学信息学中常用的查询工具:(1)了解、熟知国内外的重要信息源与信息检索工具。
文献检索与利用教学讲义
• 引言 • 文献检索基础知识 • 文献检索技巧 • 文献评价与利用 • 实际操作与案例分析 • 总结与展望
01
引言
课程介绍
01
02
03
课程性质
文献检索与利用是一门培 养学生信息素养和学术研 究能力的必修课程。
适用对象
本课程适用于本科生和研 究生,特别是对学术研究 和论文写作感兴趣的学生。
布尔逻辑运算符
利用布尔逻辑运算符(AND、 OR、NOT)组合关键词进行
检索。
限制检索
通过限定字段、时间、文献类 型等方式缩小检索范围。
高级检索
利用检索工具的高级检索功能 ,通过多个条件组合进行检索
。
03
文献检索技巧
关键词选择
关键词的确定
选择与主题相关的关键词, 确保检索结果的准确性和 全面性。
每组选派代表汇报检索成果,全班进行交流和评 价,教师进行总结和点评。
06
总结与展望
本课程总结
课程内容回顾
本课程重点介绍了文献检索的基本原 理、方法和技巧,以及文献利用的实 践操作和案例分析。通过学习,学生 能够掌握文献检索的核心技能,提高 文献利用的效率和质量。
课程亮点与特色
本课程注重理论与实践相结合,通过 丰富的案例和实践操作,帮助学生深 入理解文献检索与利用的原理和方法 。同时,课程还融入了最新的学术研 究成果和技术手段,确保教学内容的 前沿性和实用性。
检索条件的设置
根据需求设置检索条件,如时间范 围、文献类型等,提高检索效率。
学术数据库的使用
学术数据库的选择
根据研究领域和需求选择合适的 学术数据库。
数据库检索技巧
熟悉所使用数据库的检索方法和 技巧,提高检索效率。
化学化工信息检索01-第1章-基础知识
从实践经验看,科学研究中出现的各种问题,有95%~99
%可通过科技文献检索获得启发、帮助和解决。而完全靠
自己的创造性劳动来解决的问题,仅占1%~5%。
国内许多高校的化学院系将《化学文献》做为选修课或必
修课设置。
13
Internet与化学信息
Internet是当今世界上最大的信息传播媒介,它通过计算机把世
二次文献
三次文献
是指通过二次文献,选用一次文献内容而编写出来的成果。
化工文献检索PPT
化工文献检索有助于提高企业的技术水平和创新能力,促进 科技成果的转化和应用;有助于科研人员了解领域内的研究 现状和发展趋势,为科研工作提供参考和借鉴;还有助于加 强学术交流和合作,促进学术共同进步。
化工文献检索的方法与技巧
化工文献检索的方法
常用的化工文献检索方法包括关键词检索、主题检索、分类检索等。其中,关键词检索是最常用的方法,通过输 入关键词可以快速找到相关的文献资料。
。
05
化工文献检索的未来发展
人工智能在化工文献检索中的应用
自动化信息抽取
利用人工智能技术,自动从 海量文献中提取关键信息, 如化学物质的结构、性质、 合成方法等,提高信息检索
的效率和准确性。
个性化推荐系统
基于用户行为和偏好,利用 人工智能算法为用户提供个 性化的文献推荐,提高检索
的满意度和用户体验。
万方数据知识服务平台
概述
01
万方数据知识服务平台是万方数据股份有限公司推出的学术文
献数据库,涵盖了化工领域的众多文献资源。
特点
02
万方数据知识服务平台提供了丰富的学术资源,包括期刊、学
位论文、专利等,支持多种检索方式和个性化订阅功能。
使用方法
03
用户可以通过万方数据知识服务平台的网站或使用其提供的API
化工文献检索
• 化工文献检索概述 • 化工文献数据库介绍 • 化工文献检索实践 • 化工文献检索的应用 • 化工文献检索的未来发展
01
化工文献检索概述
化工文献的定义与分类
化工文献定义
化工文献是关于化学工程、工艺、技术和应用等领域的学术论文、专利、报告、 标准、手册等文献资料的统称。
化工文献分类
文献检索课二计算机检索的基础知识
–计算机检索系统的类型
1.文献型数据库 文献型数据库是指能直接提供文献线索和文献原文的数 据库,即数据库记录的对象为文献信息时。包括目录型 数据库、题录型、文摘型和全文型数据库。 (1)目录型数据库 是对信息外表特征予以揭示和报道,以整个出版单位或 收藏单位为基本著录单元,如“本”、“种”、“件” 等。著录内容包括书(刊)名、作者、出版年月、出版 地及收藏情况等。可分馆藏目录(如各图书馆的馆藏机 读目录数据库OPAC)、联合目录、出版发行目录等。
1、文献型检索工具 (1)目录 以报道文献出版或收藏信息为主要功能的工具。如《全国总书 目》。 (2)题录 是将图书、报刊等文献中论文的篇目按照一定的排检方法编排 而成,供人们查找篇目出版的工具。如《全国报刊索引》 (3)文摘 以精练的语言把文献信息的重要内容、观点、数据等摘录下来, 并按一定的著录规则与排列方式编排起来,供读者检索使用的一 种检索工具。 2、非文献型检索工具 主要指参考工具书。如词典、百科全书、年鉴、年表、名录等。
• A(nW)B AB两词靠近,次序为A先B后,中间最多可加n个词。 例 如 : communication(2w)satellite , 只 检 索 出 communication satellite 、 communicationsatellite,communication through satellite 、 communication on the satellite词组的记录。
– 选择检索系统
• 主要是根据课题的检索要求选择合适的检索工具或数 据库,如: 查找图书可用OPAC书目数据库;查学科术语或数 据等可用事实型数据库、参考工具书或网络搜索引擎; 撰写学位论文、申请研究课题,需要了解研究对象的 历史、现状和发展,要求检索文献全面、彻底,检索 覆盖的年份也较长,尽可能选用一些收录年份较长的 综合型和专业数据库。 • 考虑权威性数据库; • 数据库的学科专业范围是否与课题的学科相吻合; • 需要的是题录、文摘信息还是全文信息,还是事实、 图形、数据等; • 数据库收录的文献类型、年限、更新周期,所需文献 信息在国别和语种是否符合检索需求等。
化学文献检索讲义
第三章: 第三章:中文科技检索工具
《中文科技资料目录——化学工业》1978+, bm, 1983+, q 中文科技资料目录——化学工业 1978+, 化学工业》 1983+, 化工部科技情报所编辑出版
本目录是查找中文化工科技文献的全国性检索刊 物,以题录形式报道化工部科技情报所和31个专业情 以题录形式报道化工部科技情报所和31 31个专业情 报中心站的馆藏资料和中文的化学化工文献。 报中心站的馆藏资料和中文的化学化工文献。
第三章: 第三章:中文科技检索工具
一、综合性检索工具 5、检索国内标准资料的工具 《1980国家标准和部颁标准》汇编 1980国家标准和部颁标准 国家标准和部颁标准》 《中华人民共和国部颁标准目录》 中华人民共和国部颁标准目录》 《中华人民共和国国家标准目录》 中华人民共和国国家标准目录》 《标准化文摘》 标准化文摘》 《中国标准化年鉴》 中国标准化年鉴》 《标准新书目》 标准新书目》
第三章: 第三章:中文科技检索工具
化 工 方
化工规划、技术经济、化工原料、化学工程、化工设计、 化工规划 、 技术经济、 化工原料 、 化学工程 、 化工设计 、 化工施工、化工安装、化工过程、化工机械、 化工施工、化工安装、化工过程、化工机械、 化工基础理论 ;
面: 无机化工、有机化工、高分子化工、电化工、橡胶、 无机化工、有机化工、高分子化工、电化工、橡胶、 合成树脂及塑料、化学纤维、溶剂、助剂、化学试剂、 合成树脂及塑料、化学纤维、溶剂、助剂、化学试剂、 粘合剂、化肥、农药、感光材料、磁性材料、染料; 粘合剂、化肥、农药、感光材料、磁性材料、染料; 化工三废处理及综合利用、环境保护、化工自动化仪表、 化工三废处理及综合利用、环境保护、化工自动化仪表、 精细化工、石油化工、煤化工、化工能源及节能、工业 精细化工、石油化工、煤化工、化工能源及节能、 水处理、化工安全、计算机等新技术在化工中的应用。 水处理、化工安全、计算机等新技术在化工中的应用。
第五章化学化工期刊文献检索资料讲解
每年36期,前名为“海外ニユ-ス”
k) Organic Letters 是提供最新有关有机化学重 大研究的简报,它的内容是所有有机化学领域 最先进发展的浓缩,包括生物有机和药物化学, 物理和理论有机化学,天然产物分离及合成, 新的合成方法,金属有机和材料化学。
(俄文) 普通化学杂志(Journal of General Chemistry) 日本化学会志(化学と工业化学)(日文) 化学の领域(化学的领域) 化学的领域增刊号(化学の领域增刊号) 化学与工业(化学と工业)
Bulletin of the Chemical Society of Japan (日本化学会通报) (英文)
(3) 化学工业新闻、技术经济类期刊 (行业杂志,
trade magazines): a) 化学与工程新闻 (Chemical & Engineering News),
美国化学会编辑出版。周刊. b) 化学时代(Chemical Age)(英)
1919 -,周刊。 c) 欧洲化学新闻(European Chemical News) (London) d) 化学周报(Chemical Week)(英)1914 -,周刊 e) 化学与橡胶工业报告(Industry Report - Chemical
1972 - ,月刊,日本化学会刊。采用快报形式,登载理论 化学和工业化学研究方面的重要发现或结论。篇幅不长, 每篇不超过四页。用英文发表。
c) Chemical Physics Letters (化学物理快报)
(荷兰、英文) 1967 - ,现为半月刊。
d) SynLett 报导有机合成研究结果和趋势,短篇幅的个人综 述和快速的工作简报。所有有机合成领域的成果都在被 收录的范畴内。
(1)化工文献检索知识介绍学习资料
主讲人:汪敦佳
湖北师范学院化学化工学院
讲授内容: 一、文献检索知识介绍 二、化学化工核心期刊简介 三、Internet上的化学化工资源 四、专利文献的检索 五、 CA的检索方法 六、其他相关重要索引及文摘 七、科技论文写作简介
2
➢ 课程的基本要求
1、熟悉美国化学文摘(CA)的出版情况、编排格式、各 种索引系统和使用方法(特别是普通主题、化学物质主 题、分子式等索引系统),熟练地掌握通过美国化学文 摘(CA)检索化学文献资源的方法。
24
f. 专利文献 g. 技术标准
ISO BS(英国标准) JIS(日本工业标 准) ASTM (Am. Soc. Testing & Materials) 美国材料与试验协会 GB (中国国家标准) 部颁标准 行业标准 企业标准等. h. 技术档案: 是生产建设和科学技术部门在科技 活动中所形成的,有一定具体对象的科技文 件、图样、图表、照片、原始记录的原本以 及代替原本的复制本等。 g. 产品样本
31
(四)、数值数据情报的重要性
及其国际性协作系统
众所周知,精确的数据及其解释,无论对理 论研究工作,还是对实验室和工厂工作,都是 很重要的。可是不少人觉得查找新的或没有研 究过的化学物质的物理性质及化学结构等有关 数据很困难,这是由于过去存在一种偏向,即 发表的论文对研究内容及其结论要比数据更加 重视,论文中往往对那些详细数据从略。这一 问题在制作二次文献时就很突出了。另外,对 学术数据情报的评价是一项很困难的工作。例 如,对同一物质的同一性质,有几种数据时, 很难判断应采用哪一种数据,只有一种数据时, 也很难确定误差等。
30
当前联机情报检索系统的革命性在于: 第一,它取代了翻阅索引查找所需事项 的传统检索方法,而是利用关键词对众 多的文档可以多方面地而且迅速地检索。 第二,是只要一个文档连结上包括通信 卫星网络在内的国际数据通信网后,则 从地球上的任何地点都能使用这个文档。 正是这第二特点把情报检索服务推上了 现代化的大量生产、大量消费型的经营 业务。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章计算机检索基础与因特网的使用第一节计算机检索基础知识一、数据库的一般结构在计算机检索系统中,数据库是一种经过编辑组织以机读形式出现的记录集合。
不同的数据库,其结构也不相同,所提供的检索途径也有差别,但无论什么类型的数据库其基本结构具有共同的特征:1.字段、记录、文档字段是文献著录的基本单元,反映文献外部特征和内容特征的每一个项目,在数据库中就称为字段,在数据库中每一个字段,往往都给予一个字段名。
如Title,字段名为TI;Author,为AU;SO为文献来源,AB是文摘字段,PY为出版年份,SN为国际标准书号ISSN,DE为叙词或主题词,CS为著者单位。
在某些数据库的检索中,在上机检索前必须了解数据库的字段名。
记录是由若干不同字段组成的文献单元,一个记录在数据库中往往代表一篇文献,在数据库中每一个记录都有一个记录号,与检索工具中的文摘号类似。
文档,由若干数量的记录所构成的数据集合,在一些大型联机检索系统中称作文档。
如DIALOG系统中399号文档是美国化学文摘(CA),211号文档是世界专利索引(WPI)。
2.顺排挡、倒排挡以固定的字段顺序,按文献输入先后排列的文档,称为顺排挡。
顺排挡是文献数据库的基本单位,相当于手工检索工具的文摘正文部分,全面记录着文献的各个特征,但要在顺排挡中检索文献,检索速度相当慢。
将顺排挡中某些文献特征的字段抽取出来,再按一定的规律排列而形成的文档,称为倒排挡。
倒排挡相当于手工检索工具中的索引部分,因而往往也称作索引。
倒排挡大大加快了数据库的检索速度,在数据库的编制中,建立倒排挡的字段越多,相应的检索途径越丰富,检索效率就越高。
3.基本索引、辅助索引(Basic Index,Additional Index)Basic Index,是由数据库中的某些字段的倒排挡组成,这些字段通常是能够以主题概念检索的字段,如主题词(DE)字段、关键词(ID)字段、篇名(TI)字段等。
不同的数据库基本索引的字段有所差别,因而在检索前要先了解该数据库的Basic Index包含哪些字段。
如DIALOG系统的Ei数据库的基本索引包括TI,DE,ID,AB四个字段,而WPI数据库只包含ID一个字段。
Additional Index,除Basic Index包含的字段外,其他建立倒排挡的字段都是辅助索引。
在检索中,基本索引的检索与辅助索引的检索有所不同,基本索引检索不用加字段名,而辅助索引的检索需加字段名,如要检索ARAI写的文章,检索式应为AU=ARAI。
二、国际联机检索系统(On-Line Retrieval)联机检索,是指用户通过终端和通信线路,从信息检索系统存储的文献数据库中检索自己所需的信息。
国际联机检索系统是以大型计算机为核心,大容量存贮设备为基础,以公共数据交换网或电话通讯线路为传输媒介建立起来的大型计算机情报检索系统。
只要通讯线路能延伸到的地方都能进行异地远程通讯检索。
1.DIALOG系统DIALOG系统是国际上最著名、规模最大的联机检索系统。
目前该系统拥有三台大型计算机,总存贮量共达十八万兆,与两个卫星通信网络相连,在全世界80多个国家和地区有10多万个终端用户,系统每天24小时为用户提供联机检索服务。
目前该系统建有400多个文档,文献存储量达2亿多个记录,文档的专业范围遍及科学技术、政治经济、商业、新闻等。
DIALOG公司还将数据库文档制作成各专业的数据库光盘,单独出版。
2.ORBIT系统ORBIT系统是目前世界上仅次于DIALOG系统的国际联机检索系统,是始建于60年代的国际著名联机检索系统。
文献存储量达1亿条记录,200多个文档。
3.BDS系统BDS系统是我国最大的联机检索系统,属北京文献服务处。
该系统文献存储量达1千余万条,该系统的数据库主要是专利文献和美国政府报告。
该系统在全国各地拥有数百个终端用户,由于国内的联机检索费用较低,因而利用率要高于国际联机检索。
但国内联机检索数据量太少无法满足各专业的用户需求。
三、光盘检索网络光盘是一种存储量大,价格低廉的计算机存储设备,是采用激光、计算机、数字通讯和光电集成等现代高科技成果的结晶。
目前CD-ROM(Compact Disk Read Only Memory)只读式光盘在图书馆中广泛应用,每张光盘的信息存储量达650兆,相当于3亿多汉字。
普通软盘的1600倍,缩微平片的1200倍,相当于30万页A4型纸的信息量。
存取速度快,仅用0.5秒就可以从1张存有几万页资料的文献中检索出需要的一页。
1.光盘检索系统的基本原理光盘检索系统由光盘、CD-ROM驱动器、计算机并配以相应的驱动软件和检索软件构成。
2.光盘检索网络系统单机的光盘检索系统随着光盘数据库的大量涌现,检索时需频繁换盘,给用户带来不便。
并且同时只能有一个读者使用而无法充分发挥昂贵的光盘数据库的效益。
在计算机网络技术的基础上开发了光盘检索网络的硬件和软件,形成了光盘检索网络系统。
目前建成的光盘检索网络系统有多种模式,共同的特点是拥有能同时运行几十张光盘的光盘塔驱动器,有可供上百个用户同时检索同一张或不同光盘的光盘网络软件。
由于光盘网络检索系统不用换盘,可多用户共享数据库,充分发挥了光盘的作用,在国内外高校图书馆中得以迅速的发展。
四、布尔逻辑运算在计算机检索中,逻辑运算是常用的方法。
用逻辑运算的方法反映检索词之间的关系,能达到提高检索效果的目的。
常用的逻辑运算有三种:逻辑与、逻辑或、逻辑非。
逻辑与:机检的输入符号为“*”或“AND”,是反映概念之间交叉和限定的一种组配。
A*B,表示数据库中既含有A概念又含有B概念的文献才被命中。
用逻辑与可以逐步缩小文献的检索范围,提高文献命中的准确性。
如:乙烯的水合反应 A:ethylene A*B (交集)B:hydration A AND B逻辑或:机检的输入符号为“+”或“OR”,是反映概念之间并列关系的一种组配。
A+B,表示在数据库中只要含有A概念或B概念的文献都可命中。
用逻辑或可以扩大文献的检索范围,防止漏检,以提高文献的检全率。
如:石油和天然气 A:petroleum A+B (并集)A B B:natural gas A OR B逻辑非:机检的输入符号为“-”或“NOT”,A-B,表示在数据库中,在命中含有A概念的文献集合里,去除同时含有B概念的文献。
逻辑非也是一种缩小检索范围的概念组配方法,但并不一定能提高文献命中的准确性,往往只是起到减少文献输出量的作用,在联机检索中以降低检索费用。
如:石油炼制催化剂以外的催化剂 A:catalyst A-BA B B:petroleum refining A NOT B逻辑运算符是计算机检索过程中广泛采用的一种方法,在各检索词之间合理地、综合运用逻辑运算是提高文献命中准确性和文献的查全率的基本方法,其运算次序为:“NOT”“AND”“OR”,括号中先运算。
练习:1、沸石分子筛的吸附 A*BA:zeolites B: adsorption2、顺丁烯二酸酐的制备 A*(B+C)A: 2,5-furandionc B: prepn. C: manuf.3、石油和天然气的脱硫 (A+B)*CA:petroleum B: natural gas C: desulfurization4、润滑酯的生产工艺和设备 A*B*C* (D+E)A: IPC C10M05 B: lubricant C: grease D: technology E: equipment 5、红外光谱与质谱在石油分析中的应用 (A+B) * (C*D)A: IR B: MS C: petroleum D: analysis第二节因特网的使用一、 Internet 的概况1969 年代末美国国防部出资兴办ARPAnet (Advanced Research Projects Agency Network-高级研究计划局)项目。
当时开通时只有4个点。
1970年诞生了用于网络互连的标准、通用的网络协议TCP/IP(Transfer Control Protocol/ Internet Protocol) 协议。
1987 年,NSF(National Science Foundation美国国家科学基金会)选择了IBM (计算机制造商)、MCI(长途电话公司)、Merit(密执安州一个区域性网络服务公司)提出的一个联合方案,合作建立新的广域网。
MCI 提供长途传输线路;IBM 提供专用的计算机和软件;Merit 管理这一网络。
1988 年 NSFnet 取代了 ARPAnet 而成为 Internet 的骨干网。
1990 年 ARPAnet 停止运行。
1992年IBM、MCI 和 Merit 组建了ANS(Advanced network and Services高级网络和服务公司)。
ANSnet的传输速率是 NSFnet 骨干网的 30 倍,达到45Mbps。
Internet 的发展经历了3个阶段。
研究网、运行网、商业网。
到1998年3月,全世界Internet 用户人数已达1.1亿。
预计到2000年,Internet 上将有100万个网络,1亿台计算机和10亿个用户。
二、 Internet 在我国的发展情况我国的Internet 发展大致经历了3个阶段。
第一阶段是从1987年到1994年。
中科院高能物理所是我国首家连入Internet 的单位。
第一批Internet 使用者是全国1000多名科学家。
第二阶段是从1994年到1995年的教育科研网发展阶段。
中关村地区教育与科研示范网络NCFC(National Computer & Networking Facility of China即国家计算机与网络设施工程,简称中关村网),1994年3月开通了速率为64Kbps 的Internet国际出口专线,中国网络域名也最终确定为cn,这标志着我国正式加入Internet。
第三阶段是从1995年开始的商业应用阶段。
1995年5月,邮电部开通了我国公用Internet 网Chinanet。
1996年9月,电子工业部ChinaGBN又开通。
四大互联网络目前我国已建成了四大互连网络:CSTnet中国科学技术网、CERnet中国教育与科研网、Chinanet中国公用Internet 网、ChinaGBN中国金桥信息网,有6个Internet国际出口:中科院高能所、中科院网络中心、清华大学(10M)、北京化工大学、邮电部(北京、上海)、电子部吉通公司。
三、 Internet 的服务与工具Internet服务根据形式可以分成3大类:工具类、讨论类、信息查询类。
工具类服务包括:Telnet、E-mail、FTP、Archie等。