化学信息学课件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章化学信息概论
一、化学信息学的产生和发展
信息:实物的存在方式和运动状态的记录,它精确地描述物体或事件,并且可借助于一定的物质载体进行存储和传播。
化学学科的重要性化学信息量的快速增长
化学信息学:是应用信息学方法解决化学问题的学科。(化学信息学是信息科学与化学的交叉学科。)(利用数学、统计学与计算机科学的理论、方法和网络技术作为手段,研究化学信息的获取、表示、管理、传播、分析、加工和应用,在此基础上进行知识创新,促进化学学科的发展。)
二、化学信息学的研究领域
应用现代信息技术构建信息处理系统,处理长期积累的大量化学信息资源,帮助化学家组织、分析和理解已知的科学数据,正确地预测化学物质的性质,开发新化合物、材料和方法。
应用计算机科学方法或信息学解决化学问题,对化学信息进行有效的存储、操作和处理,使化学信息合理地提升为化学知识。
研究内容:化学、化工文献学;化学知识体系的计算机表示、管理与网络传输;化学图形学;化学信息的解析与处理;化学知识的计算机推演;化学教育与教学的现代技术与远程信息资源。
三、信息资源检索的意义与作用
⏹• 启迪创新:科研工作具有继承和创新两重性,要求科研人员在探索未知进行创新之前,应该尽
可能地继承和利用与之相关的信息。
⏹• 拓宽视野:21世纪信息与知识的积累日新月异,出现了大量的边缘科学和交叉科学。面对知识
频繁更新的世界,需要接受终身教育,在不断的教育中更新知识,适应环境的变化。
⏹• 培养能力:现代教育不单纯是知识的传授,更重要是要大力进行各种能力的培养,其中包括自
学能力、思维能力、研究能力、表达能力、创新能力、终生教育能力、组织管理能力和收集处理信息的能力。
⏹• 提高素质:信息素质是信息社会中实现对知识的探索和发现的综合能力,它是进入信息社会赖
以生存的通行证。
四、化学信息学的课程内容
化学信息的产生和获取(重点)利用检索工具通过实验方法... …
化学信息的表达、存储和管理化学运筹学数据整理可视化数据库管理技术... ...
化学信息的加工和处理化学计量学化学软件目的是获取更多的信息
化学信息的深化计算机模拟设计化学结构的可视化以图形的方式对化学信息进行描述
1.2 电子信息和数据库
一、电子信息
指通过计算机等设备以数字信号传递的数字信息资源组成的数据库。
1、联机信息资源,如:Dialog, STN, OCLC数据库
⏹2、光盘信息资源,包括单机版、网络版、联机版
⏹3、Internet网络信息资源
二、数据库
数据库是以特定方式合理地组织相互关联的数据集合。
(一)数据库的结构
⏹1、记录型文献数据结构
常用的字段:标题、作者、地址、期刊名、学科、文件类型、语种和摘要。如表1-1(p7)
⏹2、记录的排序和索引
(1)顺排文档:按记录号顺序排列;
(2)倒排文档:各个记录按照某一字段的值进行排列。
1.3 信息检索的方法和步骤
二、信息检索的评价
1、评价指标:查全率、查准率、漏检率、误检率、响应时间、用户负担、输出形式等。
2、查全率和查准率
(1)查全率(R):检索出的相关信息量(w)与该系统信
息库中存储的相关信息量(x)的比率称为查全率,R=w/x ×100 % 。
(2)查准率(P):检出的相关信息量(w)与检出信息总量(m)的比率称为查准率,P= w/m×100% 。两者之间存在互逆关系,即查全率高时,查准率较低,反之亦然。
(3)漏检率(O):O = 1 – R = 1- w/x ×100 % 。
(4)误检率(N):N = 1 - P = 1-w/m ×100 % 。
⏹如果一个检索系统中与某一课题相关的信息共250 条。检索操作后,实际检出了400条信息,
其中相关信息为200条,此次检索效率可计算为:
R = [200 /250] ×100 %=80% O = 1-80% = 20%
P = [200/400] ×100%=50% N = 1-50%= 50%
⏹2、位置检索:
⏹With (W、nW),表示算符两侧的检索词按此前后衔接的顺序排列,词序不可颠倒。
⏹Near (N、nN)表示算符两侧的检索词必须紧密相连,两词词序可变。
⏹Subfield (S )表示算符两侧的检索词必须同时出现在文献记录的同一子字段(句子、短语)。
⏹Field(F)表示算符两侧的检索词必须同时出现在同一个字段中。
⏹Citation(C)表示算符两侧的检索词必须同时出现在一条文献的记录中。
⏹Link(L)表示算符两侧的检索词之间有一定的从属关系。
⏹4、限词检索
基本检索字段:题名、文摘、主题词、标识词
辅助检索字段:作者、语种、出版年代、期刊名称和文献类型。
基本检索字段主要有题名(TI)、文摘(AB)、主题词(DE)和标识词(ID),适用于各种数据库。辅助检索字段主要有作者(AU)、语种(LA)、出版年代(PY)、期刊名称(JN)和文献类型(DT)等字段。一般说来,数据库的提供的字段越多,其检索方式就越多,可以使用多字段构建复杂的检索表达式,进行高级检索。
四、信息检索步骤
实施检索操作,获取检索信息;评估检索结果。为了减少滥检、漏检和缺检,可进行检索策略的调整,主要分为缩检和扩检二种。
缩检主要方法有:主题细化;选择更专指的检索词;运用逻辑算符AND 、NOT;运用位置算符WITH 、NEAR;减少字段检索;对检索结果进行二次检索。
扩检主要方法有:对己确定的检索词进行其同义词、同义的相关词、缩写和全称检索;利用数据库提供的词表输入规范词;使用运算符OR 等。
数据库的选择
⏹ 1. 数据库的类型。例如,书目数据库、事实数据库结构数据库;文摘数据库或全文数据库。
⏹ 2. 数据库所收集的数据内容所涵盖的学科领域和收录范围。
⏹ 3. 数据库的现状,包括数据库收录的文件类型、据量、存储年限、更新周期、语种、媒体介质
和辅助工具。
⏹ 4. 数据库的检索质量、权威性和检索速度。
⏹ 5. 数据库提供的系统功能和检索方式。
⏹ 6. 数据库的使用权和检索费用。
原文信息的获取
⏹全文链接服务:有的数据库系统提供了全文链接服务,例如Web of Science、Beilstein/Gmelin。
(要有使用权)
⏹电子期刊:可根据检索到的文献信息(如出版商和期刊名),链接出版商和电子期刊网站,下载
文献的原文的PDF文件。(要有使用权)
⏹印刷品原文:查找所在图书馆的馆藏,要获取印刷品原文,进行复印。(要有订阅)
⏹馆际互借服务:许多图书馆开设了此项服务。
⏹原文传递服务:利用各种通信手段、从各种文献服务中心购买文献信息。(付费)
⏹向作者索取原文:根据检索到的文献信息(作者姓名和地址),用户可直接发信或发送电子邮件
向作者索取原文可使用多种方法取得作者的电子邮件地址。(免费)
第二章印刷类化学文献信息
2.1 图书分类法简介
一、图书馆的重要地位和作用