化学信息学课件
化学信息学
化学信息学总结1.1.化学信息学的定义、起源和基本内容化学信息学是近几年发展起来的一个新的化学分支,它利用计算机技术和计算机网络技术,对化学信息进行表示、管理、分析、模拟和传播,以实现化学信息的提取、转化与共享,揭示化学信息的实质与内在联系,促进化学学科的知识创新。
“化学信息学”的诞生离不开计算机科学和Internet的发展,随着计算机科学的发展,化学物质结构的记录与检索需要建立独特的记录与处理系统,同时,计算机在化学研究中的应用也越来越多。
因此,诞生了“计算机化学”。
随着Internert 的发展,诞生了化学信息学。
化学信息的基本内容包括两部分:化学物质的化学信息和媒体形式的化学信息。
其中化学物质的化学信息由化学物质的结构信息、测量结果、化学物质间的化学反应、相互作用与相互识别等组成,媒体形式的化学信息包括图书、杂志、音像资料等。
1.2. MATLAB语言Matlab语言是高效率的科学工程计算语言,是“演算纸式的”科学工程算法语言。
它是Mathwork于1967年推出的“Matrix Laboratory”软件包,并不断更新和扩充。
MATLAB语言具有编程效率高、用户使用方便、扩充能力强、语句简单、内涵丰富、高效方便的矩阵和数组运算、方便的绘图功能、容易掌握等特点。
1.3交实验设计方法1.3.1正交实验设计正交试验法是指用正交表安排多因素试验与分析试验结果的方法,它具有均衡分散性和整齐可比性,这两种特性在数学上称为正交性,故利用这些特性的试验设计方法,就称为正交试验法。
正交试验法的特点有:(1). 试验点的分布是均衡的。
均衡分散性是用正交表安排试验的最重要的特点之一。
(2). 各因素水平出现的次数相同。
因素各水平在试验中变化有规律,试验结果用平均值就能方便地进行比较,这种特性称为整齐可比性。
选择正交表的原则:(1).能容纳所研究的因素数和水平数。
(2).选用试验次数最少的正交表。
1.3.2均匀实验设计方法不考虑整齐可比,而让试验点在试验范围内充分均衡分散,则可以从全面试验中挑选更少的试验点作为代表进行试验,而仍能得到反映分析体系主要特征的试验结果。
【医学PPT课件】化学信息学
• 化学信息学(曹郁教授)
2.1科技文献检索的途径
主题途径 作者途径 引文途径 其他途径
如号码途径、分类途径、关键词途径等
• 化学信息学(曹郁教授) 2.2 科技文献检索的方法
追溯法 工具法 交替法 跟踪法
手工检索 光盘检索 网络检索 其他途径
• 化学信息学(曹郁教授) 科技文献检索的步骤
• 化学信息学(曹郁教授)
【医学PPT课件】化学信息学
• 化学信息学(曹郁教授)
前言
1.1 产生的背景
化学学科的重要性 化学信息量的快速增长 计算机与网络技术的发展
如何面对出现的大量化学信息 ?
束之高阁
有效利用
• 化学信息学(曹郁教授)
现状
截止1999年12月31日,美国化学文摘登记的分子、 化合物和物相数目已超过23,000,000种,但有百年历 史Merck Index,12th Ed.(1996),收录的分子和化合 物只有10,330种,占0.05%,从最大的试剂商店和药 房能买到的药品和试剂不超过10,000种。
美国化学会每年两次年会,会议的论文摘要 (Abstracts of National Meeting of American Chemical Society)就是很价值的文献资料,具有相当高的引文影响 因子。
• 化学信息学(曹郁教授)
学位论文
• 高等学校或科研单位的研究生为取得 某种学位而撰写的研究性论文。
Number)。 • 从时间上看,比其他类型的科技文献要晚,
通常不反映最新的科技情报。 • 图书中所提供的资料比较系统、全面,是
一种较成熟的科技资料。
• 化学信息学(曹郁教授)
化学信息学(第二版)Ch2
2020/12/19
9
期刊和论文的分类
• 周刊 • 旬刊 • 半月刊 • 月刊 • 双月刊 • 季刊 • 半年刊 • 不定期刊物
• 学报(Acta) • 汇刊(Transaction) • 会志(Journal) • 快报(Letter) • 通讯(Communication) • 通报(Bulletin)
• 手册:有两种类型的手册,一种是专门收集各种实验数 据、物品的性质和用途等,通过整理和分类,用表格形 式编成的工具书;另一种是总结性概述有关学科的全部 知识的大型手册。
2020/12/19
5
二、专著和大全
大型参考书是综合某项科学技术领域的所有有关资 料,编成有系统的大型读物,由于篇幅很大,少则几卷, 多则几十卷,一般由一、二人主编,并聘请许多专家,汇 集有关的各种文献,分别执笔写成。大型参考书在某些方 面和综合论文相似,但它具有更全面、更系统、更详尽的 特点,比较易于阅读。查阅时不必将其全部阅读,而是专 门查阅其中某些章节或某一问题的论述,从而掌握有关问 题的大概情况及其发展。读者可以用大型参考书作为掌握 某一问题的基本文献的出发点,若欲进一步深入研究,则 可按文中所引参考文献,选择其最重要的进行阅读。
• 工具书:字典、词汇、辞典、手册、年鉴、百科全书等统 称为工具书或参考工具书,这类书按照特定的编排方式。 例如:用字、页、主题、分类等方式有系统地组织材料, 使读者能迅速、简便地查到某方面的知识或数据。
2020/12/19
4
一、工具书
• 字典、辞典、百科全书:字典用于解释文字的意义和正 确的拼音和书写。辞典用于对专业名词、术语、概念、 符号、略语以及商品名称等给予较清楚的解释。百科全 书的特点是内容全面且深入浅出,其编写的宗旨是向非 某专业人员普及专业的知识,撰写人一般都是较著名的 专家和权威,具有科学性和易懂性。
电子教案与课件:化学信息学 第七课
10/000001~ 11/000001~ 29/000001~ 60/000001~ 90/000001~ 95/000001~
2001.10~2004.12 2004.12~至今 1992.10.1~至今 1995.6.8~至今 1981.7.1~至今 2001.7.27~至今
12
美国专利说明书的文献编号体系
05/000001~
1970.1~1978.12
06/000001~
1979.1~1986.12
07/000001~
1987.1~1992.12
08/000001~
1993.1~1997.12
09/000001~
1998.1~2001.10
外观设计专利申请 临时专利申请 单方再审查请求 临时专利申请
5
专利文献的特点
1)专利文献集技术、法律、经济信息于一 体; 2)专利文献传播最新科学技术信息; 3)专利文献形式统一,数据规范,便于检 索。
6
美国专利文献 美国于1790年通过了第一部专利法,正式 建立了专利制度并出版专利文献。美国专 利主要类型为专利说明书和专利公报
7
美国专利说明书 美国专利说明书撰写颇具特点,每部分均 以小标题引导,一目了然。一般包括:扉 页、权利要求书、说明书正文和附图组成。
公开号(Publication Number)由四位数字 的文献公开年号和七位数字的文献公开顺 序号两部分组成,不足位数的,以零补位。
文献种类 专利申请公开
2001.1.2之前 2001.1.2之后
无
US 2001/0001111 A1
专利申请再公开
无
US 2001/0002222 A2
专利申请的更正
化学信息学第一讲FGQ
--美国科学基金会 NSF(National Science Foundation)
4
科研工作中与信息相关的问题
• 如何在海量的信息中快速检索到相关的、高质量的信息? • 如何有效地分析目前的研究进展并确定新的研究方向? • 如何及时跟踪某研究方向的最新进展? • 如何有序管理所检索到的大量文献? • 如何迅速提高论文写作的效率? • 如何全面了解所发表论文及其期刊的影响力 • 确定投稿方向?
14
文献的分类
科技期刊 科技图书 专利文献 科技报告 会议文献
学位论文 技术标准 产品资料 电子出版物
15
现代化学文献特点
1. 文献数量迅猛增加
16
2. 文献种类繁多,形式多样
类型:图书、期刊杂志、科技报告、学位论文、会议资料 文献载体:印刷型、缩微型、机读型 文献性质:一次文献、二次文献、三次文献
20
Top 化学杂志
2011年影响因子
Nature Science Nature Chem. Angew. Chem. Int. Ed. J. Am. Chem. Soc. Chem. Comm. Chem. Sci. Chem. Rev. Accounts Chem. Res. Chem. Soc. Rev.
3. 电子文献与网络检索普及
化学数据库 (Scifinder、Reaxys、ISI Web of Knowledge等) 全文数据库(ACS、RSC、Elsevier、Wiley InterScience数据库)
17
科技文献的检索方法
科技文献的检索途径
电子教案与课件:化学信息学 第八课
1
化学软件-概述
化学软件是当前化学工作者日常工作 的基本工具,国外的计算机信息产业 之所以发达,其中很重要的一个原因 就是软件非常规范和丰富,特别是专 业应用软件,计算机只有做到 “有用 ”,才真正体现到它的价值。
2
化学软件常用分类一
物理化学软件
分析化学软件 其他化学软件
有机化学软件 化学教育软件
6
Matlab
MATLAB (Matrix Laboratory)是一款商 业软件,主要应用于算法开发、数据 可视化、数据分析以及数值计算的高 级技术计算语言和交互式的环境 ()。
7
Matlab的特点
(1)友好的工作平台和编程环境 (2)强大的科学计算机数据处理能力 (3)出色的图形处理功能 (4)应用广泛的模块集合工具箱 (5)实用的程序接口和发布平台
无机化学软件
生物化学软件
化学软件 3
化学软件常用分类二
分子模拟软件
化学编排软件 谱图库软件
化学计算软件 画图作图软件
仪器分析软件
化学学习软件
化学软件 4
化学软件常用分类三
结构化学
LIMS 化学信息学 生物信息学
通用软件 量化计算软件 分子模拟软件
化学软件 5
语言软件和依托算法的化学计算软件
➢ Matlab ➢ R语言
22
While循环语句
20
If语句
If expression
statements
end 其中expression为设定的执行条件,当满足条件时程 序将执行statements语句。另外也可采用if…else…结 构进行多条判断:
If expression 1
电子教案与课件:化学信息学 第三课
1
信息搜索引擎
通常来说,搜索引擎是指以 web 站 点存在,提供网址、网页、文章搜索 及综合服务的 Search Tools。
2
搜索引擎的原理
图3-1 搜索引擎基本结构
3
搜索引擎的历史
1990年加拿大麦吉尔大学(University of McGill)计算机学院的师生开发了一个 软件,Archie。该软件通过定期搜集并 分析FTP系统中存在的文件名信息,提 供查找分布在各个FTP主机中文件的服 务。
28
图3-7 BASE主页
SciTech Connect
SciTech Connect是由美国能源部(DOE)下属的科学与 技术信息办公室(OSTI)开发维护的搜索工具
图3-9 SciTech Connect 主页
29
CiteSeerX
CiteseerX 是CiteSeer的换代产品。1997年,CiteSeer引 文搜索引擎由美国普林斯顿大学NEC研究院研制开发。
13
搜索引擎分类
缺点: 目录库相对较小,更新较慢。
14
元搜索引擎
元搜索引擎在接受用户查询请求的同 时从其他多个引擎上进行搜索,并将 结果返回给用户。著名的元搜索引擎 有InfoSpace、Dogpile、Vivisimo等, 中文元搜索引擎中具有代表性的有搜 星搜索引擎。
15
垂直搜索引擎
垂直搜索引擎是针对某一个行业的专 业搜索引擎,是搜索引擎的细分和延 伸,是对网页库中的某类专门的信息 进行一次整合,定向分字段抽取出需 要的数据进行处理后再以某种形式返 回给用户。
逻辑 “ 或 ” ——“,”,OR,空格 Chemistry OR Computer OR Software
最新北京大学化学信息学第四讲电子资源PPT课件
网络数据库检索系统特点:
l 数据库数量多,信息量大,同时提供了其它 服务项,如有关的动态信息、统计数字、相关站 点的链接等。
l 数据库更新速度快,一般为日更新。
l 数据库和系统分布式管理,响应快。
l 检索模式:客户端/服务器方式,客户方运 做在微机上进行,分析从服务器上返回的数据, 给用户显示信息;服务方则给用户提供客户端应 用程序,分析处理各类请求,并提供数据服务。
的命令检索,必须由专业人员检索。
l 系统连接需通过通讯线路或网络进行,需支付通讯费用。
l 检索费用贵。
l 检索界面单一,过于呆板。
现有的联机数据库检索系统:Dialog,STN,LEXIS-NEXIS,…
2.3 光盘数据库检索
光盘数据库通常是指CD-ROM数据库。CDROM(Compact Disc Read-only Memory),意为 只读光盘,轻便、灵活、体积小、容量大,一 张只读光盘的最大存储量为600M,可存储文字、 图片、图像、声音等。
数据库
联机检索系统的网络结构
联机检索系统的特点是:
l 数据库数量多,信息量大。
ห้องสมุดไป่ตู้
l 数据库更新快。
l
数据库和系统集中式管理,安全性好,可以在存储设备上
直接处理大量数据,但主机的负担重,网络扩展性差。
l 检索模式:主仆式,即所有的工作都在主机上进行。
l 信息组织模式:普通线性文本。
l
检索机制:检索功能强,索引多,所有的数据库使用统一
l 检索环境宽松,检索费用较联机检索低,但 高于光盘检索。
l 用户界面基于WWW浏览器开发,方便友好。
2.5 检索语言
检索语言 (information retrieval language),是信 息存储与检索过程中用于描述信息特征和表达用 户信息提问的一种专门语言。所谓检索的运算匹 配就是通过检索语言的匹配来实现的。检索语言 是人与检索系统对话的基础。
电子教案与课件:化学信息学 第六课
Spectral Database for Organic Compounds (SDBS)
SDBS is an integrated spectral database system for organic compounds, which includes 6 different types of spectra under a directory of the compounds.
图8-2层次模型示意图
图8-3网状模型示意图
14
数据库内容分类
文献数据库
事实数据库
结构数据库
目录数据库
全文数据库 专利数据库
数字数据库
化学结构数据库
光谱数据库
化学反应数据库
化合物目录数据库
研究计划数据库
15
Internet 上的化学数据库
Spectral Database for Organic Compounds NIST Chemistry WebBook NIST Atomic Spectra Database Reaxys数据库 剑桥晶体数据库
20
NIST Chemistry WebBook
美国国家标准技术研究院(National Institute of Standards and Technology,NIST)属于美国商 业部的技术管理部门,在国际上享有极高的声 誉。
表2 Chemistry webBook数据库收录的谱图数据信息
18
SDBS
图8-4 SDBS数据库主页
19
SDBS
表1 SDBS数据库收录的谱图数据信息
Compounds
MS 1HNMR 13CNMR
FT-IR Raman ESR
《化学信息学资料》课件
通过数据挖掘和分析,化学信息学能够发现潜在的化学规律和现象 ,为新材料的开发、药物设计等领域提供支持。
解决实际问题
化学信息学在环境保护、食品安全、医疗诊断等领域有广泛的应用 ,为解决实际问题提供技术支持。
化学信息学的发展历程
起源
01
化学信息学作为一门学科,起源于20世纪80年代,随着计算机
技术的快速发展和化学数据库的建立。
发展阶段
02
进入21世纪,随着大数据和人工智能技术的兴起,化学信息学
得到了快速发展,广泛应用于各个领域。
未来展望
03
未来,化学信息学将继续融合新的技术和方法,在数据获取、
处理和分析方面取得更大的突破和应用。
02
化学信息学基础知识
分子结构与性质
分子结构
分子中的原子通过化学键相互连 接,形成特定的空间排列。
原子或分子的电子在空间 中的分布状态,决定了分 子的电子结构和化学性质 。
分子轨道理论
通过分子轨道理论可以描 述分子中电子的分布和运 动状态,解释分子的化学 键合和反应机理。
分子光谱与波函数
分子光谱
分子吸收或发射光时产生的光谱,包括红外光谱 、紫外光谱、拉曼光谱等。
波函数
描述电子在原子或分子中运动的量子力学函数, 可以用来描述分子的电子结构和化学性质。
通过化学信息学方法,可以分析环境样品中的污染物成分和浓度,预测污染物的迁移转化规律,为污染 控制和环境治理提供科学依据。
化学信息学还可以应用于生态毒理学研究中,通过分析生物体内外的化学物质及其对生物体的影响,揭 示环境污染对生态系统和人体健康的潜在危害。
材料科学与工程
材料科学与工程是化学信息学的又一应用领域。在现代材料科学研究中,化学信息 学方法被广泛应用于材料的设计、合成、表征和性能预测等方面。
北京大学 化学信息学 第四讲 电子资源
l 数据库更新快。
l
数据库和系统集中式管理,安全性好,可以在存储设备上
直接处理大量数据,但主机的负担重,网络扩展性差。
l 检索模式:主仆式,即所有的工作都在主机上进行。
l 信息组织模式:普通线性文本。
l
检索机制:检索功能强,索引多,所有的数据库使用统一
的命令检索,必须由专业人员检索。
l 系统连接需通过通讯线路或网络进行,需支付通讯费用。
h
5
全文数据库:英文为full-text databases,即收录有原始文献全 文的数据库,以期刊论文、会议论文、政府出版物、研究报 告 、 法 律 条 文 和 案 例 、 商 业 信 息 等 为 主 。 如 美 国 的 LEXISNEXIS 数 据 库 、 学 术 期 刊 图 书 馆 (ProQuestAcademicResearchLibrary)及《中国人民大学书报资 料中心复印报刊资料全文数据库》等。
标识包括关键词、题名、h 摘要、全文等。
19
3. 电子资源的检索方法与技术
3.1 检索方法 对检索课题进行分析:
•明确课题的主题或主要内容: •课题涉及的学科范围: •所需信息的数量、语种、年代范围、类型、 作者等。 制定检索策略: •选择相关数据库,特别要注意数据库是否 与上述分析相吻合
h
20
3.2 检索技术
化学信息学
电子资源部分
h
1
1.电子资源
传统上也称为电子出版物,指一 切以电子方式或机读方式生产和发行 的信息资源。电子资源中的信息,包 括文字、图片、声音、动态图像等, 都是以数字代码方式存储在磁带、磁 盘、光盘等介质上,通过计算机输出 设备和网络传送出去,最终显示在用 户的计算机终端上。
《化学信息学》课件
药物设计
药物设计是一种通过研究分子结构和相互作用来设计新药物的方法。它的目 标是开发更安全、有效的药物,用于治疗疾病。
结语
化学信息学在化学和生命科学中的应用前景广阔。它为教学和科研提供了宝贵的贡献和价值,并将在未 来持续发展和创新。
《化学信息学》PPT课件
欢迎来到《化学信息学》PPT课件!本课程将为您介绍化学信息学的定义、 应用领域、相关技术和方法。准备好探索这个令人着迷的领域了吗?让我们 开始吧!
概述
化学信息学是研究如何有效地收集、存储、检索和分析化学信息的学科。它 的应用范围广泛,包括药物设计、分子模拟和化合物结构搜索。
化合物结构搜索
化合物结构搜索是一种通过分析数据库中的化合物结构来检索相关化合物的 方法。它使用算法和工具来帮助我们寻找特定的化学结构。
化学数据库
化学数据库是一个存储大量化学信息的资源,包括查询方法和操作技巧对于化学信息学研究至关重要。
分子模拟
分子模拟是一种利用计算机模拟分子的行为和性质的方法。它可以帮助我们 了解分子之间的相互作用,预测它们的性质和行为。
《信息化学物质》课件
医药
研究信息化化学在 医药领域中的突破, 为新药研发提供支 持。
环保
探讨信息化化学在 环保领域的创新应 用,促进可持续发 展。
能源
分析信息化化学在 能源领域的潜力和 用途,实现能源转 型。
结论
1 未来发展趋势
2 总结
展望信息化化学的未来发展,探讨可能的 趋势和创新。
概述本课件内容,并强调信息化化学的重 要性和实际应用。
信息化化学品种类ห้องสมุดไป่ตู้
电子化学品
探索电子化学品在信息化领域的创新应用。
磁化学品
了解磁化学品在信息化领域中的重要性和应 用范围。
光化学品
分析光化学品在信息化领域的影响力和应用 前景。
热化学品
介绍热化学品在信息化领域的独特用途和创 新。
信息化化学的应用
工业
探索信息化化学在 工业领域中的应用, 提高生产效率和质 量。
参考文献
1 引用的资料
列出在本课件中引用的资料,以供进一步参考和深入研究。
《信息化学物质》PPT课 件
本课件旨在介绍信息化学物质,探讨其概念、特性和应用,以及对未来的发 展趋势进行展望。
引言
本节将概述《信息化学物质》课程,并介绍学习目标,为您打开信息化学物 质的大门。
物质与信息化
在这一部分中,我们将探讨物质的定义和特性,以及信息化的概念和特点, 并研究物质与信息化的融合。
化学信息学(第二版)Ch2
• 电子型:指通过编码和程序设计方法,将信息转换成机读 语言,存储到磁带、磁盘和光盘中,由计算机读出。存储 容量大,存取速度快,可以修改、删除或更新。
• 多媒体型:集文字、语音、图片、动画、音乐于一体,充 分体现了信息内容表述的多样性和直观性。
2020/12/19
11
化学期刊的学科分类
一.综合性自然科学期刊 二.化学学科综合性期刊 三.专业性化学期刊 四.综论类期刊
2020/12/19
13
第四节 化学文摘 (CA)
• CA的概况 • CA的文摘 • CA的索引 • CA的索引途径 • CA的检索实例
2020/12/19
14
CA 的概况
美国《化学文摘》(Chemical Abstracts)是 “Key to the World’s Chemical Literature”。
2020/12/19
7
文献期刊类型
• 零次文献:书信、论文手稿、笔记、实验记录、会议记 录等是零星的、分散的和无规则。属于原始素材。
• 一次文献:期刊论文、研究报告、会议论文、专利说明 书、学位论文、技术标准等,亦称原始文献 。具有创造 性。
• 二次文献:通过科学的方法,将分散无序的一次文献进 行加工、整理,使之成为系统有序的信息。例如题录、 书目、文摘、索引等。具有浓缩性。
2020/12/19
15
CA 的文摘
CA以报道性为主,其内容包括研究的目的和范围、新 的化学反应、化合物、材料、工艺、操作、设备、性质机 器理论,新知识的应用,以及研究结果和作者的判断、结 论等。 CA的编排方式按内容分成五大部分,80类目。
1. 生物化学(Biochemistry Section)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章化学信息概论一、化学信息学的产生和发展信息:实物的存在方式和运动状态的记录,它精确地描述物体或事件,并且可借助于一定的物质载体进行存储和传播。
化学学科的重要性化学信息量的快速增长化学信息学:是应用信息学方法解决化学问题的学科。
(化学信息学是信息科学与化学的交叉学科。
)(利用数学、统计学与计算机科学的理论、方法和网络技术作为手段,研究化学信息的获取、表示、管理、传播、分析、加工和应用,在此基础上进行知识创新,促进化学学科的发展。
)二、化学信息学的研究领域应用现代信息技术构建信息处理系统,处理长期积累的大量化学信息资源,帮助化学家组织、分析和理解已知的科学数据,正确地预测化学物质的性质,开发新化合物、材料和方法。
应用计算机科学方法或信息学解决化学问题,对化学信息进行有效的存储、操作和处理,使化学信息合理地提升为化学知识。
研究内容:化学、化工文献学;化学知识体系的计算机表示、管理与网络传输;化学图形学;化学信息的解析与处理;化学知识的计算机推演;化学教育与教学的现代技术与远程信息资源。
三、信息资源检索的意义与作用⏹• 启迪创新:科研工作具有继承和创新两重性,要求科研人员在探索未知进行创新之前,应该尽可能地继承和利用与之相关的信息。
⏹• 拓宽视野:21世纪信息与知识的积累日新月异,出现了大量的边缘科学和交叉科学。
面对知识频繁更新的世界,需要接受终身教育,在不断的教育中更新知识,适应环境的变化。
⏹• 培养能力:现代教育不单纯是知识的传授,更重要是要大力进行各种能力的培养,其中包括自学能力、思维能力、研究能力、表达能力、创新能力、终生教育能力、组织管理能力和收集处理信息的能力。
⏹• 提高素质:信息素质是信息社会中实现对知识的探索和发现的综合能力,它是进入信息社会赖以生存的通行证。
四、化学信息学的课程内容化学信息的产生和获取(重点)利用检索工具通过实验方法... …化学信息的表达、存储和管理化学运筹学数据整理可视化数据库管理技术... ...化学信息的加工和处理化学计量学化学软件目的是获取更多的信息化学信息的深化计算机模拟设计化学结构的可视化以图形的方式对化学信息进行描述1.2 电子信息和数据库一、电子信息指通过计算机等设备以数字信号传递的数字信息资源组成的数据库。
1、联机信息资源,如:Dialog, STN, OCLC数据库⏹2、光盘信息资源,包括单机版、网络版、联机版⏹3、Internet网络信息资源二、数据库数据库是以特定方式合理地组织相互关联的数据集合。
(一)数据库的结构⏹1、记录型文献数据结构常用的字段:标题、作者、地址、期刊名、学科、文件类型、语种和摘要。
如表1-1(p7)⏹2、记录的排序和索引(1)顺排文档:按记录号顺序排列;(2)倒排文档:各个记录按照某一字段的值进行排列。
1.3 信息检索的方法和步骤二、信息检索的评价1、评价指标:查全率、查准率、漏检率、误检率、响应时间、用户负担、输出形式等。
2、查全率和查准率(1)查全率(R):检索出的相关信息量(w)与该系统信息库中存储的相关信息量(x)的比率称为查全率,R=w/x ×100 % 。
(2)查准率(P):检出的相关信息量(w)与检出信息总量(m)的比率称为查准率,P= w/m×100% 。
两者之间存在互逆关系,即查全率高时,查准率较低,反之亦然。
(3)漏检率(O):O = 1 – R = 1- w/x ×100 % 。
(4)误检率(N):N = 1 - P = 1-w/m ×100 % 。
⏹如果一个检索系统中与某一课题相关的信息共250 条。
检索操作后,实际检出了400条信息,其中相关信息为200条,此次检索效率可计算为:R = [200 /250] ×100 %=80% O = 1-80% = 20%P = [200/400] ×100%=50% N = 1-50%= 50%⏹2、位置检索:⏹With (W、nW),表示算符两侧的检索词按此前后衔接的顺序排列,词序不可颠倒。
⏹Near (N、nN)表示算符两侧的检索词必须紧密相连,两词词序可变。
⏹Subfield (S )表示算符两侧的检索词必须同时出现在文献记录的同一子字段(句子、短语)。
⏹Field(F)表示算符两侧的检索词必须同时出现在同一个字段中。
⏹Citation(C)表示算符两侧的检索词必须同时出现在一条文献的记录中。
⏹Link(L)表示算符两侧的检索词之间有一定的从属关系。
⏹4、限词检索基本检索字段:题名、文摘、主题词、标识词辅助检索字段:作者、语种、出版年代、期刊名称和文献类型。
基本检索字段主要有题名(TI)、文摘(AB)、主题词(DE)和标识词(ID),适用于各种数据库。
辅助检索字段主要有作者(AU)、语种(LA)、出版年代(PY)、期刊名称(JN)和文献类型(DT)等字段。
一般说来,数据库的提供的字段越多,其检索方式就越多,可以使用多字段构建复杂的检索表达式,进行高级检索。
四、信息检索步骤实施检索操作,获取检索信息;评估检索结果。
为了减少滥检、漏检和缺检,可进行检索策略的调整,主要分为缩检和扩检二种。
缩检主要方法有:主题细化;选择更专指的检索词;运用逻辑算符AND 、NOT;运用位置算符WITH 、NEAR;减少字段检索;对检索结果进行二次检索。
扩检主要方法有:对己确定的检索词进行其同义词、同义的相关词、缩写和全称检索;利用数据库提供的词表输入规范词;使用运算符OR 等。
数据库的选择⏹ 1. 数据库的类型。
例如,书目数据库、事实数据库结构数据库;文摘数据库或全文数据库。
⏹ 2. 数据库所收集的数据内容所涵盖的学科领域和收录范围。
⏹ 3. 数据库的现状,包括数据库收录的文件类型、据量、存储年限、更新周期、语种、媒体介质和辅助工具。
⏹ 4. 数据库的检索质量、权威性和检索速度。
⏹ 5. 数据库提供的系统功能和检索方式。
⏹ 6. 数据库的使用权和检索费用。
原文信息的获取⏹全文链接服务:有的数据库系统提供了全文链接服务,例如Web of Science、Beilstein/Gmelin。
(要有使用权)⏹电子期刊:可根据检索到的文献信息(如出版商和期刊名),链接出版商和电子期刊网站,下载文献的原文的PDF文件。
(要有使用权)⏹印刷品原文:查找所在图书馆的馆藏,要获取印刷品原文,进行复印。
(要有订阅)⏹馆际互借服务:许多图书馆开设了此项服务。
⏹原文传递服务:利用各种通信手段、从各种文献服务中心购买文献信息。
(付费)⏹向作者索取原文:根据检索到的文献信息(作者姓名和地址),用户可直接发信或发送电子邮件向作者索取原文可使用多种方法取得作者的电子邮件地址。
(免费)第二章印刷类化学文献信息2.1 图书分类法简介一、图书馆的重要地位和作用图书馆在网络环境下受到了相当大的冲击和挑战,但还能发挥其独特而无以替代的作用。
图书馆可推动和促进知识传播、教育普及、学术研究与交流等活动,它也要与信息产业中的其他机构协同合作,以求得更加长远的发展前景。
二、图书馆图书的分类系统国际十进制分类法;中国图书馆图书分类法介绍几种国内外各大图书馆广泛应用的图书分类系统一、杜威十进位分类法,二、国际十进位分类法,三、美国国会图书分类法,四、中国科学院图书分类法,五、中国图书馆图书分类法。
一、中国科学院图书分类法根据我国的具体情况和科技发展的需要而制定的分类法,1958年开始使用,并几经修订形成目前的分类体系。
分类表分为五大部分,即00 马列主义、毛泽东思想;10 哲学;20 社会科学;50 -89自然科学90 综合性图书二、中国图书馆图书分类法1973年北京图书馆联合全国有关图书馆共同编制了《中国图书馆图书分类法》(简称《中图法》),1999年第四版,目前已为我国许多图书馆和情报单位采用。
《中图法》是以科学分类为基础,结合图书文献的特点进行分类的。
将人类知识分为五大部分,22大类。
见表。
前面所讲的各类书籍的编目称为分类号码,馆藏的各种图书除编上分类号码外还在分类号码后面或下面还跟随一个由英文字母或数学组成的号码,称为书次号或作者号,这个号码与作者的名字有关,图书馆也有一套编号规则。
分类号再加上作者号合称为索书号(Call number)。
借书时只要查到并写清楚这个号码,图书馆工作人员就会很快地把书找到。
图书馆索书号❖0622.2-----中图号00----排架号可通过计算机索引查到索书号附3 文献标识码一、什么是文献标识码文献标识码就是用于标示文献正文内容类型的代码。
为便于文献的统计和期刊评价,确定文献的检索范围,提高检索结果的适用性,每一论文作者在撰写公开发表的论文或投稿时,都应根据“规范”所设的5种内容分类文献标识码,确定自己论文的分类项,并在中图分类号项后标注文献标识码。
这5种文献标识码所指代的文献内容的基本类型如下:A——理论与应用研究学术论文(包括综述报告)B——实用性技术成果报告(科技)、理论学习与社会实践总结(社科)C——业务指导与技术管理性文章(包括领导讲话、特约评论等)D——一般动态性信息(通讯、报道、会议活动、专访等)E——文件、资料(包括历史资料、统计资料、机构、人物、书刊、知识介绍等)2.4 化学文摘(Chemical Abstracts)名称(CA,Chemical Abstract)内容:以化学化工为主,涉及生物、医学、轻工、冶金、物理等领域,最常用的检索工具.出版情况:周刊,两卷/每年,26期/卷(1967-)特点:(1)摘录广泛,收录136 个国家56 种文字出版的14,000 多种期刊,包括期刊、图书、学位论文、科技报告、会议论文、专利等,占总文献98 %(2)出版迅速(3)索引完备❖组成:CA文摘和CA索引❖CA文摘的内容以报道性为主,其内容包括研究的目的和范围、新的化学反应、化合物、材料、工艺、操作、设备、性质机器理论,新知识的应用,以及研究结果和作者的判断、结论等。
CA索引介绍(一)主题索引(Subject Index )(1)1907-1915年初级阶段(2)1916-1966年发展阶段(3)1967-1971年成熟阶段(4)-1972-至今分成化学物质索引和普通主题索引出现索引指南作为辅助工具。
分子式索引(Formula Index)按分子式符号的英文字顺序排列,相同分子式下又按化学物质名称的字顺序排列。
分子式按Hill 系统排列.含碳化合物碳在前、氢在后,其他按字序;普通主题索引的主题词按学科内容分58各大类,排列成等级表,用点数表示主题级别,其格式:54. TECHNOLOGICAL PROCESSES ANDPRODUCTS (大类名)Environmental pollution(一级主题)• Air pollution• Wastes (二级主题)•• Waste gases••• Exhaust gases•• Waste solid (三级主题)••• Dust (四级主题)登记号索引(Registery Number Index)化学文摘中化学成分、结构及化学键性质确定的每一种化学物质都编一个登记号。