北京大学 化学信息学 course(1)
化学信息学1
行表示、管理、模拟(建模)、传播(收集)、分析和应用, 以实现化学信
息的充分利用和共享,促进化学学科的发展。” 首先, 化学信息学应为化学学科的分支学科,其研究对象和研究目的 均属于化学的学科领域。它的研究手段为计算机技术和计算机网络技 术,研究内容则包括如何利用计算机和计算机网络技术对化学信息进行 表示、管理、模拟、传播、分析和应用等。 化学信息学的目的是为了实现化学信息的充分利用和化学家之间的 资源 共享,从而为促进化学学科的发展做出贡献。
库、常用全文数据库、常用电子期刊、特种信息资源、常用化学事实数据库及文献数 据的管理等内容。
(1)通用信息引擎
• • Yahoo() Go要内容
(一)化学信息学的内涵与意义
(二)化学化工网站与网上数据库 (三)常用化工软件
三、要求
• 了解Internet基本概念; • 学会使用重要的化工数据库查询相关资料
• 学会使用重要化工软件(origin、 chemdraw、 chem3D) • 了解化工制图软件(AUTOCAD)
四、教学环节与教学要求:
意义
“信息” 作为沟通的基础 作为学习的主要原素
作为分析事理的主要论据
帮助解决问题和作出决定
又由于Internet 的飞速发展使其逐步成为各种信息资源传
递的重要载体,化学与 Internet 正在成为一个非常活跃、进展
惊人的新兴交叉领域。 “化学信息学(Chemoinformatics)”首次提出于1987年诺贝 尔化学奖获得者J.M.Lehn教授的获奖报告中。90年代以来, 国外一些大学开设了化学信息学课程并确定为研究生的研究
Chem3D
Origin
ChemFinder
ChemDraw
《化学信息学》教学大纲【最新精选】
《化学信息学》教学大纲【最新精选】《化学信息学》教学大纲一、课程基本信息课程编号:84110123课程中文名称:化学信息学课程英文名称:Chemical Informatics课程类型:专业必选课总学时:42学时学分:3适用专业:化学先修课程:无机化学、有机化学、物理化学开课院系:化学学院二、课程性质和任务本课程是化学—生物学实验班的专业必选课~辅助专业课应用的一门技术基础课。
本课程将全面介绍化学信息学的发展和现状~检索方法和文献情报的搜集整理。
使学生掌握一般化学化工参考工具书~化学情报~化学化工核心期刊的检索方法~了解互联网的知识。
并使学生利用专业课、完善学生的知识体系的能力得以提升~为今后实际工作打下坚实的基础。
三、课程教学目标在学完本课程之后,学生能够:1.了解化学信息学的发展和现状2.了解化学信息的出版形式和存储方法3.掌握各种信息资料的检索方法4.掌握化学信息的搜集整理5.掌握一般化学化工参考工具书,ISI数据库,美国化学文摘,化学化工核心期刊的检索方法。
6.了解互联网的一般知识。
四、理论教学环节和实践教学环节第一章绪论【教学目标】介绍化学文献的发展历史、化学情报检索系统的建立以及化学文献查阅的意义。
【教学重点】了解化学文献的发展历史。
【教学难点】情报检索系统。
【学时数】 2学时。
【考核知识点与考核要求】化学文献的发展历史、化学情报检索系统的建立以及化学文献查阅的意义。
第一节化学文献的发展本节应了解、理解、掌握的基本概念、基本理论 1、了解化学文献的发展历史。
2、理解当今化学文献总的特点。
第二节化学文献源概述本节应了解、理解、掌握的基本概念、基本理论 1、掌握化学文献源的构成:图书、期刊、科技报告、学位论文、会议资料、专利文献、技术标准、技术档案和产品样本。
2、掌握化学文献源的特点及作用。
第三节化学情报检索系统的建立和发展本节应了解、理解、掌握的基本概念、基本理论1、掌握一次文献、二次文献和三次文献的概念。
《化学与信息科学》课件
化学信息学是一门交叉学科,它结合了化学和信息科学的知识,利用计算机技 术处理、分析和解释化学信息。
详细描述
化学信息学是化学与信息科学相互渗透、融合而形成的一门新兴交叉学科。它 利用计算机技术,通过对化学信息进行获取、整理、分析、解析和表达,实现 对化学问题的深入研究。
化学信息学的研究内容
总结词
化学信息学的发展趋势
总结词
随着大数据时代的到来,化学信息学的发展趋势是向 着智能化、自动化和集成化的方向发展。
详细描述
随着大数据时代的来临,化学信息学面临着新的机遇和 挑战。为了更好地适应时代的发展,化学信息学的发展 趋势主要表现在以下几个方面:一是智能化,即利用人 工智能、机器学习等技术手段对化学数据进行自动化处 理和分析,提高数据处理效率;二是自动化,即通过自 动化技术手段获取和处理化学数据,提高数据获取的准 确性和效率;三是集成化,即通过集成化技术手段将各 类化学数据库、信息系统等进行整合,实现数据共享和 互通。
总结词
计算化学在能源、环境、药物设计等领域有广泛的应 用。
详细描述
计算化学在能源领域的应用主要包括燃料电池、太阳 能电池等方面的研究,旨在提高能源利用效率和降低 环境污染。在环境领域,计算化学可用于研究大气、 水体和土壤中的化学反应和污染物迁移转化等。在药 物设计领域,计算化学可用于研究药物与靶点的相互 作用和分子设计,为新药研发提供理论支持。此外, 计算化学还在材料科学、生物技术等领域有广泛的应 用。
总结词
要点二
详细描述
概述化学信息系统的发展历程、应用领域及未来发展趋势 。
化学信息系统经历了从简单的手工检索到计算机化的数据 库管理系统,再到智能化的知识管理系统的发展历程。目 前,化学信息系统已经广泛应用于化学研究、教学、生产 等领域,为化学学科的发展和进步提供了重要的技术支持 。未来,随着信息技术和人工智能的不断发展,化学信息 系统将朝着更加智能化、个性化的方向发展。
化学信息学重要知识点总结
化学信息学重要知识点总结一、化学数据的采集、存储、管理和分析1. 化学信息的采集化学信息的采集主要包括从文献、数据库、实验数据和化学品目录等渠道采集化学数据。
这些数据包括化合物的性质、结构、反应和生物活性等信息,是化学信息学研究和应用的基础。
2. 化学信息的存储和管理化学信息的管理和存储需要借助计算机和数据库技术。
化学数据库可以存储各种化学信息,如化合物的结构、性质、反应等,同时还可以建立不同数据间的关联,方便用户查询和分析化学数据。
3. 化学信息的分析化学信息的分析主要包括从大量的数据中提取有价值的信息,并进行统计、模式识别和预测等分析。
化学数据的分析可以帮助化学家寻找新的化合物、探索新的反应途径和发现新的规律。
二、化合物结构预测和设计1. 化合物结构预测化合物结构预测是指基于已知的化合物或分子结构信息,通过计算机模拟和分子建模等技术,预测新的化合物或分子的结构。
这项技术可以帮助化学家在合成新的化合物时,提前预测化合物的结构和性质,从而节约实验成本和时间。
2. 化合物设计化合物设计是指根据某种化学结构或分子特性,设计具有特定生物活性或其他性质的化合物。
化合物设计可以通过计算机辅助设计(CADD)技术,结合分子模拟和分子对接等方法,设计出新的药物候选化合物或优化已知的化合物结构,以提高其活性和选择性。
三、生物分子模拟和药物发现1. 生物分子模拟生物分子模拟是指利用计算机模拟技术,模拟生物大分子(如蛋白质、核酸等)的结构和动态过程。
生物分子模拟可以帮助科学家深入了解生物大分子的结构和功能,揭示其生物活性和生理作用的机制,有助于药物研发和生物工程领域的应用。
2. 药物发现化学信息学在药物发现领域发挥着重要作用。
药物发现的过程包括靶点识别、化合物筛选、分子设计和药效评价等环节。
化学信息学技术可以通过虚拟筛选、分子对接和药效预测等方法,加速药物发现的过程,为新药研发提供支持。
综上所述,化学信息学是化学和信息科学的交叉学科,具有重要的理论和应用价值。
化学信息学的入门指南
化学信息学的入门指南1. 引言化学信息学作为化学科学与计算机科学的交叉学科,旨在利用计算机技术和信息科学方法解决化学问题。
它不仅可以加速化学实验的设计与优化,还可以实现大规模数据处理与分析,为药物设计、材料科学等领域提供支持。
本文将介绍化学信息学的基本概念、主要方法和应用领域,以帮助读者了解和使用这一领域的知识。
2. 化学信息学的基本概念2.1 分子描述符分子描述符是化学信息学中的重要概念之一,它用数值或文本表示化学分子的结构、性质和活性。
常见的分子描述符包括分子的拓扑结构、物理化学性质、电子结构等。
分子描述符是进行分子相似性计算、药物设计和毒理性评估等任务的基础。
2.2 化学数据库化学数据库是存储化合物信息和相关数据的集合,它包括大量的化合物结构、性质、活性等信息,并提供搜索、筛选和分析功能。
化学数据库广泛应用于药物研发、材料科学等领域,并可供研究人员快速获取需要的数据。
2.3 分子建模与计算分子建模与计算是化学信息学中发展最为迅速的领域之一,它通过计算机模拟和预测手段研究化合物的结构、性质和活性。
常见的分子建模与计算方法包括分子力场、量子化学计算和药效团模型等。
这些方法可以为药物设计和材料发现提供重要依据。
3. 化学信息学的主要方法3.1 分子相似性计算分子相似性计算是一种判断两个或多个分子之间相似程度的方法,它常用于药物设计、环境毒理等研究。
常见的相似性计算方法包括基于拓扑结构的指纹法和基于分子描述符的 QSAR(定量构效关系)模型等。
3.2 药物筛选与设计在药物研发过程中,高吞噬药物筛选与设计是一个复杂而耗时的过程。
化学信息学可以通过建立药效团模型、虚拟筛选库和多参数优化等方法,提高药物发现与设计地效率,帮助研究人员找到具有潜在活性的候选化合物。
3.3 QSAR 模型QSAR(定量构效关系)模型是一种通过计算机预测化合物活性的方法。
通过收集一系列有关分子结构与活性之间关系的数据,并利用统计和机器学习技术建立模型,可以快速预测新候选分子的生物活性。
化学信息学的入门指南
化学信息学的入门指南化学信息学,顾名思义,是化学与信息学相结合的交叉学科领域。
随着信息技术的飞速发展以及化学研究的日益深入,化学信息学在化学领域的应用日益广泛。
今天,我们就一起来探讨化学信息学的基本概念和应用。
什么是化学信息学?化学信息学是利用信息技术处理和管理化学信息的学科。
它涵盖了化学数据的收集、存储、检索和分析,以及利用计算机和信息技术来解决化学问题。
通过建立数据库、开发分子模拟方法、设计化学信息系统等手段,化学信息学可以帮助化学家更高效地进行科研工作。
化学信息学的重要性在当今大数据时代,化学信息学的应用意义愈发凸显。
通过化学信息学技术,研究人员可以从海量数据中快速准确地筛选出有潜力的化合物,加速新药物的研发过程;还可以通过模拟实验,预测化学反应的结果,节约实验成本和时间;化学信息学还有助于促进不同领域的交叉合作,推动科学研究的创新。
化学信息学的基本工具化学信息学主要依赖于一系列先进的信息技术工具,例如:化学信息系统(ChemicalInformationSystems):这些系统可以帮助科研人员收集、存储和管理化学数据,实现数据的可视化和快速检索。
分子模拟软件(MolecularSimulationSoftware):通过分子模拟软件,研究人员可以模拟化学反应的过程,预测分子的构型和性质,为实验设计提供参考。
数据库(Databases):化学数据库包含了丰富的化学信息,如化合物的结构、性质、毒性等数据,科研人员可以利用数据库进行信息查询和分析。
化学信息学在实践中的应用化学信息学的应用领域非常广泛,以下是一些典型的应用场景:药物设计:利用化学信息学方法,科研人员可以筛选药效更好的化合物,加速新药物的开发过程。
材料设计:通过模拟分子结构和性质,设计出具有特定功能的先进材料,如光催化剂、电池材料等。
环境监测:利用化学信息学技术,对环境中的化学物质进行监测和分析,保障环境安全。
化学信息学作为化学与信息学的交叉学科,为化学研究带来了前所未有的便利和机遇。
北京大学化学信息学course-11.
2
内容
相关名词辨析及化学信息学由来 分子结构信息的计算机存储和表达 分子二维数据库和数据库检索技术
3
名词解释 - Computational Chemistry
计算化学: 使用数学方法计算分子性质和模拟分子行为
的方法。并且包括合成设计、数据库搜索、组合 库操作等
12
Human Alcohol Dehydrogenase (Adh1A)
13
分子结构信息的计算机存储和表达
如何使用计算机存储化学结构? 如何处理存储的结构信息? 计算机在Chemoinfomatics中的应用?
14
分子结构信息表达的内容
原子 原子间的连接
键型
立体化学构型 电荷 同位素 3D-coordinates for atoms
21
11
32
41
22
21
51
61
41
41
71
61
8 2 12 1
72
91
8 1 10 2
9 2 11 1 13 1
10 1 12 2
11 2
71
10 1
43
MDL Connection Table
数据交换的事实标准 衍生文件格式
Molfile (single molecule) SDfile (set of molecules and data) RGfile (Markush structure) Rxnfile (single reaction) RDfile (set of reactions with data)
29
手性表示 - @ or @@
化学信息学与计算化学方法
化学信息学与计算化学方法化学信息学是一门将计算机科学与化学相结合的学科,旨在利用计算机技术处理化学信息和分析化学数据。
计算化学方法则是在化学研究中应用计算机所开发的一系列数值模拟和计算工具。
本文将介绍化学信息学的基本概念和计算化学方法的应用。
一、化学信息学概述化学信息学(Chemoinformatics)是利用计算机和信息学方法来研究和解决化学问题的学科。
它涉及化学信息的获取、存储、检索和分析,以及设计新药物、预测物质性质等领域的研究。
化学信息学的核心任务是建立化学数据库和开发化学信息处理工具。
二、化学信息的获取与存储1. 化学数据库的构建化学数据库是化学信息学研究的重要组成部分,其中包括了化合物的结构、性质、活性等信息。
化学数据库的建立可以通过实验技术、文献挖掘和计算预测等途径获取化学信息,并将其进行整理和存储以便后续的分析和应用。
2. 化学信息的编码为了更好地处理和分析化学信息,化学信息学采用了一系列化学信息编码体系,如化学结构编码体系(例如SMILES、InChI等)和化学性质编码体系(例如化学描述符)。
这些编码体系可以将化学信息转化为计算机可处理的数据形式。
三、化学信息的检索与分析1. 化学信息的检索化学信息的检索是根据特定的查询条件来寻找和筛选化学相关的信息。
在化学数据库中,可以通过关键字、化学结构的相似性或化学性质的匹配等方式进行信息检索。
这些检索工具可以帮助化学研究人员快速准确地找到所需的化学信息。
2. 化学信息的分析化学信息的分析是利用统计学和机器学习等方法对大量的化学数据进行处理和分析,以揭示其中的规律和模式。
例如,可以通过统计分析药物分子的结构与活性之间的关系,从而指导新药的设计和优化。
四、计算化学方法的应用计算化学方法是通过数值模拟和计算手段研究和预测化学现象和材料性质的方法。
以下列举几个计算化学方法的应用领域:1. 分子模拟分子模拟是利用计算机模拟分子的结构和动力学行为。
北京大学化学信息学第二讲期刊
“通报(Bulletin)”、“会刊(Proceedings)”、
“汇刊(Transactions)”、“评论(Reviews)”、进 展(Progress; Advances in…)等。
(2) 快报性刊物
专门刊载有关最新科研成果的短文, 预报将要发表的论文的摘要,其内容简洁、
核心期刊
核心期刊的概念
当前,“核心期刊”已成为我国图书情
报界、科学界的热门话题,所谓“核心期刊”
是根据英国著名文献计量学家S. C. Bradford 的分布定律(Bradford’s Law of Scattering)得 到的一个概念。1934年Bradford 提出:“对 于某一特定主题来说,有关它的学术论文大
化学文摘千种表 List of 1000 Journals Most Frequently Cited in Chemical Abstracts
其中有我国的期刊80多种
要能把西文刊名缩写还原成全称
现在西文期刊刊名的缩写已经标准化。如: Appl.-Applied J. -Journal Eng.-Engineering Phys.-Physics Int.- International Rev.-Review
期刊发展史
最早的期刊之一是Philosophical Transactions of the Royal Society(《皇家学会哲学汇刊》),创刊于1665 年,此刊直到现在还在出版。 经过300多年的发展,期刊的种类越来越多,著名 的Ulrichs International Periodicals Directory(《乌利希国 际期刊指南》)就收录200多个国家出版的期刊14万种 (还不包括中文、日文、阿拉伯文、印地文),其中科 技期刊占1/3。这些期刊每年发表原始报告学术论文约 400万篇。美国、德国、日本、法国、英国等都是世界 上出版期刊最多的国家,每年出版量在1万种以上。我 国1997年底共有登记在册的期刊7325种,其中科技类 4386种。
化学信息学课件
第一章化学信息概论一、化学信息学的产生和发展信息:实物的存在方式和运动状态的记录,它精确地描述物体或事件,并且可借助于一定的物质载体进行存储和传播。
化学学科的重要性化学信息量的快速增长化学信息学:是应用信息学方法解决化学问题的学科。
(化学信息学是信息科学与化学的交叉学科。
)(利用数学、统计学与计算机科学的理论、方法和网络技术作为手段,研究化学信息的获取、表示、管理、传播、分析、加工和应用,在此基础上进行知识创新,促进化学学科的发展。
)二、化学信息学的研究领域应用现代信息技术构建信息处理系统,处理长期积累的大量化学信息资源,帮助化学家组织、分析和理解已知的科学数据,正确地预测化学物质的性质,开发新化合物、材料和方法。
应用计算机科学方法或信息学解决化学问题,对化学信息进行有效的存储、操作和处理,使化学信息合理地提升为化学知识。
研究内容:化学、化工文献学;化学知识体系的计算机表示、管理与网络传输;化学图形学;化学信息的解析与处理;化学知识的计算机推演;化学教育与教学的现代技术与远程信息资源。
三、信息资源检索的意义与作用⏹• 启迪创新:科研工作具有继承和创新两重性,要求科研人员在探索未知进行创新之前,应该尽可能地继承和利用与之相关的信息。
⏹• 拓宽视野:21世纪信息与知识的积累日新月异,出现了大量的边缘科学和交叉科学。
面对知识频繁更新的世界,需要接受终身教育,在不断的教育中更新知识,适应环境的变化。
⏹• 培养能力:现代教育不单纯是知识的传授,更重要是要大力进行各种能力的培养,其中包括自学能力、思维能力、研究能力、表达能力、创新能力、终生教育能力、组织管理能力和收集处理信息的能力。
⏹• 提高素质:信息素质是信息社会中实现对知识的探索和发现的综合能力,它是进入信息社会赖以生存的通行证。
四、化学信息学的课程内容化学信息的产生和获取(重点)利用检索工具通过实验方法... …化学信息的表达、存储和管理化学运筹学数据整理可视化数据库管理技术... ...化学信息的加工和处理化学计量学化学软件目的是获取更多的信息化学信息的深化计算机模拟设计化学结构的可视化以图形的方式对化学信息进行描述1.2 电子信息和数据库一、电子信息指通过计算机等设备以数字信号传递的数字信息资源组成的数据库。
化学信息学
《化学信息学》课程教学大纲课程名称:化学信息学英文译名:Chemical Informatics课程编号:开课单位:生物工程学院预修课程:适用专业:化学工程与工艺、生物工程、制药工程开课学期:课内总学时:32学分:2 考核方式:考查一、教学目的与要求1.掌握Internet 的基本知识,服务功能。
着重掌握IE 浏览Internet来获得科学信息的方法。
掌握国际与国内一些典型的搜索引擎的使用方法与技术,并灵活运用以获得所需的科学信息。
2.掌握现代化学文献的基础知识、化学文献的检索系统和四大检索方法,即网络检索、光盘检索、联机检索和手工检索等。
牢固掌握计算机网络检索化学文献的方法与技术,特别是结合毕业论文的课题利用网络数据库查阅国内外有关的化学文献。
3.牢固掌握ChemWin、HyperChem和Origin等现代化学图文处理软件的使用技术,能灵活绘制各种类型的化学分子式、分子图、反应式、立体模型图、表面图、化学实验装置图、化学工艺流程图。
初步掌握一些基本的量子力学和量子化学计算方法,进行化学建模、分子设计、分子的电子结构及相关性质的计算等。
二、课程内容及学时分配第一章化学信息学与Internet(一) 化学信息的构成及化学信息学(二) 因特网(Internet)概述第二章化学化工网站与网上数据库(一) 通用信息检索引擎:yahoo,google,baidu(二) 重要的化学化工综合同站:,(三) 网上化学结构数据库、反应数据库和初性数据库:CambridgeSoft,PubMed(四) 网上化学化工分类信息与信息资源:第三章化学化工文献检索(一) 文献慨述(二) 美国<化学文摘)(印刷出版物)(三) CA索引和手工检索方法(四) CAS的电子出版物(五) CA on CD的使用方法(六) 美国科学信息研究所ISI和《科学引文索引》SCI简介(七) 其他文献数据库:Dialog,GenBank,EI,Elsevier第四章网上专利检索(一) 中国专利文摘数据库:(二) 美国专利数据库:,(三) 其他专利数据库与知识产权保护组织:IBM,PCM,IPDL第五章化学实验数据统计与谱分析(一) 实验数据的统计分布:实验误差,统计分布(二) 分布的数字特征计算:位置、散布、分布、相关特征参数(三) 化学分析的采样(四) 比较实验:总体标准差、均值比较(五) 回归分析:一元、多元回归,相关系数、显著性检验(六) 数据的最小二乘平滑处理:(七) 曲线拟合和谱峰分辨(八) 谱的微分与积分第六章科学数据处理与绘图工具软件Origin(一) Origin的窗口组成(二) 数据的输入、编辑和保存(三) 数据的统计处理:排序、求和、标准差、t检验、多元线性回归(四) 数据关系的图形表示:分布图、线图、点线图、直方图、扇形图(五) 谱与曲线的处理:曲线平滑、背景校正、基线、谱的微积分第七章化学中的多元分析方法.(一) 化学与多元分析:多元分析的问题与特征、主要方法、变量类型,数据预处理(二) 相关分析与变量分组:相关系数矩阵、复相关系数、偏相关系数矩阵(三) 降维、信息压缩与显示技术:主成分分析、非线性映射(四) 分类与判别:距离判别法、K-最临近法、线性判别法(五) 聚类分析(六) 因子分析:偏最小二乘(七) 其他的信息挖掘技术:最大熵、模拟退火、神经网络、遗传算法第八章化学结构的表示与可视化(一) 分子拓扑结构的矩阵表示与矩阵指数:邻接矩阵、距离矩阵、关联矩阵、环矩阵(二) 分子拓扑结构的线性标记方法:WLN(三) 有机分子结构式绘图软件ChemWindow(四) 分子几何结构的表示:坐标系、常见文件格式(五) 二维分子结构显示软件WebLab ViewPro第九章分子结构信息与分子设计(一) 分子及其聚集体的计算与模拟方法评述:量子力学、分子力学、分子动力学、随机模拟、蒙特卡罗(二) 定量构效关系方法:Free-Wilson、Hansch(三) 分子设计中的重要参数:Hammett、Taft、Es、VDW体积与半径、logP、连接性指数、MR、溶解度参数、量子化学参数(四) 分子计算与模拟软件举例:Sybyl、InsightII、Alchemy、Charmm(五) 分子建模与分析软件HyperChem功能简介(六) 分子与材料设计简介三、教材[1]缪强. 面向21世课程教材《化学信息学导论》,高等教育出版社,2001年7月四、教材与主要参考书[2]沈勇,张大经,郑康成编著.《现代化学信息基础教程》,广州:中山大学出院版社,2000年11月[3]吴功宜,吴英编著. 《Internet 基础》,北京:清华大学出版社,2000 年[4]林卓然编著.《计算机应用基础教程WINDOWS98版》,广州:中山大学出版社,2000 年[5]王源编著. 《现代化学文献检索》,上海:上海科学技术文献出版社,1999 年[6]杨均辉等. 《四大文献索引及联机检索》. 广州:中山大学出版社,1996 年[7]胡立江等编著. 《精通ChemDraw》,北京:清华大学出版社,2002年[8]俞庆森,朱龙观编著. 面向21世课程教材《分子设计导论》,高等教育出版社,2000年7月[9]赵文元,王亦军编著.《计算机在化学化工中的应用技术》,科学出版社2001年[10]邵学广,蔡文生编著.中国科学院研究生教学丛书《化学信息学》,科学出版社,2001年6月。
北京大学化学系课程表
催化化学 Catalysis Chemistry
1
任选
2.0
34.0
2.0
刘海超
本科(公费)
90
1-16
7-8
20120104
01034600
立体化学 Dynamic Stereo Chemistry
1
任选
2.0
30.0
2.0
李笑宇
本科(公费)
90
1-16
3-4
20111230
01034720
1
任选
2.0
30.0
2.0
吴 凯
本科(公费)
70
1-16
3-4
20111229
01130050
生物化学实验 Biochemistry Lab.
5
任选
2.5
85.0
5.0
胡晓倩
本科(公费)
20
1-16
5-9
00101460
线性代数 (B) Linear Algebra (B)
8
任选
4.0
68.0
4.0
21
专业必修
0.0
0.0
0.0
彭立中
本科(公费)
70
1-16
7-8
00130211
高等数学 (B) (一)习题课 Problem-solving on Higher Mathematics (B)
22
专业必修
0.0
0.0
0.0
彭立中
本科(公费)
70
1-16
7-8
00130211
高等数学 (B) (一)习题课 Problem-solving on Higher Mathematics (B)
北京大学化学信息学course-12
首先根据原子类型等信息进行初步划分 划分过程逐步细化(驰豫) 如果某个查询节点的可能匹配节点表为空,
则说明目标结构中没有查询的子结构
20
一些发表的算法时间表
Ray and Kirsch算法 (1957)
是否结构中不具备某种特征就可以认为是 相似?
H C
HC
CH
H2C
CH2 CH2
H2C
CH2
CH2
HC
CH
C H
CH2
CH2
H2C
CH2
CH2
40
简单匹配因子
考虑共同“缺乏特征”的相似性因子 (D)
相似性 = C + D N
= (6 + 17) / 32 = 0.719
N is 指纹长度
N=A+B–C+D
, (OR)
; (AND – 低优先级)
31
子结构查询语言-SMARTS
递归的使用SMARTS可以描述非常复杂 的结构模式
如一级或二级胺,而不是酰胺
nitrogen
3 conns
2attached 1attached hydrogens hydrogen
nitrogen connected to carbon with double bond to any atom
数据库中每个结构必须顺序比较 由于目标结构中不包括查询分子中的子结构,因此很
多目标分子肯定是不匹配的
筛选法可以用于提高数据库搜索的速度 使用分子指纹法
22
筛选法-Screening
步骤
计算查询结构的指纹位串
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
h
22
SMILE标记示例
C Methane C1CCCCC1 cyclohexane
O water
c1ccccc1 benzene
CC ethane
CO methanol
OC methanol
N[C@@H](C)C(=O)O
CCO ethanol
CC(=O)C O=C=O
acetone carbon dioxide
Sybyl Line Notation (SLN)(Tripos)
5
3
O
NH2
6
12 11
13
1
HO
CH
4
CH2
OH
89
ROSDAL
1O-2=3O,2-4-5N,4-6-7=-127,10-13O
SLN
OHC(=O)CH(NH2)CH2C[1]=CHCH =C(OH)CH=CH@1
WLN
QVYZ1R DQ
Ethene C=C Formaldehyde C=O Hydrogen Cyanide C#N Butadiene C=CC=C
h
25
分支 – 将支链放在括号中
branch : '(' <chain> ')' | '(' <chain> <branch> ')' | '(' <branch> <chain> ')' | '(' <chain> <branch>
h
10
h
11
Human Alcohol Dehydrogenase (Adh1A)
分类: Oxidoreductase
简介: Molecule: Class I Alcohol Dehydrogenase 1, Subunit; Chain: A, B; Engineered: Yes
实验方法 : X-ray Diffraction
h
37
ClogP的计算使用片断加和法 =(片断值+校正项) 片断值基于实验值,与片断的类型有关,如:极性基团、 卤素、离子、不饱和键 校正项描述不同片断间的相互作用,如:氢键等
h
38
/
h
39
/
h
40
分子结构信息的计算机存储和表达
大写的字母表示非芳香体系
示例:
Cl
Hydrochloric acid
S
H2S
[Fe++] Iron(II)cation
h
24
Bond - 语法
bond : <empty> | '-' | '=' | '#' | ‘.‘ ;
single | double | triple | disconnection
示例
h
44
benzene
WLViewer 3D
0
12 12 0 0 0 0 0 0 0 0 0
1.1202 0.0003 0.0002 C 0 0 0 0 0 0
1.8030 1.1835 -0.0005 C 0 0 0 0 0 0
3.1691 1.1839 -0.0004 C 0 0 0 0 0 0
Nicholas J. Hrib, Norton P. Peet "Chemoinformatics: are we exploiting these new science?“
Drug Discovery Today 5 (11): 483-485, Nov. 2000
h
9
名词解释 - Cheminformatics
Wiswesser Line Notation (WLN) (Dialog)
Simplified Molecular Input Line System (SMILES/SMARTS) – (Daylight)
Representation of Structure Diagram Arranged Linearly (ROSDAL) - (Beilstein)
键型(芳香环)
立体化学构型 电荷 同位素
3D-coordinates for atoms
OH
CH2 O H2N C H
OH
h
17
分子结构信息表达的内容
原子 原子间的连接
键型(芳香环)
立体化学构型 电荷 同位素
3D-coordinates for atoms
OH
CH2 O
+
H3N C H O
21
11
32
41
22
21
51
61
41
41
71
61
8 2 12 1
72
91
8 1 10 2
9 2 11 1 13 1
10 1 12 2
11 2
71
10 1
h
43
MDL Connection Table
数据交换的事实标准 衍生文件格式
Molfile (single molecule) SDfile (set of molecules and data) RGfile (Markush structure) Rxnfile (single reaction) RDfile (set of reactions with data)
L-alanine
h
23
Atoms – 语法
atom : '[' <mass> symbol <chiral> <hcount> <sign<charge>> ']‘
双字母原子符号: Br (Upper/lower case) 原子的预定义价键:
B(3), C(4), N(3,5), O(2), P(3,5), S(2,4,6), F(1), Cl(1), Br(1), I(1)
化学信息学: …结合化学合成、生物筛选及数据挖掘技术
指导药物发现和开发,… 用于合理的设计具有 类药性质的化合物,…构建用于虚拟高通量筛选 的智能化合物库,…研究以往的数据知道先导化 合物的优化
Cheminformatics: Intelligent Drug Discovery
May 28- 30, 2003 Philadelphia PA
h
28
双键构型的表示 - ‘/’ ‘\’
F/C=C/F
F/C=C\F
h
29
手性表示 - @ or @@
从旋光中心沿字符串顺序观察, 逆时针为@,顺时针为@@
N[C@](C)(F)C(=O)O
h
30
氢原子表示
显式表示氢原子的四种情况: 1. 带电荷的氢, 如:质子 [H+] 2. 与其它氢相连的氢, 如:氢气 [H][H] 3. 氢桥 4. 同位素,如:重水, [2H]O[2H]
h
18
分子结构信息表达的内容
原子 原子间的连接
键型(芳香环)
立体化学构型 电荷 同位素
3D-coordinates for atoms
OH
CH2 O H 2N 14 C H
OH
h
19
h
20
分子结构一维表示法 (Line Notation)
简介:
使用字符串表示分子结构
现有的几种表示法
3D-coordinates for atoms
OH
CH2 O H2N C H
OH
h
15
分子结构信息表达的内容
原子 原子间的连接
键型
立体化学构型 电荷 同位素
3D-coordinates for atoms
OH
CH2 O H2N C H
OH
h
16
分子结构信息表达的内容
原子 原子间的连接
h
31
芳香性
N1ccccc1 N1=CC=CC=C1
C1cc2cccccc2c1 C1=CC2=CC=CC=CC2=C1
h
32
一些例子
[O-][n+]1ccccc1 pyridine-N-oxide
O[C@H]1CCCC[C@H]1O cis-resorcinol
CC(C)NCC(O)COc1cccc2ccccc12 Propranolol – a beta-blocker
分子结构二维表示法
连接表 (Connection Table) 邻接矩阵 (Adjacency Table)
h
41
连接表 (Connection Table)
简介:计算机系统中主流结构表示方法 类型
“内部” CTs (内存)
程序处理
“外部” CTs (磁盘文件)
文件存储 数据交换
3.8522 0.0006 -0.0007 C 0 0 0 0 0 0
<chain> ')'
SMILES: CCCC(C(=O)O)CCC
h
26
环定义 - 合环键用数字标出
h
27
其它定义
• 非连接关系 (disconnections):
• 同位素表示:
SMILES: [Na+].[O-]c1ccccc1
specified inside brackets. SMILES: [13CH4]
h
4
相关名词辨析
/content/c hemoinformatics_gloss.asp
h