使用ChemDraw与ChemFinder创建组合化学库
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
使用ChemDraw与ChemFinder创建组合化学库
作者: Jesse Gordon
公司:CambridgeSoft Corporation
期刊号:20.4
CHEMDRAW与CHEMFINDER的COMBINING FUNCTIONALITY功能可以创建组合化学库并可对其中每种物质的性质做出初步预测,这篇文章将介绍以下内容:
1.在ChemDraw中展开化学结构的通式(generic structure)
2.将展开的结构式以SDF格式导出
3.将SDF导入到ChemFinder中作为本地化学数据库
4.使用ChemFinder为每个结构式计算化学性质和名称
5.创建含有更多组合元素的化学结构通式
6.将新创建的SDF导入到ChemDraw/Excel中
7.使用ChemDraw/Excel为每个结构式计算化学性质和名称
这篇文章使用ChemDraw/Excel的工作环境为Microsoft Excel 2003,Windows XP系统;您当然也可以在Microsoft Excel 2007以及Windows7系统中使用此功能。
这里我们选用ChemBioDraw Ultra 12及ChemBioFinder Ultra12对数据进行处理。
但ChemDraw Ultra与Pro版本也提供上文所述的“展开结构通式(Expand Generic Structure)”功能,要注意的是ChemDraw Std没有此功能。
还需注意ChemDraw/Excel功能也有限制,如ChemDraw Ultra有此功能,但ChemDraw Pro没有此功能。
详细的功能说明,请参阅用户手册。
1.在ChemDraw中展开化学结构的通式
让我们从一个简单的化学结构通式开始,如下图所示,可以展开成12个结构式
未展开的结构通式
我们的目标是用展开的12个结构创建一个化学数据库,预测他们的沸点及熔点并进行对比。
我们还将为这12个结构命名。
首先我们使用ChemDraw的“Expand Generic Structure”功能,可以将上图的通式展开为下图所示的12个结构式:
展开的结构通式
在ChemDraw中,可以为每个结构式计算熔点,沸点并为其分配一个系统名,但只能对每个结构式逐个执行这些操作。
而我们的目的是将上述步骤一次性完成。
2. 将展开的结构式以SDF格式导出
ChemDraw可以将多个结构式以化学结构的标准格式SDF格式导出。
导出的SDF文件可以导入到ChemFinder或ChemDraw/Excel中。
导出SDF格式文件的方法是通过ChemDraw的“Save As”功能,用这个功能还可以将结构式转换成SKC,Mol等多种其他格式保存。
SDF文件可以使用记事本查看,如下图所示。
展开的结构式在SDF文件保存的形式
3. 将SDF导入到ChemFinder中作为本地化学数据库
现在,我们用ChemFinder以数据库的形式打开SDF文件来查看结构式。
步骤如下:
•打开ChemFinder,选择Blank Form单击OK
•单击菜单栏File > Import > SDFile选择刚才导出的SDF文件"Expanded_12.sdf"
•出现Data Import对话框,单击Import
•ChemFinder默认界面如下图所示
将SDF文件导入到ChemFinder中
SDF文件打开后,ChemFinder界面显示的是12个结构中的第一个结构苯酚,如上图所示。
接下来我们将为这些结构式添加化学性质,这一功能只在ChemFinder Ultra版提供。
4. 使用ChemFinder为每个结构式预测性质和命名
ChemFinder的“Property Populator”功能可以为数据库中所有物质一次性计算出相关化学性质,步骤如下:
•在Form View窗口(即上图的右侧窗口)的空白区域右击
•在出现的菜单中选择“Calculate Properties”。
•在出现的对话框中选中性质(Property)一列中的“Boiling Point” ,“Freezing”,“Melting Point”
及“Chemical Name”
•选中对话框上半部分的两个复选框(如图所示)
•单击“Populate”将所选择的化学性质添加到数据库中
ChemFinder的Property Populator窗口
现在我们就在ChemFinder下建立了一个组合化学库。
以Data Table查看数据库(菜单栏View > Data Table > 选择任意一个选项即可),就会出现如下图的界面。
可以发现原本在ChemDraw中以俗名表示的结构,在ChemFinder中则以实际的结构式显示在数据库中。
但在ChemDraw/Excel中仍以原来的俗名显示。
为所有结构式添加的化学性质及名称
本文所使用的数据库和SDF文件可以从章结尾提供的链接下载得到。
文章中使用的数据库名字为“Expanded_12.mdb”,以ChemFinder格式保存的数据库名字为“Expanded_12.cfx”。
5. 创建含有更多组合元素的化学结构通式
现在让我们按上述方法来对对含有组合元素更多的结构通式进行操作。
下图的结构通式与上述的通式相比多了三个新的部分:
•在原来链接12个取代基的位置多增加了一个H原子(现在有13种取代基)
•向苯环的其他5个炭原子上添加了“可变结合点(variable attachment)” 。
ChemDraw认为这5个点代表三种不同取代位,这相当于增加了3个组合元素。
•四种卤素添加到可变结合点上
•当含有13个可变元素的取代基位置为H时,4种卤素只产生4种不同物质,而不是12种,因此此结构通式可以代表(13 x 3 x 4) - 8 = 148个结构。
代表148个结构式的结构通式
展开的148个结构式可以从文章结尾提供的链接下载得到,保存在名为“ Expanded_148.cdx”的文件中,相应的SDF文件保存在“Expanded_148.sdf”中。
6.将含148个结构的SDF文件导入到ChemDraw/Excel中
现在让我们将Expanded_148.sdf文件导入到ChemDraw/Excel中。
步骤如下:
•单击Excel主菜单栏上的ChemOffice12 > New ChemOffice Worksheet创建化学智能工作表•如果菜单栏上没有ChemOffice12菜单,您需要通过“Add-in”来添加插件。
这一方法在我们发布过的教程介绍过,请到以下链接查看详细方法:
/articles/static/712Chinese.html •单击菜单栏ChemOffice12 > Import/Export > Import Table来导入SDF文件。
•选择“Expanded_148.sdf”,此时Excel会用一些时间来完成导入工作。
7. 使用ChemDraw/Excel为每个结构式计算化学性质和名称
ChemDraw/Excel的计算化学名称和性质的函数的使用方法与其它Excel函数使用方法无二。
ChemOffice 12 插件增加了一系列化学功能的函数,按照下面的方法,我们为B,C,D三列添加名称并为其设置函数。
•B列,首行添加“Name”,在fx添加公式“=CFW_CHEMICAL_NAME(A2)”
•C列,首行添加“BP”,在fx添加公式“=CHEMPROPPRO_BOILING_POINT(A2) ”
•D列,首行添加“MP” ,在fx添加公式“=CHEMPROP_FREEZING(A2) ”
上面的几个Excel函数是与ChemFinder达到相同功能的函数。
在Excel中,我们给每列首行定义相应的函数,其余的结构式的相关化学性质只需通过鼠标拖拽即可。
最终的表格如下图所示。
ChemDraw/Excel显示的化学数据库
总结
ChemDraw的“Expand Generic Structure”可以与SDF的导入/导出功能结合使用来创建可在ChemFinder和ChemDraw/Excel下使用的组合化学库。
这个方法对含500个组合元素以下的结构通式都适用。
多个结构通式也可以用ChemDraw导出并与ChemFinder或ChemDraw/Excel已有的数据进行合并。
CombiChem功能可以处理含500个以上结构式的数据库。
更多关于ChemFinder的详细内容及相关视频教程请到查看和下载。
以下提供的ZIP文件包含文章中提到的几个文件:
•ChemDraw中展开和未展开的结构式,以CDX格式保存。
•以ChemFinder和SDF格式保存的12个展开的结构式。
•以Excel格式和SDF格式保存的148展开的结构式。
化学搜索及在ChemDraw/Excel导出SD文件
嵌入在Excel的ChemDraw插件使得创建可编辑化学式的电子表格成为可能
作者: Jesse Gordon
公司:CambridgeSoft Corporation
嵌入在Excel的ChemDraw插件使得创建可编辑化学式的电子表格成为可能。
但事先必须以正确的方式创建表格,才能实现化学搜索或导出SD文件的功能。
特别是将“Structure”作为栏标题是实现两种功能的关键。
这篇文章介绍了如何使用这两种功能。
•创建ChemDraw/Excel
•以SD文件导出
•在Excel中进行化学搜索
这篇文章使用的例子可以在英文版页面底端下载,这样您就可以亲自尝试这一功能。
截图中使用的是2003版的Microsoft Excel,但文章中也会说明在Microsoft Excel 2007 如何使用这一功能。
下载文件中的CDX 文件是使用ChemBioDraw Ultra 12.0版本创建的,但同样适用于早期版本或是非Ultra的版本(Pro或Std)。
下文将更详细的说明ChemDraw/Excel中的功能。
创建ChemDraw/Excel
ChemDraw可以作为Excel的插件使用,但使用这个功能前需要进行设置。
同样的,如果想要导出SD文件或搜索化学结构式也需要设置。
设置的步骤如下:
•无论您安装哪种版本的ChemDraw,Excel主菜单中会出现“ChemOffice11”的菜单选项(“ChemOffice11”显示的是您目前安装的版本,这里我们使用“ChemOffice11”作为例子),如果主菜单上没有出现这一选项,请按照如下步骤进行设置:
•在Excel 2003版本中激活ChemDraw插件,选择菜单栏中的Tool>Templates and Add Ins之后添加对话框中的ChemOffice或ChemDraw选项。
“ChemOffice11”出现在主菜单的选项中。
•创建ChemDraw/Excel,选择主菜单中的ChemOffice11>New ChemOffic Worksheet(当然您仍然可以使用菜单栏的File>New来创建一般的工作表)
这一插件的激活在Excel 2007版中有所变化,下面我们也会用截图的方式详细说明在07版本中激活这一插件的方法。
图 1. 在Excel2007中安装插件
1.单击Excel 2007窗口左上角的“Microsoft Office Button”;在出现的菜单栏底端选择“Excel Options”选项。
然后单击窗口左侧的“Add-Ins”(图1)。
2.在“Add-Ins”对话框中,如图1所示选中“ChemDrawExcelAddIn”,“ChemDrawExcel12”或者“ChemDrawExcel12 Functions”中任意一个。
3.在“Manage”中选择“Excel Add-ins”然后单击“Go”。
4.如图2所示,在出现的对话框中将“Chemdrawexcel12”和“ChemDrawExcel12 Functions”两个选项选中。
5.ChemDraw的功能出现在ChemDraw12菜单下。
图 2. Excel的Add-in对话框
在ChemOffice12菜单下可以看到“ChemDraw功能函数”的列表,如下图所示这些功能被分类显示,如果想看全部功能,可以到主菜单中选择Insert > Function,然后选中“ChemDraw Functions”。
Excel中ChemDraw的功能函数
ChemDraw/Excel可以根据化学物质的系统名或惯用名生成器化学结构式。
一般来说,比起创建一个新的ChemDraw/Excel,常用的方式是转换一个已存在的表格。
这一功能只在有“Name=Struct”功能的版本中才能实现。
有此功能的版本有ChemDraw Ultra, ChemBioDraw Ultra, ChemBioViz Ultra, ChemOffice Ultra及ChemBioOffice Ultra。
要转换已存在的表格:
1.选择一个一般的Excel工作表,选择菜单栏中的ChemOffice11 > Convert Worksheet。
【注意】转换功能并不改变工作表的名称,所以可以根据需要手动修改表格名称。
【注意】“Name=Struct”功能是在原位置转换化学结构式,因此如果您想保留原有的名称,请将名称复制到新一栏中进行转换。
2.选中分子的名称,然后在菜单上选择ChemOffice11>Convert>Name to Molecule选项。
如果有的名称不能被转换成化学式,会出现一个对话框提示我们转换失败。
一般来说这是由于分子名称输入错误引起的。
【注意】通过“Name=Struct”功能转换结构式时,为了避免转换时间过长,默认条件下转换后的分子式并不显示。
因此转换后好像什么都没有发生。
下一步会介绍如何显示分子结构。
3.想显示分子结构,选择主菜单上ChemOffice11 > Picture > Show选项,分子的结构式就被显示出来,如图3所示:
图 3. 将一般的Excel转换成ChemDraw/Excel
ChemDraw/Excel支持导入SD文件。
SD文件可以从ChemBioFinder中的数据库创建或从您单机版的ChemFinder/Office的数据创建,也可以通过搜索在线数据库导出。
在下面的例子中,我们用ChemACX的output功能将在数据库搜索的“vitamin”的结果导成SD文件:
•用上面所述方法创建一个ChemDraw/Excel。
•导入SDF数据:在主菜单中选择ChemOffice11 > Import / Export > Import Table。
在这个例子中,我们导入名称为Vitamins_from_ChemACX.sdf的SD文件。
•我们导出了所有能够从ChemACX数据库获得的信息,如最后3列分别是产品名称(product names),供应商名称(supplier names)以及包装信息(packaging information)。
•如果想显示“Structure”栏中的分子结构式,可以选择菜单上的ChemOffice11 > Picture > Show选项,分子式就如图4被显示出来。
图 4. 向Excel中导入SD文件
•【注意】这些结构从SD文件导入时并未附带其名称,只是以“Structure15”(图4)这样的序列名称显示,您可以在Excel表格中为其添加名称。
ChemBioFinder也可以与ChemDraw/Excel配合使用。
毫无疑问您可以按照上面所述方法将数据以SDF 格式从ChemBioFinder中导出,不过您也可以直接将ChemBioFinder导入到ChemDraw/Excel表中:
•在ChemBioFinder打开文件。
在这里我们使用“steroids.cfx”作为例子,这个文件需要“steroids.mdb”数据库作为支持。
此数据是从ChemACX导入到ChemBioFinder中的(这里用到的CFX文件和MDB文件可以在英文版页面下载)。
•选择菜单栏上的File > Export > To ChemDraw for Excel(文件将以Excel的格式打开)。
•有的版本默认的是隐藏结构式,您可以在Excel表中选择ChemOffice11 > Picture > Show来显示他们。
如图5所示:
图 5. 从ChemBioFinder直接导入到ChemDraw/Excel
•【注意】从ChemBioFinder导入到ChemDraw/Excel 的数据,分子原有的名称是随结构式一同导入到“结构”一栏中的,而从SD文件导入的数据则不能显示分子原有的名称。
我们已经知道了如何将数据导入到ChemDraw/Excel中,现在我们来看看如何从ChemDraw/Excel导出SD文件。
导出的文件可以在ChemBioFinder或识别SD文件的其他程序中使用。
导出SD文件
ChemDraw/Excel可以直接导出SD文件。
但有几个需要注意的问题。
具体见下:
•请确保显示化学结构式的一列以“Structure”作为标题。
如果不是,Chemoffice>Improt/Export>Export table选项就不会被激活(呈灰色)。
结构列中的第一个单元不能为空,否则“Export table选项”也不会激活。
•选择结构列(Structure一列),单击Chemoffice>Improt/Export>Export table,选择一个输出名字,这里我们命名为Lipid_One_Column.sdf 。
•导出的SD文件可以在ChemBioFinder, ChemDraw/Excel或其它CambridgeSoft 程序中打开,用ChemDraw打开导出的SD文件如图6所示:
图 6. 在ChemDraw中打开从Excel的“Structure”列导出的SD文件
•您也可以将多列数据导出到SD文件中。
然而在ChemDraw/Excel 11.0 版本中,您不能使用“全选(Select All)”功能来选择全部数据(12.0中可以),不过您可以手动选择全部数据导出到SD文件。
•“Lipid_Five_Column.sdf”是从原文件中将全部数据导出的SD文件,手动选择全部数据(Structure列为第一列),按照上面的步骤选择菜单栏的ChemOffice11 > Import / Export > Export Table 将文件导出。
•上一步导出的SD文件可以用ChemBioFinder打开。
打开ChemBioFinder程序,选择菜单栏的File > New > Blank form,然后选择File > Import > SDfile,选中“Lipid_Five_Column.sdf.”文件,我们可以看到如图7所示的数据。
图7. 在ChemBioFinder打开从Excel导出的SD文件
【注意】“MolFileName”作为SD文件的一部分在导入过程中自动添加到文件当中;但这个名称并不是来源于原Excel中的数据。
上图中右侧四个非结构栏中的数据则是由Excel导入的。
因此,ChemDraw/Excel可以只导出结构数据也可以连同结构数据导出与之相关的其它数据。
而导出的SD 文件可以被ChemBioFinder,ChemBioDraw和其他CambridgeSoft系列软件打开,也可以被支持SDF格式的其它程序使用。
Excel中的化学搜索
在ChemDraw/Excel中搜索化学结构与SD文件的导出有着相似的规则。
您只能在名为“Structure”的一列中搜索。
这部分内容将说明在名为“Lipid_Nomenclature.xls”的Excel工作表中如何实现化学搜索。
•请确认结构列的列标题是“Structure”,否则search菜单将不会激活(呈灰色)。
•选择结构列(在ChemDraw/Excel 11.0中,必须将“Structure”的标题栏也选中,同时还要选择至少一个结构式)。
您可以选择一整列也可以选择这一列的一部分。
在这里我们选择一整列。
•基本的搜索可以通过ChemOffice11 > Search > Normal Search 选项来完成。
打开Normal Search对话框,如图8所示,目前我们采用的是默认的设置(Substructures/Include hits)。
在绘图区(Structure Query)绘制苯环(也可以在ChemDraw绘制之后粘贴到搜索对话框中)然后单击“Search”。
图8. ChemDraw/Excel 的“Normal search”
搜索的结果如下图(图9)所示:
•【注意】下图(图9)左边的序号并非连续的,序号反映的是搜索出的分子在数据库中的序列。
此外在标题行每个标题的右侧出现了一个小箭头,单击小箭头将允许我们对搜索结果分类查看。
•【注意】在显示搜索结果时,多出了名为“MATCH”的一列,单击其右侧的小箭头,可允许我们查看符合搜索条件的分子(TURE)和不符合搜索条件的分子(FALSE)。
图9. ChemDraw/Excel中的搜索结果
•如果不需要将搜索结果单独列出,则在菜单栏选择ChemOffice11 > Search > Clear Searches选项。
以上进行的搜索,是按照默认设置来搜索的。
在最后一部分中,我们将介绍其他的搜索设置。
虽然在ChemDraw/Excel中的搜索跟ChemBioFinder 或其他CambridgeSoft的系列软件不尽相同,但搜索的概念是一致的。
而且搜索用的绘制方法是相同的(都使用ChemDraw)。
因此详细的化学搜索技巧请参看英文版底部的视频链接。
•默认的“Normal Search”的搜索方式是亚结构(Substructures)搜索,另一种搜索方式是全结构(Full structure)搜索,如果上面的例子按这种搜索方式,只有在数据库中有苯的时候才能搜索出来。
全结构搜索在搜索可变结构或Markush结构时可能会得到多个结果。
•默认的筛选模式是“Include hits”,这表示显示符合搜索条件的分子(即在“MATCH”列中值为“TRUE”的结果)。
另一个筛选类型是“Exclude hits”,表示显示不符合搜索条件的分子(即“MATCH”列中值为“FALSE”的结果)。
•除“Normal Search”外,ChemDraw/Excel也可以通过Tanimoto算法进行相似搜索,搜索的方法与“Normal Search”相似,不同的是您需要设置相似度(similarity percent)。
(默认的相似度的值是“大于90%”。
)
•ChemDraw/Excel 的SDF导入与导出功能,以及其化学搜索功能使得ChemDraw/Excel可以作为化学数据管理工具使用。
它即可以作为独立的信息库(如:将Excel作为化学资料库来使用),也可以与ChemBioFinder 数据库或其他数据库结合使用。