化学信息学试题
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图 19
图 20
点击
,打开计算窗口。
7
废话不多,不花哨,只要实用
图 21 有些名字和之前计算的有点重复,但数值不同,都要记录,而且个人经历来看,这里计
算的更准一些。分别选中
七个,然后点
,计算出来结果
,这里只能手工输入到
Excel 中。谁叫这软件比较落后呢。 接下来就是无尽的重复,算出每一个化合物的这些数据。接下来就是 SPSS 建模,同时
以剩下的化合物建立模型 得到如此的方程
图 27
图 28 然后将刚刚删除的那个化合物中的三个自变量的数据带入这个新的方程中,得到一个验 证 PIC50,就是说利用余下化合建立的方程,来预测被删去那个方程的 PIC50.这样就叫留一 法。请记录预测的 PIC50。相信大家对 EXCEL 都比较熟,随便编个公式很快就能搞定。接下 来就是重复,把所有化合都验证一边,恢复第一个化合物的数据,删除第二个,再建模,如 此重复。 最后将得到所有的预测 PIC50. 接下来请按照公式计算 Q 方。见课件第六章中有计算的公式,这里也列出来。
图 17 这是高斯输出文件,在其中要找到
6
废话不多,不花哨,只要实用
图 18 其中带-号的,倒数第一倒数第二个是最高占有轨道 HOMO,次级 HOMO。 带正号第一个和第二个是最低占有轨道 LOMO,次级 LOMO。 这些数据记录完了,高斯就算完了。 4. hyperchem 描述子计算,这个步骤比较简单。打开 Hyperchem 程序,OPEN 前面叫 保存的.mol 文件。
图2 2. 导入 Chem3D,方法有很多,可以是 CTRL+C,CTRL+V 进去,也可以在窗口间直接拖
进去。推荐 CTRL+C,CTRL+V 的方法。
图3 优化结构
图4
1
废话不多,不花哨,只要实用
点击图四中的 MM2
降低能量,得到最低能量结构。
转动可转动化学键,先选中可以转动的,一般只选中可变换取代基与主基团相连的
那个键。如图 5
图6 点击然后转动之后,选择最低能量位置。
图7 再次 MM2,得到最低能量,有几个可转动的键就转懂多少次。每个键都转一次, 找到这样的最低构象。然后是分子动力学,同样是为了优化分子结构。为图 4 中的
接下来电脑会计算一万步,时间约两三分钟,看个人电脑的性能咯。算完之后,再
次ຫໍສະໝຸດ Baidu
,优化结构,注意,这两个按键不是同一个。
图 13
4
废话不多,不花哨,只要实用
选择 PM3 方法。
图 14
图 15 全选描述子。 计算之后会得到一个 TXT 文档弹出,这个文档中存储了所有计算的数据,但由于查 找不便,于是在 Chem3D 窗口中就有显示。 分别是电荷描述子,这取决于你的取代基的数量,主结构上被取代位置的原子的电
荷就叫电荷描述子。这个就不解释了,相信大家都明白的。如图 16
9
废话不多,不花哨,只要实用
图 25 如图,这是我建立好的模型之一,而这个是符合要求的,有三个变量的。这就是我要的 方程了。
自变量为
,常量为
,
图 26 接下来是留一法交叉验证。 请注意,这一步其实是对第一步的重复。以 PIC50 为因变量,又上一步建立的模型中的 三个自变量作为自变量,方法选择为进入。其余不变,建立模型。具体步骤如下 首先删除第一个化合物的所有数据
图 11 然后是 Save CHEM3D 文件,保存成 CHEM3D 的格式,然而 Hyperchem 需要一个.mol 后缀的文件,这里不解释,就这样做了,后面自然会明白的。于是有 Save as 选择 文件类型,保存成.mol 格式。建议用专门的文件夹区分。如图 12。
图 12 .mol 放在 hyperchem 中,Chem3D 就放在 Chem3D 中。ChemDraw 所画图形也应分 别保存。 3. 高斯计算。 所谓的专业名称我不太清楚,总而言之,我就要里面的数据。同样在 Chem3D 中操 作如图 13。
图 29 算出 PIC50,这就是对这个化合物的要预测的东西,然后就可以在文章中吹一下,我的 方程如何如何,预测性还是不错的。 五、总结
这就是基本流程了,有点简单,不过迫于时间紧张,我也只能写到这个程度了。 希望对大家有所帮助。 另外,在 SPSS 处理过程中还有一些剔除异常值的方法,本人没遇到,就不罗列了。 一般这样就算可以了。如有人有兴趣,请查阅课件第五章。 附件附上本人本次作业的论文。
预测化合物,写文章。 附件附上本人的数据记录文件。
四、数据处理 首先在 EXCEL 中处理好数据,计算出 HOMO-LOMO,这也是一个描述子,有些文献只提
供了 IC50 值,要计算出 PIC50,就是负对数。 一切准备就绪后,请在 SPSS 中打开 EXCEL 表格。
然后就是线性回归了
图 22
8
废话不多,不花哨,只要实用
线性回归设置
图 23
图 24 图中请将 PIC50 或者 IC50 作为因变量,而其余描述子,全部作为自变量来进行回归, 注意:IC50,PIC50 不能作为自变量。就是要在这些描述子中与 PIC50 或者 IC50 建立关系模 型,然后就可以利用这个方程来预测化合物了。而老师规定了方程是三元线性一次方程。因 此在建好的模型中要选择。
废话不多,不花哨,只要实用
化学信息学作业基本流程
首先声明,本文只是一个标准流程,如果大家有什么特殊的方法请忽略本文。下面我将 以使用的软件主线,进行介绍。
一、所需数据 要算的数据很多,文献中的 IC50,PIC50。CHEM3D 中的 17 个描述子,高斯中的 3 个描 述子和 N 个电荷描述子,Hyperchem 中的 7 个描述子等数据。 二、计算准备 先将所有需要计算的数据在 Excel 中列一个表格,如图 1
优化完毕后,就是计算 Chem3D 中的描述子,接下来的动作主要以图为主。如图 8
2
废话不多,不花哨,只要实用
图8 黄色背景的是要点击的,然后进入图 9 窗口。选择要计算的描述子。
图9 点击 OK,开始计算。 得到的结果显示在图 10 窗口中
图 10
3
废话不多,不花哨,只要实用
这些就是刚才选择的要计算的描述子,所有数据 CTRL+C,CTRL+V 到 EXCEL 表中, 如图 11 所示。
然后把方法改为“逐步”。选项中 暂时不改变这两个数字,如不改变就可以建立好的模型,那自然最好,在这样的情况下 建立不好,那么就请将数字改小,一般改到进入 2,删除 1.5 为最低,不行的话,就请剔除 异常数据,然后再重来建模,试试。如果实在不行,你就再降低点,老师说不看效果如何, 就看过程,只要弄出来就可以。 于是就点确定。 无奈,本人运气确实不错,不用改数值就 OK,于是得到模型
5
废话不多,不花哨,只要实用
图 16 在表格中找到与你分子中对应原子的电荷(下面有个滑动条,拖到最右边就可看到), 弄到 EXCEL 中。 接下来是记录高斯计算出来的三个描述子
图 17 弄到 EXCEL 中。 然后是高斯计算输出的 TXT 文件的处理,此文件也应保存,保存在相应的 GS 文件 夹下。
11
图1 将所有软件安装好,这里就不再赘述,重点是过程。 三、计算过程 本过程是经过本人近 30 次计算得到的最佳流程,配合自己 Excel 的排列顺序,可以很快 速的计算完成,在这过程中,快速利用 ALT+TAB,CTRL+C,CTRL+V,EXCEL 中的 TAB 快 捷键将能大大加快速度。好了废话不多说,下面是一个化合物的计算过程,每个都是一 个样。 1. ChemDraw 绘制结构。如图 2
验证得得到 Q 方。其中 Y 就是 PIC50。据老师所说,0.5 以上就有较好的预测性,0.7 以
10
废话不多,不花哨,只要实用
上就可以发文章,大家看看自己有多少吧,开心一下,本班最高 0.9 多,最低也有 0.2 多的。 四、预测化合物 根据你所有选择的化合物,来画一个新的化合物,可以是取代基不同,取代位置不同, 但是请注意,取代基你可以不同,但取代位置最好是你所选择的一系列化合物中取代基 的位置。这样才能预测更准。 然后就是画图,计算描述子,这里的描述子只用计算你建模得到的方程中那三个自变量 所代表的描述子。比之前要简单得多。 得到描述子之后,就带入你所得到的那个总方程。
图 20
点击
,打开计算窗口。
7
废话不多,不花哨,只要实用
图 21 有些名字和之前计算的有点重复,但数值不同,都要记录,而且个人经历来看,这里计
算的更准一些。分别选中
七个,然后点
,计算出来结果
,这里只能手工输入到
Excel 中。谁叫这软件比较落后呢。 接下来就是无尽的重复,算出每一个化合物的这些数据。接下来就是 SPSS 建模,同时
以剩下的化合物建立模型 得到如此的方程
图 27
图 28 然后将刚刚删除的那个化合物中的三个自变量的数据带入这个新的方程中,得到一个验 证 PIC50,就是说利用余下化合建立的方程,来预测被删去那个方程的 PIC50.这样就叫留一 法。请记录预测的 PIC50。相信大家对 EXCEL 都比较熟,随便编个公式很快就能搞定。接下 来就是重复,把所有化合都验证一边,恢复第一个化合物的数据,删除第二个,再建模,如 此重复。 最后将得到所有的预测 PIC50. 接下来请按照公式计算 Q 方。见课件第六章中有计算的公式,这里也列出来。
图 17 这是高斯输出文件,在其中要找到
6
废话不多,不花哨,只要实用
图 18 其中带-号的,倒数第一倒数第二个是最高占有轨道 HOMO,次级 HOMO。 带正号第一个和第二个是最低占有轨道 LOMO,次级 LOMO。 这些数据记录完了,高斯就算完了。 4. hyperchem 描述子计算,这个步骤比较简单。打开 Hyperchem 程序,OPEN 前面叫 保存的.mol 文件。
图2 2. 导入 Chem3D,方法有很多,可以是 CTRL+C,CTRL+V 进去,也可以在窗口间直接拖
进去。推荐 CTRL+C,CTRL+V 的方法。
图3 优化结构
图4
1
废话不多,不花哨,只要实用
点击图四中的 MM2
降低能量,得到最低能量结构。
转动可转动化学键,先选中可以转动的,一般只选中可变换取代基与主基团相连的
那个键。如图 5
图6 点击然后转动之后,选择最低能量位置。
图7 再次 MM2,得到最低能量,有几个可转动的键就转懂多少次。每个键都转一次, 找到这样的最低构象。然后是分子动力学,同样是为了优化分子结构。为图 4 中的
接下来电脑会计算一万步,时间约两三分钟,看个人电脑的性能咯。算完之后,再
次ຫໍສະໝຸດ Baidu
,优化结构,注意,这两个按键不是同一个。
图 13
4
废话不多,不花哨,只要实用
选择 PM3 方法。
图 14
图 15 全选描述子。 计算之后会得到一个 TXT 文档弹出,这个文档中存储了所有计算的数据,但由于查 找不便,于是在 Chem3D 窗口中就有显示。 分别是电荷描述子,这取决于你的取代基的数量,主结构上被取代位置的原子的电
荷就叫电荷描述子。这个就不解释了,相信大家都明白的。如图 16
9
废话不多,不花哨,只要实用
图 25 如图,这是我建立好的模型之一,而这个是符合要求的,有三个变量的。这就是我要的 方程了。
自变量为
,常量为
,
图 26 接下来是留一法交叉验证。 请注意,这一步其实是对第一步的重复。以 PIC50 为因变量,又上一步建立的模型中的 三个自变量作为自变量,方法选择为进入。其余不变,建立模型。具体步骤如下 首先删除第一个化合物的所有数据
图 11 然后是 Save CHEM3D 文件,保存成 CHEM3D 的格式,然而 Hyperchem 需要一个.mol 后缀的文件,这里不解释,就这样做了,后面自然会明白的。于是有 Save as 选择 文件类型,保存成.mol 格式。建议用专门的文件夹区分。如图 12。
图 12 .mol 放在 hyperchem 中,Chem3D 就放在 Chem3D 中。ChemDraw 所画图形也应分 别保存。 3. 高斯计算。 所谓的专业名称我不太清楚,总而言之,我就要里面的数据。同样在 Chem3D 中操 作如图 13。
图 29 算出 PIC50,这就是对这个化合物的要预测的东西,然后就可以在文章中吹一下,我的 方程如何如何,预测性还是不错的。 五、总结
这就是基本流程了,有点简单,不过迫于时间紧张,我也只能写到这个程度了。 希望对大家有所帮助。 另外,在 SPSS 处理过程中还有一些剔除异常值的方法,本人没遇到,就不罗列了。 一般这样就算可以了。如有人有兴趣,请查阅课件第五章。 附件附上本人本次作业的论文。
预测化合物,写文章。 附件附上本人的数据记录文件。
四、数据处理 首先在 EXCEL 中处理好数据,计算出 HOMO-LOMO,这也是一个描述子,有些文献只提
供了 IC50 值,要计算出 PIC50,就是负对数。 一切准备就绪后,请在 SPSS 中打开 EXCEL 表格。
然后就是线性回归了
图 22
8
废话不多,不花哨,只要实用
线性回归设置
图 23
图 24 图中请将 PIC50 或者 IC50 作为因变量,而其余描述子,全部作为自变量来进行回归, 注意:IC50,PIC50 不能作为自变量。就是要在这些描述子中与 PIC50 或者 IC50 建立关系模 型,然后就可以利用这个方程来预测化合物了。而老师规定了方程是三元线性一次方程。因 此在建好的模型中要选择。
废话不多,不花哨,只要实用
化学信息学作业基本流程
首先声明,本文只是一个标准流程,如果大家有什么特殊的方法请忽略本文。下面我将 以使用的软件主线,进行介绍。
一、所需数据 要算的数据很多,文献中的 IC50,PIC50。CHEM3D 中的 17 个描述子,高斯中的 3 个描 述子和 N 个电荷描述子,Hyperchem 中的 7 个描述子等数据。 二、计算准备 先将所有需要计算的数据在 Excel 中列一个表格,如图 1
优化完毕后,就是计算 Chem3D 中的描述子,接下来的动作主要以图为主。如图 8
2
废话不多,不花哨,只要实用
图8 黄色背景的是要点击的,然后进入图 9 窗口。选择要计算的描述子。
图9 点击 OK,开始计算。 得到的结果显示在图 10 窗口中
图 10
3
废话不多,不花哨,只要实用
这些就是刚才选择的要计算的描述子,所有数据 CTRL+C,CTRL+V 到 EXCEL 表中, 如图 11 所示。
然后把方法改为“逐步”。选项中 暂时不改变这两个数字,如不改变就可以建立好的模型,那自然最好,在这样的情况下 建立不好,那么就请将数字改小,一般改到进入 2,删除 1.5 为最低,不行的话,就请剔除 异常数据,然后再重来建模,试试。如果实在不行,你就再降低点,老师说不看效果如何, 就看过程,只要弄出来就可以。 于是就点确定。 无奈,本人运气确实不错,不用改数值就 OK,于是得到模型
5
废话不多,不花哨,只要实用
图 16 在表格中找到与你分子中对应原子的电荷(下面有个滑动条,拖到最右边就可看到), 弄到 EXCEL 中。 接下来是记录高斯计算出来的三个描述子
图 17 弄到 EXCEL 中。 然后是高斯计算输出的 TXT 文件的处理,此文件也应保存,保存在相应的 GS 文件 夹下。
11
图1 将所有软件安装好,这里就不再赘述,重点是过程。 三、计算过程 本过程是经过本人近 30 次计算得到的最佳流程,配合自己 Excel 的排列顺序,可以很快 速的计算完成,在这过程中,快速利用 ALT+TAB,CTRL+C,CTRL+V,EXCEL 中的 TAB 快 捷键将能大大加快速度。好了废话不多说,下面是一个化合物的计算过程,每个都是一 个样。 1. ChemDraw 绘制结构。如图 2
验证得得到 Q 方。其中 Y 就是 PIC50。据老师所说,0.5 以上就有较好的预测性,0.7 以
10
废话不多,不花哨,只要实用
上就可以发文章,大家看看自己有多少吧,开心一下,本班最高 0.9 多,最低也有 0.2 多的。 四、预测化合物 根据你所有选择的化合物,来画一个新的化合物,可以是取代基不同,取代位置不同, 但是请注意,取代基你可以不同,但取代位置最好是你所选择的一系列化合物中取代基 的位置。这样才能预测更准。 然后就是画图,计算描述子,这里的描述子只用计算你建模得到的方程中那三个自变量 所代表的描述子。比之前要简单得多。 得到描述子之后,就带入你所得到的那个总方程。