蛋白质间分子动力学模拟及数据分析报告
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
坐标文件
> quit ambpdb -p complex_water.prmtop < complex_water.inpcrd > final.pdb #final为自己命名,将拓
扑文件和坐标文件联合生成一个pdb文件,可以用看图软件打开确定水盒子的坐标
开始模拟
一、确定水盒子坐标 打开vmd,载入final.pdb文件,在Extensions 里的Tk/Tcl中依次输入: set everyone [atomselect top all] measure minmax $everyone #修改NAMD配置文件中的cellBasisVector measure center $everyone #修改NAMD配置文件中的cellOrigin
grep -v '^.............H' complex.pdb > complex_NoH.pdb #删除H
三、生成模拟需要的拓扑文件和坐标文件
原理: 用 NAMD进行分子动力学模拟需要坐标和拓扑文件,坐标文件记录了各个质点所座落的 坐标,拓扑文件记录了整个体系各质点之间的链接状况、力参数电荷等信息。这两个文 件是由Ambertools中的leap 程序生成的。
二、确定所需文件是否完全 所需文件包括:complex_water.prmtop,complex_water.inpcrd,run.conf #run.conf为NAMD的配置文件,本次模拟设置的参数全部在里面。
三源自文库运行NAMD 在终端下输入:
charmrun namd2 +p 12 complex.conf > run.log &
的,两种半胱氨酸在力场文件中是用不同的 unit 来表示的,这相当于是两个完全不同的氨基酸 ,需要手动更改蛋白质文件中半胱氨酸的名字。组氨酸(His)有若干种质子态,和半胱氨酸 一样,也需要查阅文献确定它的质子态,并更改残基名称
步骤:
(1)对于Cys,通过查阅文献确定其形态,桥连的要用 CYX,自由的用 CYS (2)对于His,把原始pdb文件或做了相关突变的准原始pdb文件提交到PDB2PQR web server, 在生成的文件里查找各个HIS的pKa值,根据pKa值与pH的大小关系决定质子化状态 。即,pH>pKa, 去质子化,改为HID或HIE;pH<pKa,质子化,改为HIP。
蛋白质间分子动力学模拟及 数据分析
蛋白质的结构和对接
在进行模拟之前,我们首先要获得的是蛋白的结合配体后的复合物结构,蛋白和配体 复合物如果已经被测出来那是最好不过的了,但是如果没有,就需要我们用软件将蛋 白质与其配体进行对接。蛋白质间的对接常用的软件有Zdock,GRAMM,Hex 等, 以上的三种软件都有本地版和在线版,简单的直接用在线版,提交两个蛋白的结构之 后,网站进行计算后将结果发给我们。还有一种极端情况是我们所研究的蛋白质的结 构没有被测出来,只有该蛋白的氨基酸序列。在这种情况下,在对接前我们可以将该 蛋白的氨基酸序列提交给I-TASSER onlie(也分为本地版和在线版)来预测出该蛋白的结 构。
步骤:
按以下过程在终端中输入:
tleap >source leaprc.ff12SB #amber力场的所有氨基酸参数都存储在 库文件里,所以打开 leap 第一
件事便是调入库文件. >loadAmberparams frcmod.ionsjc_tip3p #载入tip3p水模型中的力场 >list #可以用 list 命令看看库里都有什么,罗列的就是库里面的 unit,包 括 20 种氨基酸、糖以及核酸还有一些常见离子的参数 >comp=loadpdb complex_NoH.pdb #载入复合物pdb文件 >solvatebox comp TIP3PBOX 10.0 #加入waterbox,TIP3PBOX 是选择的水模板名 称,10.0 是水箱子的半径 >addions comp Na+ 0 (或是Cl-)#平衡电荷 >saveamberparm comp complex_water.prmtop complex_water.inpcrd #生成最终的拓扑文件和
二、去除蛋白质中的H和其他杂成分 原理:
Ambertools 自带的 leap 程序是处理蛋白质文件的,他可以读入PDB格式的蛋白质文件,根 据已有的力场模板为蛋白质赋予键参数和静电参数。PDB 格式的文件有时会带有氢原子 和孤对电子的信息,但是在这种格式下氢原子和孤对电子的命名不是标准命名,力场模板 无法识别这种不标准的命名,因此需要将两者的信息删除。除了删除氢和孤对电子,还应 该把文件中的结晶水、乙酸等分子删除,这些分子的信息常常集中在文件的尾部,可以直 接删除。处理过之后的蛋白质文件,只包括各氨基酸残基和小分子配体的重原子信息,模 拟需要的氢原子和水分子将在 leap中添加。 步骤: 输入如下命令:
模拟软件及文件
1、模拟所需要的软件 NAMD,Ambertools,VMD。 NAMD为执行模拟的软件; Ambertools提供所需力场和进行结合能等的计算; VMD为成像和分析软件,将模拟轨迹进行图像呈现
2、模拟所需要文件 对接的复合物结果(pbd格式)
准备工作
一、特殊氨基酸处理
原理: 半胱氨酸(Cys)有两种存在形态,有的是两个半胱氨酸通过二硫键相连,有的则是自由
#12为运行的进程数 tail run.log
数据分析
前面的所有工作只是开始,最重要的是数据的分析处理 重要的方法后面会给出用到这种方法的参考论文
RMSD
RMSD可以用于确定复合物在模拟过程 中的稳定性。分子动力学模拟过程中, 各个分子都处于动态的运动过程,因此 整个系统处于不停的变化当中。模拟过 程的初始阶段,各个原子之间的距离还 没有找到一个平衡点,因此整个系统将 处于运动比较剧烈的的状态。然后随着 模拟的进行,原子间的相互作用将达到 平衡状态。因此RMSD将趋近于平缓。 如图,每条曲线都代表一种蛋白或一种 蛋白复合物的RMSD变化。此外,如果 一个蛋白在结合配体过程中会发生剧烈 的结构变化,其RMSD也会有所体现。 VMD有计算RMSD的工具
> quit ambpdb -p complex_water.prmtop < complex_water.inpcrd > final.pdb #final为自己命名,将拓
扑文件和坐标文件联合生成一个pdb文件,可以用看图软件打开确定水盒子的坐标
开始模拟
一、确定水盒子坐标 打开vmd,载入final.pdb文件,在Extensions 里的Tk/Tcl中依次输入: set everyone [atomselect top all] measure minmax $everyone #修改NAMD配置文件中的cellBasisVector measure center $everyone #修改NAMD配置文件中的cellOrigin
grep -v '^.............H' complex.pdb > complex_NoH.pdb #删除H
三、生成模拟需要的拓扑文件和坐标文件
原理: 用 NAMD进行分子动力学模拟需要坐标和拓扑文件,坐标文件记录了各个质点所座落的 坐标,拓扑文件记录了整个体系各质点之间的链接状况、力参数电荷等信息。这两个文 件是由Ambertools中的leap 程序生成的。
二、确定所需文件是否完全 所需文件包括:complex_water.prmtop,complex_water.inpcrd,run.conf #run.conf为NAMD的配置文件,本次模拟设置的参数全部在里面。
三源自文库运行NAMD 在终端下输入:
charmrun namd2 +p 12 complex.conf > run.log &
的,两种半胱氨酸在力场文件中是用不同的 unit 来表示的,这相当于是两个完全不同的氨基酸 ,需要手动更改蛋白质文件中半胱氨酸的名字。组氨酸(His)有若干种质子态,和半胱氨酸 一样,也需要查阅文献确定它的质子态,并更改残基名称
步骤:
(1)对于Cys,通过查阅文献确定其形态,桥连的要用 CYX,自由的用 CYS (2)对于His,把原始pdb文件或做了相关突变的准原始pdb文件提交到PDB2PQR web server, 在生成的文件里查找各个HIS的pKa值,根据pKa值与pH的大小关系决定质子化状态 。即,pH>pKa, 去质子化,改为HID或HIE;pH<pKa,质子化,改为HIP。
蛋白质间分子动力学模拟及 数据分析
蛋白质的结构和对接
在进行模拟之前,我们首先要获得的是蛋白的结合配体后的复合物结构,蛋白和配体 复合物如果已经被测出来那是最好不过的了,但是如果没有,就需要我们用软件将蛋 白质与其配体进行对接。蛋白质间的对接常用的软件有Zdock,GRAMM,Hex 等, 以上的三种软件都有本地版和在线版,简单的直接用在线版,提交两个蛋白的结构之 后,网站进行计算后将结果发给我们。还有一种极端情况是我们所研究的蛋白质的结 构没有被测出来,只有该蛋白的氨基酸序列。在这种情况下,在对接前我们可以将该 蛋白的氨基酸序列提交给I-TASSER onlie(也分为本地版和在线版)来预测出该蛋白的结 构。
步骤:
按以下过程在终端中输入:
tleap >source leaprc.ff12SB #amber力场的所有氨基酸参数都存储在 库文件里,所以打开 leap 第一
件事便是调入库文件. >loadAmberparams frcmod.ionsjc_tip3p #载入tip3p水模型中的力场 >list #可以用 list 命令看看库里都有什么,罗列的就是库里面的 unit,包 括 20 种氨基酸、糖以及核酸还有一些常见离子的参数 >comp=loadpdb complex_NoH.pdb #载入复合物pdb文件 >solvatebox comp TIP3PBOX 10.0 #加入waterbox,TIP3PBOX 是选择的水模板名 称,10.0 是水箱子的半径 >addions comp Na+ 0 (或是Cl-)#平衡电荷 >saveamberparm comp complex_water.prmtop complex_water.inpcrd #生成最终的拓扑文件和
二、去除蛋白质中的H和其他杂成分 原理:
Ambertools 自带的 leap 程序是处理蛋白质文件的,他可以读入PDB格式的蛋白质文件,根 据已有的力场模板为蛋白质赋予键参数和静电参数。PDB 格式的文件有时会带有氢原子 和孤对电子的信息,但是在这种格式下氢原子和孤对电子的命名不是标准命名,力场模板 无法识别这种不标准的命名,因此需要将两者的信息删除。除了删除氢和孤对电子,还应 该把文件中的结晶水、乙酸等分子删除,这些分子的信息常常集中在文件的尾部,可以直 接删除。处理过之后的蛋白质文件,只包括各氨基酸残基和小分子配体的重原子信息,模 拟需要的氢原子和水分子将在 leap中添加。 步骤: 输入如下命令:
模拟软件及文件
1、模拟所需要的软件 NAMD,Ambertools,VMD。 NAMD为执行模拟的软件; Ambertools提供所需力场和进行结合能等的计算; VMD为成像和分析软件,将模拟轨迹进行图像呈现
2、模拟所需要文件 对接的复合物结果(pbd格式)
准备工作
一、特殊氨基酸处理
原理: 半胱氨酸(Cys)有两种存在形态,有的是两个半胱氨酸通过二硫键相连,有的则是自由
#12为运行的进程数 tail run.log
数据分析
前面的所有工作只是开始,最重要的是数据的分析处理 重要的方法后面会给出用到这种方法的参考论文
RMSD
RMSD可以用于确定复合物在模拟过程 中的稳定性。分子动力学模拟过程中, 各个分子都处于动态的运动过程,因此 整个系统处于不停的变化当中。模拟过 程的初始阶段,各个原子之间的距离还 没有找到一个平衡点,因此整个系统将 处于运动比较剧烈的的状态。然后随着 模拟的进行,原子间的相互作用将达到 平衡状态。因此RMSD将趋近于平缓。 如图,每条曲线都代表一种蛋白或一种 蛋白复合物的RMSD变化。此外,如果 一个蛋白在结合配体过程中会发生剧烈 的结构变化,其RMSD也会有所体现。 VMD有计算RMSD的工具