分子动力学模拟-经验谈

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分⼦动⼒学模拟-经验谈
分⼦动⼒学攻略
此⽂为dddc_redsnow发表于biolover上的关于分⼦动⼒学的系列原创⽂章,相当经典与精彩,特此将系列⽂章整合,⼀起转载,望学习动⼒学的新⼿们共同学习,提⾼进步,在此特向dddc_redsnow本⼈表⽰感谢。

动⼒学系列之⼀(gromacs,重发)
在⽼何的⿎励下,发⼀下我的gromacs上⼿⼿册(我带⼈时⽤的,基本半天可以学会gromcas)
######################################################
# Process protein files step by step #
###################################################### pdb2gmx -f 2th_cap.pdb -o 2th_cap.gro -p 2th_cap.top -ignh -ter
nedit 2th_cap.top
editconf -f 2th_cap.gro -o 2th_cap_box.gro -d 1.5
genbox -cp 2th_cap_box.gro -cs -p 2th_cap.top -o 2th_cap_water.gro
make_ndx -f 2th_cap_water.gro -o 2th_cap.ndx
genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_All.itp
genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_M.itp
genpr -f 2th_cap_water.gro -n 2th_cap.ndx -o 2th_cap_C.itp
nedit Flavo.itp
grompp -f em.mdp -c 2th_cap_water.gro -p 2th_cap.top -o prepare.tpr
genion -s prepare.tpr -o 2th_cap_water_ion.gro -np 1 -pq 1
#####################################################
# Minimize step by step #
# 1. minimization fixing whole protein #
# 2. minimization fixing maincharin of protein #
# 3. minimization fixing Ca of protein #
# 4. minimization without fix #
##################################################### grompp -np 4 -f em.mdp -c 2th_cap_water_ion.gro -p
2th_cap.top -o minimize_water.tpr mpirun -np 4 mdrun -nice 0 -s minimize_water.tpr -o minimize_water.trr -c
minimize_water.gro -e minimize_water.edr -g minimize_water.log &
grompp -np 4 -f em.mdp -c minimize_water.gro -p 2th_cap.top -o minimize_sidechain.tpr mpirun -np 4 mdrun -nice 0 -s minimize_sidechain.tpr -o minimize_sidechain.trr -c minimize_sidechain.gro -e minimize_sidechain.edr -g
minimize_sidechain.log &
grompp -np 4 -f em.mdp -c minimize_sidechain.gro -p 2th_cap.top -o
minimize_sidechain_ex.tpr
mpirun -np 4 mdrun -nice 0 -s minimize_sidechain_ex.tpr -o minimize_sidechain_ex.trr -c minimize_sidechain_ex.gro -e minimize_sidechain_ex.edr minimize_sidechain_ex.log & grompp -np 4 -f em.mdp -c minimize_sidechain_ex.gro -p
2th_cap.top -o minimize_all.tpr mpirun -np 4 mdrun -nice 0 -s minimize_all.tpr -o minimize_all.trr -c minimize_all.gro -e minimize_allx.edr -g minimize_all.log&
editconf -f minimize_all.gro -o minimize_all.pdb
#####################################################
# Raise temperature step by step #
# 1. raise from 0K to 100K fixing whole protein #
# 2. raise from 100K to 200K fixing whole protein #
# 3. raise from 200K to 300K fixing whole protein #
# 4. balance fixing maincharin of protein #
# 5. balance fixing Ca of protein #
##################################################### grompp -np 4 -f heat.mdp -c minimize_all.gro -p
2th_cap.top -o temperature100K.tpr mpirun -np 4 mdrun -nice 0 -s temperature100K.tpr -o temperature100K.trr -c temperature100K.gro -e temperature100K.edr -g temperature100K.log &
grompp -np 4 -f heat.mdp -c temperature100K.gro -p 2th_cap.top -o temperature200K.tpr mpirun -np 4 mdrun -nice 0 -s temperature200K.tpr -o temperature200K.trr -c temperature200K.gro -e temperature200K.edr -g temperature200K.log &
grompp -np 4 -f heat.mdp -c temperature200K.gro -p 2th_cap.top -o temperature300K.tpr mpirun -np 4 mdrun -nice 0 -s temperature300K.tpr -o temperature300K.trr -c temperature300K.gro -e temperature300K.edr -g temperature300K.log &
g_energy -f temperature300K.edr -s temperature300K.tpr -o temperature300K.xvg grompp -np 4 -f heat.mdp -c temperature300K.gro -p 2th_cap.top -o T300K_M.tpr
mpirun -np 4 mdrun -nice 0 -s T300K_M.tpr -o T300K_M.trr -c T300K_M.gro -e T300K_M.edr -g T300K_M.log &
grompp -np 4 -f heat.mdp -c T300K_M.gro -p 2th_cap.top -o T300K_Ca.tpr
mpirun -np 4 mdrun -nice 0 -s T300K_Ca.tpr -o T300K_Ca.trr -c T300K_Ca.gro -e
T300K_Ca.edr -g T300K_Ca.log &
grompp -np 4 -f heat.mdp -c T300K_Ca.gro -p 2th_cap.top -o T300K_MD.tpr
mpirun -np 4 mdrun -nice 0 -s T300K_MD.tpr -o T300K_MD.trr -c T300K_MD.gro -e
T300K_MD.edr -g T300K_MD.log &
⾄此,全部搞定,可以跑了。

PJ的东西放出来敏感,原创的教学东西也可以收精华吧
动⼒学系列之⼆(amber基础篇)
上次写了⼀个,结果⼀下在因为发贴的原因丢了,加上最近忙的要命,不过还是吃完饭⼲活前,静下⼼写⼀下amber,amber 远⽐gromacs要复杂(不过还⽐不上charmm,估计第⼀次看charmm脚本的⼈⼀定觉得⾃⼰选错了⾏当,类fortran的语⾔加上⾃创的格式,唉,⼜是⼀段⼼酸的往事...)。

我把amber 分成两部分讲,第⼀部分讲基础,第⼆部分讲应⽤。

这⾥先讲第⼀部分。

1. 关于整体概括. amber的⽂件格式有三种最为重要:top, crd and pdb。

pdb可以⽣成top and crd, top and crd也可以转换成pdb,这些都是ascii码⽂件,可以⼿动编辑(这也是DNA+Protein时候有时不得不作的事情,巨⼤的⼯作量)。

top⽂件中是拓扑⽂件,相当于gromacs的top,不过直接把lib的参数搞过来,不要再调⽤lib了。

crd⽂件是坐标和速度⽂件,类似于gro⽂
件,pdb不⽤我说了吧。

2. amber中的概念: 所有的单元从原⼦,⼩分⼦,残基,碱基等等⼀直到⼤分⼦都是unit,熟悉C++,JAVA 的朋友想⼀下object 就理解了,amber的xleap的操作就像⼀个外包体,利⽤object的独⽴性进⾏关联,组合或者分拆object, 实现不同的功能,每⼀个unit都是独⽴单元。

⽽标准的氨基酸,碱基就像class,你⾃⼰的蛋⽩就是object。

每个class对应多个有⾃⼰名字的object。

这些都是在xleap中实现的,xleap
就是利⽤这种关系来导⼊,修改蛋⽩或者DNA/RNA。

3. amber⾃带gaff⼒场(⽐gromacs那个⽹页算的⼩分⼦正规多了),适⽤于⼤部分有机⼩分⼦,当然修改⼒场⽂件可以让你获得更多的⽀持,尤其是特殊的原⼦⽐如说卤素,⾦属原⼦。

电荷是采⽤的resp 拟和,⽽不是原⼦的partial charge,这个的优点见JACS的原始⽂献,不再赘述,主要是考虑极化。

4. 通过xleap搞定了⼤分⼦,⼩分⼦,⽔,溶剂离⼦,跑得时候就是sander了,当然8以后的pmemd 是更好的选择,不过只能跑pme⽅式的动⼒学。

5. 轨迹⽂件amber做的不好,太⼤,没有压缩。

断点续跑也不如gromacs,半个坐标的情况时有出现,只见原⼦叉叉满天飞啊,那叫⼀个壮观。

分析⼯具⾸推ptraj(不是我推的,是他们,我个⼈喜欢carnal),加各种辅助⼯具可以实现gromacs的各种功能。

6. 优点:上次说过了,轨迹稳定,重复性好,可信度⾼。

有些朋友⾮要跑出个地动⼭摇,惊涛骇浪的轨迹,不推荐您使amber,估计等到它跑到那⼀天,您也毕业了。

缺点:真的打算⽤amber吗,打算跑10ns 吗?打算有什么特别有意思的想法吗?恭喜您,您可以考虑买硬盘了。

amber的存储量⼤概是
1ns->1.5GB, 如果想发⼀个好⼀点的⽂章,阐述⼀个精细的机理,没有10条轨迹搞不定的,算算是多少硬盘....我的⼀个题平均120G轨迹。

洋洋洒洒写了这么多,不过amber的真正强⼤之处还不在这⾥,它的强⼤在于它的应⽤⼴泛,有着各种的“⼈⽆我有,⼈有我精”的套件,下次我在应⽤篇⾥⾯详细讲⼀下
动⼒学系列之三(amber应⽤篇)
上海的天⽓真是⼀天⼀变啊,⼜是⼤⾬滂沱了。

反正出不去了,索性把amber的第⼆部分写完,⼤家周末也有个消遣。

上回说amber的基础应⽤谈到了他有很多应⽤的套件,这⾥我把最常⽤的以及⽐较容易发好⽂章的⼏个部分讲解以下:
1。

⾸先要说的就是⽤于药物设计平衡的sander/pmemd,⼀般来说,⽤amber作⼀下平衡是同源模建的重要可选步骤之⼀,尤其适⽤于结构不确定性⼤的loop和缺乏明确模板的地⽅,当然,如果您要是有macromodel,还是⽤那个,最近的⽂章发现申稿⼈很喜欢那个,可能是因为那个公司⽐较得到⼤家的认可吧
2。

MMPBSA, 计算⾃由能的很好选择,KUNZ他们组就喜欢拿这个说事,作为虚筛的终结器。

当然了⽅法的想法是很好的,不过还是有⼀些缺点的,⽐如对共轭体系,可极化严重的分⼦计算结果很不准确。

MMPBSA流⾏的时候只做⼀个这个旧可以发Protein Sci. 现在基本不可能了,不过还是很好的⼀个计算⾃由能的⽅法,平均半个⼩时⼀个分⼦
3。

NMODE,有的朋友问要什么样的分析⼯具,NMODE绝对是⼀个可选的东东,具体的原理我不讲了,很简单,矩阵⼆次求导做频率,底频⾼幅运动就是它分析的对象,Maccoman他们组只做这个就在JMB 上发了⽆数的⽂章(⼈家是开⼭⿐祖,我们做,呵呵,估计就是BJ也很难啊)
4。

Alan扫描:预测突变影响的⼯具,很粗糙,但是如果你计算资源不是很多的话,这个是推荐的⽅法。

原理没什么可讲的,想⽤的去看manual,不到1页
5。

TMD,我最近做的东西,和什么SMD了,FMD了。

⼀⼤堆兄弟姐妹啊,不过也快做烂了,可以模拟蛋⽩⼤幅运动的过渡态
6。

TI。

⽬前公认的计算⾃由能最好⽅法,缺点是相当的耗时间,⼀个师兄做n年,结果发现不适合他的体系,韶华逝⽔啊,没有时间的朋友千万不要碰
上⾯的这些⽅法都是最常⽤的,也是⽂章中暴光频率最⾼,精通2到3个,⼀个好体系,综合起来,可以冲击JMB或者JACS。

呵呵,外⾯⾬终于⼩了,希望⼤家看了能有帮助,会⼀个技术不难,难的是把这个
技术⽤的恰到好处,下次有时间聊聊怎么综合使⽤各种⼯具分析问题
动⼒学系列之四(能量分析)
明天就是5.1,可是⼿⾥还是⼀⼤堆的活,实验也是诡异的要命,时光真是快啊。

前⾯对两个基本软件介绍了⼀下,本来想讲讲charmm和macromodel,后来想想,没有什么意思,还是讲⼀下分析⽅法对⼤家更适⽤,如果⼤家真的想听这两个软件,后⾯我再补充。

动⼒学分析⽅法多种多样,但是能量永远是不变的话题,很多问题的说明都是以能量为基础的,这⾥说的能量包括各种⼒场能量,溶剂化能,⾃由能等。

我主要对⾃由能讲解⼀些如何进⾏计算。

在amber中,可以通过mmpbsa来计算这个相对⾃由能,在免费的软件gromacs中,能量的计算(不知道有⼼的朋友是否⾃⼰加和过他提供的能量项,是不是缺点⼉什么啊^v^)相当的粗糙,虽然提供了计算⾃由能的⼯具,但是源码中却是空,不知道到哪个版本才能实现。

amber是⽐较好⽤,但是也是⼀个收费软件,特别是想发⽂章的朋友要注意了。

如果是不想买amber 的朋友,⼀个中间路线就是⽤gromacs跑轨迹,⽤autodock算能量(⾃由能),虽然不如mmpbsa
原理上准确,但是忽略部分熵效应也在变动不⼤的体系也还不错。

下⾯这个脚本是我⾃⼰写的,可以实现这⼀功能,希望能对⼤家有个帮助:#!/bin/sh #'$1' is set for different list name #'$2' is set for the ligand name #prepare the $2.bnd in advance with command:
#/~root/autodock/dist305/bin/pdbtoatm lig.pdbq|
~root/autodock/dist305/bin/atmtobnd >lig.bnd for snapshot in `cat $1` do
rec=protein_mn_hoh1.${snapshot} lig=$2.${snapshot} echo ${rec} #assign the atomic solvation parameters to PDBQ-formatted version of your macromolecule, ~root/bin/addsol ${rec}.pdbq ${rec}.pdbqs ~root//bin/autotors -A $2.bnd ${lig}.pdbq ${lig}.out.pdbq > ${lig}.out.${rec}/doc/2b8c58325a8102d276a22fee.html
~root/autodock/dist305/bin/autodock3 -p
${lig}.out.${rec}.dpf -l ${lig}.out.${rec}.epdb.log -c > $1_Binding ~root//bin/Docked.awk ${lig}.out.${rec}.epdb.log >>
$1_Docked ~root//bin/Inter_score.awk
${lig}.out.${rec}.epdb.log >> $1_Inter_Energy ~root//bin/Intra_score.awk
${lig}.out.${rec}.epdb.log >> $1_Intra_Energy #rm -f *.map *.fld *.xyz *.err *.pdbqs *.glg *.log *.com *.gpf *.dpf Binding.awk
#!~root/bin/gawk -f BEGIN{ name=ARGV[1] split(name,array,".") } { if($0 ~ /Estimated Free Energy of Binding/) {print array[1]" "$9" " $10} } Docked.awk #!~root/bin/gawk -f BEGIN{ name=ARGV[1] split(name,array,".") } { if($0 ~ /Final Docked Energy/) {print array[1]" "$7" " $8} }
动⼒学系列之五(外⼀篇,1-4楼加在⼀起)
上次发了系列四的能量计算后,不少朋友pm我,既然可以⽤多个⼤分⼦构象计算能量曲线,反过来是否可以⽤⼀个⼤分⼦对⼩分⼦数据库做类似dock, gold那种虚拟筛选那?答案是可以的,不过这个要通过脚本来实现,虽然也有⼀个程序,但是那个程序是我写给ddgrid这个⼯程的,这半年暂时不能放出来,年底给⼤家共享(主要原因是怕阿)。

⾔归正传,不过这个脚本也可实现⼀样的功能,就是时间上慢⼀些,空间上占⽤多⼀点,以前在别的地⽅放过早期的版本,这次放⼀个完全版,⽽且包含了我们常⽤的参数设置。

虽然和动⼒学这个系列关系不是⾮常紧密,但是在进⾏多个阳性物对⽐动⼒学的时候结合上⼀个脚本可以把⼤量⼯作简单化。

废话少说,放东西先:
--------------------------------------
主程序, 由于论坛屏蔽原因,我⽤了替代字符,⽽且好像总是砍掉我的字符啊
不得不分开发,请⼤家见谅
"&&"请转换为"EOF"后使⽤
--------------------------------------
//准备⽂件
#!/bin/sh
receptor=receptor.mol2
rec=${receptor%.mol2}
mol2topdbqs $receptor
for ligand in `cat mol2.list`
do
lig=${ligand%.mol2}
deftors $ligand <<&&
//选项
1
c
c
&&
#if(-z ${lig}.pdbq) then
# deftors $ligand <<&&
# a
# 1
# c
# c
# &&
#endif
#vi ${lig}.pdbq << &&
#:%s/ Br/ b /g
#:%s/ Cl/ c /g
#wq
#&&
(转载) 分⼦动⼒学攻略
动⼒学系列之六(膜蛋⽩的模拟)
今天是假期的最后⼀天(不过好像⼤家都是8号上班了,我们特殊,不过后⾯是惨痛的10天连续⼯作),整理⼀下思路,写⼀些膜蛋⽩的模拟,膜蛋⽩的⼯作量⼤,需要进⾏的准备⼯作多,做⼀个膜蛋⽩相当于两个球蛋⽩的⼯作量。

我先介绍⼀下膜蛋⽩的⼀些基本概念:
1。

膜蛋⽩-顾名思义,就是存在于细胞膜和细胞核(线粒体膜也有,不过不属于主流,暂时忽略之)双层脂质膜上的⼤型蛋⽩质。

膜蛋⽩从拓扑结构可以分为⼏种,酶(3500个左右),7次跨膜的G偶联受体(2000个左右),离⼦通道(1000个左右),核的激素受体(150个左右)
2。

⽣物膜膜蛋⽩可分为外周膜蛋⽩和内在膜蛋⽩,后者约占整个膜蛋⽩的70%~80%,它们部分或全部
嵌⼊膜内,有的则是跨膜分布,如受体、离⼦通道、离⼦泵、膜孔、运载体(transporter)以及各种膜酶等等。

象⽔溶性蛋⽩质⼀样,要深⼊了解膜蛋⽩的功能必须解析它们的三维结构。

第⼀个⽔溶性蛋⽩质——肌红蛋⽩的三维结构的解析是由英国Kendrew于1957年⽤X射线衍射法完成的,从⽽使他获得了诺贝尔奖。

随着相关技术的⽇益改进与发展,迄今蛋⽩质解析出具有原⼦分辨率的三维结构已达13 000个左右,⽽且正以2000个/年的速率递增。

但是其中内在膜蛋⽩只有26个左右(根据2000年6⽉的统计),换⾔之,仅占所有已经解析出三维结构的蛋⽩质的0.2%。

因此,⽤MD理解膜蛋⽩的作⽤机制也成为2000年后的⼀个热点。

3。

当获得了⼀个膜蛋⽩后,该怎么下⼿那(废话,当然是越快越好,世界上n多个组都瞄着新的膜蛋⽩那,JMB和PNAS的常客啊),准备过程我简要介绍⼀下,细节如果⼤家感兴趣,我今后再详细说⼀下,不过确实的繁琐啊,我花了两个⽉时间搞这个东东:
a. 修补残基(这个都知道怎么做了,不说了)
b. 选择合适的膜,膜的种类也是很多的,所以⼤家不要挑花眼啊(⽹上有,⾃⼰down,我也可以提供⼀个,呵呵,别⼈的,不过是我们修改了⼀点不合理结构的,获得⽅法, pm我)
c. 把蛋⽩正确的放到膜⾥⾯,去掉重叠部分,打通蛋⽩内部的通道(最关键的⼀步,决定了是否可以正确的模拟和结果的可靠性)
d. 膜两侧包⽔加box
e. MD
第三步是做膜蛋⽩的精髓,不同的组使⽤的⽅法不同,我⾃⼰写了⼀个简单的Interactive的程序,供组⾥的⼈使⽤,这次是第⼀次发布到外⾯(dos版,linux或者sgi的,可以pm我),可以⾮常简单的实现这⼀步,不要做繁琐的处理,google上可以搜到钾通道的处理⽅法,8页english, 相当的⿇烦,gromacs 给了⼀个命令,但是膜不合适(他给的膜也就适合做demo,缺乏合理性)。

当然,即使搞定了上述5步,强⼤的cpu和⾜够的硬盘是基本的保障,否则2006年交的作业,2007年可以才能进⾏分
析。

明天EMBO就要开始了,⽜⼈我知道的来了两个,都是做的最前沿的东东,⼀个是free enregy landscape, 另⼀个是structrual genomics。

去听听,有什么感想后⾯和⼤家共享
动⼒学系列之七(同源模建)
最近去听了⼏场embo, 觉得⾃⼰还是有很多地⽅需要提⾼啊,⽽且今年的embo的特⾊很突出,可能代表了当今的潮流吧,等embo结束,我写⼀个⾃⼰的感受,⼤家分享。

动⼒学⾥⾯核⼼是⽣物⼤分⼦,当然有NMR和X-RAY最好,如果没有,就需要同源模建技术来构建蛋⽩。

同源模建技术在90年代风靡⼀时,简单的模建在⼀些⾼档次的⽂章中独撑⼀⾯,2000年以来,随着技术的成熟和应⽤的⼴泛,这项技术逐渐成为⼀个基本⼯具出现在各种⽂献中。

同源模建是⼀个根据模板蛋⽩将⼀级序列转成3D结构的技术总称,包括了threading和homology两种,当让后来发展的fugue啊,geneatlas等等都是以次为基础。

在这两种中,⼜以后者重要(因为简单⽽且准确性⾼),在很多软件中都提供了相应的功能,做的最好的商业软件是INSIGHTii和modeller(这个⾮常傻⽠,但是结果的可控制性不⾼), 免费的有spdbvierwer和⼀些在线服务器.。

如果买了这个软件的朋友⼀定⾸选insightII做,因为审稿⼈很偏爱这个;没有买的朋友最好的⽅法是找买了的单位合作(D版发⽂章会给你的导师和单位带来很多⿇烦),如果找不到,只好⽤spdbviewer了,但是这样的结构最好不要发在纯计算的杂志上,被拒的危险很⼤。

说了这么多废话,我这次主要介绍INSIGHTii的⽤法和⼀些使⽤细节:
⼀. insightII
最强⼤的同源模建软件(前提是你看了所有的manual,理解了各种算法和参数的意义),可以进⾏各种模建和验证预测。

主要分以下⼏个步骤:
a. input sequence,alignment(pariwise and multi alignment,主要是对类似结构要很好了解,manual的排列原则写的⾮常好,建议⼤家仔细看)
b. refine (我个⼈使⽤的笔记)
1. Check and correct potentials, partial charges, and hydrogens before submitting a Discover/CHARMm job.
①Builder from the Module pulldown
②For hydrogens, use the Hydrogen command in the Modify pulldown
③Potential atom types and partial charges, use the commands in the Forcefield pulldown.
2. Check and correct steric overlaps
①Bump command from the Measure pulldown
②Relieve them by moving atoms with the Torsion command in the Transform pulldown.
3. Find unacceptable steric overlaps caused by one to three interactions or short bond lengths.
①Using the Geometry command in the Modify pulldown in the Builder module.
4. End Repair
5. Splice Repair
6. Energy Minimization
①Relax command provides for the selective minimization of sections of the model protein.
7. Molecular Dynamics
①Explore command in the Refine pulldown can accomplish this task.
同源模建技术给我们带来了更多选择和探索新领域的机会,但是有⼀点请⼤家注意,如果你的蛋⽩同源性不⾼,波动性过⼤,关键位点差异显著的话,要谨慎的选择同源模建,因为这样构造出来的蛋⽩很可能误导你后⾯的⼯作,因为往往同源模建在我们这⾥都是⼀个课题的第⼀步,决定了后⾯这个课题是否成功的关键
(转载) 分⼦动⼒学攻略
动⼒学系列之⼋(如何设计动⼒学)
今天下午没有课程,可以闲下来写点东西,上⾯谈了那么多技术,说到底,应该为了解决问题.动⼒学的课题我⼤⼤⼩⼩也作了不少,当然⽬的不同,设计也不同.这次我讲⼀下怎么设计动⼒学的整个课题,主要是思路⽅⾯,细节就不谈了,例⼦就讲我在JACS发过的⼀篇⽂章(J. AM. CHEM. SOC., 127, 11709-11719 ,2005),希望作的不好的地⽅⼤家指正
这是⼀个典型的配体诱导open-closed运动的⽂章,为后⾯的抑制剂设计打下了基础,在这个机理上,获得了36/60的活性化合物,最好的⼏个正在结构改造中(有的是相当的⿇烦啊,痛啊).设计这个题⽬的⽬的就是为了根据ATP和TNPATP的不同来设计抗⽣素的先导化合物.
采⽤⽅法:GMD (gromacs), PCA, QM, Homology, Protein-Protein docking
1. ⾸先通过GMD解析两个⼩分⼦构象变化
2. 从结构⼊⼿分析产⽣变化的原因
3. 设计QM来验证ATP变化的假说
4. 设计PCA来分析蛋⽩的变化,并通过PCA将⼩分⼦变化与蛋⽩变化关联起来
5. 分析得出⼤分⼦打开的根本原因来⾃于⼩分⼦的构想周期性变化
6. 利⽤Protein-Protein docking进⾏反应初始环境的构建,并⽤GMD来考证结构的正确性
7. 总结整个磷酸化机制,并提出设计抑制剂的关键性氨基酸(控制蛋⽩⼝袋开合)
基本上开始时值是设计了前⼏步,随着课题的深⼊不断对问题深化,最后得出结论。

在同时进⾏的药物设计上采⽤了这个机制的关键氨基酸限制性搜寻,获得36个阳性化合物,从⼀个侧⾯证明机制的正确性。

在上⾯这个例⼦中,动⼒学起了⼀个串联起各项技术桥梁的作⽤,当然,最后的机制还是由根据综合各项技术提出的。

作⼀个计算课题的关键我个⼈觉得是知道什么时候选⽤什么样的技术,理解这个技术的算法和机理,这样才能⼼中有雄兵。

⼀家之谈,不⾜之处请⼤家指正
动⼒学系列之九(动⼒学发展⽅向)
今天embo整个结束了,我断断续续的听的(因为最近实在是太忙⽽且有的听不懂)。

前⾯谈了许多技术阿,思路阿,对于中国从事计算⽣物学,计算化学的⼈来说,最重要的是在国外已经有的基础上发展⾃⼰的东西,不能亦步亦趋。

⾃从六七⼗年代Karplus发展动⼒学以来,动⼒学经过了⼏次⼤的波折,开始的时候模拟真空中⼏⼗个氨基酸,慢慢的可以模拟⼤⼀些的蛋⽩,随着计算资源的发展和算法的改进,⽔环境可以加⼊到模拟当中。

进⼊90年代,膜蛋⽩,尤其是GPCR和离⼦通道的模拟成功进⼀步推动了整个动⼒学的应⽤范围。

回头来我们看⼀看整个发展历程,表⾯上动⼒学的⼀个⼤的⽅向是模拟越来越⼤的体系,模拟越来越长的时间,模拟越来越多的次数来满⾜动⼒学原理上的随机问题。

如果我们眼光只看着这些,我们永远也⽆法超越国外的⽔平,因为国外新⽣代⽐较好的动⼒学组已经不是把应⽤作为主要⽬标了,他们在反思动⼒学到底可以为科学的发展贡献什么,怎么⽤动⼒学来预测想要的东西,计算/⽣物/化学怎么结合起来,相互验证着进⾏解决实验⽆法测得尺度上的微观问题。

国外的⼈来参观,你说你模拟了多长,多少条轨迹,实际⼈家不是真正的佩服你,只是佩服你能搞到这么多的计算资源。

如果你能在算法或者动⼒学本⾝原理上提出见解;你通过动⼒学发现了⼀些东西,结果实验证明是正确的,⼈家才是由衷的说fine,这次embo课程中,象clark,grummuller等都是将⽣物和计算结合的⽐较好的组,⽤到的⼿段包括AFM,荧光,NOE,NMR 等等。

许多做实验的朋友可能觉得动⼒学好发⽂章,可以make story,所以趋之若鹜,实际冷静⼀下,你要考虑⼀下如果你要做动⼒学,你应该怎么做,怎么和你的实验结合起来,把⼀个课题,⼀个体系,⼀个机制完整的呈现出来,我提⼏个⾃⼰的想法,⼤家指正:
1. 结构⽣物学结合动⼒学(最容易)进⾏结构功能研究
2. 酶学结合动⼒学进⾏残基突变,酶反应机理的研究
3. 蛋⽩组学结合动⼒学进⾏partner的识别
4. 信号传导通过动⼒学研究构象如何变化实现信号传输
5. 其他,包括folding, 蛋⽩演化这些原来纯粹的计算⽣物学的⽅向,现在可以结合AFM, Biocore等仪器来验证你的idea
说了这么多,最后有⼏个建议,送给想做动⼒学的朋友
1. 不要只解释别⼈的实验结果,提出机制。

从去年年底到今年,发现动⼒学的⽂章最⼤的变化就是这个,只解释的⽂章被拒稿率猛增,QSAR的今天就是md的明天
2. 不要局限于细节,要有⼤局观,从整体⼊⼿考虑⽂章构架
3. 给出预测,并⽤实验验证它,如果你没有条件,⼀定要提出你的建议,没有建议的⽂章不要投4分以上的杂志
4. 数据分析不是⽬的,整理思路才是关键,我有海量数据,但是⼈家没有海量时间听你讲,看你的罗罗嗦嗦象唐僧⼀样,马上给你kill,理由就是你的⽂章没有新颖性,没有条理性
5. 建议⼀定要做重复,就是同⼀条轨迹最好多跑⼏边,从统计学意义上说明问题,不要保侥幸⼼⾥
分⼦动⼒学简介及在药物化学中应⽤
分⼦动⼒学是⼀门结合物理,数学和化学的综合技术,我做过⼀点这⽅⾯的⼯作,谈⼀点⾃⼰的感受,对⼤家可能有些帮助吧
1. 动⼒学可以解决什么问题
做药物化学最重要是要有有前途的先导化合物,⽽先导化合物的来源两⼤⽀柱之⼀就是虚拟筛选技术,作为虚拟筛选技术串连技术的最终⼀步,动⼒学有着可以选择最有前途分⼦进⾏合成的作⽤,提⾼靶酶先导化合物的阳性成功率;另外动⼒学还可以对已知的化合物进⾏研究,获得进⼀步改造的空间;在⽣物化学领域,更多的蛋⽩性质可以被探索,这样动态设计药物分⼦先导成为可能。

2.什么样的体系适合做动⼒学
不是所有的体系都适合做动⼒学,有的体系跑了分析了快⼀年才发现原来并不适合做动⼒学(组⾥有过这
样的先例),轨迹扔了可惜,不扔是垃圾,还占空间,被⼈骂(组⾥硬盘空间太少,才⼏个T)。

动⼒学最重要的是选择体系,这也就是说什么样的体系适合做动⼒学(或者说适合发⽂章的).
以下⼏类都是⽐较好作的:
a. ligand induced conformation
b. open-closed mechanism
c. binding mechanism
d. large-scale mechnism
e. free energy evaluation(这个对做药物化学的⼈很重要)
不好做的有(但是作出来会很好)
a. membrane protein
b. ion-channel protein
c. Protein-DNA/RNA interaction
千万不要去尝试(会让你做完欲哭⽆泪的)
a. homoloy-based MD(especillay <30%),⼏乎⽂章做⼀个拒⼀个,除⾮你⾃⼰组⾥有⼈给作实验验证
b. independent stable protein,分析不出什么东西,⼩东西⽐⽅说⽔啊什么的,这个都已经过时了,不要扣细节了
c. Super large-scale MD, 这个我不⽤说了吧,估计我们作不了的呵呵,别的地⽅也很难做
d. 不知道⾃⼰为什么去作MD,先跑上再说的那种(最危险的⼀个),没有⼈指点你会迷失在分析的海洋中。

2.选择什么样的软件做动⼒学
动⼒学的软件多如⽜⽑,选择哪个去做哪?我只谈主流的⾃⼰摸过的⼏个(排名不分先后),Gromacs, amber, charmm, gromose和macromodel。

NAMD我没有摸过,不敢评价。

a. Gromacs⼤家问的最多,我先说。

⼀个字!快。

其他的优点还有分析傻⽠,简单易学(我⾃⼰带⼈的话,⼀个上午之内保证学会,⼤家不要板砖啊,确实是缺乏内涵,傻⽠的很),可以pull(⽽且可以想怎么pull就怎么pull,还可以多个pull)。

我说说缺点:结果可靠性差,重复性难,⾼档次分析⼯具⽋缺,分析⼯具中bug多(仔细看就会知道,结果⼀看就知道不对),并⾏通信量⼤.....。

这个软件只适合没有经济能⼒购买商业软件和需要长时间动⼒学(微秒)的同学使⽤
b. amber和charmm(偷懒了,放在⼀起),两者差不多,但是前者商业化程度更好,做得⽐较容易上⼿;后者还是⽼样⼦,脚本复杂,分⽀狂多,这也和karplus学⽣众多有关(孩⼦多了就是不好管啊)。

优点都是结果相对准确,可信度⾼,具有⾼档次分析⼯具。

缺点是上⼿难,跑的慢,理论基础要好,狂占空间(我都被管理员说了⽆数次了,唉)
c. gromose,拥有和CPMD的⽆缝接⼝是最⼤的优点。

什么,不知道CPMD是什么,算我没说,跳过这个软件吧
d. macromodel,商业化最好,拥有能⼒最强,号称动⼒学黄⾦标准的MD软件。

⼀个字,贵。

但是⼈家薛定额做的就是好,结果被各⼤公司使⽤频率最⾼,药物化学个⼈推荐⾸选。

e. 其他,还有很多动⼒学软件,NAMD是⽐较出名的⼀个,但是我没有摸过,没有什么特⾊主要是。

更⼩的⼤家如果感兴趣,⼀句话:⼩玩贻情,⼤作伤⾝。

3.应该做什么样的分析
rmsd,rmsf, t, e,dis, angle这些俗套就算了,最重要的是你对你的体系精通,各种实验结果了然于胸,机制脱⼝欲出,靶标分⼦的作⽤⽅式才是分析改造化合物的关键。

最好掌握⼀些发展前沿的分析⼿段,⼀两句话说不清楚,这个我下次有时间再开个贴说说。

洋洋洒洒写了半天,后来写困了,可能前⾔不搭后语了,⼤家不要拍我啊,仅供⼤家参考。

相关文档
最新文档