gromacs文件介绍and一些杂知识CPTEPS力场

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(1)gromacs(GMX) 各种文件格式详细,可以查阅GROMACS 手册第5章第6小节,以下为简要介绍。

CPT文件:该文件为模拟断点文件(check point,.cpt)。

该文件为模拟过程固定时间间隔产生,保存模拟系统所有信息。

该文件一部分可以在能量文件(.edr)找到,一部分可以在双精度轨迹文件(.trr)中找到。

如果模拟不幸因为外界条件中断(如断电,模拟人发脾气砸电脑等),可以使用该文件重新在断点处开始模拟,以节省模拟时间。

同时也可以依靠该断点文件开始,并延长模拟计算(见tpbconv)。

EDR文件:系统能量文件(energy,.edr)。

该文件记录模拟输入文件中定义的能量组的各种相互作用能量等。

EPS文件:封装文件格式(.eps),并不是GROMACS自身文件格式,可以当图片打开。

LINUX系统下一般已经有默认打开程序,WINDOWS要安装其他打开程序(可以GOOGLE以下)。

GROMACS的DSSP和罗麽占陀罗图等通过xpm2ps处理后都是这个文件格式。

习惯就好。

G87文件:分子坐标文件(.g87)。

该文件记录并只记录原子坐标和速度,不含原子序号。

并只记录常压强模拟系统的盒子信息。

G96文件:分子坐标文件(.g96)。

GROMOS96程序的分子坐标文件,模拟程序以15.9的C语言格式写入,精度较高,但是会比较大。

包含有文件头,时间步,原子坐标,原子速度,以及盒子信息等。

GRO文件:分子坐标文件(.gro)。

GROMACS的最主要分子坐标文件,明白这个文件,就基本明白使用GROMACS了。

该文件类型的各个文本列字数固定,C语言的写入格式为:"%5d%5s%5s%5d%8.3f%8.3f%8.3f%8.4f%8.4f%8.4f"。

具体固定文本列有:
残基序号,5位数;残基名称,5字母;原子名称,5字母;原子序号,5为数;原子坐标三列,X,Y,Z坐标各8位数,含3个小数位;速度同坐标,速度单位为nm/ps(km/s)。

ITP文件:分子拓扑文件(.itp)。

被主拓扑文件(.top)包含的分拓扑文件,一般包含某个特定分子的类型。

于主拓扑文件区别有它不引用其他力场文件,同时包含[system],[molecule]等拓扑字节。

M2P文件:xpm2ps程序配置文件,定义输出eps文件中颜色,字体种类及大小等。

MDP文件:GROMACS的模拟配置文件(.mdp)。

该文件所含定义较多,各关键字的含义可以查阅GROMACS手册。

(这是使用GROMACS进行分子动力学模拟最最最最(10个最)重要的文件,no mdp文件,no GROMACS模拟。

好好看书,以明白各个关键字的含义。

因为它太重要,所以不在此简要描述。

N2T文件:原子名称及类型对照文件(.n2t)。

x2top程序可以按照原子名称得到该原子的原子类型力场参数,N2T就是x2top程序扫描的数据库,文件很小。

文件中文本行有原子名称,原子类型,原子电量,原子质量,该原子与其他原子成键距离等。

NDX文件:原子索引文件(.ndx)。

该文件含原子的序号,当使用make_ndx 程序生成索引文件时,可以定义不同的原子组,每组名下即是该组所含各个原子的序号。

PDB文件:分子坐标文件(.pdb)。

这个就不用说了(说真的,如果真没有听过这个文件类型的话,看这篇文章有点浪费时间。


RTP文件:残基力场参数文件(.rtp)。

该文件包含常见残基的力场信息,
包括残基所含原子,成键种类等。

使用pdb2gmx处理PDB文件时,程序按照PDB文件信息,在RTP文件中寻找对应的残基力场信息。

TOP文件:模拟系统的拓扑文件(.top)。

该文件就是所谓十分及其著名的系统拓扑文件啦,其包含各个关键字都十分易懂;一般其还包含引用其他力场文件(#include)。

TOP文件一般由pdb2gmx产生,grompp程序生成模拟TPR文件时使用。

TPR文件:模拟打包文件(.tpr)。

该文件打包模拟需要各种信息,包括模拟系统,模拟控制等。

TRJ文件:全精度轨迹文件(.trj)。

该文件包含模拟系统模拟各个时间下的原子坐标,速度和受力等。

所含帧数频率由MDP文件控制,文件较大。

TRR文件:以上同,一般为默认格式。

由于所含信息多,可以也EDR文件一起使用,重新开始模拟程序。

XPM文件:数据矩阵文件(.xpm)。

该文件矩阵中每个值即是矩阵点所表示的物理量大小(也可以是布尔值)。

该文件其实就是二维图,可以失踪xpm2ps转换为图片。

XTC文件:模拟轨迹单精度文件(.xtc)。

单精度轨迹文件,文件较TRR 和TRJ小,为常用分析文件。

包含模拟系统中原子坐标,模拟时间,和模拟盒子信息。

XVG文件:二维图标文件(.xvg)。

二维画图工具xmgrace的默认文件,可以使用xmgrace打开。

(2)Gromacs中几个特殊文件
aminoacids.dat
该文件保存GMX默认的蛋白质和核算的默认残基名称。

如果计算过程要
建立一个新的蛋白质或者核算残基,可以将新的残基名称加到该文件中,并增加文件第一个的整数即可。

有时候可以将该文件拷贝到当前工作文件夹进行编辑,以不影响其他计算的命名(GMX的文件搜索总是从当前目录开始的。


FF.dat
GMX默认力场列表,即pdb2gmx处理PDB文件时可以选择的立场列表。

增加新的力场,可以编辑该文件,并修改文件第一行的整数,使其与力场种类熟目一致。

specbond.dat
GMX处理特殊化学键的文件,特殊化学键包括二硫键,血红素铁原子于其他原子成键等。

该文件第一行指明特殊键对的数目,第二行开始即为各个特殊键对的信息,其中第一列为键对第一个残基的名称,第二列为该残基成键原子的名称,第三列为该原子可以成键的数目,第四到第六列为成键另一个残基的信息,第七列为该化学键的平衡长度,此后两列为成键后残基的新名称。

vdwradii.dat
原子范德华半径数据库。

使用genbox为系统添加水分子,或者使用genion 为系统添加离子时,各个原子间的距离要大于两个原子范德华半径之和,否则则为原子重叠
(3)常见水分子模型
进行分子动力学模拟,水分子十分重要,除非选择使用连续介质模型(implictit water model)。

水分子模型较多,选择这些模型要结合使用的力场,并参考别人已经的数据。

一下简单介绍几种常见的水分子模型,希
望对了解它们有点帮助。

按照一般化学常识,水分子由三个原子构成,主要的参数应该有各个原子的质量,电量,氢氧键的长度以及H-O-H的键角。

没有错,最简单的水分子模型就是这些参数都固定的刚性水分子模型。

如SPC模型和TIP3P 模型。

这两种模型中,原子质量和电量都在同一个质点上。

唯一不同的是TIP3P的H-O-H键角比理论值109.47小,为104.52度。

这两种水模型只有氧原子具有范德华作用系数,氢原子的范德华系数为0。

以上两种模型有对应的改进模型,SPC的改进模型为SPC/E,起主要改进其实就是使溶液系统的总能量乘以5.22 kJ/mol。

这样可以使SPC溶液属性更加接近实验值。

TIP3P在CHARMM力场中的改进是给氢原子一定的范德华系数,这样做的结果的计算根据复杂。

(很无奈,因为结果好,所以也没有办法。


由于真是情况下水分子的电量分布并不是完全在原子上的,如氧原子的一部分负电量就在H-O-H的对角线上,还有两个电子对处在H-O化学键的延长线上。

为了得到更加真实的水分子模型,四个粒子以上的模型就被应用到分子动力学模拟中。

其中最著名的有TIP4P模型。

该模型在三个原子中间,H-O-H化学键的对角线上多了一个不含质量,只带电量的点。

很多蛋白质模拟计算中,TIP4P和OPLS力场结合使用都得到很好的效果。

以上提到,水分子的氧原子在H-O化学键延长线上有两个电子对,于是有的人就在这两处添加了两个只带电量的粒子。

2000年报道的TIP5P模型,计算结果也很好。

还有一些牛人,结合TIP4P和TIP5P,要研制TIP6P,很好很强大。

不得不说,并不是模型的所含粒子越多越好。

粒子越多,就算付出越大,因为要计算的相互作用更多
(4)力场
“力场”,请不要被“场”这个听起来像是十分高深的物理名词给吓坏了。

分子动力学模拟中使用的力场,包含两个重要的部分:
1)模拟粒子之间相互作用的方程(即经典力学的相互作用力方程如库仑定律,范德华作用方程等)。

2)方程的参数(即各个不同粒子,原子本身的参数,如带点量等等)。

可以想想,模计算机模拟好多成键或者不成键的粒子的运动,总要让它们互相推推拉拉吧,于是力场就是定义它们推推拉拉的方式(按照物理定律)。

力场类型,一般分类为三种:
i)全原子力场:精确定义每一个原子的参数。

ii)联合原子力场:省略非极性氢原子,同时把其参数整合到与他们成键的相邻原子上(比如甲基,只由一个碳原子表示)。

iii)粗颗粒力场:进一步精简分子结构的力场参数,种类比较多,比如有讲蛋白侧链看作一个颗粒的力场,或者甚至将整个氨基酸残基看成一个颗粒的力场等等。

一般来说力场的方程和参数是自成一个系统的,所以一般不能在一个系统中使用两个力场的参数。

更具体的将,同一个原子在力场一中的带电量与起在第二个力场中是不一样的,化学键也一样。

一般来讲,也不能特定修改力场中模一个原子的参数,因为原子之间是互相交叠依赖(比如未来保
证整个氨基酸残基电量为0,各个原子电量加和必须为0)。

但是,这并不是说一定不行,相反的,为了模拟一些不常见的分子,经常需要根据已有的参数(力场里面的,其他论文等)来构建新的分子参数。

具体方法可以参考Mr. Google等著名老师。

目前比较流行的力场有:
AMBER:包含好几个版本的力场,为全原子力场;
CHARMM:全原子力场,是软件CHARMM的一部分;
GROMOS:GROMOS软件使用的力场,版本较多,为联合原子力场;OPLS:包含全原子和联合原子力场两个版本;
粗颗粒力场:种类较多,没有固定版本或者种类,一般根据研究需要开发。

(5)Gromacs重启模拟计算
以前介绍过如果使用GMX 3.x 重新由于种种原因停止的模拟,以下为GMX 4.x 下重启模拟的方法。

GMX 4.x 的模拟程序mdrun较以往版本有不少不同。

在模拟过程中,mdrun 按照mdp 文件在一定时间间隔保存一个断点文件(checkpoint file, .cpt文件),该文件保存了该时刻模拟系统的所有物理量信息。

如果由于不可预见原因,模拟中断,则可以使用该文件重新在该时刻开始进行模拟。

重启模拟的命令如下:
-------
mdrun -s topol.tpr -cpi state.cpt -append
-------
以上state.cpt文件为最新生产的断点文件(mdrun会保存另外一个断点
文件:state_prev.cpt,为上一个时刻保存的断点文件,双保险。

)使用“-append " 的作用是将模拟输出添加到已有文件中,包括轨迹文件,记录文件,能量文件等,相同帧的信息将被后生产的信息覆盖。

当然,也可以继续像GMX 3.x 一样使用tpbconv生产新的tpr文件继续模拟,详细请参见旧文或手册。

(6)Gromacs多链模拟
进行模拟计算时,如果模拟分子由两条以上的链组成,一般都要明确告诉模拟软件区分两条链。

模拟软件一般没有那么聪明,除非明确定义,否则它会把两条以上的化学链(如肽链,DNA,其他聚酰胺等)看成一条链。

在建立模拟文件是,上一条链尾端会于下一条链头部加一个共价化学键(如肽键)。

由于该化学键一般很长,开始模拟时系统就“爆炸”了。

AMBER软件在处理这样的问题的,需要编辑原始的PDB文件,在每一条链结尾处添加“TER”。

在GMX中,这种做法行不通(其实开发人员应该考虑这个问题)。

解决的办法要在原始PDB文件中给每一条链添加链标识符,如“A”,“B”等等。

(如果26个字母不够用,那就使用数字1到9,然后还可以使用特殊字符,如"$“,”¥“等等)。

这样,使用pdb2gmx处理PDB文件的时候,就会得到各个链的拓扑文件,如topol_A.itp,topol_B.itp等等,并都被topol.top包含。

以上所述使用一个字符标识PDB文件中不同的链,是因为PDB文件只使用第22字符列作为链标识位,两个字符以上不认。

(即AA,AB标识的链都被认为是A链。


那么如果拿到一个没有链标识符的PDB坐标文件或GRO文件,该怎么办呢?那么要先使用make_ndx将不同链的残基选作不同的分子组(group),
然后使用editconf将不同组输出成带链标识符的PDB文件,命令如:editconf -f File.pdb(/File.gro) -n indenx.ndx -o chian_A.pdb -lable A
(以上可以等等A链,以此类推得到不同的链的PDB文件)。

最后将这些PDB文件组合成一个PDB文件,再由pdb2gmx处理即可。

甚是麻烦。

(7)GMX.5 eneconv
GMX 分子模拟,有一个非常重要的能量输出文件,即edr 文件。

eneconv 就是对GMX 能量输出文件进行处理的程序。

一个模拟可以分对次进行,于是得到很多edr 文件。

使用eneconv 的“ -f ” 参数,然后把这些能量文件罗列出来,那么就可以对这些能量文件进行合并,输出一个完整的能量文件。

如果另个能量文件中有重复的模拟步骤,那么后一个读入的能量文件将覆盖前一个文件。

也可以使用“-settime” 参数对每一个输入文件的开始时间进行设置,以免互相覆盖。

如下就是一个程序运行例子:
++++++++++++++++
eneconv -o fixed.edr -f *.edr
++++++++++++++++
即对当前目录下所有edr 文件进行合并,然后输出为fixed.edr文件。

当用“ -f ” 参数读入单一一个能量edr 文件时,也不是没有用,可以和其他参数配合,对能量文件进行编辑, 如“ -dt ” 参数可以设定对原来能量文件进行规定时间间隔输出到新能量文件中;“ -offset ” 参数设定写出输入能量文件的时间帧(从哪一个模拟时间开始写入新的能量文件)等。

这些参数,还有上面说到的“-settime” 参数,都可以一起使用,加上“-b”
和“-e” 设定开始和结束读取模拟时间帧,就能得到新的称心如意的新能量文件。

程序输入文件:
-----------
-f:
输入能量文件,即edr 文件。

-o:
输出文件,也是edr 文件。

其他参数:
---------
-b:
设定从哪一个模拟时间帧对输入文件进行读取。

-e:
设定从哪一个模拟时间帧对输入文件结束读取。

-dt:
设定输出文件的模拟时间间隔,比如“-dt 10”表示每10ps 输出一次。

-offset:
设定从哪一个时间帧开始输出到新的能量文件中。

-settime:
交换式设定每一个输入文件在新输出文件中的开始时间。

-sort:
自动排序输入文件。

-scalefac:
该参数输入为一个实数,程序会将能量文件中的每一个能量项乘以这一个实数。

-error:
如果输入文件中有错误,程序自动退出。

注意:新的输出文件中,只有能量项是正确的,用于统计的sigma和E^2并没有更新,所有需要使用其他工具,如g_analysis 进行新的统计
(8)GMX.4 editconf
editconf 是GMX 最重要的程序之一。

它的主要功能是对系统结构进行编辑,同时它也把系统结构文件保存或者转换到不同的文件格式中,如gro、g96、pdb文件等。

在分子动力学模拟中,通常给模拟系统添加一个模拟盒子(周期性的盒子,原子从这边出去了,就从那边进来,通俗吧)。

editconf 使用“ -box ”、“ -d ” 和“ -angle ” 等参数对模拟系统的盒子进行设定。

在为系统设定盒子的时候,“ -box ” 和“ -d ” 都把系统放置在盒子的中间,除非editconf 明确使用另外一个参数“ -noc ”。

(也就是not center 的意思啦。

)
使用“ -bt ” 参数,editconf 可以设定使用盒子的类型。

editconf 支持以下几种盒子类型:triclinic(斜方体)、cubic(正方体)、dodecahedron(等边十二面体),octahedron (等边八面体,两头被剪切的那种,即两个四面体放在一起,切去方向相反的尖尖的两头,同时保证所有的边长相等)。

等边十二面体和等边八面体的体积分别是同“ 周期映像距离”的正方体体积的0.71 和0.77 倍,越接近球形,体积越小,计算代价越小。

当使用立方体、等边十二面体或者等边八面体时,“ -box ” 的参数可以只为一个实数值,该数值即为边长。

“ -box ”参数也可以是三个实数,结果为以这三个实数为边
长的长方体(如不指定“ -angle ”,默认盒子矢量间夹角为90度)。

参数“ -angle ” 只同参数“ -box ” 和参数“ -box ” 一起使用,以指定盒子矢量间的夹角;不能和参数“ -d ”(用于指定系统原子到盒子边界的最小距离)一起使用。

如果使用“ -n ” 或者“ -ndef ” 参数为程序指定一个索引文件,则editconf 可以选择系统中某一个组计算盒子大小或者几何中心,否则整个系统都会被考虑在内。

参数“ -rotate” 用来旋转系统,按照给定数值在该坐标系上进行旋转。

如“ -rotate 0 30 0 ”,则表示将系统绕Y 轴顺时间方向旋转30 度。

参数“ -princ ” 用来将系统(或者系统某一部分)固有坐标对齐到坐标轴上。

这样做可以缩小盒子的体积,特别是当分子为一长条形状的时候。

但是分子在模拟过程中会平移或者转动,所以使用的时候要特别小心。

扫描参数“ -scale ” 在其他参数被读入前可以扫描系统中各个原子的坐标,与其他参数配合使用可以对系统中原子坐标进行修改以得到不同的系统性质。

如果“ -density ” 一起使用,可以得到不同的系统密度(这样做会改变系统盒子大小,要特别小心!)。

使用该参数时,如果输入为.gro 文件,可能结果会不精确。

当“ -scale ” 参数为单一“ -1 ” 时,输出的系统结果为该方向上的镜面映像,当三个方向上的输入全部为“ -1 ”(即“-scale -1 -1 -1”)时,系统的结果机构为原来结构的坐标原点对称映像。

在程序输出时,可以只输出系统的某一个组,或者某一个部分。

可以建立划分更为细致的索引文件,这样可以进行细致的选择。

系统结构的周期性可以在程序中进行粗略去除,但是必须保证结构文件中周期性盒子的信息绝对正确,因为editconf 去除周期性的算法十分简单,只是将原子坐标直接减去盒子边长。

当程序输出文件为.pdb 文件时,可以使用“ -bf ” 参数为输出文件添加B-factor。

B-factor要在一定的格式的文件中读取,这个格式要求文件第一行为文件中所含B-factor 数值个数,文件第二行开始没行要有一个索引号,然后就是该索引后面的B-factor值。

B-factor默认是一个残基一个数值,如果每一个原子有一直B-factor 值,则要使用“ -atom ” 参数。

如果使用“ -legend ” 参数,那么程序在结构文件中会生成一列CA 原子,这些原子带有B-factor数字,并从最小B-factor值排列到最高,便于可视化软件显示。

如果使用“ -mead ” 参数,那么程序将输出一个被静电统计软件MEAD(玻松-波尔兹曼方程求解软件)使用的pdb 文件(或者pqr 文件)。

使用这个参数有一个前提条件,就是输入文件必须是模拟打包文件(如tpr 文件),因为这样的文件包含了力场参数。

这个输出pdb (pqr) 文件中,B-factor 数值列为该行原子的范德华半径,而occupancy列则为该原子的电量。

“ -grasp ” 参数的作用很类似,但是B-factor 列和occupancy列的数值互换。

另外一个十分的有用的参数就是“ -label ” 参数,它可以为pdb 文件加上一个链标记。

如果一个文件里面不同残基属于不同肽链,那么这个参数可以帮这些残基指定肽链归属,这样不但可以帮助可视化,在建立模拟系统时也十分方便。

editconf 还可以修改结构文件的盒子类型,比如以下就是立方体盒子修改成一个等边八面体:
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ ++++++
editconf -f <in.gro> -rotate 0 45 35.264 -bt octahedron -box <veclen> -o <out.gro>
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ ++++++
其中,<veclen>的数值为正方形变成乘于根号三除以二: a*sqrt(3)/2。

程序输入文件:
-------------
-f:
输入结构文件,文件格式可以是gro、g96、pdb、tpr、tpb 或者tpa。

-n:
索引文件。

-o:
输出文件,文件格式为gro、g96 或者pdb 。

-mead:
输出文件,MEAD程序的坐标文件,包含力场参数。

-bf:
B-factor数值文件,文件格式见上文。

其他参数:
---------
-w:
程序结束自动打开输出文件。

-ndef:
在索引文件的默认组中选择输出范围。

-bt:
指定盒子类型,支持的盒子类型有triclinic(斜方体)、cubic(正方体)、dodecahedron (等边十二面体)或者octahedron(等边八面体)。

-box:
指定盒子三个矢径,(a,b,c)。

-angle:
盒子矢径间夹角,默认都是90 度(bc,ac,ab)。

-d:
溶质分子(蛋白,核酸等)到盒子边界的距离。

-c:
把溶质分子放在盒子中间,“-box” 和“-d” 参数的默认参数。

-center:
为输出结构指定几何坐标中心,默认为(0,0,0)。

-translate:
平移分子机构,比如“-translate 0 0 2.5” 表示将分子结构向Z 轴正方向平移2.5 纳米。

-rotate:
旋转分子结构,见上文。

-princ:
对齐分子结构,见上文。

-scale:
扫描分子结构,“-scale 1 1 1” 表示在三个坐标方向上进行扫描。

-density:
指定输出结构文件的分子密度。

-pbc:
处理结构文件的周期性。

-grasp:
将原子的力场参数存储在输出文件中,见上文。

-rvdw:
给定默认原子的默认范德华半径。

该参数可用于处理缺少力场参数的原子。

-sig56:
使用范德华能量最低点到原子中心距离的一半距离,而不使用简单使用范德华半径的一半。

(特殊使用,多特殊?)
-vdwread:
从默认vdwradii.dat 文件中读取原子的范德华半径,而不使用力场提供的范德华半径。

-atom:
为各个原子添加B-factor 数值。

-legend:
在结构文件中添加B-factor 参考值,见上文。

-label:
为各个残基指定肽链归属。

注意:对于复杂的分子,最好使用trjconv 去除结构周期性。

:)
(9)朗格文动力学( Langevin Dynamics )
2009-06-19 14:10
朗格文动力学( Langevin Dynamics ) 是控制模拟系统能量的一种常用算法,在多种分子模拟软件中都可以看到。

分子模拟在一定的系综下进行,所以要保持系统状态不变,比如控制系统温度,压强等。

由于计算机不是百分百精准,微小的误差在长时间的模拟过程中可能被不停
积累和放大,于是需要不同的方法对系统进行不停调整。

这些调整的方法有很多,比如Berendersen, Nose-hoover, Langevin。

模拟系统中的原子受到起周围原子相互作用力,依据所受作用力根据牛顿第二定律运动。

朗格文动力学的实现方法是给原子添加两个额外的作用力,即摩擦力和随机力。

该摩擦力大小为原子速度乘于其质量再乘于一个摩擦因子(gamma),其方向与原子速度相反。

而随即力可以理解为来自溶液分子的随机相互作用等。

这个两个力一起调节系统中各个原子的运动,以达到对整个系统能量的调控,即调控系统温度,压强等。

(10)GMX.3 do_dssp
本程序调用第三发软件DSSP,从轨迹文件中读出蛋白质的二级结构信息。

要使用该程序,必先安装好DSSP 软件(恩,用google 或者baidu 小搜一下)。

安装DSSP 完毕后(/home/user/soft/bin/dssp),在shell 中定义DSSP 变量:
setenv DSSP /home/user/soft/bin/dssp
如果使用bash,则export DSSP='/home/user/soft/bin/dssp'。

可以该变量直接加到shell的配置文件中。

程序输出文件为.xpm 文件,该文件其实是一个文本文件,可以一般文本编辑器打开。

文件中用不同字符表示蛋白质每一个残基属于什么二级结构,并随时间变化,同时定义每个字符的颜色。

.xpm 文件可视化有一点麻烦,Gromacs的另外一个程序xpm2ps可以将其转化为PostScript文件,为 .eps 文件后缀,可以直接打开或直接使用到Latex 文件中。

do_dssp可以统计属于某二级结构类型的残基数目,“-sss” 参数用于选择二级结构类型,“-sc“ 参数则把统计结果输出到scount.xvg 文件中(其实这个文件包含了所有
不同二级结构氨基酸残基数目,可以用xmgrace的“-nxy” 参数打开)。

本程序还可以计算每一个残基的溶液可及化面积(Solvent Accesible Surface, SAS),以绝对平方埃(A^2)表示,或者最大SAS 面积的分数表示(最大SAS 定义为该一残基在甘氨酸链中的SAS 面积)。

Gromacs另外一个程序g_sas也可以求取SAS,效率较高并且相对简单。

程序同时可以使用输出一个ssdump.dat 文件。

该文件包含了各个残基的二级结构信息,可以被另外一个程序g_chi使用,以分析残基直接二面角性质与二级结构直接的关系。

(其实这个文件就是一个文本文件,里面用字符代表残基的二级结构,如H 表示螺旋,B 表示折叠等。


程序输入输出文件:
---------------
-f:
轨迹文件,xtc、trr等。

-s :
模拟系统tpr 文件。

-n:
索引文件。

-ssdump:
输出ssdump.dat 文件。

-map:
程序输出xmp 文件的原色库文件,如无则默认输出。

(让其默认挺好的啦)
-o:
输出文件,xmp 文件。

各个残基属于某二级结构信息并随模拟时间变化。

相关文档
最新文档