蛋白质数据库应用swiss-port和PPD
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
摘要
本文对SWISS-PROT和PDB两个数据库进行了简要介绍以及如何进行序列的单个下载和批量下载进行了说明。
关键词:SWISS-PROT PDB 下载
ABSTRACT
In this paper,I make a brief introduction about SWISS-PROT and PDB and how to make a single download and batch download about sequence.
Key words:SWISS-PROT PDB download
摘要 0
ABSTRACT (1)
一Swiss-Port的使用方法 (4)
1.1网站简介 (4)
1.2数据下载: (5)
二 PDB的使用方法 (5)
2.1网站简介 (5)
2.2数据下载 (9)
一Swiss-Port的使用方法
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。Swiss-Port的网址为http://www.expasy.ch/sprot。
1.1网站简介
打开网站后可以找到如下所示部分:
在处可以查询序列。点击后会有如下界面:
在输入区输入序列:MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHL
VLRLRGG,点击按钮可以进行查找(查找时还可以在其下方进行一系列的筛选条件控制)。
查询后会看到如下界面,在这里可以看到你进行查询的时间,查询所用时间,
查找到的相关序列的数目以及相似度和其他相关信息。
1.2数据下载:
没有找到数据下载的信息。
二 PDB的使用方法
PDB是蛋白质结构数据库的英文简称。PDB是目前最主要的收集生物大分子(蛋白质、核酸和糖)三维结构的数据库,是通过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质、多糖、核酸、病毒等生物大分子的三维结构数据库。随着晶体衍射技术的不断改进,结构测定的速度和精度也逐步提高。90年代以来,随着多维核磁共振溶液构象测定方法的成熟,使那些难以结晶的蛋白质分子的结构测定成为可能。蛋白质分子结构数据库的数据量迅速上升。据2000年5月统计,PDB数据库中已经存放了1万2千多套原子坐标,其中大部分为蛋白质,包括多肽和病毒。此外,还有核酸、蛋白和核酸复合物以及少量多糖分子。近年来,核酸三维结构测定进展迅速。PDB数据库中已经收集了800多套核酸结构数据。
PDB数据库允许用户用各种方式以及布尔逻辑组合(AND、OR和NOT)进行检索,可检索的字段包括功能类别、PDB代码、名称、作者、空间群、分辨率、来源、入库时间、分子式、参考文献、生物来源等项。用户不仅可以得到生物大分子的各种注释、坐标、三维图形、VAML等,并能从一系列指针连接到与PDB有关的数据库,包括SCOP、CATH、Medline、ENZYME、SWISS-3DIMAGE等。可通过FTP下载PDB数据。所有的PDB文件均有压缩和非压缩版以适应用户传输需要。PDB的电子公告版BBS和电子邮件兴趣小组(Mailing List)为用户提供了交流经验和发布新闻的空间。在PDB 的服务器上还提供与结构生物学相关的多种免费软件如Rasmol、Mage、PDBBrowser、3DB Brower等。其网址为/pdb/home/home.do。
2.1网站简介
打开主页后可以找到下图所示部位:
单击进入下图界面:
在“Sequence”出输入如下序列:MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLS DYNIQKESTLHLVLRLRGG
单击可以再不查看结果得情况下知道有多少个相似序列。单击进行搜索,查看结果。找到结果中的一个序列如图,打开。
此时我们会看到下图的结果:
标题栏的内容依次为:摘要、序列、注释、序列相似性、3D相似性、文献、生物及化学报告、方法、几何结构、链接。
(1)Summary
包含有Primary Citation(主引)、Molecular Description(分子描述)、Source(来源)、External Domain Annotations (外部与注解,该部分只要在可以找到的情况下才会显示)几部分。
在右侧会看到下图,这是该序列的立体结构,点击图片可以查看详细信息。
在其上方会看到下面的下载项目,在此处可以进行下载。
(2)Sequence
包含有注解、偏好性、参考文献。
在注解上方可以一看到这样的部分:
点击FASTA可以下载该序列,点击Sequence&DSSP可以查看二级结构与氨基酸序列的对应关系,点击Image可以查看二级结构图片。
(3)Annotation
包含有其他数据库的相关数据。
(4)Seq.Similaarity
序列的相似度。
(5)3D Similarity
3D结构相似性。
(6)Literature
相关的文献信息在这里可以找到。
(7)Biol.&Chem.
生物和化学报告。