蛋白质分析相关数据库及网站
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋⽩质分析相关数据库及⽹站
表1蛋⽩质相互作⽤分析相关数据库及⽹站
蛋⽩质序列分析和结构预测
【实验⽬的】
1、掌握蛋⽩质序列检索的操作⽅法;
2、熟悉蛋⽩质基本性质分析;
3、熟悉基于序列同源性分析的蛋⽩质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋⽩质功能预测;
4、了解蛋⽩质结构预测。
【实验内容】
1、使⽤Entrez或SRS信息查询系统检索⼈脂联素(adiponectin)蛋⽩质序列;
2、使⽤BioEdit软件对上述蛋⽩质序列进⾏分⼦质量、氨基酸组成、和疏⽔性等基本性质分析;
3、对⼈脂联素蛋⽩质序列进⾏基于NCBI/Blast软件的蛋⽩质同源性分析;
4、对⼈脂联素蛋⽩质序列进⾏motif结构分析;
5、对⼈脂联素蛋⽩质序列进⾏⼆级结构和三维结构预测。
【实验⽅法】
1、⼈脂联素蛋⽩质序列的检索:
(1)调⽤Internet浏览器并在其地址栏输⼊Entrez⽹址(/doc/9364f7ae783e0912a3162a12.html
/Entrez);
(2)在Search后的选择栏中选择protein;
(3)在输⼊栏输⼊homo sapiens adiponectin;
(4)点击go后显⽰序列接受号及序列名称;
(5)点击序列接受号NP_004788 (adiponectin precursor;adipose most abundant gene transcript 1 [Homo sapiens])后显⽰序列详细信息;
(6)将序列转为FASTA格式保存(参考上述步骤使⽤SRS信息查询系统检索⼈脂联素蛋⽩质序列);
2、使⽤BioEdit软件对⼈脂联素蛋⽩质序列进⾏分⼦质量、氨基酸组成和疏⽔性等基本性质分析:
打开BioEdit软件→将⼈脂联素蛋⽩质序列的FASTA格式序列输⼊分析框→点击左侧序列说明框中的序列说明→点击sequence 栏→选择protein→点击Amino Acid Composition→查看该蛋⽩质分⼦质量和氨基酸组成;或者选择protein后,点击Kyte & Doolittle Mean Hydrophobicity Profile→查看该蛋⽩质分⼦疏⽔性⽔平;
3、⼈脂联素蛋⽩质序列的蛋⽩质同源性分析:
(1)进⼊NCBI/Blast⽹页;
(2)选择Protein-protein BLAST (blastp);
(3)将FASTA格式序列贴⼊输⼊栏;
(4)点击BLAST;
(5)查看与之同源的蛋⽩质;
4、⼈脂联素蛋⽩质序列的motif结构分析:
(1)进⼊http://hits.isb-sib.ch/cgi-bin/PFSCAN⽹页;
(2)将⼈脂联素蛋⽩质序列的FASTA格式序列贴⼊输⼊栏;
(3)点击Scan;
(4)查看分析结果(注意Prosite Profile中的motif information);
5、⼈脂联素蛋⽩质序列的⼆级结构预测:
(1)进⼊下列蛋⽩结构预测服务器⽹址http://www.embl-heidelberg.de/predictprotein//predictprotein.html
(The PredictProtein Server);
(2)在You can栏点击default;
(3)填写email地址和序列名称;
(4)将⼈脂联素蛋⽩质序列的FASTA格式序列贴⼊输⼊栏点击Submit;
(5)从email信箱查看分析结果;
6、⼈脂联素蛋⽩质序列的三维结构预测:
(1)进⼊/doc/9364f7ae783e0912a3162a12.html /swissmod/SWISS-MODEL.html (SwissModel First Approach Mode)⽹页;
(2)填写email地址、姓名和序列名称;
(3)将⼈脂联素蛋⽩质序列的FASTA格式序列贴⼊输⼊栏;
(4)点击Send Request;
(5)从email信箱查看分析结果(注:需下载软件⼊rasmol查看三维图象)。
【作业】
1、提交使⽤上述软件对⼈脂联素蛋⽩质序列进⾏基本性质分析、同源性分析、motif结构分析以及⼆级结构和三维结构预测的结果;
2、相互对⽐结果,说明产⽣不同结果的原因,总结进⾏上述分析所需注意的关键事项。
蛋⽩质序列分析
pfam /doc/9364f7ae783e0912a3162a12.html /蛋⽩质结构域预测
smart http://smart.embl-heidelberg.de/ 蛋⽩质结构域预测
BLOCKS /doc/9364f7ae783e0912a3162a12.html / 蛋⽩质家族的序列保守区域
CluSTr /doc/9364f7ae783e0912a3162a12.html /clustr/ 将SWISS-PROT+TrEMBL蛋⽩⾃动归类InterPro /doc/9364f7ae783e0912a3162a12.html /interpro/ 蛋⽩质家族、结构域和位点的集成信息资源PIR-ALN /doc/9364f7ae783e0912a3162a12.html /pirwww/dbinfo/piraln.html 蛋⽩质序列联配
PRINTS /doc/9364f7ae783e0912a3162a12.html /dbbrowser/PRINTS/ 分层的基因家族指纹PROSITE http://www.expasy.ch/prosite/ 具有⽣物学意义的蛋⽩模式和轮廓ProtoMap
/doc/9364f7ae783e0912a3162a12.html / 对SWISS-PROT蛋⽩质进⾏⾃动分类
SBASE http://hydra.icgeb.trieste.it/~kristian/SBASE/ 注释了的蛋⽩质结构域序列SYSTERS http://systers.molgen.mpg.de/ 基于多种资源对蛋⽩质序列进⾏分类Emotif /doc/9364f7ae783e0912a3162a12.html /emotif 蛋⽩质序列模体查询
Iproclass /doc/9364f7ae783e0912a3162a12.html /iproclass/ 注释了的蛋⽩质分类数据库
PFSCAN www.isrec.isb-sib.ch/software/PFSCAN_form.html 蛋⽩质序列的(profile)分析
Compute pI/Mw- http://www.expasy.ch/ch2d/pi_tool.html蛋⽩质序列的理论等电点、分⼦量的计算
CATH- /doc/9364f7ae783e0912a3162a12.html /bsm/cath 通过⾃动、⼿动⽅式进⾏蛋⽩质结
构相关性的系统分类,
CATH是以下四个单词的第⼀个字母的组合
Class(类) -源于⼆级结构的最⾼级别的分类
Architecture(构造) -独⽴于拓扑结构的⼆级结构排列描述。
Topology(拓扑结构)-参照已知的折叠及观测的结构进⾏拓扑分析
Homology(同源)-结构间相同的拓扑布局、不同的⼆级结构(与功能相似性相关)描述
CRASP http://wwwmgs.bionet.nsc.ru/Programs/CRASP/default.htm 蛋⽩质序列的相关分析
FPAT /doc/9364f7ae783e0912a3162a12.html /fpat/-an 检索分⼦序列数据库模式的简易⽅法Hydropathy Plot (GIF image) /doc/9364f7ae783e0912a3162a12.html /nixon/webtools/hydro/default.htm绘制亲疏⽔图
MOTIF http://www.genome.ad.jp/SIT/MOTIF.html- 蛋⽩质序列模式检索
RandSeq http://www.expasy.ch/sprot/randseq.html- 随机的蛋⽩质序列⽣长⼦REPRO- http://www.embl-
heidelberg.de/repro/repro_info.htmlA 蛋⽩质重复⽚断识别服务器
paralign /doc/9364f7ae783e0912a3162a12.html / 蛋⽩质、核酸序列相似性检索
SignalP http://www.cbs.dtu.dk/services/SignalP/ 在不同的物种中预测信号肽及酶切位点
SIM- http://expasy.hcuge.ch/sprot/sim-prot.html 由⽤户定义的最佳两序列对⽐TMpred
http://ulrec3.unil.ch/software/TMPRED_form.html - 蛋⽩质跨模区预测、定位,该⽅法基于统计学结果,通过权重矩阵打分进⾏预测分析
Coils http://ulrec3.unil.ch/software/COILS_form.html 对⽐分析具有双股卷曲结构的序列同源性打分,进⽽计算适于采⽤该结构的序列的⼏率
GuessProt http://www.expasy.ch/www/guess-prot.html 选择SwissProt蛋⽩的等电点、分⼦量
MassSearch http://cbrg.inf.ethz.ch/subsection3_1_3.html- 蛋⽩质消化后的聚集检索
Phospepsort http://genome.eerie.fr/gcg/phospepsort-query.html- 磷酸化位点分类SAPS
http://ulrec3.unil.ch/software/SAPS_form.html- 蛋⽩质序列统计分析
Sleuth /doc/9364f7ae783e0912a3162a12.html /molebio/pro... du/pub/sleuth/data- 氨基酸构象及可及性分析
PEDANT-http://pedant.mips.biochem.mpg.de/frishman/pedant.html 蛋⽩质提炼PROVE
http://www.ucmb.ulb.ac.be/%7Ejoan/survol/form.html 蛋⽩质原⼦体积计算
Naccess (ASA for proteins)/doc/9364f7ae783e0912a3162a12.html /research/themes/bioinformatics/ 利⽤Lee & Richards⽅法描述分⼦表⾯性质的计算程序,能够计算蛋⽩质的表⾯
准确地将已知的蛋⽩质序列转化成DNA序列
根据物种在swiss-prot⾥⾯翻转
/doc/9364f7ae783e0912a3162a12.html /index.php?id=tools/backtranslationá=eng
/doc/9364f7ae783e0912a3162a12.html /sms2/re_trans.html
/doc/9364f7ae783e0912a3162a12.html /sms2/re_trans.html
进去之后,点击Codon Usage Database,然后将你要的物种的拉丁⽂名输⼊QUERY Box for search with Latin name of organism ,点击submit,然后就可以看到各个物种的⼀个密码⼦列表。
然后替换那个⼤肠杆菌就可以了。