蛋白质分析相关数据库及网站
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
表1蛋白质相互作用分析相关数据库及网站
蛋白质序列分析和结构预测
【实验目的】
1、掌握蛋白质序列检索的操作方法;
2、熟悉蛋白质基本性质分析;
3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测;
4、了解蛋白质结构预测。
【实验内容】
1、使用Entrez或SRS信息查询系统检索人脂联素(adiponectin)蛋白质序列;
2、使用BioEdit软件对上述蛋白质序列进行分子质量、氨基酸组成、和疏水性等基本性质分析;
3、对人脂联素蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析;
4、对人脂联素蛋白质序列进行motif结构分析;
5、对人脂联素蛋白质序列进行二级结构和三维结构预测。
【实验方法】
1、人脂联素蛋白质序列的检索:
(1)调用Internet浏览器并在其地址栏输入Entrez网址(/Entrez);
(2)在Search后的选择栏中选择protein;
(3)在输入栏输入homo sapiens adiponectin;
(4)点击go后显示序列接受号及序列名称;
(5)点击序列接受号NP_004788 (adiponectin precursor;adipose most abundant gene transcript 1 [Homo sapiens])后显示序列详细信息;
(6)将序列转为FASTA格式保存(参考上述步骤使用SRS信息查询系统检索人脂联素蛋白质序列);
2、使用BioEdit软件对人脂联素蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析:
打开BioEdit软件→将人脂联素蛋白质序列的FASTA格式序列输入分析框→点击左侧序列说明框中的序列说明→点击sequence栏→选择protein→点击Amino Acid Composition→查看该蛋白质分子质量和氨基酸组成;或者选择protein后,点击Kyte & Doolittle Mean Hydrophobicity Profile→查看该蛋白质分子疏水性水平;
3、人脂联素蛋白质序列的蛋白质同源性分析:
(1)进入NCBI/Blast网页;
(2)选择Protein-protein BLAST (blastp);
(3)将FASTA格式序列贴入输入栏;
(4)点击BLAST;
(5)查看与之同源的蛋白质;
4、人脂联素蛋白质序列的motif结构分析:
(1)进入http://hits.isb-sib.ch/cgi-bin/PFSCAN网页;
(2)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏;
(3)点击Scan;
(4)查看分析结果(注意Prosite Profile中的motif information);
5、人脂联素蛋白质序列的二级结构预测:
(1)进入下列蛋白结构预测服务器网址http://www.embl-heidelberg.de/predictprotein//predictprotein.html
(The PredictProtein Server);
(2)在You can栏点击default;
(3)填写email地址和序列名称;
(4)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏点击Submit;
(5)从email信箱查看分析结果;
6、人脂联素蛋白质序列的三维结构预测:
(1)进入/swissmod/SWISS-MODEL.html (SwissModel First Approach Mode)网页;
(2)填写email地址、姓名和序列名称;
(3)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏;
(4)点击Send Request;
(5)从email信箱查看分析结果(注:需下载软件入rasmol查看三维图象)。
【作业】
1、提交使用上述软件对人脂联素蛋白质序列进行基本性质分析、同源性分析、motif结构分析以及二级结构和三维结构预测的结果;
2、相互对比结果,说明产生不同结果的原因,总结进行上述分析所需注意的关键事项。
蛋白质序列分析
pfam /蛋白质结构域预测
smart http://smart.embl-heidelberg.de/ 蛋白质结构域预测
BLOCKS / 蛋白质家族的序列保守区域
CluSTr /clustr/ 将SWISS-PROT+TrEMBL蛋白自动归类InterPro /interpro/ 蛋白质家族、结构域和位点的集成信息资源PIR-ALN /pirwww/dbinfo/piraln.html 蛋白质序列联配
PRINTS /dbbrowser/PRINTS/ 分层的基因家族指纹PROSITE http://www.expasy.ch/prosite/ 具有生物学意义的蛋白模式和轮廓ProtoMap / 对SWISS-PROT蛋白质进行自动分类
SBASE http://hydra.icgeb.trieste.it/~kristian/SBASE/ 注释了的蛋白质结构域序列SYSTERS http://systers.molgen.mpg.de/ 基于多种资源对蛋白质序列进行分类Emotif /emotif 蛋白质序列模体查询
Iproclass /iproclass/ 注释了的蛋白质分类数据库
PFSCAN www.isrec.isb-sib.ch/software/PFSCAN_form.html 蛋白质序列的(profile)分析
Compute pI/Mw- http://www.expasy.ch/ch2d/pi_tool.html蛋白质序列的理论等电点、分子量的计算
CATH- /bsm/cath 通过自动、手动方式进行蛋白质结
构相关性的系统分类,
CATH是以下四个单词的第一个字母的组合
Class(类) -源于二级结构的最高级别的分类
Architecture(构造) -独立于拓扑结构的二级结构排列描述。
Topology(拓扑结构)-参照已知的折叠及观测的结构进行拓扑分析
Homology(同源)-结构间相同的拓扑布局、不同的二级结构(与功能相似性相关)描述
CRASP http://wwwmgs.bionet.nsc.ru/Programs/CRASP/default.htm 蛋白质序列的相关分析
FPAT /fpat/-an 检索分子序列数据库模式的简易方法Hydropathy Plot (GIF image) /nixon/webtools/hydro/default.htm绘制亲疏水图
MOTIF http://www.genome.ad.jp/SIT/MOTIF.html- 蛋白质序列模式检索
RandSeq http://www.expasy.ch/sprot/randseq.html- 随机的蛋白质序列生长子REPRO- http://www.embl-heidelberg.de/repro/repro_info.htmlA 蛋白质重复片断识别服务器
paralign / 蛋白质、核酸序列相似性检索
SignalP http://www.cbs.dtu.dk/services/SignalP/ 在不同的物种中预测信号肽及酶切位点
SIM- http://expasy.hcuge.ch/sprot/sim-prot.html 由用户定义的最佳两序列对比TMpred http://ulrec3.unil.ch/software/TMPRED_form.html - 蛋白质跨模区预测、定位,该方法基于统计学结果,通过权重矩阵打分进行预测分析
Coils http://ulrec3.unil.ch/software/COILS_form.html 对比分析具有双股卷曲结构的序列同源性打分,进而计算适于采用该结构的序列的几率
GuessProt http://www.expasy.ch/www/guess-prot.html 选择SwissProt蛋白的等电点、分子量
MassSearch http://cbrg.inf.ethz.ch/subsection3_1_3.html- 蛋白质消化后的聚集检索
Phospepsort http://genome.eerie.fr/gcg/phospepsort-query.html- 磷酸化位点分类SAPS http://ulrec3.unil.ch/software/SAPS_form.html- 蛋白质序列统计分析
Sleuth /molebio/pro... du/pub/sleuth/data- 氨基酸构象及可及性分析
PEDANT-http://pedant.mips.biochem.mpg.de/frishman/pedant.html 蛋白质提炼PROVE http://www.ucmb.ulb.ac.be/%7Ejoan/survol/form.html 蛋白质原子体积计算
Naccess (ASA for proteins)/research/themes/bioinformatics/ 利用Lee & Richards方法描述分子表面性质的计算程序,能够计算蛋白质的表面
准确地将已知的蛋白质序列转化成DNA序列
根据物种在swiss-prot里面翻转
/index.php?id=tools/backtranslation&lang=eng
/sms2/re_trans.html
/sms2/re_trans.html
进去之后,点击Codon Usage Database,然后将你要的物种的拉丁文名输入QUERY Box for search with Latin name of organism ,点击submit,然后就可以看到各个物种的一个密码子列表。
然后替换那个大肠杆菌就可以了。