蛋白相互作用数据库
dip数据库使用

dip数据库使用引言DIP(Database of Interacting Proteins)是一个公共资源库,收集了已知的蛋白质相互作用信息。
该数据库对于研究蛋白质结构、功能、代谢、信号传导及疾病等领域都有重要的意义。
目前,DIP数据库已经更新至DIP20210706版本,其中共包含了23370种蛋白质、101194条相互作用信息。
DIP数据库特征1. 基于实验数据DIP数据库的数据来源都是经过实验证实的蛋白质相互作用信息,确保了数据的可信度和可靠性。
2. 多样的检索方式基于DIP数据库的特性和数据存储方式,DIP数据库提供了多种检索方式,如蛋白质名称、互作类型、PDB ID等。
同时,DIP数据库还支持同时检索多个蛋白质的互作信息。
3. 数据量大DIP数据库包含的蛋白质和互作信息的规模非常大,涵盖了很多不同物种的信息,可以为蛋白质相互作用的研究提供充分的数据支持。
1. 检索功能DIP数据库提供了丰富的检索功能,可以利用蛋白质名称、互作类型、PDB ID等多个维度进行搜索。
例如,在搜索框中输入“insulin receptor”,可以得到与该蛋白质互作的结果。
结果页面会显示片段名称、蛋白质名称、互作类型、互作分子、互作方法和参考文献等信息。
2. 展示页面DIP数据库的展示页面设计简洁且信息齐全。
用户可以在展示页面中获得蛋白质名称、物种、基因信息、蛋白质结构、蛋白质互作、信号传导通路、疾病相关性等详细信息。
在蛋白质互作信息页面,用户可以查看具体分子之间的互作类型、互作方法、互作域、序列相似性等信息,在参考文献中可以查询到基于实验的证据。
此外,DIP数据库还支持互作关系的可视化显示,以便更好地理解分子之间的相互作用情况。
DIP数据库也提供数据下载功能,用户可以根据自己的需要将数据以各种格式下载下来,如XML、TAB、FASTA和SQL等。
此外,DIP数据库还支持RESTful API接口,方便用户使用编程语言进行调用。
蛋白质数据库

生物芯片北京国家工程研究中心湖南中药现代化药物筛选分中心暨湖南涵春生物有限公司常用数据库名录1、蛋白质数据库PPI - JCB 蛋白质与蛋白质相互作用网络•Swiss-Prot - 蛋白质序列注释数据库•Kabat - 免疫蛋白质序列数据库•PMD - 蛋白质突变数据库•InterPro - 蛋白质结构域和功能位点•PROSITE - 蛋白质位点和模型•BLOCKS - 生物序列分析数据库•Pfam - 蛋白质家族数据库 [镜像: St. Louis (USA), Sanger Institute, UK, Karolinska Institutet (Sweden)] •PRINTS - 蛋白质 Motif 数据库•ProDom - 蛋白质结构域数据库 (自动产生)•PROTOMAP - Swiss-Prot蛋白质自动分类系统•SBASE - SBASE 结构域预测数据库•SMART - 模式结构研究工具•STRING - 相互作用的蛋白质和基因的研究工具•TIGRFAMs - TIGR 蛋白质家族数据库•BIND - 生物分子相互作用数据库•DIP - 蛋白质相互作用数据库•MINT - 分子相互作用数据库•HPRD - 人类蛋白质查询数据库•IntAct - EBI 蛋白质相互作用数据库•GRID - 相互作用综合数据库•PPI - JCB 蛋白质与蛋白质相互作用网络2、蛋白质三级结构数据库•PDB - 蛋白质数据银行•BioMagResBank - 蛋白质、氨基酸和核苷酸的核磁共振数据库•SWISS-MODEL Repository - 自动产生蛋白质模型的数据库•ModBase - 蛋白质结构模型数据库•CATH - 蛋白质结构分类数据库•SCOP - 蛋白质结构分类 [镜像: USA | Israel | Singapore | Australia]•Molecules To Go - PDB数据库查询•BMM Domain Server - 生物分子模型数据库•ReLiBase - 受体/配体复合物数据库 [镜像: USA]•TOPS - 蛋白质拓扑图•CCDC - 剑桥晶体数据中心 (剑桥结构数据库 (CSD))•HSSP - 蛋白质二级结构数据库•MutaProt - PDB数据库中点突变的比较•SWISS-3DIMAGE - 蛋白质和其他生物分子的三维图像•BioImage - 生物图像数据库 (包含生物大分子图像) 3、蛋白质组数据库和链接•2-D胶数据库以及与2-D胶相关的数据库•蛋白质组链接4、与核酸相关的数据库•EMBL - EMBL核酸序列数据库 (EBI)•Genbank - GenBank核酸序列数据库 (NCBI)•DDBJ - 日本DNA数据库•dbEST - dbEST(表达序列标签)数据库 (NCBI)•dbSTS - dbSTS(序列标签位点)数据库 (NCBI)•AsDb - 异常剪切数据库•ACUTS - DNA非转录保守序列数据库•密码子数据库•EPD - 真核生物启动子数据库•HOVERGEN - 颈椎动物同源基因数据库•IMGT - 免疫遗传学数据库 [镜像: EBI]•ISIS - 内含子序列信息•RDP - 核糖体数据库•gRNAs db - gRNA数据库•PLACE - 植物DNA顺势调控元件数据库•PlantCARE - 植物中DNA顺势调控组件数据库•ssu rRNA - 欧洲核糖体RNA数据库-小核糖体•lsu rRNA - 欧洲核糖体RNA数据库-大核糖体•5S rRNA - 5S核糖体RNA数据库•tmRNA Website - tmRNA站点•tmRDB - tmRNA数据库•tRNA - tRNA剪切( Bayreuth大学)•uRNA db•RNA editing - RNA剪切位点•RNAmod db - RNA修饰数据库•TelDB - 多介质端粒数据库•MPDB - 分子探针数据库•VectorDB - 载体序列数据库5、糖类•FCCA - 糖类论坛•GlycoSuiteDB - 多聚糖数据库•Monosacharide browser - Space filling Fischer projection for monosaccharides•Thorkild's lectin page - 凝集素通道6、特殊物种数据库:人类:•OMIM - 孟德尔遗传在线--人类•GENATLAS - 人类基因图集•GeneClinics - 医学基因学库•GDB - 基因组数据库•GeneCards - 人类基因整合信息数据库•UDB - 人类基因图谱数据库•Ensembl人类基因组浏览器•UCSC人类基因组工作草图•TIGR HGI - TIGR人类基因组索引•Hs UniGene - GenBank中的人类转录本•STACK - 序列标签比对• - 人类基因预测•GenLink - 人类基因组资源数据库•GeneLynx - 人类基因组•HUGE - 人类未知基因-大型蛋白质反转录得到的cDNA (KIAA...)•HUNT - 人类异常转录本•CGAP - 癌症基因组解剖学•MGC - 哺乳动物基因•SCDb - 干细胞数据库•Homophila - 人类疾病基因与果蝇基因对比数据库•Human Protein Atlas - 人类正常组织蛋白质与癌细胞蛋白质表达与位点的比较•Chr at Rutgers - Rutgers的人类染色体信息•Chr at Sanger - Sanger Center的人类染色体信息•Chr Swiss-Prot list - Swiss-Prot的染色体信息脊椎动物:•OMIA - 孟德尔遗传在线--动物•MGI - 小鼠基因组学信息 [镜像: Australia]•Ensembl小鼠基因组浏览器•TIGR MGI - TIGR小鼠基因索引•Mm UniGene - GenBank 中的小鼠转录本(EST clusters) •MGC - 哺乳动物基因•Mouse gene knockouts db - 小鼠基因敲除数据库•RGD - 大鼠基因组数据库•RatMAP - 大鼠基因组数据库•TIGR RGI - TIGR大鼠基因组数据库•Rn Unigene - GenBank 中的大鼠转录本(EST clusters) •BOVMAP - 牛基因数据库 (法国)•DGP - 狗基因数据库•MIS - 孟德尔遗传--羊•Ark-Cat - 猫基因组数据库•Ark-Chicken - 鸡基因组数据库•Ark-Cow - 奶牛基因组数据库•Ark-Deer - 鹿基因组数据库•Ark-Horse - 马基因组数据库•Ark-Pig - 猪基因组数据库•Ark-Sheep - 绵羊基因组数据库•Ark-Turkey - 火鸡基因组数据库•FishBase -鱼类综合信息系统•Fugu genome project - 河豚基因组•Fugu - HGMP 河豚数据•- Ensembl 河豚基因组浏览器•Medakafish - Mekada fish (Oryzias latipes) server •Ark-Tilapia - 罗飞鱼基因组数据库•Ark-Salmon - 大马哈鱼基因组数据库•The fish net - 斑马鱼基因组数据库•Ensembl斑马鱼基因组浏览器线粒体和叶绿体:•GOBASE - 细胞器基因组数据库•MitoDat - 孟德尔遗传和线粒体数据库• C.caldarium - 蓝藻纲PK1菌株叶绿体基因组昆虫•Drosophila Swiss-Prot list - Swiss-Prot中的果蝇链接•FlyBase - 果蝇遗传数据库和分子数据库•BDGP - Berkeley果蝇基因组项目•FlyView - 果蝇图像数据库•Homophila - 人类疾病与果蝇基因对照数据库•蚊子基因组学•AnoDB - 疟蚊数据库•Ensembl蚊子基因组浏览器7、人类突变数据库•HGMD - 人类基因突变数据库•SVD - EBI序列变异数据库•GeneDis - 人类遗传病数据库8、特殊基因和蛋白质数据库•Allergens in Swiss-Prot - Swiss-Prot中过敏反应的命名与索引•Allergome - 过敏症反应分子数据库•Aminoacyl-tRNA synthetases in Swiss-Prot - Swiss-Prot 中氨基化tRNA合成酶列表9、转录后修饰数据库•DSDBASE - 二硫化物数据库 (数据来源于三级结构数据库) •GlycoSuiteDB - 多聚糖结构数据库•LIPID MAPS - 脂类代谢及路径10、系统发生学数据库•COG - 全基因组中编码的蛋白质的系统发生学分类方法•EGO - 真核生物基因分类方法•InParanoid - 真核生物分类11、芯片数据库•ArrayExpress - EBI中芯片数据•ExpressDB - 酵母菌和大肠杆菌表达数据库•GeneX - 基因表达工程12、专利数据库•DPD - DNA专利数据库•Ag Patents - USDA收录的农业工艺专利•Esp@cenet - 欧洲专利事务所专利信息数据库 (世界范围内)13、参考文献(目录数据库)•PubMed Medline server - PubMed查询•AGRICOLA - NAL农业查询数据库•Article@INIST - 科技信息数据库•Korean Journals Abstract db - 韩国杂志摘要数据库•SeqAnalRef - 序列分析文献14、字典, 读物, 课程 ,命名法•BioABACUS - 缩写词•BioTech's life science dictionary生物科技及生命科学字典•DCB - 细胞生物学字典(Julian Dow编写)15、生物软件数据库及目录•CLC Free Workbench - 可在Linux, MacOS X and Windows操作系统上运行的,对DNA、RNA和蛋白质进行算法分析的软件•CLC Protein Workbench - 可在Linux, MacOS X and Windows 操作系统上运行的,对DNA、RNA和蛋白质进行算法分析的软件•BioCatalog - EBI的生物目录16、生命科学资源•Biofind - 生物科技工业信息、评论及新闻•Bioinformatik.de - 生物信息学网页目录17、生物杂志和发行人•生物杂志主页:Swiss-Prot journals list - Swiss-Prot杂志列表• - 电子出版物目录• - 电子期刊目录18、发行人•Allen Press, Inc. - Allen出版社•AMA - 美国医学联合出版物•ACS - 美国化工协会出版物19、生物信息学杂志和通讯•BioInformer - EBI通讯•NCBI Newsletter -NCBI通讯•PDB Quaterly Newsletter - PDB通讯20、基因组通讯•Human Genome Project Information - 人类基因组计划•FGN - 真菌遗传学•Rice Genome Newsletter - 水稻基因组21、其他•IJC - 化学杂志•Plant Gene Register - 植物基因注册22、生物商业杂志•BioCentury - 生物世纪•BioWorld Online - 生物世界•Drug Discovery and Development - 药物发现和发展•GEN - 基因工程新闻23、综合性科学杂志•Nature•New Scientist•La Recherche•Science•Scientific American24、生物学研究机构•APS - 美国缩氨酸社区•ASCB - 美国细胞生物学社区•ASHG - 美国人类遗传学社区25、计算生物学服务器主页欧洲:•EBI - 欧洲生物信息学协会•EMBnet - 欧洲分子生物信息学网•EMBL - EMBL计算生物学机构美国和加拿大:•NCBI - 美国生物学信息中心•ABCC - NCI高级生物医学计算中心•ACGT - Oklahoma大学基因组技术中心亚洲•APBioNet - 亚太生物信息网•BIC-JNU - Jawaharlal Nehru大学生物信息学中心•DIC - Pune (印度)大学生物信息澳洲•APBioNet - 亚太生物信息网•ANGIS - 澳大利亚国家遗传信息服务中心•ANU - 澳大利亚国大学生物信息学研究组•APAF - 澳大利亚蛋白质组分析工具26、其他•HUJI - 耶路撒冷Hebrew大学基因组学和生物信息学服务中心•Weizmann Bioinfo/BCU - Weizmann计算生物学和生物信息学研究协会•SANBI - 南非生物信息学研究协会27、生物公司和制药公司•美国药物研究和制造商目录•Bioportfolio - 生物技术企业•Affymetrix, Inc. - Affymetrix公司28、生物信息公司•Aborygen•Accelrys, Inc•AlgoNomics NV t29、其他链接其他医学查询•HON - 基于网络的健康服务• - 药物网络指南•MedWeb - 医学链接其他科学查询•GPSDB - 基因和蛋白质同义词数据库•Chemcyclopedia Online - 商业化学试剂数据库。
蛋白质数据库使用说明

引言:蛋白质数据是生物信息学领域中非常重要的资源之一,它提供了大量关于蛋白质序列、结构、功能以及相互作用等方面的信息。
本文旨在介绍如何使用蛋白质数据库,帮助用户更好地利用这一资源进行研究。
概述:蛋白质数据库是一个集成了许多蛋白质信息的在线资源,用户可以通过搜索、浏览、等方式获取所需的信息。
其中,常用的蛋白质数据库包括NCBI、UniProt、PDB等。
这些数据库提供了丰富的蛋白质数据,并且不断更新以满足用户需求。
正文内容:1.数据库搜索功能1.1.关键词搜索1.1.1.输入蛋白质名称1.1.2.输入序列片段1.1.3.输入关键词1.2.高级搜索选项1.2.1.提供更精确的搜索结果1.2.2.支持过滤和排序功能1.2.3.可以根据相关字段进行搜索2.数据库浏览功能2.1.蛋白质分类2.1.1.按物种分类2.1.2.按功能分类2.1.3.按家族分类2.2.数据表格浏览2.2.1.查看蛋白质基本信息2.2.2.查看蛋白质序列2.2.3.查看蛋白质结构2.3.数据图谱浏览2.3.1.查看蛋白质相互作用网络2.3.2.查看蛋白质结构域分布2.3.3.查看蛋白质功能注释3.数据库功能3.1.蛋白质序列数据3.1.1.全部序列3.1.2.特定物种的序列3.2.蛋白质结构数据3.2.1.已解析的蛋白质结构3.2.2.蛋白质结构预测结果3.3.蛋白质相互作用数据3.3.1.已验证的相互作用数据3.3.2.预测的相互作用数据4.数据库工具与资源4.1.序列比对工具4.1.1.BLAST4.1.2.PSIBLAST4.2.结构预测工具4.2.1.SWISSMODEL4.2.2.Phyre24.3.功能注释资源4.3.1.GeneOntology4.3.2.InterPro4.4.数据库交互接口4.4.1.提供API接口4.4.2.支持数据提交与5.数据库更新与维护5.1.数据更新频率5.2.数据质量保证5.3.用户反馈与支持5.4.数据库版本与历史记录总结:蛋白质数据库为研究人员提供了丰富的蛋白质信息资源,通过搜索、浏览、等功能,用户可以轻松地获取需要的数据。
STRING数据库的蛋白质相互作用(PPI)网络分析

STRING数据库的蛋白质相互作用(PPI)网络分析STRING(Search Tool for the Retrieval of InteractingGenes/Proteins)数据库是一个用于存储蛋白质相互作用(PPI)信息的在线资源。
PPI网络分析是研究蛋白质之间相互作用的一种方法。
通过分析PPI网络,研究者可以了解蛋白质的功能和作用机制,揭示生物系统的复杂性。
在本篇文章中,我们将探讨PPI网络分析的意义、方法和应用。
PPI网络分析的意义在于帮助我们理解蛋白质的功能和相互作用。
蛋白质是细胞中最重要的功能分子之一,它们通过相互作用形成复杂的网络结构,从而参与调控细胞的生理和病理过程。
通过构建PPI网络并进行分析,我们可以了解蛋白质在细胞中的相互关系,进而找到调控的关键因子。
PPI网络的构建通常基于实验数据或计算机预测。
实验方法包括酵母双杂交、共免疫沉淀和质谱分析等。
这些实验技术可以检测到蛋白质之间的物理相互作用。
计算机预测方法则基于已知蛋白质结构和序列信息,通过算法判断蛋白质之间是否可能相互作用。
STRING数据库整合了多种实验和计算方法生成的PPI数据,提供了更全面的PPI网络信息。
PPI网络分析通常包括网络图的构建和网络特性的分析。
网络图由节点和边组成,其中节点代表蛋白质,边表示蛋白质之间的相互作用。
网络构建可以基于已知的实验数据或计算机预测结果。
网络特性分析包括节点度数、网络连通性、模块化等指标的计算。
这些指标可以帮助我们了解网络的结构和特点。
PPI网络分析的应用非常广泛。
首先,它可以帮助我们预测蛋白质的功能。
蛋白质的功能通常与其相互作用的伙伴密切相关。
通过分析PPI网络,我们可以推断一个未知蛋白质的功能,并为后续实验提供指导。
其次,PPI网络分析还可以帮助我们识别关键的调控通路和靶点。
在许多疾病中,蛋白质相互作用的异常可能是病理过程的关键因素。
通过分析PPI网络,我们可以找到与疾病相关的节点和模块,并设计针对性的治疗策略。
基于元数据的异构蛋白质-蛋白质相互作用数据库整合

大量 来 源 于 实 验 和 预 测 的 数 据 。 这些 数 据 存 储 于彼 此 异 构 的 数 据 库 中 。对 上 述 异 构 数 据 库 进 行 数 据 整 合 是 实 现 共 享 和最 大 限 度 利 用 已 有 蛋 白质 - 白质 相互 作 用 数 据 必须 解 决 的关 键 问 题 。据 此 问 题 提 出 了基 于 元 数 据 理 论 和 蛋
Ab ta t rti—rti neat n P I) aefn a na fr n esa dn ftebooia poesso sr c :Poenp oenitrci s( Ps r u d me tl o d rtn igo h Hale Waihona Puke lgcl rc se f o u
l e I h o r e o h t d f P I ,a l r e a u t o a a wh c a r m x e i n s a d p e ito s i . n t e c u s f t e su y o P s a g mo n fd t i h c me fo e p rme t n r d c i n f h v e n g n r t d, a d r so e i h t r g n o s a a a e . I o d r o mp e n d t s a i g n a e b e e eae n a e t r d n e e o e e u d t b s s n r e t i l me t aa h rn a d ma i z h s f d t x mie t e u e o a a,i i e u r d t a h s e e o e e u a a a e e i t g a e .Th s p p r p e e t d t s r q i h tt e e h t r g n o s d t b s s b n e r t d e i a e rs ne
如何利用STRING数据库分析蛋白间相互作用(PPI)?

如何利⽤STRING数据库分析蛋⽩间相互作⽤(PPI)?相信很多⼈在做蛋⽩分析的时候,经常被蛋⽩与蛋⽩间的互作⽹络所烦恼,那今天,我们就来给⼤家介绍⼀个神器,帮助⼤家能简单快捷地完成蛋⽩与蛋⽩互作⽹络。
这个软件是STRING。
STRING本⾝就收录了2031个物种,9.6 Million个蛋⽩和1380 Million种相互作⽤。
出来能进⾏蛋⽩-蛋⽩间互作⽹络外,这个数据库还能⽤来查找关注的蛋⽩的调控因⼦,共表达,基因组共线性,物种共存在,⽂本挖掘,实验验证信息等等,是⼀个对科研⼈员来说⼗分实⽤的数据库。
⾸页我们直接点击SEACH,进⾏搜索⾃⼰想要查找的蛋⽩质。
可以按蛋⽩名字搜索,也可以按序列搜索,都可以输⼊多个或多条,也可以按照蛋⽩家族或者物种浏览。
那我们就以trpA为例进⾏说明⼀下吧~这是搜索出来的结果。
每个点代表⼀个蛋⽩,他们都是可以进⾏拖动的。
点击其中⼀个蛋⽩,我们可以查看其详细注释信息,结构信息,功能域信息,序列信息,同源基因,还能以此基因为核⼼重构⽹络(与其相互作⽤最强的基因的⽹络展⽰)等。
由下边的图例解释说明可见,不同颜⾊的线代表相互作⽤确定的依据,有基于认证过的数据库,实验验证,基因邻近,共表达,同源推测,⽂本挖掘等。
如果关联的蛋⽩很多的情况下,我们还能直接通过点的颜⾊,直接找到相关蛋⽩。
同时,我们还可以进⾏筛选,调整线型的含义,相互作⽤的数⽬,数据来源,可信度筛选, 互作点数⽬限制等的不同操作。
⾯对这么多的基因,我们当然希望能做个功能富集分析,这样就能更加直接地看到每个蛋⽩的功能、偏好性等等的信息。
我们也可以直接点击“Analysis”进⾏选择分析。
调整完毕,最后就可以点击Exports输出结果。
今天的介绍就到这⾥了,希望能帮到⼤家喔~。
蛋白质组学研究中常用的网站和数据库

蛋白质组学研究中常用的网站和数据库蛋白质, 数据库, 研究本帖引用网址:/thread-35586-1-1.html一、蛋白质数据库1.UniProt (The Universal Protein Resource) 网址://uniprot/简介:由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成,提供详细的蛋白质序列、功能信息,如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等,同时提供其他数据库,包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。
2.PIR(Protein Information Resource) 网址:/简介:致力于提供及时的、高质量、最广泛的注释,其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort,与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。
3.BRENDA(enzyme database) 网址:简介:酶数据库,提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。
4.CORUM(collection of experimentally verifiedmammalian protein complexes) 网址:http://mips.gsf.de/genre/proj/corum/index.html简介:哺乳动物蛋白复合物数据库,提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database) 网址:.au/cybase简介:环状蛋白数据库,提供环状蛋白的序列、结构等数据,提供环化蛋白预测服务。
6.DB-PABP 网址:/DB_PABP/简介:聚阴离子结合蛋白数据库。
蛋白质功能-结构-相互作用预测网站工具合集

蛋白质组学蛋白质是生物体的重要组成部分,参与几乎所有生理和细胞代谢过程。
此外,与基因组学和转录组学比较,对一个细胞或组织中表达的所有蛋白质,及其修饰和相互作用的大规模研究称为蛋白质组学。
蛋白质组学通常被认为是在基因组学和转录组学之后,生物系统研究的下一步。
然而,蛋白质组的研究远比基因组学复杂,这是由于蛋白质内在的复杂特点,如蛋白质各种各样的翻译后修饰所决定的。
并且,研究基因组学的技术要比研究蛋白质组学的技术强得多,虽然在蛋白质组学研究中,质谱技术的研究已取得了一些进展。
尽管存在方法上的挑战,蛋白质组学正在迅速发展,并且对癌症的临床诊断和疾病治疗做出了重要贡献。
几项研究鉴定出了一些蛋白质在乳腺癌、卵巢癌、前列腺癌和食道癌中表达变化。
例如,通过蛋白质组学技术,人们可以在患者血液中明确鉴定出肿瘤标志物。
表1列出了更多的蛋白质组学技术用于研究癌症的例子。
另外,高尔基体功能复杂。
最新研究表明,它除了参与蛋白加工外,还能参与细胞分化及细胞间信号传导的过程,并在凋亡中扮演重要角色,其功能障碍也许和肿瘤的发生、发展有某种联系。
根据人类基因组研究,约1000多种人类高尔基体蛋白质中仅有500~600种得到了鉴定,建立一条关于高尔基体蛋白质组成的技术路线将有助于其功能的深入研究。
蛋白质组学是一种有效的研究方法,特别是随着亚细胞器蛋白质组学技术的迅猛发展,使高尔基体的全面研究变为可能。
因此研究人员希望能以胃癌细胞中的高尔基体为研究对象,通过亚细胞器蛋白质组学方法,建立胃癌细胞中高尔基体的蛋白质组方法学。
研究人员采用蔗糖密度梯度的超速离心方法分离纯化高尔基体,双向凝胶电泳(2-DE)分离高尔基体蛋白质,用ImageMaster 2D软件分析所得图谱,基质辅助激光解吸离子化飞行时间质谱(MALDI-TOF MS)鉴定蛋白质点等一系列亚细胞器蛋白质组学方法建立了胃癌细胞内高尔基体的蛋白图谱。
最后,人们根据分离出的纯度较高的高尔基体建立了分辨率和重复性均较好的双向电泳图谱,运用质谱技术鉴定出12个蛋白质,包括蛋白合成相关蛋白、膜融合蛋白、调节蛋白、凋亡相关蛋白、运输蛋白和细胞增殖分化相关蛋白。
蛋白质分析相关数据库及网站

表1蛋白质相互作用分析相关数据库及网站蛋白质序列分析和结构预测【实验目的】1、掌握蛋白质序列检索的操作方法;2、熟悉蛋白质基本性质分析;3、熟悉基于序列同源性分析的蛋白质功能预测,了解基于motif、结构位点、结构功能域数据库的蛋白质功能预测;4、了解蛋白质结构预测。
【实验内容】1、使用Entrez或SRS信息查询系统检索人脂联素(adiponectin)蛋白质序列;2、使用BioEdit软件对上述蛋白质序列进行分子质量、氨基酸组成、和疏水性等基本性质分析;3、对人脂联素蛋白质序列进行基于NCBI/Blast软件的蛋白质同源性分析;4、对人脂联素蛋白质序列进行motif结构分析;5、对人脂联素蛋白质序列进行二级结构和三维结构预测。
【实验方法】1、人脂联素蛋白质序列的检索:(1)调用Internet浏览器并在其地址栏输入Entrez网址(/Entrez);(2)在Search后的选择栏中选择protein;(3)在输入栏输入homo sapiens adiponectin;(4)点击go后显示序列接受号及序列名称;(5)点击序列接受号NP_004788 (adiponectin precursor;adipose most abundant gene transcript 1 [Homo sapiens])后显示序列详细信息;(6)将序列转为FASTA格式保存(参考上述步骤使用SRS信息查询系统检索人脂联素蛋白质序列);2、使用BioEdit软件对人脂联素蛋白质序列进行分子质量、氨基酸组成和疏水性等基本性质分析:打开BioEdit软件→将人脂联素蛋白质序列的FASTA格式序列输入分析框→点击左侧序列说明框中的序列说明→点击sequence栏→选择protein→点击Amino Acid Composition→查看该蛋白质分子质量和氨基酸组成;或者选择protein后,点击Kyte & Doolittle Mean Hydrophobicity Profile→查看该蛋白质分子疏水性水平;3、人脂联素蛋白质序列的蛋白质同源性分析:(1)进入NCBI/Blast网页;(2)选择Protein-protein BLAST (blastp);(3)将FASTA格式序列贴入输入栏;(4)点击BLAST;(5)查看与之同源的蛋白质;4、人脂联素蛋白质序列的motif结构分析:(1)进入http://hits.isb-sib.ch/cgi-bin/PFSCAN网页;(2)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏;(3)点击Scan;(4)查看分析结果(注意Prosite Profile中的motif information);5、人脂联素蛋白质序列的二级结构预测:(1)进入下列蛋白结构预测服务器网址http://www.embl-heidelberg.de/predictprotein//predictprotein.html(The PredictProtein Server);(2)在You can栏点击default;(3)填写email地址和序列名称;(4)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏点击Submit;(5)从email信箱查看分析结果;6、人脂联素蛋白质序列的三维结构预测:(1)进入/swissmod/SWISS-MODEL.html (SwissModel First Approach Mode)网页;(2)填写email地址、姓名和序列名称;(3)将人脂联素蛋白质序列的FASTA格式序列贴入输入栏;(4)点击Send Request;(5)从email信箱查看分析结果(注:需下载软件入rasmol查看三维图象)。
常用的生物数据库(二)

常用的生物数据库(二)引言概述:生物数据库是生物信息学领域的重要工具,可以帮助研究人员存储、管理和共享生物数据。
本文将介绍常用的生物数据库(二),以便研究人员更好地利用这些资源进行生物学研究。
正文内容:一、蛋白质相互作用数据库1. STRING数据库:提供蛋白质相互作用预测和注释功能。
2. IntAct数据库:收集整理蛋白质相互作用数据,提供数据检索和分析工具。
3. BioGRID数据库:整合多种物种的蛋白质相互作用数据,并提供丰富的功能注释。
二、基因组数据库1. GenBank数据库:包含大量的序列数据,包括基因组、转录本和蛋白质序列等。
2. ENSEMBL数据库:集成了各种生物信息学工具,提供全面的基因组注释信息。
3. UCSC数据库:基于人类基因组构建的浏览器,提供详细的基因组注释和可视化功能。
三、表达谱数据库1. GEO数据库:收集了大量的基因表达谱数据,可进行数据检索和分析。
2. ArrayExpress数据库:包含了来自各种高通量技术的表达谱数据,提供数据下载和分析工具。
3. TCGA数据库:整合了多种癌症的基因表达数据,可进行差异表达和生存分析等研究。
四、突变数据库1. dbSNP数据库:记录了常见的单核苷酸多态性(SNP)数据,是研究遗传变异的重要资源。
2. COSMIC数据库:专注于癌症相关的突变数据,包含了大量的突变谱系和功能注释信息。
3. ClinVar数据库:整合了与人类疾病相关的遗传变异数据,提供临床相关的注释信息。
五、药物数据库1. DrugBank数据库:收录了大量的药物信息,包括结构、作用机制和药理学数据等。
2. PubChem数据库:提供了大量的小分子化合物数据,可进行化学结构搜索和药物筛选等研究。
3. ChEMBL数据库:整合了化合物活性数据和药物靶点信息,可用于药物发现和优化。
总结:生物数据库为生物学研究提供了丰富的数据资源和分析工具。
蛋白质相互作用数据库、基因组数据库、表达谱数据库、突变数据库和药物数据库是常用的生物数据库之一。
蛋白结构域互作分析方法

蛋白结构域互作分析方法蛋白结构域互作分析是研究蛋白质相互作用的重要方法之一、蛋白结构域是蛋白质分子中的一段连续的高保守序列,具有特定的结构和功能。
通过分析蛋白质结构域之间的相互作用,可以揭示蛋白质互作网络的拓扑结构,进而理解蛋白质功能及其在细胞内信号传导、转录调控、蛋白质合成、代谢调控等生物过程中的作用。
本文将介绍几种常用的蛋白结构域互作分析方法。
1. 结构域相互作用数据库的分析方法:结构域相互作用数据库存储了已知的蛋白质结构域组合的信息,如DIP、BIND、IntAct等。
通过结构域相互作用数据库,可以获取蛋白结构域之间的已知相互作用信息,进而预测相关蛋白之间的互作关系。
这种方法主要依赖于结构域相互作用数据库的积累和维护,具有较高的可靠性。
2.蛋白互作预测方法:蛋白互作预测方法通过分析蛋白序列中的保守结构域进行预测。
保守结构域是指在进化过程中高度保守的结构域,其具有相似的结构和功能。
在预测蛋白互作时,首先利用多序列比对和引擎等工具识别出蛋白序列中的保守结构域,然后通过比较已知互作蛋白结构域与待预测蛋白结构域之间的相似性,来预测它们之间的互作潜力。
4.结合实验方法的结构域互作分析:结合实验方法的结构域互作分析是通过实验手段来验证已预测或研究的蛋白结构域之间的相互作用关系。
常见的实验方法包括酵母双杂交、共沉淀、共免疫沉淀、亲和层析等。
通过这些实验方法,可以验证预测蛋白结构域的相互作用关系,并获取更全面、可靠的互作信息。
综上所述,蛋白结构域互作分析方法包括结构域相互作用数据库的分析方法、蛋白互作预测方法、结构域互作网络分析方法以及结合实验方法的结构域互作分析。
这些方法通过不同的途径揭示了蛋白质结构域之间的相互作用网络,为深入理解蛋白质功能及其在生物过程中的作用提供了重要的分析工具。
蛋白质相互作用数据库系统的设计与实现

关 键 词 : 白质相互作用 ; 蛋 数据库系统 ; 生物信启学 、 中图 分 类 号 :5 Ql 文 献 标 识 码 : A 文章 编号 :0600 (00 1— 17 0 1 —6X 2 1)505 —4 0
摘 要 : 白质相 作用的研是当前生命 科学的前沿和热点 , 蛋 随着研 究逐渐深入 , 已经产生 r 大量 的实验数据 为 了保存 、 利
用这些宝贵的数据 , 有关研究 工作提供一个便捷的】: , 给 具 基于 A ah 、 S 、 ae HP开发环境 , 步构建 了蛋 白质相互 作用 pc e MyQL C k P 初
c n t ce rl iai ae n A a h , y Q n a e H , hc a fn t n f d i , ee n , h n iga d o s u t p e m n r y sd o p c e M S L a d C k P P w i h s u ci s dn d l ig c a g n r d i lb h o oa g t n
(. ol eo i c n e dTc nl , N U C agh 1 1 8 P C 2 C l g Si c, N U C agh 1 C l g e fBo i c ㈣ eh { H A , hnsa4 0 2 , R ; . ol eo c n e H A , h nsa se ) o e f e
湖南 农 、科 学 i k
2 1 . 5)l7 1913 0 0 ¨ :5 ~ 6 5
蛋白质相互作用数据库和分析方法

蛋白质相互作用数据库和分析方法1. 蛋白质相互作用的数据库 蛋白质相互作用数据库见下表所示: 数据库名 说明网址BIND 生物分子相互作用数据库http://bind.ca/DIP 蛋白质相互作用数据库/IntAct 蛋白质相互作用数据库/intact/index.html InterDom 结构域相互作用数据库.sg/ MINT 生物分子相互作用数据库http://mint.bio.uniroma2.it/mint/ STRING 蛋白质相互作用网络数据库http://string.embl.de/ HPRD 人类蛋白质参考数据库/HPID 人类蛋白质相互作用数据库http://wilab.inha.ac.kr/hpid/ MPPI 脯乳动物相互作用数据库http://fantom21.gsc.riken.go.jp/PPI/ biogrid蛋白和遗传相互作用数据,主要来自于酵母、线虫、果蝇和人 /PDZbase 包含PDZ 结构域的蛋白质相互作用数据库 /services/pdz/start Reactome生物学通路的辅助知识库/2. 蛋白质相互作用的预测方法蛋白质相互作用的预测方法很非常多,以下作了简单的介绍1) 系统发生谱这个方法基于如下假定:功能相关的(functionally related)基因,在一组完全测序的基因组中预期同时存在或不存在,这种存在或不存在的模式(pattern)被称作系统发育谱;如果两个基因,它们的序列没有同源性,但它们的系统发育谱一致或相似.可以推断它们在功能上是相关的。
2)基因邻接这个方法的依据是,在细菌基因组中,功能相关的基因紧密连锁地存在于一个特定区域,构成一个操纵子,这种基因之间的邻接关系,在物种演化过程种具有保守性,可以作为基因产物之间功能关系的指示。
这个方法似乎只能适用于进化早期的结构简单的微生物。
所以在人的蛋白质相互作用预测时不采用这个方法。
3)基因融合事件这个方法基于如下假定:由于在物种演化过程中发生了基因融合事件,一个物种的两个(或多个)相互作用的蛋白,在另一个物种中融合成为一条多肽链, 因而基因融合事件可以作为蛋白质功能相关或相互作用的指示。
蛋白质常用数据库一文看懂!

蛋白质常用数据库|一文看懂!蛋白质数据库是指专门存储蛋白质相关信息的数据库。
它们收集、整理和存储大量的蛋白质数据,包括蛋白质序列、结构、功能、互作关系、表达模式、疾病关联等信息。
蛋白质数据库提供了对这些数据的检索、查询和分析功能,为科学研究人员、生物信息学家和药物研发人员等提供了重要的资源。
蛋白质数据库的内容通常来自于实验室实际测定的蛋白质数据,如蛋白质序列测定、结晶学、核磁共振、质谱等技术获得的数据。
这些数据经过验证和标准化后,被整合到数据库中,使研究者能够方便地访问和利用这些数据进行各种研究工作。
下面是笔者总结的常用蛋白质数据库及网址,供大家参考。
⓪BioXFinder:BioXFinder是国内第一个也是唯一一个生物数据库:收录50多万条高质量的、整合多个来源数据,手工注释的非冗余的蛋白质信息,包含蛋白质的基本信息、序列、序列特征、功能、名称和谱系、亚细胞定位、疾病与变异、翻译后修饰、表达、相互作用等信息。
蛋白结构库:收录19多万条经过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质结构数据。
包括蛋白3D结构、基本信息、实验数据、参考文献等。
①UniProt:UniProt是一个综合性的蛋白质数据库,提供了大量蛋白质的序列、结构、功能、互作关系和注释信息。
它整合了多个来源的数据,包括Swiss-Prot、TrEMBL和PIR数据库。
②Protein Data Bank (PDB):PDB是存储蛋白质和其他生物大分子结构的数据库。
它提供了实验确定的蛋白质结构的三维坐标数据,可用于结构生物学研究、药物设计和分子模拟等领域。
③NCBI Protein:NCBI Protein是美国国家生物技术信息中心(NCBI)提供的蛋白质数据库,包含了大量的蛋白质序列数据,可以进行蛋白质的基本信息查询和比对分析。
④Ensembl:Ensembl是一个综合性的基因组注释数据库,包含了多个物种的基因组序列、基因结构、转录本和蛋白质信息。
蛋白质相互作用数据库探究

蛋白质相互作用数据库探究
蛋白质相互作用(Protein-Protein Interaction)是生物体内生命过程的重要组成部分,是研究基因表达和蛋白质功能的关键步骤。
因此,蛋白质相互作用数据库(Protein-Protein Interaction Database)是基因组学和蛋白质组学研究的重要工具。
蛋白质相互作用数据库是一种用于存储和管理蛋白质相互作用的数据库,它的目的是收集已知和推断的蛋白质相互作用信息,并将其存储在一个可查询的系统中。
蛋白质相互作用数据库可以帮助生物学家了解和探索蛋白质之间的交互作用,进而发现和预测蛋白质功能。
蛋白质相互作用数据库包括一系列数据库,如BIND数据库、DIP数据库、MINT数据库和IntAct数据库等。
这些数据库收集了从实验测定和推理出的蛋白质相互作用数据,可以帮助生物学家理解蛋白质的结构、功能和相互作用。
此外,蛋白质相互作用数据库还可以用于研究疾病的发生机制。
通过蛋白质相互作用数据库,可以更好地了解特定疾病的发生机制,从而更好地设计治疗策略。
蛋白质相互作用数据库是一个重要的研究工具,可以帮助生物学家理解蛋白质的结构、功能和相互作用,从而发现和预
测蛋白质功能。
此外,蛋白质相互作用数据库还可以帮助研究疾病的发生机制,以提供更有效的治疗策略。
蛋白质结构,分类和相互作用网站

蛋白质结构、分类和相互作用数据库蛋白质一级结构是氨基酸的排列顺序,二级结构主要是由氢键维持的alpha螺旋和beta片,三级结构是完全折叠好的蛋白质的空间结构,四级结构是多个蛋白质亚基组成蛋白质复合体的结构。
在最细的层次,由X射线衍射和核磁共振(NMR)等实验方法确定的蛋白质中原子的三维坐标,构成PDB[R-519]这样的蛋白质结构数据库的主要内容.二级结构和三级结构之间的模体(motif)、结构域(domain)和“折叠”或“折叠单元”(fold),对于蛋白质结构的分类和预测有重要作用。
R-519 PDB,蛋白质结构数据库(Protein Data Bank)。
1971年建立于美国布鲁克海文国家实验室[R-171],当时只有7个结构。
它搜集由X射线衍射和核磁共振实验测定的生物大分子三维结构数据。
从1998年10月1日起PDB的管理交给RCSB[R 520]。
2002年8月13日PDB库中有18 464个条目。
2001年每月新增约275个结构。
关于PDB库的较近介绍见:J.Westbrook et al., Nucl.Acids Res.30(2002)245-248.网址:http://(自动转如下网址:)/pdb/在世界许多地方设有PDB镜像点。
R-520 RCSB,结构生物信息学合作研究组织(Research Collaboration for Structural Bioinformatics),现在是PDB[R-519]数据库的管理者。
网址:/R-521 MSD,大分子结构数据库(Macromolecular Structure Database),乃是交由RCSB 管理后的PDB库的正式名称,不过PDB仍然是当前通用的名字。
请看PDB[R-519]。
R-522 PDBNEW,下一版PDB库正式发布前收到的全新或更新条目。
网址:/R-523 PDBFinder,在PDB[R-519]、DSSP[R-546]、HSSPIR-547]基础上建立的二级库,它包含PDB序列、作者、R因子、分辨率、二级结构等。
蛋白互作网络(PPI)分析

蛋⽩互作⽹络(PPI)分析蛋⽩互作⽹络(protein protein interaction network,PPI network)分析有助于从系统的⾓度研究疾病分⼦机制、发现新药靶点等等。
今天⼩编介绍为⼤家⼀个常⽤的PPI数据库——STRING 数据库。
STRING数据库是⼀个搜索已知蛋⽩质之间和预测蛋⽩质之间相互作⽤的数据库,该数据库可应⽤于2031个物种,包含960万种蛋⽩和1380万中蛋⽩质之间的相互作⽤。
蛋⽩质之间的相互作⽤包括了直接的物理相互作⽤和间接的功能相关性。
STRING数据库主页。
可按照蛋⽩质名称,氨基酸序列等信息进⾏检索某个特定的蛋⽩质相互作⽤的其他蛋⽩质点击continue,得到检索结果检索结果页⾯。
圆圈代表蛋⽩质,直线代表蛋⽩质之间相互作⽤。
点击圆圈可以查看蛋⽩质相关信息。
点击直线可以查看蛋⽩质相互作⽤信息。
Setting中可以设置⽹络边所代表的意义:evidence:不同颜⾊的线表⽰不同证据;confidence:两个蛋⽩质相互作⽤越强连线越粗;actions:不同颜⾊和形状的线表⽰不同的相互作⽤;Evidence viewConfidence viewAction viewSetting中可以设置⽹络边的来源。
STRING数据库中⽹络边的来源包含实验数据、从PubMed摘要⽂本挖掘的数据、数据库数据,还有利⽤⽣物信息学的⽅法预测的结果。
所应⽤的⽣物信息学⽅法有:基因邻接、基因融合、系统发⽣谱和基于芯⽚数据的基因共表达。
该系统利⽤⼀个打分机制对这些不同⽅法得来的结果给予⼀定的权重,最终给出⼀个综合得。
输⼊⼀组蛋⽩质名称或氨基酸序列,检索其相互作⽤关系。
检索结果。
最后⼩编为⼤家列举了5个常⽤PPI数据供⼤家参考。
⼈类常⽤PPI数据库落叶♬知秋。
scop2数据库一般应用方法

scop2数据库一般应用方法SCOP2数据库是结构分类蛋白质的数据库,它为了方便对蛋白质的分类和归纳所做的工具。
它的出现为蛋白质分子的结构分类提供了更加准确、可靠、高效的工具和方法。
本篇文章将详细介绍SCOP2数据库的应用方法,包括数据库的获取、使用说明和应用案例。
一、获取SCOP2数据库SCOP2数据库可以通过以下两种方式获得:1.从SCOP2的官方网站下载2.通过PDB数据库的API获取PDB数据库可以通过API获取相关的蛋白质信息和结构,包括蛋白质的序列、拓扑结构、旋转、平移等信息。
通过API获取的数据可以通过相关工具提取出归属分类和分类编号。
二、使用说明1.分类SCOP2数据库中的蛋白质分类可分为五个层级,分别是:超级王国、王国、领域、蛋白质超家族和蛋白质家族。
对于每个层级,都有相关的分类编号。
超级王国:提供了最高级别的生物分类,包括了细菌、古菌、真核生物等。
超级王国采用大写字母“K”来表示。
王国:王国提供了更详细的分类,例如真菌、动物、植物等。
王国采用数字“1-9”来表示。
领域:对应了基本分类单位,例如动物领域下面包含了哺乳类和鸟类两个子领域。
领域采用小写字母“d”和两位数字来表示。
蛋白质超家族:蛋白质超家族是结构相似、但互相并非很密切相关的蛋白质的集合。
超家族采用字母“sf”的缩写。
蛋白质家族:蛋白质家族是结构和序列都非常相似的蛋白质集合。
蛋白质家族采用字母“fa”的缩写。
2.查询用户可以通过输入分类编号或者相应的蛋白质序列信息来查询SCOP2数据库。
查询结果将呈现相关分类信息和结构拓扑图。
3.可视化工具SCOP2数据库提供了相应的可视化工具,可以帮助用户更加直观地理解蛋白质分类和结构。
主要包括一下几个工具:(1)HHsearchHHsearch是SCOP2数据库的搜索引擎,可以用于在数据库中搜索相似的蛋白质结构。
HHsearch提供了多种搜索参数,用户可根据需要进行调整。
(2)UCSF ChimeraUCSF Chimera是一款结构可视化工具,可以将蛋白质的三维结构进行可视化,支持多种投影模式和可视化效果。
蛋白质数据库介绍

SWISS-PROT或TrEMBL /sprotPIRMIPSJIPID已经和ExPASy 三、蛋白质二级结构预测网站(数据库)4始建于基于对蛋白质家族中同源序列多重序列比对得到的保守区域,这些区域通常与生物学功能相关。
数据库包括两个数据库文件:数据文件Prosite5蛋白质二级结构构象参数数据库DSSP6蛋白质家族数据库FSSP7同源蛋白质数据库HSSP在前面已经述说过了。
第二节、蛋白质序列分析方法一、多序列比对双序列比对是序列分析的基础。
序列之间的关系,生物学模式方面起着相当重要的作用。
多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,法建立在某个数学或生物学模型之上。
因此,正如我们不能对双序列比对的结果得出果也没有绝对正确和绝对错误之分,相似性关系以及它们的生物学特征。
我们称比对前序列中残基的位置为绝对位置。
置Ⅰ相对位置。
显然,同一列中所有残基的相对位置相同,而每个残基的绝对位置不同,因为它们来自不同的序列。
绝对位置是序列本身固有的属性,也就比对过程赋予它的属性。
算法复杂性多序列比对的计算量相当可观,时间和内存空间与这两个序列的长度有关,或者说正比于这两个序列长度的乘积,用(的两维空间扩展到三维,即在原有二维平面上增加一条坐标轴。
这样算法复杂性就变成了(例如,如果用某种颜色表示一组高度保守的残基,则某个序列的某一位点发生突变时,则由于颜色不同,就可以很快找出。
颜色的选择可以根据主观愿望和喜好,但最好和常规方法一致。
用来构筑三维模型的按时氨基酸残基组件和三维分子图形软件所用的颜色分类方法,比较容易为大家接受(表2)。
多序列比对程序的另一个重要用途是定量估计序列间的关系,关系。
关系。
相似性值低于预料值,那么有可能是序列间亲缘关系较远,也可能是比对中有错误之处2同步法实质是把给定的所有序列同时进行比对,而不是两两比对或分组进行比对。
其基本思想是将一个二维的动态规划矩阵扩展到三维或多维。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
14
15
PTMs: post-translational modifications 翻译后修饰 Subcellular Localization 亚细胞定位
16
17
18
19
The default behavior if more than one term is entered within a field is 'AND.'
68
数据库比较:数据量
Suresh Mathivanan An evaluation of human protein-protein interaction data in the public domain. BMC Bioinformatics 2006,7
蛋白相互作用数据库 ——MINT
蛋白相互作用 数据库
1
生物学背景知识
从DNA到蛋白质:
DNA CCTGAGCCAACTATTGATGAA
转录
RNA
翻译
CCUGAGCCAACUAUUGAUGAA
Protein
PEPTIDE
蛋白质是由多种氨基酸按特定的排列顺序通过肽键连接成有一定结构的高分 子化合物。
随着后基因组时代的到来 ,蛋白质研究变得更加广泛而 深入,同时蛋白质与蛋白质相互作用(protein—protein interaction, PPI )的重要性也越来越受到重视。
➢ In addition to the mapped motifs, PhosphoMotif Finder also indicates potential enzymes (i.e. kinases or phosphatases) associated with these phosphorylation motifs. ➢ PhosphoMotif Finder should also be helpful in ascertaining the novelty of any motif that is described in the literature. ➢ Finally, it can be used in designing phosphorylation motif specific antibodies and antibody-based arrays.
蛋白相互作用数据库 ——HPRD
8
9
HPRD ( human protein reference database ) 数据库是 包含蛋白质注释、PPI、转录后修饰、亚细胞定位等多 种信息的综合数据库。该数据库只收录人的 PPIs,目 前已包含30000多个蛋白质和39000多条相互作用信息, 是来源于文献挖掘的最大的人PPI数据库。
e.g. entering 'SH2 SH3' in 'Domain' search field will search for all the proteins that have both SH2 and SH3 domains. Similarly, if more than one field is filled in, it will be treated as an 'AND' query
4
近几年, 利用高通量筛选、计算方法预测、文献挖掘等 技术产生了海量PPI数据, 并且数据还在飞速增长中.如何高 效地存储、管理 PPI数据, 如何深入分析、充分利用 PPI数 据, 已成为生物信息学的一个重要课题。随着 PPI数据的增 长, 一些内容丰富、不断扩大更新的蛋白质相互作用数据库 (PPI Database)已经应运而生, 成为蛋白质相互作用网络构建 和生物学通路分析的主要资源, 也是蛋白质功能研究的有效 平台和辅助手段
Currently, the role of 2732 and 1793 proteins are thus annotated in the context of cancer and immune signaling pathways, respectively.
Also cataloged genes that are upregulated or down-
56
NetPath contains information about protein interactions, catalytic reactions(催化反应) and protein translocation events, which occur downstream of ligand– receptor interactions.
20
蛋白质名称、Accession Number、HPRD 描述、Gene Symbol、染色体位置、PTMs、 细胞组分、Domain、Motif 、基因表达、蛋
白质序列长度、分子量、疾病
21
2003年Query界面
36
40
42
44
49
PhosphoMotif Finder contains experimentally characterized phosphorylation-based substrate and binding motifs derived from the literature and has been integrated with HPRD.
3
蛋白质是生命活动的主要执行者, 从遗传物质复制到 基因表达调控, 从细胞信号转导到新陈代谢, 从生物体生长 繁殖到细胞凋亡或坏死, 蛋白质相互作用均在其中扮演了 重要角色。因此, 研究蛋白质之间如何通过相互作用形成 分子间调控网络, 包括遗传调控途径、新陈代谢途径和信 号传导途径, 具有重要的生物学意义, 它将不仅有助于从系 统角度进一步理解各种生物学过程, 还能广泛应用于探索 疾病的发生机制,预测和评价相应的治疗手段, 同时还可 以寻找新的药物靶标, 为新药研发开辟道路。
丝氨酸/苏氨酸motifs
激酶/磷酸化motifs 结合motifs
酪氨酸motifs
激酶/磷酸化motifs 结合motifs
Enter raw protein sequence below to search against the catalog of known phosphorylation motifs
regulated at the transcriptional level under the influence of
these signaling pathways.
Janus Kinase 2 (JAK2) is involved in diverse pathways including EGFR1, Kit receptor, Notch, IL-2, IL-3, IL-4, IL-5 and IL-6 signaling pathways.
10
HPRD 对 PPI数据有 2 种分类方式:
➢ 根据相互作用的拓扑结构和参与数目,将PPI分成二 元相互作用和复杂相互作用(复合物)
➢ 根据实验类型, 将 PPI分为体内( in vivo)、体外( in vitro)和酵母双杂交(Y2H) 3类相互作用
11
网址ห้องสมุดไป่ตู้/
70
MINT(molecular interaction database) 网址: http://mint.bio.uniroma2.it/mint/Welcome.do
数据库建立的目标是提取文献信息 ,存储 经实验证实的生物分子相互作用。目前,MINT 主要存储蛋白质物理相互作用 ,尤其强调哺乳 动物的 PPIs ,同时包含部分酵母、果蝇、病 毒的 PPIs。
于酵母、线虫、果蝇和人
网址 http://bind.ca/ / /intact/index.ht
ml .sg/ http://mint.bio.uniroma2.it/mint/ http://string.embl.de/ / http://mips.gsf.de/proj/ppi/ /
5
蛋白质组相互作用数据库
数据库名 BIND DIP IntAct
InterDom MINT STRING HPRD MPPI biogrid
PDZbase
Reactome
说明 生物分子相互作用数据库 蛋白质相互作用数据库 蛋白质相互作用数据库
结构域相互作用数据库 生物分子相互作用数据库 蛋白质相互作用网络数据库 人类蛋白质参考数据库 脯乳动物相互作用数据库 蛋白和遗传相互作用数据,主要来自
包含PDZ结构域的蛋白质相互作用数 据库
生物学通路的辅助知识库
/services/p dz/start
/
数据库比较:数据量
Suresh Mathivanan An evaluation of human protein-protein interaction data in the public domain. BMC Bioinformatics 2006,7
按照序列 BLAST 查找同源相互作用
各项按物种分类统计
数据库比较:数据量
Suresh Mathivanan An evaluation of human protein-protein interaction data in the public domain. BMC Bioinformatics 2006,7
蛋白相互作用数据库 ——BIND
85
BIND(biomolecular interaction network database)
网址: http://bind.ca/
是BOND(biomolecular object network databank)数据库的一 个子数据库 ,收录已知的生物分子之间的相互作用 ,不仅包括蛋白质之 间的相互作用 ,也包括蛋白质与DNA、 RNA、 小分子、 脂质以及糖 类物质之间的相互作用.