WoLF PSORT 蛋白亚细胞定位预测
生物信息学-课堂练习作业生物信息学蛋白质序列分析-课堂练习
生物信息学蛋白质序列分析-课堂练习ZNF395, 全称为Zinc Finger Protein395, 又被称为PBF ,PRF1,DBP2,PRF-1,Si-1-8-14或DKFZp434K1210。
其氨基酸序列为(一)分析蛋白质的一级结构ZNF395蛋白的理论等电点为7.17,分子式C 2417H 3775N 679O 741S 23,原子总数为7635,总平均亲水性(GRA VY )为-0.451,脂肪指数64.54,不稳定指数69.57,序列N 末端是M (Met ),估计半衰期是:30小时(哺乳动物网状细胞,离体);>20小时(酵母,体内);>10小时(大肠杆菌,体内)。
在编码的513个氨基酸中,包括48个带负电的氨基酸(天冬氨酸+谷氨酸),33个带正电荷的氨基酸(精氨酸+赖氨酸)。
依据氨基酸分值越低亲水性越强,分值越高疏水性越强的规律,用Expasy 网络服务器的ProtScale Server 在线工具对该氨基酸序列的亲水性/疏水性进行预测,预测结果如图1,分值在-2.800—1.967之间,且绝大部分氨基酸分值为负,故推测该蛋白应为亲水性蛋白。
图1 ZNF395氨基酸序列的亲水性/疏水性分析(二)分析蛋白质的二级结构利用SOPMA在线工具对二级结构进行预测,如图2,α螺旋99个占19.30%,延伸链66个占12.87%,β-转角18个占3.51%,无规卷曲330个占64.33%,其二级结构主要由无规卷曲组成。
图2 ZNF395蛋白二级结构预测注:蓝色表示α螺旋;红色表示延伸链;紫色表示无规则卷曲(三)分析膜蛋白质利用在线分析工具TMHMM Server 2.0,对ZNF395氨基酸跨膜结构域进行在线预测和分析,结果表明,该序列编码的蛋白非跨膜蛋白(见图3)。
利用Signal P 3.0 Server在线预测工具对ZNF395蛋白质进行信号肽预测,无信号肽存在(图4)。
花生GATA基因家族鉴定和表达分析
2024 ,44(2) : 010J.SHANXI AGRIC, UNIV . ( N atural Science Edition )学报(自然科学版)04255花生GATA 基因家族鉴定和表达分析王伟杰,雷亚柯,张建航,展世杰,邓陈威,贾朝阳*(周口市农业科学院,河南 周口,466000)摘要:[目的]探究GATA 基因家族在花生生长发育和抗旱调控中的作用。
[方法]通过生物信息学方法鉴定花生GATA 家族成员,分析其系统进化、基因结构、组织表达模式,最后结合转录组数据和实时荧光定量PCR 技术筛选花生GATA 家族响应干旱胁迫的关键基因。
[结果]本文鉴定到47个GATA 类转录因子编码基因,它们不均匀地分布在除2号、4号和14号染色体以外的17条染色体上。
理化性质分析表明,该家族属于亲水性蛋白,大部分基因呈酸性,只有Arahy.QG9XFC.1具有信号肽。
根据拟南芥家族同源基因聚类分析结果,可将花生GATA 家族蛋白分为4个亚家族。
其中第Ⅰ、Ⅱ、Ⅲ亚家族成员的锌指结构域特征模体为C X2C X18C X2C ,而第Ⅳ亚家族为C X2C X20C X2C 类型。
大部分成员在A 亚基因组和B 亚基因组中呈对称分布,组织表达模式分析显示,超过半数的GATA 家族成员在22个组织中表现不同程度的特异性表达。
其中第Ⅰ亚家族Arahy.LJYJ4M 、Arahy.VS8GG1、Arahy.3S8P0L 和Arahy.I6JZDT 在所有组织中均显示较高的表达水平。
然而Arahy.QY7BN7和Arahy.F7WS4I 在叶片,Arahy.C6NV9N 在花被中表达较高,Arahy.4Y7J59和Arahy.D56WMI 在种子中呈现组织特异性高表达特性。
转录组数据分析发现,34个GA⁃TA 基因响应干旱、低温、ABA 和BR 激素处理,5个GATA 基因在干旱和低温胁迫下表达量发生显著上调,1个基因发生显著下调。
生物信息学-课堂练习生物信息学蛋白质序列分析-课堂练习
生物信息学蛋白质序列分析-课堂练习ZNF395, 全称为Zinc Finger Protein395, 又被称为PBF,PRF1,DBP2,PRF-1,Si-1-8-14或DKFZp434K1210。
其氨基酸序列为结构域分析:http://www.expasy.ch/prosite/(一)分析蛋白质的一级结构分析蛋白质的pI、Mw、氨基酸组成:Tools and software packages------Identification and characterization-----ProtParamhttp://www.expasy.ch/tools/protparam.html分析蛋白质的疏水性:Primary structure analysis-----ProtScalehttp://www.expasy.ch/tools/protscale.html分析蛋白质的重复序列:Primary structure analysis-----REPhttp://www.embl-heidelberg.de/~andrade/papers/rep/search.html(二)分析蛋白质的二级结构预测蛋白质的?-螺旋和?-折叠结构:Secondary structure prediction-----nnPredict/~nomi/nnpredict.html蛋白质的其它二级结构:Secondary structure prediction-----SOPMA(三)分析蛋白质的三级结构molecular modeling:“tertiary structure prediction ”栏目选择选择一个分析工具,email服务(四)分析膜蛋白质预测膜整合蛋白的跨膜区: Topology prediction------SOSUIhttp://bp.nuap.nagoya-u.ac.jp/sosui/分析膜锚定蛋白的GPI位点:Post-translational modification------big-PI Predictorhttp://mendel.imp.ac.at/sat/gpi/gpi_server.html(五)分析蛋白质的翻译后修饰分析信号肽及其剪切位点: Post-translational modification prediction----SignalIPhttp://www.cbs.dtu.dk/services/SignalP/分析糖链连接点:分析O-连接糖蛋白,Post-translational modification prediction----NetOGlychttp://www.cbs.dtu.dk/services/NetOGlyc/分析N-连接糖蛋白,Post-translational modification prediction----NetNGlyc(六)分析蛋白质的亚细胞定位Topology prediction----PSORT-----WoLF PSORT/(七)分析化学因子作用蛋白质的位点“Identification and characterization ”------“Other prediction or characterization tools”栏目选择“PeptideCutter” 软件http://www.expasy.ch/tools/peptidecutter/1.蛋白基本理化性质分析利用Expasy 软件包中的ProtParam工具(http://www.expasy.ch/tools/protparam.htmL) 进行蛋白的氨基酸组成、分子质量、等电点及疏水性等理化性质的分析。
棉花PAL_基因家族的全基因组鉴定及其在逆境胁迫下的表达分析
山西农业科学 2023,51(9):961-973Journal of Shanxi Agricultural Sciences棉花PAL 基因家族的全基因组鉴定及其在逆境胁迫下的表达分析王梓钰,古丽斯坦·赛米,刘隋赟昊,黄耿青,张经博,郭彦君(新疆师范大学 生命科学学院/新疆特殊环境物种保护与调控生物学实验室,新疆 乌鲁木齐 830054)摘要:苯丙氨酸解氨酶(Phenylalanine ammonia lyase ,PAL )是苯丙烷代谢的关键酶和限速酶,在植物的生长发育、抗病虫害和抗逆等方面发挥着重要作用。
研究在全基因组水平上对棉花PAL 基因家族进行了鉴定和分析,以了解棉花中PAL 的功能,为后续深入研究棉花PAL 功能提供一定参考。
结果表明,在陆地棉(Gossypium hir⁃sutum )、海岛棉(Gossypium barbadense )、草棉(Gossypium herbaceum )和雷蒙德氏棉(Gossypium raimondii )中分别鉴定出15、13、7、8个PAL 基因。
进化分析结果显示,棉花PAL 基因家族可分为3个亚组。
保守基序和基因结构分析显示,亲缘关系近的PAL 基因之间的保守基序组成和基因结构也十分相似。
启动子分析显示,GhPAL 基因的启动子上存在多个与非生物和生物胁迫应答以及激素信号转导相关的顺式作用元件。
组织表达模式分析表明,GhPAL 基因主要在根、茎、花丝和胚珠中高表达。
转录组和qPCR 分析显示,部分GhPAL 基因的表达量在PEG 、盐、高温、低温和碱胁迫下显著提高,其中一些GhPAL 基因能够对多种非生物胁迫作出响应。
生物胁迫转录组数据显示,GhPAL1/GhPAL5/GhPAL13的表达在大丽轮枝菌处理条件下发生显著上调。
GhPAL 基因在逆境胁迫下的表达分析结果说明,PAL 基因可能在棉花应答逆境胁迫的过程中发挥一定的功能。
苹果糖转运蛋白TMT基因的表达及其与糖积累的关系
园艺学报2014,41(7):1317–1325 http: // www. ahs. ac. cn Acta Horticulturae Sinica E-mail: yuanyixuebao@ 苹果糖转运蛋白TMT基因的表达及其与糖积累的关系马新立,秦源,魏晓钰,马锋旺,李明军*(西北农林科技大学园艺学院,陕西杨凌712100)摘要:利用苹果基因组筛选液泡膜单糖转运蛋白TMT家族基因,通过qRT-PCR探索它们在苹果各器官组织中的表达特性,并分析其表达与果实糖积累的关系。
结果表明,在苹果中主要存在5个TMT家族基因,均含有11个跨膜区,并具有1个长约330氨基酸的亲水loop区位于胞质内,它们与拟南芥和葡萄的TMTs高度同源。
定量表达分析发现,它们均在苹果中表达,且MdTMT1表达量相对最高,M dTMT3和MdTMT4表达量较低。
MdTMT1在花和成熟果实中表达量最高,M dTMT2在成熟果实中表达最高。
在果实发育过程中,M dTMT1和MdTMT2的表达量与果实中总糖、还原性总糖、果糖、蔗糖含量呈极显著正相关,说明MdTMT1和MdTMT2可能参与了苹果果实成熟期果糖和蔗糖的积累。
关键词:苹果;液泡单糖转运蛋白;表达;糖;果实中图分类号:S 661.1 文献标志码:A 文章编号:0513-353X(2014)07-1317-09 Sequence and Expression Analysis of Apple Tonoplast Monosaccharide Transporter TMT Genes and Their Relationship with Sugar Accumulationin FruitMA Xin-li,QIN Yuan,WEI Xiao-yu,MA Feng-wang,and LI Ming-jun*(C ollege of Horticulture,N orthwest A & F University,Y angling,S haanxi712100,China)Abstract:In present study,we analyzed the information of apple tonoplast monosaccharide transporter(TMT)gene family based on Malus g enome database,and explored their expression characteristics by qRT-PCR and analyzed the relationship between their expression and sugar accumulation in apple. The results showed that apple had 5 transcribed MdTMT genes with 11 transmembrane domains and a hydrophilic loop located in the cytoplasm. These MdTMTs are highly homologous with Arabidopsis thaliana and Vitis vinifera TMTs. Quantitative expression analysis showed that all MdTMTs were expressed in apple with a higher expression abundance of MdTMT1and lower expression abundance of MdTMT3and MdTMT4.MdTMT1had the highest expression abundance in flower and fruit while MdTMT2in fruit. The expression of MdTMT1and M dTMT2had significantly positive correlation with total sugar,reducing sugar,fructose and sucrose during fruit development,especially MdTMT2. These results suggested that M dTMT1and MdTMT2may participate in the accumulation of fructose and sucrose in the收稿日期:2014–03–05;修回日期:2014–06–02基金项目:国家自然科学基金项目(31372038)* 通信作者Author for correspondence(E-mail:limingjun@)1318 园艺学报41卷fructescence of apple.Key words:Malus ×domestica;tonoplast monosaccharide transporter;expression;sugar;fruit果实中糖的种类及其比例直接关系到果实的甜度与风味,果实中的糖虽依赖于源叶的输入,但控制糖分积累的关键步骤是位于发育的果实内部,而不是源叶输出光合产物的能力或者韧皮部运输的效率(Ruan & Patrick,1995)。
芒果bZIP转录因子基因的克隆、亚细胞定位及表达分析
李 健,李 曦,农艳丰.芒果bZIP转录因子基因的克隆、亚细胞定位及表达分析[J].江苏农业科学,2023,51(21):29-36.doi:10.15889/j.issn.1002-1302.2023.21.005芒果bZIP转录因子基因的克隆、亚细胞定位及表达分析李 健,李 曦,农艳丰(百色学院农业与食品工程学院/广西芒果生物学重点实验室/亚热带特色农业产业学院,广西百色533000) 摘要:碱性亮氨酸拉链(bZIP)转录因子在调控植物生长发育及抵抗非生物胁迫过程中具有重要作用。
本研究通过RACE技术,获得了全长1317bp的芒果bZIP转录因子基因(MibZIP46)。
系统进化树分析结果表明,MibZIP46与同样是漆树科的阿月浑子的bZIP亲缘关系最为接近,同源性最高,与甜橙的同源性次之。
构建了原核表达重组质粒pCZN1-MibZIP46,经0.2mmol/LIPTG诱导,目的蛋白以包涵体的形式表达,经镍柱纯化,获得高纯度(90%)的目的蛋白并成功进行Westernblotting鉴定;MibZIP46蛋白的亚细胞定位分析结果表明,融合的目的蛋白在烟草叶片细胞中定位于细胞核;实时荧光定量PCR分析结果表明,200mmol/LNaCl、15%PEG和0.1mmol/LABA胁迫处理,均能不同程度诱导MibZIP46的表达。
本研究为进一步挖掘利用芒果的抗逆相关基因提供了理论依据。
关键词:芒果;碱性亮氨酸拉链(bZIP)转录因子;基因克隆;基因表达;胁迫处理 中图分类号:S667.701 文献标志码:A 文章编号:1002-1302(2023)21-0029-07收稿日期:2023-03-15基金项目:广西自然科学基金(编号:2018GXNSFBA050026);广西高校中青年教师科研基础能力提升项目(编号:2019KY0743、2020KY19025)。
作者简介:李 健(1986—),男,广西百色人,博士,研究方向为植物抗逆生理与分子生物学。
uniprot蛋白定位_概述及解释说明
uniprot蛋白定位概述及解释说明1. 引言1.1 概述蛋白质是生物体中具有重要功能的分子,其定位在细胞内发挥着至关重要的作用。
Uniprot蛋白定位是一种通过收集和整理蛋白质定位相关信息的数据库,为研究者提供了丰富的数据资源和工具,帮助他们深入了解蛋白质在细胞中的位置和功能。
1.2 文章结构本文将以Uniprot蛋白定位为主题,对其概念、应用以及相关信息来源和分类方法进行介绍。
随后,将详细探讨Uniprot数据库中关于蛋白定位的解释说明内容。
最后,给出文章总结并列举参考文献。
1.3 目的本文旨在向读者介绍Uniprot蛋白定位相关知识,并阐明其在生物学研究领域中的重要性和应用价值。
通过阅读本文,读者可以了解到不同细胞器、组织及亚细胞水平上如何对蛋白质进行准确地定位,以及相应的实验技术和方法。
以上所述是“1. 引言”部分内容,请按照这个思路进行详细的撰写。
2. Uniprot蛋白定位概述2.1 Uniprot数据库简介Uniprot是一个综合性的蛋白质序列和功能信息数据库,为科学家提供了全球最大、最全面的蛋白质数据资源。
Uniprot数据库包含了大量已知和预测的蛋白质序列及其相关信息,其中就包括了蛋白质的定位信息。
Uniprot通过整合来自各种来源的实验数据和基因组学研究数据,提供了关于蛋白质定位的重要信息。
2.2 蛋白定位的重要性和应用在细胞中,不同的蛋白质定位在维持正常生理功能中发挥着至关重要的作用。
准确了解蛋白质的定位信息对于揭示其生物学功能、疾病机制以及药物研发具有重要意义。
因此,蛋白质定位是现代生物学研究领域中一个非常活跃且备受关注的方向。
2.3 Uniprot中蛋白定位信息的来源和分类方法Uniprot数据库中关于蛋白定位信息主要来源于实验研究和预测算法。
实验技术如质谱分析、免疫组织化学染色和显微镜技术等可以直接观察或间接鉴定蛋白质的定位。
预测算法可以根据蛋白质的氨基酸序列特征和机器学习方法进行推断。
牡丹非特异性脂质转移蛋白基因PsLTP的生物信息学分析
牡丹非特异性脂质转移蛋白基因PsLTP的生物信息学分析作者:问荣荣苏钰高泽芳徐梦宇何雯雯王步勇来源:《安徽农业科学》2024年第02期摘要 [目的]了解牡丹非特異性脂质转移蛋白基因LTP的基因特征及其编码蛋白的生物学特性,探索其生物功能。
[方法]运用Blast、ORF-Finder、ProtParam、SignalP 4.1、ProtScale和TMHMM 2.0 Server等生物信息学软件,分析牡丹nsLTP基因序列及其编码蛋白的基本理化性质、信号肽、磷酸化位点、保守结构域等,并运用DANMAN、MEGA软件进行多序列比对和系统发育树构建。
[结果]牡丹nsLTP基因(NCBI登录号为:JZ840269.1)序列全长为685 bp,开放阅读框长为354 bp,编码蛋白包含117个氨基酸,理论等电点为8.93,为不稳定性蛋白。
牡丹nsLTP蛋白为疏水性蛋白,含有信号肽但不含跨膜结构域,NetPho Server预测其含有8个丝氨酸和3个酪氨酸磷酸化位点及5个苏氨酸磷酸化位点。
PsnsLTP蛋白具有植物LTP蛋白典型结构,即4个α-螺旋,4对二硫键,1个可结合和容纳脂质分子的疏水结构。
多序列比对及系统发育树分析显示,PsLTP蛋白与绒毛烟草LTP蛋白(XP_009608993.1)的相识度62.7%,且进化树聚为同一小分支,遗传距离较近。
[结论]通过对牡丹nsLTP基因特性及蛋白结构研究,系统性研究了牡丹nsLTP基因的生物信息学特性,为牡丹抗病抗逆功能基因的研究提供了依据,也为其他植物nsLTP基因研究提供了参考。
关键词牡丹;非特异性脂质转移蛋白基因LTP;蛋白结构;生物信息学中图分类号 Q781;S685.11 文献标识码 A文章编号 0517-6611(2024)02-0087-06doi:10.3969/j.issn.0517-6611.2024.02.018开放科学(资源服务)标识码(OSID):Bioinformatics Analysis of Peony Non-specific Lipid Transfer Protein Gene PsLTPWEN Rong-rong,SU Yu,GAO Ze-fang et al(College of Agricultural and Biological Engineering,Heze University,Heze,Shandong 274015)Abstract [Objective]In order to understand the genetic characteristics of peony non-specific lipid transfer protein gene LTP and the biological characteristics of its encoding protein,and further explore its biological functions.[Method]Bioinformatics software such as Blast,ORF-Finder,ProtParam,SignalP 4.1,ProtScale,and TMHMM 2.0 Server,were used to analyze the basic physicochemical properties,signal peptides,phosphorylation sites and conserved domains of the nsLTP gene sequence. Moreover,DANMAN and MEGA software were used for the multiple sequence alignment and phylogenetic tree construction of nLTP.[Result]The results showed that the total length of peony nsLTP gene (JZ840269.1) was 685 bp,the open reading frame length was 354 bp,the encoded protein contained 117 amino acids,and the theoretical isoelectric point was 8.93,which was an unstable protein. nsLTP protein is a hydrophobic protein with signal peptide but no transmembrane domain. NetPho Server predicted that nsLTP protein contains 8 serine and 3 tyrosine phosphorylation sites and 5 threonine phosphorylation sites. The nsLTP protein has thetypical s tructure of plant LTP proteins including four α-helix,four pairs of disulfide bonds,and a hydrophobic structure that can bind and hold lipid molecules. Multiple sequence alignment and phylogenetic tree analysis showed that PsLTP protein and LTP protein (XP_009608993-1) were 62.7% familiar,and the phylogenetic tree was clustered into the same small branch.[Conclusion]By studying the nsLTP gene characteristics and protein structure of peony,the bioinformatics characteristics of nsLTP gene of peony were systematically studied,which provided a basis for the study of disease resistance and stress resistance gene of peony,and also provided a reference for the study of nsLTP gene of other plants.Key words Peony;Non-specific lipid transfer protein gene LTP;Protein structure;Bioinformatics作者简介问荣荣(1987—),女,山西大同人,讲师,博士,从事植物病理分子研究。
蛋白质的亚细胞定位的预测
蛋白质的亚细胞定位的预测关于蛋白质的亚细胞定位的预测,In general,预测方法分为3个步骤。
首先,为每一类亚细胞locations构建客观而具有代表性的数据集。
其次,从数据集中提取特征参数或descriptor。
最后也是最关键的一步,通过算法比较查询序列中所包含的特征参数与各类相应的location 的相似度,作出判断,一般会用一组概率的形式来表述。
很明显,其中大量运用的是机器学习理论和统计学的方法。
对算法有兴趣的朋友可以参考下面这一篇综述,“An overview on predicting the subcellular location of a protein” In Silico Biology 2002 http://www.bioinfo.de/isb/2002/02/0027/main.html以下是该综述中涉及的部分server,都是比较经典的。
PSORT:http://psort.nibb.ac.jpBy amino acid composition information and sorting signal knowledgeTargetP:http://www.cbs.dtu.dk/services/TargetP/By discriminating the individual targeting signal peptideMitoProt:http://ihg.gsf.de/ihg/mitoprot.htmlBy discriminating mitochondrial and chloroplast signal peptidePredotar:http://www.inra.fr/Internet/Produits/Predotar/By discriminating mitochondrial, chloroplast signal peptideNNPSL:/nnpslBy amino acid compositionSobLoc:/SubLoc/By amino acid compositionSubLoc: /SubLoc/By more sequence information besides the amino acid composition一篇文献:/papers/2003_loci_3dnet/paper.html“Better prediction of sub-cellular localization by combining evolutionary and structural information”。
蛋白的亚细胞定位预测方法
蛋白的亚细胞定位预测方法
随着生物信息学和计算机技术的发展,蛋白质的亚细胞定位预测成为了一项研究热点。
蛋白质在细胞内的位置决定了其功能和相互作用方式,因此准确地预测蛋白质的亚细胞定位对于深入研究细胞生物学和疾病发生机制具有重要意义。
目前,蛋白质的亚细胞定位预测方法主要包括基于序列特征、基于机器学习和深度学习等多种方法。
其中,基于序列特征的方法主要通过分析蛋白质的氨基酸组成、静电性、亲水性等特征来预测其亚细胞定位。
而机器学习和深度学习方法则利用大量已知的蛋白质亚细胞定位信息进行训练,并通过预测新蛋白的亚细胞定位来提高预测准确率。
此外,还有一些集成多种方法的综合预测模型被广泛应用于蛋白质亚细胞定位预测中。
这些模型可将不同方法的预测结果进行整合,从而提高预测准确度。
总之,蛋白质的亚细胞定位预测方法涉及多个学科领域,需要多种技术手段的综合应用。
未来,随着生物信息学和计算机技术的不断发展,蛋白质亚细胞定位预测方法将进一步提高其预测准确率和应用范围。
- 1 -。
茶树bZIP转录因子基因CsbZIP1的克隆与表达定位
作物学报 ACTA AGRONOMICA SINICA 2014, 40(9): 1702-1709 /ISSN 0496-3490; CODEN TSHPA9E-mail: xbzw@本研究由国家自然科学基金项目(31170650), 浙江省自然科学基金重点项目(Z3100473), 浙江省农业新品种选育重大专项(2012C2905-3)和国家现代农业产业技术体系建设专项(CARS-23)资助。
*通讯作者(Corresponding authors): 王新超, E-mail: xcw75@, Tel: 0571-********; 杨亚军, E-mail: yjyang@, Tel:0571-********第一作者联系方式: E-mail: caohongli@, Tel: 0571-********Received(收稿日期): 2014-01-08; Accepted(接受日期): 2014-04-16; Published online(网络出版日期): 2014-05-16. URL: /kcms/detail/11.1809.S.20140516.1002.019.htmlDOI: 10.3724/SP.J.1006.2014.01702茶树bZIP 转录因子基因CsbZIP1的克隆与表达定位曹红利 岳 川 周艳华 王 璐 郝心愿 杨亚军* 王新超*中国农业科学院茶叶研究所 / 国家茶树改良中心 / 农业部茶树生物学与资源利用重点实验室, 浙江杭州310008摘 要: 碱性亮氨酸拉链蛋白(bZIP)作为真核生物中分布最广、最保守的一类转录因子, 参与多种生物学过程, 尤其在植物抵御各种逆境胁迫中有重要作用。
采用RACE 和RT-PCR 技术克隆到茶树bZIP 转录因子基因全长cDNA 序列, 命名为CsbZIP1(GenBank 登录号为JX050148.1)。
该基因cDNA 全长1515 bp, 包含813 bp 的完整开放阅读框(ORF), 编码270个氨基酸, 预测分子量29.484 kD; 含有bZIP 家族典型的BRLZ 结构域碱性结构域和亮氨酸拉链, 属于B -zip1家族; 系统发育树分析显示CsbZIP1属于bZIP 转录因子F 亚家族; 亚细胞定位结果表明CsbZIP1主要定位于细胞核; qRT-PCR 分析表明, 4℃低温和NaCl 盐胁迫处理均能诱导CsbZIP1的表达, 表达量变化趋势都是随着胁迫时间先逐渐升高, 到24 h 时降低, ABA 胁迫处理24 h 抑制CsbZIP1的表达。
植物蛋白质的亚细胞定位研究进展
质特异的抗体检测目标蛋白质在细胞中的位置的方
法。一般是将抗体进行标记后识别植物细胞切片中
的目标蛋白质, 然后借助光学显微镜或电子显微镜 观察其所在位置, 根据抗原抗体的结合部位确定目 标蛋白的位置。这种亚细胞定位方法是把免疫反应 的特异性、组织化学的可见性巧妙地结合起来, 可以 在细胞、亚细胞水平检测各种抗原物质, 如多肽、酶、
关键词: 蛋白质; 亚细胞定位; 细胞分区; 蛋白质组学; 高通量 中图分类号: Q- 1 文献标识码: A 文章编号: 1000- 7091( 2006) 增刊- 0001- 06
Advancement of Protein Subcellular Localization in Plants
XING Hao_ran, LIU Li_juan, LIU Guo_zhen
GFP 能自我催化形成发色结构并在蓝光激发下 发出绿色荧光, 所以可以与目标蛋白融合, 作为荧光
标记 分 子, 特 异 性地 进 行 蛋白 质 的 亚细 胞 定 位。 GFP 能在蛋白质的 N 端或 C 端融合而 保持其天然 蛋白的特性, 而且灵敏度高、对活细胞无毒害作用, 所以广泛应用[ 4, 5] ; 此外, GFP 可以人工改造成具有 更高的荧光 强度和 灵敏性 的突 变体, 例如 增强 型 GFP( EGFP) 是将 Ser65 用 Thr 替代, Phe64 用 Leu 替 代, 其荧光强度提高了 35 倍[ 6] ; 另外, GFP 还改建成 了能发射其它颜色荧光的突变体, 例如, 红色荧光蛋 白( RFP ) 、黄 色荧 光 蛋 白 ( YFP ) 和 蓝色 荧 光 蛋 白 ( BFP) 以及它们的增强型 ERFP、EYFP、EBFP 等[ 7, 8] , 这些改造使荧光蛋白的应用更为广泛。
蛋白质亚细胞定位预测及检测技术研究进展
蛋白质亚细胞定位预测及检测技术研究进展蛋白质是生命中最重要的分子之一,其功能涉及细胞内外的许多生物学过程。
蛋白质的亚细胞定位是揭示其生物学功能的关键因素之一。
因此,蛋白质亚细胞定位预测及检测技术一直是生命科学研究的热点之一。
本文将介绍蛋白质亚细胞定位预测及检测技术的研究进展。
一、蛋白质亚细胞定位预测技术蛋白质亚细胞定位预测技术是通过利用蛋白质本身序列和结构信息推断蛋白质在细胞内的位置分布。
常见的方法包括基于序列、基于结构以及综合方法三种。
基于序列的蛋白质亚细胞定位预测方法是通过分析蛋白质序列中固有的氨基酸特性、保守区域以及启动子区域等信息,来预测蛋白质的亚细胞定位。
该方法简便易行,但是在预测准确性和广泛性等方面还存在着不少问题。
基于结构的蛋白质亚细胞定位预测方法则是通过模拟蛋白质在细胞中的空间构型来推断其亚细胞定位,其中常见的方法包括Homology模型和其他基于结构预测的方法。
该方法精度较高,但是其应用范围受限于数据量和结构信息的获取难度。
综合方法则是在上述两种方法的基础上进行融合以提高蛋白质亚细胞定位预测的准确度。
二、蛋白质亚细胞定位检测技术蛋白质亚细胞定位检测技术是指通过实验手段来验证蛋白质的亚细胞定位。
常见的方法包括免疫荧光、免疫印迹、蛋白质质谱等。
免疫荧光技术是通过将荧光标记的抗体与蛋白质结合,使其在荧光显微镜下呈现出特定的亚细胞定位。
该技术适用于细胞和组织水平的蛋白质定位研究。
免疫印迹技术则是通过将蛋白质从细胞组织中分离出来,然后使用特异性抗体来检测蛋白质的亚细胞定位。
该方法适用于较高纯度的蛋白质样品,但是不适用于细胞和组织水平。
蛋白质质谱技术是通过将蛋白质进行蛋白质质量分析和结构鉴定来确定其亚细胞定位。
该方法适用于各种类型的蛋白质样品,但是需要特殊的设备及技术支持。
三、蛋白质亚细胞定位预测及检测技术研究进展随着生命科学的不断发展,蛋白质亚细胞定位预测及检测技术也不断创新和完善。
近年来,人工智能在蛋白质亚细胞定位预测方面也发挥了重要作用。
植物蛋白质的亚细胞定位研究进展
植物蛋白质的亚细胞定位研究进展一、本文概述植物蛋白质在细胞中的亚细胞定位对于理解其生物功能及在植物生命活动中的作用至关重要。
近年来,随着生物技术的飞速发展,尤其是分子生物学、遗传学和蛋白质组学等领域的突破,植物蛋白质亚细胞定位的研究取得了显著进展。
本文旨在综述当前植物蛋白质亚细胞定位的研究现状,探讨其方法和技术,分析面临的挑战,并展望未来的发展趋势。
文章首先简要介绍了植物蛋白质亚细胞定位的基本概念和研究意义,随后综述了目前常用的定位方法和技术,包括生物信息学预测、荧光标记、免疫电镜等。
接着,文章重点分析了近年来在植物蛋白质亚细胞定位研究方面取得的重要成果,包括新发现的定位模式、定位机制以及定位与功能关系的研究等。
文章对当前研究中存在的问题和挑战进行了讨论,并提出了未来研究的方向和建议。
通过本文的综述,希望能够为植物蛋白质亚细胞定位领域的研究者提供有价值的参考和启示。
二、植物蛋白质亚细胞定位方法随着分子生物学和生物技术的快速发展,植物蛋白质的亚细胞定位研究取得了显著的进步。
亚细胞定位是理解蛋白质功能的关键环节,它有助于我们揭示蛋白质在细胞内的确切位置,从而推测其可能参与的生物过程。
目前,植物蛋白质亚细胞定位的方法主要包括生物信息学预测、荧光标记显微观察以及细胞分馏技术等。
生物信息学预测:这是一种基于计算机算法的方法,通过分析蛋白质的氨基酸序列,预测其可能的亚细胞定位。
这种方法具有快速、高效的特点,可以在蛋白质表达之前提供初步的定位信息。
目前,已有多个在线工具和数据库可供使用,如TargetP、WoLF PSORT等。
荧光标记显微观察:这种方法通过将荧光基团与特定的蛋白质标记结合,然后利用显微镜观察荧光信号在细胞内的分布,从而确定蛋白质的亚细胞位置。
常用的荧光标记技术包括绿色荧光蛋白(GFP)标记、免疫荧光标记等。
这种方法直观、准确,是目前研究蛋白质亚细胞定位的主要手段之一。
细胞分馏技术:这是一种基于生物化学原理的方法,通过利用不同细胞组分在物理和化学性质上的差异,将细胞内的各种组分进行分离和纯化,从而得到特定的亚细胞组分。
蛋白质亚细胞定位预测研究综述
蛋白质亚细胞定位预测研究综述QIAO Shan-ping;YAN Bao-qiang【期刊名称】《计算机应用研究》【年(卷),期】2014(31)2【摘要】蛋白质亚细胞定位预测对于确定蛋白质功能、揭示分子交互机理、理解复杂生理过程和设计药物靶标等方面都有很大的促进作用。
随着后基因组时代中蛋白质序列数据的指数增长,研究基于机器学习的计算性蛋白质亚细胞定位预测方法变得越来越重要。
为了能够把握该问题的研究状况,从数据集构建、蛋白质特征提取与表示、预测算法设计、算法测试和Web服务的建立等五个方面对蛋白质亚细胞定位预测的研究进行了综述。
指出了目前该研究领域需要解决的核心问题及难点问题,分析了当前研究中出现的一些新情况,并对将来的研究方向和研究重点进行了展望。
%Protein subcellular location prediction can promote scientists to determinate protein functions,to reveal how and in what kind of cellular environments proteins interact with each other and with other molecules,to understand the intricate pathways that re【总页数】7页(P321-327)【作者】QIAO Shan-ping;YAN Bao-qiang【作者单位】School of Management Science & Engineering,Shandong Normal University,Jinan 250014,China;School of Information Science & Engineering,University of Jinan,Jinan 250022,China;School ofMathematical Science,Shandong Normal University,Jinan 250014,China【正文语种】中文【中图分类】TP301.6【相关文献】1.PSO_BFA优化词袋模型及蛋白质亚细胞定位预测 [J], 胡雪娇; 陈行健; 赵南; 薛卫2.CL-RBF:一种基于改进ML-RBF的蛋白质亚细胞多点定位预测算法 [J], 薛卫; 洪晓宇; 胡雪娇; 陈行健; 张梁3.基于聚类与特征融合的蛋白质亚细胞定位预测 [J], 王艺皓;丁洪伟;李波;保利勇;张颖婕4.基于多标记学习的蛋白质亚细胞定位预测研究综述 [J], 余静;张靖5.基于特征融合与平衡数据集的蛋白质亚细胞定位预测研究 [J], 余静;张靖因版权原因,仅展示原文概要,查看原文内容请购买。
亚细胞定位
http://genomics.cicbiogune.es/ SECRETOOL/wolfpsort.php 真菌
阈值:实验经验值(默认14)
结果展示
Gene ID
蛋白ID
位点位置:分数
文献结果展示
K近邻法:对于一个待分类的测试样本,在多维空间中寻找与未知样本最相似的K样 本,及K个最近邻居,待测样本则被判定为K个样品中绝大多数样本所属的类别,因 为仅仅取决少量相邻的样本,因此这种算法能有效处理样品不均衡问题,
对于一个待分类的测试样本在多维空间中寻找与未知样本最相似的k样本及k个最近邻居待测样本则被判定为k个样品中绝大多数样本所属的类别因为仅仅取决少量相邻的样本因此这种算法能有效处理样品不均衡问题展望未来亚细胞定位的生物信息学研究作为亚细胞蛋白组学实验做了研究补充但是从生物学的角度来看
关于亚细胞定位知识探讨
展望未来
亚细胞定位的生物信息学研究作为亚细胞蛋白组学实验做了研 究补充,但是从生物学的角度来看:
目前各数据库的亚细胞定位注释不统一,给大规模分析带来困难 对分选信号的理解不透彻 有些蛋白质在细胞内并不是固定在某一个亚细胞内,如:转录因子, 具有流动性,这类蛋白研究较少。 对蛋白质功能和亚细胞定位之间关系理解不够深入。
贺位皇
生物信息平台
2016.09.02
主要内容
亚细胞定位知识背景 定位要点 软件使用 展望未来
亚细胞定位知识背景
生物体细胞是一个高度有序的结构,胞内根据空间分布和功能不同,可以分成不 同细胞器或细胞区域,如细胞核、高尔基体、内质网、线粒体、胞浆和细胞膜等。蛋白 质在核糖体中合成后经蛋白质分选信号引导后被转运到特定的细胞器中,部分蛋白质则 被分泌到细胞外或留在细胞质中,只有转运到正确的部位才能参与细胞的各种生命活动, 所以蛋白质的亚细胞定位信息日益重要。 ● 传统法 ●生信法
蛋白亚细胞定位方法
蛋白亚细胞定位方法-CAL-FENGHAI.-(YICAI)-Company One11.挑单克隆斑加到30ml LB中,加AMP。
37℃摇过夜。
2.分别取15ml菌液加到1L的LB中,加AMP,继续在37℃下摇至OD600=严格控制OD。
3. 加IPTG,使终浓度达到0.2mM , 18℃摇过夜。
4. 在4℃下以7700 × g . 8000 rpm)离心10min.5. 弃去上清,放在冰上。
6. 加入30~50ml ice-cold 1× PBS,用移液器悬浮细胞。
7. 用超声波超生。
取一部分超生后的产物用SDS-PAGE检测。
8. 向溶液中加入20%的Trion x-100,使终浓度达到1%。
Mix gently for 30 min to aid in solubilization of the fusion protein。
应该是在冰上。
9. 10 000 rpm 离心 for 10 min at 4 °C. 转移上清到一个新的容器中。
1× PBS (ice-cold): Dilute 10× PBS with sterile H2O. Store at 4 °C.10× PBS is 1.4 M NaCl, 27 mM KCl, 100 mM Na2HPO4, 18 mM KH2PO4, pH .1×PBS is 140 mM NaCl ; 2.7 mM KCl; 10 mM Na2HPO4; 1.8 mM KH2PO4,1L, 1×PBS配方如下:称取NaCl 8.18g; KCl 0.2g; 3.58g ; KH2PO4 0.245g 溶于800ml 水中,用HCl调节PH=,最后加蒸馏水定容至1L,高温高压灭菌。
2。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Nucleic Acids Research,2007,Vol.35,Web Server issue W585–W587doi:10.1093/nar/gkm259WoLF PSORT:protein localization predictorPaul Horton1,Keun-Joon Park1,2,Takeshi Obayashi3,Naoya Fujita1,3,Hajime Harada1,C.J.Adams-Collier4and Kenta Nakai3,*1Computational Biology Research Center,AIST,Tokyo,Japan,2Center for Genome Science,NationalInstitute of Health,Korea Center for Disease Control&Prevention,5Nokbeon-Dong,Eunpyung-Gu,Seoul122-701Korea,3Human Genome Center,Institute of Medical Science,University of Tokyo,Tokyo,Japan and4Collier Technologies,Everett,WA,USAReceived January30,2007;Revised March26,2007;Accepted April8,2007ABSTRACTWoLF PSORT is an extension of the PSORT II program for protein subcellular location prediction. WoLF PSORT converts protein amino acid sequences into numerical localization features; based on sorting signals,amino acid composition and functional motifs such as DNA-binding motifs. After conversion,a simple k-nearest neighbor classifier is used for ing html,the evidence for each prediction is shown in two ways: (i)a list of proteins of known localization with the most similar localization features to the query,and (ii)tables with detailed information about individual localization features.For convenience,sequence alignments of the query to similar proteins and links to UniProt and Gene Ontology are provided. Taken together,this information allows a user to understand the evidence(or lack thereof)behind the predictions made for particular proteins. WoLF PSORT is available at INTRODUCTIONBilipid membranes divide eukaryotic cells into various types of organelles containing characteristic proteins and performing specialized functions.Thus,subcellular localization information gives an important clue to a protein’s function.Although localization signals in mRNA appear to play some role(1),the main determi-nant of a protein’s localization residues in the protein’s amino acid sequence.(We recommend /wiki/ Protein_targeting for a brief overview and Alberts et al.(2)for a textbook description.)Numerous experiments to determine protein localiza-tion have been performed to date.These can broadly be classified as:small-scale experiments—the results of which continue to accumulate in public databases,such as UniProt(3)and Gene Ontology(4);and large-scale experiments using epitope(5)or greenfluorescent protein (GFP)(6)tagging,or by separation of organelles by centrifugation combined with protein identification by mass spectrometry(7,8).Although they provide invaluable information,the coverage of experimental data is only high for model organisms,particularly yeast.Moreover,the agreement amongst large-scale experimental data is only75–80% (6–9).Thus,computational prediction of localization from amino acid remains an important topic.Numerous computational methods are available [reviewed in(10,11)].Some(including WoLF PSORT) have recently been benchmarked by Sprenger et al.(12), who found the computational methods to be useful for sites,such as the nucleus,for which many training examples can be easily obtained from UniProt(which is the source of most or all of the training data for most prediction methods—including WoLF PSORT).The different methods they benchmarked were found to have different strengths.Here,we describe the public server for our WoLF PSORT method.PREDICTION METHODWoLF PSORT is an extension of PSORT II(13,14)and also uses the PSORT(15)localization features for prediction.In addition,WoLF PSORT uses some features from iPSORT(16)and amino acid composition.Those features are used to convert amino acid sequences into numerical vectors,which are then classified with a weighted k-nearest neighbor classifier.WoLF PSORT uses a wrapper method to select and use only the most relevant features.This reduces the amount of information which needs to be considered(and displayed)for the user to interpret individual predictions and may also make the predictor less prone to over learning.The prediction method has described in more detail elsewhere(17).*To whom correspondence should be addressed.Tel:þ81-3-5449-5131;Fax:þ81-3-5449-5133;Email:knakai@ims.u-tokyo.ac.jpß2007The Author(s)This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License(/licenses/ by-nc/2.0/uk/)which permits unrestricted non-commercial use,distribution,and reproduction in any medium,provided the original work is properly cited.DatasetThe WoLF PSORT dataset is divided into fungi,plant and animal containing 2113,2333and 12771proteins,respectively.The current data was primarily obtained from UniProt (3)version 45,but subcellular localization information from Gene Ontology (4)was also used.Entries with evidence codes {TAS,IDA,IMP}were included,with manual revisions in a few cases.We intend to update these datasets regularly in the future.LOCALIZATION SITES AND PREDICTION ACCURACYWoLF PSORT classifies proteins into more than 10loca-lization sites,including dual localization such as proteins which shuttle between the cytosol and nucleus.Based on our cross-validation studies (17),we estimate sensitivity and specificity of around 70%for:nucleus ,mitochondria ,cytosol ,plasma membrane ,extracellular and (in plants)chloroplast .For other sites,such as peroxisome,Golgi,etc.the sensitivity is very low,but useful predictions are still made in some cases.For example,the Arabidopsis seed protein 12S1_ARATH is reasonably predicted to localize to the vacuole even though only one of its neighbors (see below)shares significant sequence similarity.An independent test (12)on mouse proteins gave a significantly lower estimate of WoLF PSORT’s predic-tion accuracy (around 50%).This discrepancy may be explained by the over-representation of well-studied proteins in the WoLF PSORT training data and perhaps also by the size of their test data (in particular,their ‘LOC2145’test set contained only 87cytosolic proteins)or differences in site definition.PREDICTION RESULTS DISPLAYThe k -nearest neighbors classifier allows for an intuitive display of the prediction results which is exactly analogous to sequence similarity ing multifasta format,multiple sequences can be given in a query.The first page returned from the server gives a one line summary of the result for each query sequence.For example the prediction summary line for the TCOF_HUMAN protein is:TCOF_HUMAN details nucl:27.5,cyto_nucl:17,cyto:3.5,extr:1The localization sites are abbreviated to four letter codes (documented on the server)with dual localization denoted by joining the four letter codes with an underscore character.The numbers roughly indicate the number of nearest neighbors to the query which localize to each site—but are adjusted to account for the possibility of dual localization (17).Neighbor listDetails about the queries neighbor list and localization signals can be obtained by following the ‘details’link.The first part of the display page is a neighbor list table such as the one shown in Figure 1.This list gives information regarding the query’s neighbors (proteins in the WoLF PSORT training data that have the most similar localization features).For user convenience,the percent identity and a link to the alignment of each neighbor to the query is given.Sequence similarity is not used for prediction but can provide additional corroborating evidence in many cases.Links to the relevant entries in UniProt,Gene Ontology and TAIR ()for many Arabidopsis entries are also provided.Localization feature tableBy scrolling down on the detailed results pages,one can find a feature table giving the values of each localization feature for the query and its neighbors.In some cases,the individual values can help support (or question)the predicted site.For example in the case of TCOF_HUMAN (Figure 2),the 99percentile value of the PSORT localization feature ‘nuc’(which is based on nuclear localization signals and DNA-binding site motifs),is consistent with the nuclear prediction.Below the normalized table,a similar table with the raw feature values is displayed.IMPLEMENTATIONThe server is implemented with Mason (),which allows convenient embedding of logic and computed results into html via the Perl programming language.Multiple requests are handled with the simple strategy of returning the results in a URI containing an MD5hash of the querycontents.Figure 1.Part of the list of proteins similar to the query protein,an isoform of TCOF_HUMAN,is shown.For each neighbor the following is shown:UniProt ID,localization site,the distance in localization features from the query,the percent identity to the query,a link to its UniProt entry,the subcellular localization line from UniProt and other available localization information.W586Nucleic Acids Research,2007,Vol.35,Web Server issueUpon sending a query a wait page is shown,followed by an automatic redirect to the results page upon task completion (usually requiring around 40s).Task schedul-ing is delegated to Apache and the Linux operating system.Multiple sequences are allowed in one query,but we currently limit the query size to 64KB.For large-scale use,such as whole genome annotation,we encourage users to download the stand-alone package (available on the server)and run WoLF PSORT locally.SUMMARYWoLF PSORT not only provides subcellular localization prediction with competitive accuracy,but also provides detailed information relevant to protein localization to help users to form their own hypotheses.ACKNOWLEDGEMENTSKN was partly supported by a grant from the National Project on Protein Structural and Functional Analyses by the Ministry of Education,Culture,Sports,Science and Technology in Japan.The annual budget of the Human Genome Center was used for the publication of this paper.Conflict of interest statement .None declared.REFERENCES1.Gonsalvez,G.B.,Urbinati,C.R.and Long,R.M.(2005)RNAlocalization in yeast:moving towards a mechanism.Biol.Cell ,97,75–86.2.Alberts,B.,Bray,D.,Lewis,J.,Raff,M.,Roberts,K.and Watson,J.D.(2002)Molecular Biology of the Cell ,4th edn .Garland Publishing.New York.3.Bairoch,A.,Apweiler,R.,Wu,H.,Barker,C.,Boeckmann,B.,Ferro,S.,Gasteiger,E.,Huang,H.,Lopez,R.et al .(2005)The universal protein resource (UniProt).NAR ,33,D154–D159.4.Ashburner,M.,Ball,C.A.,Blake,J.A.,Botstein,D.,Butler,H.,Cherry,J.M.,Davis,A.P.,Dolinski,K.,Dwight,S.S.,et al .(2000)Gene ontology:tool for the unification of biology.Nat.Genet.,25,25–29.5.Kumar,A.,Agarwal,S.,Heyman,J.A.,Matson,S.,Heidtman,M.,Piccirillo,S.,Umansky,L.,Drawid,A.,Jansen,R.,et al .(2002)Subcellular localization of the yeast proteome.Genes Dev.,16,707–719.6.Huh,W.-K.,Falvo,J.V.,Gerke,L.G.,Carroll,A.S.,Howson,R.W.,Weissman,J.S.and O’Shea,E.K.(2003)Global analysis of protein localization in budding yeast.Nature ,425,686–691.7.Prokisch,H.,Scharfe,C.,Camp II,D.G.,Xiao,W.,David,L.,Andreoli,C.,Monroe,M.E.,Moore,R.J.,Gritsenko,M.A.,et al .(2004)Integrative analysis of the mitochondrial proteome in yeast.PLoS Biol.,2(6):e160.8.Foster,L.J.,de Hoog,C.L.,Zhang,Y.,Xie,X.,Mootha,V.K.and Mann,M.(2006)A mammalian organelle map by protein correlation profiling.Cell ,125,187–199.9.Nair,R.and Rost,B.(2005)Mimicking cellular sortingimproves prediction of subcellular localization.JMB ,348,85–100.10.Emanuelsson,O.(2002)Predicting protein subcellular localisationfrom amino acid sequence information.Brief.Bioinformatics ,3,361–376.11.Horton,P.,Mukai,Y.and Nakai,K.(2004)Protein localizationprediction.In Wong,L.(ed.),The Practical Bioinformatician ,Chapter 9,pp.193–215,World Scientific 5Toh Tuck Link,Singapore 596224.12.Sprenger,J.,Fink,J.L.and Teasdale,R.D.(2006)Evaluation andcomparison of mammalian subcellular localization prediction methods.BMC Bioinformatics ,7(Suppl 5),S3.13.Horton,P.and Nakai,K.(1997)Better prediction of protein cellularlocalization sites with the k nearest neighbors classifier.In Gaasterland,T.,Karp,P.,Karplus,K.,Ouzounis,C.,Sander,C.and Valencia,A.(eds),Proceeding of the Fifth International Conference on Intelligent Systems for Molecular Biology .AAAI Press,Halkidiki,Greece,pp.147–152.14.Nakai,K.and Horton,P.(1999)Psort:a program for detectingsorting signals in proteins and determining their subcellular localization.TIBS ,24,34.15.Nakai,K.and Kanehisa,M.(1992)A knowledge base forpredicting protein localization sites in eukaryotic cells.Genomics ,14,897–911.16.Bannai,H.,Tamada,Y.,Maruyama,O.,Nakai,K.and Miyano,S.(2002)Extensive feature detection of N-terminal protein sorting signals.Bioinformatics ,18,298–305.17.Horton,P.,Park,K.-J.,Obayashi,T.and Nakai,K.(2006)Proteinsubcellular localization prediction withWoLF PSORT.In Jiang,T.,Yang,U.-C.and Chen,Y.-P.P.(eds),Proceedings of the 4th Annual Asia Pacific Bioinformatics Conference,APBC06,Imperial College Press,London,pp.39–48.Figure 2.The localization features for the query and its neighbors are shown.The values are normalized to percentiles relative to the WoLF PSORT training data.Neighbor values shown in blue are within 10%points to the query value,while those shown in red are 20or more percentile point different from the query.Nucleic Acids Research,2007,Vol.35,Web Server issue W587。