PIR-PSD 蛋白质序列数据库
生物信息研究中常用蛋白质数据库的总结
生物信息研究中常用蛋白质数据库简述内蒙古工业大学理学院呼和浩特孙利霞2010.1.5摘要:在后基因组时代生物信息学的研究当中,离不开各种生物信息学数据库。
尤其在蛋白质从序列到功能的研究当中,目前各种行之有效的方法都是基于各种层次和结构的蛋白质数据库。
随着计算机技术及网络技术的发展,目前的蛋白质数据库不论是所包含数据量还是功能都日新月异,新的数据库层出不穷。
一个新手面对如此浩瀚的数据量往往无从下手。
本文粗浅地为目前蛋白质数据库的使用勾画出一个轮廓,作为自己蛋白质研究入门的一个引导。
关键词:蛋白质;数据库0 引言随着科技的发展,个人的知识往往赶不上快速膨胀的信息量,人们为了解决这个问题,便创建了形形色色的数据库。
蛋白质数据库是指:在蛋白质研究领域根据实际需要,对蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建出具有特殊生物学意义和专门用途的数据库。
蛋白质数据库总体上可分为两大类:蛋白质序列数据库和蛋白质结构数据库,蛋白质序列数据库来自序列测定,结构数据库来自X-衍射和核磁共振结构测定(详见图1)。
这些数据库是分子生物信息学的基本数据资源。
上世纪90年代,我国从事蛋白质研究的学者使用的蛋白质数据库储存介质还是国外实验室发布的激光光盘[1]。
信息的传播储存甚为不便。
随着蛋白质研究的发展飞快,同时伴随着计算机和因特网发展,蛋白质数据库的储存传播方式也发生的巨大的变化。
进入21世纪后,我们所用的各种蛋白质数据库都发展成为存储在网络服务器上,基于“服务器—客户机”的访问查询方式。
伴随着计算机及物理测试技术的发展数据库的容量和功能成数量级膨胀。
但是面对如此浩瀚的数据,新手往往感到无从下手,在需要时找不到自己需要的合适数据库。
本文从目前蛋白质数据库建立的的逻辑层次出发,系统地简绍了常用蛋白质数据的概况,它们的查询方法以及它们相互之间的联系。
同时尽量不涉及数据库建设和维护方面的计算机和网络这些数据库底层的技术,为蛋白质研究的入门者及对蛋白质感兴趣的人员的一个引导。
蛋白质工程原理与技术
蛋白质工程原理与技术蛋白质工程与原理技术1、什么是蛋白质工程?P1答:蛋白质工程(Protein engineering )是通过对蛋白质结构与功能关系的了解,借助于生物信息学的知识和手段,利用基因定点诱变和基因重组等技术特异性地改造蛋白质的结构基因,产生具有新的特性的蛋白质的技术。
2、什么是基因定点诱变?答:就是在DNA水平上,通过对蛋白质结构基因中某个或某些氨基酸编码顺序加以改变,从而改变蛋白质结构的技术。
该技术不仅可用于改造天然蛋自质,而且可以用于确定蛋白质中每一个氨基酸在结构和功能上的作用,以收集有关氨基酸线形顺序与其空间构象和生物学活性之间的对应关系,为人工改造蛋白质提供理论依据。
3、什么是表达载体?P27答:表达载体:就是在克隆载体基本骨架的基础上增加表达元件(转录和翻译所必需的DNA序列,如启动子、终止子等),使外源DNA片段能够在宿主细胞中表达蛋白质。
包括原核细胞表达载体和哺乳动物细胞表达载体两类。
4、什么是克隆载体?P27答:克隆载体:在载体上插入合适大小的外源DNA片段,并引入到宿主细胞中进行大量繁殖,使外源DNA片段得到大量扩增。
5、基因克隆的基本程序?P29答:(1)获得目的基因;(2)与克隆载体连接,形成新的重组DNA分子;(3)用重组DNA分子转化受体细胞,并能在受体细胞中复制和遗传;(4)对转化子筛选和鉴定;(5)对获得外源基因的细胞或生物体通过培养,获得所需的遗传性状或表达出所需要的产物。
6、真核基因在大肠杆菌中的表达方式?(条件)P34答:基本条件:①大肠杆菌没有剪切内含子的功能,所以,真核细胞的目的基因必须来自于cDNA;②真核基因mRNA缺乏结合细菌核糖体的SD序列,因此cDNA的起始密码子(ATG)上游部分(5‘端非编码区)是无用的,必须除去。
对于一些分泌性蛋白,还应除去信号肽部分;③表达载体应是含有大肠杆菌RNA聚合酶所能识别的启动子和SD序列的大肠杆菌表达载体; ④载体上只能用大肠杆菌启动子,将外源基因克隆在启动子下游,以便大肠杆菌RNA聚合酶识别启动子,并带动真核基因在大肠杆菌细胞中转录。
Uniprot数据库介绍及信息检索下载指南
UniProt数据库一、UniProt数据库简介蛋白质组常用数据库——UniProt数据库,是信息最丰富、资源最广的蛋白质数据库。
它由Swiss-Prot、TrEMBL 和PIR-PSD三大数据库的数据整合而成,数据主要来自于基因组测序项目完成后,后续获得的蛋白质序列,并包含了大量来自文献的蛋白质生物功能的信息。
一般蛋白质组搜库首选数据库也是UniProt,所以对于通过UniProt库搜库的组学数据,可以在此网站中进行蛋白功能查询。
UniProt数据库可以提供的信息包括蛋白功能描述、GO条目、细胞定位、组织特异性表达情况、生理病理情况描述、互作蛋白、Domain、翻译后修饰位点等信息。
蛋白的信息描述段落均会标出引用文章,并且可以跳转到PubMed界面进行浏览。
UniProt 数据库由UniProt 知识库(UniProtKB )、UniProt 档案(UniParc )、UniProt 参考资料库(UniRef)以及UniProt元基因组学与环境微生物序列数据库(UniMES)构成。
UniProtKB全称 UniProt Knowledgebase(UniProt知识库)它是经过专家校验的数据集,主要由两部分组成:UniProtKB/Swiss-Prot (包含检查过的、手工注释的条目) 和 UniProtKB/TrEMBL (包含未校验的、自动注释的条目)。
Swiss-Prot 数据库特点高质量的、手工注释的、非冗余的数据集;主要来自文献中的研究成果和E-value校验过计算分析结果。
有质量保证的数据才被加入该数据库!TrEMBL数据集包含高质量的计算分析结果,一般都在自动注释中富集,主要应对基因组项目获得的大量数据流以人工校验在时间上和人力上的不足。
它能注释所有可用的蛋白序列。
在三大核酸数据库(EMBL-Bank/GenBank/DDBJ)中注释的编码序列都被自动翻译并加入该数据库中。
它也有来自PDB数据库的序列,以及Ensembl、Refeq和CCDS基因预测的序列。
蛋白质数据库
蛋白质数据库1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。
这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。
所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。
PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。
每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。
PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2. SWISS-PROTSWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。
数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。
SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。
SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
3. PROSITEPROSITE数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。
生物信息学中的数据库资源及其应用
生物信息学中的数据库资源及其应用摘要:伴随着生物信息学的发展,生物信息数据库日趋完善。
现对生物信息学、数据库的建设及其应用情况进行了综述,并展望生物信息学的发展前景。
关键词:生物信息学;数据库的建设及其应用生物信息学(Bioinformatics)是80年代末随着人类基因组计划的启动而兴起的一门新的交叉学科,最初常被称为基因组信息学。
广义地说,生物信息学是一门采用计算机技术和信息论方法对蛋白质及其核酸序列等多种生物信息采集、加工、储存、传递、检索、分析和解读的科学,是现代生命科学与信息科学、计算机科学、数学、统计学、物理学和化学等学科相互渗透而形成的交叉学科。
美国人类基因组计划中[1],对基因组信息学有这样的定义:它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。
这一定义包含着两方面的内容,一方面是发展有效的信息分析工具,构建适合于基因组研究的数据库,用于搜集,管理,使用人类基因组和模式生物基因组的巨量信息。
另一方面是配合实验研究,确定约30亿个碱基对的人类基因组完整核苷酸顺序,找出全部约10万个人类基因在染色体上的位置以及包括基因在内的各种DNA片段的功能,也就是“读懂”人类基因组[2]。
正如基因组信息学的定义所确定的,它的研究内容主要包含两个部分,一是基因组相关数据的收集与管理,另一个是基因组数据内涵的分析与解释,也就是遗传密码的破译。
生物信息学自产生以来大致经历了前基因组时代、基因组时代和后基因组时代三个发展阶段。
前基因组时代的标志性工作包括生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等;基因组时代的标志性工作包括基因识别与发现、网络数据库系统的建立和交互界面工具的开发等;后基因组时代的标志则是大规模基因组分析、蛋白质组分析以及各种数据的比较与整合。
三个阶段虽无明显的界限,却真实地反映了整个研究重心的转移变化历程[3]。
1 生物信息学数据库简介近年来随着大量生物学实验数据的积累,众多的生物学数据库也相继出现,它们各自按照一定的标准收集和处理生物学实验数据,并提供相关的数据查询、处理等服务。
检验实验室试题-第6期
检验实验室试题姓名:()成绩:()一、单项选择题(每题1分,共100分)1.单核吞噬细胞系统功能不包含以下哪个A.诱导免疫反应B. 移植排斥反应C. 吞噬和杀灭某些病原体D.吞噬红细胞和清除损伤组织及死亡的细胞E. 抗肿瘤活性2.目前临床上最常用的尿酮体筛检方法是A.胶体金法B. 片剂法C. 滴定法D. 湿化学法E. 试带法3.不符合尿沉渣镜检标准化的是A.10ml尿液离心后保留0.2ml尿沉渣B.先用低倍镜,再用高倍镜观察C.检查细胞应观察10个高倍视野D.检查管型应观察20个高倍视野E.以观察视野的细胞.管型的平均值报告4.肾小管上皮细胞来自A.远曲小管和近曲小管B. 输尿管C. 膀胱D. 尿道E. 肾盂5.正常人可偶见的是A.颗粒管型B. 脂肪管型C. 蜡样管型D. 透明管型E. 宽大管型6.诊断泌尿系统感染的尿液革兰氏阴性菌的菌落计数应大于A.10cfu/mlB. 10 2cfu/mlC. 103cfu/mlD. 104 cfu/mlE. 10 5cfu/ml7.特异性最好的粪便隐血试验是A.免疫学法B. 还原酚酞法C. 邻-甲苯胺法D. 无色孔雀绿法E. 愈创木酯法8.正常婴儿粪便细菌主要为A.变形杆菌B. 大肠埃希菌C. 产气杆菌D. 葡萄球菌E. 绿脓杆菌9.棕褐色痰常见于A.阿米巴肺脓肿B. 支气管哮喘C. 支气管扩张症D. 肺癌E. 细菌性肺脓肿10.输血时主要考虑A.供血者红细胞不被受血者红细胞所凝集B.供血者红细胞不被受血者血浆所凝集C.供血者血浆不使受血者血浆所凝集D.供血者血浆不被受血者红细胞所凝集E.受血者红细胞不与其血浆发生凝集11.主要组织相容性复合体是A.MHCB. MHAC. HLAD. H-2E. RLA12.免疫系统不包括A.免疫细胞B.免疫分子C.免疫原D.中枢免疫器官E.外周免疫器官13.最早用人痘苗预防天花的国家是A.美国B. 英国C. 中国D. 日本E. 俄国14.补体结合试验的判断终点是A.25%溶血B. 50%溶血C. 75%溶血D. 85%溶血E. 100%溶血15.福氏完全佐剂的组成A.液体石蜡+羊毛脂B. 羊毛脂+氢氧化铝C. 液体石蜡+羊毛脂+卡介苗D. 卡介苗+氢氧化铝+羊毛脂E. 液体石蜡+羊皮脂+卡介苗16.下列不属于抗核抗体的是A.抗DNA抗体B. 抗组蛋白抗体C. 抗非组蛋白抗体D.抗核仁抗体E. 抗蛋白酶抗体17.关于单参数直方图的描述正确的是A.能显示两个独立的参数与细胞的关系B.通过十字门进行测定C.只能表明一个参数与细胞数量的关系D.只能用于定性资料的分析E.不是通过线性门进行测量18.三磷酸肌醇可使胞浆内哪一种离子升高A.MgB. CaC. KD. NaE. 以上选项都不是19.最严重的Ⅰ型超敏反应是A.消化道过敏反应B. 皮肤过敏反应C. 过敏性皮炎D.呼吸道过敏反应E. 过敏性休克20.目前公认类风湿关节炎的标志抗体是A.抗Sm抗体B. 抗SSB抗体C. 抗环瓜氨酸抗体D.抗dsDNA抗体E. 抗RNP抗体21.可见-紫外分光光度法的理论基础为A.Rayleigh方程式B. Nernst方程式C. Lambert-Beer定律D. Heidelberger曲线E. ROC曲线22.酶的活性国际单位(U)是指A.在25℃及其他最适条件下,每分钟催化1mmol底物反应所需的酶量B.在规定条件下,每秒钟催化1mol底物反应所需的酶量C.在37℃条件下,每分钟催化1mmol底物发生反应所需的酶量D.在特定的条件下,每分钟催化1μmol底物发生反应所需的酶量E.在最适条件下,每秒钟催化1mol底物发生反应所需的酶量23.前列腺癌诊断首选的生化指标是A.ACPB. ALPC. GGTD. PSAE. ALT24.具有冷变性特点的酶是A.AMYB. LDHC. ALPD. ASTE. CK25.以下会出现胆酶分离的疾病是A.急性心肌梗死B. 胆石症C. 肝坏死D. 脂肪肝E. 肝癌26.妊娠定性试验的标本最好是A.首次晨尿B. 随机尿液C. 午后尿液D. 夜间10~12时尿E.夜间3~4时尿27.正常条件下作为脑组织惟一能量来源的物质是A.糖B. 氨基酸C. 甘油D. 蛋白质E. 酮体28.现国内外推荐的甲状腺功能紊乱的首选筛查项目是A.FT3,FT4B. TBGC. TSHD. TRHE. TT3,TT429.诊断糖尿病的金标准是A.OGTT试验,2小时血糖>11.1mmol/LB.空腹血糖浓度>7.0mmol/LC.随机取样血糖浓度>11.1mmol/LD.餐后2小时血糖浓度>11.1mmoL/LE.尿糖浓度>1.1mmoL/L30.AMI发生后最先出现于血液中的标志物是A.MbB. CK-MBC. cTNTD. CKE. cTnI31.食物中缺碘会引起A.Graves病B. 桥本甲状腺炎C. 急性甲状腺炎D. 地方性甲状腺肿E. 甲状腺癌.32.间隔用药时治疗药物监测的标本,采集时间一般选择在A.任一次用药后1个半衰期时B.血药浓度达稳态浓度后任一次用药后C.血药浓度达稳态浓度后任一次用药后1个半衰期时D.血药浓度达稳态浓度后任一次用药前E.随机取样33.IFCC建议将缩短测定周期控制在多长时间之内A.4hB. 3hC. 2hD. 1hE. 0.5h34.我国室间质评中的标准优良的变异指数得分是A.VIS<50B. VIS<80C. VIS<100D. VIS<150E. VIS<20035.为消除内源性干扰自动生化分析仪可以利用下列哪种方法A.双试剂B. 单试剂C. 双波长D. 单波长E. 多通道36.可用荚膜肿胀试验鉴定的菌株是A.甲型链球菌B. 粪肠球菌C. D群链球菌D. B群链球菌E. 肺炎链球菌37.下列哪项是引起DIC的主要物质A.透明质酸酶B. 荚膜多糖C. 内毒素D. 菌毛E. 外毒素38.保存菌种的方法不属于培养基保存法的是A.普通琼脂斜面保存法B. 血琼脂斜面保存法C. 干燥保存法D. 巧克力琼脂斜面保存法E. 半固体穿刺保存法39.青霉素对细菌的作用机制是A.切断β-1,4糖苷键B.干扰四肽侧链与五肽交联桥的连接C.影响细胞膜的合成D.干扰磷壁酸的活性E.干扰细菌DNA的复制40.细菌合成细胞组分和获得能量的基质主要是A.蛋白质B. 淀粉C. 脂类D. 糖类E. 糖原41.属于条件致病菌的细菌是A.破伤风梭菌B. 产气荚膜梭菌C. 难辨梭菌D. 肉毒梭菌E. 丙酸梭菌42.血液增菌培养结果呈均匀混浊生长并有胶胨状凝块者,可能为A.伤寒沙门菌B. 金黄色葡萄球菌C. 铜绿假单胞菌D. 肺炎链球菌E. 粪产碱杆菌43.呈沉淀生长的革兰阳性需氧杆菌是A.白喉棒状杆菌B. 产单核细胞李斯特菌C. 蜡样芽胞杆菌D. 阴道加特纳菌E. 炭疽芽胞杆菌44.在碱性培养基中生长良好的细菌是A.葡萄球菌B. 大肠埃希菌C. 霍乱弧菌D. 结核分枝杆菌E. 厌氧菌45.卵磷脂酶试验用于下面哪个菌的鉴定A.肉毒梭菌B. 铜绿假单胞菌C. 产气荚膜梭菌D. 蜡样芽胞杆菌E. 结核杆菌46.冷凝集试验阳性时,抗体效价应≥A.1:128B. 1:64C. 1:32D. 1:16E. 1:847.新型隐球菌与白色假丝酵母菌最重要的鉴别点是A.22℃及37℃均能生长B. 尿素酶试验阳性C. 对鼠有致病性D. 形成酵母样菌落E. 芽管形成试验48.伤寒发病第一周时阳性检出率最高的是A.粪便培养B. 血液培养C. 尿液培养D. 肥达反应E. 呕吐物培养49.葡萄球菌A蛋白是一种细菌表面蛋白,其英文简称是A.HRPB. SAPC. SPAD. SSPE. ASP50.采集脑脊液标本不能分离的病毒是A.柯萨奇病毒B. 肝炎病毒C. 肠道病毒D. ECHO病毒E. 腮腺炎病毒51.Ⅰ型异形淋巴细胞是指哪种细胞A.不规则型B. 幼淋巴细胞样型C. 幼稚型D. 浆细胞型E. 单核细胞样型52.鉴别慢性粒细胞性白血病和类白血病最有价值的细胞染色法是A.特异性酯酶染色B. 非特异性酯酶染色C. 过氧化物酶染色D. 中性粒细胞碱性磷酸酶染色E. 糖原染色53.尼曼-匹克病会导致下列什么物质在细胞中堆积A.鞘磷脂B. 糖原C. 葡萄糖脑苷脂酶D. 葡萄糖脑苷脂E. 鞘磷脂酶54.淋巴细胞型类白血病反应最常见的致病原因是下列哪项A.细菌感染B. 大面积烧伤C. 恶性肿瘤D. 恶性肿瘤E. 病毒感染55.下列哪项符合嗜酸性粒细胞增多症A.外周血中嗜酸性粒细胞>4%,以成熟型为主B.骨髓中红系.巨系常受抑C.本病的主要诊断依据是骨髓检查D.外周血不可见幼稚细胞E.骨髓中以幼稚嗜酸性粒细胞增多为主,且有形态异常56.骨髓涂片中的哪一项特点对诊断霍奇金淋巴瘤最有价值A.可见尼曼-匹克细胞B. 淋巴细胞增多C. 非造血细胞增多D. 嗜酸性粒细胞增多E. 可见Reed-Sternberg细胞57.诊断温抗体型自身免疫性溶血性贫血最重要的实验室检查是A.Ham试验B. 免疫球蛋白试验C. 血红蛋白电泳D. 游离血红蛋白测定E. Coombs试验58.内源性凝血系统最常用的筛检试验是A.APTTB. 复钙时间C. CTD. ACTE. BT59.临床上IgG型多发性骨髓瘤约占百分数为A.80%B. 70%C. 60%D. 40%E. 20%60.诊断慢性血管内溶血最有意义的阳性结果是A.尿胆原阳性B. 黄疸C. 血清间接胆红素阳性D. 抗人球蛋白试验阳性E. 尿含铁血黄素试验阳性61.阴道毛滴虫可引起的疾病是A.黑热病B. 睡眠病C. 恰加斯病D. 旅游者腹泻E. 阴道炎62.钩虫感染方式主要是A.经口传播B. 经皮肤传播C. 自体传播D. 经胎盘传播E. 经呼吸道传播63.急性阿米巴痢疾最常用的实验诊断方法是A.直接涂片法B. 饱和盐水浮聚法C. 透明胶纸法D. 厚.薄血膜涂片法E. 碘液染色法64.钩虫对宿主的最主要危害是A.皮炎B. 肠炎C. 肺部病变D. 异嗜症E. 贫血65.诊断蛲虫感染的首选方法是A.粪便直接涂片法B. 粪便饱和盐水漂浮法C. 粪便水洗沉淀法D. 肛门拭子法E. 免疫法66.在中国流行最广泛的疟原虫是A.恶性疟原虫B. 间日疟原虫C. 三日疟原虫D. 卵形疟原虫E. 以上都对67.PIR和PSD数据库是A.世界上最大的蛋白质序列数据库B.中国最大的蛋白质序列数据库C.欧洲最大的蛋白质序列数据库D.美国最大的蛋白质序列数据库E.日本最大的蛋白质序列数据库68.分子生物学检验技术不能用于以下临床实验诊断的哪些方面A.病毒的检测B. 支原体的检测C. 亲子关系的鉴定D. 个体身份的识别E. 细菌感染能力的鉴定69.生物芯片作用的原理是A.分子杂交B. 抗原抗体反应C. 生物分子间特异性相互作用D. 荧光定量E. 亲和层析70.细胞内寿命最短的RNA是A.tRNAB. mRNAC. snRNAD. rRNAE. 环状RNA71.目前室间质量评价活动主要评价的是A.精密度B. 灵敏度C. 准确度D. 特异性E. 总误差72.按NCCLSEP5文件进行精密度评价时,每天实验时,各批之间至少间隔几小时A.2B. 3C. 4D. 5E. 673.二级参考测量方法所用的校准物质一般是A.一级参考物质B. 二级参考物质C. 常规测量方法D. 一级参考测量方法E. 二级参考测量方法74.危急值指的是指A.急诊患者检测结果B. 医学决定水平C. 异常结果D. 危重患者抢救时检测结果E. 一些检测项目的测定值过高.过低时可能危及患者生命的值75.临床实验室建立质量管理体系的首要原则是A.领导作用B. 以患者为中心C. 全员参与D. 持续改进E. 决策方法76.准确性和一致性的来源是A.法制性B. 有效性C. 溯源性D. 确定性E. 可靠性77.国际上最早建立.最完善.成效最显著的临床检验参考系统是A.甘油三酯参考系统B. 胆固醇参考系统C. 糖化血红蛋白参考系统D. 高密度脂蛋白参考系统E. 低密度脂蛋白参考系统78.正态曲线下面积有一定的规律,μ±3σ的面积占总面积的A.80.7%B. 80.5%C. 98.7%D. 99.7%E. 99.9%79.用EDTA抗凝血作下列检验,影响检验结果最大的是A.RBCB.HCTC. CaD. TPE. HBsAg80.测得血糖20天室内质量控制数据,计算出其均值为5.0mmol/L,标准差为0.25mmol/L,其变异系数应为A.1%B. 2%C. 3%D. 4%E. 5%81.男性,64岁,因低热.乏力3月余就诊,两侧颈部可触及多个蚕豆大小淋巴结,脾肋下2cm,RBC 4.25×10 12/L,Hb 134g/L,WBC 19.1×10 9 /L,白细胞分类:中性分叶核细胞15%,中性杆状核细胞2%,淋巴细胞83%,PLT 152×10 9 /L。
蛋白质序列数据库
4 UniPro
▪ 蛋白质信息资源(PIR)、欧洲生物信息学研究所(EBI) 和瑞士生物信息学研究所(SIB)合作,于2002年共同组 建世界蛋白质资源(the Universal Protein Resource, UniPro)。
▪ UniPro把Swiss-Prot、TrEMBL和PIR等蛋白质数据库整 合在一起,是目前国际上最全面的蛋白质信息库。
综上所述,蛋白质序列数据库种类多且各有特色,因 此,用户在分析蛋白质序列时,应根据实际情况,尽可能 选择几个不同的数据库,并对结果加以比较。
The Universal Protein Resource (Uபைடு நூலகம்iProt)
属性。
5 序列描述:
是在生物和(或)生物文献的上下文中描述一个生 物序列或生物序列集;
生物源(BioSource)-来源生物的信息; 分子信息(MolInfo)--描述器指示分子类型,如基因,
mRNA,EST,肽链信息。
蛋白质数据分析
由于传统的用X光晶体衍射和核磁共振 技术测定蛋白质的三维结构、用生化方法 研究蛋白质功能的效率不高,无法适应由 基因组测序所带来的蛋白质序列数量飞速 增长的需要,近年来,许多科学家致力于 用理论计算的方法预测蛋白质的三维结构 和功能,提高蛋白质功能研究的效率,并 取得了一定的成果。
信息、注释、蛋白质序列等(如:Acetyltransferase)。
3D structure
c. 蛋白质注释
包括蛋白质的功能、翻译后修饰(如糖基化和磷酸 化)、结构域和结合位点、二级结构(如α- 螺旋和β- 片 层)、四级结构(如同聚体和异聚体)、与其它蛋白质序 列的相似性、蛋白质序列残缺与疾病的关系、序列冲突和 变异体等信息。
蛋白质组学研究中常用的网站和数据库
蛋白质组学研究中常用的网站和数据库蛋白质, 数据库, 研究本帖引用网址:/thread-35586-1-1.html一、蛋白质数据库1.UniProt (The Universal Protein Resource) 网址://uniprot/简介:由EBI(欧洲生物信息研究所)、PIR(蛋白信息资源)和SIB(瑞士生物信息研究所)合作建立而成,提供详细的蛋白质序列、功能信息,如蛋白质功能描述、结构域结构、转录后修饰、修饰位点、变异度、二级结构、三级结构等,同时提供其他数据库,包括序列数据库、三维结构数据库、2-D凝聚电泳数据库、蛋白质家族数据库的相应链接。
2.PIR(Protein Information Resource) 网址:/简介:致力于提供及时的、高质量、最广泛的注释,其下的数据库有iProClass、PIRSF、PIR-PSD、PIR-NREF、UniPort,与90多个生物数据库(蛋白家族、蛋白质功能、蛋白质网络、蛋白质互作、基因组等数据库)存在着交叉应用。
3.BRENDA(enzyme database) 网址:简介:酶数据库,提供酶的分类、命名法、生化反应、专一性、结构、细胞定位、提取方法、文献、应用与改造及相关疾病的数据。
4.CORUM(collection of experimentally verifiedmammalian protein complexes) 网址:http://mips.gsf.de/genre/proj/corum/index.html简介:哺乳动物蛋白复合物数据库,提供的数据包括蛋白复合物名称、亚基、功能、相关文献等5.CyBase(cyclic protein database) 网址:.au/cybase简介:环状蛋白数据库,提供环状蛋白的序列、结构等数据,提供环化蛋白预测服务。
6.DB-PABP 网址:/DB_PABP/简介:聚阴离子结合蛋白数据库。
UniProt:蛋白质的全信息数据库
Nucleic Acids Research, 2004, Vol. 32, Database issue D115-D119© 2004 Oxford University PressUniProt:蛋白质的全信息数据库摘要为了给科学界提供一个专门,集中,权威的蛋白质序列和功能的信息资源,瑞士-Prot,TrEMBL 和PIR蛋白质数据库已经合作组成了蛋白质的全信息数据库 (UniProt)。
我们的目的是用广泛的对照和询问接口来提供一个全面的,分类完全的,丰富并且准确的蛋白质序列信息。
中心数据库将有两个部分:符合熟悉的瑞士-Prot(完全手工操作入口)和TrEMBL(使用丰富的自动化的分类,注释和广泛的对照)。
为方便序列查寻,UniProt也提供几个无冗余的序列数据库。
UniProt NREF(UniRef)数据库为高效率的搜寻提供适当的蛋白质的全信息数据库的代表性的子集。
全面的UniProt 档案(UniParc)每天从很多公共来源数据库更新。
数据库那些UniProt接口可在线访问()或者以几个形式下载(ftp:///pub)。
我们鼓励科学界人士向UniProt 提供数据。
介绍近来,瑞士-Prot + TrEMBL和PIR-PSD如同蛋白质数据库不同的序列信息覆盖面和注释优势共存。
2002年,在生物信息科学(SIB)的瑞士研究所和欧洲生物信息科学研究所的瑞士-Prot + TrEMBL 组 (EBI)和蛋白质信息资源(PIR)组织在乔治敦大学医学中心和国家生物医学的研究基金会联合协作。
新联合的组织的主要任务是通过建立一个综合,详细分类,丰富并且准确注释蛋白质序列的优质的数据库和广泛序列对比和询问服务的到科学团体免费接口—knowledgebase来支持生物学的研究。
UniProt 将在组织成员多年合作的坚实基础上建立起来。
UniProt 数据库包括3 个数据库层:1、UniProt 档案(UniParc),通过储存全部可公开得到的蛋白质序列数据供一个稳定,综合,无冗余的序列收集。
UniProt:蛋白质的全信息数据库
Nucleic Acids Research, 2004, Vol. 32, Database issue D115-D119© 2004 Oxford University PressUniProt:蛋白质的全信息数据库摘要为了给科学界提供一个专门,集中,权威的蛋白质序列和功能的信息资源,瑞士-Prot,TrEMBL 和PIR蛋白质数据库已经合作组成了蛋白质的全信息数据库 (UniProt)。
我们的目的是用广泛的对照和询问接口来提供一个全面的,分类完全的,丰富并且准确的蛋白质序列信息。
中心数据库将有两个部分:符合熟悉的瑞士-Prot(完全手工操作入口)和TrEMBL(使用丰富的自动化的分类,注释和广泛的对照)。
为方便序列查寻,UniProt也提供几个无冗余的序列数据库。
UniProt NREF(UniRef)数据库为高效率的搜寻提供适当的蛋白质的全信息数据库的代表性的子集。
全面的UniProt 档案(UniParc)每天从很多公共来源数据库更新。
数据库那些UniProt接口可在线访问()或者以几个形式下载(ftp:///pub)。
我们鼓励科学界人士向UniProt 提供数据。
介绍近来,瑞士-Prot + TrEMBL和PIR-PSD如同蛋白质数据库不同的序列信息覆盖面和注释优势共存。
2002年,在生物信息科学(SIB)的瑞士研究所和欧洲生物信息科学研究所的瑞士-Prot + TrEMBL 组 (EBI)和蛋白质信息资源(PIR)组织在乔治敦大学医学中心和国家生物医学的研究基金会联合协作。
新联合的组织的主要任务是通过建立一个综合,详细分类,丰富并且准确注释蛋白质序列的优质的数据库和广泛序列对比和询问服务的到科学团体免费接口—knowledgebase来支持生物学的研究。
UniProt 将在组织成员多年合作的坚实基础上建立起来。
UniProt 数据库包括3 个数据库层:1、UniProt 档案(UniParc),通过储存全部可公开得到的蛋白质序列数据供一个稳定,综合,无冗余的序列收集。
PIR蛋白质序列数据库
bioinformatics
2
PIR的概念
• PIR是一个集成了关于蛋白质功能预测数据 的公共资源的数据库,其目的是支持基因 组/蛋白质组研究。PIR与其他组织合作, 共同构成了PIR-国际蛋白质序列数据库 (PSD)——一个主要的已预测的蛋白质数 据库,包括250,000个蛋白。
bioinformatics
Protein Information resouce
bioinformatics
PIR蛋白质序列数据库
生物技术试验班08Protein Information resouce,蛋白质 数据库)的出现先于核酸数据库。在1960 年左右,Dayhoff和其同事们搜集了当时所 有已知的氨基酸序列,编著了《蛋白质序 列与结构图册》。从这本图册中的数据, 演化为后来的蛋白质信息资源数据库。
8
bioinformatics
9
蛋白质一般信息
bioinformatics
交叉引用文献
10
bioinformatics
相关蛋白质家族信息
11
bioinformatics
点击此处
12
bioinformatics
此处链接 UniProt databases.
13
bioinformatics
在UniProt database搜 索s中的结果
3
PIR的功能
• 目的: 帮助研究者鉴别和解释蛋白质序列信息, 研究分子进化、功能基因组。
• 它是一个全面的、经过注释的、非冗余的蛋白 质序列数据库。 • 所有序列数据都经过整理,超过99%的序列已 按蛋白质家族分类,一半以上还按蛋白质超家 族进行了分类。
4
bioinformatics
生物信息数据库简介
1. GenbankGenbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。
它是由美国国立生物技术信息中心(NCBI)建立和维护的。
它的数据直接来源于测序工作者提交的序列;由测序中心提交的大量EST序列和其它测序数据;以及与其它数据机构协作交换数据而来。
Genbank每天都会与欧洲分子生物学实验室(EMBL)的数据库,和日本的DNA数据库(DDBJ)交换数据,使这三个数据库的数据同步。
到1999年8月,Genbank 中收集的序列数量达到460万条,34亿个碱基,而且数据增长的速度还在不断加快。
Genbank 的数据可以从NCBI的FTP服务器上免费下载完整的库,或下载积累的新数据。
NCBI还提供广泛的数据查询、序列相似性搜索以及其它分析服务,用户可以从NCBI的主页上找到这些服务。
Genbank库里的数据按来源于约55,000个物种,其中56%是人类的基因组序列(所有序列中的34%是人类的EST序列)。
每条Genbank数据记录包含了对序列的简要描述,它的科学命名,物种分类名称,参考文献,序列特征表,以及序列本身。
序列特征表里包含对序列生物学特征注释如:编码区、转录单元、重复区域、突变位点或修饰位点等。
所有数据记录被划分在若干个文件里,如细菌类、病毒类、灵长类、啮齿类,以及EST数据、基因组测序数据、大规模基因组序列数据等16类,其中EST数据等又被各自分成若干个文件。
(1)Genbank数据检索NCBI的数据库检索查询系统是Entrez。
Entrez是基于Web界面的综合生物信息数据库检索系统。
利用Entrez系统,用户不仅可以方便地检索Genbank的核酸数据,还可以检索来自Genbank和其它数据库的蛋白质序列数据、基因组图谱数据、来自分子模型数据库(MMDB)的蛋白质三维结构数据、种群序列数据集、以及由PubMed获得Medline的文献数据。
Entrez提供了方便实用的检索服务,所有操作都可以在网络浏览器上完成。
第03讲蛋白质数据库
PIR
PIR-PSD是第一个国际蛋白质序列数据库,它从‘Atlas
Sequence and Structure’发展而来。
PIR-PSD是一个全面的、经过注释的、非冗余的蛋白质序列数据库。
‘SwissProt数据库’
由瑞士日内瓦大学生物化学系与1978年创建,之后与EMBL合作,由
(H)序列的矛盾、变化等。
‘SwissProt数据库’
SwissProt数据库的特征
④ 最小冗余:尽量将相关的数据归并,降低数据库的冗余程度。如果不同 来源的原始数据有矛盾,则在相应序列特征表中加以注释。 ⑤ 与其它数据库的连接:对于每一个登录项,有许多指向其它数据库相关 数据的指针,这便于用户迅速得到相关的信息。现有的交叉索引有: 到EMBL核酸序列数据库的索引, 到生物大分子结构数据库PDB的索引等
UniProt
UniProt是一个集中收录蛋白质资源并能与其它资源
相互联系的数据库,也是目前为止收录蛋白质序列 目录最广泛、功能注释最全面的一个数据库。
UniProt数据库的四大组成
UniProt数据库的四大组成
UniProt针对不同的用户,UniProt分三个层次: (1) UniProt Knowledgebase (UniProtKB)( UniProt知 识库) 包含蛋白质序列、功能、分类、交叉引用等信 息存取中心。由部分组成: ① UniProtKB/Swiss-Prot ② UniProtKB/TrEMBL ③ PIR-PSD (2) UniProt Reference Clusters (UniRef) ( UniProt 参考资料库):将相近的或者密切相关的蛋白质序列整 合为单个记录,加快检索速度。 (3) UniProt Archive (UniParc) ( UniProt档案):记 录了最完整的信息,反映了所有蛋白质序列的历史。
蛋白质常用数据库一文看懂!
蛋白质常用数据库|一文看懂!蛋白质数据库是指专门存储蛋白质相关信息的数据库。
它们收集、整理和存储大量的蛋白质数据,包括蛋白质序列、结构、功能、互作关系、表达模式、疾病关联等信息。
蛋白质数据库提供了对这些数据的检索、查询和分析功能,为科学研究人员、生物信息学家和药物研发人员等提供了重要的资源。
蛋白质数据库的内容通常来自于实验室实际测定的蛋白质数据,如蛋白质序列测定、结晶学、核磁共振、质谱等技术获得的数据。
这些数据经过验证和标准化后,被整合到数据库中,使研究者能够方便地访问和利用这些数据进行各种研究工作。
下面是笔者总结的常用蛋白质数据库及网址,供大家参考。
⓪BioXFinder:BioXFinder是国内第一个也是唯一一个生物数据库:收录50多万条高质量的、整合多个来源数据,手工注释的非冗余的蛋白质信息,包含蛋白质的基本信息、序列、序列特征、功能、名称和谱系、亚细胞定位、疾病与变异、翻译后修饰、表达、相互作用等信息。
蛋白结构库:收录19多万条经过X射线单晶衍射、核磁共振、电子衍射等实验手段确定的蛋白质结构数据。
包括蛋白3D结构、基本信息、实验数据、参考文献等。
①UniProt:UniProt是一个综合性的蛋白质数据库,提供了大量蛋白质的序列、结构、功能、互作关系和注释信息。
它整合了多个来源的数据,包括Swiss-Prot、TrEMBL和PIR数据库。
②Protein Data Bank (PDB):PDB是存储蛋白质和其他生物大分子结构的数据库。
它提供了实验确定的蛋白质结构的三维坐标数据,可用于结构生物学研究、药物设计和分子模拟等领域。
③NCBI Protein:NCBI Protein是美国国家生物技术信息中心(NCBI)提供的蛋白质数据库,包含了大量的蛋白质序列数据,可以进行蛋白质的基本信息查询和比对分析。
④Ensembl:Ensembl是一个综合性的基因组注释数据库,包含了多个物种的基因组序列、基因结构、转录本和蛋白质信息。
蛋白质序列PIR和PDB使用方法
随着核酸数据库不断发展以及数据库的建立,蛋白质序列、结构、功能不断引起人们的重视,生命科学的研究中蛋白质的研究显得尤为重要,一系列的蛋白质序列数据随之产生,数据库也在研究蛋白质的过程中有着不可或缺的地位。
本文主要通过实验说明蛋白质序列数据库PIR及蛋白质结构数据库PDB的使用方法,返回结果的含义,以及如何下载数据和批量下载数据。
由于蛋白质序列测定技术先于DNA序列测定技术问世,蛋白质序列的搜集也早于DNA序列。
蛋白质序列数据库的雏形可以追溯到60年代。
60年代中期到80年代初,美国国家生物医学研究基金会(National Biomedical Research Foundation,简称NBRF)Dayhoff领导的研究组将搜集到的蛋白质序列和结构信息以“蛋白质序列和结构地图集”(Atlas of Protein Sequence and Structure)的形式发表,主要用来研究蛋白质的进化关系。
时至今日,国际上已建立了许多关于生物分子的数据库,主要包括基因组图谱数据库、核酸序列数据库、蛋白质序列数据库、蛋白质结构数据库、生物大分子结构数据库等。
这些数据库均为公共数据库,由特定的组织维护、以及发布相关序列信息,供生物研究学者使用,称为生物研究中的必要工具之一,随着科学技术的发展,这些数据库不断壮大,也为研究人员提供了大量有用的数据。
本文主要通过课程实验,展示蛋白质序列数据库PIR及蛋白质结构数据库PDB的相关使用方法。
本论蛋白质序列数据库PIR介绍1984年,“蛋白质信息资源”(Protein Information Resource,简称PIR)计划正式启动,蛋白质序列数据库PIR也因此而诞生。
与核酸序列数据库的国际合作相呼应,1988年,美国的NBRF、日本的国际蛋白质信息数据库(Japanese International Protein Information Database,简称JIPID)和德国的慕尼黑蛋白质序列信息中心(Munich Information Center for Protein Sequences,简称MIPS)合作成立了国际蛋白质信息中心(PIR-International),共同收集和维护蛋白质序列数据库PIR。
共享——农业大学生物信息学课后练习题及答案
2014级山东农业大学大二下学期期末生物信息学课后练习题及答案 第一章
1、什么是生物信息学? 2、列举5个在生物信息学发展史上有重意义的事件(技术发明或软件创 新)
3、生物信息学的研究内容都有哪些? 1. What is the bioinformatics? 2. Enumerate five significance events in the bioinformatics development. 3. What are the questions for bioinformatics to answer? 第二章 1、什么是一级数据库,什么是二级数据库 2、世界上三大核酸数据库分别叫什么,由什么机构进行维护,两个重 要的蛋白质数据库分别是什么,蛋白质三维结构数据库是什么,他们分 别由什么机构进行维护。
物种I和物种II中的a1或a2被称作直系同源,因为它们来自同一祖先,
而物种I或物种II中的a1和a2被称作旁系同源,因为它们是由基因复制
得到的。
3、 什么是相似性(similarity)、同一性(identity)?他们的 关系?
答: 4、什么是点阵图(dot matrix)?作用与优点。 答:1.点阵图分析(Dot matrix analysis):是双序列比对的基本方
2005年, 新一代测序技术出现。(Nature, 2005)
3、生物信息学的研究内容都有哪些? 答:1.获取人和各种生物的完整基因组
2.发现新基因和新的单核苷酸多态性 3.基因组中非编码区信息结构分析 4.完整基因组的比较研究 5.功能基因组研究 6.生物大分子结构模拟与药物设计 7.生物信息学的发展与应用研究 第二章 生物信息学资源
列往往具有相似的结构与功能; 2、用于进化分析,是用系统发育方法构建进化树的初使步骤; 3、通过序列比对发现直系同源(Orthologs)与旁系同源(Paralogs)
蛋白质数据库介绍
SWISS-PROT或TrEMBL /sprotPIRMIPSJIPID已经和ExPASy 三、蛋白质二级结构预测网站(数据库)4始建于基于对蛋白质家族中同源序列多重序列比对得到的保守区域,这些区域通常与生物学功能相关。
数据库包括两个数据库文件:数据文件Prosite5蛋白质二级结构构象参数数据库DSSP6蛋白质家族数据库FSSP7同源蛋白质数据库HSSP在前面已经述说过了。
第二节、蛋白质序列分析方法一、多序列比对双序列比对是序列分析的基础。
序列之间的关系,生物学模式方面起着相当重要的作用。
多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,法建立在某个数学或生物学模型之上。
因此,正如我们不能对双序列比对的结果得出果也没有绝对正确和绝对错误之分,相似性关系以及它们的生物学特征。
我们称比对前序列中残基的位置为绝对位置。
置Ⅰ相对位置。
显然,同一列中所有残基的相对位置相同,而每个残基的绝对位置不同,因为它们来自不同的序列。
绝对位置是序列本身固有的属性,也就比对过程赋予它的属性。
算法复杂性多序列比对的计算量相当可观,时间和内存空间与这两个序列的长度有关,或者说正比于这两个序列长度的乘积,用(的两维空间扩展到三维,即在原有二维平面上增加一条坐标轴。
这样算法复杂性就变成了(例如,如果用某种颜色表示一组高度保守的残基,则某个序列的某一位点发生突变时,则由于颜色不同,就可以很快找出。
颜色的选择可以根据主观愿望和喜好,但最好和常规方法一致。
用来构筑三维模型的按时氨基酸残基组件和三维分子图形软件所用的颜色分类方法,比较容易为大家接受(表2)。
多序列比对程序的另一个重要用途是定量估计序列间的关系,关系。
关系。
相似性值低于预料值,那么有可能是序列间亲缘关系较远,也可能是比对中有错误之处2同步法实质是把给定的所有序列同时进行比对,而不是两两比对或分组进行比对。
其基本思想是将一个二维的动态规划矩阵扩展到三维或多维。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
PIR的产生
PIR(Protein Information resouce, 蛋白质数据库)的出现 先于核酸数据库。在 1960年左右,Dayhoff (1925 - 1983)和其 同事们搜集了当时所有 已知的氨基酸序列,编 著了《蛋白质序列与结 构图册》。从这本图册 中的数据,演化为后来 的蛋白质信息资源数据 库
谢谢观赏
Make Presentation much more fun
PIR是由美国国家生物医学 基金会(NBRF)于1984年 建立,位于乔治敦大学。
PIR是一个集成了关于蛋白 质功能预测数据的公共资 源的数据库,其目的是支 持基因组/蛋白质组研究。 PIR与其他组织合作,共同 构成了PIR-国际蛋白质序 列数据库(PSD).
发展至今日830,000条非冗余蛋白质序列, 提供了36,000多PIR蛋白质超家族, 145,000多蛋白质家族,4,000多蛋白质 结构域,13,000多模体和555,000多相 似的蛋白质聚类信息。
PIR的功能
目的: 帮助研究者鉴别和解释蛋白质序列信息,
研究分子进化、功能基因组。
它是一个全面的、经过注释的、非冗余的蛋白质序 列数据库。
所有序列数据都经过整理,超过99%的序列已按蛋 白质家族分类,一半以上还按蛋白质超家族进行了 分
除了蛋白质序列数据之外,PIR还包含以下信息: (1)蛋白质名称、蛋白质的分类、蛋白质的来源; (2)关于原始数据的参考文献; (3)蛋白质功能和蛋白质的一般特征,包括基因表达 、翻译后处理、活化等; (4)序列中相关的位点、功能区域。
蛋白质一般信息
交叉引用文献
相关蛋白质家族信息
点击此处
此处链接 UniProt databases.
在UniProt database 搜索中的结果
蛋白质基本信息
蛋白质家族信息
Entry name 标题/序列名称 序列物种来源拉 丁名(常用名) 记录注册、修改日期
注册号及参考来源
物种分类型 序列长度 序列顺序 文献发表作者/刊名/发 表时间/文章名/文献数 据库记录号
PIR-PSD 蛋白质序列数据库
韩硕 徐飞 薛刚 费文斌
PIR 国际蛋白质序列数据库(PSD) ()是由蛋白质信息 资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和 日本国际蛋白质序列数据库(JIPID)共同维护的国际 上最大的公共蛋白质序列数据库。 是一个支持基因组学、蛋白质组学和系统生物学检 索和科学研究的综合公共生物信息学资源。 PIR免费为科学界提供包括蛋白序列数据库(PSD) 在内的蛋白数据库和分析工具。的交互式查询 用户通过关键字进行数据查询。 二是标准的序列相似性搜索, 包括BLAST、FastA等。
三是结合序列相似性、注释信息和蛋白质家族 信息的高级搜索 包括按注释分类的相似性搜索、结构域搜索等。
网站搜索
蛋白质搜索
G00016
主页的导航条有五大类:
Abrout PIR:对网站的历史、 发展、 刊物等的介绍; Databases:包括Proclass、 Pirsf、PIR—PSD、 PIR— NREF 、Uniprot等数据库集合 ; Search/Analysis:对蛋白质序 列分析的多种途径; Dowload:网站提供的蛋白质序 列;
Support:一些帮助及其它连接.