转录因子相关数据库

合集下载

转录调节位点和转录因子数据库介绍_张光亚

转录调节位点和转录因子数据库介绍_张光亚

10生物学通报2005年第40卷第11期2003年即Watson和Crick发表DNA双螺旋结构50周年,宣布了人类基因组计划的完成,与此同时,其他许多生物的基因组计划已完成或在进行中,在此过程中产生的大量数据库对科学研究的深远影响是以前任何人未曾预料到的。

然而遗憾的是,许多生物学家、化学家和物理学家对这些数据库的使用甚至去何处寻找这些数据库都只有一个比较模糊的概念。

基因转录是遗传信息传递过程中第一个具有高度选择性的环节,近20年来对基因转录调节的研究一直是基因分子生物学的研究中心和热点,因此亦产生了大量很有价值的数据库资源,对这些数据库的了解将为进一步研究带来极大便利,本文对其中一些数据库进行简要介绍。

1DBTSSDBTSS(DataBaseofTranscriptionalStartSites)由东京大学人类基因组中心维护,网址:http://dbtss.hgc.jp。

最初该数据库收集用实验方法得到的人类基因的TSS(TranscriptionalStartSites,转录起始位点)数据。

对转录起始位点(TSS)的确切了解具有非常重要的意义,可更准确的预测翻译起始位点;可用于搜索决定TSS的核苷酸序列,而且可更精确地分析上游调控区域(启动子)。

自2002年发布第一版以来已作了多次更新。

目前包含的克隆数为190964个,含盖了11234个基因,在SNP数据库中显示了人类基因中的SNP位点,而且现在含包含了鼠等其他生物的相关数据。

DBTSS最新的版本为3.0。

在该最新的版本中,还新增了人和鼠可能同源的启动子,目前可以显示3324个基因的启动子,通过本地的比对软件LALIGN可以图的形式显示相似的序列元件。

另一个新的功能是可进行与已知转录因子结合位点相似的部位的定位,这些存贮在TRANSFAC(http://transfac.gbf.de/TRANSFAC/index.html)数据库中,免费用于研究,但TRANSFAC专业版是商业版本。

ipa数据库 转录因子

ipa数据库 转录因子

ipa数据库转录因子
IPA数据库是一个广泛使用的生物信息学工具,用于分析和解释基因组学数据。

它可以帮助研究人员理解基因调控、信号通路和蛋白质相互作用等生物学过程。

在IPA数据库中,转录因子是一个重要的研究对象。

转录因子是一类调控基因表达的蛋白质,它们通过结合到特定的DNA序列上,调控相关基因的转录活性。

在IPA数据库中,研究人员可以利用其强大的功能来分析转录因子在特定生物学过程中的作用。

例如,可以通过IPA数据库来寻找与特定转录因子相关的信号通路、生物过程以及相关的调控基因。

此外,IPA还可以帮助用户预测潜在的转录因子-靶基因相互作用,并生成与转录因子相关的生物网络图。

除了单独研究转录因子外,IPA数据库还可以将转录因子与其他生物信息学数据整合分析,如基因表达数据、蛋白质相互作用数据等。

这有助于揭示转录因子在复杂生物学系统中的作用机制,以及它们与其他分子之间的相互作用。

总之,IPA数据库为研究人员提供了丰富的工具和资源,可以
帮助他们全面理解转录因子在基因调控中的作用,以及与其他生物学过程的关联,从而推动生物医学研究的进展。

开花相关与转录因子研究方法

开花相关与转录因子研究方法

三、转录因子转录激活作用分析
目的片段分段-与BD组合-与AD菌体杂交-染色鉴定
四、转录因子复合体研究 1.酵母双杂实验 2.pull-down 3.双分子荧光互补BiFC 4.免疫共沉淀(转录因子-抗体-Protein A 或G-Agarose珠-目的蛋白)
五、转录因子功能研究
1.通过生物信息学构建系统进化树对其功能进行预测 2.胁迫条件下鉴定基因表达特性 (利用半定量PCR(RT-PCR)和实时定量PCR(qRT-PCR) 3.在基因缺失和过表达条件下检测植株的表型变化及生理变化 (基因缺失:插入突变--转座子插入法、T-DNA 插入法和同源重组插入法;反义RNA 抑制法--RNA i) 4.检测过表达植株基因表达变化 5.分析转录因子调控的下游效应基因 (染色质免疫沉淀-DNA 基因芯片分析;酵母单杂交分析;) 常用构建生物系统进化树的软件有 PHYLIP(http ///phylip/software.html)、 PAUP(ftp :///paup)、 MEGA(http ://bioinfo.weizmann.ac.il/ databases/info/mega.sof) TreeView(http :///rod/treeview.html) 序列比对软件 ClustalW 软件 人工miRNA设计工具 WebMicroRNA designer(http ://) THE RNAi WEB(http ://)因子保守结构域 2.定点突变分析转录因子结构域的功能位点 (DNA定点突变和蛋白质定点突变)
转录因子数据库 TRANSFAC(http :///pub/ databases.html) PlanTFDB(http ://plantfdb.bio.unipotsdam.de/v3.0/), 拟南芥的转录数据库 RARTF(http ://rarge.gsc.riken.jp/rartf/) AGRIS(http ://arabidopsis /AtTFDB/), 水稻基因组数据库 (http :// rice. plantbiology. msu. edu/)

生命科学中最常用的5个数据库介绍

生命科学中最常用的5个数据库介绍

生命科学中最常用的5个数据库介绍生命科学是一个庞大而复杂的学科,其中包含了关于生命现象的各种研究。

对于生命科学的研究,特别是在分子水平上进行的研究,需要大量的数据支持。

这些数据包括分子序列、蛋白质结构、代谢途径等等。

为了有效地管理这些数据,生命科学中广泛应用了各种数据库。

本文将介绍生命科学中最常用的5个数据库。

1. GenBankGenBank是全球最大的分子生物学数据库,包含了全球各地实验室提交的DNA和RNA序列。

它由美国国家生物技术信息中心(NCBI)维护。

GenBank包含了数十亿条序列记录,其中包括了不同物种的基因组、蛋白质序列、DNA和RNA序列等。

与DNA和RNA序列相关的信息包括序列长度、基序、带电的特殊域、结构域、转录因子结合位点以及其他数据。

GenBank还包含了元数据,如物种和菌株的信息、文献引用以及序列的提交日期。

2. PubMedPubMed是美国国家医学图书馆(NLM)维护的一个生命科学文献数据库,包括了生命科学、医学和健康相关的数百万篇论文。

PubMed提供了对文献的全文搜索和存储,使科学家在查找特定话题时更加方便。

除了搜索全文的功能,PubMed还提供了很多额外的服务,如翻译摘要、相关文章推荐、绘制图表等。

3. EnsemblEnsembl是一种数据库、搜索引擎和分析平台,专门用于处理各种生命科学的数据。

Ensembl已经成为了全球最大的基因组数据库之一,包含了人类、其他哺乳动物、鸟类、篮球、双子蝎、无脊椎动物等近700个物种的基因组信息。

Ensembl提供的数据包括生物序列、调控区域、基因家族、基因结构、基因组的变异和基因表达信息等。

4. Protein Data Bank (PDB)蛋白质数据银行(PDB)是一个三维蛋白结构数据库,由改华大学、美国罗格斯大学和欧洲生物信息研究所等机构共同维护。

PDB存储了全球各地实验室提交的蛋白质晶体结构和生化分析,包括了大多数已知的蛋白质家族和酶。

数据库说明

数据库说明

数据库说明实验2 数据库搜索与模式匹配1.TRANSFAC数据库【TRANSFAC数据库说明】TRANSFAC数据库是关于转录因子(transcription factor, TF)与及其在基因组上的转录因子结合位点(transcription factor binding site, TFBS)序列或者序列模式(profile)的数据库,主要包括SITE/GENE/FACTOR/CLASS/MATRIX/CELLS/METHOD/REFERENC E等几个数据表。

此外还包含几个扩展库:PATHODB收录了可能导致疾病的转录因子和结合位点;S/MARTDB收集了与染色体结构变化相关的转录因子以及对应位点的信息;TRANSPATH主要用于描述与转录因子调控相关的信号传递网络;CYTOMER包含了人类转录因子在各个器官、细胞类型、生理系统和发育时期的表达状况。

本实验的所有数据来自于P. Bucher于1990年发表在Journal of molecular biology的一篇文章。

作者从502条序列中包含的真实的TATA-box,计算得到的位置权重矩阵(PSSM)。

然后利用这个矩阵在输入的启动子(promoter)序列中扫描可能存在的TATA-box。

【参考文献】Bucher P. Weight matrix descriptions of four eukaryotic RNA polymerase II promoter elements derived from 502 unrelated promoter sequences. J. Mol. Biol. 212: 563-578 (1990).【材料与方法】输入序列:6个来自果蝇(Drosophila melanogaster)的基因上游启动子序列,包含在文件All.fas中WWW工具:Regulatory Sequence Analysis Tools (RSA)TRANSFAC数据库:TRANSFAC,一个转录因子数据库【操作步骤】1)从TRANSFAC数据库中搜索TATA-box:在TRANSFAC数据库注册一个帐号,登录后打开SEARCH服务,选择MATRIX(转录因子结合位点矩阵)数据表进行搜索,将“Tablefield to search in”设置为“All field”,然后输入“TATA”提交查询。

生物信息学二级数据库及数据库的格式

生物信息学二级数据库及数据库的格式

..125
Homo. Sapiens Medline4,. gluco- transcriptional TGT..
......
Corticoid regulator, ..
receptor
Fig 2.7 GenBank数据库的组织. 常被计算机检索程序ENTREZ利用。
2 EMBL序列格式
• The European Molecular Biology Laboratory(EMBL)序列 条目与GenBank类似,通过大量信息来描述每个序列。该 信息组织成一个个字段,每个字段有一个标识符。这些标 识符缩写成两个字母,某些字段还有次级字段。每行序列 后面的数字显示片断的位置。
BASE COUNT count of A, C, G, T and other symbols
ORIGIN
text indicating start of sequence
1 gaattcgata aatctctggt ttattgtgca gtttatggtt ccaaaatcgc
51 atatactcac agcataactg tatatacacc cagggggcgg aatgaaagcg
Prosite的网址:
/prosite/
3、蛋白质结构二级数据库
DSSP (Definition of Secondary Structure of Proteins) 蛋白质二级结构构象参数数据库 DSSP的网址:
http://www.cmbi.kun.nl/gv/dssp/
source range of sequence, source organism
misc_signal range of sequence, type of function or signal

转录因子相关数据库

转录因子相关数据库

转录因子相关数据库陈鸿飞;王进科【期刊名称】《遗传》【年(卷),期】2010(32)10【摘要】转录水平的调控是基因调控的重要环节,其中转录因子(Transcription Factor,TF)和转录因子结合位点(Transcription Factor Binding Site,TFBS)是转录调控的重要组成部分.为了解析基因转录调控过程中TF与其TFBS相互作用的分子机理,鉴定TFBS及构建基因转录调控网络,需要对已发现的TF及其TFBS信息进行系统的收集,整理和分析.目前,国际上已经出现不少关于TF及其TFBS的专业数据库,这些数据库对基因转录调控及TF相关的分子生物学、系统生物学及生物信息学的研究非常重要,对这些领域的研究起到了显著的推进作用.文章对7个目前比较著名的TF及其TFBS相关数据库,包括TRANSFAC、JASPAR、TFDB、TRRD、TRED、PAZAR、MAPPER的特点、数据种类和数量及使用方法进行了详细综述,并简要介绍了其他相关数据库.【总页数】9页(P1009-1017)【作者】陈鸿飞;王进科【作者单位】东南大学生物电子学国家重点实验室,生物科学与医学工程学院生物技术与材料实验中心,南京,210096;东南大学生物电子学国家重点实验室,生物科学与医学工程学院生物技术与材料实验中心,南京,210096【正文语种】中文【中图分类】Q3【相关文献】1.超音刺猬蛋白转录因子叉头框转录因子M1及神经胶质瘤相关癌基因同源物1在宫颈癌中的表达与临床意义 [J], 杨娜;刘禄;魏容2.动物转录因子相关数据库研究进展 [J], 王志鹏;郭媛媛;梁美景3.外周血单个核细胞锌指样转录因子2、锌指样转录因子4mRNA表达与脑梗死静脉溶栓预后的相关性分析 [J], 赵松耀;尹刘杰;李世泽4.血清肺腺癌转移相关转录因子-1、叉头框转录因子M1和神经生长因子表达水平与肺癌患者临床病理特征及肿瘤转移的关系 [J], 景建军;张云江;王银5.拟南芥膜相关转录因子bZIP60活化后与转录因子MYB7互作共同调控种子萌发[J], 鲜孟君;张双双;刘建祥;陆孙杰因版权原因,仅展示原文概要,查看原文内容请购买。

数据库说明

数据库说明

实验2 数据库搜索与模式匹配1.TRANSFAC数据库【TRANSFAC数据库说明】TRANSFAC数据库是关于转录因子(transcription factor, TF)与及其在基因组上的转录因子结合位点(transcription factor binding site, TFBS)序列或者序列模式(profile)的数据库,主要包括SITE/GENE/FACTOR/CLASS/MATRIX/CELLS/METHOD/REFERENCE等几个数据表。

此外还包含几个扩展库:PATHODB收录了可能导致疾病的转录因子和结合位点;S/MARTDB收集了与染色体结构变化相关的转录因子以及对应位点的信息;TRANSPATH主要用于描述与转录因子调控相关的信号传递网络;CYTOMER包含了人类转录因子在各个器官、细胞类型、生理系统和发育时期的表达状况。

本实验的所有数据来自于P. Bucher于1990年发表在Journal of molecular biology的一篇文章。

作者从502条序列中包含的真实的TATA-box,计算得到的位置权重矩阵(PSSM)。

然后利用这个矩阵在输入的启动子(promoter)序列中扫描可能存在的TATA-box。

【参考文献】Bucher P. Weight matrix descriptions of four eukaryotic RNA polymerase II promoter elements derived from 502 unrelated promoter sequences. J. Mol. Biol. 212: 563-578 (1990).【材料与方法】☺输入序列:6个来自果蝇(Drosophila melanogaster)的基因上游启动子序列,包含在文件All.fas中☺WWW工具:Regulatory Sequence Analysis Tools (RSA)☺TRANSFAC数据库:TRANSFAC,一个转录因子数据库【操作步骤】1)从TRANSFAC数据库中搜索TATA-box:在TRANSFAC数据库注册一个帐号,登录后打开SEARCH服务,选择MATRIX(转录因子结合位点矩阵)数据表进行搜索,将“Tablefield to search in”设置为“All field”,然后输入“TATA”提交查询。

(工具篇):如何查找基因的启动子及预测转录因子?

(工具篇):如何查找基因的启动子及预测转录因子?

(⼯具篇):如何查找基因的启动⼦及预测转录因⼦?最近长链⾮编码RNA(lncRNA)很⽕热,好不容易找到了⼀个⼼仪的lncRNA(关于怎么找,我们之前也聊过:⾃⼰做测序、芯⽚;从别⼈的数据⾥挖据;或移植研究从其他疾病⾥扯⼀个过来验证),那么问题来了:分⼦有了,机制部分我该往哪个⽅向扯呢?很多⼈可能都会仔细寻找下游靶分⼦,以证明该lncRNA参与了xx调控,具有某个功能,表明该lncRNA分⼦在疾病发⽣发展过程中起到了很重要的作⽤。

其实,我们还可以往上游做,以丰富机制研究的深度。

今天我们就聊⼀聊,预测⼀下参与调控lncRNA表达转录因⼦的⽅法。

今天我们通过2个⽅式进⾏预测:1、需要⽤到UCSC、PROMO数据库⾸先,我们需要找到lncRNA的启动⼦序列。

打开UCSC数据库:举例:HOTAIR输⼊:HOTAIR点击GO点击红⾊的那个序列得到这么⼀个图,点击红⾊框,继续点击,得到这个界⾯,我们需要修改⼀些参数:转录起始位点上游2000nt和下游100nt区域为我们所选的启动⼦区。

SubmitOK,启动⼦序列有了。

拷贝下来。

接下来,我们打开PROMO数据库:http://alggen.lsi.upc.es/cgi-bin/promo_v3/promo/promoinit.cgi?dirDB=TF_8.3在SelectSpecies进⾏部分设置,Submit另外,如果对转录因⼦有选择的话,也可以在SelectFactors中进⾏设置。

最后,我们点击SearchSites将刚刚得到的启动⼦序列粘贴进⾏。

另外,默认容错率15%,如果得到的转录因⼦过多,我们可以进⾏调整,设置成5%或0%。

Submithttp://alggen.lsi.upc.es/cgi-bin/promo_v3/promo/promo.cgi?dirDB=TF_8.3&idCon=148056381600&getFile=resumSearchRes.html我最终设置了容错率为0,⼀共得到了120个预测的转录因⼦。

转录因子和靶基因系列(二)按类检索转录因子ChIP-seq数据

转录因子和靶基因系列(二)按类检索转录因子ChIP-seq数据

转录因子和靶基因系列(二)按类检索转录因子ChIP-seq数据上一次我们介绍了CistromeMap知识库(/db/#/),收录了14000多套人和小鼠的ChIP-seq数据,包含800多个转录因子(简称TF)。

在这里能查询哪些TF已经有了ChIP-seq数据,质量如何,TF结合位点的motif,TF调控的靶基因,以及有着相似结合特征的TF (可能是co-factor)。

这是世界上最全的ChIP-seq数据库了。

今天介绍一个类似的数据库factorbook,不是脸书,是因子书~虽然不如CistromeMap收录的那么齐全,它也有自己独特的地方,那就是分类浏览TF。

您可以选择您关注的功能或结构类型,看看这一类型的TF在哪些细胞里有ChIP-seq数据。

同时它还整合了组蛋白修饰数据和核小体定位数据,查看该TF附近的组蛋白修饰和核小体分布。

例如,我选择p53-like transcription factors,下面就列出了NFkB、STAT1、STAT2、STAT3,分别在一些免疫细胞、Hela-S3、K562、MCF10A等细胞里有ChIP-seq数据。

单击STAT1打开新页面,有像wikipedia一样全面的STAT1的功能介绍。

接下来是STAT1结合位点附近组蛋白修饰的分布峰图,初步推测该转录因子结合到启动子区,还是增强子区域。

另外,还能看到STAT1结合位点附近的核小体分布情况,STAT1来了,是不是挤跑了中间那个核小体?STAT1附近的核小体分布实在不敢恭维,想看漂亮的核小体分布图,请移驾电脑前,在factorbook 中查询CTCF,那叫一个经典。

最经典的TF结合位点的motif,这个数据库当然也少不了。

遗憾的是,这里只给出该motif跟您检索的这个TF的motif是否一致,没有告诉我们其他motif对应哪个TF。

想知道?请翻看CistromeMap的介绍。

factorbook最可爱的地方在于,它给出了其他组蛋白修饰和转录因子在该TF结合位点附近分布的热图。

生物信息学数据库的种类

生物信息学数据库的种类

生物信息学数据库的种类1.引言1.1 概述生物信息学数据库是由生物学和计算机科学相结合的一个重要领域。

随着高通量测序技术的快速发展, 生物学研究已经进入了“大数据”时代。

生物信息学数据库的出现, 解决了这些海量生物信息的存储和管理问题, 为生命科学研究提供了重要的工具和资源。

生物信息学数据库可以存储和管理各种类型的生物信息数据, 对于科学家和研究人员来说, 这些数据库包含了大量的基因组序列、蛋白质序列、基因表达数据等重要信息。

通过对这些数据的分析和挖掘, 科学家们可以更深入地研究生物体的组成、功能和进化等方面。

在当前的生物信息学数据库中, 可以根据数据类型进行分类。

常见的生物信息学数据库包括序列数据库、结构数据库、基因表达数据库、蛋白质互作数据库、药物数据库、多样性数据库、基因组数据库、疾病数据库和转录因子数据库等。

每种类型的数据库都有其独特的特点和应用领域。

随着生物学研究的不断深入和技术的不断进步, 生物信息学数据库也在不断发展。

未来的数据库将更加注重数据的互联互通, 提供更完整、准确和可靠的生物信息。

同时, 数据分析和挖掘的算法和工具也将不断更新和完善, 为科学家们的研究提供更加强大的支持。

总之, 生物信息学数据库是生物学研究中不可或缺的重要工具和资源。

通过这些数据库, 科学家们可以更加高效地存储、管理和分析生物信息,推动生命科学领域的发展。

未来, 随着生物学研究的不断进步, 生物信息学数据库将不断发展和完善, 为科学家们带来更多的可能性和突破。

1.2 文章结构本文将分为三个部分来详细介绍生物信息学数据库的种类。

首先,在引言部分,我们将提供对本文的概述,介绍生物信息学数据库的基本概念和作用,并说明文章的目的。

接下来,在正文部分,我们将详细介绍九种不同类型的生物信息学数据库,包括序列数据库、结构数据库、基因表达数据库、蛋白质互作数据库、药物数据库、多样性数据库、基因组数据库、疾病数据库和转录因子数据库。

植物生物学数据库大全,请收藏!!!

植物生物学数据库大全,请收藏!!!

植物生物学数据库大全,请收藏Top 植物种的snoRNA基因数据库。

/cgi-bin/plant_snorna/homePlantCARE是一个关于植物顺式调控元件、增强子和抑制子的数据库,很多数据来源于文献搜索,对这些元件进行了坐标定位和序列描述,还有相关的一些生物学信息。

/webtools/plantcare/html/ 多种不同植物的抗胁迫基因数据库。

GABI初级数据库始建于2000年,作为德国植物基因组计划的中心数据库,该数据库包含的信息特别多,从序列的各个部分,到实验获得的一些蛋白2-D胶图,以及基因表达谱数据、代谢途径等都具有,因此是一个生物信息翔实的数据库。

一个植物的预测的分子标记的数据库。

植物启动子序列数据库。

/mendel.php?topic=plantprom农作物当中的生化途径及酶。

POGs/PlantRBP 是一个关系型数据库,整合了拟南芥、水稻、玉米的可以得到的基因组、蛋白组及序列数据,生成一个假定的同源基因组(POGs),基因注释的重点在于对那些预测的RNA结合蛋白(RBPs)。

除了上述之外,同时也对这些蛋白的一些保守结构域提供查找功能。

TIGR的植物转录本(TA)集合数据库收集了来自于NCBI的GenBank Nucleotide数据库的试验验证的EST、全长cDNA数据,包括目前所有已有相关信息的植物的信息,可以通过序列的BLAST、物种等方式查找数据,并且可以自由下载这些数据。

植物器官研究的植物器官图片和协议数据库。

/Organellome植物启动子数据库。

TropGENE DB是一个管理热带作物的遗传和基因组信息的数据库,该数据库将作物按数个模式作物归类,目前在线公布的模式作物有香蕉、可可、椰子、棉花、油椰子、水稻和甘蔗。

其他模式作物正有待开发。

每个模式作物都包括遗传来源信息(如形态学、起源、等位基因数据),分子标记信息,遗传图谱,长序列多态性(QTL)分析结果,测序图谱,序列、基因及相应的参考文献。

【word】转录因子相关数据库

【word】转录因子相关数据库

转录因子相关数据库子结合位点(TranscriptionFactorBindingSite,TFBS)是转录调控的重要组成部分.为了解析基因转录调控过程中TF与其TFBS相互作用的分子机理,鉴定TFBS及构建基因转录调控网络,需要对已发现的TF及其TFBS信息进行系统的收集,整理和分析.目前,国际上已经出现不少关于TF及其TFBS 的专业数据库,这些数据库对基因转录调控及TF相关的分子生物学,系统生物学及生物信息学的研究非常重要,对这些领域的研究起到了显着的推进作用.文章对7个目前比较着名的TF及其TFBS相关数据库,包括TRANSFAC,JASPAR,TFDB,TRRD,TRED,PAZAR,MAPPER的特点,数据种类和数量及使用方法进行了详细综述,并简要介绍了其他相关数据库.关键词:转录因子;DNA结合位点;数据库;生物信息学ThedatabasesoftranscriptionfactorsCHENHong—Fei,WANGJin—Ke TheStateKeyLaboratoryofBioelectronics,TheExperimentalCenterofBiot echnologyandBiomaterials,SchoolofBiologicalSciences andMedicalEngineering,SoutheastUniversity,Nanjing210096,ChinaAbstract:ThecontrolofgenetranscriptioniSacriticallevelofgeneexpression regulation.Theinteractionsbetweentranscriptionfactors(TF)andtheirDNAbindingsites(TFBS)playakeyroleat thisleve1.Inordertodecipherthemolecu—larmechanismoftheinteractionsofTFswithTFBSsandconstructtranscripti onregulatorynetwork.itisnecessarytosys—tematicallycollect,save,andanalyzetheinformationofdiscoveredTFsandth eirTFBSs.Inrecentyears,multipleTFandTFBS.relateddatabaseshavebeenestablished.Thesedatabesessignificantly promotedtheTF-relatedstudiesinthefieldsofmolecularbiology,bioinformatics,andsystembiology.1]bispapersummari zedthecontents,characteristics,access,and advancesofmainTFsandTFBSs—relateddatabases,includingTRANSFA C,JASPAR,TFDB,TRRD,TRED,PAZAR,~LAPPERandothers.Keywords:transcriptionfactor;DNAbindingsite;database;bioinformatics 真核生物基因的表达受多个层次的调控,其中基因的转录调控就是一个非常重要的环节.该环节中,转录因子与其DNA结合位点的相互作用发挥关键作用.转录因子包括基础转录因子(BasicTF)和调控性转录因子(RegulatoryTF)NJ类,其中基础转录因子与RNA聚合酶一起构成转录机器(transcriptionapparatusormachine),通过与转录起点(Transcriptionstartsite,TSS)f~近的DNA上的启动子区结合实现基因的转录;而调控性转录因子一般与位置多样的增强子序列结合,再与转录机器发生作用,调控基收稿日期:2009—12—25;修回日期:2010—03一I1基金项目:国家自然科学基金项目(编号:60871014)资助作者简介:陈鸿飞(1987一),男,硕士研究生,专业方向:生物医学工程.E-mail:********************通讯作者:王进科(1969一),男,博士,教授,博士生导师.研究方向:生物医学工程.Tel:025—83793620;E-mail:*****************.cn篷HEREDITAS(Beijing)2010第32卷因转录的水平及组织,细胞特异性.增强子序列没有方向性,可位于基因的上游,也可以位于基因的下游,甚至基因内部.目前,已经证实位于基因上游10kb远的增强子仍然对基因有调控作用.目前,在人的基因中已经鉴定出2000多个转录因子_J’21,NCBI(NationalCenterforBiotechnologyInformation)数据库中收录人转录因子基因1962个,占人全基因总数(24652)的8%l3】.已经鉴定的转录因子中约有700多个是DNA结合转录因子(DNA—bindingTF).除了转录因子的鉴定外,目前已经发现一个DNA结合转录因子在基因组中存在成千上万的DNA结合位~(DNA.bindingsites).例如,通过染色质免疫沉淀fChromatinimmunoprecipita. tion,CHIP)结合DNA微阵列芯片(CHIP.chip)或高通量DNA测序技术(CHIP.seq),发现转录因子SP1在基因组中有12000个结合位点l4],c.myc有25000个结合位点【4】,p53有1600~65000个结合位点I5】, CREB有19000~40000个结合位点l6’.通过这些位点转录因子控制着众多基因的表达,构成了复杂的基因转录调控网络(Genetranscriptionregulatory network).转录因子及其DNA结合位点的鉴定,以及它们构成的基因转录调控网络的构建已经成为目前系统生物学研究的重点领域,也是生命科学研究的热点之一.这一领域的研究,不仅具有重要的基础研究价值,而且在生物技术及生物医学领域具有重要的应用价值.很多转录因子(如NF.KB,API,p53, PPAR,CREB,STA T,E2F等1与重要疾病(如炎症,肿瘤等1的发生,发展具有密切的关系,因而成为疾病诊断的依据和药物开发的靶点.为了系统收集该领域研究产生的大量数据信息并进行相关的生物信息学研究,最近数年国际上涌现出不少转录因子相关数据库,如TRANSFAC(TRANScriptionFACtor),JASPAR,TFdb(TheMouse TranscriptionFactorDatabase),TRRD(Transcription RegulatoryRegionsDatabase),TRED(Transcriptional RegulationElementDatabase),PAZAR,MAPPER等.这些数据库各有特色,提供了转录因子研究不同侧面的数据信息,促进了转录因子的研究,特别是对转录因子相关的生物信息学研究发挥了显着的推动作用.然而目前国内还没有专业的转录因子数据库建立,为了推动这一领域的研究,本文对目前国际上主要的转录因子数据库的相关内容,特点及使用方法予以综述.1主要转录因子数据库1.1TRANSFAC数据库TRANSFAC数据库是基于真核生物转录调控所建立的数据库,其中收集了大量与基因转录水平有关的数据,如转录因子及其DNA结合位点和相应的靶基因等信息【.,.TRANSFAC数据库由BIOBASE公司负责日常更新和维护工作,网址是http://www.gene—regulation.tom.该数据库分为公开版本和专业版本两个部分,用户只需登陆该网站,按照要求完成相应的注册,利用所获得的账号可以免费查询公开版本中所有的信息,而专业版本则需要用户付费使用,对于国内用户需要付款约800欧元进行网上查询, 如需下载则需要额外的800欧元.目前,公开版版本的版本号为TRANSFAC7.0:专业版本版本号为TRANSFAC2009.3.两个版本的最后更新日期及贮存的数据种类及数据量见表1.相对于公开版本,专业版本还增加了小RNA(miRNA)及其靶序列, ChIP.chip实验序列片段,以及所有收录数据的相关参考文献,启动子序列等信息.TRANSFAC数据库的公开版本中主要包括6个工作表文件【:(1)位点工作表(Sitetable):主要包括每个(推定的)调控蛋白各自的结合位点信息.其中既包括真核生物基因调控中转录因子的结合位点, 也包括经诱变实验,体内随机选择所得到的人工序列信息.收录的所有序列经证实都与蛋白结合并且有着特定的功能,每一条序列条目都有相应的唯一序号.(2)因子工作表(Factortable):储存相关的转录因子数据信息.在位点工作表中所涉及的转录因子在此表中都有储存.同时还包括一些不与DNA直接结合或者需要与其他转录因子形成复合物才能与DNA结合的转录因子.此外TRANSFAC还对所收集的转录因子根据其DNA结合结构域类型进行分类,方便用户根据需要进行查找.(3)基因工作表rGenetable):包括与转录调控相关的基因信息.该工作表最初建立的目的是与其他数据库如TRRD, TRANSCompel的数据相连接:现在已经成为与其第10期陈鸿飞等:转录因子相关数据库1011注:表中数据库除TRANSFAC专业版外,都为免费使用数据库.本表所列数据为截止2010年6月各数据库贮存的数据量.他主流数据库如欧洲分子生物学实验室(The EuropeanMolecularBiologyLaboratory,EMBL),美国国立生物信息中O(NCBI)联系的重要组成部分.(4)细胞工作表(Celltable):主要包括了与结合位点相互作用的蛋白的细胞相关信息.利用这些信息可以来确定所涉及的细胞,组织,器官甚至生物体.(5)分类工作表(Classtable):主要存放了以不同的DNA结合结构域类型分类的转录因子的家族信息.(6)矩阵工作表(Matrixtable):利用在Site工作表和Factor工作表中储存的转录因子位点信息,以及1O12遗HEREDITAS(Beijing)2010第32卷EMBL数据库和NCBI提供的参考序列数据库(Referencesequencedatabase,RefSeq)中的基因组序列信息,对转录因子建立了相应的位点特异性权重矩阵,储存在此表中[】”.登陆TRANSFAC网站,用户可以根据自己的需求(如转录因子名称,结合位点序YO)对6个主要工作表中的条目进行搜索,查询.同时,BIOBASE公司还提供了与TRANSFAC主数据库相关联的其他数据库,如TRANSPA TH,TRANSCompel.TRANSPA TH数据库提供了有关转录因子参与信号转导的信息以及它们参与的反应信息,并提供了包含许多信号组件的复杂的信号调控网络信息【1.TRANSCompel主要是关于真核生物中影响转录的复合调控元件的数据库.复合调控元件由两个不同的转录因子紧密契合的DNA结合位点构成,从而提供了不同信号交叉偶联的机制Il引.TRANSFAC作为着名的关于转录因子的数据库,其数据规模十分庞大,收集的信息比较全面.但是其仍存在一些问题,比如数据存在冗余现象,对于不同研究组发现的同一转录因子可能存在不同的条目,且不同物种的同一转录因子也被分开存放,用户在使用时需要注意.同时对于信息更为丰富的TRANSFAC专业版需要付费,限制了普通用户的使用,特别是普通科研用户.1.2JASPAR数据库JASPAR是收集有关转录因子与DNA结合位点模体(motif)的最全面的公开的数据库,该数据库是由哥本哈根大学(UniversityofCopenhagen)负责日常数据更新维护工作,其网址为/ cgi—bin/jaspardb.pl.JASPAR数据库中所包含的数据,都经过严格筛选,有确切的实验依据,通过计算机辅助软件进行整合识别匹配并用生物学手段进行注释,.JASPAR的最新版本号是JASPAR4.0,相对之前的版本,增加了许多新内容[1引.(1)JASPAR核心数据库(JASPARCORE)增加了ChIP.chip和ChIP—seq相关的信息.ChIP.chip与以前常用的配体DNA系统进化指数富集技术(DNASystematicEvo. 1utionofLigandsbyExponentialEnrichment,DNA SELEX)相比,提供的信息量更大,更加准确,已经越来越多地应用于基因研究之中.(2)JASPARCORE中增加了177个酵母转录因子相关信息,并且增加了关于果蝇和线虫的条目数量,从而使JASPAR基本覆盖了所有的真核顶端生物群(Eukaryotecrown group).JASPARCORE中所包含的非冗余的条目从123个大幅度增加到457个.(3)增加了关于蛋白结合微列阵技术(Proteinbindingmicroarray,PBM)相关的3个子数据库.PBM子数据库包含104个小鼠转录因子信息.PBMHOMEO子数据库包含176个小鼠同源域(Mousehomeodomains)信息.PBMHLH子数据库包含线虫bHLH转录因子二聚体信息.通过更新,JASPAR目前在核心数据库之外已经拥有840 个转录因子结合谱【】.除核心数据库之外,JASPAR还包含其他几个子数据库lI7l:(1)JASPARFARM数据库:由具有相似结合特性的转录因子的模型所构成.目前含有11个转录因子家族图谱信息.由于多个转录因子有着相似的结合位点图谱,这样存放可以降低结果的复杂性.同时,这些模型也可以为新的数据提供分类依据.f2)JASPARphyloFACTs数据库:包含174个图谱.这些图谱提取于系统发生上高度保守的基因上游元件.JASPAR主要作为_ phyloFACTsJASPARCORE的补充,可以和JASPARCORE中的数据共同使用. (3)JASPARPOLII:包含13个已知的与RNA聚合酶Ⅱ核心启动子相关的DNA序列.这些序列与JASPARCORE中数据的区别是这些序列不一定有与之作用的特异蛋白.(41JASPARCNE:该数据库由233个后生动物基因组中高度保守的非编码DNA 元件所组成.这些序列被发现行使长距离增强子作用,参与调控基因表达,调控生物发育和分化.(5)JASPARSPLICE:目前仅包括了人类的6个拼接位点,以后会增加其他真核生物的拼接位点信息,以及新的外显子拼接的增强子和衰减子信息. JASPAR中的数据是完全公开的,用户可以通过主页对数据库进行直接访问.网站在最新一次更新中对JASPARCORE根据物种分成5类,即脊椎动物门(V ertebrata),线虫纲(Nematoda),昆虫纲(Insecta),植物界(Plantae)和真菌界(Fungi),以及根据结构归类,用户可以清晰地在主页上找到相应链接.网站还提供了根据序列号(ID),物种等特性进行的搜索,还可以直接浏览数据库的内容.同时,用户第10期陈鸿飞等:转录因子相关数据库1O13通过主页可以下载JASPAR中的数据到自己的电脑上.与同领域相似数据库相比,JASPAR是一个非冗余的数据库,数据来源经过严格筛选,并且对所有数据提供免费下载,并有相应软件配套使用.但是相对于TRANSFAC等其他数据库,JASPAR所包含的数据量比较小,用户可以根据需要选择相应的数据库.1.3TFdb数据库TFdb是一个专业的关于小鼠转录因子的非冗余的数据库.该数据库由RIKEN基因组科学中心(toKENGenomicSciencesCenter,GSC)的基因组探测研究组实验室(LaboratoryforGenomeExplorationRe- searchGroup)进行日常维护,其网址是http://genome. gsc.riken.jp/TFdb/.TFdb包含了小鼠转录因子基因和与之相关联的基因数据.TFdb的建库宗旨是提供小鼠全基因组的非冗余的转录因子信息.现在的版本共有1585个小鼠转录因子信息.TFdb是从全基因组的视角来收集数据,其数据与基因组的联系十分紧密【1剐.该数据库的优点是: (1)数据的收集工作十分严谨,是非冗余的数据库,集合了许多有用的信息,是目前关于小鼠转录因子的最专业最全面的数据库.(2)该数据库中的每个转录因子都与NCBI的位点链接(LocusLink)(http://www. e/Locuslink/)相关联.位点链接(LocusLink) 是NCBI提供的一个单一的查询界面,可用来找到某一个遗传位点的序列和描述性信息;它展现了官方命名,别名,序列登陆,表型,EC号码,MIM号码,UniGene聚类,同源图谱位点和相关网站信],并提供这个链接可以准确定位的转录因子基因.(3)该数据库中的每个转录因子都提供了Gene Ontology(GO)的ID序号.GeneOntology包含基因或蛋白的细胞组分,生物过程及分子功能信息,并将上述信息根据概念粗细不同组织成有向无环图(DAG)结构.利用GO的条目,可以明确确定每个基因是否具有转录因子功能.f4)该数据库还利用NCBI提供的同源基因数据库(HomoloGene)对人类和大,小鼠的基因进行同源比较,选出功能上具有转录因子效果的基因,添加进数据库,确保转录因子信息的完整性.(5)转录因子DNA结合结构域种类则参考了蛋白质组数据库(InterPro)的资料,并给出了相关链接. TFDB无需用户注册,使用者可以直接点击页面上方按钮对数据库中所含数据进行浏览,并可以根据转录因子基因的名称,GO或InterPro数据库的ID或名称进行搜索.点击每个条目之前的细节按钮, 用户可以进入单个基因的条目,网站给出了各个数据库的相关链接,方便用户查询.1.4TRRD数据库TRRD是转录调控区数据库,收集基因转录调控区域注释信息资源.该数据库由俄罗斯科学院西伯利亚部的细胞学与遗传学研究所(InstituteofCytol—ogyandGenetics,SiberianDepartmentoftheRussian AcademyofSciences,Novosibirsk,Russia)提供技术支持及日常维护.,”.其网址为http://wwwmgs.bionet.nsc. ru/mgs/gnw/trrd/.目前最新版本号为TRRD7.0.TRRD数据库包含的数据种类及数据量见表1. TRRD数据库还包含7609篇相关科学文献.TRRD 还有与内分泌调节,脂质代谢以及细胞凋亡相关的转录因子信息.最新版TRRD数据库主要由8个子数据库所构成,分别是TRRDGENES(TRRD库基因的基本信息和调控单元信息);TRRDLCR(调控区定位信息); TRRDUNITS(调控区的启动子,增强子,沉默子等具体信息);TRRDSTARTS(转录起始位点相关信息); TRRDSITES(转录调控位点信息);TRRDFACTORS (转录因子信息);TRRDEXP(基因表达模式的信息) 和TRRDBIB(数据库涉及的实验出版物信息)f2. TRRD网站提供了几个子数据库的链接及搜索按钮.用户不需注册可以直接在网站上浏览其数据库信息.用户可以根据自己需求,选择浏览或者对特定的条目进行搜索.1.5TRED数据库TRED为转录调控元件数据库,是基于研究基因调控网络的需要而建立的数据库,收集有实验证据的哺乳动物顺式作用元件和反式作用因子.TRED 为公开的数据库,由冷泉港实验室(ColdSpringHar- borLaboratory)承担数据整理及维护工作:其网址为/cgi-bin/TRED/tred.cgi?process=home. 该数据库目前版本收集的转录因子相关数据种类及数量见表1.该数据库还提供人类,小鼠,大鼠的全基因组序列,并提供相应的序列分析查询工具[引.TRED数据库所提供的数据都是经过实验验证,1014篷HEREDITAS(Beijing)2010第32卷并且经过人工一一筛选,保证了数据的有效性.该数据库不但提供转录因子结合位点序列信息,还提供转录因子结合位点的基因组定位信息,为查询者提供了方便.另外,该数据库还引人了基因调控网络的概念,并给出了与癌症相关的36个转录因子之间的调控网络,供使用者查询[2引.TRED的网站架构简洁明了,数据库不需要注册,数据信息完全公开,在其网站的左边部分,提供了对于数据库各项信息(如启动子序列,转录因子靶基因,转录因子结合位点模体信息等)的链接,非常适合使用者进行查询并使用.1.6PAZAR数据库PAZAR数据库是一个公开的有关转录因子和其调控序列的数据库.PAZAR数据库提供相应的网页界面和工具来方便用户查询;其网址是http:llwww. .该数据库包含的数据种类及数据量见表1.PAZAR数据库把数据库的结构做成小商店的形式,为用户提供了方便简洁的查询方式l2引.PAZAR数据库的一大特点是允许每个用户登陆报告自己,本实验室或者是某个数据库的信息.这使得PAZAR数据库更像是一个为转录因子及其结合位点的研究人员所建立的数据交流平台.目前, PAZAR主要包含的数据库有:(1)ABS(adatabaseof AnnotatedregulatoryBindingSites):是一个公开数据库,收集从文献中人工筛选获得的直系同源脊椎动物基因启动子中鉴定的已知结合位点l2;其网址为http://genome.imim.es/datasets/abs2005/index.html. (2)JASPARCORE:上文提到的JASPAR的核心数据厍.(3)ORegAnno(TheOpenREGulatoryANNOtation database):是一个资源及获取都开放的数据库和文献管理系统(1iteraturecurationsystem),以便基于集体注释实验鉴定的DNA调控区域,转录因子结合位点和调控变体[2;其网址是http://www.oreganno.org/.PAZAR数据库中还有个人以及相关实验室发布的转录因子和调控基因的信息.PAZAR数据库还为用户提供了各种计算机辅助软件,使不同学者之间交流信息变得更加容易【2刖. 数据库允许匿名用户进行数据查询,其网站也提供了免费的注册系统,经过注册后,用户可以向网站提供自己的研究成果,并定制相关服务.网站提供了相关数据的搜索工具,且提供了所有公开数据的免费下载.1.7MAPPER数据库MAPPER数据库收集整理两个着名的转录因子数据库TRANSFAC和JASPAR中有关转录因子的资料,经过加工形成1134个转录因子结合位点的隐马尔可夫模型,并通过这种模型去搜索人,小鼠及果蝇的基因组转录起始位点上游1Okb序列.数据库还提供用户自定义序列的搜索功能.MAPPER数据库为利用计算机分析手段进行转录因子结合位点的研究提供了平台,叭.MAPPER数据库的网址是/mapper.MAPPER数据库需要用户利用自己的邮箱进行免费注册.注册登陆之后,用户即可使用数据库的各种功能.在Models板块,用户可以对数据库所包含的结合位点模型进行逐一查询,也可以根据模型的名称和序列来查询自己所需要的结合位点模型.在Tools模块中,用户可以对数据库已知的基因序列,或是自己提供的序列,进行结合位点模型的搜索,搜索结果包括了转录因子的名称,结合位点所在的确切位置,相似程度和预测结果.此外, MAPPER数据库还为每个用户提供了一块私人区域来储存搜索的历史记录和用户自设的模型.2其他数据库除上述主要数据库外,还有转录因子及其结合位点的其他数据库,如DBTSS(DatabaseofTranscrip—tionalStartSites),AGRIS(ArabidopsisGeneRegulatory InformationServer),DBD(DNA?bindingdomain), Redfly(RegulatoryElementDatabaseforDrosophila), RegulonDB(RegulonDatabase),PlantPromDB(Plant PromoterSequencesDatabase)等.DBTSS即转录起始位点数据库【3”,由东京大学人类基因组中心维护,是一个关于转录起始位点的数据库,只收集准确实验确定的5末端的完整cDNA序列,并提供了已知转录因子结合位点的定位;其网址是http://dbtss.hgc.jp.AGRIS即拟南芥基因调控信息数据库,是专业的拟南芥启动子序列,转录因子及其靶基因数据库f3;网址为http://arabidopsis .DBD即DNA结合结构域数据库, 第10期陈鸿飞等:转录因子相关数据库1015是一个预测与DNA特定序列结合的转录因子的数据库f3;其网址是http://www.transc邱.Redfly是一个收集果蝇转录顺式作用元件和转录因子靶序列的数据库;其网址是r. /.RegulonDB是一个专业的有关大肠杆菌和其他生物转录起始和转录调控的数据库L3,其网址是g.unam.mx.PlantPromDB是一个有注解非冗余的RNA聚合酶Ⅱ识别的植物启动子序列数据库,其网址是http://mende1.cs./.以上数据库包含的数据种类及数量见表1. 3结语将生物信息学技术与分子及细胞生物学技术交叉联合,即干实验(Dryexperiment,insilicoexperiment)与湿实验(Wetexperiment,invivo/vitroexperiment)的相辅相成,是今后生命科学发展的趋势.在转录因子研究领域,自从转录因子DNA结合靶点高通量信息获取技术,包括ChIP.chip[,ChIP—seq[q..,Protein.bindingmicroarray[卜6J等产生后,转录因子相关研究产生了巨大的数据信息,对这些数据信息的收集,整理及分析成为转录因子研究领域无法避免的生物信息学课题.因此,今后转录因子的相关研究必然是干湿实验结合的研究f4,引.转录因子数据库的建立无疑会极大地促进转录因子有关的分子生物学,系统生物学及生物信息学研究.参考文献(References)【1】BrivanlouAH,DamellJEJr controlofgeneexpression.813-818.SignaltransductionandtheScience,2002,295(5556):『2]MessinaDN,GlasscockJ,GishW,LovettM.AnOR—Feome—basedanalysisofhumantranscriptionfactorgenes andtheconstructionofamicroarraytointerrogatetheir expression.GenomeRes,2004,14(10B):2041-2047.【3】V enterJC,AdamsMD,MyersEWLiPW,MuralRJ,Sut—tonGGSmithHO,YandellM,EvansCA,HoltRA.Go—cayneJD,AmanatidesP’BallewRM,HusonDH,Wort—manJR,ZhangQ,KodiraCD,ZhengXH,ChenL,Skup—skiM,SubramanianG,ThomasPD,ZhangJ,GaborMik—losGL,NelsonC,BroderS,ClarkAG.NadeauJ. McKusickV,ZinderN,LevineAJ,RobertsRJ,SimonM, SlaymanC,HunkapillerM,BolanosR,DelcherA,DewI, FasuloD,FlaniganM,FloreaL,HalpemA,HannenhalliS. KravitzS,LevyS,MobarryC,ReinertK,RemingtonK, Abu—ThreidehJ,BeasleyE,BiddickK,BonazziBran—donR,CargillM,ChandramouliswaranI,CharlabR,ChaturvediK,DengZ,DiFrancescoV’DunnP,EilbeckK, EvangelistaCGabrielianAEGanGeGongGuZ,GuanP,HeimanTJ,HigginsME,JiRR,KeZ, KetchumKA,LaiZ,LeiY’LiZ,LiJ,LiangY,LinX,LuEM erkulovGV’MilshinaN,MooreHM,NaikAK,Na—rayanVA,NeelamB,NusskernD,RuschDB,SalzbergS, ShaoW,ShueB,SunJ,WangZ,WangA,WangX,WangJ,WeiM,WidesR,XiaoC,Y anC,Y aoA,YeJ,ZhanM, ZhangZhangHZhaoQZhengLZhongZhongZhuS,ZhaoS,GilbertD,BaumhueterS,SpierG’CarterC, CravchikA,WoodageT,AliF,AnH,AweA,BaldwinD, BadenH,BarnsteadM,Ba~owI,BeesonK,BusamD, CarverA,CenterA,ChengML,CurryL,DanaherS,Daven—portL,DesiletsR,DietzS,DodsonK,DoupL,FerrieraS, GargN,GluecksmannA,HartB,HaynesJ,HaynesC,Heiner C,HladunS,HostinD,HouckJ,HowlandIbegwamC, JohnsonJ,KalushEK1ineL,KoduruS,LoveA,Mann MayD,McCawleyS,McIntoshLMcMullenI,MoyM,Moy L,MurphyB,NelsonPfannkochC,PrattsE,PuriVQureshi H,ReardonM,RodriguezR,RogersYH,RombladD, RuhfelB,ScottR,SitterC,SmallwoodM,StewartE,S~ong R,SuhE,ThomasR,TintNN,TseS,V echC,WangGWetterJ,WilliamsS,WilliamsM,WindsorS,Winn—DeenE,W0lfe K,ZaveriJ,ZaveriK,AbrilJF,Guig6R,CampbellMJ,Sjo—landerKV,KakB,KejariwalA,MiH,LazarevaB,Hatton LNarechaniaA,DiemerK,MuruganujanA,GuoN,SatoS, BafnaIstrailS,LippertR,SchwartzWalenzB,Y oosephS,AllenD,BasuA,BaxendaleJ,BlickL,CaminhaM, Carnes—StineJ,CaulkP,ChiangYH,CoyneM,DahlkeC, MaysA,DombroskiM,DonnellyM,ElyD,EsparhamS, FoslerC,GireH,GlanowskiS,GlasserK,GlodekA, GorokhovM,GrahamK,GropmanB,HarrisM,HeilJ, HendersonS,HooverJ,JenningsD,JordanC,JordanJ,Ka—shaJ,KaganL,KraftC,LevitskyA,LewisM,LiuX,LopezJ,MaD,Majorosw,McDanielJ,MurphyS,NewmanM, NguyenLNguyenN,NodellM,PanS,PeckJ,PetersonM, RoweWSandersR,ScottJ,SimpsonM,SmithLSpragueA, StockwellTurnerR,V enterE,WangM,WenM,WuD, WuM,XiaA,ZandiehA,ZhuX.Thesequenceofthehuman genome.Science,2001,291(5507):l304-1351.[4】CawleyS,BekiranovS,NgHH,KapranovP,SekingerEA, KampaD,PiecolboniA,SementchenkoV,ChengJ,Wil—lianasAJ,WheelerR,WongB,DrenkowJ,Y amanakaM, PatelS,BrubakerS,TammanaH,HeltG,StndalK,GingerasTR.Unbiasedmappingoftranscriptionfactorbindingsites 1016遗HEREDITAS(Beijing)2010第32卷alonghumanchromosome21and22pointstowidespread regulationofnoncodingRNAs.Cell,2004,116(4):499—509. 【5]weiCL,wuQ,V egaVB,ChiuKP,NgZhangT’Shahab A,Y ongHC,FuY,WengZ,LiuJ,ZhaoXD,ChewJL, LeeYL,KuznetsovV A,SungWK,MillerLD,LiraB,Liu ET’Y uQ,NgHH,RuanY.Aglobalmapofp53transcrip—tion—factorbindingsitesinthehumangenome.Ce{ll2006, 124(1):207——219.【6】HagiwaraM,BrindleP’HarootunianA,ArmstrongR, RivierJ,V aleW,TsienR,MontminyMR.Couplingof hormonalstimulationandtranscriptionviathecyclic AMP—responsivefactorCREBisratelimitedbynuclear entryofproteinkinaseA.MolCellBiol,l993,13(8):4852-4859.【7]EuskirchenGRoyceTE,BegoneP,MagoneR,RinnJL, NelsonFK,SaywardFjLuscombeNM,MillerP,Gerstein M,WeissmanS,SnyderM.CREBbindstomultiplelocio?。

启动子与转录因子工具

启动子与转录因子工具

启动子与转录因子工具启动子与转录因子是生物学中重要的概念和研究领域,它们在基因调控和生物进程的调控中起着关键作用。

随着生物信息学和计算生物学的发展,研究者们发展了各种工具和方法来预测和分析启动子和转录因子。

本文将介绍几种常用的启动子与转录因子工具,并探讨它们的优缺点和应用领域。

1.JASPAR:JASPAR是一个广泛使用的数据库和工具集,用于预测转录因子结合位点。

它提供了一个庞大的基于转录因子结合位点的DNA序列集合,并提供了丰富的生物信息学工具来分析和预测转录因子结合位点。

JASPAR的优点在于它的数据库内容丰富,包含了多个物种和转录因子家族的结合位点数据。

它还提供了多种和分析工具,可以方便地进行位点预测和功能注释。

然而,由于数据库内容的积累和更新需要时间,JASPAR 在一些物种和转录因子家族的数据上可能没有最新的信息。

2. MEME Suite:MEME Suite是一个综合的工具集,用于预测和分析DNA和RNA序列中的启动子和转录因子结合位点。

它包括了多种功能强大的算法和统计方法,可以进行序列模式、转录因子结合位点预测、转录因子模式分析等多种任务。

MEME Suite的优点在于它的算法和方法经过了广泛的验证和比较,在准确性和稳定性上有保障。

此外,它还提供了友好的图形用户界面和丰富的文档和指南,方便用户进行操作和分析。

然而,对于初学者来说,工具集的复杂性可能是一个挑战。

3.PROMO:PROMO是一个专注于启动子分析的工具,用于预测和鉴定基于转录因子结合位点的启动子序列。

它基于转录因子-启动子结合的编码矩阵模型,并利用统计学方法进行位点预测和功能注释。

PROMO的优点在于它的灵活性和可定制性,用户可以根据自己的研究需求进行参数设置和算法调整。

此外,PROMO还提供了丰富的数据库和工具,用于分析和可视化结果。

然而,由于其基于统计学方法,PROMO的预测结果可能会受到噪声和误差的影响。

综上所述,启动子与转录因子是生物学中关键的研究领域,研究者们开发了多种工具和方法来预测和分析启动子和转录因子。

分子生物学中常用数据库

分子生物学中常用数据库

分子生物学中常用数据库综合数据库:来源:/news/science/article/90048.html生物信息学网址链接:http://www.bioinformatics.ca/links_directory/Nucleic Acid Research Database Issue:/content/vol32/suppl_2/一、蛋白相关数据库蛋白质结构域预测工具Esignal:/esignal/信号传导系统蛋白的结构域预测工具,凡是涉及到信号传导系统的蛋白用这个预测效果最佳SignalP:http://www.cbs.dtu.dk/services/SignalP/信号肽预测工具,适合定位于非胞质位置的蛋白质Emotif:/emotif-search/结构域预测工具,由于其用motif电子学习的方法产生结构域模型,故预测效果比Prosite好Ematrix:/ematrix/是用Matrix的方法创建的结构域数据库,可与emotif互相印证。

其速度快,可快速搜索整个基因组InterPro:/InterProScan/EBI提供的服务,用图形的形式表示出搜索的结构域结果TRRD:http://wwwmgs.bionet.nsc.ru/mgs/gnw/trrd/转录因子结构域预测的最好数据库。

但不会用Protscale:/cgi-bin/protscale.pl可分析该序列的各种性状如活动度、亲水性(Kyte&Doolittle)、抗原性(Hopp&Woods)等通过寻找MOTIF和Domain来分析蛋白质的功能A. MOTIF是蛋白中较小的保守序列片断,其概念比Domain小PROSITE:/tools/scanprosite/是专门搜索蛋白质Motif的数据库,其中signature seqs是最重要的motif信息B. Domain:若干motif可形成一个Domain,每个Domain形成一个球形结构,Domain与Domain之间通常像串珠一样相连Pfam:可以搜索某段序列中的Domain,并以图形化表示出来。

promo数据库转录因子 结果

promo数据库转录因子 结果

Promo数据库转录因子1. 引言转录因子是一类能够结合到DNA上的蛋白质,它们在基因转录过程中起到重要的调控作用。

转录因子能够识别DNA上的特定序列,并与其他转录因子、RNA聚合酶和其他调控蛋白质相互作用,调控基因的表达。

Promo数据库是一个专门用于存储和分析转录因子结合位点信息的数据库。

本文将对Promo数据库转录因子的相关内容进行详细介绍。

2. Promo数据库概述Promo数据库是一个由转录因子结合位点信息构建的数据库。

它包含了大量的转录因子结合位点序列和相关的功能注释信息。

Promo数据库的目的是帮助研究人员更好地理解转录因子与基因表达调控之间的关系,从而揭示基因调控网络的机制。

3. Promo数据库的构建Promo数据库的构建主要分为以下几个步骤:3.1 数据收集首先,需要收集转录因子结合位点的实验数据。

这些数据可以通过实验手段如染色质免疫共沉淀(ChIP)等技术获取。

在ChIP实验中,转录因子与DNA结合后,可以通过特定抗体将转录因子与DNA结合物质进行分离和富集。

通过对富集物进行测序,可以获得转录因子结合位点的序列信息。

3.2 数据预处理获得的转录因子结合位点序列需要进行预处理。

预处理的目的是去除低质量的序列,去除重复的序列,并对序列进行标准化处理,以便于后续的分析和比较。

3.3 功能注释对于每个转录因子结合位点,需要进行功能注释。

功能注释可以包括转录因子结合位点的基因组位置信息、序列保守性分析、TFBS(转录因子结合位点)的预测和功能富集分析等。

3.4 数据存储经过预处理和功能注释后的数据被存储到Promo数据库中。

Promo数据库采用关系型数据库的形式进行存储,以便于后续的查询和分析。

4. Promo数据库的应用Promo数据库作为一个专门用于存储和分析转录因子结合位点信息的数据库,具有广泛的应用价值。

以下是Promo数据库的一些主要应用领域:4.1 转录因子识别Promo数据库中存储了大量的转录因子结合位点序列和相关的功能注释信息,可以用于转录因子的识别。

promo数据库转录因子 结果

promo数据库转录因子 结果

文章标题:深度解析:promo数据库转录因子的重要性与应用在生物学领域中,转录因子是一类具有调控基因转录水平和表达模式功能的重要蛋白质。

而promo数据库则是一个致力于收集和整理转录因子与启动子交互信息的数据库。

本文将深入探讨promo数据库转录因子的重要性与应用,以帮助读者更好地理解这一主题。

1. promo数据库及其意义promo数据库是一个集成了大量转录因子与启动子结合位点信息的数据库,其对于理解基因调控网络、开展基因表达调控研究具有重要意义。

研究者可以通过该数据库快速获取到目标转录因子与启动子的相关信息,从而深入研究基因调控机制和调控网络。

2. promo数据库的广泛应用promo数据库在生物学研究领域中有着广泛的应用,涉及基因表达调控、疾病研究、药物研发等多个方面。

通过该数据库,研究者可以发现潜在的转录调控关系,揭示疾病发生机制,寻找潜在的药物靶点等,对于推动生物医学研究具有重要意义。

3. promo数据库转录因子在疾病研究中的应用通过promo数据库转录因子的研究,可以发现许多与疾病发生发展相关的调控路径和关键因子。

这为疾病的诊断和治疗提供了重要的理论依据,并为相关疾病的早期预防和干预提供了新的思路和途径。

4. 个人观点及总结从疾病治疗的角度来看,promo数据库转录因子具有重要的临床应用前景。

其对于疾病的发生机制进行深入挖掘,可能为基于转录因子的靶向治疗提供新的途径和方法。

promo数据库转录因子的研究具有重要的临床意义和应用前景。

通过本文的深度解析,相信读者对于promo数据库转录因子的重要性和应用有了更深入的了解。

希望promo数据库转录因子的研究能够得到更广泛的关注和应用,为生物医学研究领域带来新的突破和进展。

转录因子是一类蛋白质,它们能够结合到DNA上的特定序列,从而调控基因的转录水平和表达模式。

这一过程对于生物体的正常生长发育和稳态维持至关重要。

而promo数据库则是一个集成了大量转录因子与启动子结合位点信息的数据库,它的建立和应用对于揭示基因调控网络、开展基因表达调控研究具有重要的意义。

如何使用生物大数据技术进行转录因子分析

如何使用生物大数据技术进行转录因子分析

如何使用生物大数据技术进行转录因子分析转录因子分析是生物学研究中非常重要的一个方面,可以帮助我们理解基因表达调控的机制。

随着生物大数据技术的发展,我们可以更加深入地研究转录因子的功能和作用。

本文将介绍如何使用生物大数据技术进行转录因子分析。

首先,我们需要获取转录因子与基因表达水平相关的生物数据。

这可以通过公共数据库(如GEO、TCGA等)或专门的转录因子数据库(如HOCOMOCO、JASPAR等)进行。

这些数据库收集了大量的转录因子和基因表达数据,可以帮助我们进行分析。

第二步是进行数据处理和预处理。

生物数据通常是庞大且复杂的,我们需要对数据进行预处理,以确保数据的质量和一致性。

这通常涉及到数据清洗、去除异常值、标准化等步骤。

此外,我们还可以根据需要选择特定的转录因子和基因进行分析。

接下来,我们可以使用生物大数据技术进行转录因子与基因表达之间的关联分析。

一种常用的方法是基因共表达网络分析,它可以帮助我们发现与转录因子高度相关的基因群。

这基于假设,转录因子与其调控的基因通常在表达水平上具有相似的变化趋势。

通过构建基因共表达网络,我们可以识别与感兴趣的转录因子高度相关的基因。

除了基因共表达网络分析外,我们还可以使用其他生物大数据技术来探索转录因子的功能和调控机制。

例如,转录因子结合位点预测可以帮助我们鉴定转录因子结合在基因组上的位置。

这可以通过利用转录因子结合motif的信息和基因组序列来实现。

此外,转录因子的调控网络分析也是一个重要的方向,可以帮助我们理解转录因子与其他蛋白质和信号通路的相互作用关系。

随着生物大数据技术的不断发展,我们还可以利用机器学习和数据挖掘的方法来进行转录因子分析。

通过建立预测模型,我们可以预测已知转录因子的新目标基因。

这可以帮助我们发现新的转录因子与疾病发生和发展相关的基因。

最后,我们需要对分析结果进行解释和验证。

生物大数据技术可以提供丰富的信息和假设,但还需要进行实验验证来确认结果的准确性。

uniprobe 转录因子 -回复

uniprobe 转录因子 -回复

uniprobe 转录因子-回复什么是uniprobe转录因子?Uniprobe是一种常用的生物信息工具,用于预测和分析转录因子结合位点(TFBS)。

转录因子是调控基因表达的蛋白质,它们通过与DNA上特定序列的结合来启动或抑制基因的转录过程。

这些特定序列被称为转录因子结合位点,它们通常存在于基因的调控区域。

Uniprobe是一个数据库,其中包含了大量已知的转录因子结合位点序列信息。

使用Uniprobe,研究人员可以根据自己感兴趣的转录因子查询数据库,以获得与该转录因子相关的结合位点信息。

如何使用Uniprobe转录因子?首先,研究人员需要访问Uniprobe数据库的网站。

网站上提供了丰富的功能和工具,可以满足不同研究人员的需求。

在网站上,研究人员可以输入感兴趣的转录因子名称或相关关键词进行搜索。

Uniprobe将返回与输入信息相关的转录因子结合位点信息。

当研究人员获得所需的转录因子结合位点信息后,他们可以进一步分析这些位点的特征和可能的功能。

Uniprobe提供了一些分析工具,如序列比对、位点共享和互补等,以帮助研究人员更好地理解转录因子与它们结合位点之间的关系。

Uniprobe还提供了一些实用的功能,例如通过转录因子结合位点预测某个基因的调控潜力。

研究人员可以输入感兴趣的基因序列,Uniprobe将搜索与该序列相关的转录因子结合位点,并给出这些位点对基因调控的评估。

为什么使用Uniprobe转录因子?Uniprobe转录因子数据库的使用有许多优势。

首先,它提供了大量已知的转录因子结合位点信息,可以帮助研究人员快速定位感兴趣的转录因子。

其次,Uniprobe还提供了一些实用的分析工具,可以帮助研究人员更深入地了解转录因子与结合位点之间的关系。

此外,Uniprobe的数据库和工具都是免费提供的,使其成为广大研究人员的理想选择。

Uniprobe的局限性和未来发展方向尽管Uniprobe是一个强大而实用的工具,但它仍然存在一些局限性。

TF转录因子筛选信息从数据库到功能验证综述

TF转录因子筛选信息从数据库到功能验证综述

TF转录因子筛选信息从数据库到功能验证综述TF转录因子(transcription factor)是一类能够与DNA结合并调控基因转录的蛋白质分子。

它们是细胞中调控基因表达的重要调控因子,能够直接或间接影响基因转录速率。

TF转录因子在发育、生长、免疫和疾病等生物过程中起着关键作用。

为了更好地理解TF转录因子的功能和调控机制,研究者们开展了大量的研究工作,并利用数据库来收集和整理相关信息。

本综述将从数据库筛选信息到功能验证这一过程综述TF转录因子的研究进展。

首先,对于TF转录因子的研究,研究者通常会从大量的科学文献中搜集相关信息。

与之相伴的是建立了多个数据库以储存和整理这些信息,如:JASPAR、TRANSFAC、ChIPBase、ENCODE等。

这些数据库中包含了大量的TF转录因子的注释信息、结构信息、调控元件信息以及TF与目标基因的关联信息。

通过对这些数据库的利用,研究者可以获取大量的有关TF转录因子的信息。

其次,研究者会利用获得的TF转录因子信息进行筛选和分析。

通过分析TF的结构特征、序列保守性、表达谱和选择性启动子区域等,研究者可以初步筛选出一些具有潜在功能的候选转录因子。

在此基础上,结合人们日益完善的高通量测序技术,可以进一步鉴定出在不同发育阶段、组织类型或疾病状态下表达量差异显著的TF转录因子。

这种差异分析有助于确定哪些TF在特定的生物过程中起关键调控作用。

在鉴定候选TF转录因子的基础上,功能验证是不可或缺的一步。

功能验证是通过多种实验手段和技术手段来验证候选TF是否具有调控基因表达的能力。

其中,常用的方法包括转录活性分析、RNA干扰(RNAi)技术和基因敲除技术。

转录活性分析通常是在体外或细胞模型中进行的。

该方法通过构建启动子报告基因和靶向TF的表达载体,从而可以直接测量TF转录因子的活性。

例如,双荧光素酶报告基因系统可以用来监测特定基因的转录活性。

这种方法可以定量分析特定TF转录因子对基因表达的调控能力。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

HEREDITAS (Beijing) 2010年10月, 32(10): 1009―1017 ISSN 0253-9772 综 述收稿日期: 2009-12-25; 修回日期: 2010-03-11基金项目:国家自然科学基金项目(编号:60871014)资助作者简介:陈鸿飞(1987-), 男, 硕士研究生, 专业方向:生物医学工程。

E-mail: chenhf0001@通讯作者:王进科(1969-), 男, 博士, 教授, 博士生导师。

研究方向:生物医学工程。

Tel: 025-********; E-mail: wangjinke@DOI: 10.3724/SP.J.1005.2010.01009转录因子相关数据库陈鸿飞, 王进科东南大学生物电子学国家重点实验室, 生物科学与医学工程学院生物技术与材料实验中心, 南京210096摘要: 转录水平的调控是基因调控的重要环节, 其中转录因子(Transcription Factor, TF)和转录因子结合位点(Transcription Factor Binding Site, TFBS)是转录调控的重要组成部分。

为了解析基因转录调控过程中TF 与其TFBS 相互作用的分子机理, 鉴定TFBS 及构建基因转录调控网络, 需要对已发现的TF 及其TFBS 信息进行系统的收集、整理和分析。

目前, 国际上已经出现不少关于TF 及其TFBS 的专业数据库, 这些数据库对基因转录调控及TF 相关的分子生物学、系统生物学及生物信息学的研究非常重要, 对这些领域的研究起到了显著的推进作用。

文章对7个目前比较著名的TF 及其TFBS 相关数据库, 包括TRANSFAC 、JASPAR 、TFDB 、TRRD 、TRED 、PAZAR 、MAPPER 的特点、数据种类和数量及使用方法进行了详细综述, 并简要介绍了其他相关数据库。

关键词: 转录因子; DNA 结合位点; 数据库; 生物信息学The databases of transcription factorsCHEN Hong-Fei, WANG Jin-KeThe State Key Laboratory of Bioelectronics , The Experimental Center of Biotechnology and Biomaterials , School of Biological Sciences and Medical Engineering , Southeast University , Nanjing 210096, ChinaAbstract: The control of gene transcription is a critical level of gene expression regulation. The interactions between transcription factors (TF) and their DNA binding sites (TFBS) play a key role at this level. In order to decipher the molecu-lar mechanism of the interactions of TFs with TFBSs and construct transcription regulatory network, it is necessary to sys-tematically collect, save, and analyze the information of discovered TFs and their TFBSs. In recent years, multiple TF and TFBS-related databases have been established. These databeses significantly promoted the TF-related studies in the fields of molecular biology, bioinformatics, and system biology. This paper summarized the contents, characteristics, access, and advances of main TFs and TFBSs-related databases, including TRANSFAC, JASPAR, TFDB, TRRD, TRED, PAZAR, MAPPER and others.Keywords: transcription factor; DNA binding site; database; bioinformatics真核生物基因的表达受多个层次的调控, 其中基因的转录调控就是一个非常重要的环节。

该环节中, 转录因子与其DNA 结合位点的相互作用发挥关键作用。

转录因子包括基础转录因子(Basic TF)和调控性转录因子(Regulatory TF)两类, 其中基础转录因子与RNA 聚合酶一起构成转录机器(transcription apparatus or machine), 通过与转录起点(Transcription start site, TSS)临近的DNA 上的启动子区结合实现基因的转录; 而调控性转录因子一般与位置多样的增强子序列结合, 再与转录机器发生作用, 调控基1010 HEREDITAS (Beijing) 2010 第32卷因转录的水平及组织、细胞特异性。

增强子序列没有方向性, 可位于基因的上游, 也可以位于基因的下游, 甚至基因内部。

目前, 已经证实位于基因上游10 kb 远的增强子仍然对基因有调控作用。

目前, 在人的基因中已经鉴定出 2 000多个转录因子[1, 2], NCBI (National Center for Biotechnology Information) 数据库中收录人转录因子基因1 962个, 占人全基因总数(24 652)的8%[3]。

已经鉴定的转录因子中约有700多个是DNA 合转录因子(DNA-binding TF)。

除了转录因子的鉴定外, 目前已经发现一个DNA 结合转录因子在基因组中存在成千上万的DNA 结合位点(DNA-binding sites)。

例如, 通过染色质免疫沉淀(Chromatin immunoprecipitation, ChIP)结合DNA 微阵列芯片(ChIP-chip) 或高通量DNA 测序技术(ChIP-seq), 发现转录因子SP1在基因组中有12 000个结合位点结[4], c-myc 有25 000个结合位点[4]、p53有1 600~65 000个结合位点[5]、CREB 有19 000~40 000个结合位点[6, 7]。

通过这些位点转录因子控制着众多基因的表达, 构成了复杂的基因转录调控网络(Gene transcription regulatory net-work)。

转录因子及其DNA 结合位点的鉴定, 以及它们构成的基因转录调控网络的构建已经成为目前系统生物学研究的重点领域, 也是生命科学研究的热点之一。

这一领域的研究, 不仅具有重要的基础研究价值, 而且在生物技术及生物医学领域具有重要的应用价值。

很多转录因子(如NF-κB 、AP1、p53、PPAR 、CREB 、STAT 、E2F 等)与重要疾病(如炎症、肿瘤等)的发生、发展具有密切的关系, 因而成为疾病诊断的依据和药物开发的靶点。

为了系统收集该领域研究产生的大量数据信息并进行相关的生物信息学研究, 最近数年国际上涌现出不少转录因子相关数据库, 如TRANSFAC (TRANScription FACtor)、JASPAR 、TFdb (The Mouse Transcription Factor Database)、TRRD(Transcription Regulatory Regions Database)、TRED(Transcriptional Regulation Element Database)、PAZAR 、MAPPER 等。

这些数据库各有特色, 提供了转录因子研究不同侧面的数据信息, 促进了转录因子的研究, 特别是对转录因子相关的生物信息学研究发挥了显著的推动作用。

然而目前国内还没有专业的转录因子数据库建立, 为了推动这一领域的研究, 本文对目前国际上主要的转录因子数据库的相关内容、特点及使用方法予以综述。

1 主要转录因子数据库1.1 TRANSFAC 数据库TRANSFAC 数据库是基于真核生物转录调控所建立的数据库, 其中收集了大量与基因转录水平有关的数据, 如转录因子及其DNA 结合位点和相应的靶基因等信息[8, 9]。

TRANSFAC 数据库由BIOBASE 公司负责日常更新和维护工作, 网址是http://www.gene- 。

该数据库分为公开版本和专业版本两个部分, 用户只需登陆该网站, 按照要求完成相应的注册, 利用所获得的账号可以免费查询公开版本中所有的信息, 而专业版本则需要用户付费使用, 对于国内用户需要付款约800欧元进行网上查询, 如需下载则需要额外的800欧元。

目前, 公开版版本的版本号为TRANSFAC7.0; 专业版本版本号为TRANSFAC2009.3。

两个版本的最后更新日期及贮存的数据种类及数据量见表1。

相对于公开版本, 专业版本还增加了小RNA(miRNA)及其靶序列、ChIP-chip 实验序列片段, 以及所有收录数据的相关参考文献、启动子序列等信息。

TRANSFAC 数据库的公开版本中主要包括6个工作表文件[10]: (1) 位点工作表(Site table): 主要包括每个(推定的)调控蛋白各自的结合位点信息。

其中既包括真核生物基因调控中转录因子的结合位点, 也包括经诱变实验、体内随机选择所得到的人工序列信息。

收录的所有序列经证实都与蛋白结合并且有着特定的功能, 每一条序列条目都有相应的唯一序号。

(2) 因子工作表(Factor table): 储存相关的转录因子数据信息。

在位点工作表中所涉及的转录因子在此表中都有储存。

同时还包括一些不与DNA 直接结合或者需要与其他转录因子形成复合物才能与DNA 结合的转录因子。

此外TRANSFAC 还对所收集的转录因子根据其DNA 结合结构域类型进行分类, 方便用户根据需要进行查找。

(3) 基因工作表(Gene table): 包括与转录调控相关的基因信息。

相关文档
最新文档