物种#转录因子
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
可变剪切的影响
➢ 可变剪切不影响转录因子绑定形式
ENSBTAG00000005251产生了7个转录因子 每个转录因子只包含RING/U-box结构。
http://dbd.mrc-lmb.cam.ac.uk/DBD/index.cgi?About
http://bioinformatics.zj.cn/archaeatf/Homepage.php
http://planttfdb.cbi.pku.edu.cn/
http://dbtbs.hgc.jp/
概要
❖ 研究背景 ❖ 材料与方法 ❖ 数据库构建与网页 ❖ 结果与讨论
转录因子
➢ 定义:
能够结合在某基因上游特异核苷酸序列上 从而调控其基因转录的一类蛋白质。
➢ 结构特点:
存在结构域和功能域 结构域(DBD) :与DNA结合的具有特异性 结构模式:锌指,亮氨酸拉链,
螺旋-转角-螺旋, 螺旋-环-螺旋 … …
暖枝菌
8 紫色光合细菌 20
热变形菌
9 具核梭杆菌
2
常温泉古菌 15 乳酸球菌
1
嗜热菌
7 发光杆菌
7
超嗜熱菌
6 双叉杆菌
7
嗜盐杆菌 39 抗辐射细菌 17
古细菌
503 细菌
332
--收集于NCBI
转录因子所占比例
--J. L. Riechmann 2000 science.
生物进化历史
--J. L. Riechmann 2000 science.
2000 1500 1000 500
0 0
genome-wide gene ~ TF's gene
5000 10000 15000 20000 25000 30000 genome genes
转录因子的可变剪切
➢ 有886个基因产生2个或2个以上的转录蛋白
1 个基因产生 7个不同的转录因子 3 个基因每个产生 6个转录因子 9 个基因每个产生 5个转录因子 712 个基因每个产生 2个转录因子
➢ 共计 5479 个转录因子,4357个基因 由已知蛋白集合预测 3810个基因4932个转录因子 由预测蛋白集合预测 4260个基因5487个转录因子
结 果 (I)
已
预
知
测
蛋 白
3810~4932
547~547
蛋 白
集
集
合
合
4357个基因~5479 个转录因子 占全基因组~14%
TF's gene
➢ 顺式作用元件与反式作用因子
真核生物转录因子
物种 #转录因子
人
1790
猩猩
242
百度文库
鼠
1305
鸭嘴兽 139
鸡
585
斑马鱼 874
果蝇
586
线虫
635
物种 #转录因子
拟南芥 1953
水稻
400
小麦
97
玉米
37
番茄
29
绿藻
90
红藻
10
酵母
322
--收集于NCBI
原核生物转录因子
古细菌物种 #转录因子 细菌物种 #转录因子
转录信息4933条。 (NCBI) PDB数据3.6万条 。 (SWISS-MODEL ) 收集涉及91个性状的QTL共846条。(QTLdb)
转录因子识别
➢识别蛋白质是否含有DBD结构
•与DNA结合的结构域(DBD)具有特异性 •HMMER程序 (hmmpscan,hmmsearch) • 66个家族231个HMM模型(SCOP) •参数为默认值,取E-value=0.01
已有转录因子数据库
农场生物转录因子
物种
猪 马 牛 羊 鸡 狗 猫 水稻 小麦 玉米
#转录因子
94 156 634
17 585 215
5 400
97 37
--收集于NCBI
牛转录因子
➢ 关注于模式生物 ➢ NCBI~634 编码转录因子的基因 ➢ TRANSFAC ~10 编码转录因子的基因
~ 16 转录因子调控的基因 ➢ DBD ~ 2333 预测转录因子 (无注释)
注
本地 BLAST
信息整合
基因注释
释
转录因子功能注释
转录因子物理位置注释
生物功能信息
基本信息
QTL区域信息
数据收集
牛全基因组序列3.1版本 。( ENSEMBLE ) 收集牛已知蛋白质序列2.7万条。
(ENSEMBLE) 获得由GENESCAN 预测蛋白质5.6万条。 与转录因子相关的基因信息4357条,
perl :: DBI 、perl :: CGI perl :: GD
数据表结构
TF_family 信息 Motif 信息
PDB 信息 TF 基本信息
转录和外显子信息
基因信息
注释信息 QTL 信息 序列信息
概要
❖ 背景知识 ❖ 材料与方法 ❖ 数据库构建与网页 ❖ 结果与讨论
结 果 (I)
目的
全基因组范围完整注释的 牛转录因子库
概要
❖ 背景知识 ❖ 材料与方法 ❖ 数据库构建与网页 ❖ 结果与讨论
实现步骤
➢ 数据的收集 ➢ 转录因子的识别 ➢ 预测转录因子的注释 ➢ 预测转录因子的展示
技术路线
蛋白质二级结构 模型集
( Pfam &SuperFamily)
已知转录因子集合
基因组,蛋白质组数据 HMMER 程序 预测转录因子集
http://regulondb.ccg.unam.mx/
http://flybase.bio.indiana.edu/
http://genome.gsc.riken.jp/TFdb/
http://arabidopsis.med.ohio-state.edu/
http://drtf.cbi.pku.edu.cn/
预测转录因子的注释
转录因子基本信息物理位置 转录因子家族信息 DBD信息 基因与转录本信息 基因结构与3D结构信息 GO信息 表型性状与QTL信息 序列信息
概要
❖ 背景知识 ❖ 材料与方法 ❖ 数据库构建与网页 ❖ 结果与讨论
预测转录因子的展示
C \S构架 动态网站 数据存储 ~ Mysql (5.0.18) 服务 ~ Apache (2.2.4) 界面 ~ Perl (5.8.7)
转录因子存在的特性
1. 转录因子存在的普适性 2. 物种间的差异性 3. 与进化历史有一定关系
转录因子的作用
➢ 基因调控特别针对真核生物的多 级调控结构
➢ 基因调控网络 ➢ 辅助基因网络的推断
已有转录因子数据库
http://www.gene-regulation.com/cgi-bin/pub/databases/transfac/search.cgi