玉米Dof转录因子家族基因的全基因组分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
玉米Dof转录因子家族基因的全基因组分析
来源:《生物信息学》.-2 0 1 0 ,8(3).-198-20 作者:江海洋等阅读次数: 769 摘要:Dof转录因子家族在植物生长发育和基因表达调控过程中具有重要的作用,本文利用公布的玉米基因组草图数据,利用生物信息学方法对玉米全基因组Dof基因的结构、系统进化关系和保守motif进行了分析。结果表明:玉米中共有18个Dof类型基因,命名为ZmDof1 - Zm Dof18,其蛋白质长度在211aa至618aa之间,通过系统进化树分析后, 18个Dof基因可以明显的分为三类,此外玉米Dof基因的数目远远小于水稻和拟南芥,基因复制现象较少是玉米Dof基因数量较少的原因之一,M EME分析证实了Dof基因含有三个保守的motif。对玉米Dof类型基因的系统分析,将有助于玉米Dof类型基因的克隆和功能的进一步研究。
转录因子( transcrip tion factor) ,又称反式作用因子( transacting f actor) ,是指能够与真核基因的顺式作用元件( cis acting element)发生特异性相互作用并对转录有激活或抑制作用的DNA结合蛋白,转录因子调控复杂的蛋白间的互作网络。典型的转录因子含有DNA结合区、转录调控区、寡聚化位点及核定位信号区等功能。有关转录因子结构和功能的研究是植物分子生物学研究的前沿领域,因其含有DNA结合蛋
白的不同可以划分为不同的基因家族。因为转录因子在植物基因表达过程中的重要作用,因此从全基因组角度研究某一类型调控因子具有重要的意义。对拟南芥和水稻全基因组的转录因子研究表明,拟南芥中共含有3 018个转录因子,占基因总数的16. 8%。
Dof (DNA bindingwith one finger)基因家族是一类植物专有的转录因子,在果蝇、秀丽线虫和酿酒酵母的基因组中尚未发现有Dof基因的存在。它含有一个独特的富含Cys残基的单锌指(C2 -C2 )保守结构域,命名为Dof结构域,含有Dof结构域的蛋白质通称为Dof蛋白家族。Dof蛋白通常包含2个主要的结构域:一个位于N末端的保守的DNA结合结构域和一个位于C末端的调控结构域。在N 末端有52 个氨基酸组成的高度保守的DOf结构域,在此结构域中CX2CX21 CX2 C基序形成一个单锌指结构,此单锌指结构中1个Zn可与4个Cys残基共价结合。
并且Dof基因的锌指结构亮氨酸残基与锌离子结合方式特殊,造成其与其它的锌指结构有明显不同。Dof蛋白的转录调控结构域位于C末端,如玉米的ZmDofl的转录激活结构域是位于C末端的44个氨基酸残基。并且两个结构域之间拥有一个Ser骨架,可能作为分子铰链连接这两个结构域。研究表明Dof转录因子在植物生长发育过程中参与多种生物学过程,参与植物体内多种基因的表达调控,包括种子贮藏蛋白合成、糖代谢过程光调控、植物防卫机制、种子萌发、赤霉素反应等基因。在玉米中已经克隆了2个Dof转录因子,主要功能是特异性的结合启动子的AAAAGG核心序列,并且有增强启动子活性的功能。
随着测序技术的进一步升级,植物全基因组测序物种再进一步扩大,拟南芥、水稻、苜蓿、杨树等模式生物都已经完成全基因组测序,大大加快了这些物种的基因克隆和功能基因组学研究,特别是对特定一类基因家族的全基因组分析研究近年来取得了一定得进展。玉米属于禾本科玉米属植物,原产于美洲大陆的墨西哥、秘鲁、智利等地,玉米作为三大粮食作物之一,是人类生存的基本食物来源和主要的动物饲料原料,同时玉米也是研究作物和光合作用代谢的模式植物。其全基因草图数据于2 008年完成,对玉米基因组信息的分析和挖掘工作是目前研究的热点。本文利用公布的玉米基因组草图数据,对全基因组Dof转录因子基因家族进行筛选,分析Dof转录因子的数目并进行分类,同时进行系统发生学分析并与水稻的Dof转录因子比较分析,该研究全面了解玉米Dof基因家族的信息和特点,对于玉米Dof基因的克隆、功能鉴定具有重要的意义。1数据与方法
1. 1数据下载
玉米B73全基因组数据和蛋白质数据从国际玉米基因组网站http: / /www. maizegenome. org/data_portal. html下载。
1. 2Dof类型基因的鉴定
首先,从Sanger中心的数据库中选取Dof结构域的氨基酸序列( PF 02701) ,然后利用Blastp 程序,P - value设为10- 4 ,对玉米全基因组蛋白质数据库进行搜索,寻找玉米基因组中所有的候选含Dof蛋白。所有
符合要求的序列再通过Pfam (蛋白家族数据库, http: / /pfam. wustl. e du /hmmsearch. shtml)来验证是否含有Dof结构域( threshold = 0. 9)。第三步,所有已被选取基因的核苷酸序列通过Clust2alW的方法进行多序列排列,根据排列的结果,去除候选基因中的重复序列。
1. 3Dof基因系统进化树的构建
由于Dof蛋白氨基酸序列具有较高的相似性,根据排序结果,利用M EGA4. 0软件对所有序列使用距离法(Neighbor - Joiningmethod)构建
系统进化树。
1. 4Dof基因保守motif分析
玉米Dof类型基因的保守motif分析通过MEME(Multip le Expect ation Maximization for Motif Elicita2tion)在线分析,MEME是圣地亚哥超级计算机中心(SDSC)开发的一套用来寻找一组相关的DNA序列或
者蛋白质序列的基序(motif)的程序。利用此软件对玉米Dof类型基因的保守motif进行分析。
2结果与分析
2. 1Dof类型基因的确定
对玉米全基因组基因进行分析, 利用标准的Dof结构域氨基酸序列,通过B last分析获得候选Dof基因,首先通过序列比对以去除重复的基因,然后利用Pfam数据库分析证实候选基因存在Dof结构域,去除结构不完成的候选基因,最终共得到18个玉米Dof家族基因,并命名为Zm Dof1 - ZmDof18(表1略) ,蛋白的氨基酸长度从211aa至618aa,长度差异较大,但是每一个蛋白质经过pfam分析都含有典型的锌指结构,具有典型的Dof结构域。玉米基因组远远大于模式植物拟南芥和水稻,但在水稻中共发现30个Dof类型基因,拟南芥中发现36个Dof类型基因,都远远的大于玉米中的18个Dof基因。此外,因为玉米基因组并没有拼接完整。对Dof进行BAC定位,发现18个基因分别位于不同的BAC克隆上,通过下面的系统进化树分析把18 个玉米Dof基因分为a、b、c三类。
2. 2Dof类型基因的结构域分析
对18个玉米Dof基因的Dof结构域氨基酸序列进行ClustalW排列