拟南芥及水稻转录因子MADS密码子的偏好性比较
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
浙江大学学报(农业与生命科学版)
31(5):513~517,2005Journal of Zhejiang U niversity (Agric 1&Life Sci 1)
文章编号:100829209(2005)0520513205
收稿日期:2005201229
基金项目:国家自然科学基金(39870421);浙江省重点研究项目基金(2003C22007);浙江省“04206"工程水稻品种改良项目.
作者简介:李娟(1979—
),女,山东省济南人,从事基因组学方面的研究.通讯作者:薛庆中,男,教授,博士生导师,从事植物遗传育种,基因组学方面的研究.E 2mail :qzhxue @hot .
拟南芥及水稻转录因子MADS 密码子的偏好性比较
李娟1,薛庆中1,2
(1.浙江大学沃森基因组科学院,浙江杭州310008;21浙江大学农学系,浙江杭州310029)
摘 要:大多数与花发育相关的功能基因属于MADS 基因家族.应用CodonW 的因子分析表明,拟南芥MADS 转录因子家族偏好使用A 、U 结尾的密码子,而水稻MADS 转录因子家族偏好使用G 、C 结尾的密码子.同时通过氨基酸序列的多重比对,表明密码子偏好性与氨基酸序列及二级结构之间存在关联,证实了不同的密码子编码的氨基酸位于蛋白质二级结构的特定位置.关 键 词:水稻;拟南芥;密码子偏性;转录因子;AU 含量中图分类号:S511 文献标识码:A
L I J uan 1,XU E Qing 2zhong 1,2(1.J ones D.W atson I nstitute of Genome Science ,Zhej iang Universit y ,H angz hou 310008,China ;2.Dept of A g ronom y ,Zhej iang Universit y ,H angz hou 310029,China )
Comparison of MADS transcriptional factor on codon bias in arabidopsis and rice.Journal of Zhejiang University (Agric 1&Life Sci 1),2005,31(5):5132517
Abstract :Most of the flower development 2related f unctional genes are belong to MADS transcription factors families.Through the factorial correspondence analysis (FCA )of CodonW ,we can find out that MADS transcriptional factors in Arabidopsis prefer to A 2ending and U 2ending codons ,while that in rice prefer to G 2ending and C 2ending codons.By using the ClustalX for searching the relation between the bias of the codons and second structure of the MADS ,we confirm that the amino acids coding by different codons are on the special position of the second structure of the proteins.K ey w ords :rice ;arabidopsis ;codon usage bias ;transcriptional factors ;AU content
转录因子是指那些专一性地结合于DNA
特定序列上,能激活或/和抑制其它基因转录的蛋白质.根据DNA 结合功能域结构,他们主要分为:b HL H (碱基性螺旋2环2螺旋)、bZIP (碱性亮氨酸拉链)、homeodomain 蛋白、MADS 2box 蛋白、zinc 2finger 蛋白、Myb 蛋白、A P2/EREBP 蛋白、HSF 蛋白、HM G 蛋白和A T hook 蛋白等[1]. 植物MADS 基因是一个序列特异的调节
基因家族.和其他真核生物转录因子一样
MADS 蛋白由MADS (M )、Intervening (I )、Keratin 2like (K )和C 2terminal (C )等结构域组成,属于结构域蛋白.大多数花发育相关功能基因属于MADS 因子家族[2,3],被子植物的大部分MADS 基因参与花发育的调控[4].不仅在花器官原基分化期表达,在植物其它部位也有表达,且某些MADS 2box 在烟草花粉发育全过程中持续表达[5].同时,MADS 2box 基因家族还
浙江大学学报(农业与生命科学版)
可能与雄性不育和育性恢复有关[6].因此, MADS2box基因对于高等植物花的发育具有重要意义.
植物基因中不同密码子的出现频率明显不同,同一种氨基酸的不同密码子比率也有差异.禾本科作物基因中同义密码子使用偏性的形成与转录相关突变和翻译水平上的选择有关[7].密码子的使用还与基因编码结构和功能及基因表达有密切的联系[8].但有关转录因子密码子使用及其与基因功能的关系却鲜有报道.本文分别对拟南芥和水稻MADS核苷酸CDS序列密码子偏性及其ORF产物水平进行比较分析,并对MADS的氨基酸序列进行多重比对,试图阐明MADS转录因子家族的密码子用法特点,为进一步研究密码子偏性与氨基酸序列的关系提供信息.
1 材料与方法
1.1 序列数据
由()网站下载得到拟南芥转录因子MADS的CDS序列107条(2004年12月9日).由(http://ricetfdb.bio. uni2potsdam.de/)网站下载得到水稻转录因子MADS的CDS序列68条(2004年12月12日).为计算密码子的平均相对性,及分析数据的精确性,我们利用PERL程序在这两个数据中随机提取注释较好的编码序列进行分析.然后用DNAstar中的Editseq软件对拟南芥和水稻的CDS序列进行整理,寻找ORF序列,按照Editseq的参数,翻译成氨基酸序列,统计各个MADS的CDS序列中A、U、G、C含量.
1.2 密码子使用频率的计算
为避免序列中不同氨基酸含量所造成的偏差,按照Chiapello的方法计算59个密码子中的每种同义密码子的相对使用频率.若某氨基酸在DNA序列中出现N次,并且两个同义密码子1和2分别出现A和B次,则其相对频率分别是A/N和B/N.
1.3 因子相关性分析(FCA)
为检验序列之间密码子使用上的不同,用CodonW软件对随机的编码序列FCA分析产生密码子偏性使用的相关数据.利用行列所建立的图形同时对基因及转录因子两组数据进行分析,比较他们在多维空间的位置.
用PERL程序对所得数据分类整理,并用Excel对整理后的数据作散点图分析.分别从拟南芥和水稻Edit seq翻译得到的氨基酸序列中随机取得10条序列,用ClustalX程序做多序列比对.
2 结果与分析
2.1 拟南芥和水稻中MADS转录因子的密码子碱基组成
拟南芥和水稻转录因子MADS的编码序列中密码子第1、第2和第3各个位点的AU 含量列于表1.由表1可见,在拟南芥中,A、U 含量顺序由大到小分别为第2(6514%)、第3 (5513%)和第1(5119%).而水稻中,却为第2 (5815%)、第1(4113%)和第3(2915%).这两种作物中,密码子第2位A、U含量均为最高,所不同的是A、U最低含量,拟南芥出现在第1位置,而水稻中却是第3位置.同时从总体上比较,拟南芥MADS转录因子家族A、U平均含量(5715%)高于水稻(4311%).
由表2可知,水稻的MADS转录因子较偏好使用G、C结尾的密码子,如:GCC、U GC、GA G、AUC、CUC、CC G和GU G等.拟南芥的MADS转录因子较偏好使用A、U结尾的密码
表1 拟南芥和水稻中MADS转录因子密码子位点的AU含量
Table1 AU composition at each position of codons of arabidopsis and rice MADS transcriptional factors 生物序列数第1位点第2位点第3位点平均Arabidopsis1075119%6514%5513%57140% Rice684113%5815%2915%43108%
注:密码子第1、第2和第3位置的A、U含量是由PERL程序计算得出.而总体上A、U含量是由DANstar统计得到.
415第31卷