火炬松DREB1基因的电子克隆与生物信息学分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第8卷第1期2010年3月生物信息学
China Journal of B i oinf or matics Vol 18No 11Mar .,2010
火炬松DREB 1基因的电子克隆与生物信息学分析
林元震
1,2
,郭海3,黄少伟
1,2
,刘纯鑫
1,2
,刘天颐
1.2
,陈晓阳
1,23
(1.华南农业大学林学院,广州510642;2.华南农业大学热带亚热带林业生物技术实验室,广州510642;
3.水利部水土保持植物中心,北京100038)
摘要:利用来自Forest Tree DB 数据库中热胁迫c DNA 文库ESTs 聚类、拼接组装的Unigene 以及基因G O 注释,得到了假定的火炬松DR EB 1基因,全长1293bp,具有完整的蛋白编码框的c DNA 序列。

采用DNAMAN 软件分析碱基组成、限制酶切位点和重复序列等,结果发现,该序列与其他物种中克隆得到的DRE B1具有较高的同源性,初步断定所电子克隆得到的c DNA 序列为火炬松DRE B1基因(Ptea DRE B1)。

在此基础上,利用网上的公共数据库和相关软件(Anthep r ot 等)对PteaDRE B1编码的理化性质和一级结构进行分析,并模拟了其二级结构和三级结构。

结果表明,该蛋白为疏水性非球形可溶蛋白,含有295个氨基酸,分子量为32.4k D,等电点为8.22;其二级结构以螺旋和卷曲为主,三级结构具有DRE B 蛋白家族中典型的结合DNA 的
AP2结构域。

这进一步说明所克隆到的c DNA 片断为火炬松DRE B1基因。

上述研究结果可为Ptea DRE B1基因下一步的分子
克隆、功能鉴定和应用奠定基础,具有一定的现实意义和应用前景。

关键词:火炬松;DR EB 1基因;电子克隆;生物信息学;蛋白结构预测
中图分类号:Q517 文献标识码:A 文章编号:1672-5565(2010)-01-043-04
收稿日期:2008-10-21;修回日期:2009-02-27.基金项目:广东省自然科学基金重点项目(7118123)。

作者简介:林元震,男,汉族,福建人,博士,讲师,E mail:yzhlin@scau .edu .cn .3通讯作者:陈晓阳,男,汉族,四川人,博士生导师,E mail:xychen@scau .edu .cn .
In silico clon i n g and b i o i n for ma ti cs ana lysis of DR EB 1gene from P i n us teada
L IN Yuan 2zhen
1,2
,G UO Hai 3,HUANG Shao 2wei 1,2,L IU Chun 2xin
1,2
,L IU Tian 2yi 1.2,CHE N Xiao 2yang
1,23
(1.College of Forestry,South China A gricultural U niversity,Guangzhou 510642,China;
2.L aboratory for B iotechnology in Tropical &subtropical Forest Science,South China A gricultural U niversity,Guangzhou 510642,China;
3.P lant M aterials for Soil and W ater Conservation,M inistry of W ater Resources,B eijing 100038,China )
Abstract:Based on the results of gene asse mbly and gene annotati on of ESTs fr om heat induced cDNA library in the ForestTree DB thr ough p r ogra m C AP3and s oft w are Am iGo,putative Pinus DR EB 1gene of a 1293bp -length c DNA sequence with an full ORF was obtained .The basic compositi on,the restricti on enzy me sites and the repeat frag ments of PteaDR EB 1gene were analyzed .It was f ound that P teaDREB 1gene encoded 421a m ino acids with MW 32.4k D and P I 8.22.The gene shared high si m ilarity with other p lant DRE B1genes,indicating that P teaDREB 1m ight be a ne w me mber of DREB 1fa m ily .On this base,thr ough public database such as CPHmodel and related s oft w ares,the p ri m ary structure of the p r otein PteaDREB 1such as physical and che m ical characterizati on was analyzed,and then the secondary and tertiary structure was emulated .The results showed that the p r otein encoded by PteaDREB 1m ight be hydr ophilic and not a gl obular with s ome flexible domains,its N -ter m inus p resented a basic a m ino acid -rich nuclear l ocali 2zati on signal .The secondary structure are mainly Helix and Coli and part of which tertiary structure containeda classical DNA -combi 2ning domain AP2,si m ilar t o DRE B p r oteins fa m ily .The above results may p lay an i m portant r ole in the further research f or is olatii on,identificati on and app licati on of PteaDREB 1gene .
Key W ords:Pinus teada ;P teaDREB 1;in silico cl oning;bi oinfor matics;p r otein structure p redicti on
转录因子DRE B (Dehydrati on Res ponsive Ele 2
ment B inding )通过结合下游基因启动子中的CRT/DRE 元件(C -repeat/Dehydrati on Res ponsive Ele 2ment ),在不依赖于ABA 的信号转导途径中发挥重
要作用[1]。

L iu 等[2]
发现转CBF 基因拟南芥耐寒能力较野生型植株有明显提高;之后,人们逐渐认识到
转录因子在改良植物抗逆能力中的潜在价值[3]。

研究人员采用酵母杂交法、图位克隆法、c DNA 差示分析法、RACE 以及伴随生物学数据累积出现的电子克隆法,从不同的植物中克隆各种转录因子基因。

DREB 基因家族的克隆、功能鉴定是当前植物抗逆分子机制和农林作物遗传改良的研究热点,具有重要的理论和实践价值。

电子克隆(in silico cloning )是近年来伴随着基
生 物 信 息 学第8卷
因组计划和EST计划发展起来的基因克隆新方法,
其主要原理是利用生物信息学技术,借助电子计算
机的巨大运算能力,通过EST或基因组的序列组装
和拼接,再利用RT-PCR快速获得功能基因。

该方
法的最大特点是整个克隆过程只需要一台与网络连
通的计算机,而无须传统实验室的任何工作。

电子
克隆具有投入低、速度快、针对性强等优点,特别是
其与实验手段结合,可以达到事半功倍的效果。


着人类、拟南芥、水稻、杨树等基因组计划的实施,已
有研究人员利用电子克隆的方法从人类、水稻、杨树
中克隆了一些功能基因[4-6]。

采用电子克隆的方法,结合火炬松热胁迫c D2
NA文库EST序列的CAP3组装结果,以及G O注释
分析,选择了具有DNA结合特性、核定位信息、转录
因子活性等特点的一个Unigene,做进一步的分析,
包括基因的一般特征以及其编码蛋白一级、二级、三
级结构的预测,为后续该基因的分子功能研究提供
一些借鉴。

1 材料与方法
1.1 电子克隆的原始种子序列的获得
利用火炬松热胁迫c DNA文库EST序列拼接、
G O注释的结果,选择目的序列。

1.2 电子克隆结果的验证
选择所得的假定火炬松DR EB1基因,以DNA2
MAN预测其蛋白编码框,验证该基因是否为全长基
因;选择假定火炬松DR EB1基因,运用B lastn2.0程
序搜索NCB I的nr数据库[6],验证该基因是否为未
被登录过的新基因。

1.3 一级结构预测
利用软件Anthep r ot分析火炬松DR EB1编码的
蛋白的分子量、等电点等基本性质以及转膜区、信号肽和Pr osite等结构域信息[7]。

1.4 二级结构预测
ANT HE W I
N5.0软件包含有二级结构预测功能,预测方法有:G OR I、Gibrat、Double Predicti on Method(DP M)、Homol ogue等四种方法,对P teaD2 R EB1进行上述方法的二级结构预测,并进行相关数据统计[7]。

1.5 三级结构预测
利用CPHmodel预测该转录因子的三维结构。

CPHmodel是丹麦理工大学生物序列分析中心的预测服务器提供的三级结构预测,其方法是基于同源模建,与S W I SS-MODE L相比,它简单易学,只需要目的序列,没有高级选项,如提交自定义的模板等。

将目的序列提交后,可随即得到结果,不会出现无搜索结果的情况[8]。

结果用MOLMOL显示完整三级结构示意图。

2 结果与分析
2.1 电子克隆的原始种子序列的获得
根据火炬松热胁迫c DNA文库EST聚类、拼接及G O注释的结果,发现HEAT1-Contig-h1a-119 (见表1),这条序列具有核定位、转录因子活性、DNA结合特性等特点,表明该基因可能是一个转录因子。

因此,选择该序列作为目的序列进行下一步的研究。

表1 HE AT1-Contig-h1a-119的G O注释Table1G O annotati on of HE AT1-Contig-h1a-119
Ter m Ont ol ogy Evidence A ssigned by
nucleus
cellular
component
I C
W ith G O:
0003700
TI GR
(via T A I R) DNA binding
molecular
functi on
T AS
TI GR
(via T A I R) transcri p ti on
fact or
activity
molecular
functi on
I SS T A I R
transcri p ti on
fact or
activity
molecular
functi on
I SS
W ith TI GR A th1:
A t1g78080
TI GR
(via T A I R) regulati on of
transcri p ti on,
DNA-dependent
bi ol ogical
p r ocess
RCA
W ith I nterPr o:
I PR001471
TI GR
(via T A I R) 2.2 目的序列的基本特征
HE AT12Contig2h1a2119序列长1293bp,利用DNAMAN预测该片段的可能编码框如图1,发现在六种可能的读码方式中,Plus3含有完整的阅读框(ORF),具有起始密码子ATG和终止密码子T AA,故该片段为一条全长基因,命名为P teaDR EB1。

图1 Ptea DREB1编码框预测
Fig.1ORF p redicti on of the cDNA seg ment
该基因的序列和编码框如图2。

PteaDREB1基因编码295个氨基酸,分子量为32.4k D,等电点p I为8.22。

编码的氨基酸序列中(图2),丝氨酸含量最高,达13.9%,Leu含量其次(为12. 88%),A la和Gln含量居第三(8.81%),含量最低的是Tr p(1.02%),进一步分析发现非极性(疏水)氨基
44
第1期林元震,等:火炬松DR EB 1基因的电子克隆与生物信息学分析酸含量为39.0%,极性(亲水)氨基酸含量为61.0%,极性(亲水)氨基酸含量明显高于非极性的,由此可见,所编码的蛋白为亲水性蛋白。

另外,PteaDREB 1编码的氨基酸序列中含有5个Cys,分别位于第203、231、243、255和277位氨基酸(图2),说明PteaDREB 1编码产物中可能含有二硫键,这也许对维持其结构稳
定及功能行使具有重要意义。

图2 PteaDR EB 1基因和编码蛋白的序列
Fig .2The sequences of PteaDR EB 1gene and am ino acids
B last 结果表明,P teaDR EB 1序列所编码的氨基
酸序列与龙须菜(A sparagus officina lis ,ABB89754)、构树(B roussonetia papyrifera ,ABB89755)、麻疯树(Jatropha cu rcas ,AAZ14831)、拟南芥(A rabidopsis thaliana ,NP _177931)、显花蕙兰(Cym bidium insig 2ne ,ABR53728)、陆地棉(Gossypium hirsutum ,AAZ41376)以及毛果杨(Populus trichocarpa ,ABQ62984)等同源性分别为63%、63%、61%、50%、49%、49%和45%(图3),而且未检索到其他松树类同源基因,说明P teaDR EB 1可能是松树DREB 家族的第一个成员。

此外,P teaDR EB 1序列编码的蛋白存在DREB 的典型结构域AP2,而且隶属于AP2家族,这表明所得到的c DNA 序列可能是火炬松DRE B 基因(图4)。

2.3 一级结构分析
Anthep r ot 预测Ptea DRE B1中的信号肽序列,如
图5所示,发现N 端83~87处ARAQP 片段为潜在
的信号肽断裂位点。

另外,丹麦理工大学生物序列分析中心的预测软件SingalI P 预测结果也与An 2thep r ot 分析结果一致。

N 端信号肽的存在,对于Ptea DRE B1作为一个转录因子是必要的。

结构位点(Pr osite )分析结果显示PsG6P DH 中存在9种结构位点:6个N -糖基化位点,1
个蛋白
图3 火炬松PteaDR EB 1基因编码蛋白的B last 分析
Fig .3B last analysis of Ptea DREB1p r otein of P .
teada
图4 火炬松PteaDR EB 1基因编码蛋白保守区域的B last 分析
Fig .4B last analysis of conserved domain in the PteaDREB1p r otein
of P .teada
激酶C 磷酸化位点,5个酪蛋白激酶Ⅱ磷酸化位点,
5个N -十四酰化位点,1个信号肽酶位点,6个膜脂蛋白脂附着位点,1个半胱氨酸蛋白酶活性位点,1个MYC 类型bHLH 结构域和2个Myb 类型DNA 结合结构域。

信号肽酶位点、bHLH 结构域和DNA 结合结构域的存在,为Ptea DREB1属于转录因子进一步提供了证据。

另外,蛋白激酶位点,表明Ptea D 2REB1行使生理生化功能前或者与其他蛋白互作时可能需要磷酸化的活化。

图5 Ptea DREB1蛋白信号肽预测结果
Fig .5The potential signal peptide in Ptea DRE B1predicted by Anthepr ot
2.4 二级结构的预测
在Anthep r ot 软件菜单中选择methods/Seconda 2ry structure p redicti on 选项,采用G OR 、Gibrat 、Homo 2l ogue 、DP M 等4种算法预测转录因子Ptea DREB1的二级结构,不同方法预测的二级结构不尽相同。

4种预测结果进行统计分析,α螺旋的比例均在35%~55%,而β折叠均在20%以下,转角的比例也相对较小,在20%以下。

其中Gibrat 方法预测的结果虽没有转角,但α螺旋的比例较高,可达55%。

2.5 三级结构的预测
搜索结果显示,Ptea DREB1的氨基酸105~165
5
4
生 物 信 息 学第8卷
部分与拟南芥CBF1中的AP2(P DB 编号1GCC )高度相似,同源性达66.7%。

根据同源建模原理,只要目标蛋白与模板蛋白的同源性大于30%,即可进行三级结构的同源模建。

因此,对Ptea DRE B1的氨基酸105~165部分进行同源结构模拟,模拟结果如图6,N 和C 端附近分别形成β折叠区和α螺旋区,β折叠区有3个β折叠,α螺旋区有5个α螺旋。

这是典型的AP2结构域。

3 讨论
近年来,随着基因组计划和功能基因组以及蛋白组学的不断发展,在世界三大数据库(NCB I,EB I,DDBJ )中登记的数据越来越多,但分离和克隆新基因仍是当前分子生物学的重点,而且是研究基因结构、功能以及表达调控的基础。

分离和克隆基因的经典方法是差减杂交、mRNA 差异显示(DDRT )或c DNA 末端快速扩增(RACE ),这些方法虽然曾成功运用于一些基因的分离,但费时费力、费用高、成功率低,而且在当今海量的数据里,难以得到广泛运用。

电子克隆是在基因组计划和EST 计划基础上发展起来的基因克隆新方法,具有成本低、速度快、技术要求低和针对性强等优点。

目前松树EST 数据非常丰富,而且EST 数目每天还在高速增加,利用电子克隆分离松树基因已经成为可能,并将极大加速松树新基因的发现和功能鉴定研究。

图6 用CPHmodels 预测的蛋白质三级结构
Fig .6Tertiary structures p redicted by CPHmodels
火炬松是世界南方松中分布最广、生长面积最
大、木材年产量最高和蓄积量最大的绿化、造林用速生树种,也被我国广泛引种,但其耐热性较差,严重限制其在南方尤其是广东和海南的推广范围。

目前,利用常规育种手段培养耐热性火炬松新品种未见有成功报道,究其原因,可能是常规育种技术定向改良或培育高抗性林木难度比较大,而且时间长。

但随着植物基因工程技术的不断成熟和完善,已为林木抗逆性改良提供了一个新途径。

而可用林木遗
传转化的外源基因的匮乏,是这些年林木基因工程发展缓慢的一个原因,因此,极有必要扩大植物抗逆性基因资源,尤其是从高大林木中分离出目的基因。

本研究结果表明,Ptea DRE B1编码蛋白具有AP2典型结构域,该蛋白序列区域与其它植物DREB 高度保守,而且存在信号肽酶位点、bHLH 结构域和DNA
结合结构域[2]
,为Ptea DRE B1属于转录因子进一步提供了佐证。

同时,AP2典型结构域高度保守性,也为后续RNA i 研究验证功能提供了靶序列。

P teaD 2R EB 1基因的电子克隆与生物信息学分析,除了可研究其在火炬松各组织器官及其高温等逆境胁迫下的表达状况,了解其在火炬松抗逆境中的表达调控模式和作用机理外,还可以通过操作P teaDR EB 1基因,研究其在植物生长发育中的作用,尤其是在耐高温等逆境能力形成过程中的网络调控作用,并可为今后借助基因工程技术提高植物抗热性,培育农林作物抗热新品种的分子育种工作奠定基础。

4 结论
从火炬松热胁迫c DNA 文库中筛选到了一个DREB1基因P teaDR EB 1,该基因编码295个氨基酸,分子量为32.4k D ,等电点为8.22。

编码蛋白为疏水性非球形可溶蛋白,其二级结构以螺旋和卷曲为主,三级结构具有AP2典型结构域。

关于P teaD 2R EB 1基因的分子克隆和功能鉴定有待于进一步的实验和研究。

参考文献(References ):
[1] 邓江明,简令成.植物抗冻机理研究新进展:抗冻基因表达
及其功能[J ].植物学通报,2001,18(5):521-530.[2] 刘强,张贵友,陈受宜.植物转录因子的结构与调控作用[J ].
科学通报,2000,45(14):65-74.[3] L iu Q K M ,Sakuma Y,Abe H,et al .T wo transcri p ti on fact ors,
DREB1and DRE B2,with an EREBP /AP2DNA binding domain
separate t w o cellular signal transducti on pathways in dr ought and l ow temperature res ponsive gene exp ressi on,res pectively,in A ra 2bidop sis[J ].Plant Cell,1998,10(8):1391-1406.[4] 黄骥,王建飞,张红生,等.水稻葡萄糖-6-磷酸脱氢酶c DNA
的电子克隆[J ].遗传学报,2002,29(11):1012-1016.[5] 林元震,张志毅,林善枝,等.运用基因组和EST 数据库进行电
子克隆分离杨树功能基因的策略[J ].分子植物育种,2007a,5
(4):583-587.
[6] 林元震,张志毅,刘纯鑫,等.甜杨抗冻转录因子I CE1基因的
分子克隆及其结构分析[J ].分子植物育种,2007b,5(3):
424-430.
[7] Zhang J,Madden T L.Power BLAST:A ne w net w ork BLAST app li 2
cati on f or interactive or aut omated sequence analysis and annota 2ti on[J ].Genome Res,1997,7:649-656.
[8] 林元震.甜杨葡萄糖-6-磷酸脱氢酶的基因克隆及结构分析
与功能鉴定[D ],北京:北京林业大学,2006.[9] Lund O,N ielsen M ,Lundegaard C,et al .CPHmodels 2.0:X3M a
Computer Pr ogra m t o Extract 3D Models [C ].Abstract at the CASP5conference,California,US A,2002,A102.
64。

相关文档
最新文档