叶绿体DNA(cpDNA)研究与植物系统学

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一.叶绿体DNA(cpDNA)研究与植物系统学

1. 分子系统学研究中常用的标记

分子生物学技术的发展为植物育种提供了一种基于DNA变异的新型遗传标记——DNA分子标记,或简称分子标记。与传统应用的常规遗传标记相比,分子标记具有许多明显的优点,因而已被广泛应用于现代作物遗传育种研究的各个方面,大量以前无法进行的研究目前利用分子标记手段正蓬勃开展,并取得丰硕的成果。尤其是当分子标记技术走出实验室与常规育种紧密结合后,正在为植物的系统学研究带来一场新的变革。

目前用于植物系统进化、遗传多样性以及植物地理学研究的分子标记和方法有多种。总体来看可以分为4类,即:(1)蛋白质标记;(2)DNA序列分析;(3)DNA指纹分析;(4)DNA构象变化与SSCP 分析[1]。

DNA序列可以直接反映物种的基因型,并记录进化过程中发生的每一个变化,含有极为丰富的进化信息。依据DNA序列上的差异来比较植物的亲缘和演化关系,可以为植物系统与进化研究提供最直接的证据。当前用于研究的DNA序列主要分为两大类:叶绿体基因组(Chloroplast DNA,cpDNA)和核基因组(nuclear DNA,nDNA)本文采用的是叶绿体DNA(cpDNA)序列分析,故在此主要接介绍cpDNA序列分析。

2.cpDNA

叶绿体基因组(cpDNA)占植物总基因组DNA的10-20%,为双链

闭环结构,一般为120-220kb(多在120-160kb之间),被2个长约22-25kb的反向重复序列(IR)分成大拷贝区(LSc)和小两个单拷贝区(SSC)。

在过去二十年里,.植物系统学家们依据叶绿体DNA序列进行了大量的系统发育分析[2]。因为cpDNA具有一下优势:第一,叶绿体基因组在植物细胞中虽为多拷贝,但其序列都是一样的,便于操作[3];第二,叶绿体基因组是单亲遗传的,不存在核基因中出现的基因重组等问题;第三,由于叶绿体基因组序列的保守性,扩增叶绿体片段的引物是通用的;第四,非编码区的叶绿体DNA具有更多的信息位点,且测序的工作量不大,更适合于低等级类群的系统发育研究。尽管叶绿体基因在系统发育研究中有众多优点,但仍然存在不少缺点限制其使用[4]首先,相对缓慢的进化速率使得叶绿体基因序列在系统发育研究应用中局限于较高等级的类群;其次,由于是单亲遗传(在被子植物中是母系遗传),叶绿体DNA序列只能够推断杂交物种形成中的母系来源,比较适合于低等级类群的系统发育研究。如Araujol等(2003)利用2个叶绿体片段研究柑橘亚科12个属的系统进化关系[5]。Makarevitch等〔2003)使用cpDNA(trnL和trnL-trnF基因间隔区)和RAPDs对22种俄罗斯莺尾进行研究,认为其中16个种来自亚属Subgen.Limniris下亚组sect.Limniri[6]。

目前常用的片段有两种类型,即叶绿体基因的编码区和非编码区。由于进化速率不同,两种片段分别用于解决不同的系统学问题。

2.1.cpDNA编码区基因

1)rbcL

rbeL基因编码1,5—二磷酸核酮羧化酶/氧化酶大亚基,该酶催化光合作用中CO2的固定,由于该酶的重要性使成为研究的重点对象。rbcL基因在不同植物类群中的进化速率有着较大的差异,总体来说是比较保守的,主要用于远缘属间及科或科以上水平的系统重建。由于rbcL基因的结构、功能、进化速率特点,使其已经成为植物分子系统学较高等级间的关系研究中应用最普遍的基因之一。

Chase(l993)利用rbcL基因构建了种子植物的系统关系[7];APG (1998,2003)也主要是基于rbcL基因构建的[8]。Anderson(2005)利用rbcL基因对真双子叶(eudicots)的基本类群进行了分歧年代的估计,显示了该片段在系统学研究中的价值[9]。姬生国等(2008)利用叶绿体rbcL基因和psbA-trnH基因间区序列探讨石杉科植物的系统位置及石杉科部的分类关系[10]。

2)matK

matK基因位于叶绿体trnK基因的含子中,长约1550bp,是叶绿体基因组编码基因中进化较快的基因之一,大量用于科、属间、甚至种间的研究(Matsumoto et al., 1998; Conti et al., 1999; Xiang et al. 2002; Steane et al., 2003)[11] [12] [13] [14]。matK基因的进化速率约是rbcL基因的2~3倍。由于matK与rbcL基因不一样,其序列的变异比较均一[15](Jolmson&Soltis,1999),构树时不必加权就可得到可信的系统发育树。Hilu(1997)对matK基因的进化速率、模

式、碱基替代的类型进行了研究,阐明了matK在科以上水平的应用[16];他的研究还发现其3'端的序列对系统发育研究更有用;且当信息位点达到100个时,系统树拥有稳定的拓扑结构。

利用matK基因,Steaneetal.(2003)研究了Casu耐anaceae 科4属间、76种间的关系[17];Meng(2002)探讨了Saururaceae科属、种间的关系,表明了该片段的重要意义[18]。Wilson(2004)利用matK基因和trnK含子分析了46种莺尾属植物,其包含了所有的亚属和组,除了组Regelia、Brevituba和Manolepis[19]。

除rbcL、matK基因外,atpB、nahF、rpll6等多个叶绿体基因或片段都得到了广泛的应用。

2.2cpDNA非编码区序列

叶绿体基因的非编码区受到的选择压力小,其进化速率要比编码区快,常可用于较低分类阶元的系统学分析[20](Shaw et al.,2005)。

1)trnL-F

trnL-F非编码区由靠的比较近的两个非编码区,即trnL含子和trnL与trnF的基因间隔区构成[21](Taberietetal,1991),但是在实际的操作过程中,常把两个非编码区与其中间的trnL基因编码区作为一个整体片段)称为trnL-F非编码区来分析[22][23](Yi et al.,2004;应娟等,2004)trnL-F非编码区可用于探讨属间或亚属间[24](Wang&Liu, 2004)及种间[25](Stappen, 1999)的关系。

卫国等人(2002)对21种植物的cpDNA trnL-F间隔区序列的同源性进行了比较,探讨了桑树的起源和进化[26]。文蘅等人(2001)利用

相关文档
最新文档