植物分子系统发育与进化的理解和认识
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
植物分子系统发育与进化的理解和认识摘要:由于dna测序和pcr等分子技术的普及,植物系统学研究已经从单一的形态学研究转向通过分子手段或形态学与分子相结合探讨其进化机制。
作者结合有关文献阐述谈谈对植物分子系统发育与进化的理解和认识。
关键词:植物分子系统发育与进化系统发生树
自达尔文进化论问世以来,植物分类进入一个崭新的阶段——系统发育时期。
化石保存的不完整性使由化石记录推导出的谱系树缺乏中间环节,利用现存物种的比较形态学、比较细胞学、蛋白质免疫和比较生理学等途径的研究大致填补了化石谱系树的空缺,但分类单元何时与最近祖先分歧等细节性问题含糊不清。
直到30年前,形态性状在进化和系统学研究中仍然占统治地位,但形态性状易受环境影响,普遍存在趋同和平行进化现象,使许多分类群的进化地位难以确定。
而dna序列则不同,它直接反映物种的基因型,并记录进化过程中发生的每一件事,含有极丰富的进化信息。
依据dna序列上的差异比较植物的亲缘和演化关系,可以为植物系统进化研究提供最直接的证据。
本文介绍分子进化研究中系统发生树重建和分子进化的若干基础理论问题。
1.系统发生与系统发生树
系统发生是指一群有机体发生或进化的历史。
利用dna序列进行发育分析就是推断并评价分子水平的进化关系,并用分支图表现
出来,这种图就是系统发生树,简称系统树。
系统发生树是描述一群有机体发生或进化顺序的拓扑结构。
根据系统发生树的具体表达形式,可分为物种(或种群)树与基因树。
无论是物种(或种群)树还是基因树,都用树一样的拓扑结构表示,其中将已标明最近共祖分类单元所在位置的树称为有根树,将最近共祖分类单元所在位置未知的树称为无根树。
有根树的根节点为全部分类单元最近共同祖先,它反映了分类单元间的进化关系,而无根树仅反映分类单元间的分类关系。
无根树可通过加入外类群或利用分子钟理论、dna 不可逆取代模型推导的方法转化为有根树。
2.分子系统发生树的重建
在现代分子进化研究中,根据现有生物基因或物种多样性重建生物的进化史是非常重要的问题。
国内有些学者将利用现有生物的形态或分子生物学数据推断系统发生的过程称为系统发生树的构建,也有学者认为应称为重建。
目前,利用分子生物学数据重建系统发生树的方法很多。
在重建时,对不同类型的数据应采用不同的重建方法。
利用现代分子生物学技术获得的生物多样性的信息,可大致分为以下两大类:
(1)离散特征数据。
即获得的两个或更多的离散的值,它是赋给某一具体的运筹分类单位的,可进一步分为二态特征与多态特征。
前者的离散特征只有两种可能的状况,即具有与不具有某特征项,通常用“0”或“1”表示,如限制性酶切位点、rapd数据等。
后者的离散特征具有三个或更多的可能状态,如核酸的序列信息,就某一位点来说,组成核苷酸的碱基具有a、t、g或c四种可能。
(2)相似性和距离数据。
它并不是某一具体分类单元所具有的,而是用彼此间的相似性或距离表示的各分类单位间的相互关系,如免疫学方法与dna杂交得到的只有分类单元间相似性信息。
3.系统发生树的可靠性
在系统发生推断中,统计分析的系统误差和随机误差均影响所建树的可靠性。
对随机误差的影响,常采用一定的统计检验分析获得的系统发生树的可靠性。
一种是利用某一参量来对所获得的树及其相近树进行结构差异检验。
在ml法中常利用似然值,在最小进化法中则利用所有支的总长度。
这种方法是一种保守检验方法,检验的程序非常复杂,需要很大的计算机内存。
另一种是分析每个内支可靠性,其中常用的方法有:
(1)标准误估计,即计算内支长度及其标准误,检验内支长度与0间的偏差,得到一个置信概率(简称cp),cp值越高,支的长度就越可靠。
通常,当cp≥0.95或0.99时,可认为该支的长度在统计上有效。
(2)自举检验是一种重抽样技术,可用来估计在取样分布不知道或难以分析得到的情况下内支与统计有关的变异性。
通过自举检验,可得到一个自举置信水平(简称bcl)。
计算机模拟已表明当bcl>0.9时,cp值与bcl值非常相近。
与自举检验相近的另一种重
抽样方法是弃半复制检验。
有研究表明,在研究的核苷酸数量较少的情况下,即使cp或bcl值达到95%,获得的结果仍然不十分可信。
因此,在研究中应从不同的基因中尽可能分析较多数量的核苷酸,特别在研究不同生物间进化关系时,因为不同基因遭受的进化压力不同。
此外,衰退/支持指数和t-ptp检验等方法亦可用来分析所得系统发生树的可靠性。
通常用来降低系统误差对系统发生分析影响,增加所建树可靠性的方法有:①重新考虑分析时的假定,变换分析方法;②除去树中的长支,因为树中有许多长支,会使分析中的误差复杂化;③去除不可靠的数据;④对某些特征或某一特征状态进行加权等。
4.结语
从系统发育生物学的角度看,基因组学的丰富数据既包括了大量序列信息,又蕴藏着有关重复基因、dna片段缺失/插入、转座子丢失/插入等信息,为系统发育研究提供了丰富的资料,使利用大规模基因组水平的数据进行系统发育分析成为可能。
系统发育基因组学是利用基因组水平的海量数据信息进行系统发育分析的新兴
学科,它是后基因组时代的产物,也是未来进化生物学研究的重要趋势之一。
目前利用dna测序及分子标记等分子生物学手段进行植物分子系统学研究已经十分普遍。
分子数据是独立于形态学性状的数据,易于获取和分析,且排除了主观因素,能有效地弥补形态分类学研
究的不足。
参考文献
[1]boore jl.the use of genome-level characters for phylogenetic reconstruction.trends in ecology & evolution,2006,21:439-446.
[2]cummings m p,otto s p,wakeley j.sampling properties of dna sequence data in phylogenetic analysis.molecular biology and evolution,1995,12:814-822.
[3]fritsch,p.phylogeny and biogeography of the flowering plant genus styrax(styracaceae)based on chloroplast dna restriction sites and dna sequences of the internal transcribed spacer region.molecular phylogenetics and evolution,2001,19(3):387-408.。