分子系统学

合集下载

第四章、序列的同源比较及分子系统 学和分子进化分析1

第四章、序列的同源比较及分子系统 学和分子进化分析1

(ii) 氨基酸突变代价矩阵GCM (iii)疏水矩阵 (iv)PAM矩阵(Point Accepted Mutation) (v) BLOSUM矩阵 (Blocks Amino Acid Substitution Matrices)
2013-7-14 22
二、序列相似性比较基础知识
3、打分矩阵
直向同源( orthologous):不同种属的同源序列,是 基因复制的结果。如:α血红素和β血红素。 共生同源 (paralogous):同一种属的同源序列,是 物种行成的结果。如:人和鼠的α血红素。
2013-7-14 5
一、序列相似性比较简介
4、序列比较的基本操作是:比对(align) 是指这两条序列中各个字符的一种一一对应关系,
2013-7-14 23
二、序列相似性比较基础知识
3、打分矩阵 该矩阵是根据氨基酸残基替换前后疏水性的变化而 得到得分矩阵。若一次氨基酸替换疏水特性不发生太 大的变化,则这种替换得分高,否则替换得分低。
2013-7-14
24
二、序列相似性比较基础知识
3、打分矩阵
PAM 矩阵 是第一个广泛使用的最优矩阵,它是基于进化原理的,建立 在进化的点接受突变模型PAM(Point Accepted Mutation)基础 上,通过统计相似序列比对中的各种氨基酸替换发生率而得到该 矩阵。Dayhoff 和她的同事们研究了71 个相关蛋白质家族的1572 个突变,发现蛋白质家族中氨基酸的替换并不是随机的,由此, 断言一些氨基酸的替换比其他替换更容易发生,其主要原因是这 些替换不会对蛋白质的结构和功能产生太大的影响。如果氨基酸 的替换是随机的,那么,每一种可能的取代频率仅仅取决于不同 氨基酸出现的背景频率。然而,在相关蛋白中,存在取代频率大 大地倾向于那些不影响蛋白质功能的取代,换句话说,这些点突 2013-7-14 25 变已经被进化所接受。这意味着,在进化历程上,相关的蛋白质

分子进化和分子系统学(转载)

分子进化和分子系统学(转载)

分⼦进化和分⼦系统学(转载)分⼦进化和分⼦系统学12.1 概念 分⼦进化⼀词有两层含义。

从⽣命历史看,在前⽣命的化学进化阶段(细胞⽣命出现之前),进化主要表现在分⼦层次上,即表现在⽣物分⼦的起源和进化上。

换⾔之,从时序上说,分⼦进化是⽣物进化的初始阶段。

但从另⼀⾓度来看,在细胞⽣命出现之后,进化发⽣在⽣物分⼦、细胞、组织、器官、⽣物个体、种群等各个组织层次上,分⼦进化是⽣物分⼦层次上的进化。

换⾔之,从组织层次上说,分⼦进化是⽣物组织的基础层次的进化。

我们通常所说的分⼦进化就是指后者。

前者通常被称为前⽣命的化学(分⼦)进化。

⼀般⽽⾔,对⾃然现象的认识过程是从⼈类感官所及的层次开始,逐步向微观和宏观两个⽅向扩展。

向微观领域的探索往往出于寻找“深层原因”的动机。

对进化原因和进化机制的探索,最终必然深⼊到分⼦层次。

向宏观领域探索则是相反的过程,即⽤已知的低组织层次的知识去认识和解释⾼组织层次现象。

如今,科学家们发现,不同层次的现象遵循不同的规律和不同的法则。

低层次的规律并不完全适⽤于⾼层次,⽤⾼层次的规律解释低层次现象也往往⾏不通。

因此,本章讨论的分⼦进化规律和分⼦进化的理论基本上只适⽤于分⼦进化。

12.2 ⽣物⼤分⼦进化的特点 在⽣物⼤分⼦的层次上来观察进化改变时,我们看到的是⼀个很不同于表型进化的过程。

根据分⼦进化研究的权威之⼀⽊村(Kimura,1989)的总结,分⼦进化有两个显著特点,即进化速率相对恒定和进化的保守性。

1.⽣物⼤分⼦进化速率相对恒定 如果以核酸和蛋⽩质的⼀级结构的改变,即分⼦序列中的核苷酸或氨基酸的替换数作为进化改变量的测度,进化时间以年为单位,那么⽣物⼤分⼦随时间的改变(即分⼦进化速率)就像“物理学的振荡现象”⼀样,⼏乎是恒定的。

通过⽐较不同物种同类(同源的)⼤分⼦的⼀级结构,可以计算出该类分⼦的进化速率。

对于某类蛋⽩质分⼦或某个基因(或核酸序列)来说,其分⼦进化速率可表⽰为氨基酸或核苷酸的每个位点每年的替换数,即 上式中的K是分⼦进化速率(每个氨基酸位点每年的替换数);d是氨基酸或核苷酸替换数⽬;N是⼤分⼦结构单元(氨基酸或核苷酸)总数; t是所⽐较的⼤分⼦发⽣分异的时间, 2t代表进化时间,进化经历的时间是分异时间的2倍。

分子系统发生学

分子系统发生学

分子系统发生学
分子系统发生学(Molecular Phylogenetics)是通过比较生物大分子序列的差异来研究生物物种之间的进化关系的学科。

它利用分子生
物学技术,如 DNA 测序和蛋白质分析,来研究物种之间的遗传关系,并推断它们的进化历史。

分子系统发生学的基本原理是基于分子进化理论,即分子序列的
变化是逐渐发生的,并且这些变化是遵循一定的规律的。

通过比较不
同物种的分子序列,可以确定它们之间的遗传距离,并构建出进化树,从而推断它们的进化关系。

分子系统发生学在生物分类学、生态学、遗传学、生物保护等领域都有广泛的应用。

它可以帮助我们了解物种的起源、进化历史和分类关系,以及生物多样性的保护和利用。

分子系统发育分析的生物信息学方法

分子系统发育分析的生物信息学方法

分子系统发育分析的生物信息学方法一、概述分子系统发育分析的生物信息学方法,是生物信息学领域中的重要研究手段,其核心在于利用分子层面的数据揭示生物体之间的进化关系。

该方法主要通过对DNA或蛋白质的分子序列信息进行分析,计算序列间的相似性,从而估计基因分子进化的速率、基因间序列的分歧时间以及物种或基因在系统发育中的位置。

在分子系统发育分析中,生物信息学方法的应用不仅限于单条生物序列的进化信息提取,还涉及到多条生物序列之间的比对与关联分析。

通过比较不同物种间的基因序列,可以揭示它们之间的进化关系和亲缘关系。

生物信息学方法还可以利用数学模型和计算机程序,构建系统发育树,直观地展示物种之间的进化历程。

随着生物信息学技术的不断发展,分子系统发育分析的生物信息学方法也在不断更新和完善。

新的算法和工具不断涌现,使得我们能够更准确地分析生物序列数据,揭示生物进化的奥秘。

分子系统发育分析的生物信息学方法在生物学研究中具有广泛的应用前景和重要的实践价值。

本文将详细介绍分子系统发育分析的生物信息学方法,包括单条生物序列的进化信息提取、多条生物序列的比对与关联分析、系统发育树的构建等方面,并探讨这些方法在生物学研究中的应用和未来发展。

1. 分子系统发育学概述分子系统发育学,作为系统发育系统学的一个重要分支,致力于通过深入剖析生物大分子(如蛋白质、核酸等)的结构与功能,揭示生物各类群之间的谱系发生关系。

这一学科不仅涵盖了生物进化历程的宏观视角,更通过分子生物学技术和计算机技术的结合,深入到微观层面,从而为我们提供了生物演化的全新理解。

在分子系统发育学的研究中,基因或生物体的系统发育关系常常通过构建有根或无根的树状结构来展示。

这种树状结构不仅揭示了物种之间的亲缘关系,还为我们理解物种的进化历程和演化模式提供了关键线索。

通过多重序列比对,研究者可以分析一组相关基因或蛋白质,进而推断和评估不同基因间的进化关系,这包括分子进化(基因树)和物种进化(物种树)的研究。

厦门大学进化生物学第10章分子进化和分子系统学演示教学

厦门大学进化生物学第10章分子进化和分子系统学演示教学

1)蛋白水平上进化速率不均衡性 (保守性)的体现
不同蛋白一般进化速率不等
按系统来说,一般认为参与免疫反应及 受精过程的蛋白进化速率较快,而参与胚胎 发育的转录因子则进化速率较慢。如脊椎动 物的gamma-interferon蛋白和海胆的精子顶体 蛋白Bindin都是目前发现的进化速率最快的 蛋白成员。
1.中性突变理论的提出
◌ 1968年,日本遗传学家木村资生(Motoo Kimura)
在《Nature》杂志发表了“论分子水平上的进化 速率”的评述,根据不少核苷酸和氨基酸的置换 并不影响生物大分子的生物学功能的事实,提出 了生物进化在分子水平上的“中性理论”;
◌ 次年,美国学者金和朱克斯(J.K.King & T.H.
3.中性突变理论的主要论据
1)分子层次上的大多数变异是选择中性的; 2)蛋白质与核酸分子的进化速率高而且相对
恒定; 3)突变压在分子进化中的作用在最近的研究
中得到越来越多的证实; 4)按群体遗传学的数学模式计算出来的自然
选择代价过高,不符合实际情况。
跳页
a. 哑突变占优势; b. 在生物基因组中,非编码的DNA占绝大部
此外,还有研究暗示脑部特异表达的基 因在人的这一支中进化速率较快。
同一蛋白不同区域进化速度不等
2)核酸水平上进化速率不均衡性(保守 性)的体现
• DNA密码子中的同义替换比变义替换发生
的频率高;
• 内含子内的碱基替换速率明显高于外显子,
一般大致等同于或高于同义替换;
• 外显子内部一般编码区的进化速度快于非
序列计算的,往往比实际的小。
• 校正方法:氨基酸和核酸的校正方法存在
一定差异,且根据不同基因的蛋白序列 (或核酸序列)校正方法也不尽相同。

系统发育进化树作用-概述说明以及解释

系统发育进化树作用-概述说明以及解释

系统发育进化树作用-概述说明以及解释1.引言1.1 概述系统发育进化树是生物学领域一个重要的概念和工具。

它通过对物种之间的遗传关系和演化历史进行系统分析和分类,构建出一颗树状结构,用以揭示物种之间的进化关系。

这种树状结构可以帮助我们更好地理解物种之间的演化历史以及它们之间的亲缘关系。

系统发育进化树的构建方法经历了长期的发展和完善,目前主要包括分子系统学和形态系统学两种方法。

分子系统学通过比对物种之间的DNA 或蛋白质序列,来推断它们之间的遗传关系;而形态系统学则是通过对物种的形态、生理学特征等进行比较和分类。

这些方法的结合可以更准确地揭示物种之间的演化关系。

系统发育进化树在生物学领域有着广泛的应用,不仅可以帮助我们解答物种起源、分化等基础科学问题,还可以指导生物分类学、生物地理学等实际应用领域的研究。

因此,系统发育进化树的建立和应用具有重要的理论和实践价值。

1.2 文章结构本文将分为三个主要部分来探讨系统发育进化树的作用。

首先,我们将在引言部分对本文的内容进行概述,介绍系统发育的基本概念以及文章的目的。

接下来,在正文部分,我们将详细介绍系统发育和进化树的构建方法,以及系统发育进化树在生物学研究中的应用。

最后,在结论部分,我们将强调系统发育进化树的重要性,并展望未来其在科学研究中的发展前景。

通过以上结构的安排,我们希望读者能够更全面地了解系统发育进化树的作用及其在生物学领域的重要性。

1.3 目的在本文中,我们的主要目的是探讨系统发育进化树在生物学研究中的重要作用。

我们将首先介绍系统发育的概念,探讨进化树的构建方法,然后详细讨论系统发育进化树在生物学领域中的应用。

通过对这些内容的分析和探讨,我们旨在揭示系统发育进化树在生物学研究中的重要性,为今后更深入的研究提供参考和启示。

同时,我们也将展望未来系统发育进化树在生物学领域的发展潜力,希望能为相关研究提供一定的借鉴和指导。

最终,我们将对本文进行总结,强调系统发育进化树在生物学研究中的重要性和必要性。

地衣分类学与系统学

地衣分类学与系统学

地卷衣目(Peltigerales)
肺衣(Lobaria linita)
犬地卷 Peltigera canina
2. 子襄为茶渍型 (9) 茶渍目(Lecanorales) (10)鸡皮衣目(Pertusariales) (11)黄枝衣目(Teloschistales)
茶渍目(Lecanorales)
菊花石蕊 Cladonia bellidiflora
珊瑚枝属 Stereocaulon sp.
鳞石蕊 Cladonia squamosa
黄绿地图衣 (Rhizocarpon geographicum) 美味石耳 (Umbilicaria esculenta)
鸡皮衣目(Pertusariales)
3)核糖体DNA碱基序列包含着足够的遗传信息以利于生物 演化系统学分析。
4)而且,不同的生物细胞中核糖体的组分也被人们阐明得较 多;用于PCR扩增引物碱基顺序的资料也比较丰富,便 于选用。Fra bibliotek研究方法
获取地衣型真菌核糖体小亚基DNA序列(16s类rDNA)进 行系统学分析,有5种方法可供选用。【见讲义】
特征置于地衣分类学研究的首位,即按重要性顺序将特征 列为孢子(颜色、隔膜及数量)、子囊及侧丝、子实下层 、果壳及地衣体特征。
3. 化学显色法时期
19世纪60年代,尼兰德开创了化学显色法在地衣分类 鉴定中的应用。I、C、K的颜色反应。
此后Leighton(1866,1867)又发现了KC颜色反应法 。
槽梅衣 Parmelia sulcata
胶衣 (Collema coccophorum)
中华大叶梅 Parmotrema chinense
长松萝(Usnea longissima)

群体遗传学和分子生态学软件介绍

群体遗传学和分子生态学软件介绍

附录3分子生态学统计软件介绍分子生态学是研究生命系统与环境系统相互作用的分子基础与分子机理的崭新的分子生物学与生态学的交叉学科,是从基因、蛋白质、酶等生物分子活动规律来阐释生态规律进化、生态过程、适应和演变历程(Burke et al ,1992; Bachmann et al ,1994)。

这些研究通常会产生大量而复杂的分子数据,选择合适的统计方法对正确的解释科学现象是非常重要的。

以下就介绍几类常用的分子生态学软件。

3.1 遗传多样性与遗传结构分析软件遗传多样性是生物多样性的基础,丰富的遗传多样性可以提供很多宝贵的遗传资源。

因此为了对天然群体的遗传多样性研究,分子生态学专家开发出了一系列的评估软件,用于计算和检测生物群体基因变异的度量和遗传指标,其中用得比较广泛的有POPGENE 、STRUCTURES 、GENEPOP 、GenAlEx 6、NTSYSpc 、FSTAT 等。

POPGENE 是由Francis Yeh 等人开发的用共显性和显性标记来研究群体内和群体间的遗传多样性。

这个软件操作较简单,功能也比较全,主要包括计算广泛的遗传学数据如等位基因频率、遗传多样性、遗传距离、G -statistics 、F -statistics 等以及复杂的遗传学数据基因流、中性检测、连锁不平衡、多位点结构等。

新版本的POPGENE 还可用来分析数量遗传变异以及提供更高质量的系统聚类图。

POPGENE 下载地址:http://www.ualberta.ca/~fyeh/download.htmFSTAT 软件包是Jérôme Goudet 开发的用于计算共显性标记的遗传多样性和遗传分化参数。

主要功能如下:检测样本和总体水平上的基因频率,观察和期望基因型,等位基因数,基因丰富度;检测整体水平上以及每个样本或位点是否处于哈温平衡; Nei's (1987)的遗传多样性和遗传分化的估计值和 Weir & Cockerham (1984)每个等位基因,每个位点以及总体上的Capf (Fit), theta (F st )和smallf (F is)的估计值;检测R- statistics (Slatkin , 1995),5 将原始数据转化成Genepop 的格式等。

分子系统学

分子系统学

分子系统学Molecular Systematics课程代码:901060105学时数:36 学分数:2执笔人:刘彦群讨论参加人:秦利,石生林,夏润玺等审核人:杨瑞生一、教学目的分子系统学是近40年发展起来的应用生物化学及分子生物学技术解决进化生物学问题的一门综合性很强的交叉学科,是检测、描述并解释生物在分子水平的多样性及其演化规律的学科,在生命科学研究领域具有重要作用。

通过本课程的学习,掌握分子系统学的原理和方法,基本掌握如何利用分子系统学方法解决种群结构、分类学、系统发育和分子进化的问题,为生物科学研究奠定科学的研究方法。

本课程是蚕学专业选修课和公共选修课。

二、教学内容、教学目标及学时分配第一章概论(3学时)本章介绍分子系统学的概念、发展状况、基本原理、研究方法、研究内容、分子系统学的优缺点、动物主要类群的分子系统学研究概况、分子系统学研究中存在的主要问题和展望。

第二章分子系统学基础(6学时)本章主要介绍分子系统学的遗传和进化基础,重点掌握生物的分子组成、起源和系统学价值。

1. DNA及其基因组的组成、结构和进化2. RNA的组成、结构和进化3.蛋白质的组成、结构和进化4.小分子化合物及其生化进化5.分子进化6.表型进化的分子基础第三章分子系统学的研究程序(5学时)通过本章学习,掌握分子系统学研究的一般程序和方法,重点掌握分子系统学研究的原则。

1.确定研究类群和目标2.预试3.取样策略4.样品的收集、处理和保存5.结果记录、数据分析6.系统学解释第四章核酸的分子系统学方法(8学时)本章主要介绍核酸分子系统学方法与应用范围,包括DNA—DNA杂交法、RAPD、AFLP、RFLP、SSR、核酸序列分析方法,重点掌握各种方法的优缺点和适合范围。

1. RAPD标记技术的原理与应用2. AFLP标记技术的原理与应用3. SSR标记的原理与应用4.序列分析方法与应用:核基因、线粒体基因、叶绿体基因;功能基因、基因间隔区。

鱼类分类学研究的方法

鱼类分类学研究的方法

鱼类分类学研究的方法
鱼类分类学研究的方法主要包括形态学、遗传学和分子系统学。

1. 形态学:形态学研究是通过观察和描述鱼类的形态特征来分类和鉴定不同的物种。

这包括外部形态特征(如体型、鳞片形状、口部结构等)和内部解剖特征(如骨骼结构、内脏器官等)。

形态学的研究方法包括标本采集、组织切片、显微镜观察等。

2. 遗传学:遗传学研究是通过分析鱼类的遗传信息来研究它们之间的遗传关系和分类。

这包括基因型和表型等遗传数据的收集和分析。

遗传学的研究方法包括PCR扩增、DNA测序、核酸杂交等技术。

3. 分子系统学:分子系统学是使用分子生物学技术来研究和分析鱼类分类的方法。

主要是通过分析鱼类的DNA序列来研究种属间的亲缘关系和演化历史。

常用的分子系统学方法包括分子标记(如DNA条形码)和系统发育分析等。

分子系统学

分子系统学

分子系统学是指通过对生物大分子(蛋白质、榜酸等)的结构、功能等的进化研究,来阐明生物各类群(包括已绝灭的生物类群)间的谱系发生关系[ .相对于经典的形态系统分类研究,由于生物大分子本身就是遗传信息的载体,含有庞大的信息量,且趋同效应弱,因而其结论更具可比性和客观性.尤为重要的是,一些缺乏形态性状的生物类群(如微生物和某些低等动、植物)中,它几乎成为探讨其系统演化关系的唯一手段.由于分子系统学的上述特点,自其诞生之日起,就逐渐在各种生物类群的系统发生研究中得到了广泛的应用.总的说来,迄今分子系统学的研究所获得的生物类群间亲缘关系的结果,大多都和经典的形态系统树相吻合.但是,在一些生物进化谱系不明或模糊关键环节上,它得出的结果却往往和形态系统学的推测大相径庭.1 分子系统学研究的一般步骤分子系统学研究的主要方法是根据分子生物学数据构建生物类群的谱系发生树.它一般包括以下程序:首先确定所要分析的生物类群,选择该类群中相关亚类群的一些代表种类;确定所要分析的目的生物大分子(包括DNA序列、蛋白质序列等)或它们的组合;设法获得它们的序列数据或其它相关数据(如限制性内切酶(I LP)、随机扩增多态DNA( )、DNA序列等),DNA序列的数据可以通过GenBank获得,也可以通过实验室的研究(设计特异引物进行PCR扩增和序列测定)而获得;对获得的相关数据进行比对(pairwisealignment)或其它的数学处理,如转变成遗传距离数据矩阵;通过一些遗传分析软件(常用的计算机软件如:PHYLIP J、PAI J、MEGA[ J等)对这些处理后的数据,并基于一定的反映DNA序列进化规律的数学模型构建分子系统树;对构建的系统树做相应的数学统计分析以检验系统树的可靠性等.值得注意的是,在分析具体的研究对象时,上述各个环节是紧密联系的一个整体,要获得一个正确的结论,必须综合考虑每一环节之间的内在联系.比如目的基因的选择、数据处理和分析的分类群之间、构树方法和分析软件的选择之间都有密切的联系.2 分子系统学研究中涉及到的几个重要议题2.1 基因树和物种树分子系统学的目的就是通过基因树来推测物种树.基因树是根据生物大分子的序列数据(主要为DNA序列数据)构建的谱系树,物种树则是反映物种实际种系发生的谱系树.人们期待着得到的基因树和物种树相一致,然而实际情况往往并非如此.Nei(1987)描绘了二种谱系树之间所有可能的关系,认为二种谱系树之间至少存在二个方面的差异:一是基因树的分化时间早于物种树,二是基因树的拓扑结构可能与物种树不一致(二个或多个基因树之间存在着差异)[77,如何将由多个基因或基因组建立的基因树综合成一个物种树,是分子系统学面临的一个主要难题.Mad dison(1997)认为:基因重复所导致的并源而非直源关系的产生,不同生物类群问基因的水平转移,系统演化分歧事件发生后产生的分子性状的多型性引起的谱系选择等生物学因素是造成二者不一致的主要原因[8].相应地,分子系统学研究中一定要选择直源基因而非并源基因,选择水平转移事件较少的树,采用基于大量独立进化的基因位点进行分析等等,都不失为一种行之有效的方法,更有利于获得一个可靠的树.2.2 分类群的选择分子系统学研究中如何选择所研究的对象——内类群的选择是一个非常值得注意的问题.内类群选择(内类群的数目及选择依据等)的科学性与否直接影响到所得结论的可靠性.关于内类群的数目,目前大多数分子系统学家认为,当所分析的序列长度一定时,尽量选择较多的分类群有助于获得更准确的结论,加j.而内类群选择的依据主要体现在:(1)结合古生物学,形态学等各方面证据,尽量保证所选择的分类群确为一个单系发生的类群;(2)分类群的选择并非是随机的,尽量使其在所研究的生物类群中具有代表性;(3)在某些因具有明显长枝效应(或短枝效应)而导致的系统关系不确定的分支间增加分类群有助于减弱或消除这种效应[91.另外,在构建分子系统树中,同样需要选择外类群以确定系统发生树的基部位置,从而确定进化的方向.外类群的选择可以是单个(单一外类群),也可以是多个(复合外类群).在所研究的内类群数目不多且二者之间的极性关系十分确定的情况下,单个外类群足以说明问题.而在较为复杂的分析中,通常选择复合外类群以保证所得结论的可靠性[11].随机选择的外类群,极有可能因为亲缘关系较远,导致所得结果的不确定性增大.因此,在选择外类群时,必须结合其它分类学上的证据,或者在做详细的系统发育研究之前,首先对所研究的内、外群的关系进行初步探讨,以便于选择较为理想的外类群.最理想的外类群应该是该内群的姐妹群,因为二者间拥有较多的共近裔性状.2.3 目的基因的选择分子系统学研究中目的基因的选择也是一个至关重要的问题.一般来说,要根据所研究的具体分类群选择适宜的基因:在高级分类阶元(科级以上)间的系统发生分析中,选择一些在进化中较为保守的基因或基因片段(如核编码的蛋白质(酶)基因、核糖体基因(18S rRNA基因、28S rRNA基因)等);在较低级的分类阶元间,可以选择进化速率较快的基因或基因片断(如某些核编码基因的内含子或转录间隔区(I TS)以及一些细胞器基因(线粒体基因和叶绿体基因)等).当然,每一个具体的研究对象,可以选择的基因数目可以是多个的,至于哪些是最有效的,这通常要依据具体情况做比较分析后才能得出结论.条件允许的话,可以作多基因或多基因组合分析后寻求一致树来加以解决.有时针对某些涉及到多种层次分类阶元的复杂分类群时,还可以采取组合分析的方法:即推断位于系统树基部的深层次的谱系发生时,运用较保守的基因作为目的基因;推断位于系统树中段的谱系发生时,采用进化速率较为适中的基因;在系统树顶端的终端分类单元时,采用进化速率较快的基因.这样可以在不同阶层的演化关系中都获得可信的结果[ ].2.4 基因序列数据的比对选择了适宜的目的基因并通过基因的扩增(PCR技术)和序列测定后,就获得了各个目标生物类群的DNA序列数据,对所获得的同源DNA序列进行比对是分析中的关键环节.所谓比对是指通过插入间隔(gaps)的方法,使不同长度的序列对齐达到长度一致,并确保序列中的同源位点都排列在同一位置.其中间隔的处理对后续的系统学分析有明显的影响[ ,:4].序列比对目前通常基于以下二种原理:点标(dot plot)法和记分距阵(scoring ma仃ix)法[15].对于分类群数目较少且序列较短的对位排列,用肉眼判断,手工排序就能完成.但随着序列数目和长度的增加,即多序列对位排列(multiple sequence alignment)的l难度随之增大.因而计算机程序已成为多序列比对必不可少的工具,CLUSTAL系列软件[ ]是目前较为常用的排序程序.当然,软件自动排序的结果不可避免地会出现一些偏差,在此情况下,肉眼辨别和基于某些序列结构特征(如rRNA基因的二级结构等)的手工校正成为一种重要的补充手段.另外处理某些得失位点(indels)和多次替换位点是排序中一个十分棘手的事情,此时往往需要借助个人积累的经验和相应的数学方法、设计统计学模式以估算发生多次替换的数目而加以修正.2.5 基因树的构建方法目前,构建基因树的方法很多,常用的主要有二大类:即距离法(distance method)、和具体性状法(dis—crete character method).前者是将序列数据转变成数据(遗传距离)矩阵,然后通过此数据矩阵构建系统树;后者直接分析序列上每个核苷酸位点所提供的信息构建系统树,它又包括最大简约法(MP)和最大似然法( )以及由ML法延伸的贝叶斯法(Bayesian metl-,od).2.5.1 距离法:该方法基于这样一种假设,即只要获得一组同源序列间的进化距离(遗传距离),那么就可以重建这些序列的进化历史.距离法中以邻接法(NJ)最为常用.NJ法是由Saitou和Nei(1987)提出,其原理是逐步寻找新的近邻种类(序列),使最终生成的分子树的遗传距离总长度为最小[17].该法虽并不检验所有可能的拓扑结构,但在每阶段诸物种(序列)聚合时都要应用最小进化原理,故而被认为是ME的一种简化方法.由于分析程序大大简化,费时较少,适于分析较大的数据集,目前已成为距离法分析中最通用的一种方法.NJ法不包含速率一致的假设,通过采用“校正”距离矩阵来减少各分支速率的影响,因而系统树的正确与否依赖于校正距离系数的准确性.当序列较短时,计算仍可能有较大的统计误差.NJ 法由于仅限于数据矩阵的统计值,相对于后述的具体位点的分析方法,其最大优势是运算十分简便而快捷.但是该法的不足之处是,由于不考虑各个位点的具体情况而丢失了一些有用的遗传信息,另外,通过这一方法得出的枝长估算值不具有确定的进化意义.2.5.2 最大简约法该方法源于形态学的分支系统学研究,而最早被Fitch(1971)用于核苷酸数据研究.它是一种最优化标准,遵循“奥卡姆剃刀(Ockharn’S razor)原理,即假设由一祖先位点替换为另一位点时,发生的替换数目最少的事件为最可能发生的事件[18].在实际应用中,由于MP法只考虑所谓的“信息位点”,所得的进化树是最短的、也是变化最少的进化树.因而,简约法的“最小核苷酸替换数目”原则也意味着“异源同型事件(homoplastic event)(即平行替换、趋同替换、同时替换和回复突变等)最少.就序列上的位点来说,它没有明确的假设,无须估计核苷酸替换时所用的各种数学模型,且当序列问的分化程度较小、序列长度较大且核苷酸替换率较稳定的情况下,该法能获得更为真实的拓扑结构[19].反之,当序列较短且序列间的进化速率差异较大或替换形式不同时,异源同型事件出现的概率就大,产生所谓的“长枝吸引”或“短枝吸引”效应,而得出错误的拓扑结构.另外,由于MP法需要比较大量的拓扑结构,当序列数目和长度较大时,运算过程非常耗时.2.5.3 最大似然法该法最早由Felsenstein(1981)提出,其原理是以一个特定的替代模型分析一组既定的序列数据,使获得的每一个拓扑结构的似然率均为最大,再挑出似然率值最大的拓扑结构作为最终树[ .这里所分析的参数是每个拓扑结构的枝长,并对似然率的最大值来估算枝长.迄今的研究表明,在分类群数目较大、序列长度较长的复杂分析中,ML法的分析结果优于其它任何方法[15].但由于该法涉及到全部序列的所有核苷酸位点的替换数,加之假设的替换模型包含一组可变参数(如转换/颠换比等).所以该法和MP法一样,当序列数目和长度较大时,构建NIL树是极其耗时的,同时当序列数目足够大而序列长度很小时,和MP 法一样,它也容易给出错误的拓扑结构.。

分子系统生物学中的代谢通路研究

分子系统生物学中的代谢通路研究

分子系统生物学中的代谢通路研究代谢是生命活动的重要过程,其中许多的代谢路径都是由众多的生化反应组成的。

这些反应之间的相互转化还需要大量的底物、酶以及其他生物分子的参与。

分子系统生物学是一种研究代谢通路的方法,通过对代谢通路中各个组成部分的分子及其相互作用网络和调节机制进行系统的分析和描述,可以深入研究代谢通路的功能和调控机制,有望为代谢疾病的治疗和预防提供有力支撑。

代谢通路是细胞中一个十分重要的过程,涉及到许多生化反应,包括氧化、酸化、脱羧、加羟、脱酰基等等。

这些反应之间的相互作用关系非常复杂,需要一种系统性的深入分析方法才能够得到深入的描述和分析。

分子系统生物学正是一种应用数学、物理、计算机等多学科的手段,重点研究代谢途径中的相互作用网络、信号传递及调节机制,并通过建立代谢途径的数学模型、动力学模拟和虚拟实验等手段,对代谢过程的功能及调节机制进行全面而深入的探讨。

在分子系统生物学中,代谢通路的研究涉及到代谢物、反应酶、亚细胞结构及其组成等多个层面的研究。

首先是对代谢通路中各个反应的基础数据的整理与收集,包括反应底物、反应产物、反应酶、反应中介物等等,这些信息对于建立代谢通路数学模型非常重要。

其次,这些反应之间通过物质及能量传递进行相互作用,因此对反应物之间的结构、空间分布以及反应速率等参数进行描述和提取也是重要的一环。

此外,由于代谢通路还受到基因表达及调控的影响,因此在分子系统生物学中也需要对该途径所依赖的相关分子和调控机制进行深入的研究和探究。

目前分子系统生物学在代谢通路研究中的应用越来越多。

在基础研究方面,通过对生物体内不同代谢通路中基本分子间相互作用关系的分析,可以更好地理解代谢途径的功能机制,同时也有助于对代谢疾病的发生机理以及治疗方法进行深入的研究。

此外,在药物研发方面,分子系统生物学的理论模型可以预测药物对代谢通路的影响,并选择较好的药物治疗代谢疾病,以此为目标研究代谢途径的变化和调控机制,从而为疾病治疗和预防开辟新的研究方向和手段。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分子系统学分子系统学是指通过对生物大分子(蛋白质、核酸等)的结构、功能等的进化研究,来阐明生物各类群(包括已绝灭的生物类群)间的谱系发生关系.相对于经典的形态系统分类研究,由于生物大分子本身就是遗传信息的载体,含有庞大的信息量,且趋同效应弱,因而其结论更具可比性和客观性.尤为重要的是,一些缺乏形态性状的生物类群(如微生物和某些低等动、植物)中,它几乎成为探讨其系统演化关系的唯一手段.由于分子系统学的上述特点,自其诞生之日起,就逐渐在各种生物类群的系统发生研究中得到了广泛的应用.总的说来,迄今分子系统学的研究所获得的生物类群间亲缘关系的结果,大多都和经典的形态系统树相吻合.但是,在一些生物进化谱系不明或模糊关键环节上,它得出的结果却往往和形态系统学的推测大相径庭.1研究步骤分子系统学研究的主要方法是根据分子生物学数据构建生物类群的谱系发生树.它一般包括以下程序:1.首先确定所要分析的生物类群,选择该类群中相关亚类群的一些代表种类;确定所要分析的目的生物大分子(包括DNA序列、蛋白质序列等)或它们的组合;2.设法获得它们的序列数据或其它相关数据(如限制性内切酶(I LP)、随机扩增多态DNA( )、DNA序列等),DNA序列的数据可以通过GenBank获得,也可以通过实验室的研究(设计特异引物进行PCR扩增和序列测定)而获得;3.对获得的相关数据进行比对(pairwisealignment)或其它的数学处理,如转变成遗传距离数据矩阵;通过一些遗传分析软件(常用的计算机软件如:PHYLIP J、PAI J、MEGA[J 等)对这些处理后的数据,并基于一定的反映DNA序列进化规律的数学模型构建分子系统树;4对构建的系统树做相应的数学统计分析以检验系统树的可靠性等.值得注意的是,在分析具体的研究对象时,上述各个环节是紧密联系的一个整体,要获得一个正确的结论,必须综合考虑每一环节之间的内在联系.比如目的基因的选择、数据处理和分析的分类群之间、构树方法和分析软件的选择之间都有密切的联系.2涉及议题基因树和物种树分子系统学的目的就是通过基因树来推测物种树.基因树是根据生物大分子的序列数据(主要为DNA序列数据)构建的谱系树,物种树则是反映物种实际种系发生的谱系树.人们期待着得到的基因树和物种树相一致,然而实际情况往往并非如此.Nei(1987)描绘了二种谱系树之间所有可能的关系,认为二种谱系树之间至少存在二个方面的差异:一是基因树的分化时间早于物种树,二是基因树的拓扑结构可能与物种树不一致(二个或多个基因树之间存在着差异)如何将由多个基因或基因组建立的基因树综合成一个物种树,是分子系统学面临的一个主要难题.Maddison(1997)认为:基因重复所导致的并源而非直源关系的产生,不同生物类群问基因的水平转移,系统演化分歧事件发生后产生的分子性状的多型性引起的谱系选择等生物学因素是造成二者不一致的主要原因.相应地,分子系统学研究中一定要选择直源基因而非并源基因,选择水平转移事件较少的树,采用基于大量独立进化的基因位点进行分析等等,都不失为一种行之有效的方法,更有利于获得一个可靠的树.分类群的选择分子系统学研究中如何选择所研究的对象——内类群的选择是一个非常值得注意的问题.内类群选择(内类群的数目及选择依据等)的科学性与否直接影响到所得结论的可靠性.关于内类群的数目,目前大多数分子系统学家认为,当所分析的序列长度一定时,尽量选择较多的分类群有助于获得更准确的结论,而内类群选择的依据主要体现在:(1)结合古生物学,形态学等各方面证据,尽量保证所选择的分类群确为一个单系发生的类群;(2)分类群的选择并非是随机的,尽量使其在所研究的生物类群中具有代表性;(3)在某些因具有明显长枝效应(或短枝效应)而导致的系统关系不确定的分支间增加分类群有助于减弱或消除这种效应.另外,在构建分子系统树中,同样需要选择外类群以确定系统发生树的基部位置,从而确定进化的方向.外类群的选择可以是单个(单一外类群),也可以是多个(复合外类群).在所研究的内类群数目不多且二者之间的极性关系十分确定的情况下,单个外类群足以说明问题.而在较为复杂的分析中,通常选择复合外类群以保证所得结论的可靠性[11].随机选择的外类群,极有可能因为亲缘关系较远,导致所得结果的不确定性增大.因此,在选择外类群时,必须结合其它分类学上的证据,或者在做详细的系统发育研究之前,首先对所研究的内、外群的关系进行初步探讨,以便于选择较为理想的外类群.最理想的外类群应该是该内群的姐妹群,因为二者间拥有较多的共近裔性状.目的基因的选择分子系统学研究中目的基因的选择也是一个至关重要的问题.一般来说,要根据所研究的具体分类群选择适宜的基因:在高级分类阶元(科级以上)间的系统发生分析中,选择一些在进化中较为保守的基因或基因片段(如核编码的蛋白质(酶)基因、核糖体基因(18S rRNA基因、28S rRNA基因)等);在较低级的分类阶元间,可以选择进化速率较快的基因或基因片断(如某些核编码基因的内含子或转录间隔区(ITS)以及一些细胞器基因(线粒体基因和叶绿体基因)等).当然,每一个具体的研究对象,可以选择的基因数目可以是多个的,至于哪些是最有效的,这通常要依据具体情况做比较分析后才能得出结论.条件允许的话,可以作多基因或多基因组合分析后寻求一致树来加以解决.有时针对某些涉及到多种层次分类阶元的复杂分类群时,还可以采取组合分析的方法:即推断位于系统树基部的深层次的谱系发生时,运用较保守的基因作为目的基因;推断位于系统树中段的谱系发生时,采用进化速率较为适中的基因;在系统树顶端的终端分类单元时,采用进化速率较快的基因.这样可以在不同阶层的演化关系中都获得可信的结果.基因序列数据的比对选择了适宜的目的基因并通过基因的扩增(PCR技术)和序列测定后,就获得了各个目标生物类群的DNA序列数据,对所获得的同源DNA序列进行比对是分析中的关键环节.所谓比对是指通过插入间隔(gaps)的方法,使不同长度的序列对齐达到长度一致,并确保序列中的同源位点都排列在同一位置.其中间隔的处理对后续的系统学分析有明显的影响.序列比对目前通常基于以下二种原理:点标(dot plot)法和记分距阵(scoring ma仃ix)法.基因树的构建方法目前,构建基因树的方法很多,常用的主要有二大类:距离法(distancemethod):是将序列数据转变成数据(遗传距离)矩阵,然后通过此数据矩阵构建系统树、具体性状法(dis—cretecharacter method):直接分析序列上每个核苷酸位点所提供的信息构建系统树,它又包括最大简约法(MP)和最大似然法以及由ML法延伸的贝叶斯法(Bayesianmetl-,od).距离法该方法基于这样一种假设,即只要获得一组同源序列间的进化距离(遗传距离),那么就可以重建这些序列的进化历史.距离法中以邻接法(NJ)最为常用.邻接法是由Saitou和Nei(1987)提出,其原理是逐步寻找新的近邻种类(序列),使最终生成的分子树的遗传距离总长度为最小.该法虽并不检验所有可能的拓扑结构,但在每阶段诸物种(序列)聚合时都要应用最小进化原理,故而被认为是ME的一种简化方法.最大简约法该方法源于形态学的分支系统学研究,而最早被Fitch(1971)用于核苷酸数据研究.它是一种最优化标准,遵循“奥卡姆剃刀(Ockharn’S razor)原理,即假设由一祖先位点替换为另一位点时,发生的替换数目最少的事件为最可能发生的事件.在实际应用中,由于MP法只考虑所谓的“信息位点”,所得的进化树是最短的、也是变化最少的进化树.因而,简约法的“最小核苷酸替换数目”原则也意味着“异源同型事件(homoplastic event)(即平行替换、趋同替换、同时替换和回复突变等)最少.最大似然法该法最早由Felsenstein(1981)提出,其原理是以一个特定的替代模型分析一组既定的序列数据,使获得的每一个拓扑结构的似然率均为最大,再挑出似然率值最大的拓扑结构作为最终树这里所分析的参数是每个拓扑结构的枝长,并对似然率的最大值来估算枝长.迄今的研究表明,在分类群数目较大、序列长度较长的复杂分析中,ML法的分析结果优于其它任何方法。

名词解释:系统发生树:(英文:phylogenetic tree或evolutionary tree)是表明被认为具有共同祖先的各物种相互间演化关系的树,又被译作系统发育树、系统演化树、系统进化树、种系发生树、演化树、进化树、系统树。

它用来表示系统发生研究的结果,用它描述物种之间的进化关系。

基因树:表示一组基因或一组DNA顺序进化关系的系统发生树。

和进化树相似,揭示各基因的亲缘关系远近。

“长枝吸引”(长枝效应):是指在用系统发育分析方法分析一个有限数据集时, 由于高频率的相似变化(如趋同、平行进化)和加速的进化速率等因素的存在使序列达到相同状态而人为地将这些不是来自于共同祖先的序列的代表分类元聚在一起, 使这些分类元之间相互“吸引”。

因此, 在进行系统发育分析时, 应尽可能避免“长枝吸引”假象的产生, 从而构建出可靠的系统发育树。

短枝效应:基因同源性:许多不同的物种间都具有同源性。

现代分子生物学中的同源性描述的是基因与基因之间相似关系,它表明的是两个相比较的序列之间的匹配程度。

一般来说,如果两条基因序列相似性达80%,就可以把它们称为“同源基因(homologousgene)”。

为了便于研究,Fitch又把同源基因分为直向同源基因、横向同源基因和异源同源基因直向同源基因(orthologous gene):又译为“垂直同源基因”、“正同源基因” 或“定向进化同源基因”、“直系同源基因”,是指从同一祖先垂直进化而来的基因。

或者说,一个祖先物种分化产生两种新物种,那么这两种新物种共同具有的由这个祖先物种继承下来的基因就称为直向同源基因。

直向同源基因通常是编码生命必需的酶、辅酶或关键性的调控蛋白的基因,具有功能保守,进化缓慢,变化速度可覆盖整个进化历史,且序列变化速度与进化距离相当等特征。

横向同源基因(paralogous gene):又译为“旁系同源基因”、“并系同源基因”或“平行进化同源基因”,是指由于基因重复而产生的同源基因例如人γ一珠蛋白基因和β一珠蛋白基因。

基因重复后,进化选择压力变小、其中一条基因丢失或发生沉默都是促使横向同源基因分化产生新特性或新功能的原因。

然而,虽然某些横向同源基因转录区序列相似度不高,但它们的操纵子却仍然具有较高的保守度异源同源基因(xenologous gene):是由于基因在不同物种间的横向转移(horizontal transfer)而产生的。

相关文档
最新文档