浅谈系统发育分析方法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2、现有的系统发 育分析方 法的分

(1) 距 离法_】I该方 法的基本思想是 首 先需 要根据某种进化模型计算所有对象 间 的 进 化 距 离 ,然 后 根 据 不 同 的 算 法 ,从 进 化 距 离 最 短 的 开 始 依 次 聚 类 ,利 用 距 离 方阵计算 出最优 树 ,或将分支长度之和 最 小化 ,获得最优树 。距 离矩阵 的计算是构 建 系统 发育树的基 础 ,序 列之 间的距离计 算是 关键。现 有的计算方法 中基本都使用 了多序  ̄ilபைடு நூலகம்:l-,对 ,计算速度慢 成为一大技术 瓶 颈 。再 有在 此 类方 法 中每 完成 一次 聚 类 ,已聚 类的物种 将被看 成一个 新物种 , 需 要重 新 计算 新物 种 跟其 他物 种 间的 距 离 。因此 ,在系统发 育树 的重建过程 中,需 要不断地调 整距离矩阵 ,增加 了时 间复杂 度 。
DOI 10.3969/j.issn.1001-8972.2010.24.008
基金 项 目 :湖 南 省 教 育 厅 资 助 科研 项 目 (1 0C025 7)
浅 谈 系 统 发 育分 析 方 法
杨 沽 湖南信息职 业技 术学院 4 7 0200
生 物物 种 的 多样 性 的价 值 越 来 越 被人 们 所 认 识 与利 用。生 物 多样 性 的原 因是 生物 进 化 的 过 程 中 ,物 种和 物 种 之 间 、物 种 和 无 机 环境 之 问 共 同进 化 形 成 的 结 果 。对 生 物 进 行 系统 发 育 分析 可 以发现 它 们之 间 的 亲 缘 关 系 及进 化过 程 ,使 我 们 对 其 的 利 用 更 具针 对 性 。重 建 生物 类 群 的 系统 发育 树 已 经 成 为生物 信 息 学 中一 个 十 分 重要 的研 究 内 容 , 并 日益 受 到 广 泛 的 关 注 。本 文综 述 了系统 发育 分析 的各 种 研 究方 法 以及 生 物 信 息 学 在 其 中 的应 用 ,并对 生 物 信 息 学 中 所 采 用 的研 究 生物 进 化 关 系的 方 法进 行 了 比 较 , 分 析 了其 在 生 物 信 息 学 的 发展 趋 势 。
1、系统 发 育 学 及 其产 生背 景
系 统 发 育 学 研 究 的 是 进 化 关 系 , 系 统发育分析就是要推断或者评估这些进化 关 系 。通 过 系 统 发 育分 析 所 推 断 出 来 的 进 化 关 系 一 般 用 分 枝 图表 (系统 发 育树 )来 描 述 ,这 个 系 统 发 育 树 就 描 述 了 同 一 谱 系 的进化关系 ,包括 了分子进化 (基因树 )、 物 种 进 化 以 及 分 子 进 化 和 物 种 进 化 的 综 合 。在现 代系统 发育学研究 中,研究的重 点 已经 不 再 是 生 物 的 形 态 学 特 征 或 者 其 他 特 性 ,而 是 生 物 大 分 子 尤 其 是 序 列 。随 着
分 子 生 物 学 技 术 的 发 展 以 及 生 物 分 子 数 据 的 积累 ,系统发 育分析进 入 了分 子层次 。 分子 系统发 育分 析中常用的生物大分子是 作 为生 命机 器的蛋白质和作为遗传物质的 核酸 。早期 的研 究工作主要是 利用不同物 种 中同一种 基因 /蛋 白质序列 的异 同重建 系统 发育树 ,并研 究各物种 的进化关 系 。 近年来 ,较多模式生 物基 因组测序 任务的 完 成 以 及 蛋 白质 组 学 的发 展 ,为 从 “组 ”水 平 进 行 系 统 发 育 研 究 提 供 了条 件 ,但 同 时也对现有的 系统发 育分析 方法提 出了挑 战 。
l§I曩 ◇ 0≮ ◇≮器 毒羹 一
系统 发育 分析 ; 分 子进 化 ; 序 列 比 对
引言
地 球上 的一 切生 命形 式 ,不 管是 现 存 的还 是 已 经 灭 绝 了的 ,都 由于 一 个 共 同 的进化 历史而有着不 同程度的关联 ,这种 关联也使研究物种之 间进化关 系的学科一 系统 发育学 变得非常有意 义。追溯 生物 界 不同生物类型的起源及进化关系 ,即重 建 生 物 类 群 的 系 统 发 育 树 已经 成 为 生 物 信 息 学中一个十分重要的研究内容 ,并 日益受 到 广 泛 的 关 注 。
(2) 基 于 最 优 原 则 的 方 法 I:I 基 于 最 优原则的方法从数学 角度讲就 是在 评价 树 的 最 优 标 准 的 基 础 上 ,找 到 使 得 目标 函 数 最 优 的 树 。 目前 最 常 用 两 种 基 于 最 优 原 则 的 方 法 有 最 大 简 约 标 准 (m a x i m U m P a r sim OnY, 简 称 M P)和 最 大 似 然 (maximum likelihood,简称 ML)标准 。 虽 然 每 种 最 优 原 则 都 有 不 尽 相 同 之 处 , 但是不论是基于最大 简约标准 的方法还是 基于 最 大似 然标 准 的方 法 ,它们 构建 系 统 发 育 树 的 最 根 本 的 思 路 是 相 同 的 , 即 首 先 找 出 由 对 象 形 成 的 所 有 可 能 的 树 ,
然后利 用最优标 准对每一 个树进 行评价 , 给每个树赋予一 个分值 ,最后将具有最好 分值的树作 为最优 树。但是 n个对象可以 有 可 能 的 系统 发 育 树 ,所 以 当 对 象 数 目超 过 l0时 ,在 目前计算机所 能够 容忍的时 间 和空 间内不 能够 对每一棵 系统 发育树都 一 一 做评 估。但是在分子数据大量积 累的今 天 ,往往所 处理的 数据量又是 非常大 的。 并 且 ,现在 已经证 明了构建 n个对象的最 大 简约树和最大似然树 都是 NP难问题131。
相关文档
最新文档