第四章 分子进化分析

合集下载
相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.2.3 最大似然法(ML)
最大似然法(maximum likelihood,ML) ML对 系统发育问题进行了彻底搜查。ML期望能够 搜寻出一种进化模型(包括对进化树本身进 行搜索),使得这个模型所能产生的数据与 观察到的数据最相似.
进化模型可能只是简单地假定所有核苷酸(或 AA)之间相互转变的概率相同,程序会把所有 可能的核苷酸轮流置于进化树的内部节点上, 并且计算每个这样的序列产生实际数据的可能 性(比如两个姊妹群都有核苷酸A,那么如果 假定原先的核苷酸C得到现在的A的可能性比起 假定原先就是A的可能性要小得多),所有可 能性的几率被加总,产生一个特定位点的似然 值,然后这个数据集的所有比对位点的似然值 的加和就是整个进化树的似然值。
PHYLIP安装
分析程序
帮助文件
Exe 文 件 夹 内 容
5.2.2 Phylip软件包的应用
1.根据你的分析数据,选择适当的程序 如,你分析的是DNA数据,就在核酸序列分 析类中选择程序(dnapenny,dnapars, dnamove,dnaml,dnamlk,dnainvar, dnadist,dnacomp )如果分析的是离散数据, 如突变位点数据,就在离散字符组里面选择 程序。
外类群
姊妹群
Monophyletic group(单系类群)
eukaryote eukaryote eukaryote
Monophyletic group
1.1.3系统(发育)树
有根树(rooted tree)和无根树(unrooted tree):以外类 群作为树根的系统树为有根树,没有外类群作为树根的系统树为 无根树
1.1.1 同源性与同源性状
同源------具有共同祖先 同源性状:1. 它们与这些物种的祖先类群中所发现的某个性状相同 2.它们是具有祖先-后裔关系的不同性状 同源性:分子进化研究中,两核苷酸序列之间或AA序列之间的相似程 度 直系同源(orthologs): 同源的基因是由于共同的祖先基因进化 而产生的,可能具有相同的功能。 旁系同源(paralogs): 同源的基因是由于基因复制产生的,可能 具有不同的功能。 这两个概念代表了两个不同的进化事件,而用于分子进化分析中 的序列必须是直系同源的,才能真实反映进化过程。
点击选择保存过 的CLUSTAL或 DNAman(GCG) 比对文件
对应DNAman 的GDE格式
选择相应 的格式
把比对结果 转换为*.meg 的格式
保存
查看*.mega文件 最后行是否正常, 为了保证各比对 序列的长度相等
保存到指定 文件夹
点击
可选择要分析的 序列,可对序列名 称进行编辑
基因树(gene tree)和物种树(species tree): 基因树由来自各个物种的一个基因所构建的系统树,物 种树则表达了某一特定类群的进化路径.代表一个物种 或群体进化历史 两方面的差异:1.从两个不同的物种中获取的两个同 类基因,其分化可能早于物种的分化
2.基因树的拓扑结构可能与物种树不一致,因为两个 或多个基因树之间很可能存在不一致之处 拓扑(Topology)是将各种物体的位置表示成抽象位置。 拓扑不关心事物的细节也不在乎什么相互的比例关系,只 将讨论范围内的事物之间的相互关系表示出来,将这些事 物之间的关系通过图表示出来。
设两个已聚合过的类群OTUp和OTUq中分别包含了np 和nq原始类群,再将OTUp和OTUq聚合后组成的OTUr 与其他OTUi间的距离dr,用下式计算:
d2
np nq 2 2 d d + = p,i r,i np + n q np+ nq q,i
例:设4个类群的对称半角距离矩阵如下
OTU1 0 OTU2 OTU3 OTU4 0.15 0 0.20 0.35 0.18 0.28 0 0.22 0
1.3 由蛋白质序列构建进化树
对于一个完整的进化树分析首先需要对所分析的 多序列目标进行排列(align sequences)。
最经常使用的有Clustalx和Clustalw (Dos),
1.3.1 CLUSALX软件的应用
载入序列可以 识别记事本格 式(*.TXT), 序列名称前必 须用”〉”标定
首先,根据最小距离值0.15(对角线元素除外),将OTU1和 OTU2聚为OTUr1,OTUr1与OTU3间的距离分别为: d2r1,3=1/2d21,3+1/2d22,3=1/2(0.20)2+1/2(0.18)2=0.03632 计算获得dr1,3=0.19,同理,dr1,4=0.32
OTUr1 OTU3 OTU4 0 0.19 0 0.32 0.22 0
外类群(outgroup):不包含在内类群中又与之有一定关系的类 群,为了比较内类群中各成员的特征差异.
姊妹群(sister group):与某一类群在谱系关系上最为密切的 类群称为姊妹群,是单系类群的一种常见类型
bacteria outgroup
archaea archaea archaea eukaryote
用写字板 打开 outfile
用treeview打 开outtree
outfile
outtree
不同形式
不同形式
不同形式
Gendoc查看.msf文件
第四章
分子系统发育分析
1.1分子进化的基本概念
系统发育学研究的是进化关系,系统发育分析就是要 推断或者评估这些进化关系。 通过系统发育分析所推断出来的进化关系一般用分枝 图表(进化树)来描述,这个进化树就描述了同一谱 系的进化关系,包括了分子进化(基因树)、物种进 化以及分子进化和物种进化的综合。
paralogs
orthologs
1.1.2 类

祖先类群(ancestral group):如果一个类群(物种)至少有一 个子裔群,这个原始的类群就称为祖先类群 单系类群(monophyletic group)包含一个祖先类群所有子裔 的群组称为单系类群,其成员间存在共同祖先关系 并系类群(paraphyletic group)和复系类群(polyphyletic group):不满足单系类群要求,各成员间又具有共同祖先特征 的群组称为并系类群;各成员不具有共同衍生特征也不具有共 同祖先特征,只具有同型特征的分类群组称为复系类群 内类群(ingroup):一项研究所涉及的某一特定类群可称为内类 群
2.选择适当的分析方法 如你分析的是DNA数据,可以选择简约法 (DNAPARS),似然法(DNAML, DNAMLK), 距离法等(DNADIST)。。。 3.进行分析 选择好程序后,执行,读入分析数据,选 择适当的参数,进行分析,结果自动保存为 outfile,outtree。
Outfile是一个记录文件,记录了分析的 过程和结果,可以直接用文本编辑器(如写 字板)打开。 Outtree是分析结果的树文件,可以用 phylip提供的绘树程序打开查看,也可以用 其他的程序来打开,如treeview。
新的矩阵为
OTU3和OTUr1聚合为OTUr2,聚合值为0.19 ,同理 计算得OTUr2与OTU4之间的距离为dr2,4=0.29
以上结果可构建一个系统树
UPGMA法构建的系统树
1.2.2最大简约法(MP)
最大简约法(maximum parsimony,MP) 理论基础是奥卡姆(Ockham)哲学原则: 解释一个过程的最好理论是所需假设数目最 少的那一个。 这种方法对所有可能的拓扑结构进行计算, 并计算出所需替代数最小的那个拓扑结构, 作为最优树。也就是用最小的改变来解释所 要研究的分类群之间观察到的差异
点击可 进行参 数编辑
不同形式进 化树
1.4 PHYLIP软件包的应用
PHYLIP是一个免费的系统发生(phylogenetics) 分析软件包。由华盛顿大学遗传学系开发, 1980年首次公布。以下链接可以下载: http://evolution.genetics.washington.edu/ phylip.html
多重比对分析
保存结果
参 数
infile
多重比对分析保存的结果
Clustal自动保存文件, Phylip、msf格式文 一个是保存的比对结果, 件 另一个是进化树文件
用于MEGA进化树构建的 DNAman比对文件的保存
序列名称 前加#
wk.baidu.com
1.3.2 MEGA3.1软件的应用
第一步:点击 file,选 择”convert to MEGA format”
1.2 分子系统树的构建方法
• 距离矩阵法(distance)---UPGMA法和邻 接法 • 最大简约法(maximum parsimony,MP)
• 最大似然法(maximum likelihood,ML)
1.2.1 UPGMA法的应用
算术平均的不加权对群的缩写(Unweighted Pair Group Method) ,也称为类平均法 OTU概念:分类单元(operational taxonomic unit) 构建原理:以距离最小的两个OTU开始,合为一个 OTU记为OTU1,计算OTU1与其他OTU的距离,再 把距离最小的与OTU1组成一个聚簇,以此类推直到最 后一个OTU加到系统树中
相关文档
最新文档