分子进化与系统发育学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六讲
分子进化与系统发育学 Molecular evolution and
phylogenetics
Begin with a story… STORY 1:
《老山发现大型西汉王陵墓》《北京晚报》 2000年03月18日 《老山汉墓考古发掘进入核心部分》《人民日报》 (2000年08
月20日
墓主(西汉诸侯王后)尸骨,鉴定为女性,年龄约30岁,身高约1.60米
颠换
(transvertion) 嘌呤 嘧啶 嘧啶 嘌呤
胞嘧啶
C
A
腺嘌呤
胸腺嘧啶 T
G 鸟嘌呤
在大多数DNA片段中,转换出现的概率高于颠换出现的概率。
DNA序列突变对氨基酸序列的影响
同义(沉默)替代(synonymous / silent substitution)
时间
基因分裂
基因树:
物种分裂
由来自各个物种的一
个基因构建的系统发育树
(不完全等同于物种树),
表示基因分离的时间。
a bc
de f
系统发育树的种类 ——期望树、现实树和重建树
理论上:
实际情况:
假设所研究的序列无限 长,从中随机抽样进行 统计分析。
所研究的序列是短序列, 统计得到的替代数目存 在大量随机误差。
高温下生活的嗜热菌
生命三界: 细菌(Eubacteria) 古细菌(Archaebacteria) 真核(Eukaryotes) (Woese and Fox, 1977)
基于16S/18S核糖体RNA序列比对得到的古细菌系统发育树 (Ettema等,2005)
wk.baidu.com
STORY 4:
电子显微镜下的SARS冠状病毒
2002年10月,吉林大学文学院考古系边疆考古研究中心与北 京市文物研究所合作,对该尸骨进行体质人类学、古代DNA和颅 像复原三个方面的研究,其中DNA研究工作是由吉大生命科学学 院副院长、边疆考古研究中心考古DNA实验室主任周慧教授负责 完成。
据周慧教授介绍,由于老山汉墓女主人的骨骼保存状况欠佳,
a
ca
b
b
dc
d
a
b
d
c
考虑4个分类群时,共有3种可能的无根树
考察类群数为 m ( m 3 )的系统树,其可能的拓扑结构数目 为:
有根树
(2m 3)! m=10: 2m2 (m 2)! 34,459,425种
无根树
(2m 5)! m=10: 2m3 (m 3)! 2,027,025种
期望树:
一个用无限长的序列或每一 分支的期望替代数构建的树
当 m较大时,选出真实树的拓扑结构十分困难。
分支数目:
有根树 2m 2
无根树 2m 3
内部分支数目:
有根树 m 2
内部节点数目:
有根树 m 1
无根树 m 3 无根树 m 2
系统发育树的种类 ——基因树、物种树
物种树:
基因分裂
代表一个物种或群体
进化历史的系统发育树
两个物种分歧的时间: 两个物种发生生殖隔离的 基因分裂
细胞的代谢产物对DNA的损伤) ♦ 物理因素引起的损伤(电离辐射、紫外线、热诱变等) ♦ 化学因素引起的损伤(烷化剂、碱基类似物、嵌入试剂等)
突变的效应
◙ 突变对基因组的影响 同义突变:没有改变产物氨基酸序列的密码子 错义突变:碱基序列的改变引起了氨基酸序列的改变 (中性突变、渗漏突变) 无义突变:碱基的改变使代表某种氨基酸的密码子变 为蛋白合成的终止密码子 连读突变:与终止突变正好相反,终止密码子变成指 令某一氨基酸的密码子,使翻译继续进行
• 逆转录转座子
以RNA为中介
§6.2
系统发育树 (Phylogenetic tree)
STORY 2:
Anna Anderson
?
Anastasia Tsar Nicholas II Establishing the identity of Anna Anderson Manahan
《真假公主》—— 1917年俄国末代王朝被推翻,贵族与侍卫 全部逃走,而沙皇可怜的儿子老少一个都没走脱,并于1918 年被全部处决。但民间却流传着沙皇的小女儿死里逃生,远 走他乡的故事。为了得到俄国沙皇的一千万遗产,许多人绞 尽脑汁寻找安娜公主,终无所获。俄国贵族后裔布丁将军终 于找到一位外貌气质酷似安娜公主的女子,于是训练她皇室 的各种礼仪及相关的人和事,安娜公主过关斩将。顺利和皇 太后相认,就在太后要宣布安娜公主为遗产继承人并与保罗 定婚时,安娜公主与布丁悄然消失,结局出人意料……
分子系统学为生物分类问题提供了许多崭新的见解。
生物进化的分子机制
1、核苷酸替代、插 入/缺失、重组 2、基因转换
基因突变
遗传漂变 自然选择
固定在生物个体 以及物种内
产生新的形态、性状
传递给后代
分子系统学是研究进化机制的一个重要工具。
DNA序列的突变
DNA分子的改变
性状改变
核苷酸倒位 invertion
拓扑结构:
有根树:反映时间顺序 a
bc
节点: 内部节点 外部节点 d
无根树:反映距离
a
b
c 分支: 内部分支
d 外部分支
a
b c da
cb
da
db c
a
b c da
c b da
d bc
b
a c db
c a db
a ac
c
a b dc
b a dc
d ab
d
a b cd
b a cd
c ab
考虑4个分类群时,共有15种可能的有根树
古分子系统学:利用古代DNA保留的遗传信息进行分子系统 学研究
§6.1 生物进化的分子基础
Darwin, Charles (1809-1882)
《The Origin of Species》 (1859)
经典的进化研究方法
化石证据
(Fossil)
比较形态学证据
(Comparative morphology)
精氨酸Arg CGU CGC CGA CGG 89 46 1 0
为什么会出现密码子使用频率的偏倚性?
• 与同功能tRNA的丰度有关?
• 突变压力与进化选择双重控制?
Open problem
基因组进化的分子基础:
•突 变 •重 组 •转 座
突变
突变的机制 ♦ 自发性损伤(复制中的损伤、碱基的自发性化学改变、
Tyr STP
问题:假设所有密码子以同一概率出现,上述三种突变的比例 25%,71%,4%
密码子使用频率(codon usage)
密码子使用频率的偏倚性: 编码同一个氨基酸的多个同义密码子具有不同的使用频率
例:E. coli的RNA聚合酶
缬氨酸Val GTT GTC GTA GTG 55 21 34 34
STORY 3:
1964年生物学家托马斯·布罗克在黄石 公园的温泉源头发现了微生物,第二 年夏天又发现了在60摄氏度的水中生 活的水藻,还有在82摄氏度的水温下 生存的微生物。
极端厌氧的产甲烷菌
美国黄石公园内有 许多温泉,水温从 20℃到100℃,其 中生活着一些喜欢 热的微生物,用显 微镜观察,这些微 生物呈杆状。
插入 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TAC TTT GCT G Thr Tyr Phe Ala
倒位 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TTT ATG CTG Thr Phe Met Leu
核苷酸替代的几种分类
转换
(transition) 嘌呤 嘌呤 嘧啶 嘧啶
古代DNA是指从田野考古发掘中出土的古代人 类和动物遗骸以及古生物化石中提取的古代生物分 子。随着现代生物技术、有机地球化学理论和实验 技术的不断发展,人们对古代DNA的研究也不断深 入。
把古代DNA数据与现代基因库中的数据资料相 结合,便可以构建出某一生物门类的系统发育树, 从而进一步探讨人类的演化与迁移等重大问题。
序列比较:源于同一祖先DNA/氨基酸序列的两条DNA/氨基酸 序列,考察二者的差异。
序列差异:进化过程中分子突变的痕迹
分子进化:以累计在DNA/氨基酸分子上的历史信息为基础, 研究分子水平的生物进化过程和机制。
分子系统发育学 Molecular Phylogenetics
分子系统学 Molecular Systematics
《老山汉墓走出西域美女 汉墓女主人头像复原记》
(北京青年报,2001年4月20日)
……此次头像复原品的作者纪元“在我国单个人体 复原领域中是首屈一指的专家。他所在的单位—— —公安部物证鉴定中心也是目前我国人体复原最具 权威的机构。”
……纪元介绍说:此次所采用的是颅骨面貌复 原技术。这项技术已经有100多年的历史,其科学 依据是人体头面部的解剖学规律,且在单体复原方
核苷酸替代 substitution
核苷酸缺失 deletion
核苷酸插入 insertion
替代 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TCT TTG CTG Thr Ser Leu Leu
缺失 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TAT TGC TGThr Tyr Cys -
可比较性 比较不同物种的有关DNA序列 建立DNA序列的演化模 型、氨基酸序列的演化模型(数学模型) 蛋白质结构的演化模型 (形态、性状的演化模型?)
基因组编码信息的丰富 与形态、性状包含的信息相比,基因组序列包含更多、更 复杂的信息结构
What can we do for molecular evolution?
重组
• 同源重组 • 位点专一性重组
转座
转座: 是基因进化的一种重要方式,它不是重组,但利用 了重组的过程,它是一段DNA或其拷贝从基因组的一个 位置转移到另一位置,并在插入位点两测产生1对很短 的正向重复序列
根据转座机制可分为2个大的范畴:
• DNA转座子
以DNA区段作为转座成分
又可分为复制转座和保守转座
100nm
http://www.sciencexpress.org /
1 May 2003/Page 7/10.1126/science.1085952
系统发育树的种类 ——有根树、无根树
理论上,一个DNA序列在物种形成或基因复制时,分裂 成两个子序列,因此系统发育树一般是二歧的。
一般考虑二歧的树结构:二歧树
仍然为同义密码子的核苷酸替代 如: TAT TAC
Tyr Tyr
非同义替代(nonsynonymous substitution)
导致产生非同义密码子的核苷酸替代 如: TAT AAT
Tyr Asn
无义突变(nonsense mutation)
导致产生终止密码子的核苷酸突变 如: TAT TAA
比较生理学证据
(Comparative physiology)
系统学(Systematics) 分类学(Taxonomy)
比较形态学证据
(Comparative morphology)
进化学的分子途径
普适性 由4种核酸组成 分子水平的进化表现为:DNA序列的演 化、氨基酸序列演化、蛋白质结构的演化
因此运用分子生物学的方法对其线粒体进行提取、扩增、测序和 分析是这项综合性研究计划中的一个重点和难点课题。其人骨样 本中DNA降解严重、含量很少,提取工作很不顺利。为此研究人 员考虑了三套方案,即分别从其肢骨、牙齿和颅腔中偶然保存下 来的一块干燥脑组织中提取DNA。 由于样本的肢骨、牙齿的保存情况 欠佳,未能提取出DNA。最后经过 课题组成员坚韧不拔的努力和反复 实验,终于分别从干燥脑组织的三 个不同部位成功得到了古DNA模板, 并扩增测序。实验结果表明,三个 不同部位所得序列一致,同一抽提 产物的平等测序结果相同,该序列 真实地反映了老山汉墓女墓主的遗 传信息。
古分子系统学、分子系统学
古生物遗体、化石保存的三种信息: 1、形态学信息 2、化学信息(生物的代谢产物和一般的生物化学分子) 3、遗传信息(保存的一级结构生物大分子,即基因产物和基因片段)
分子系统学(Molecular Systematics):从生物大分子(氨 基酸、核苷酸)的遗传信息推断生物进化的历史,并以系统 树(谱系)的形式表达出来。
面具有较高的精确度。世界上第一次运用它是为著
名艺术家巴赫进行头像复原并取得了成功。目前在 我国这项技术主要运用于破案之中。
?
《DNA证实老山汉墓女主人是中原人》
2003-05-15 新华网
吉林大学边疆考 古研究中心今天正式 宣布:他们完成的一 项研究结果表明,北 京老山汉墓女主人的 DNA序列属于亚洲M 谱系,代表了东亚地 区现代人群的某种祖 先类型的遗传学性状。
分子进化与系统发育学 Molecular evolution and
phylogenetics
Begin with a story… STORY 1:
《老山发现大型西汉王陵墓》《北京晚报》 2000年03月18日 《老山汉墓考古发掘进入核心部分》《人民日报》 (2000年08
月20日
墓主(西汉诸侯王后)尸骨,鉴定为女性,年龄约30岁,身高约1.60米
颠换
(transvertion) 嘌呤 嘧啶 嘧啶 嘌呤
胞嘧啶
C
A
腺嘌呤
胸腺嘧啶 T
G 鸟嘌呤
在大多数DNA片段中,转换出现的概率高于颠换出现的概率。
DNA序列突变对氨基酸序列的影响
同义(沉默)替代(synonymous / silent substitution)
时间
基因分裂
基因树:
物种分裂
由来自各个物种的一
个基因构建的系统发育树
(不完全等同于物种树),
表示基因分离的时间。
a bc
de f
系统发育树的种类 ——期望树、现实树和重建树
理论上:
实际情况:
假设所研究的序列无限 长,从中随机抽样进行 统计分析。
所研究的序列是短序列, 统计得到的替代数目存 在大量随机误差。
高温下生活的嗜热菌
生命三界: 细菌(Eubacteria) 古细菌(Archaebacteria) 真核(Eukaryotes) (Woese and Fox, 1977)
基于16S/18S核糖体RNA序列比对得到的古细菌系统发育树 (Ettema等,2005)
wk.baidu.com
STORY 4:
电子显微镜下的SARS冠状病毒
2002年10月,吉林大学文学院考古系边疆考古研究中心与北 京市文物研究所合作,对该尸骨进行体质人类学、古代DNA和颅 像复原三个方面的研究,其中DNA研究工作是由吉大生命科学学 院副院长、边疆考古研究中心考古DNA实验室主任周慧教授负责 完成。
据周慧教授介绍,由于老山汉墓女主人的骨骼保存状况欠佳,
a
ca
b
b
dc
d
a
b
d
c
考虑4个分类群时,共有3种可能的无根树
考察类群数为 m ( m 3 )的系统树,其可能的拓扑结构数目 为:
有根树
(2m 3)! m=10: 2m2 (m 2)! 34,459,425种
无根树
(2m 5)! m=10: 2m3 (m 3)! 2,027,025种
期望树:
一个用无限长的序列或每一 分支的期望替代数构建的树
当 m较大时,选出真实树的拓扑结构十分困难。
分支数目:
有根树 2m 2
无根树 2m 3
内部分支数目:
有根树 m 2
内部节点数目:
有根树 m 1
无根树 m 3 无根树 m 2
系统发育树的种类 ——基因树、物种树
物种树:
基因分裂
代表一个物种或群体
进化历史的系统发育树
两个物种分歧的时间: 两个物种发生生殖隔离的 基因分裂
细胞的代谢产物对DNA的损伤) ♦ 物理因素引起的损伤(电离辐射、紫外线、热诱变等) ♦ 化学因素引起的损伤(烷化剂、碱基类似物、嵌入试剂等)
突变的效应
◙ 突变对基因组的影响 同义突变:没有改变产物氨基酸序列的密码子 错义突变:碱基序列的改变引起了氨基酸序列的改变 (中性突变、渗漏突变) 无义突变:碱基的改变使代表某种氨基酸的密码子变 为蛋白合成的终止密码子 连读突变:与终止突变正好相反,终止密码子变成指 令某一氨基酸的密码子,使翻译继续进行
• 逆转录转座子
以RNA为中介
§6.2
系统发育树 (Phylogenetic tree)
STORY 2:
Anna Anderson
?
Anastasia Tsar Nicholas II Establishing the identity of Anna Anderson Manahan
《真假公主》—— 1917年俄国末代王朝被推翻,贵族与侍卫 全部逃走,而沙皇可怜的儿子老少一个都没走脱,并于1918 年被全部处决。但民间却流传着沙皇的小女儿死里逃生,远 走他乡的故事。为了得到俄国沙皇的一千万遗产,许多人绞 尽脑汁寻找安娜公主,终无所获。俄国贵族后裔布丁将军终 于找到一位外貌气质酷似安娜公主的女子,于是训练她皇室 的各种礼仪及相关的人和事,安娜公主过关斩将。顺利和皇 太后相认,就在太后要宣布安娜公主为遗产继承人并与保罗 定婚时,安娜公主与布丁悄然消失,结局出人意料……
分子系统学为生物分类问题提供了许多崭新的见解。
生物进化的分子机制
1、核苷酸替代、插 入/缺失、重组 2、基因转换
基因突变
遗传漂变 自然选择
固定在生物个体 以及物种内
产生新的形态、性状
传递给后代
分子系统学是研究进化机制的一个重要工具。
DNA序列的突变
DNA分子的改变
性状改变
核苷酸倒位 invertion
拓扑结构:
有根树:反映时间顺序 a
bc
节点: 内部节点 外部节点 d
无根树:反映距离
a
b
c 分支: 内部分支
d 外部分支
a
b c da
cb
da
db c
a
b c da
c b da
d bc
b
a c db
c a db
a ac
c
a b dc
b a dc
d ab
d
a b cd
b a cd
c ab
考虑4个分类群时,共有15种可能的有根树
古分子系统学:利用古代DNA保留的遗传信息进行分子系统 学研究
§6.1 生物进化的分子基础
Darwin, Charles (1809-1882)
《The Origin of Species》 (1859)
经典的进化研究方法
化石证据
(Fossil)
比较形态学证据
(Comparative morphology)
精氨酸Arg CGU CGC CGA CGG 89 46 1 0
为什么会出现密码子使用频率的偏倚性?
• 与同功能tRNA的丰度有关?
• 突变压力与进化选择双重控制?
Open problem
基因组进化的分子基础:
•突 变 •重 组 •转 座
突变
突变的机制 ♦ 自发性损伤(复制中的损伤、碱基的自发性化学改变、
Tyr STP
问题:假设所有密码子以同一概率出现,上述三种突变的比例 25%,71%,4%
密码子使用频率(codon usage)
密码子使用频率的偏倚性: 编码同一个氨基酸的多个同义密码子具有不同的使用频率
例:E. coli的RNA聚合酶
缬氨酸Val GTT GTC GTA GTG 55 21 34 34
STORY 3:
1964年生物学家托马斯·布罗克在黄石 公园的温泉源头发现了微生物,第二 年夏天又发现了在60摄氏度的水中生 活的水藻,还有在82摄氏度的水温下 生存的微生物。
极端厌氧的产甲烷菌
美国黄石公园内有 许多温泉,水温从 20℃到100℃,其 中生活着一些喜欢 热的微生物,用显 微镜观察,这些微 生物呈杆状。
插入 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TAC TTT GCT G Thr Tyr Phe Ala
倒位 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TTT ATG CTG Thr Phe Met Leu
核苷酸替代的几种分类
转换
(transition) 嘌呤 嘌呤 嘧啶 嘧啶
古代DNA是指从田野考古发掘中出土的古代人 类和动物遗骸以及古生物化石中提取的古代生物分 子。随着现代生物技术、有机地球化学理论和实验 技术的不断发展,人们对古代DNA的研究也不断深 入。
把古代DNA数据与现代基因库中的数据资料相 结合,便可以构建出某一生物门类的系统发育树, 从而进一步探讨人类的演化与迁移等重大问题。
序列比较:源于同一祖先DNA/氨基酸序列的两条DNA/氨基酸 序列,考察二者的差异。
序列差异:进化过程中分子突变的痕迹
分子进化:以累计在DNA/氨基酸分子上的历史信息为基础, 研究分子水平的生物进化过程和机制。
分子系统发育学 Molecular Phylogenetics
分子系统学 Molecular Systematics
《老山汉墓走出西域美女 汉墓女主人头像复原记》
(北京青年报,2001年4月20日)
……此次头像复原品的作者纪元“在我国单个人体 复原领域中是首屈一指的专家。他所在的单位—— —公安部物证鉴定中心也是目前我国人体复原最具 权威的机构。”
……纪元介绍说:此次所采用的是颅骨面貌复 原技术。这项技术已经有100多年的历史,其科学 依据是人体头面部的解剖学规律,且在单体复原方
核苷酸替代 substitution
核苷酸缺失 deletion
核苷酸插入 insertion
替代 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TCT TTG CTG Thr Ser Leu Leu
缺失 Thr Tyr Leu Leu ACC TAT TTG CTG
ACC TAT TGC TGThr Tyr Cys -
可比较性 比较不同物种的有关DNA序列 建立DNA序列的演化模 型、氨基酸序列的演化模型(数学模型) 蛋白质结构的演化模型 (形态、性状的演化模型?)
基因组编码信息的丰富 与形态、性状包含的信息相比,基因组序列包含更多、更 复杂的信息结构
What can we do for molecular evolution?
重组
• 同源重组 • 位点专一性重组
转座
转座: 是基因进化的一种重要方式,它不是重组,但利用 了重组的过程,它是一段DNA或其拷贝从基因组的一个 位置转移到另一位置,并在插入位点两测产生1对很短 的正向重复序列
根据转座机制可分为2个大的范畴:
• DNA转座子
以DNA区段作为转座成分
又可分为复制转座和保守转座
100nm
http://www.sciencexpress.org /
1 May 2003/Page 7/10.1126/science.1085952
系统发育树的种类 ——有根树、无根树
理论上,一个DNA序列在物种形成或基因复制时,分裂 成两个子序列,因此系统发育树一般是二歧的。
一般考虑二歧的树结构:二歧树
仍然为同义密码子的核苷酸替代 如: TAT TAC
Tyr Tyr
非同义替代(nonsynonymous substitution)
导致产生非同义密码子的核苷酸替代 如: TAT AAT
Tyr Asn
无义突变(nonsense mutation)
导致产生终止密码子的核苷酸突变 如: TAT TAA
比较生理学证据
(Comparative physiology)
系统学(Systematics) 分类学(Taxonomy)
比较形态学证据
(Comparative morphology)
进化学的分子途径
普适性 由4种核酸组成 分子水平的进化表现为:DNA序列的演 化、氨基酸序列演化、蛋白质结构的演化
因此运用分子生物学的方法对其线粒体进行提取、扩增、测序和 分析是这项综合性研究计划中的一个重点和难点课题。其人骨样 本中DNA降解严重、含量很少,提取工作很不顺利。为此研究人 员考虑了三套方案,即分别从其肢骨、牙齿和颅腔中偶然保存下 来的一块干燥脑组织中提取DNA。 由于样本的肢骨、牙齿的保存情况 欠佳,未能提取出DNA。最后经过 课题组成员坚韧不拔的努力和反复 实验,终于分别从干燥脑组织的三 个不同部位成功得到了古DNA模板, 并扩增测序。实验结果表明,三个 不同部位所得序列一致,同一抽提 产物的平等测序结果相同,该序列 真实地反映了老山汉墓女墓主的遗 传信息。
古分子系统学、分子系统学
古生物遗体、化石保存的三种信息: 1、形态学信息 2、化学信息(生物的代谢产物和一般的生物化学分子) 3、遗传信息(保存的一级结构生物大分子,即基因产物和基因片段)
分子系统学(Molecular Systematics):从生物大分子(氨 基酸、核苷酸)的遗传信息推断生物进化的历史,并以系统 树(谱系)的形式表达出来。
面具有较高的精确度。世界上第一次运用它是为著
名艺术家巴赫进行头像复原并取得了成功。目前在 我国这项技术主要运用于破案之中。
?
《DNA证实老山汉墓女主人是中原人》
2003-05-15 新华网
吉林大学边疆考 古研究中心今天正式 宣布:他们完成的一 项研究结果表明,北 京老山汉墓女主人的 DNA序列属于亚洲M 谱系,代表了东亚地 区现代人群的某种祖 先类型的遗传学性状。