生物信息学概论第三章替换模式

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

来源与β球蛋白基因的数据,一个核苷酸序列每一 百万年只发生0.35%的改变,对于人类来说这种改变 是非常缓慢的,但是比之分子的进化又是相当迅速的
3.1.3 同义和异义替换
同义替换:改变核苷酸编码序列,但不影响蛋白质 的氨基酸序列的替换 甘氨酸(GGG,GGA,GGU,GGC)
异义替换:改变核苷酸编码序列,同时影响蛋白质 的氨基酸序列的替换
个体之间发现的许多变异的优势或劣势都不明显,
在本质上是选择中性的。
基因任何中性变异被固定的概率是q
这里q为该等位基因的相对频率
基因任何中性变异最终从种群中消失的可能性为1-q, 尽管基因新变异的固定概率可能很小,中性突变却能 在种群中维持很长的时间,固定新的中性突变的平均时 间实际上相当于繁衍4N代所经历的时间
大量分析证实,基因不同部分的变化速度确实千差万别, 而这些速度正反映了不同部分受功能约束的程度
人、鼠、兔、牛的类β球蛋白基因各部分的差异
基因区域类别 所有非编码序列 所有编码序列 5’端侧翼序列 人类/基因区域 替换的平均数量 长度 913 441 67.9 69.2 标准方差 14.1 16.7 替换速率(个替换/ 位点/10亿年) 3.33 1.58
复制一条完整的基因可能形成很多复制品,其中一 个提供原基因的必要功能,而其他的复制则积累了不 受自然选择的替换
某个不断变化的复制品会出现一些新的重要功能,于是 这个基因就变得对生物体的适应性非常重要 更多时候复制出来的基因会成为伪基因,因为变异使得 这样的基因丧失了功能,失去了转录的活性。这些基因序列 的替换积累速率相当高,略高于同一物种的基因的3’端侧翼 序列
3.1.2 功能约束
自然选择能够杜绝导致生物体生存和繁衍能力下降 的基因变化
那些能够引起蛋白质催化性能及结构特征变化的基因变 化,会更加受制于自然选择。十分重要的基因部分被认 为受功能约束控制,它们在进化过程中趋向于非常缓慢 的变化 另外一些不会对氨基酸序列或表达方式造成影响的基因 变化,很少受到自然选择的纠正,因此这种类型的变化 速度相对较快
甘氨酸(GGG)->丙氨酸(GCG) 经过详细分析可以发现,基因的编码序列发生同义替 换的概率几乎是异义替换的3倍
并非三联密码子上的所有位置都会发生异义替换。事实 上,三联密码子中的核苷酸可分为3类: 非简并位点:该位点的变异都是导致替换 双重简并位点:该位点有两种不同的核苷酸翻译成 同一种氨基酸,另外两种不同的核苷酸则翻译成不同 的氨基酸 四重简并位点:这一位点上无论是什么,都不会影 响该密码子的翻译
3.1.5 替换和突变
虽然一个基因核苷酸序列的每一位都可能发生变化,然 而人们没有观察到所有可能的变异,但这个问题却使人 们发现了分子进化研究中突变和替换这两个词在使用上 有趣的数字差异。 突变:是指DNA的复制和修复过程中出现错误而导致 的核苷酸序列的改变
替换:是指了某个层次上经过自然选择过滤后的突变
分析已经发生的替换数目和性质,对于分子进化 的研究有很重要的意义.
这种分析也为生物信息学的研究人员致力于识别 和刻画具有重要功能的基因部分提供了强有力的 线索。
本章内容
基因内的替换模式 估算替换数目 基因间进化率的变化
分子时钟
细胞器的进化
3.1 基因内的替换模式
• 基因突变:一种核苷酸替换成另一种,以及插入/删除事件
同义(和伪基因)的替换速率Ks,通常被认为能较好反 映出基因突变时实际速率;而异义替换速率Ka则不然, 因Hale Waihona Puke Baidu他们逃脱不了自然选择
3.1.6 等位基因与固定
绝大多数自然界现存的生物种群包含着大量的基因变异, 从而形成等位基因。一个物种某个基因的不同版本被称 之为等位基因。
- 举个例子,人平均每200个碱基对中就有一个不同于其他人。
– 有利的
– 中性的 – 不利的
• 有利的变化实际上只占少数 • 核苷酸序列的某些变化对一个生物体的影响比其他因素更 大
3.1.1 突变率 r = K/(2T)
r:替换速率(突变率)
K: 来源于同一祖先的两个序列之间的替换数量 T:分叉时间 如果不同物种间的进化率是相似的,在没有其他证 据的情况下,通过替换速率(突变率),可以推测进 化事件发生的时间。 比较基因内和基因间的替换速率(突变率)常用来 确定不同基因组区域的作用
300
50 131 132 300
96.0
9.0 41.8 33.0 76.3
19.6
3.0 8.1 11.5 14.3
3.39
1.86 3.48 3.00 3.60
5’UT
内含子 3’UT 3’端侧翼序列
由上表中,可以揭示的一个普遍规律:
内含子和两端侧翼序列的替换积累速度最快 其次是能转录而不能翻译的序列 最慢的是编码序列
例:
分类 例子
非简并位点
苯丙氨酸(UUU) 亮氨酸(CUU) 异亮氨酸(AUU) 缬氨酸(GUU) 天冬氨酸(GAU,GAC) 谷氨酸(GAA,GAG) 甘氨酸(GGG,GGA,GGU,GGC)
双重简并位点 四重简并位点
如果自然选择在出现改变蛋白质功能的变异的时候就起作用,那么 很显然,处于四重简并位点的核苷酸替换的积累最为迅速,而处于 非简并位点的替换积累最为缓慢
人、兔类β球蛋白基因编码序列里各种位点的替换率
位点类型 位点数目/bp 302 60 85 替换数目 17 10 20 替换速率(个替换/位 点/10亿年) 0.56 1.67 2.35
非简并位点
二重简并位点 四重简并位点
3.1.4 插入删除情况和伪基因
在有转录活性的基因中,插入删除很难发生。原因 在于插入删除会改变阅读框。DNA和修复酶经过亿万 年的进化,已形成合理的机制,一般会使插入删除比 简单的碱基替换发生的概率小10倍
等位基因的差异变化很广,从不会产生影响到产生严重 后果。各种等位基因相对频率的改变就是进化的基础 新的等位基因以非常低的频率出现:q = 1/2N
N是这个种群中具有繁殖活性的二倍体的数量
危及生物体生存和繁殖的突变,会在自然选择中,从 基因库里扫地出门,这种突变频率最终降为0
如果等位基因优势突出,其频率就渐渐接近于1,即 该等位基因被固定
相关文档
最新文档