微卫星及其应用
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
# 收稿日期:2001 - 04 - 10;修改稿收到日期:2001 - 04 - 29
,它们广泛分布在各种真核生物基因组中, STRs) 且分布比较均匀。不像小卫星序列比较集中在端粒 区域。据估计,平均每 6 kb 长度中就有 1 个微卫 星位点(Beckmann & Weber, 1992) 。微卫星的重 复单位在 1 ~ 5 bp,每一重复单位发生若干次重复, 使整个重复序列达到几十至几百个 bp。虽然微卫 星在整个人类基因组中分布比较均匀,但相对而 言,随着每个重复单位碱基长度的增加,微卫星位 点的总数减少。比如那些单碱基重复微卫星位点, 特别是 A 和 T 重复位点,大约一共有 50 万个位点 (占据了约 10 mb 长度) 。而那些 5 bp 重复微卫星位 点的总数大约只有几千个(Bennett,2000) 。 由于微卫星等位基因具有突变速率快、多态性 高等特性,因此在生物遗传作图、群体遗传研究、 个体间亲缘关系鉴定等方面已得到广泛应用。对微 卫星本身突变机制的了解有助于合理应用微卫星数 据来研究生物学中的问题。为此,我们对微卫星及 其在生物学中的应用作一简要介绍。
如果存在使小等位基因倾向于增加重复单位数目而大等位基因则倾向于减少重复单位数目的偏向性突变那么这也可能是导致微卫星等位基因的重复单位数目受到限制的原因之一d1g
动
物
学
研
究
:315 ~ 320 2001,Aug . 22(4)
CN 53 - 1040 / 0
ISSN 0254 - 5853
Zoological Research
1
微卫星的突变
引起微卫星位点发生突变的原因主要为“滑链
基金项目:国家自然科学基金、中国科学院和云南省自然科学基金资助项目 !通讯联系人,电话:0871 - 5190761, e-maiI:zhangyp @ pubIic . km . yn . cn
316
动
物
学
研
究
22 卷
错配”( siipped-strand mispairing, Levinson & Gut。在 DNA 复制合成的过程中,新生链 man,1987) 和模板链之间在微卫星重复区域可能发生错配,使 得一个或者几个重复单位形成环状,未能参与配 对。如果未配对的重复单位位于新生链,则最终得
引自 Eiiegren,2000(cited from Eiiegren,2000) 。
于同一位点的不同等位基因之间都存在着不同的突 变速率。Rubinsztein !" #$ ( 比较了人与其他 . 1995) 灵长类的微卫星, 发现人类等位基因长度明显长于 其他灵长类, 表明在种内微卫星进化可能存在着方 向性, 而且在不同物种中其进化速率也存在差异。 后来 的 一 些 结 果 也 支 持 这 种 观 点 ( Amos !" #$ . , 。影响微卫星突变速率 1996; Primmer !" #$ . , 1996) 的因素很多, 包括重复单位数目和重复单位碱基长 度等 (Schi tterer, 。但还没有发现普遍性的规 2000) 律。一些观察及分析结果显示微卫星的突变速率随 重复单位数目的增加而加快 ( Edwards !" #$ . , 1992; 。体外研 Weber & Wong, 1993; Wierdi !" #$ . , 1997) 究显示重复单位长度与滑链错配速率之间呈负相关 (Schi tterer & Tautz, 。与之相一致, 1992) Lee !" #$ . (1999) 发现当重复单位数目相同时, 4 bp 重复微卫 星的突变速率要明显小于 2 bp 重复微卫星的突变 速率。但从谱系中直接观测到的微卫星突变速率却 显示, 4 bp 重复微卫星的突变速率高于 2 bp 重复微 卫星的突变速率 (Weber & Wong, 。 1993)
具有 特 定 的 功 能, 这 可 能 是 选 择 的 基 础。 例 如 发现 2 bp 重复序列至少可以 Hamada !" #$ ( . 1984) 影响一个哺乳动物基因的转录调节。④微卫星重复 单位存在缺陷 ( imperfection) 。Garza !" #$ ( 比 . 1995) 较了人与黑猩猩的一个微卫星序列 Mfd 59, 结果发 现黑猩猩中为正常的 TA 重复, 而人类中则存在着 的替换, 使得其重复区域发生改变, 这一改 TA!TT 变也 导 致 重 复 单 位 数 目 出 现 差 异 (黑 猩 猩 中 为 而人类中为 7 . 3) 。这种在重复区域的缺陷也 34 . 4, 可能在某些微卫星位点中起到限制等位基因长度的 作用。 ⑤ 重 复 区 域 碱 基 的 随 机 突 变。 Kruglyak !" 认为在微卫星重复单位不断增加的过程 #$ ( . 1998) 中, 碱基突变也在不断积累, 从而破坏了整个微卫星 长度的增加。微卫星重复单位长度的频率分布是由 于 DNA 滑链错配与碱基突变之间的平衡造成的。 这实际上与④是一致的。
大多数微卫星位点在体内所观察到的突变速率 估计 在 10 - 2 ~ 10 - 5 次 / 代 ( Weber & Wong, 。 1993 ) 这一速率取决于滑链错配速率与体内错配修复系统 的效率。体外试验显示 DNA 发生滑链错配的频率 很高 ( Schi tterer & Tautz, 。当微卫星被表达 1992) 在缺乏有效错配修复系统的宿主中时, 其不稳定性 要 比 正 常 时 高 10 ~ 5 X 103 倍( Chambers & 。 MacAvoy, 2000) 为了了解等位基因在特定群体中的数目、 大小 范围、 分布频率等是如何形成的, 往往需要借助于模 型来进行研究。从目前所进行的一些研究来看, 没 有一种模型能够适用于所有微卫星数据。一些计算 机模拟显示, 2 bp 重复微卫星的等位基因频率在人 类中其分布比较符合由 Ohta & Kimura ( 1973) 提出 的逐 步 突 变 模 型 ( stepwise mutation modei, SMM ) (Vaides !" #$ . , , 即突变所 1993; Shriver !" #$ . , 1993) 产生的新的等位基因是在原来的基础上增加或者减 少了一个重复单位。 Shriver !" #$ ( 对可变数 . 1993) 目串联重复 ( variabie number tandem repeats, VNTR,
真核生物基因组中广泛存在着串联重复序列。 根据重复单位大小的不同, 将重复序列 Tautz(1993) 分为 3 类: 卫星序列、 小卫星序列和微卫星序列。卫 星序列通常存在于异染色质, 主要分布在着丝粒区 域。其重复单位达上千个碱基, 重复程度可以达到 (Debrauwere !" #$ . , 。与卫星序列 103 ~ 107 次 1997) 相比, 小卫星序列和微卫星序列的重复单位要短, 重 复程度也小。对于小卫星序列和微卫星序列的区 分, 并没有特别明确的界限。通常将重复单位超过 位点长度约在 0 . 5 ~ 100 kb 的称为小卫 10 或 15 bp、 星序列; 而那些重复单位只有 1 ~ 5 bp, 长度仅为几 百 bp 的位点称为微卫星序列。二者之间还有一些 过渡类型 ( Chambers & MacAvoy, 2000; Debrauwere 。 !" #$ . , 1997) 自从发现串联重复序列具有高度可变的特性以 来,无论是在群体遗传学研究还是在个体识别及亲 子鉴定等方面都得到了广泛的应用。由于卫星序列 片段非常大,无法进行分析处理,实际使用的重复 序列主要为小卫星和微卫星。其中微卫星因具有片 段小、易操作,尤其可以经 PCR 扩增放大后再分 析等优点,而得到最为广泛的应用。 微卫星又称小串联重复( short tandem repeats,
到的新生链未配对重复单位数目比模板链多。反 之,如果未配对的重复单位位于模板链,则最终得 到的新生链未配对重复单位数目比模板链少(图 。 1) 微卫星在不同物种、 同一物种的不同位点, 乃至
Fig . 1
图 1 微卫星的滑链错配突变模型 Modei of microsateiiite mutation by repiication siippage(siipped-strand mispairing)
Hale Waihona Puke Baidu
!!!"
"
综 述
!!!" "
微卫星及其应用
张云武 张亚平!
650223) (中国科学院昆明动物研究所细胞与分子进化开放研究实验室 昆明
Oliver A . RYDER
(Center for Reproduction of Endangered Species,ZooIogicaI Society of San Diego,San Diego, CA 92112, USA)
4期
张云武等:微卫星及其应用
317
包括小卫星和微卫星) 的等位基因大小范围、 数目、 模式以 及 杂 合 度 等 进 行 了 计 算 机 模 拟, 并与根据 结果显示由计算机 SMM 模型得到的预期值相比较, 模拟得到的平均杂合度与由 SMM 模型得到的预期 值相符, 但由计算机模拟得到的等位基因的平均数 要比由 SMM 模型得到的预期值高。他们也将计算 机模拟结果与真实数据相比较, 结果显示 3 ~ 5 bp 重复单位的微卫星完全符合 SMM 模型, 1 ~ 2 bp 重 复单位的微卫星其次, 而 15 ~ 70 bp 的小卫星反而 更适于用无限等位 基 因 模 型 ( infinite allele model, 解释。Di Rienzo !" #$ ( 对人类群体数据 IAM) . 1994) 进行了分析, 认为双相突变模型 ( two phase mutation , 即绝大多数突变只引起一个重复单位 model, TPM) 的变化, 另外少部分突变使得新产生的等位基因发 生了若干个重复单位的变化, 这种模型能更好地解 释所观察到的微卫星等位基因的分布。上述这些模 型都假设对等位基因的大小没有限制, 作为相应的 结果, 他们预言在一个生殖隔离的群体中, 重复单位 的平均数倾向于随分歧时间的增加而相应地增大 (Goldstein !" #$ . , 。如 上 所 述, 1995; Slatkin, 1995 ) 一些实验结果也表明种内微卫星的进化可能存在着 方向性, 其等位基因的突变更倾向于增加而不是减 少重复单位数目 ( Rubinsztein !" #$ . , 1995; Amos !" 。但实际上, 绝大多 #$ . , 1996; Primmer !" #$ . , 1996) 数微卫星位点的重复单位数目小于 50 个 ( Garza !" 。许多研究表明微卫星位点的等位基因 #$ . , 1995) 大小受到某种限制 ( Stallings !" #$ . , 1991; Bowcock , 即当重复单位的数 !" #$ . , 1994; Garza !" #$ . , 1995) 目不断增大到一定程度后, 会反过来呈现丢失一些 重复单位片段从而回复到原有数目的趋势 ( Wierdl 。这些限制微卫星重复 !" #$ . , 1997; Bennett, 2000) 单位数目无限增加的因素可能有以下一些: ① 基因 转换 ( gene conversion ) 。基因转换是小卫星位点产 生新 等 位 基 因 的 一 个 重 要 机 制 ( Jeffreys !" #$ . , , 但关于基因转换是否也在微卫星进化中起重 1994) 要作用还不清楚。② 偏向性突变 ( biased mutation ) 。 如果存在使小等位基因倾向于增加重复单位数目, 而大等位基因则倾向于减少重复单位数目的偏向性 突变, 那么这也可能是导致微卫星等位基因的重复 单位数目受到限制的原因之一 (Garza !" #$ . , 1995; 。③ 选择 (selection) 。选择也可 Wierdl !" #$ . , 1997) 能是调节重复单位数目的一个因素。虽然微卫星在 基因组中的功能作用还不明确, 但某些微卫星位点
摘要:微卫星是广泛分布于真核生物基因组中的短串联重复序列(1 ~ 5 bp) ,具有突变速率快、多态性高 等特性。已被广泛应用于生物遗传作图、群体遗传研究、个体间亲缘关系鉴定等方面。简要论述了微卫星的突 变、位点的分离、数据的收集、在生物学中的应用及其存在的缺陷。 关键词:微卫星;突变机制;亲缘关系鉴定 中图分类号:@754,@343 . 1 文献标识码:A 文章编号:0254 - 5853 (2001) 04 - 0315 - 06
,它们广泛分布在各种真核生物基因组中, STRs) 且分布比较均匀。不像小卫星序列比较集中在端粒 区域。据估计,平均每 6 kb 长度中就有 1 个微卫 星位点(Beckmann & Weber, 1992) 。微卫星的重 复单位在 1 ~ 5 bp,每一重复单位发生若干次重复, 使整个重复序列达到几十至几百个 bp。虽然微卫 星在整个人类基因组中分布比较均匀,但相对而 言,随着每个重复单位碱基长度的增加,微卫星位 点的总数减少。比如那些单碱基重复微卫星位点, 特别是 A 和 T 重复位点,大约一共有 50 万个位点 (占据了约 10 mb 长度) 。而那些 5 bp 重复微卫星位 点的总数大约只有几千个(Bennett,2000) 。 由于微卫星等位基因具有突变速率快、多态性 高等特性,因此在生物遗传作图、群体遗传研究、 个体间亲缘关系鉴定等方面已得到广泛应用。对微 卫星本身突变机制的了解有助于合理应用微卫星数 据来研究生物学中的问题。为此,我们对微卫星及 其在生物学中的应用作一简要介绍。
如果存在使小等位基因倾向于增加重复单位数目而大等位基因则倾向于减少重复单位数目的偏向性突变那么这也可能是导致微卫星等位基因的重复单位数目受到限制的原因之一d1g
动
物
学
研
究
:315 ~ 320 2001,Aug . 22(4)
CN 53 - 1040 / 0
ISSN 0254 - 5853
Zoological Research
1
微卫星的突变
引起微卫星位点发生突变的原因主要为“滑链
基金项目:国家自然科学基金、中国科学院和云南省自然科学基金资助项目 !通讯联系人,电话:0871 - 5190761, e-maiI:zhangyp @ pubIic . km . yn . cn
316
动
物
学
研
究
22 卷
错配”( siipped-strand mispairing, Levinson & Gut。在 DNA 复制合成的过程中,新生链 man,1987) 和模板链之间在微卫星重复区域可能发生错配,使 得一个或者几个重复单位形成环状,未能参与配 对。如果未配对的重复单位位于新生链,则最终得
引自 Eiiegren,2000(cited from Eiiegren,2000) 。
于同一位点的不同等位基因之间都存在着不同的突 变速率。Rubinsztein !" #$ ( 比较了人与其他 . 1995) 灵长类的微卫星, 发现人类等位基因长度明显长于 其他灵长类, 表明在种内微卫星进化可能存在着方 向性, 而且在不同物种中其进化速率也存在差异。 后来 的 一 些 结 果 也 支 持 这 种 观 点 ( Amos !" #$ . , 。影响微卫星突变速率 1996; Primmer !" #$ . , 1996) 的因素很多, 包括重复单位数目和重复单位碱基长 度等 (Schi tterer, 。但还没有发现普遍性的规 2000) 律。一些观察及分析结果显示微卫星的突变速率随 重复单位数目的增加而加快 ( Edwards !" #$ . , 1992; 。体外研 Weber & Wong, 1993; Wierdi !" #$ . , 1997) 究显示重复单位长度与滑链错配速率之间呈负相关 (Schi tterer & Tautz, 。与之相一致, 1992) Lee !" #$ . (1999) 发现当重复单位数目相同时, 4 bp 重复微卫 星的突变速率要明显小于 2 bp 重复微卫星的突变 速率。但从谱系中直接观测到的微卫星突变速率却 显示, 4 bp 重复微卫星的突变速率高于 2 bp 重复微 卫星的突变速率 (Weber & Wong, 。 1993)
具有 特 定 的 功 能, 这 可 能 是 选 择 的 基 础。 例 如 发现 2 bp 重复序列至少可以 Hamada !" #$ ( . 1984) 影响一个哺乳动物基因的转录调节。④微卫星重复 单位存在缺陷 ( imperfection) 。Garza !" #$ ( 比 . 1995) 较了人与黑猩猩的一个微卫星序列 Mfd 59, 结果发 现黑猩猩中为正常的 TA 重复, 而人类中则存在着 的替换, 使得其重复区域发生改变, 这一改 TA!TT 变也 导 致 重 复 单 位 数 目 出 现 差 异 (黑 猩 猩 中 为 而人类中为 7 . 3) 。这种在重复区域的缺陷也 34 . 4, 可能在某些微卫星位点中起到限制等位基因长度的 作用。 ⑤ 重 复 区 域 碱 基 的 随 机 突 变。 Kruglyak !" 认为在微卫星重复单位不断增加的过程 #$ ( . 1998) 中, 碱基突变也在不断积累, 从而破坏了整个微卫星 长度的增加。微卫星重复单位长度的频率分布是由 于 DNA 滑链错配与碱基突变之间的平衡造成的。 这实际上与④是一致的。
大多数微卫星位点在体内所观察到的突变速率 估计 在 10 - 2 ~ 10 - 5 次 / 代 ( Weber & Wong, 。 1993 ) 这一速率取决于滑链错配速率与体内错配修复系统 的效率。体外试验显示 DNA 发生滑链错配的频率 很高 ( Schi tterer & Tautz, 。当微卫星被表达 1992) 在缺乏有效错配修复系统的宿主中时, 其不稳定性 要 比 正 常 时 高 10 ~ 5 X 103 倍( Chambers & 。 MacAvoy, 2000) 为了了解等位基因在特定群体中的数目、 大小 范围、 分布频率等是如何形成的, 往往需要借助于模 型来进行研究。从目前所进行的一些研究来看, 没 有一种模型能够适用于所有微卫星数据。一些计算 机模拟显示, 2 bp 重复微卫星的等位基因频率在人 类中其分布比较符合由 Ohta & Kimura ( 1973) 提出 的逐 步 突 变 模 型 ( stepwise mutation modei, SMM ) (Vaides !" #$ . , , 即突变所 1993; Shriver !" #$ . , 1993) 产生的新的等位基因是在原来的基础上增加或者减 少了一个重复单位。 Shriver !" #$ ( 对可变数 . 1993) 目串联重复 ( variabie number tandem repeats, VNTR,
真核生物基因组中广泛存在着串联重复序列。 根据重复单位大小的不同, 将重复序列 Tautz(1993) 分为 3 类: 卫星序列、 小卫星序列和微卫星序列。卫 星序列通常存在于异染色质, 主要分布在着丝粒区 域。其重复单位达上千个碱基, 重复程度可以达到 (Debrauwere !" #$ . , 。与卫星序列 103 ~ 107 次 1997) 相比, 小卫星序列和微卫星序列的重复单位要短, 重 复程度也小。对于小卫星序列和微卫星序列的区 分, 并没有特别明确的界限。通常将重复单位超过 位点长度约在 0 . 5 ~ 100 kb 的称为小卫 10 或 15 bp、 星序列; 而那些重复单位只有 1 ~ 5 bp, 长度仅为几 百 bp 的位点称为微卫星序列。二者之间还有一些 过渡类型 ( Chambers & MacAvoy, 2000; Debrauwere 。 !" #$ . , 1997) 自从发现串联重复序列具有高度可变的特性以 来,无论是在群体遗传学研究还是在个体识别及亲 子鉴定等方面都得到了广泛的应用。由于卫星序列 片段非常大,无法进行分析处理,实际使用的重复 序列主要为小卫星和微卫星。其中微卫星因具有片 段小、易操作,尤其可以经 PCR 扩增放大后再分 析等优点,而得到最为广泛的应用。 微卫星又称小串联重复( short tandem repeats,
到的新生链未配对重复单位数目比模板链多。反 之,如果未配对的重复单位位于模板链,则最终得 到的新生链未配对重复单位数目比模板链少(图 。 1) 微卫星在不同物种、 同一物种的不同位点, 乃至
Fig . 1
图 1 微卫星的滑链错配突变模型 Modei of microsateiiite mutation by repiication siippage(siipped-strand mispairing)
Hale Waihona Puke Baidu
!!!"
"
综 述
!!!" "
微卫星及其应用
张云武 张亚平!
650223) (中国科学院昆明动物研究所细胞与分子进化开放研究实验室 昆明
Oliver A . RYDER
(Center for Reproduction of Endangered Species,ZooIogicaI Society of San Diego,San Diego, CA 92112, USA)
4期
张云武等:微卫星及其应用
317
包括小卫星和微卫星) 的等位基因大小范围、 数目、 模式以 及 杂 合 度 等 进 行 了 计 算 机 模 拟, 并与根据 结果显示由计算机 SMM 模型得到的预期值相比较, 模拟得到的平均杂合度与由 SMM 模型得到的预期 值相符, 但由计算机模拟得到的等位基因的平均数 要比由 SMM 模型得到的预期值高。他们也将计算 机模拟结果与真实数据相比较, 结果显示 3 ~ 5 bp 重复单位的微卫星完全符合 SMM 模型, 1 ~ 2 bp 重 复单位的微卫星其次, 而 15 ~ 70 bp 的小卫星反而 更适于用无限等位 基 因 模 型 ( infinite allele model, 解释。Di Rienzo !" #$ ( 对人类群体数据 IAM) . 1994) 进行了分析, 认为双相突变模型 ( two phase mutation , 即绝大多数突变只引起一个重复单位 model, TPM) 的变化, 另外少部分突变使得新产生的等位基因发 生了若干个重复单位的变化, 这种模型能更好地解 释所观察到的微卫星等位基因的分布。上述这些模 型都假设对等位基因的大小没有限制, 作为相应的 结果, 他们预言在一个生殖隔离的群体中, 重复单位 的平均数倾向于随分歧时间的增加而相应地增大 (Goldstein !" #$ . , 。如 上 所 述, 1995; Slatkin, 1995 ) 一些实验结果也表明种内微卫星的进化可能存在着 方向性, 其等位基因的突变更倾向于增加而不是减 少重复单位数目 ( Rubinsztein !" #$ . , 1995; Amos !" 。但实际上, 绝大多 #$ . , 1996; Primmer !" #$ . , 1996) 数微卫星位点的重复单位数目小于 50 个 ( Garza !" 。许多研究表明微卫星位点的等位基因 #$ . , 1995) 大小受到某种限制 ( Stallings !" #$ . , 1991; Bowcock , 即当重复单位的数 !" #$ . , 1994; Garza !" #$ . , 1995) 目不断增大到一定程度后, 会反过来呈现丢失一些 重复单位片段从而回复到原有数目的趋势 ( Wierdl 。这些限制微卫星重复 !" #$ . , 1997; Bennett, 2000) 单位数目无限增加的因素可能有以下一些: ① 基因 转换 ( gene conversion ) 。基因转换是小卫星位点产 生新 等 位 基 因 的 一 个 重 要 机 制 ( Jeffreys !" #$ . , , 但关于基因转换是否也在微卫星进化中起重 1994) 要作用还不清楚。② 偏向性突变 ( biased mutation ) 。 如果存在使小等位基因倾向于增加重复单位数目, 而大等位基因则倾向于减少重复单位数目的偏向性 突变, 那么这也可能是导致微卫星等位基因的重复 单位数目受到限制的原因之一 (Garza !" #$ . , 1995; 。③ 选择 (selection) 。选择也可 Wierdl !" #$ . , 1997) 能是调节重复单位数目的一个因素。虽然微卫星在 基因组中的功能作用还不明确, 但某些微卫星位点
摘要:微卫星是广泛分布于真核生物基因组中的短串联重复序列(1 ~ 5 bp) ,具有突变速率快、多态性高 等特性。已被广泛应用于生物遗传作图、群体遗传研究、个体间亲缘关系鉴定等方面。简要论述了微卫星的突 变、位点的分离、数据的收集、在生物学中的应用及其存在的缺陷。 关键词:微卫星;突变机制;亲缘关系鉴定 中图分类号:@754,@343 . 1 文献标识码:A 文章编号:0254 - 5853 (2001) 04 - 0315 - 06