DNA分子标记及其数据库:indel标记
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
简单indel编码(simple indel coding)是Simmons and Ochoterena(2000)提出的。它在一个数据矩阵中将空位编码 成一个独立的性状。每一个具有不同5 ’和/或3’ 末端的空位 被编码成一个独立的存在/缺失性状。如果一个空位完全覆 盖另外一条序列的空位,也就是说,如果一个空位是另外一 个长空位的子集,那么包含长空位的这条序列对于这个短的 空位是不可编码的,而认为包含长空位的序列与在这个区域 存在碱基的序列是同源的。这是因为不可能确定这个短的空 位是否存在于长的空位中。
诸多悬念。
2005年起,他们通过生物信息学技术对人、黑猩猩、恒河猴、小鼠、果蝇、水稻和酿
酒酵母等不同类别生物的基因组序列进行了比对分析。研究后发现,DNA的插入/缺失
(Indel)会引起其周围一系列的变异。在此基础上,他们提出了“Indel诱导自发突变机制假
说”,从源头上成功回答了“遗传变异究竟是如何形成的”这一生命科学面临的基本问题。该
说,生物多样性的最初变异来源,主要是由Indel诱导产生;第三,自然选择在
很大程度上是通过对Indel的选择而实现,而自发突变率的高低很大程度上也是
自然选择的结果;第四,生物通过调节自身变异能力而适应环境的能力,比人们
原先想象的要大得多,即突变在进化中的作用相当巨大。
该研究成果不仅引发了大量科学问题,还具有潜在的应用前景,如体细胞中
幻灯片 14 微软用户1
空位1存在于序列A和B中。空位2存在于序 列C和D中。空位3存在于序列A中。空位4存在 于序列c中。空位5存在于序列D中。在数据矩阵 中,序列c和D中对于空位1时缺失的,序列A和 B对于空位2是缺失的,序列c对于空位3和5是 不可编码的。所以当使用简单indel编码时,空位3和5对于这4条序列不是信息位点。
假说可用不同物种的基因组作参照系加以检验,并得到多种检验结果的支持。
田大成解释说,基因突变主要是指DNA中核苷酸顺序、种类和数量的改变,而DNA序
列中普遍存在的点(碱基)突变是遗传变异的基本来源。点突变又分为自发突变和诱发突
变。长期以来,学术界对自发突变机制的经典认识是,自发突变受一系列因素的影响,是 一系列变化的结果,具有随机性和稀有性。但随着上个世纪90年代以来DNA测序技术的突 破性进展,研究者们对自发突变在基因组中的数量和分布有了精确估计,并普遍认为“自发 突变在基因组中不是随机分布的,突变热点普遍存在于基因组中”。这一结论对传统的自发 突变随机性和稀有性的认识形成巨大挑战,而这种现象也引起了各国科学家的极大关注, 但遗憾的是始终没有找到一种普遍的机制来解释这一重大的科学疑问。
③引物序列的GC含量最好在40%--60%,且上下游引物序列GC含量的差异不要 太大,3’端最后5个碱基最好不要富含GC,特别是连续3个的G或C
④DNA双链形成所需的自由能△G,应该以5’端向3’端递减,3’端△G最好不要高 于9.0 kcal/mol .
⑤避免形成稳定的引物二聚体(Dimer and Cross Dimer)和发夹结构(Hairpin) , AG高于4.5 kcal/mol时易引发上述两种结构的产生。
当一条序列发生插人或者缺失时,与之比对的另一条序列就会相应地产 生空位;
2)空位的长度表现出一个双峰(bimodal type)的频率分布,短的空位 (20~30核苷酸)主要是由DNA复制过程的错误造成, 比如滑动链的错 配,而长的插入和缺失的发生主要是由不等长的互换或者DNA错位造 成。
生物学上,空位被认为是序列从共同的祖先分化时产生的插入或缺 失。
1.1 形态标记(Morphological Markers)
形态标记是指生物的外部特征特性。包括质量性状作遗 传标记和数量性状作遗传标记,例如人的肤色、作物的株 高、种子的粒形和动物的体重等。它是最早被使用和研究的 一类遗传标记。在遗传的分离规律、自由组合定律和连锁交 换定律以及群体遗传学和数量遗传学的研究和应用等方面发 挥着重要作用。它具有易于识别和掌握、简单直观等优点, 但也具有标记数量少、多态性差和易受环境因素影响等不 足。
1.2 细胞标记(Cytological Markers)
细胞标记主要指染色体组型和带型。染色体组型是指生物体细胞所
有可测定的染色体特征总称。包括染色体总数、染色体组数、每条染色
体大小和形态、着丝点的位置等。它是物种特有的染色体信息之一,具
有很高的稳定性和再现性。对鉴别真假杂种、对研究染色体结构和数目
究、进化分类、遗传育种、医学和法学等方面,成为分子遗
传学和分子生物学研究与应用的主流之一。
与其它遗传标记相比较,DNA分子标记具有诸多优点:1)能对生 物各发育时期的个体、各组织、器官和细胞进行检测,直接以DNA的 形式表现,不受环境影响,不存在基因表达与否的问题;2)数量丰 富,遍及整个基因组;3)遗传稳定,多态性高;4)对生物体的影响 表现为“中性”,不影响目标性状的表现,和不良性状无必然连锁;5) 多为共显性,能为鉴别纯合基因型和杂合基因型提供完整的遗传信 息;6)操作简便等等。这些优点使其广泛地应用于生物基因组研 究、进化分类、遗传育种、医学和法学等方面,成为分子遗传学和分 子生物学研究与应用的主流之一,并且对社会产生巨大冲击。目前, 被广泛应用的DNA分子标记主要有RFLP(限制性片段长度多态 性)、RAPD(随机扩增多态性DNA)、ALFP(扩增片段长度多态 性)、STS(序列标记位点)、SSR or SSLP(简单重复序列)、 Indel(插入缺失序列)DNA指纹技术等。
本文以水稻Indel标记的开发为例
水稻是最重要的粮食作物,也是单子叶模式植物。水稻重要基因的 精细定位和克隆已成为当前植物功能基因组学研究的热点之一,而功能 基因克隆的最基本和最重要的方法是图位克隆。图位克隆的关键是寻找 与目标基因紧密连锁的分子标记,然而,目标基因周围已有的分子标记 密度常常不能满足需要。因此,合理地利用亲本之间DNA 序列的多态性 来发展新的分子标记,是提高图位克隆效率的重要方法。双亲间DNA序 列的多态性是发展分子标记的基础,基于PCR的共显性分子标记是现在 最常用的标记类型。通常用于发展这类分子标记的DNA序列多态性有3 种基本的形式:简单序列重复长度多态性(simple sequence repeat length poly—morphism,SSR)、插入缺失长度多态性 (insertiondeletionlength polymorphism,InDel)和单核苷酸多态性(single nucleotide polymorphism,SNP),由这3种基本的多态性产生的分子标 记分别为SSR标记、InDel标记和SNP标记。
的变异、物种起源和生物的遗传进化等具有重要价值。带型是用染色体
分带技术体所产生的明显的染色带(暗带)和未染色的明带相间的带
纹,使染色体呈现鲜明的个体性。因此,可以把染色体带型作为一种遗
传标记,有效地识别不同物种之间、同一物种不同染色体之间的差异。
带型有Q带、G带、R带、T带等类型,但是该遗传标记也有其标记数目
Indel标记
Introduction
分子系统学研究的关键步骤是序列比对和系统发育重建。大多数情况 下序列比对需要在序列中插入空位(gap)。对齐好的序列通过某种系统发 育重建(phylogenetic reconstruction)算法得到一棵或一组系统发育树。
从分子的观点将空位描述为: 1)插入和缺失都归诸于空位(或者indels),这是因为与原序列相比,
田大成等发现的遗传突变新机制具有重大科学意义,成功破解了生物遗传学
上的很多悬念:第一,基因组各区域的突变率很不相同,自发突变的数量是由
Indel的数量和密度所决定,自发突变的数量在Indel附近并不稀有,远离Indel的
区域是稀有的,但Indel本身是一种点突变,其发生有一定的随机性,因而其诱
发的突变也有一定的随机性;第二,找到了多数自发突变的发生根源,也就是
的Indel诱变效应,可能是解开肿瘤发生机制的关键;大量Indel的总体诱变效
应,对理解生命的起源具有重要作用;杂合体Indel的放大诱变效应,可使基因
的突变率大大提高,在作物遗传育种中有重大潜在应用价值。
(《自然》(Nature),doi:10.1038/nature07175,Dacheng Tian,Jian-Qun Chen)
Indel Markers
汇报人:郎需勇 学号:2008202040083
引言 Indel标记
Outline
引言
遗传标记(Genetic Markers)是基因型特殊的易于识别的表现形 式。它一般具有较强的多态性、表现的共显性、不影响重要的农艺性 状和经济方便、易于观察记载等优点。它在遗传学的建立和发展过程 中起着重要作用。随着遗传学的发展,遗传标记也在不断的发展。从 遗传学的建立到现在,遗传标记的发展主要经历了4个阶段,表现出了 4种类型。 1 形态标记(Morphological Markers) 2 细胞标记(Cytological Markers) 3 生化标记(Biochemical Markers) 4 DNA分子标记(Molecular Markers)
另外,同工酶研究也有助于探讨生物个体发育过程中基因表达与调控。
生化标记具有简便、经济、快速和准确等优点,但是同样具有标记数目
有限的缺点。贮藏蛋白与种子的萌发等发育过程有关,也具有生物种属
的特异性,可以作为遗传标记。例如,马铃薯蛋白是马铃薯块茎中的主
要蛋白(贮藏蛋白),玉米醇溶蛋白是玉米种子内的贮藏蛋白,按其结
⑥引物所在的模板区域应该位于外显子区,最好跨越一个内含子区,这样便于对 扩增出来的片段进行功能鉴定和表型分析。
⑦如果以DNA为模板设计引物,产物长度在100-600 bp比较理想。而以mRNA 为模板设计引物时,产物长度在150-300bp比较理想。5'端对PCR影响不太大, 可以引进修饰位点和标记物.
微软用户, 2009-5-25
Indel标记 How to exploit it?
引物设计的原则和注意事项: ①引物的长度一般为15-30 bp,最好在18-24 bp,因为太短易形成错配(false
priming)降低特异性,而太长也会降低特异性,并且ห้องสมุดไป่ตู้低产量。
②引物在模板内最好具有单一性,也就是说在模板内部没有错配。特别是3’端, 一定要避免连续4个以上的碱基互补错配。
有限的弱点。
1.3 生化标记(Biochemical Markers)
生化标记是指生物的生化特征特性,主要包括同工酶和贮藏蛋白两
种标记。同工酶是生物体代谢的调节者,与特殊的生理功能和细胞分化
相联系,也与基因进化和物种的演变有关,因此,同工酶既可作为生理
指标又可作为遗传标记在生物群体的遗传进化和分类研究中广为应用。
理论应用
Single-nucleotide mutation rate increases close to insertions/deletions in eukaryotes
在丰富多彩的生命世界,究竟什么原因造就诱人的生命多样性?南京大学教授经多年
潜心研究大胆提出“Indel诱变假说”,用新发现的“遗传突变的普遍机制”破解了生物学上的
构和溶解度分为α、β、γ和δ四大类等。
1.4 DNA分子标记(Molecular Markers)
DNA分子标记是能反映生物个体或种群间基因组中某
种差异特征的DNA片段。此DNA片段是将基因组DNA经过
限制性内切酶切割和分子杂交或PCR扩增后在电泳凝胶上
(或杂交膜上)检测到的。它广泛地应用于生物基因组研
通过以下例子(见图1)说明其编码空位的原理。
微软用户1
(1)
(2)
(1)中①代表空位1,位置从3到9;②代表空位2,位置从7到11;③代表 空位3,位置从21到23;④代表空位4,位置从21到28;⑤代表空位5, 位置从24到28.
(2)数据矩阵中的空位性状.⋯0’表示空位性状缺失,“1”表示空位性状存 在,“-”表示性状不可编码