4基因组测序与序列组装
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
几种不同生物基因组的测序
4.2.1基因组测序的策略
1) 作图测序 2) 随机测序
4.2.2 基因组测序的覆盖面
基因组测序覆盖面(coverage):随机测序获得 的序列总长与单倍体基因组序列总长之比,覆 盖面越大,遗漏的序列越少。 测序覆盖率计算, P定义为丢失的概率. P0=e-m, m为覆盖面, 即当量数 若m=1 P0=e-1=0.37 若m=5 P0=e-5=0.0067=0.67% 若m=10 P0=e-10=4.5 x 10-5 =0.000045=0.0045%
3浏览测序
是粗略分析初步测序结果从中寻找基因编码顺序的方法。
本章结束
3’外切酶活性 5’外切酶活性
Klenow酶 加工性能差 sequence酶 加工效率高
制备单链DNA的方法
1将DNA克隆到质粒载体中,样品为双链DNA,需变性处理 使双链DNA变为单链. 优点:可获得大量样品,操作简便,可双向测序. 缺点:制备的样品中可能有未纯化的DNA沾染,会干扰测序 反应. 2以M13载体克隆单链DNA. M13载体是根据复制型M13基因组改进的双链DNA
4.2.3 间 隙 的 类 型
测序后将DNA顺序进行组装,会发现存在不 连续的区段.它们产生于: 1) 因覆盖率的原因而留下的未能测序的顺 序,仍存在于克隆文库中, 这类间隙称为 序列间隙. 2) 因克隆载体自身的限制或DNA顺序特 殊的组成等原因造成某些顺序丢失或未 能克隆, 这类间隙称为物理间隙.
通用引物:克隆位点附 近载体上的一段顺序
(SP6,T7)
内部引物:DNA长度大于 750bp必须根据前面已 知顺序合成新的引物延 伸测序
化学降解法测序
基本原理:在选定的核苷酸碱基中引入化学基 团再经化合物处理使DNA分子在被修饰的核 苷酸位置降解。4种核苷酸A、C、G、T均 可分别修饰,分别降解,形成只差一个核苷酸 的降解DNA群体。
毛细管电泳:采用毛细管电泳取代聚丙烯凝胶平板电泳, 一次可同时进行96次测序,大大提高测序效率(P62)。
自动化测序(荧光标记检测)
非常规DNA测序
光点测序(pyrosequencing):该方法无须电泳及其他 分离程序,不必ddNTP终止反应,可一直合成延伸下去, 因此比链终止法更加迅速。原理:当每个配对的核苷酸 加入到正在生长的新链末端时,根据发出的信号直接判 读。 引物
(Sanger等,1977)
原理:通过合成与单链DNA互补的多核苷酸链来读取待测 DNA分子的顺序,合成的互补单链可在不同位置随机终止 反应。
化学降解法(chemical degradation method)
(Maxam等,1977)
原理:双链DNA分子经化学试剂处理,可在特定的核苷酸 位点产生切口。用同位素标记碱基,以此确定顺序组成。
操作:双链DNA变性为单链DNA后(一端带标记
物),单一碱基的化学修饰后降解(控制修饰 剂浓度使每条单链只发生一处断裂),电泳后 带型分析。
注:不同核苷酸碱基的特异修饰方法见表
4.1(P59)。
自动化测序
链终止法采用放射性标记(ddNTP掺入同位素), 自动化测序采用荧光标记.二者的不同之处有三:
-
N N O H H 2’ OH H N
O
-
O
-
O P O P O P O CH2 O O O H H 3’ H OH ATP ddATP
ddNTP(3’碳原子连接的都是H,不能形成磷酸二酯键)
链终止法对DNA多聚酶的要求 1高酶活性 2无5’ 3无3’
多聚酶在终止合成前多聚核苷酸分子 可延伸的长度.
顺序间隙缝合
物理 间隙 缝合
4.2.4 插入片段的两端测序
利用长度不同插入子克隆两端测序搭建支架
4.3 序列组装
4.3.1 作图法测序与序列组装 从上至下的策略—图位法测序
基因组顺序组装的概念定义
1)
2) 3)
4)
5)
BAC 末端顺序(BAC-end sequenced) 一个BAC克隆插入片 段两端的已测序的顺序,不包括内部顺序. 可用于确定BAC 的排列方向以及重叠群(contig)在支架(scaffold)中的排 列方向. 重叠群(contig) 一群相互重叠的克隆或DNA顺序,可以是 草图顺序或精确顺序(finished), 包括连续的(内部无间 隙)或不连续的(内部含间隙)DNA顺序,未锚定到染色体上. 草图顺序(draft sequence) 人类基因组测序计划定义为 经Phred Q20软件认可覆盖测序克隆片段3-4倍的DNA顺序. 含间隙或无间隙, 排列方向和位置未定. 完成顺序(finished sequence) 顺序差错率(错误碱基数) 低于0.01%的DNA序列, 排列方向确定,内部不含间隙, 一 般测序覆盖率在8-10个当量. 支架(scaffold) 一组已锚定在染色体上的重叠群, 内部 含间隙或不含间隙. 引自NCBI, Revised November 6, 2003
4.3.2 鸟枪法测序与序列组装 从下至上的策略—随机法测序
关于基因组测序顺序的概念
1) 草图顺序: draft sequence 2) 完成顺序: finished sequence
草图顺序
1) 达到普通质量但尚未完成的基因组DNA顺序, 其精确度高于90%.所处染色体位置已知,一 般长度约10kb. 2) 草图顺序可分为3个等级: Phase 0: 测序覆盖顺序一次的DNA序列; Phase 1: 测序覆盖顺序4-10次的BAC克隆, BAC及内部片段的位置和排列方向 未定. Phase 2: 测序覆盖顺序4-10次的BAC克隆, BAC及内部片段的位置和排列方向 已定.
优点:M13载体如同质粒DNA克隆载体一样操作,但M13载 体提供的是包装在噬菌体中的单链DNA样品,不用变性直 接用于测序. 缺点:若重组M13载体大于3kb,在扩增时容易发生丢失与 重排事件,只适用于小片段DNA.
3以噬粒(phagemid)克隆DNA 改造过的质粒克隆载体,含有2个复制起始点:一个是质 粒自身的,另一个来自单链DNA 噬菌体基因组的复制起 始点.当大肠杆菌细胞同时含有噬粒和辅助噬菌体可激
4.1
DNA测序的方法学 4.2 DNA顺序的组装 4.3 基因组测序的其他路线
4.1 DNA测序的方法学
4.1.1 4.1.2 4.1.3 4.1.4
链终止法测序 化学降解法测序 自动化测序 非常规DNA测序
链终止法(the chain termination method)
wk.baidu.com
活噬菌体DNA复制产生含有单链的噬粒噬菌体.
优点:避免了M13系统的不稳定性,克隆片段≥10kb 4PCR产生单链DNA
根据测序DNA两端顺序合成2个引物,其中一个引物连接到 磁珠上,PCR后利用吸磁的办法提纯扩增的单链DNA.
It is an original idea!
引物的顺序决定了DNA测序的起点
完成顺序
1) 完成顺序系指已测序的, 每10000 个碱 基中出现一个差错, 且内部不存在间隙 的DNA顺序. 2) 完成顺序也称为Phase 3期顺序.
基因组测序的其他路线
1重要区域的优先测序
如人类主要组织相容性复合区(hMHC)的测序。
2EST测序
EST为探针很易从cDNA文库中筛选全长基因。
技术要点:
制备相同的单链模板DNA; 与一小段引物退火,形成 双链后起始新链的合成; DNA多聚酶催化,底物包括4种脱 氧核苷酸(dNTP) 及少量双脱氧核苷酸(ddNTP) ,合成的 新链终止于ddNTP.
双脱氧核苷酸ddNTP
链终止法对DNA多聚酶的要求
链终止法要求单链作为模板
NH 2 N O
模板DNA
图 解
+ dATP + dTTP
降解
降解
发光 降解 发光 GA G
+
dGTP + dCTP + dATP +
非常规DNA测序
DNA芯片测序:将各种排列顺序的寡聚核苷酸点播
在面积很小的芯片上,每个点播的寡聚核苷酸在排 列的方阵中都有指定的位置。待测的DNA分子与芯 片温浴,凡是能杂交的寡聚核苷酸都会在确定位置 发出信号,然后根据获取的信息将寡聚核苷酸顺序 比对组装,拼接成完全的DNA顺序(P62)。
物理图绘制的四种方法?
①限制性作图(restriction mapping)是将限制性酶切 位点标定在DNA分子的相应位置 ②依靠克隆的基因组作图(clone-based mapping)根据 克隆的DNA片段之间的重叠顺序构建重叠群,绘制物理 连锁图 ③荧光标记原位杂交(FISH fluorescent in situ hybridization )将荧光标记的探针与染色体杂交确 定分子标记的所在位置 ④顺序标签位点作图(STS sequence tagged site) 通 过PCR或分子杂交将小段DNA顺序定位在基因组的DNA区 段中
1)辐射杂种 两个标记滞留在同一杂种细胞中的比例与其之间的连 锁关系成正比. 2)克隆作图 作图试剂来自:全基因组DNA或单一染色体构建的基 因组文库,然后采取PCR检测STS的克隆,根据重叠的 STS标记可绘制克隆连锁图.
§4 基因组测序与序列组装
基因组测序的终极目标是获取生物完整 的DNA顺序,理想的状况是将物理图与遗传图 进行有机的整合,这样便于确定基因以及其 他重要的序列在DNA顺序中的位置。
⑴后者以荧光颜色作为标记颜色;⑵整个反应在一个试 管中进行,一个泳道同时判读4种碱基;⑶当新合成的终止 单链通过荧光监测仪时,可由光信号读出末端核苷酸并 由电脑记录。
荧光标记法:不同的荧光色彩标记化合物可分别与四种 不同的ddNTP结合后通过荧光检测仪时激发出不同颜色的 光(如ddATP红光、如ddCTP蓝光、如ddTTP绿光、如 ddGTP黄光),因而可直接读出延伸链末端的ddNTP类型 (P61)。
局限性:每次可测定的DNA分子长度受到限制。
DNA
DNA芯片
杂交
共聚焦显微镜
ATAGGCAT TAGGCATA AGGCATAC …ATAGGCATAC…
4.2 基因组测序
1) 2) 3) 4) 4) 5) 大肠杆菌基因组测序----图位法 流感嗜血杆菌基因组测序---鸟枪法 果蝇基因组测序---鸟枪法 人类基因组测序---图位法和鸟枪法 拟南芥基因组测序—图位法 水稻基因组测序---图位法和鸟枪法
什么是STS? STS物理图定位的方 法有几种分别是什么?
STS(sequence tagged site)是一小段长度在100500bp的DNA顺序,每个基因组仅1份拷贝,很易分辨。 当2个片段含有同一STS顺序时,可以确认这2个片段彼 此重叠。2个不同的STS出现在同一片段的机会取决于 它们在基因组中的位置靠得多近。
4.2.1基因组测序的策略
1) 作图测序 2) 随机测序
4.2.2 基因组测序的覆盖面
基因组测序覆盖面(coverage):随机测序获得 的序列总长与单倍体基因组序列总长之比,覆 盖面越大,遗漏的序列越少。 测序覆盖率计算, P定义为丢失的概率. P0=e-m, m为覆盖面, 即当量数 若m=1 P0=e-1=0.37 若m=5 P0=e-5=0.0067=0.67% 若m=10 P0=e-10=4.5 x 10-5 =0.000045=0.0045%
3浏览测序
是粗略分析初步测序结果从中寻找基因编码顺序的方法。
本章结束
3’外切酶活性 5’外切酶活性
Klenow酶 加工性能差 sequence酶 加工效率高
制备单链DNA的方法
1将DNA克隆到质粒载体中,样品为双链DNA,需变性处理 使双链DNA变为单链. 优点:可获得大量样品,操作简便,可双向测序. 缺点:制备的样品中可能有未纯化的DNA沾染,会干扰测序 反应. 2以M13载体克隆单链DNA. M13载体是根据复制型M13基因组改进的双链DNA
4.2.3 间 隙 的 类 型
测序后将DNA顺序进行组装,会发现存在不 连续的区段.它们产生于: 1) 因覆盖率的原因而留下的未能测序的顺 序,仍存在于克隆文库中, 这类间隙称为 序列间隙. 2) 因克隆载体自身的限制或DNA顺序特 殊的组成等原因造成某些顺序丢失或未 能克隆, 这类间隙称为物理间隙.
通用引物:克隆位点附 近载体上的一段顺序
(SP6,T7)
内部引物:DNA长度大于 750bp必须根据前面已 知顺序合成新的引物延 伸测序
化学降解法测序
基本原理:在选定的核苷酸碱基中引入化学基 团再经化合物处理使DNA分子在被修饰的核 苷酸位置降解。4种核苷酸A、C、G、T均 可分别修饰,分别降解,形成只差一个核苷酸 的降解DNA群体。
毛细管电泳:采用毛细管电泳取代聚丙烯凝胶平板电泳, 一次可同时进行96次测序,大大提高测序效率(P62)。
自动化测序(荧光标记检测)
非常规DNA测序
光点测序(pyrosequencing):该方法无须电泳及其他 分离程序,不必ddNTP终止反应,可一直合成延伸下去, 因此比链终止法更加迅速。原理:当每个配对的核苷酸 加入到正在生长的新链末端时,根据发出的信号直接判 读。 引物
(Sanger等,1977)
原理:通过合成与单链DNA互补的多核苷酸链来读取待测 DNA分子的顺序,合成的互补单链可在不同位置随机终止 反应。
化学降解法(chemical degradation method)
(Maxam等,1977)
原理:双链DNA分子经化学试剂处理,可在特定的核苷酸 位点产生切口。用同位素标记碱基,以此确定顺序组成。
操作:双链DNA变性为单链DNA后(一端带标记
物),单一碱基的化学修饰后降解(控制修饰 剂浓度使每条单链只发生一处断裂),电泳后 带型分析。
注:不同核苷酸碱基的特异修饰方法见表
4.1(P59)。
自动化测序
链终止法采用放射性标记(ddNTP掺入同位素), 自动化测序采用荧光标记.二者的不同之处有三:
-
N N O H H 2’ OH H N
O
-
O
-
O P O P O P O CH2 O O O H H 3’ H OH ATP ddATP
ddNTP(3’碳原子连接的都是H,不能形成磷酸二酯键)
链终止法对DNA多聚酶的要求 1高酶活性 2无5’ 3无3’
多聚酶在终止合成前多聚核苷酸分子 可延伸的长度.
顺序间隙缝合
物理 间隙 缝合
4.2.4 插入片段的两端测序
利用长度不同插入子克隆两端测序搭建支架
4.3 序列组装
4.3.1 作图法测序与序列组装 从上至下的策略—图位法测序
基因组顺序组装的概念定义
1)
2) 3)
4)
5)
BAC 末端顺序(BAC-end sequenced) 一个BAC克隆插入片 段两端的已测序的顺序,不包括内部顺序. 可用于确定BAC 的排列方向以及重叠群(contig)在支架(scaffold)中的排 列方向. 重叠群(contig) 一群相互重叠的克隆或DNA顺序,可以是 草图顺序或精确顺序(finished), 包括连续的(内部无间 隙)或不连续的(内部含间隙)DNA顺序,未锚定到染色体上. 草图顺序(draft sequence) 人类基因组测序计划定义为 经Phred Q20软件认可覆盖测序克隆片段3-4倍的DNA顺序. 含间隙或无间隙, 排列方向和位置未定. 完成顺序(finished sequence) 顺序差错率(错误碱基数) 低于0.01%的DNA序列, 排列方向确定,内部不含间隙, 一 般测序覆盖率在8-10个当量. 支架(scaffold) 一组已锚定在染色体上的重叠群, 内部 含间隙或不含间隙. 引自NCBI, Revised November 6, 2003
4.3.2 鸟枪法测序与序列组装 从下至上的策略—随机法测序
关于基因组测序顺序的概念
1) 草图顺序: draft sequence 2) 完成顺序: finished sequence
草图顺序
1) 达到普通质量但尚未完成的基因组DNA顺序, 其精确度高于90%.所处染色体位置已知,一 般长度约10kb. 2) 草图顺序可分为3个等级: Phase 0: 测序覆盖顺序一次的DNA序列; Phase 1: 测序覆盖顺序4-10次的BAC克隆, BAC及内部片段的位置和排列方向 未定. Phase 2: 测序覆盖顺序4-10次的BAC克隆, BAC及内部片段的位置和排列方向 已定.
优点:M13载体如同质粒DNA克隆载体一样操作,但M13载 体提供的是包装在噬菌体中的单链DNA样品,不用变性直 接用于测序. 缺点:若重组M13载体大于3kb,在扩增时容易发生丢失与 重排事件,只适用于小片段DNA.
3以噬粒(phagemid)克隆DNA 改造过的质粒克隆载体,含有2个复制起始点:一个是质 粒自身的,另一个来自单链DNA 噬菌体基因组的复制起 始点.当大肠杆菌细胞同时含有噬粒和辅助噬菌体可激
4.1
DNA测序的方法学 4.2 DNA顺序的组装 4.3 基因组测序的其他路线
4.1 DNA测序的方法学
4.1.1 4.1.2 4.1.3 4.1.4
链终止法测序 化学降解法测序 自动化测序 非常规DNA测序
链终止法(the chain termination method)
wk.baidu.com
活噬菌体DNA复制产生含有单链的噬粒噬菌体.
优点:避免了M13系统的不稳定性,克隆片段≥10kb 4PCR产生单链DNA
根据测序DNA两端顺序合成2个引物,其中一个引物连接到 磁珠上,PCR后利用吸磁的办法提纯扩增的单链DNA.
It is an original idea!
引物的顺序决定了DNA测序的起点
完成顺序
1) 完成顺序系指已测序的, 每10000 个碱 基中出现一个差错, 且内部不存在间隙 的DNA顺序. 2) 完成顺序也称为Phase 3期顺序.
基因组测序的其他路线
1重要区域的优先测序
如人类主要组织相容性复合区(hMHC)的测序。
2EST测序
EST为探针很易从cDNA文库中筛选全长基因。
技术要点:
制备相同的单链模板DNA; 与一小段引物退火,形成 双链后起始新链的合成; DNA多聚酶催化,底物包括4种脱 氧核苷酸(dNTP) 及少量双脱氧核苷酸(ddNTP) ,合成的 新链终止于ddNTP.
双脱氧核苷酸ddNTP
链终止法对DNA多聚酶的要求
链终止法要求单链作为模板
NH 2 N O
模板DNA
图 解
+ dATP + dTTP
降解
降解
发光 降解 发光 GA G
+
dGTP + dCTP + dATP +
非常规DNA测序
DNA芯片测序:将各种排列顺序的寡聚核苷酸点播
在面积很小的芯片上,每个点播的寡聚核苷酸在排 列的方阵中都有指定的位置。待测的DNA分子与芯 片温浴,凡是能杂交的寡聚核苷酸都会在确定位置 发出信号,然后根据获取的信息将寡聚核苷酸顺序 比对组装,拼接成完全的DNA顺序(P62)。
物理图绘制的四种方法?
①限制性作图(restriction mapping)是将限制性酶切 位点标定在DNA分子的相应位置 ②依靠克隆的基因组作图(clone-based mapping)根据 克隆的DNA片段之间的重叠顺序构建重叠群,绘制物理 连锁图 ③荧光标记原位杂交(FISH fluorescent in situ hybridization )将荧光标记的探针与染色体杂交确 定分子标记的所在位置 ④顺序标签位点作图(STS sequence tagged site) 通 过PCR或分子杂交将小段DNA顺序定位在基因组的DNA区 段中
1)辐射杂种 两个标记滞留在同一杂种细胞中的比例与其之间的连 锁关系成正比. 2)克隆作图 作图试剂来自:全基因组DNA或单一染色体构建的基 因组文库,然后采取PCR检测STS的克隆,根据重叠的 STS标记可绘制克隆连锁图.
§4 基因组测序与序列组装
基因组测序的终极目标是获取生物完整 的DNA顺序,理想的状况是将物理图与遗传图 进行有机的整合,这样便于确定基因以及其 他重要的序列在DNA顺序中的位置。
⑴后者以荧光颜色作为标记颜色;⑵整个反应在一个试 管中进行,一个泳道同时判读4种碱基;⑶当新合成的终止 单链通过荧光监测仪时,可由光信号读出末端核苷酸并 由电脑记录。
荧光标记法:不同的荧光色彩标记化合物可分别与四种 不同的ddNTP结合后通过荧光检测仪时激发出不同颜色的 光(如ddATP红光、如ddCTP蓝光、如ddTTP绿光、如 ddGTP黄光),因而可直接读出延伸链末端的ddNTP类型 (P61)。
局限性:每次可测定的DNA分子长度受到限制。
DNA
DNA芯片
杂交
共聚焦显微镜
ATAGGCAT TAGGCATA AGGCATAC …ATAGGCATAC…
4.2 基因组测序
1) 2) 3) 4) 4) 5) 大肠杆菌基因组测序----图位法 流感嗜血杆菌基因组测序---鸟枪法 果蝇基因组测序---鸟枪法 人类基因组测序---图位法和鸟枪法 拟南芥基因组测序—图位法 水稻基因组测序---图位法和鸟枪法
什么是STS? STS物理图定位的方 法有几种分别是什么?
STS(sequence tagged site)是一小段长度在100500bp的DNA顺序,每个基因组仅1份拷贝,很易分辨。 当2个片段含有同一STS顺序时,可以确认这2个片段彼 此重叠。2个不同的STS出现在同一片段的机会取决于 它们在基因组中的位置靠得多近。