第4章 基因组测序与序列组装

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

The mapped BAC-by-BAC shotgun sequencing strategy
(24kb)
Major steps in BAC-by-BAC shotgun sequencing
线 虫 基 因 组 采 用 克 隆 重 叠 群 法 测 序
§ 4.2.3 鸟枪法测序与序列组装 鸟枪法测序 • 将DNA分子打断成小片段,测定每一段的序列,根据每个
如何获得单链DNA?
3)以噬菌粒(phagemid)载体克隆DNA
• 这是一种改造过的质粒克隆载体,含有两个复制起点, 一个是质粒自身的复制起点,一个是单链DNA噬菌体基
因组的复制起点
• 当大肠杆菌细胞中同时含有噬粒和辅助噬菌体时,因为 辅助噬菌体携带的编码噬菌体复制酶和外壳蛋白的基因
可以激活噬菌粒上的噬菌体复制起始位点,产生含单链 的噬粒噬菌体
2)以M13载体克隆单链DNA
• M13噬菌体载体是专门为得到单链DNA测序模板而设计的。
• M13噬菌体本来含有单链DNA基因组,感染大肠杆菌的M13 可转变为双链复制型。 M13噬菌体载体是双链的,相当于 M13噬菌体的复制型。 • 用含有待测序片段的M13噬菌体载体感染大肠杆菌,大肠 杆菌分泌的噬菌体就含有单链DNA基因组。 • 缺点:只能用于短片段DNA,大于3kb的片段在克隆过程中 会发生丢失和重排。
支架(scaffold)
一组已锚定在染色体上的重叠群, 内部含间隙或 不含间隙.
草图序列(draft sequence)
人类基因组测序计划定义为经Phred Q20软件认可 覆盖测序克隆片段3-4倍的DNA顺序. 含间隙或无 间隙, 排列方向和位置未定
完成序列(finished sequence)
碱基特异的化学切割反应
碱基 G A+G 特异修饰方法 pH8.0,用硫酸二甲酯对 N7进行甲基化,使 C8C9键对碱基裂解有特殊敏感性 pH2.0 哌啶甲酸可使嘌呤环的N原子位置脱嘌 呤,并因此消弱腺嘌呤和鸟嘌呤的糖苷键 肼可打开嘧啶环,后者重新环化成五元环后易除 去 1.5mol/L NaCl存在时,可用肼除去胞嘧啶
序列差错率(错误碱基数)低于0.01%的DNA序列, 排列方向确定,内部不含间隙, 一般coverage 达 到8-10
§ 4.2.2克隆重叠群测序与序列组装 克隆重叠群测序又称为作图法测序(mapbased sequence)或者克隆依次测序(cloneby-clone)
BAC-by-BAC
2015-4-23
Leabharlann Baidu
§ 4.2 基因组测序与组装 § 4.2.1 一些术语 覆盖面(coverage)
• 是指随机测序中获得的序列总长与单倍体基因组序列总长之 比,coverage 越大,遗漏的序列越少 • 可以用P0=e-m计算,P0为丢失的概率,m为coverage 如果m=1, P0=37% m=6, P0=0.25% m=8, P0=0.034% • 要使测序的覆盖率达到 99.99% ,就必须使 coverage 达到8 次 以上
21
§ 4.1.3 焦磷酸测序法(pyrosequencing)
也叫454测序技术 不需要克隆得到DNA模板,不需要电泳或其他任 何片段分离程序 高通量的一种测序方法,一种二代测序技术
2015-4-23
DNA Bead
Enzyme Bead
•Polymerase adds nucleotide (dNTP)
24
氧化萤光素发出的可见光信号与加入核苷酸数成正比
加apyrase双磷 酸酶降解未反应 的dNTPs
Second generation sequencers
高通量! 454
400bp/400Mb Metagenomics De novo sequencing RNA-seq De novo sequencing Novel genome(s)
Solexa
120bp/4060Gb
RNA-seq, Re-sequencing Both types
ChIP-seq,
Meth-seq
SOLiD
50bp/80100Gb
Re-sequencing
“known”
ChIP-seq
RNA-seq
Genome
• 第二代测序技术采用了高通量测序技术,使测序通量大大 提高,从Sanger测序法一次读取一条序列到毛细管测序的 一次读取96条序列再到现在的一次读取几百万条序列的实 现,这是对第一代测序技术的一次革命性的变革 • 然而第二代测序技术并不完美,由于其在测序前要通过 PCR手段对待测片段进行扩增,因此增加了测序的错误率 。并且其测序结果比较短,更适合重测序,而不太适用于 没有基因组序列的全新测序。
• 两种形态的PAGE
毛细管电泳有96 个泳道,可同时 进行96次测序
Automated DNA sequence workflow
DNA template preparation
Cycle sequencing :384-well plate, 每个 well中,加上4种dNTPs和四种带不同荧光标 记的ddNTP,测序酶,模板DNA,单侧引物, 放于热循环仪(thermocycler)上进行反应 60 cycles: 95oC 30s 50oC 20s 60oC 4min
• 优点:克隆片段可达10kb以上
链终止法所用的DNA聚合酶
• 高持续合成能力(processivity)
聚合酶由于自然原因终止反应前所合成的多聚核苷酸的长 度
• 无5' →3'外切酶活性 • 无3' →5'外切酶活性 • 目前普遍采用的测序酶为Sequenase, 来自T7噬菌 体,除具有以上特点,还具有其它特征,比如反应 快速
化学降解法测序
DNA模板有链内碱基配对时也可用化学降解法测序
化学降解法基本原理及步骤
i.首先对待测片段作末端标记,用放射性32P-磷酸基团 标记链的末端之一 ii. 进行四组平行的反应:(G,A+G,C+T以及C)特异 性切割 iii. 最后进行聚丙烯酰胺凝胶电泳和放射自显影。比较 G、A+G、C+T和C各个泳道,自下而上从自显影片上就可 读出DNA序列
片段的重叠部分再组装成主体序列 • 可以不需要事先了解基因组信息,不需要构建遗传图或物 理图,但不适合大基因组
全基因组鸟枪法测序
应用图谱帮助主要序列组装
鸟枪法测序实例-流感嗜血杆菌序列测定
1)建立高度随机、插入片段大小为2kb左右的基因组文库。 克隆数要达到一定数量,即经末端测序的克隆片段的碱基 总数应达到基因组5倍以上。 2)高效、大规模的末端测序。对文库中每一个克隆,进 行两端测序,流感嗜血杆菌基因组的测定完成,使用了14 台测序仪,用三个月时间完成了必需的28,643个测序反应,
A A T C G G C A T
dTTP
聚合酶
Polymerase
G
C
T
A
A
A
A
G
T
C
A T
5’-磷酰硫酸
APS
PPi
Annealed Prim
•Pyrophosphate is released (PPi)
Sulfurylase Luciferase
CCD camera detects bursts of light
测序总长度达6倍基因组,得到140个contigs
3)填补缺口。 42个物理间隙和99个序列间隙 ,建立插入 片段为15-20kb的λ 文库以备缺口填补
序列间隙(sequence gap)

测序时遗漏的序列,这些序列仍然保留在尚未挑选到的 克隆中 • 可以通过利用相邻已知顺序作为探针,筛选已有的基因组 文库,挑选阳性克隆重新测序关闭间隙
引物决定待测模板DNA区域
自动化测序 • 是在Sanger 双脱氧链终止法的基本原理上 发展起来的:
1)荧光染料(fluorescent dye)标记取代了放射 性标记,由于由于每种ddNTP带有各自特定的荧光 颜色,而简化为由1个泳道同时判读4种碱基
2)毛细管(capillary gel)电泳取代了平板胶 (slab gel)电泳
第四章 基因组测序与序列组装
§ 4.1 DNA测序的方法
§ 4.2 基因组测序与序列组装
§ 4.3 基因组测序的其他路线
§ 4.1 DNA测序的方法 § 4.1.1 Maxam-Gilbert 化学 降解法
(chemical degradation method)
化学修饰DNA测序法, A.M.Maxam和W.Gilbert于 1977年发明。化学降解法主 要用于测定短片段DNA的序 列 例如启动子测序
C+T C
DNA标记与分离:
• 先放射性标记DNA链5'端 • 加入二甲基亚砜DMSO,加热 到90度,打开双链 • 电泳分离 一条链比另一 条链嘌呤核苷酸多,跑得 慢,称为重链 • 纯化一条链,分成4份,每 样都用一种切割试剂处理
6
"G"反应
• 加入有限的硫酸二甲酯处 理,使每个多聚核苷酸上 只能修饰一个G残基 • 加入哌啶使链断裂 哌啶首先去除修饰的嘌呤 环,并在紧邻所产生的无 碱基位点上游的磷酸二酯 键出切割DNA
ATP
硫酸化酶
•Sulfurylase creates ATP from PPi and APS
萤光素 luciferin
萤光素酶
Light + oxy luciferin
• Luciferase hydrolyses AT to oxidize luciferin and produce light
dNTP与ddNTP的分子结构
分别进行反应
如何获得单链DNA?
1)将DNA克隆到质粒载体中
• 获得测序模板DNA最常用的方法 • 获得的DNA通过热变性或者碱变性转变为单链DNA进行测序 • 优点是可双向测序 • 缺点是样品可能有少量细菌的DNA或者RNA污染,会干扰测 序
如何获得单链DNA?
物理间隙 (physical gap)
• 建基因组文库时丢失的DNA序列,即基因组文库中没有这 些序列的克隆
• 物理间隙的填补需要利用其他载体或者宿主菌重新构建一
个基因组文库,然后利用间隙两侧的序列作为探针,或者
制备相应的PCR引物,从新文库筛选阳性克隆,重新测序
• 高度重复序列造成的gap很难填补
§ 4.1.4 第三代测序技术
Helicos公司的Heliscope单分子测序仪、Pacific Biosciences公司的SMRT技术和 Oxford Nanopore Technologies 公司正在研究的纳米孔单分子技术, 被认为是第三代测序技术 又称为下下一代的测序(next-next-generation sequencing)的直接测序方法 这一测序技术是基于纳米孔(nanopore)的单分 子读取技术,不同于之前的两代技术,可以直接读 取序列信息,简洁快速,成本更低廉
读序(read)
每次测序可获得的DNA序列
BAC末端序列(BAC-end sequences)
一个BAC克隆插入片段两端的已测序的序列,不包括内部序 列。可用于确定BAC的排列方向以及重叠群(contig)在支 架(scaffold)中的排列方向
重叠群(contig)
一群相互重叠的克隆或DNA顺序,可以是草图顺序 或精确顺序(finished), 包括连续的(内部无间隙 )或不连续的(内部含间隙)DNA顺序
7
化学降解法缺点:
试剂含有毒性 8 不易自动化
§ 4.1.2 链终止法(chain
termination method)
1977年Sanger等人发明了利 用DNA聚合酶的双脱氧链终 止原理测定核苷酸序列的方 法,又称为Sanger 双脱氧测 序法 此法更适合序列分析的自动 化 最常用的一种测序方法,第 一代测序仪采用的方法
全 基 因 组 鸟 枪 法 序 列 组 装 过 程
利用插入片段大小不同的克隆两端测序搭建支架
§ 4.2.4 人类基因组测序与组装
Automated DNA sequence workflow (cont.)
Extension product purification
ethanol precipitation
Capillary electrophoresis Data analysis
阅 读 链 终 止 实 验 所 产 生 的 序 列
相关文档
最新文档