MALBAC单细胞全基因组测序详细解析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
单细胞全基因组测序一直是生物学家梦想得到的结果。
但是其中必须解决的矛盾:
1. 线性扩增。如果用全基因组PCR扩增,因为PCR的扩增偏向性(bias),再加上PCR过程中较小的偏向性通过指数放大,其结果就会是严重的覆盖不均一,导致在许多地方只有很低的覆盖、甚至没有覆盖。所以,保证模板被线性地扩增,是首要问题。
2. 全基因组覆盖。常规的建库方法,因为补平、加A、接头连接效率的问题,起始DNA中有很大一部分会被浪费,没有形成有效文库分子(也就是两头都接好引物的DNA片段)。在单细胞测序中,这是不可接受的。
3. 高扩增效率。单细胞中的每个基因位置理论上都只有2个拷贝,而要从2个拷贝扩增到足够建立文库的DNA量,要经过许多次的扩增。这就需要很高的扩增效率。而一般的线性扩增很难有好的扩增效率
谢晓亮教授创新的MALBAC方法(multiple annealing andlooping-based amplification cycles),一举解决了上述3个问题,达到:1. 线性扩增,2. 近乎全覆盖,3. 高扩增效率(高产量),并且最终可以用于检测单细胞的CNV。
原理:
1. 第一步
A. 用5’端有27个统一序列,而3’端是8个随机序列的引物,作为扩增引物。用随机引物保证可以在模板链上的各处随机结合
B. 0℃淬火,再65℃等温扩增,得到第一轮的复制的产物
a. n个扩增产物(在图中标成蓝色),这些扩增产物都有在5’端有一个统一的引物
b. 1个原来的模板(在图中标成黑色)
C. 用有前链移开功能的聚合酶(ϕ29聚合酶)来进行扩增,这种酶的特点是会把酶前行方向上的前链从原来的模板链上进行解链、移开。利用这种特点,可以让模板上的每个点在第一轮反应中,都有机会得到n个拷贝
D.巧妙之处:
a. 0℃淬火,在延伸开始之前,就把n个引物杂交到模板上
b. ϕ29聚合酶可以把前面的链给推开,结合前面的淬火步骤,一次复制出n个扩增子
2. 第2轮起的m轮扩增
A. 每个循环
a. 先0℃淬火,再65℃扩增
b. 粘到第一轮所产生的扩增产物上的引物,又会产生一轮扩增。其产物5’端带有统一引物序列,3’端带有与统一引物序列,称为完整扩增产物
c. 粘到原始模板上的引物,也产生一轮扩增。但是其产物是只在5’端带有统一引物序列,而在3’端没有统一引物序列,称为半扩增产物
d. 98℃解链
e. 58℃保温,让完整产物的两端发生链内杂交,复性后3’端的序列不再能与游离的互补引物发生杂交,这就阻止了指数扩增。
B. 重复A步骤中从a~e的5个步骤,共5次。经过m个循环后,得到:
a. m* n2个“完整扩增产物”
b. (m+1)* n个“半扩增产物”
c. 1个原始模板
C. 巧妙之处:
a. 线性扩增
i. 其巧妙之处在于,每个循环的最后,加了一步58℃退火。这一退火过程,让完整扩增产物的两端发生链内杂交。这样3’端的序列就不能与新的游离引物发生杂交,也就不会引发起始于3’端的扩增,也就是避免了“完整扩增产物”的自我指数扩增。
ii. 如果发生以8个随机碱基为引物3’末端的指数扩增,3’末端的碱基序列不一致性就会导致扩增效率的Bias,再经过指数放大,就会变成明显的扩增效率Bias。
iii. 现在,还是8个随机碱基的引物在模板上随机地找结合位点,所有位点的被扩增机会大致均等。
iv. 完整产物的数量是m * n2,也就是说,扩增产物与m成正比,而不是与m2成正比,更不是与2m成正比。也就是说扩增产物与扩增的次数成线性关系。这达成了单细胞测序所要求的:线性扩增。
b. 全基因组覆盖
i. 再次利用ϕ29聚合酶的前链移开功能,在一个模板上扩增出多个扩增子。这样从第1轮扩增开始,每个模板就会得到多个扩增子。再加上以后5轮的扩增中,原始模板都有机会再次被扩增出多个扩增子。这样本保证每个原始模板都产生n个扩增子。建库时被漏掉一些扩增子,还是能保证大多数的基因组区域可以被建成库
c. 高扩增效率
i. 在扩增中,所得到的“完整扩增产物”的个数是m * n2个。这个“n2”,还是利用了ϕ29聚合酶的“前链移开功能“,保证了扩增有较高的效率。可以得到较多的扩增产物,以供下面的实验之用。
结果
1. Lorenz曲线
可以从上面的Lorenz曲线中看出来,MALBAC方法的覆盖均一性明显好于MDA方法,但还是弱于大批量细胞的测序结果。
蓝箭头和绿箭头,分别指出MALBAC方法和MDA方法没有测到序列部分占全基因组的比例。
2. CNV
3. A、B、C、D中的绿线是按Markov模型估算出来的CNV数
4. A、B、C,分别是3个单细胞MALBAC方法测序后的覆盖率。
5. D是大量细胞测序后的覆盖率。
6. E是MDA方法测序后的覆盖率。
7. 测序的深度都是平均25倍。
参考文献:
Chenghang Zong1, Sijia Lu1, Alec R. Chapman, X. Sunney Xie. Genome-Wide Detection of Single-Nucleotide and Copy-Number Variations of a Single Human Cell. Science 21 December 2012:Vol. 338 no. 6114 pp. 1622-1626
Rubicon Genomics公司推出了商业化的单细胞测序试剂盒,Rubicon并没有公布其技术细节,但是根据其公开的技术材料,基本与MALBAC技术相近:
∙都是通过扩增产物的末端自封闭来抑制指数扩增。
∙通过数轮线性扩增得到大量的扩增产物