高通量测序问题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二代高通量测序常见问题

1. 你们做不做第二代高通量测序?

Answer:我们是国内最早从事第二代高通量测序的单位之一,2007 年初就引入了454 测序系统,至2011 年底已经运行了300 多个完整反应,是目前国内运行量最大的454 测序平台。而2010 年引入Solexa 测序系统后,已经先后完成过包括人的肿瘤基因组测序,外显子捕获测序,RNAseq,小RNA 测序,大型真核生物基因组测序等不同的任务,基本处于饱和运转的状态。

2. 我想做第二代测序,你们是怎么收费的?

Answer:所有测序都是根据客户要做哪类测序(基因组、转录组还是分子生态等),选择哪种测序系统,测序的量,以及对分析的要求来确定收费标准的;所以需要客户先说明他想做的内容。微生物基因组部分:

3. 我有个细菌想测序,你们怎么收费?

Answer:细菌基因组测序,分为草图和完成图两种类型。

(1)草图:就是测序后直接拼装,得到的彼此没有关系的contigs 就称为基因组草图;如果做基因组草图,可以选择Solexa 或者454:用solexa 测序的话,一般我们是做100 倍覆盖率的pair-end 测序,通常是建300bp 插入片段的文库;用454 测序的话,就是做20 倍覆盖率的shotgun 文库。通常solexa 价格便宜,但得到的contigs 数目也多,并且拼装不够准确,不能用来构建完成图。而454测序拼装的结果非常准确,contigs 数目也少,一般会在100 个左右(只是统计值,不能向客户保证),而且能够在这个基础上做完成图。

(2)完成图:就是把所有的contigs 接起来,一般是通过PCR 等方法确定contigs之间的关系,并通过对PCR 产物进行常规测序,填补所有gap,最终得到一条完整的环状基因组序列(链霉菌是线性染色体,有些细菌是多条染色体)。在填补完所有gap 后,我们还会对测序中的低值区域进行补测,最后得到的序列精确度在99.99%以上,即错误率低于万分之一(1bp/10kb)。我们是目前国内做细菌完成图最多的单位,已经完成了近80 株细菌的完成图,合作单位发表的SCI 文章已有20 余篇。

(3)精细图:这是对真核基因组测序来说的,严格来说细菌不应该存在精细图这个概念,即使存在1 个gap,也应该称为草图。但由于市场上很多公司做gapclosing 做到最后有些gap 关不掉,就提出了这么一个概念。如果客户提出做精细图,想要向他讲明我们一般就是做草图和完成图,然后他如果需要精细图,我们就会在草图的基础上,加测一个solexa 的3kb 插入片段mate-pair,构建一个scaffold,即客户要求的精细图。价格根据客户需要做哪种测序来确定。

4. 你们细菌基因组测序,包括哪些分析?

Answer:我们一般测序完成后,无论草图还是完成图,都会帮助客户做基因预测,功能注释,COG 分析和代谢通路构建这几项基本分析。但如果客户需要更深入的比较基因组学分析,就需要收费。对于细菌基因组来说,所有的分析工作我们都可以完成,但除非是有科研合作的单位,否则我们不参与客户的文章写作。

5. 你们做不做真菌基因组测序?

Answer:我们至今已完成30 余株真菌的基因组测序工作。由于真菌一般是多条线性染色体,存在着丝粒和端粒等极难克隆和测序的区域,所以通常对真菌基因组都是以获得精细图为主。我们的做法有两种:

(1)以454 做20 倍覆盖率的shotgun 测序(一般先估计真菌的基因组大小为40Mb),拼装获得contigs;然后在此基础上,加测一个100 倍覆盖率的solexamate-pair 测序(3kb 插入片段),用以搭建scaffold。最终给客户的结果就是这个scaffolds,即精细图。

(2)以solexa 做100 倍覆盖率的pair-end 测序(一般建2 个不同插入片段的文库,我们通常做170bp 和500bp 两种),拼装获得contigs;然后再加测一个100 倍覆盖率的solexa mate-pair 测序(3kb 插入片段),用以搭建scaffold。最终给客户的结果就是这个scaffolds,即精细图。

(3)以454 为基础的精细图效果要好于以solexa 为基础的精细图,通常454拼装的contigs 数目在1000 个左右,scaffold 在50 个左右;而solexa 的结果就很难估计。

6. 做基因组草图或者精细图,你们能保证的contigs 或scaffold 数目是多少?

Answer:基因组测序拼装,受多个因素影响,包括基因组大小,覆盖率,重复序列等,其中重复序列影响最大,所以同样大小的基因组,拼装结果都会差异很大。因此除完成图外,通常我们不向客户承诺拼装的contigs 数目,只能告诉客户,一般细菌拼出来的contigs 数目在100 个左右(链霉菌会更高一些)真菌用454;测序,拼出来的contigs 在1000 个左右。

7. 高GC 含量的细菌如何做?

Answer:目前我们做的最多的细菌类群就是放线菌,包括链霉菌,结核分枝杆菌等,都是高GC 的。在早期我们向Roche 公司提出454 对高GC 的DNA 测序效果不好后,它们专门开发了additive,目前这个试剂已经添加在所有的454 测序试剂中,因此对于高GC 含量的细菌测系效果特别好。如果客户做链霉菌测序,尽量选用454 测序。如果是做结核分枝杆菌这种高度保守的细菌的重测序,可以考虑用solexa,但要告诉客户,像PE/PPE/PE-PGRS 等高GC 的区域是测不到的,或者说即使测到了也mapping 不上去。

8. 测序的完成时间,样本要求:

Answer:做细菌的草图都是2 个月以内,但454 基本可以在1 个月左右出来结果(建库和上机只要3 天,主要是要排队),solexa 由于在机器上就要10 多天,所以一般都要2 个月左右才能得到数据。对于细菌的完成图,我们的平均时间是6 个月;但像链霉菌等高GC 的菌,时间平均要9 个月。一般我们向客户承诺的时间都是8-12 个月。这个工作我们可以保证质量,但毕竟是实验的东西,无法保证时间。对于测序的样本,我们要求客户提供抽提好的DNA,浓度最好在50ng/ul左右,总量要达到5ug(通过凝胶电泳定量)。如果要做完成图,需要提供20ug以上的DNA。对DNA 要求是没有明显降解,OD260/280>1.8。

转录组测序部分:

9. 我要做RNA 测序或者转录组测序,如何做?

Answer:首先要明确客户的目的,是为了发现新基因,还是做表达谱分析(用测序代替芯片);再就是要询问客户要做的物种有没有已知的基因组序列。

(1)转录组测序:如果是全新的物种,还没有基因组,那么最好是用454 做转录组测序,即获得EST 序列,然后我们会对EST 序列进行拼装和注释,得到这个物种的转录本信息。如果客户不想做时期/组织间的比较,只是为了获得尽量多的基因信息,那么就推荐客户把几个不同处理/时期的样本混合在一起,做一份转录组测序。如果客户还想做丰度比较,就需要把几个样本分开,我们分别建库和测序。

(2)RNAseq:如果客户要做表达谱分析,基本就可以用solexa 做RNAseq,但前提是他的物种有已知的基因信息;否则我们得到的数据只能与近源物种做比对,匹配效率会低很多。一般RNAseq,每个样品测序得到500 万条序列,就可以达到饱和,代表这个样品的多数表达基因。因为目前我们solexa 测序都是做pair-end,所以承诺客户500 万条序列,我们实际是测500 万对(1Gb 的数据量)。

10. 用454 做转录组测序,我需要做多少测序量?平均长度是多少?可以保证拼出多少unigene?

Answer:一般来说,一个物种做一个完整反应的454 测序,可以获得80 万条以上的有效序列;通过拼装可以获得约2-3 万个EST cluster。但这些EST cluster有些是属于同一个基因的,只是中间没有测到或可变剪接的原因,导致无法拼到一起。对于新的物种。这样的情况我们是无法确定哪些EST cluster 是属于同一个基因的。因此,我们无法保证客户获得的unigene 数目,只能承诺测序得到的数据量。转录组测序序列平均长度要比基因组测序短,因为很多RNA 本身就很短,所以一般转录组测序我们承诺的平均长度要比基因组短100bp。目前我们是承诺客户平均长度为300bp;等到升级后我们可以承诺500bp。对于发现新基因来说,一般一个完整反应拼装得到的EST cluster 可以代表多数基因;但对于低丰度的基因还是难以发现,因此多数客户会选择做1-2 个run 的454 反应。

11. 转录组测序的分析内容:

相关文档
最新文档