NGS测序技术及分析流程

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

https://main.g2.bx.psu.edu/u/jjv5/h/unnamed-history-1
http://222.200.187.83/nongpost/linux_lecture/msg.php
测序实验流程:
• 4、数据分析:GS FLX系统在10小时的运行 当中可获得100多万个读长,读取超过4-6亿 个碱基信息,通过GS FLX系统提供两种不同 的生物信息学工具对测序数据进行分析。
454 Pyrosequencing
454 的特点与主要应用
• 读长较长,400-600bp
• 通量较低,1Run 1M 序列,400-600Mb • 相对成本较高 • 主要应用:de novo测序
Solexa HiSeq 2000
Single-end: 1 x 35 bp Paired-end: 2 x 50 bp Paired-end: 2 x 100 bp
25 Gb/d
~1.5d ~4d ~8d 1d/ 1lane 7d/ 12 lane 7d/ 12 lane 10h
SOLiD 5500xl
测序实验流程:
• 2、Emulsion PCR:特定比例的单链DNA文库被 固定在特别设计的DNA捕获磁珠上,使大部分 磁珠磁珠携带了一个独特的单链DNA片断。磁 珠结合的文库被扩增试剂乳化,形成油包水的 混合物,每个独特的片断在自己的微反应器里 进行独立的扩增,而不受其他的竞争性或者污 染性序列的影响。整个片段文库的扩增平行进 行。扩增后产生了几百万个相同的拷贝。随后, 乳液混合物被打破,扩增后仍结合在磁珠上的 片段既可被回收纯化用于后续的测序实验;
Ion Torrent 测序原理
精度
• Examples:
• • 90% confidence (10% error rate) =
• • 99% confidence (1% error rate) = • • 99.9% Q30
Q10
Q20
confidence (.1% error rate) =
Illumina solexa
• Solexa 测序原理
Illumina solexa
Illumina Solexa 桥式PCR
diol
diol
diol
diol
diol
diol
diol
diol
1st cycle denaturation
1st cycle annealing n=35 total
B. SOLiD 测序结果示例(Color Space) A. SOLiD Oligo荧光基团模式图
SOLiD 的特点与主要应用
• 读长较短,50-75bp
• 精度高,可达Q40 • 通量高, 20-30G每天,1Run 可达120G • 主要应用:基因组重测序、SNP检测等
Ion torrent
有参考序列 转录组分析内容
1 基本数据统计,比对参考序列 2 序列在基因组上在分布 3 测序深度分析、随机性评估和 基因差异表达分析 4 新基因预测,基因可变剪接鉴 定和基因融合鉴定等。
小RNA测序
果蝇三种组织中MiRNA表达情况
MiRNA表达模式分析
新miRNA预测
miRNA编辑情况分析与统计
第一代测序技术
• Sanger测序
1977年,桑格测定了第一个基因组序列,是 噬菌体X174的,全长5375个碱基

Sanger法核心原理是:由于ddNTP的2’和3’都不含羟基,其在DNA的合成过程 中不能形成磷酸二酯键,因此可以用来中断DNA合成反应,在4个DNA合成反 应体系中分别加入一定比例带有放射性同位素标记的ddNTP(分为: ddATP,ddCTP,ddGTP和ddTTP),通过凝胶电泳和放射自显影后可以根据电泳带 的位置确定待测分子的DNA序列
5
6
7
8
9
TTTTTTTGT…
Solexa 的特点与主要应用
• 读长较短,100-150bp
• 通量高,25G每天,120-150G每Run • 主要应用:RNA测序、表观遗传学研究
ABI SOLiD
• SOLiD Sequencing by Oligo Ligation/Detection • Oligo连接测序:通过连接酶连接,再对 oligo上荧光基团进行检测
• 454公司可谓新一代测序技术的奠基人。2005 年底,454公司推出了革命性的基于焦磷酸测 序法的超高通量基因组测序系统——Genome Sequencer 20 System,被《Nature》杂志以里 程碑事件报道,开创了边合成边测序 (sequencing-by-synthesis)的先河。之后, 454公司被罗氏诊断公司以1.55亿美元收购。
分析软件介绍
• 质量控制软件 (Quality Control) • 定位软件 (Mapping the reads)
• 已知基因(差异)表达评估软件 (Differential Expression)
• 新基因鉴定软件 (New gene identification)
• 可视化展示软件 (Virsulization)
• 基因功能注释软件 (GO term or KEGG pathway analysis)
数据格式示例
Fastq 格式 Color Space 格式
Phred score
质量控制
利用galaxy进行原始数据处理
https://main.g2.bx.psu.edu/
Galaxy History ' VGN FASTQ'
新一代测序介绍
• 三大测序平台的前世今生
Lynx MPSS Polony Seq
454
Solexa Illumina Solexa Roche பைடு நூலகம்54
ABI SOLiD Helicos Ion Torrent ABI Ion Torrent SMRT
Pacific Biosciences
Roche-454
• 454测序原理
测序实验流程:
• 1、文库制备:根据样品的种类和实验目的, 将基因组DNA/cDNA片段化处理至400-800bp 间,经末端修复与特异性接头连接等修饰 后变性处理回收单链的DNA(sstDNA);然 后和两个44个碱基长的衔接子(adaptor)A、 B进行平端连接。A、B 衔接子各自含有20个 碱基的PCR 引物序列、20个碱基的测序引物 序列和4个碱基的对照序列(TACG),除此 之外,B衔接子的5’端还标记有一个生物素 基团,供后续的分离合适的测序模板使用。
测序实验流程:
• 3、测序反应:携带DNA的珠子与其他反应 物混合物,随后放入PTP板中进行后继的测 序。 PTP孔的直径(29um)只能容纳一个 珠子(20um)。然后将PTP板放置在GS FLX 中,测序开始。每一个与模板链互补的核 苷酸的添加都会产生化学发光的信号,并 被CCD照相机所捕获;
Single-end: 75 bp Paired-end: 75 x 35 bp Mate-pair: 60 x 60 bp
20 – 30 Gb/d
Q40
454 GS FLX
400 - 600 bp
400 – 600 Mb/Run
Q20
转录组测序测序流程
全转录组总RNA
polyT富集mRNA
转录组mRNA
去除rRNA
Non-coding RNA
RNA片段化、纯化、检测产量
连接两端接头序列 逆转录生成cDNA
选择适当长度cDNA进行扩增
纯化扩增产物,评估产量
上机进行高通量测序
转录组主要分析内容
无参考序列 转录组分析内容
1 测序数据产量统计,数据成分和 质量评估; 2 Contig及Scaffold长度分布 3 Unigene的长度分布和功能注释 ,GO分类,Pathway分析,差异表 达分析 4 蛋白功能预测与分类,差异表达 基因GO富集和 Pathway富集分析。
1st cycle extension
2nd cycle denaturation
diol
diol
diol
diol
diol
diol
2nd cycle extension
2nd cycle annealing
Illumina Solexa Base Calling
TG C TAC GAT …
1
2
3
4
三种平台的技术差异
平台
PCR 测序载体 测序方式 结果序列 磁珠
454
磁珠乳化PCR
Solexa
桥式PCR 玻片 可逆终止物 、荧光 FastQ 玻片
SOLiD
磁珠乳化PCR
焦磷酸、荧光 FastQ
连接酶、荧光 CSFastQ
三种平台的效能参数差异
平 台 读长 通量 周期 精度 •50 bp 85%以上 Q30 •100 bp 80%以上 Q30
SOLiD 5500xl
ABI SOLiD测序前期制备
A 样品片段化 磁珠连接
B 乳化PCR 3‘末端修饰
C 磁珠富集 转到测序玻片
ABI SOLiD测序原理
ABI SOLiD荧光结合和结果示例
@SRR029969.1 VAB_5551_12_381_F3 length=35 T11.0203.3.1113211010332111302330201 +SRR029969.1 VAB_5551_12_381_F3 length=35 !36!8/8:!:!462>@6=(<8>8.<;2:*9748078 @SRR029969.2 VAB_5551_13_468_F3 length=35 T202312302.3333130131131322113203131 +SRR029969.2 VAB_5551_13_468_F3 length=35 !9),4/3)&$!(&(573(96,'7&91>)43),(95,
相关文档
最新文档