转录组测序技术原理及应用
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
RNA测序技术原理及应用
基因组—转录组—表观遗传组—蛋白组层 次
遗传的中心法则
什么是转录组?
All transcripts
All mRNAs
RNA是解读基因组的关键
Genotype DNA Phenotype
Protein
RNA
RNA 测序技术
测序技术 研究对象 鉴定新分子
RNA-Seq mRNA O Small RNA
测序
Small RNA O
降解组测序 mRNA O
Non-coding RNA测序 Non-coding RNA O
表达谱研究
基因结构分析 EST 测序 筛选分子标记 转录融合基因 表达
O
O/X O/X O O/X
O
X X O X
O
X X O X
O
O X X X
Workflow of RNA-Seq
实验材料收集:
叶片,花序, 果实, 根 时间点:0 , 4, 8, 12, 16, 20和 24 h 将每个时间点采集的样品均匀混合
测序策略:
Illumina 测序,1G data
Genome Res 2010
抗逆相关可变剪接
1. High light
2.Heat
3. Cold
4. Salt
5.Drought
样品检测 文库制备 Cluster Station Illumina Sequencing 生物信息分析
真核mRNA的纯化
mRNA的纯化主要通过的磁珠与
链霉亲合素包被磁珠+生物素标记 Oligo(dT)25+poly(A)
生物素吸附原理从而分离纯化 Oligo(dT)25磁珠纯化原理主要 是mRNA的3′的poly A与磁珠在 bindingbuffer的作用下相结合。磁 珠通过MPC(磁分离器)从溶液 中分离出来。 mRNA与磁珠结合后,再用TrisHCL在加热条件下解离洗脱到溶 液中。
转录组研究技术横向比较
Technology Principle Resolution Tiling Array Hybridization cDNA or EST sequesing Sanger sequencing Transcriptome Sequencing Next-Gen sequencing Single base
From several to Single base 100
Throughput Reliance on genomic sequence Background noise Application Simutaneously map transcribed regions and gene expression
技术 优点
1)检测基因数比基因芯片多25% 2)定量准,可重复性高(重复相关系数 ≥0.99) 3)数字化信号,无背景噪音,无交叉杂交 4)高、低丰度基因均可检测 5)不受研究物种限制,模式生物和非模式 生物均可检测 6)数据可与时俱进,即随数据库更新而更 新 7)具有较好的分析兼容性,数据格式与芯 片相同,可与芯片的分析软件兼容
Workflow of RNA-Seq
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation (200bp) Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing
生物信息学分析
RNA-Seq (Transcriptome)
RNA-Seq (De novo transcriptome assembly)
Technique
2
RNA-Seq (Transcriptome resequencing)
Characterize the transcriptome in unparalleled detail
20
RNA-Seq (De novo transcriptome assembly)
文库构建
测序
组装
Biblioteka Baidu
De novo assemble a transcriptome组装流程
De novo assembly transcriptome 信息分析主要内容:
数据产出统计及测序数据的成分和质量评估 组装结果分析(Contig 长度分布、Scaffold 长度分 布、Unigene 长度分布) Unigene (transcript)功能注释 Unigene 的GO 分类 Unigene 代谢通路分析 预测编码蛋白框(CDS) Unigene 表达差异分析(两个或两个以上样品) Unigene 在样品间的差异GO 分类(需两个或两个 以上样品)和Pathway 富集性分析
末端修复(防止自连)
cDNA 3′末端加A
Adapter连接
文库制备
第一天 第二天 第三天
消化DNA
↓
末端修复
↓
PCR
↓
mRNA的分离
↓
↓ A 3’端加
↓
PCR胶回收
mRNA的打断
↓
加接头
↓
cDNA的合成
胶回收
文库质量检测: Aligent 2100:片段大小、纯度、浓度 qPCR:片段大小、浓度 手工检测:跑胶验证。
De novo assembly transcriptome信息分析流程
Unigenes的GO 注释
Pathway 分析
RNA-Seq (Transcriptome resequencing)
cDNA文库构建
测序
比对到参考序列
Transcriptome resequencing比对流程
Transcriptome resequencing信息分析主要内容
决方案。 ● 可扩展的通量—16联或96孔微量滴定板 ● 快速得到结果—平均每个样品只需一分钟便可获得结果
● 使用简单—可直接使用的ScreenTape预制胶条简化了工作流程
● 样品用量少—每次运行仅需要不到2ul样品
检测报告-合格样品
棉铃虫/果蝇
检测报告-不合格样品
Workflow of RNA-Seq
生物信息学分析
RNA-Seq单端测序(Quantification) 生物信息分析内容
测序数据评估 筛选差异表达基因 表达模式聚类分析 GO 功能富集分析 Pathway 富集分析 蛋白互作网络分析
RNA-Seq单端测序(Quantification)信息分析流程
RNA-Seq与基因芯片优缺点比较
exon2
exon3
mRNA
exon1
exon3
junction reads
exon1
exon2
exon3
鉴定基因融合
Paired Reads Single Reads
Gene A
Gene B
分析RNA水平SNP
转录组重测序比对软件: SOAP
De novo 转录组测序: 组装软件:SoapDenovo 比对软件: SoapSNP
Dynamic range to quantify gene expression level Ability to distinguish different isoforms and allelic expression
High Yes High
Low No Low
High In some cases Low
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation
样品检测 文库制备 Cluster Station Illumina Sequencing 生物信息分析
Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing
比对统计 基因表达注释 基因差异表达分析 基因结构优化 可变剪接分析 预测新转录本 cSNP分析
Transcriptome resequencing信息分析流程
应用---优化转录组注释信息
基因结构优化 可变剪接鉴定 基因融合鉴定 RNA水平SNP分析
优化基因结构 鉴定新的转录本
HiSeq 2500
17
RNA-Seq (Transcriptome)
Workflow of RNA-Seq(Transcriptome)
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation (200nt~700nt) Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing 101PE
样品检测 文库制备 Cluster Station Illumina Sequencing 生物信息分析
Applications of RNA-Seq
Application Expression-profiling Alternative Splicing Fusion Gene SNP detection RNA-Seq (单端测序---Quantification) √ - - - RNA-Seq (双端测序---Transcriptome) √ √ √ √
Yes
Up to a fewhundred fold Limited
Limited for expression
Not practical Yes
Yes
>8,000-fold Yes
36
Technique
转录组测序的优势
1
RNA测序与芯片检 测基因数比较
RNA测序与芯片 检测基因的表达量分布
Case
等同于数字表达谱(DGE)
Workflow of RNA-Seq单端测序 (Quantification)
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation (200bp) Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing 50SE
低温胁迫相关的AS
Control
Low Temperature Resistance
Intron-retention 外包膜蛋白16 (AT2G28900) 低温胁迫下这个内含子和对照相比被保留了下来,揭示了可变剪接有重要功能。
生物钟相关基因,例如 调节气孔的开关等 CCA1
AS调节机制
RNA-Seq单端测序 (Quantification)
Paired-End (PE) Reads
Paired Reads distribution
Genomic intergenic region
Reads cluster
Reads 比对到参考序列基因间区域
鉴定可变剪接( Alternative Splicing )
common reads
exon1
原核mRNA的纯化
Ambion MICROExpress Kit
LNA扣锁型探针
mRNA反转录---fragment+RT
纯化过的mRNA样品加入
1µ l的fragment buffer 70℃ 作用1.5min。 加入1µ l的stop buffer终止 反应。 加入沉淀剂(NaAc 糖原 无水乙醇)沉淀产物。 RT ds cDNA
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation (200bp) Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing
Total RNA样品检测
Agilent 2200 检测
OD260/280:1.8~2.2 RNA 28S:18S ≥ 1.0; RIN≥7
新型安捷伦2200 TapeStation 系统是新一代测序(NGS)、生物微阵列芯片分析和qPCR
工作流程以及蛋白质纯化和抗体生产过程中对生物样品进行质量控制(QC)的理想解
基因组—转录组—表观遗传组—蛋白组层 次
遗传的中心法则
什么是转录组?
All transcripts
All mRNAs
RNA是解读基因组的关键
Genotype DNA Phenotype
Protein
RNA
RNA 测序技术
测序技术 研究对象 鉴定新分子
RNA-Seq mRNA O Small RNA
测序
Small RNA O
降解组测序 mRNA O
Non-coding RNA测序 Non-coding RNA O
表达谱研究
基因结构分析 EST 测序 筛选分子标记 转录融合基因 表达
O
O/X O/X O O/X
O
X X O X
O
X X O X
O
O X X X
Workflow of RNA-Seq
实验材料收集:
叶片,花序, 果实, 根 时间点:0 , 4, 8, 12, 16, 20和 24 h 将每个时间点采集的样品均匀混合
测序策略:
Illumina 测序,1G data
Genome Res 2010
抗逆相关可变剪接
1. High light
2.Heat
3. Cold
4. Salt
5.Drought
样品检测 文库制备 Cluster Station Illumina Sequencing 生物信息分析
真核mRNA的纯化
mRNA的纯化主要通过的磁珠与
链霉亲合素包被磁珠+生物素标记 Oligo(dT)25+poly(A)
生物素吸附原理从而分离纯化 Oligo(dT)25磁珠纯化原理主要 是mRNA的3′的poly A与磁珠在 bindingbuffer的作用下相结合。磁 珠通过MPC(磁分离器)从溶液 中分离出来。 mRNA与磁珠结合后,再用TrisHCL在加热条件下解离洗脱到溶 液中。
转录组研究技术横向比较
Technology Principle Resolution Tiling Array Hybridization cDNA or EST sequesing Sanger sequencing Transcriptome Sequencing Next-Gen sequencing Single base
From several to Single base 100
Throughput Reliance on genomic sequence Background noise Application Simutaneously map transcribed regions and gene expression
技术 优点
1)检测基因数比基因芯片多25% 2)定量准,可重复性高(重复相关系数 ≥0.99) 3)数字化信号,无背景噪音,无交叉杂交 4)高、低丰度基因均可检测 5)不受研究物种限制,模式生物和非模式 生物均可检测 6)数据可与时俱进,即随数据库更新而更 新 7)具有较好的分析兼容性,数据格式与芯 片相同,可与芯片的分析软件兼容
Workflow of RNA-Seq
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation (200bp) Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing
生物信息学分析
RNA-Seq (Transcriptome)
RNA-Seq (De novo transcriptome assembly)
Technique
2
RNA-Seq (Transcriptome resequencing)
Characterize the transcriptome in unparalleled detail
20
RNA-Seq (De novo transcriptome assembly)
文库构建
测序
组装
Biblioteka Baidu
De novo assemble a transcriptome组装流程
De novo assembly transcriptome 信息分析主要内容:
数据产出统计及测序数据的成分和质量评估 组装结果分析(Contig 长度分布、Scaffold 长度分 布、Unigene 长度分布) Unigene (transcript)功能注释 Unigene 的GO 分类 Unigene 代谢通路分析 预测编码蛋白框(CDS) Unigene 表达差异分析(两个或两个以上样品) Unigene 在样品间的差异GO 分类(需两个或两个 以上样品)和Pathway 富集性分析
末端修复(防止自连)
cDNA 3′末端加A
Adapter连接
文库制备
第一天 第二天 第三天
消化DNA
↓
末端修复
↓
PCR
↓
mRNA的分离
↓
↓ A 3’端加
↓
PCR胶回收
mRNA的打断
↓
加接头
↓
cDNA的合成
胶回收
文库质量检测: Aligent 2100:片段大小、纯度、浓度 qPCR:片段大小、浓度 手工检测:跑胶验证。
De novo assembly transcriptome信息分析流程
Unigenes的GO 注释
Pathway 分析
RNA-Seq (Transcriptome resequencing)
cDNA文库构建
测序
比对到参考序列
Transcriptome resequencing比对流程
Transcriptome resequencing信息分析主要内容
决方案。 ● 可扩展的通量—16联或96孔微量滴定板 ● 快速得到结果—平均每个样品只需一分钟便可获得结果
● 使用简单—可直接使用的ScreenTape预制胶条简化了工作流程
● 样品用量少—每次运行仅需要不到2ul样品
检测报告-合格样品
棉铃虫/果蝇
检测报告-不合格样品
Workflow of RNA-Seq
生物信息学分析
RNA-Seq单端测序(Quantification) 生物信息分析内容
测序数据评估 筛选差异表达基因 表达模式聚类分析 GO 功能富集分析 Pathway 富集分析 蛋白互作网络分析
RNA-Seq单端测序(Quantification)信息分析流程
RNA-Seq与基因芯片优缺点比较
exon2
exon3
mRNA
exon1
exon3
junction reads
exon1
exon2
exon3
鉴定基因融合
Paired Reads Single Reads
Gene A
Gene B
分析RNA水平SNP
转录组重测序比对软件: SOAP
De novo 转录组测序: 组装软件:SoapDenovo 比对软件: SoapSNP
Dynamic range to quantify gene expression level Ability to distinguish different isoforms and allelic expression
High Yes High
Low No Low
High In some cases Low
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation
样品检测 文库制备 Cluster Station Illumina Sequencing 生物信息分析
Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing
比对统计 基因表达注释 基因差异表达分析 基因结构优化 可变剪接分析 预测新转录本 cSNP分析
Transcriptome resequencing信息分析流程
应用---优化转录组注释信息
基因结构优化 可变剪接鉴定 基因融合鉴定 RNA水平SNP分析
优化基因结构 鉴定新的转录本
HiSeq 2500
17
RNA-Seq (Transcriptome)
Workflow of RNA-Seq(Transcriptome)
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation (200nt~700nt) Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing 101PE
样品检测 文库制备 Cluster Station Illumina Sequencing 生物信息分析
Applications of RNA-Seq
Application Expression-profiling Alternative Splicing Fusion Gene SNP detection RNA-Seq (单端测序---Quantification) √ - - - RNA-Seq (双端测序---Transcriptome) √ √ √ √
Yes
Up to a fewhundred fold Limited
Limited for expression
Not practical Yes
Yes
>8,000-fold Yes
36
Technique
转录组测序的优势
1
RNA测序与芯片检 测基因数比较
RNA测序与芯片 检测基因的表达量分布
Case
等同于数字表达谱(DGE)
Workflow of RNA-Seq单端测序 (Quantification)
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation (200bp) Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing 50SE
低温胁迫相关的AS
Control
Low Temperature Resistance
Intron-retention 外包膜蛋白16 (AT2G28900) 低温胁迫下这个内含子和对照相比被保留了下来,揭示了可变剪接有重要功能。
生物钟相关基因,例如 调节气孔的开关等 CCA1
AS调节机制
RNA-Seq单端测序 (Quantification)
Paired-End (PE) Reads
Paired Reads distribution
Genomic intergenic region
Reads cluster
Reads 比对到参考序列基因间区域
鉴定可变剪接( Alternative Splicing )
common reads
exon1
原核mRNA的纯化
Ambion MICROExpress Kit
LNA扣锁型探针
mRNA反转录---fragment+RT
纯化过的mRNA样品加入
1µ l的fragment buffer 70℃ 作用1.5min。 加入1µ l的stop buffer终止 反应。 加入沉淀剂(NaAc 糖原 无水乙醇)沉淀产物。 RT ds cDNA
Total RNA
Eukaryon Procaryon
Enrich mRNA by OligoT
Remove rRNA
RNA fragmentation (200bp) Random hexamer primed cDNA synthesis Size selection, then PCR amplification HiSeq 2000 sequencing
Total RNA样品检测
Agilent 2200 检测
OD260/280:1.8~2.2 RNA 28S:18S ≥ 1.0; RIN≥7
新型安捷伦2200 TapeStation 系统是新一代测序(NGS)、生物微阵列芯片分析和qPCR
工作流程以及蛋白质纯化和抗体生产过程中对生物样品进行质量控制(QC)的理想解