转录组分析(RNA-Seq)-PPT文档资料
转录组测序ppt课件
SUCCESS
THANK YOU
2019/5/5
环境转录组也可以这样做
• 使用RNA-seq手段对实验样本进行转录组分析,关注个体或者组织器 官在不同环境条件下基因表达的动态变化,挖掘生物对逆境适应的分 子机制。
转录组?
• 转录组是特定组织或细胞在某一功能状态下所能 转录出来的所有RNA的总和,包括mRNA和非编码 RNA。
• 转录组(transcriptome)广义上指某一生理条件 下,细胞内所有转录产物的集合,包括信使RNA、 核糖体RNA、转运RNA及非编码RNA;狭义上指所有 mRNA的集合。蛋白质是行使细胞功能的主要承担 者,蛋白质组是细胞功能和状态的最直接描述, 转录组成为研究基因表达的主要手段,转录组是 连接基因组遗传信息与生物功能的蛋白质组的必 然纽带,转录水平的调控是目前研究最多的,也 是生物体最重要的调控方式。
3. DNA成簇(Cluster)扩增
4. 高通量测序(Illumina Genome Analyzer IIx)信息分析流程
生物信息分析
基本信息分析
• 数据量产出:>2Gb per sample • 测序策略:HiSeq2000, PE91 or 101 • 插入片段大小:200 bps • 测序质量控制:Q20% >80
相关概念
• 高通量测序中,每测一个碱基会给出一个相应的质量值, 这个质量值是衡量测序准确度的。Q20与Q30则表示质量值 大于等于20或30的碱基所占百分比。
• Q20值是指的测序过程碱基识别过程中,对所识别的碱基 给出的错误概率。
• 质量值Q20,错误识别概率是1%,即正确率是99%; 质量值Q30,错误识别概率是0.1%,即正确率是99.9%; 质量值Q40,错误识别概率是0.01%,即正确率99.99%; Q“N”0的质量值,就是正确率有N个9的百分比。
RNA-seq(转录组学)的分析流程和原理
RNA-seq(转录组学)的分析流程和原理在开始详细讲解RNA测序之前,我们先来了解一下它的基本步骤:1.建库:提取RNA,富集mRNA或消除rRNA,合成cDNA和构建测序文库。
2.测序:然后在高通量平台(通常是Illumina)上进行测序(每个样本测序reads在DNA测序中,读数是对应于单个DNA片段的全部或部分的碱基对(或碱基对概率)的推断序列。
深度为10-30 Million reads。
)3.分析:先比对/拼装测序片段到转录本,通过计数、定量,样本间过滤和标准化,以进行样本组间基因/转录本统计差异分析。
大致了解这个过程之后,我们就先从建库开始了解建库的难点在于提纯出mRNA, 一般在我们抽离出的RNA中rRNA占比很大,其他还会有tRNA、microRNA等。
我们需要从抽离出的RNA中提取出mRNA,并建立cDNA文库。
这里以应用最广泛的Illumina公司的Truseq RNA的建库方法为例来进行介绍。
首先,利用高等生物的mRNA通常有poly(A)尾的(使mRNA更稳定,翻译不容易出错)特点,用带有poly(T)探针的磁珠与总RNA进行杂交,这样磁珠就和带poly(A)尾巴的mRNA结合在一起了。
接下来,就回收磁珠,把这些带poly(A)的mRNA从磁珠上洗脱下来。
再用镁离子溶液(或者超声波)进行处理,把mRNA打成小段。
然后,利用这些被打断的mRNA片段,以随机引物进行逆转录,得到第一链cDNA。
再根据第一链cDNA合成出ds-cDNA。
对cDNA在平末端进行3’端加A碱基(腺苷酸)(adapter接头上带了T碱基头,为了和adapter配对)在双链cDNA的两端加分别上Y型接头再经PCR扩增经筛选的目的基因,就得到可以上机的测序文库了。
这个建库方法对RNA的完整度有较高的要求。
也就是说,只有在mRNA大部分是完整的状态下,才能得到比较好的效果。
因为带Poly(T)的磁珠,它所吸附的是带有Poly(A)的那些序列。
RNA_Seq
IlluminTerminator a Sequencing Reversible Chemistry
3’ 5’
DNA (0.1-1.0 ug)
A C T
G A
C G A
T
C T G
Sample preparation: Fragmentation & addition of primers
Cluster growth in flow cell
[ ;J ?$ ( ' ;*( L$ ) ) 2+*$ $ v ) 2& ' I *( D2, $ , //- $
e/ < $ / ( - +$ $ A v ?;J ?/ A) 2+*$ $ ' / A3 S$ $ $
8 , A L;( SL/ $2A / C $ L2, J $ ?2& 2' 2L0& / A $ A J ;2, $ /
= ?>Y?""% >/(
/ & >1T$ $ 2, S/ ( - $ #0, *?/ +;+$ $ X r $ / */ ) D2, Y$ [ s RQ@ $ O` 5$ S$ " 477$ $ X $ ?;' Y$ K5W) s Z4O$ s 7@ ZK$ % - / L$ , i 5l $ e( +*$ I , 6L2< $ A $ ) 2+*6( , - $ $ *A w) *2A *2$ ( / 0$ L2, J / AA ( - $ $/ $
Outline
• • • • • Sequencing RNA-Seq Basic concepts in RNA-Seq Data format in RNA-Seq Brief introduction to RNA-Seq data analysis & quality assessment
转录组测序(RNA-seq)技术
转录组测序(RNA-seq)技术转录组是某个物种或者特定细胞类型产生的所有转录本的集合。
转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。
基于Illumina高通量测序平台的转录组测序技术使能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点以及cSNP(编码序列单核苷酸多态性),提供最全面的转录组信息。
相对于传统的芯片杂交平台,转录组测序无需预先针对已知序列设计探针,即可对任意物种的整体转录活动进行检测,提供更精确的数字化信号,更高的检测通量以及更广泛的检测范围,是目前深入研究转录组复杂性的强大工具。
技术优势:¾数字化信号:直接测定每个转录本片段序列,单核苷酸分辨率的精确度,同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题。
¾高灵敏度:能够检测到细胞中少至几个拷贝的稀有转录本。
¾任意物种的全基因组分析:无需预先设计特异性探针,因此无需了解物种基因信息,能够直接对任何物种进行转录组分析。
同时能够检测未知基因,发现新的转录本,并精确地识别可变剪切位点及cSNP,UTR区域。
¾更广的检测范围:高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和正常转录本。
应用领域:转录本结构研究(基因边界鉴定、可变剪切研究等),转录本变异研究(如基因融合、编码区SNP研究),非编码区域功能研究(Non-coding RNA研究、microRNA前体研究等),基因表达水平研究以及全新转录本发现。
图1 RNA-seq获得的数据能够进行全面的数据挖掘,既能够进行基因结构分析,鉴定UTR、可变剪切位点,也能够发现新的转录本及非编码RNA,比较样本间的表达水平差异康成生物提供的RNA-seq技术服务实验流程:1. 样品RNA准备2. 测序文库构建¾使用oligo dT微珠纯化mRNA¾ mRNA片段化处理¾反转录反应合成合成双链cDNA¾双链DNA末端修复及3’末端加‘A’¾使用特定的测序接头连接DNA片段两端¾高保真聚合酶扩增构建成功的测序文库3. DNA成簇(Cluster)扩增4. 高通量测序(Illumina Genome Analyzer IIx)5. 数据分析¾原始数据读取¾与数据库比对并进行注释¾深层次数据分析6. 提供实验报告¾原始数据报告(Fasta-Q格式),包含所有测序序列信息,碱基读取质量评估¾基本数据分析报告(Excel表格),包含有效序列的序列信息、与参考基因组比对后的注释信息等。
课件:5. RNA-Seq数据分析
RNA-Seq数据分析
李国亮 2014-03-18
1
提示
• 我在服务器上建立了两个目录:tools和genome • 现将FastQC、Trimmomatic、bwa、bowtie、
bedtools和samtools放在tools目录中,将拟南 芥、果蝇、人类基因组序列放在genome目录中 • 大家可以共同使用。现在,大家已经练习过数据 的下载、程序的下载、编译、索引的建立,每个 人就不需要保留自己的备份。
– Mapping reads to genome is challenging
• The relative abundance of RNAs vary wildly
– 105 – 107 orders of magnitude
– Since RNA sequencing works by random sampling, a small fraction of highly expressed genes may consume the majority of reads
6
Variations in RNA-Seq
• mRNA • Total RNA • Small RNA, such as miRNA, tRNA • Ribosomal profiling • Long non-coding RNA
7
Challenges
• RNAs consist of small exons that may be separated by large introns
RNA-seq = RNA sequencing
4
RNA-Seq
• Purpose
– Quantify the expression levels of RNAs – Identify new transcripts/genes – Identify fusion genes – Identify alternative splicing – Identify single nucleotide variations – Identify RNA editing
RNA-seq技术原理及应用[优质ppt]
3.把高通量测序技术应用到由 RNA 逆转录生成 的 cDNA 上,从而获得来自不同基因的RNA 片段在 特定样本中的含量,这就是 RNA测序或 RNA-seq。
三、RNA-seq结果分析
2. 基因表达水平估计 RNA-seq 数据最基本的应用是检测基因的表达水 平 ,与基因芯片数据相比 ,RNA 测序得到的是数字 化的表达信号,具有灵敏度高、分辨率高、无饱和区 等优势。 RNA 测序数据是对提取出的 RNA 转录本中随机 进行的短片段测序,如果一个转录本的丰度高,则测 序后定位到其对应的基因组区域的读段也就多,可以 通过对定位到基因外显子区的读段计数来估计基因表 达水平。
进一步,通过对供体和受体位点的读段计数,结合 外显子其他区域的读段数据,还能定量地计算选择性 剪接事件之间的比例。
三、RNA-seq结果分析
两类样本 RNA-seq 数据比较分析的框架
四、RNA-seq技术应用
1、转录本结构研究 利用单碱基分辨率的RNA-Seq技术可极大地丰
富基因注释的很多方面内容, 包括 5′/3′边界鉴定、 UTRs区域鉴定以及新的转录区域鉴定等。RNA-Seq 还可对可变剪接(Alternative splicing)进行定量研究。
二、RNA板扩增
序列组装和比较
图像获得和处理
TGCT…
1234
TTTT…
簇序列读取反应
二、RNA-seq技术原理
RNA-seq实验流程图
三、RNA-seq结果分析
为了便于测序数据的发布和共享,高通量测序数据以 FASTQ 格式来记录所测的碱基读段和质量分数。 NCBI、EBI、 DDBJ 等数据中心建立了大容量的数据库 SRA来存放共享的测 序数据。
转录组测序原理.pptx
激发碱基荧光并收集荧光信号
去除阻断基团和荧光基团
Cycle 2-n:
重复前面的步骤
第16页/共40页
ห้องสมุดไป่ตู้基片段杂交
OH
diol
P7 P5
Flow Cell接头
diol diol
模板杂交
diol diol
延长
diol diol
变性
第17页/共40页
Cluster station
• 剩下的复制链其一端“固定”在芯片上,
Throughput : up to 25 Gb per day
Output 26-35 Gb 75-100 Gb 150-200 Gb
第15页/共40页
基于SBS测序技术
3’-
…-5’
5’-
GTATTTTCGGCACAG
A
G
A
C
T
T
C TG
Cycle 1:按顺序加入反应试剂
合成第一个碱基
清除未反应的碱基和试剂
第25页/共40页
鉴定基因可变剪接
exon1
common reads
exon2
exon3
mRNA
exon1
junction reads
exon3
exon1
exon2
exon3
第26页/共40页
鉴定融合基因
第27页/共40页
Paired Reads distribution
Reads cluster
主要内容• 样品检测 • 制备 • Cluster Station • Illumina Sequencing • 生物信息分析
第14页/共40页
新一代测序技术
RNA-seq技术原理及应用 PPT
RNA-SEQ原理及应用解析PPT课件
10
2020/1/1
11
• 3、RPKM(reads per kilobase per million reads)是每百万 读段中来自于某基因每千碱基长度的读段数。其公式为:
6
高通量测序
• 高通量测序技术(High-throughput sequencing)是指 能够一次并行对几十万到几百万条DNA分子进行序列测定, 每一次序列测定的读长一般较短的测序技术。
• 高通量测序技术是对传统测序一次革命性的改变,一次对 几十万到几百万条DNA分子进行序列测定,因此在有些文 献中称其为下一代测序技术(next generation sequencin g)足见其划时代的改变,同时高通量测序使得对一个物种 的转录组和基因组进行细致全貌的分析成为可能,所以又 被称为深度测序(deep sequencing)。
所以近年来,许多通过RNA-seq进行测序分析的文章都包括对
ncRNA的分析,并且发现了许多新的ncRNA。
5
二、RNA-seq技术原理
RNA-seq 实验流程图
首先,我们获得细胞总RNA,然后根据实 验需要,比如是需要测mRNA,ncRNA还 是 smallRNA等,对RNA样品进行处理。处理
好的RNA再进行片段化最后用新一代高通量测序 依进行测序。
8
三种高通量测序技术的优缺点
9
高通量测序中重要名词解释
• 1、测序深度:测序得到的总碱基数与待测基因组大小的比值。 假设一个基因组大小为7M,测序总碱基数为70M,则测序深 度为10×。
转录组测序(RNA-seq)技术
转录组测序(RNA-seq)技术转录组是某个物种或者特定细胞类型产生的所有转录本的集合。
转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。
基于Illumina高通量测序平台的转录组测序技术使能够在单核苷酸水平对任意物种的整体转录活动进行检测,在分析转录本的结构和表达水平的同时,还能发现未知转录本和稀有转录本,精确地识别可变剪切位点以及cSNP(编码序列单核苷酸多态性),提供最全面的转录组信息。
相对于传统的芯片杂交平台,转录组测序无需预先针对已知序列设计探针,即可对任意物种的整体转录活动进行检测,提供更精确的数字化信号,更高的检测通量以及更广泛的检测范围,是目前深入研究转录组复杂性的强大工具。
技术优势:数字化信号:直接测定每个转录本片段序列,单核苷酸分辨率的精确度,同时不存在传统微阵列杂交的荧光模拟信号带来的交叉反应和背景噪音问题。
高灵敏度:能够检测到细胞中少至几个拷贝的稀有转录本。
任意物种的全基因组分析:无需预先设计特异性探针,因此无需了解物种基因信息,能够直接对任何物种进行转录组分析。
同时能够检测未知基因,发现新的转录本,并精确地识别可变剪切位点及cSNP,UTR区域。
更广的检测范围:高于6个数量级的动态检测范围,能够同时鉴定和定量稀有转录本和正常转录本。
应用领域:转录本结构研究(基因边界鉴定、可变剪切研究等),转录本变异研究(如基因融合、编码区SNP研究),非编码区域功能研究(Non-coding RNA研究、microRNA前体研究等),基因表达水平研究以及全新转录本发现。
图1 RNA-seq获得的数据能够进行全面的数据挖掘,既能够进行基因结构分析,鉴定UTR、可变剪切位点,也能够发现新的转录本及非编码RNA,比较样本间的表达水平差异康成生物提供的RNA-se q技术服务实验流程:1. 样品RNA准备2. 测序文库构建使用oligo dT微珠纯化mRNAmRNA片段化处理反转录反应合成合成双链cDNA双链DNA末端修复及3’末端加‘A’使用特定的测序接头连接DNA片段两端高保真聚合酶扩增构建成功的测序文库3. DNA成簇(Cluster)扩增4. 高通量测序(Illumina Genome Analyzer IIx)5. 数据分析原始数据读取与数据库比对并进行注释深层次数据分析6. 提供实验报告原始数据报告(Fasta-Q格式),包含所有测序序列信息,碱基读取质量评估基本数据分析报告(Excel表格),包含有效序列的序列信息、与参考基因组比对后的注释信息等。
转录组测序技术原理及应用 ppt课件
转录组测序技术原理及应用
Applications of RNA-Seq
Application
Expression-profiling Alternative Splicing Fusion Gene SNP detection
真核mRNA的纯化
mRNA的纯化主要通过的磁珠与 生物素吸附原理从而分离纯化
Oligo(dT)25磁珠纯化原理主要 是mRNA的3′的poly A与磁珠在 bindingbuffer的作用下相结合。磁 珠通过MPC(磁分离器)从溶液 中分离出来。
mRNA与磁珠结合后,再用Tris-
HCL在加热条件下解离洗脱到溶
加入1µl的stop buffer终止 反应。
加入沉淀剂(NaAc 糖原 无水乙醇)沉淀产物。
RT ds cDNA
转录组测序技术原理及应用
末端修复(防止自连) cDNA 3′末端加A Adapter连接
转录组消化DNA
↓
mRNA的分离
↓
mRNA的打断
Size selection, then PCR amplification
HiSeq 2000n Illumina Sequencing 生物信息分析
转录组测序技术原理及应用
系统生物学-第三讲-转录组学PPT课件
.
18
• 第一个被确认的miRNA——在线虫中首次发现的lin-4 和 let-7 ,可以通过部分互补结合到目的mRNA靶的3’非编 码区(3’UTRs),以一种未知方式诱发蛋白质翻译抑制, 进而抑制蛋白质合成,通过调控一组关键mRNAs的翻译 从而调控线虫发育进程。
继线虫之后,随后多个研究小组在包括人类、果蝇、植物等多 种生物物种中鉴别出数百拼接和注释表达与分类功能分析作用机理分析qpcr验证est软件平台est序列库序列的质量检查测序量监控聚类和拼接检查借助于基因组信息全长orf寻找发现全长基因研究表达基因概况的主要实验手段dnachipproteomics的先驱功能分类表达量分析交替剪接检测est特有信息microarray和genechip大规模表达谱或全景式表达谱globalexpressionprofile
.
40
表达序列标签(EST)测定及分析
1、什么是EST? 2、EST的应用 3、EST序列测定及分析过程
.
41
1、表达序列与表达序列标签概念
(1) 什么是表达序列?
基因组表达为RNA的序列: mRNA和功能RNA
(2) 什么是表达序列标签?
(expressed sequence tag, EST)
• 转录组研究是基因功能及结构研究的基础和 出发点,是解读基因组功能原件和揭示细胞 及组织分子组成所必需的。
.
34
• 转录组的特点:受到内外多种因素的调节,因而是 动态可变的。能够揭示不同物种、不同个体、不同 细胞、不同发育阶段及不同生理病理状态下的基因 差异表达信息。
.
35
• 转录组学(Transcriptomics):研究细胞在某 一功能状态下所含mRNA的类型与拷贝数;比较不
转录组分析(RNA-Seq)
Random hexamer primed cDNA synthesis
Paired-end Solexa Sequencing
-6-微珠纯化mRNA ������ mRNA片段化处理 ������ 反转录反应合成合成双链cDNA ������ 双链DNA末端修复及3’末端加‘A’ ������ 使用特定的测序接头连接DNA片 段两端 ��� 4. 高通量测序(Illumina Genome Analyzer IIx) 5. 数据分析 ������ 原始数据读取 ������ 与数据库比对并进行注释 ������ 深层次数据分析
转录组分析(RNA-Seq)
• 李江攀
RNA-Seq 的技术背景 RNA-Seq 的应用领域 RNA-Seq 面临的挑战及发展前景
RNA-Seq 的技术背景
RNA-Seq又称转录组高通量测序(transcriptome sequencing)或称为全转录组鸟枪法测序(Whole Transcriptom Shotgun Sequencing WTSS) 原则上, 所有的高通量测序技术都能进行RNA测序。自2005 年以来, 以Roche 公司的454 技术、Illumina 公司的 Solexa 技术和ABI 公司的SOLiD 技术为标志的新一代测 序技术相继诞生, 之后HelicosBiosciences 公司又推出单 分子测序(Single molecule sequencing, SMS)技术。新一 代测序又称作深度测序或高通量测序, 是相对于传统的 Sanger 测序而言,主要特点是测序通量高, 测序时间和成 本显著下降。各平台测序原理及序列长度的差异决定了各 种高通量测序仪具有不同的应用侧重
2、就目前来看, 作为两个高通量的转录组 学研究技术, 在应用的某些方面既存在重叠 和竞争也存在优势互补, 一种技术能弥补另 一种技术遗漏的部分, 通常对一个生物学问 题的回答需要不同实验技术的协同配合
RNA-seq技术原理及应用ppt课件
二、RNA-seq技术原理
Illumina/Solexa 测序技术的基本原理是边合成边 测序,即测序过程是以 DNA 单链为模板,在生成 互补链时,利用带荧光标记的 dNTP 发出不同颜色 的荧光来确定不同的碱基。
新加入 dNTP 的末端被可逆的保护基团封闭,既 保证单次反应只能加入一个碱基,又能在该碱基读 取完毕后,将保护基团除去,使得下一个反应可继 续进行。为了增加荧光强度,使之更易被成像系统 所采集,该技术在测序之前还需要对待测片段做桥 式扩增。
RNA-seq技术原理及应用
主要内容
1、RNA-seq技术简介 2、RNA-seq技术原理 3、RNA-seq结果分析 4、RNA-seq技术应用
精选2021版课件
2
一、RNA-seq技术简介
1.诞生于 20 世纪 70 年代的 Sanger 法是最早被广 泛应用的 DNA 测序技术,也是完成人类基因组计 划的基础。
进一步,通过对供体和受体位点的读段计数,结合 外显子其他区域的读段数据,还能定量地计算选择性 剪接事件之间的比例。
精选2021版课件
11
三、RNA-seq结果分析
两类样本 RNA-seq 数据比较分析的框架
精选2021版课件
12
四、RNA-seq技术应用
1、转录本结构研究 利用单碱基分辨率的RNA-Seq技术可极大地丰
(2) Burrows-Wheeler 转换技术:通过B-W 转换将基因组 序列按一定规则压缩并建立索引,再通过查找和回溯来定位读 段,在查找时可通过碱基替代来实现允许的错配(Bowtie)。
(3)改进的 SmithWaterman 动态规划算法:随着读长的 增加,允许读段序列中存在插入删除(indel)的定位(BFAST、 SHRiMP、Mosaik)。
转录组研究新技术RNASeq及其应用
转录组研究新技术RNASeq及其应用一、本文概述随着生物信息学和分子生物学的快速发展,转录组研究已成为解析生命活动重要机制的关键手段。
近年来,新一代测序技术(Next-Generation Sequencing,NGS)的崛起,特别是RNA测序(RNA Sequencing,RNA-Seq)技术的广泛应用,极大地推动了转录组学研究的深度和广度。
RNA-Seq技术以其高分辨率、高灵敏度和高定量的特性,在基因表达分析、非编码RNA研究、基因结构变异分析等领域展现出强大的潜力。
本文旨在全面介绍RNA-Seq技术的基本原理、实验流程、数据分析方法,以及其在生命科学各领域中的实际应用,以期为相关研究人员提供有益的参考和启示。
二、RNASeq技术概述RNA测序(RNASeq)是一种革命性的技术,极大地推动了转录组学的研究进程。
该技术基于下一代测序(Next Generation Sequencing, NGS)平台,可以对生物样本中的RNA进行全面、精确的测序和分析。
RNASeq不仅提供了转录本的序列信息,还能够揭示转录本的表达水平、剪接方式、变异情况以及基因结构等重要信息。
RNASeq的实验流程通常包括样本制备、文库构建、测序和数据分析等步骤。
在样本制备阶段,需要提取高质量的RNA,并通过一系列的处理步骤去除杂质和降解的RNA。
文库构建是RNASeq技术的核心,其目标是将RNA片段化、反转录成cDNA,并构建成适合测序的文库。
测序阶段则利用NGS平台对文库进行高通量测序,获得大量的序列数据。
数据分析是RNASeq技术的另一个关键环节。
通过对测序数据的处理和分析,可以鉴定出转录本、评估基因表达水平、发现可变剪接事件、识别基因融合以及探索非编码RNA等。
RNASeq技术还可以与表观遗传学、蛋白质组学等其他组学技术相结合,从多个层面揭示生命活动的复杂性和多样性。
RNASeq技术的应用范围非常广泛,涵盖了基础生物学研究、疾病机理探索、药物研发等多个领域。
组学专题-转录组学
组学专题-转录组学转录组及转录组测序(RNA-seq)转录组即特定细胞在某一功能状态下所能转录出来的所有 RNA的总和,包括mRNA 和非编码RNA。
转录组测序(RNA-seq)主要通过高通量测序研究特定组织或细胞在某个时期转录出来的mRNA的表达量,进而对相关基因和表型的关系进行分析。
本质上讲RNA-seq就是在用一种新的方法实现“基因决定性状”的经典思路。
在RNA-seq之前用于研究基因组表达分析的主要技术是基因芯片,不过由于高通量测序成本的下降,RNA-seq的运用愈来愈广泛。
RNA-seq的技术优势有:•可以直接测定每个转录本片段序列、单核苷酸分辨率的准确度;•灵敏度高,可以检测细胞中少至几个拷贝的稀有转录本;•可以对任意物种进行全基因组分析,能够检测未知基因,发现新的转录本,并准确地识别可变剪切位点及cSNP,UTR区域;•检测范围广,能够同时鉴定和定量稀有转录本和正常转录本。
RNA-seq是需要生物学重复的,至少需要两次生物学重复,3次以上的生物学重复更好。
以3个重复为例,加上对照的三个生物学重复,一次RNA-seq需要6个样本。
转录组分析入门转录组分析是参考菜鸟团团长Jimmy的转录组入门推送门,详细的请参考原文(参考资料2即是)。
DNA-seq、RNA-seq等组学分析都是一个系统性的工作,细节也很多,在这里主要是框架的搭建。
1. 计算机资源准备Jimmy推荐的电脑配置:最好是有mac或者linux系统,8G+的内存,500G的存储即可。
如果你是Windows,那么安装必须安装git,notepad++,everything,还有虚拟机,在虚拟机里面安装linux,最好是ubuntu。
其实很不建议使用windows直接进行RNA-seq,因为虚拟机的稳定性是一个很大的问题,性能和功能都很难保证,以VMware为例,虚拟安装Ubuntu16.04LTS,总是会出现网络连接问题,没有网络连接,连安装分析软件这一关都很难过去。
RNA-Seq定量分析介绍
2-RPKM
log2 Ratio (2/1) 12.34022 11.88152 11.82992 11.7416 11.63819
Up-DownRegulation (2/1) Up Up Up Up Up
P-value
FDR
5.185345 3.773063 3.640487 3.424326 3.187452
85.36% 99.85% 97.87%
1134.969602
2709.9351648 6763.5638996 432.08279049
3312
13802
2261
99.56%
1665.5817029
表达量统计
基于样品的定量结果,可 以分析样品间的重复性: - 生物学重复
- 技术性重复
方法:相关性分析 (Pearson、Spearman、
案例
- 玉米胚胎脱分化过程的基因表达谱
• 玉米重要的粮食作物和饲料来源,全世界产量最高的粮食 作物 • 玉米胚胎胚性愈伤组织具有较强的长期继代能力和再生植 株能力,常被用于构建转基因受体系统 • 目前没有玉米幼胚胚脱分化过程全面的表达谱研究 • 高胚性愈伤诱导率自交系18-599为研究材料
Genome Expression Profile Analysis of the Immature Maize Embryo during Dedifferentiation. PLoS ONE (2012): e32237. doi:10.1371/journal.pone.0032237
a) 空载测序接头序列 控制reads中unknown碱基比例 b)
上机测序
RNA-Seq 实验流程
c)
控制read的整体测序质量
真核转录组讲解及数据解读PPT
转录组结果解读转录调控研究部北京诺禾致源科技股份有限公司OUTLINE简介实验部分生物信息分析概述1转录组是指特定组织或细胞在某个时间或某个状态下转录出来的所有RNA的总和,主要包括mRNA和非编码RNA。
转录组研究是研究基因功能和结构的基础,对生物体的发育和疾病的发生具有重要作用。
RNA-seq技术流程主要包含两个部分,建库测序和数据分析。
2实验部分(RNA检测、建库、测序))•琼脂糖凝胶电泳:分析样品RNA完整性及是否存在杂质污染。
•NanoPhotometerspectrophotometer:检测RNA纯度(OD260/280及OD260/230比值)。
•Agilent 2100 bioanalyzer:精确检测RNA完整性。
链特异性文库优势:相同数据量下可获取更多有效信息;能获得更精准的基因定量、定位与注释信息5➢1、一般动物样品会有三条带:28S 、18S 、5S ,如果提取过程经过过柱处理或者利用CTAB+LiCl 方法提取,5S 可能较暗或者没有。
➢昆虫或者软体动物等样品只有1条比较明显的带,例如:牡蛎、果蝇、螨虫、蝗虫、蚊、蚕等➢2、植物样品有三条带:25S 、18S 、5S ,有些特殊物种或部位可能本身含条带比较多,如果条带清晰,也可初步判定合格➢3.原核生物中主要有5S 、16S 、23S rRNA叶片小鼠蚊动物植物原核RIN 5RIN 7RIN 8RIN 9RIN 4RIN 6RIN 10RIN 2RIN 1RIN 值范围示意图问与答文献要求OD260/OD230≥1.8,OD260/OD230如果小于2.0,则表明样品中被碳水化合物、盐类或有机溶剂污染;OD260/OD230合格的标准是多少呢?答:OD260/OD230≥2.0,且OD260/OD280≥2.0这说明RNA提取结果是相当好的,一般在1.8-2.1之间就说明RNA结果十分好,但是nanodrop的灵敏度没有2100好,因此我们主要根据2100检测结果来判定RNA是否合格,一般只要RIN值和RNA总量达到我们的判定标准的话,我们就会判为合格。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Random hexamer primed cDNA synthesis
Paired-end
Solexa Sequencing
-6- dT微珠纯化mRNA ������ mRNA片段化处理 ������ 反转录反应合成合成双链cDNA ������ 双链DNA末端修复及3’末端加‘A’ ������ 使用特定的测序接头连接DNA片 段两端
转录组分析(RNA-Seq)
• 李江攀
RNA-Seq 的技术背景 RNA-Seq 的应用领域 RNA-Seq 面临的挑战及发展前景
RNA-Seq 的技术背景
RNA-Seq又称转录组高通量测序(transcriptome sequencing)或称为全转录组鸟枪法测序(Whole Transcriptom Shotgun Sequencing WTSS)
数字表达谱与芯片的比较
特点
数字化信号 高通量 可重复性高 无需重复实验 检测低丰度基因 检测新转录本 检测反义链转录本
数字表达谱
√ √ √ √ √ √ √
芯片
√
Unigene12000个以上,但转录组大小受基因数目和基因丰度双 重影响,组织差异、状态和实验处理也会影响转录组组成。Βιβλιοθήκη RNA-Seq 的发展前景
1、虽然RNA-Seq 技术还面临着种种困难, 但 作为一个刚刚起步的新技术RNA-Seq 已经显 示出其他转录组学技术无可比拟的优势:既 能提供单碱基分辨率的转录组注释又能提供 全基因组范围的“数字化”的基因表达谱, 而 且其成本通常比芯片和大规模的Sanger EST 测序要低, 有
Procedure of RNA-Seq
Total RNA
Rich mRNA (polyA RNA)
Oligo(dT) primed cDNA synthesis
Random hexamer primed cDNA synthesis
RNA fragment (200~700 nt)
Fragmentation (200~700 bp)
转录组?
转录组是特定组织或细胞在某一发 育阶段或功能状态下转录出来的所 有RNA 的集合
RNA-Seq 原理
把高通量测序技术应用到由mRNA 逆转录生 成的cDNA 上, 从而获得来自不同基因的 mRNA 片段在特定样本中的含量, 这就是 mRNA 测序或 mRNA-Seq, 同样原理, 各种 类型的转录本都可以用深度测序技术进行 高通量检测, 统称作RNA-Seq
RNA-Seq 面临的挑战
庞大的数据量所带来的信息学难题
如何针对更复杂的转录组来识别和追踪所有基 因中罕见RNA 亚型的表达变化
目前的高通量测序技术大都需要较多的样品起 始量, 这使得来源极为有限的生物样品分析受 到限制, 因此如何对单细胞或少量细胞进行转 录组测序是一个亟待解决的问题
2、就目前来看, 作为两个高通量的转录组 学研究技术, 在应用的某些方面既存在重叠 和竞争也存在优势互补, 一种技术能弥补另 一种技术遗漏的部分, 通常对一个生物学问 题的回答需要不同实验技术的协同配合
3、 RNA-Seq 的强项, 就在于它是一个“开 放系统”, 它的发现能力和寻找新的信息的 能力从本质上高于芯片技术, 相信随着相关 学科的进一步发展和测序成本的进一步降 低, RNA-Seq 必将在转录组学研究领域占 主导地位
������)扩增 4. 高通量测序(Illumina Genome Analyzer IIx) 5. 数据分析
������ 原始数据读取
������ 与数据库比对并进行注释
������ 深层次数据分析
RNA-Seq 的应用领域
图所示 RNA-seq获得的数据能够进行全面的数据挖掘,既能够进行 基因结构分析,鉴定UTR、可变剪切位点,也能够发现新的转录本及 非编码RNA,比较样本间的表达水平差异
RNA-seq常见问题
• 送样要求: 浓度≥400ng/ul,RNA总量≥20ug;OD260/280为1.8-2.2, 28S/18S>1.8,RIN ≥8.
• 在进行原核生物转录组分析时需要提供纯化后的原核生物 mRNA或cDNA样品。
• 进行非编码RNA测序时需要提供去除rRNA和tRNA的RNA样品。 • 测序1Gb的转录组数据时通常可以得到长度大于500bp的