RNA-SEQ原理及应用(转)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息培训+视频群 451570858
生物信息培训+视频群 451570858
SAGE, serial analysis of gene expression, 基因表达系列分析 MPSS, massively parallel signature sequencing, 大规模平行信号测序
四、RNA-seq技术应用
• 1、转录本结构研究 利用单碱基分辨率的RNA-Seq技术可极大地丰富基因注 释的很多方面内容, 包括 5′/3′边界鉴定、UTRs区域鉴 定以及新的转录区域鉴定等。RNA-Seq还可对可变剪接(Alt ernative splicing)进行定量研究。 • 2、转录本变异研究 在发现序列差异方面,如融合基因鉴定、编码序列多态 性研究等,RNA-seq也具有很大的潜力。
有关ncRNA的一些知识:
非编码RNA(ncRNA)主要包括有以下几种:转运RNA(tRNA), 核糖体RNA(rRNA),小核RNA(snRNA),核仁小分子RNA(snoRNA), 细胞质小分子RNA(scRNA),不均一核RNA(hnRNA)及小RNA (microRNA,miRNA)等。
非编码RNA具有调节基因表达的作用,如对染色体结构的影响, 对RNA加工修饰及稳定性的影响,对转录和翻译的影响,甚至对 蛋白质的转运及稳定性都有一定的影响。 所以近年来,许多通过RNA-seq进行测序分析的文章都包括对nc RNA的分析,并且发现了许多新的ncRNA。
三种高通量测序技术的优缺点
高通量测序中重要名词解释
• 1、测序深度:测序得到的总碱基数与待测基因组大小的比值。 假设一个基因组大小为7M,测序总碱基数为70M,则测序深度 为10×。 • 2、覆盖度:测序获得的序列占整个基因组的比例。由于基因 组中高GC含量,重复序列等复杂结构的存在,测序最终拼接组 装的序列往往无法覆盖所有的区域,这些区域就叫做Gap。
• 4、基因表达水平研究 相比于传统的芯片技术,RNA-Seq技术能更准确地确定 细胞中RNA的表达水平。原则上,RNA-Seq有可能确定细胞 群中的每一个分子的绝对数量,并对实验之间的结果进行 直接比较。RNA-Seq一个特别强大的优势是它可以捕捉不同 组织或状态下的转录组动态变化而无需对数据集进行复杂 的标准化。
生物信息培训+视频群 451570858
转录组的含义:
• 转录组是指特定组织或细胞在某一发育阶段或功能状态下 转录出来的所有RNA的总和, 主要包括mRNA和非编码RNA(no n-coding RNA, ncRNA)。 • 转录组研究是基因功能及结构研究的基础和出发点,是解 读基因组功能原件和揭示细胞及组织分子组成所必需的。
• 3、非编码区域功能研究 转录组学研究的一个重要方面就是发现和分析ncRNA。 ncRNA按其功能可分为看家ncRNA和调节ncRNA。前者通常 稳定表达,发挥着一系列对细胞存活至关重要的功能, 主要 包括转移RNA(tRNA)、核糖体RNA(rRNA)、小核 RNA(snRNA) 及小核仁 RNA(snoRNA)等;后者主要包括长链 ncRNA(lncR NA)和以microRNA为代表的小ncRNA(small ncRNA), 在表观 遗传、转录及转录后等多个层面调控基因表达。
高通量测序
• 高通量测序技术(High-throughput sequencing)是指能 够一次并行对几十万到几百万条DNA分子进行序列测定,每 一次序列测定的读长一般较短的测序技术。 • 高通量测序技术是对传统测序一次革命性的改变,一次对 几十万到几百万条DNA分子进行序列测定,因此在有些文献 中称其为下一代测序技术(next generation sequencing) 足见其划时代的改变,同时高通量测序使得对一个物种的 转录组和基因组进行细致全貌的分析成为可能,所以又被 称为深度测序(deep sequencing)。
三种高通量测序简介:
• 自2005年以来,以 Roche公司的454技术、Illumina公司的S olexa技术和ABI公司的SOLiD技术为标志的新一代测序技术 相继诞生。之后Helicos Biosciences公司又推出单分子测 序(Single molecule sequencing, SMS)技术。
RNA-seq技术原理及应用
报告人:柳晓东 2012.4.16
• 1、RNA-seq技术简介 • 2、RNA-seq技术原理 • 3、RNA-seq技术优势 • 4、RNA-seq技术应用 • 5、RNA-seq发展前景
生物信息培训+视频群 451570858
一、RNA-seq技术简介
RNA-Seq(RNA sequencing), 即 RNA测序又称转录组测序,就是把 mRNA,smallRNA和 non-coding RNA (ncRNA)全部或者其中一些用高通 量测序技术进行测序分析的技术。
三、RNA-seq技术优势
• 相对于传统的sanger测序法,RNA-seq具有以下优势: • 1、数字化信号:直接测定每个转录本片段序列,单核苷酸分辨 率的精确度,同时不存在传统微阵列杂交的荧光模拟信号带来的 交叉反应和背景噪音问题。 • 2、高灵敏度:能够检测到细胞中少至几个拷贝的稀有转录本ቤተ መጻሕፍቲ ባይዱ • 3、任意物种的全基因组分析:无需预先设计特异性探针,因此 无需了解物种基因信息,能够直接对任何物种进行转录组分析。 同时能够检测未知基因,发现新的转录本,并精确地识别可变剪 切位点及cSNP,UTR区域。
RNA-seq测序数据的分析
五、RNA-seq发展前景
• 由于RNA-seq相对于传统的测序方法具有明显的优势,所以 被广泛运用到差异基因表达分析,新转录本发现,可变剪 切研究等方面。并且随着技术的进步,成本的降低,其应 用也越来越广泛。近年来,由RNA-seq技术测序而发表的文 章越来越多,而且对于测序结果进行分析的软件也也越来 越丰富,相信在不久的将来,RNA-seq技术能够获得相当大 的普及。
二者的关系:测序深度与基因组覆盖度之间是一个正相关的关系, 测序带来的错误率或假阳性结果会随着测序深度的提升而下降。 当测序深度在10~15X以上时,基因组覆盖度和测序错误率控 制均得以保证。
• 3、RPKM(reads per kilobase per million reads)是每百万读 段中来自于某基因每千碱基长度的读段数。其公式为:
• 其中,total exon reads指映射到某个基因上的reads数,mapped reads指map到所有基因的总的reads数。 • RPKM不仅对测序深度作了归一化,而且对基因长度也作了归一化, 使得不同长度的基因在不同测序深度下得到的基因表达水平估计 值具有了可比性,是目前最常用的基因表达估计方法。
生物信息培训+视频 451570858
• 5、低丰度全新转录本的确定 虽然利用转座子标签和芯片技术能够获得全新的转录本, 但是其工作量大,结果不确定。而RNA-Seq不受背景噪音问 题的困扰,结果准确性高,因而被用来发现全新的转录本。 近年来对酿酒酵母、栗酒裂殖酵母、拟南芥、水稻、小鼠、 人、和人体白色念珠菌的转录组测定结果都显示出大量的 新转录区域,并且其中许多转录水平都低于已知的cDNA基 因。
二、RNA-seq技术原理
RNA-seq 实验流程图
首先,我们获得细胞总RNA,然后根据实 验需要,比如是需要测mRNA,ncRNA还是 smallRNA等,对RNA样品进行处理。处理 好的RNA再进行片段化,然后反转录形成 cDNA,获得cDNA文库,然后在cDNA片段的 两端接上接头,最后用新一代高通量测序 依进行测序。