转录组学

转录组学
转录组学

基于高通量测序的储粮害虫抗药性相关基因的转录组学分析及其技术研究

专业:食品科学姓名:陶冶心学号:1120140520

摘要:随着测序技术的发展,昆虫转录组数据不断积累,在昆虫学研究中的应用也越来越广泛。在害虫抗药性的研究中,转录组数据分析也是重要的最新研究手段。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。RNA-Seq作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。本文简要介绍了转录组学及其定义,并以RNA测序为例着重介绍了高通量测序在转录组中的应用,并对其中有待进一步研究的问题进行展望。

关键词:转录组高通量测序抗性

Deep Sequencing-based Transcriptome Analysis in insect

resistance research

Abstract:With the development of sequencing technology,the number of known insect transcriptome sequences has increased and transcriptome data has become more useful in entomology,including research on insect resistance.Transcriptome can research from the overall level of gene function and gene structure, revealing the specific molecular mechanism in the process of biological processes and disease. RNA-Seq,as a new kind of efficient, fast transcriptome research techniques ,is changing people's understanding of the transcriptome. Transcriptomics and its definitions are briefly introduced and pick RNA sequencing as an example, fully introduced the application of high-throughput sequencing of the transcriptome, the further research problems are discussed at the same time.

Key words: transcriptome ,High-throughput sequencing, resistance

由于杀虫剂的长期使用,昆虫产生的抗药性已成为农林虫害治理面临的重大问题研究昆虫抗药性机制有助于为农林害虫防控、资源昆虫抗性品系选育及新型杀虫剂研发提供科学指导。长期以来,人们通过对模式昆虫、卫生昆虫和农林害虫的研究,对昆虫代谢抗性、靶标抗性有了一定认识,继而利用分子生物学手段克隆、分析了一些抗性相关基因,上述研究方

案中,受限于序列获得的困难,往往只研究某一个或几个基因,并将代谢抗性和靶标抗性割裂开来分析。组学技术的出现使研究人员有可能对所有抗性相关的基因开展系统的分析。1转录组学的发展

1.1转录组

转录组(transcriptome)广义上是指在一定生理条件下,某一物种的组织或特定细胞内的全部转录产物的总和,包括了信使RNA(mRNA)、转运RNA(tRNA)、核糖体RNA (rRNA)和非编码RNA (non-coding RNA, ncRNA)。狭义上指的是细胞内能够转录出的所有mRNA 分子。mRNA作为信使RNA通过编码蛋白质,负责将基因的遗传信息传递给行使生物学功能的蛋白质,被认为是DNA与蛋白质之间生物信息传递的“桥梁”[1]。ncRNA是不被翻译成蛋白质的RNA分子,在转录产物中占的比例也较大,它们对生物体的各项生命活动具有重要的调节作用,如蛋白质合成及降解、蛋白质细胞定位、参与mRNA的稳定性及翻译、mRNA选择性剪接及降解、rRNA的甲基化修饰及假尿啼聢化加工、DNA端粒合成及细胞寿命的调控、染色体复制、染色体表观遗传修饰等[2-3]。

转录组的定义里面包括了时间与空间的限定,显著不同于基因组的固定不变(除基因突变),即同一细胞在不同的生长周期及生长环境下,其基因表达情况不完全相同[4]。

1.2 转录组学

随着当今科学技术的飞速发展,目前越来越多的物种全基因测序工作已完成,下一阶段我们面临的主要问题就是这些基因的功能有哪些?不同的基因参与了哪些组织细胞中的基因表达的调控?参与哪些生命过程?相同的基因在不同细胞内或者疾病和治疗状态下的表达水平、以及基因与基因产物之间的相互作用等等。因此,在人类基因组测序研究后,科学家们更多的精力转移到功能基因组学的研究中。

功能基因组学(Functional Genomics)是利用结构基因组学提供的信息和产物,以高通量、大规模实验方法,应用统计科学和计算机分析,在基因组或系统水平全面研究功能基因、蛋白质和代谢物,并探索它们之间的相互联系和规律[5]。

转录组学(transcriptomics)是功能基因组学的一个重要组成部分,是一门在整体水平上研究细胞中基因转录的情况及转录调控规律的学科。简而言之,转录组学是从RNA水平研究基因表达的情况,可以用来研究某一生理条件或时空条件下该物种转录水平和正常情况下的差异,能够将功能基因组学与RNA水平的基因表达情况的研究联系起来。因此,在人类基因组计划完成后,转录组学研究很快受到科学家的关注。目前,转录组学已经成为基因表达调控研究的重要手段,从一个细胞或组织基因组的全部mRNA 水平研究基因表达情况,它

能够提供全部基因的表达调节系统和蛋白质的功能、相互作用的信息。基因转录水平上的调控是生物最重要的调控形式,也是现在研究最多的基因表达调控形式。转录组学研究的不断深入,必将为生命科学的更多新领域的探索研究提供高效的方法。

1.3转录组研究技术的发展

转录组学研究是基于高通量的,用大规模的数据研究生命过程中一系列基因的整体水平的转录机理。因此需要先获取大量已知的基因序列信息和转录本序列,并且对所研究对象的基因组需要有一个全局性的了解。

第一个得到描述的转录组是酿酒酵母细胞,共分析了60633个转录本,揭示了4665个基因,其中,1981个基因有已知的功能,而2684个基因从未被鉴定过[6]。随着科技的进步以及转录组研究的不断加深,科学家们已经建立起来了一系列的技术方法,转录组的研究方法主要有以下几种:(1)基于杂交的转录组学方法:基因芯片(DNA microarray);(2)基于测序的转录组学方法:主要包括:表达序列标签(Expressed Sequence Tag,EST)[7,8]、基因表达序列分析(SerrialAnalysis of Gene Expression ,SAGE) 、大规模平行测序(Massively Parallel Signature Sequencing, MPSS);(3)基于新一代高通量测序技术(High-ThroughputSequencing)的转录组测序等等。

2基于新一代高通量技术的转录组学研究方法

2.1新一代高通量技术的测序技术的发展

新一代高通量测序技术(454GS-FLX,Solexa, SOLiD)具有高通量、高检测灵敏度以及低运行成本等优点,堪称测序技术发展历程的一个里程碑,该技术可以对数百万个DNA 分子进行同时测序。这使得对一个物种的转录组和基因组进行细致全貌的分析成为可能,因此也称其为深度测序( deep sequencing) [9]。RNA-Seq技术,又称转录组测序技术,就是近几年发展起来的应用新一代高通量测序进行转录组学研究的技术[10]。原则上,所有的高通量测序技术都能够应用于RNA测序。

20世纪70年代的Sanger法测序技术是最早广泛应用的DNA测序技术[11],它是一种以末端终止法为原理建立起来的技术。Sanger测序作为30多年来惟一的DNA测序方法,对现代生物学研究起到了极大的促进作用。测序时,DNA分子被切断为大的片段,测得大片段的序列后,继续将大片段切断成小片段,逐步测定整个基因组序列。但是,Sanger法技术测序通量低,费时费力且成本高,需要大量的技术人员参与。随着大规模基因组学的兴起,多种高通量低成本的测序技术应运而生,并逐步被应用到生物学研究的各个领域。目前, 新一代测序技术正以Sanger测序无可比拟的速度产生海量数据, 不仅引领生命科学全面进入后基因组

时代,更推动了生物信息学、系统生物学等交叉学科的迅猛发展。

循环芯片测序法(cyclic-arraysequencing)[12]为近年来出现的一种新的测序方法,也可将其称为“新一代测序技术或者第二代测序技术”Next-generation Sequencing Technology)。这一技术不断得到创新和改良,在保证基因组测序足够精确的前提下,操作程序的优化,测序通量急速增加,是传统Sanger法的几百到几千倍,测试的成本也呈现直线下降的趋势,只为原有技术的几十分之一。新一代测序技术的核心思想就是边合成(或者连接)边测序[13]。

自2005年以来,以Roche公司的454技术(Roch GS FLX sequencer,以emulsion-PCR和焦磷酸测序技术为核心)、Illumina公司的Solexa技术(niumina/Solexa Genome Analyzer,核心为单分子阵列原位扩增及边合成边测序技术)和ABI公司的SOLiD技术(ABISOLiD Sequencer,以支持寡核苷酸链接及检测技术为核心)为标志的新一代或下一代测序技(next-generation sequencing techology, NST)相继出现,目前已经比较成熟和商品化,在多个领域得到了广泛应用。在这三种新一代测序平台中,Illumina/Solexa测序平台上的RNA测序技术(RNA sequencing,RNA-seq)应用最为广泛。

2.2 高通量RNA测序及其在转录组研究中的应用

高通量测序技术的迅猛发展,将基因组学水平的研究带入了一个新的时期,也使经典分子生物科学家对基因组学的认识和思考上升到一个新的水平。高通量测序技术不仅可以进行大规模基因组测序,还可用于基因表达分析、非编码小分子RNA的鉴定、转录因子靶基因的筛选和DNA甲基化等相关研究。

近年来,包括基因组、转录组、蛋白质组等的各种组学技术在功能基因发现及鉴定中起着越来越重要的作用。由于全基因组测序费用仍然很高,蛋白质组实验技术有待进一步的提高,转录组研究是基因功能及结构研究的基础和出发点,是全基因组测序完成后首先要面对的问题。最近科学家们将高通量测序技术应用于转录组分析开发出了RNA测序技术( RNA-Seq)。高通量转录组测序避免了克隆亚克隆过程中引入的偏差,且其确定的序列长度显著增加,提高了识别其对应基因的准确性。同时,计算这些短序列的个数和分析其在整个基因组中的分布,可以计算出转录组表达水平。已经广泛应用于细菌、拟南芥、水稻和人类等生物转录组的研究。我国在应用RNA-Seq 进行水稻转录谱分析方面走在了世界的前列。王俊和韩斌领导的研究小组利用RNA-Seq 技术分别对水稻的转录组进行高分辨率的分析,发现水稻具有可变剪切模式基因数目远远高于预期[14-15]。

RNA-Seq即对细胞转录产物进行测序,统计测得的每条序列获得每个特定转录本的表达量,可提供精确的数字化表达谱检测。该技术首先将细胞中的所有转录产物反转录为cDNA

文库,然后将cDNA 文库中的DNA随机剪切为小片段(片段大小根据采取的测序方法的读长而不同),利用新一代高通量测序仪测序直到获得足够的序列。高通量测序避免了亚克隆过程中引入的偏差,且其确定的短序列长度显著增加。获得长度显著增加的短序列所包含信息可以提高识别其对应的基因的准确性,然后计算这些短序列的个数和分析其在整个基因组中的分布,可以计算出细胞的转录组表达水[16]。RNA-Seq技术具有十分广泛的应用领域:(1)检测新的转录本:Zhang[17]等运用RNA高通量双向深度测序技术,首次展现了水稻8个组织部位的转录本表达图谱全貌,并且能够精确检测到丰度非常低的转录产物,获得相当可观数量的全新转录本。

(2)基因转录水平研究,如基因表达量、不同样本间差异表达:通过分析不同处理、不同条件下、不同组织间的基因表达差异性,可以将那些显著差异表达的基因与某些生物学功能关联起来,从而为深入研究昆虫体内相关的分子生物学机制奠定基础。李新建在其博士论文中比较了荣昌猪和长白猪的转录本,筛选出1596个差异表达显著的基因[18]。分别对褐飞虱和稻纵卷叶螟的不同发育阶段建库并进行RNA-Seq 测序,进行差异表达分析,获得了大量与发育阶段相关且具有显著表达差异的基因,这些成果为害虫防治研究提供了重要的参考[19]。(3)基因功能注释。将所测reads与已有数据库(如GO、KEGG)已注释功能的基因相比对分析,从而揭示特定转录状态下的基因的功能和生物通路等。AjaiK等采用454测序平台对牛角癌组织和正常角组织转录本分析,并对909345个转录本进行了GO和KEGG分析[20]。

(4) 转录本结构变异研究,如可变剪接、RNA编辑、基因融合等。转录本结构的变异能揭示基因转录后表达的多样性。可变剪接使一个基因产生多个mRNA转录本,从而翻译成不同的蛋白。早在2004年,家蚕就完成了基因组测序工作,2012年利用RNA-Seq数据纠正了1140个已知的基因结构,发现了几千个新的可变剪接[21]。基因融合是最近利用转录组高通量测序研究的一个新的内容,主要在肿瘤组织中发现。Shancheng Ren等对14个中国汉族人的原发性前列腺癌和他们的正常组织进行RNA-Seq分析,揭示前列腺癌的基因融合、长非编码RNA、可变剪切和体细胞突变的多样性[22]。

(5) 开发SNPs和SSR等。通过比对转录本和参考基因组间的序列,寻找潜在的SNPs或SSRs。Stephen B等对HapMap中60个欧洲后代进行了转录组测序分析,开发了901个人基因组上的cSNP(编码SNP)。Angela Ca’novas等对荷斯坦奶牛乳样品进行转录组分析,开发了33045个具有多态性的cSNPs[20]。

2.3 面临的挑战

随着测序技术的不断进步, 我们能够对转录组开展更为深入的测序工作, 能够发现更多、

更可靠的转录子, 目前的大规模并行测序技术已经彻底改变了我们对转录组的研究方法,测序结果的质量也在不断提高,得到的信息量也在爆炸式增长。然而和其他所有新生技术一样,RNA-Seq 技术也面临着一系列新问题:其一是庞大的数据量所带来的信息学难题,比如如何最好地诠释和比对鉴定多个类似的同源基因,如何确定最佳测序量,获得高质量的转录图谱等[16];其二是如何针对更复杂的转录组来识别和追踪所有基因中罕见RNA亚型的表达变化。有可能提前实现这一目标的将是使用配对末端测序和单分子测序等更新的测序技术,以及使用更长的读段来增加测序深度和覆盖度[23];其三,目前的高通量测序技术大都需要较多的样品起始量, 这使得来源极为有限的生物样品分析受到限制, 因此如何对单细胞或少量细胞进行转录组测序是一个亟待解决的问题。最近这方面的研究也取得了一定进展,如Tang 等[24]建立了一种mRNA-Seq方案,它以PCR为基础扩增单个细胞的mRNA转录组,成功分析了取自小鼠四细胞胚胎时期的单个卵裂球的转录组。然而该方法只能捕捉带有poly(A)尾巴的mRNA,也不能检测绝大多数较长的mRNA(大于3 kb)的5′末端, 同时也不能保留原转录子的方向信息。除此之外还有一些新的针对低数量细胞进行转录组研究的技术正在不断被开发[25]。最后,标准的RNA-Seq 技术不能提供序列转录的方向信息,而这对于转录组注释尤为重要, 采用single-strand sequencing和strandspecific sequencing技术能很好的解决这一问题,或将成为RNA-Seq 技术发展的一个重要方向。

3 展望

RNA-Seq 为转录组学研究提供了一个很好的契机,不仅提供了转录组序列的全貌,而且提供了基因表达信息,正逐步成为昆虫分子生物学研究的主要工具。美国科学家发起了ik5 计划,拟开展5000种昆虫的基因组测序项目,丰富昆虫基因资源。但由于基因组测序成本高,昆虫种类繁多,RNA-Seq仍然是获取基因资源的主要方式。随着RNA-Seq技术进一步发展,其测序读长和测序准确性将会得到改善,可以更深入具体地研究昆虫的各种复杂生命现象,对害虫防治和资源昆虫利用起到重要的推动作用。此外,由于RNA-Seq数据分析工具和产生的数据特征紧密相关,因此在RNA-Seq技术不断成熟并被广泛应用时,需要更多针对昆虫基因数据进行优化的分析软件,将给生物信息学研究者提供广阔的空间[26~27]。

参考文献

[1] CostaV, Angelini C, De feis I,Ciccodicola A. Uncovering the Complexity of Transcriptomes with RNA-Seq[J]. Journal of Biomedicine and Biotechnology,2010,10:1-20.

[2] 王康宇,王义,孙春玉,等.RNA测序的研究进展[J].江苏农业科学,2014,42(10):12 -16.

[3]王金花,郜海燕,许晴晴,等.转录组学在果蔬采后衰老生物学的中的研究进展[J].浙江农业科学,2014 (7):1067-1072

[4] Lander, E.S.,Consortium, I.H.GS., Linton, L.M., Birren, B.,Nusbaum, C., Zody, M.C.,Baldwin, J., Devon, K.,Dewar, K., Doyle, M., et al (2001). Initial sequencing andanalysis of the human genome. Nature 409,860-921.

[5]贾琪,吴名耀,梁康迳,等.基因组学在作物抗逆性研究中的新进展[J].中国生态农业学报, Apr. 2014, 22(4): 375385.

[6]Velculescu VE, Zhang L, Zhou W, et al. Characterization of the yeast transcriptome. Cell, 1997, 88∶243~251.

[7]张棋麟,袁明龙.基于新一代测序技术的昆虫转录组学研究进展[J].昆虫学报,2013,56( 12): 1489-1508

[8]吴春颖,宋经元,陈士林. 表达序列标签在药用植物研究中的应用[J].中草药, 2008,39(5):778-782.

[9]高静,焦雅,张文广.高通量测序序列比对研究综述[J].生命科学研究,2014,18(5):458~464.

[10]冯超,朱长青,徐昌杰,等.RNA-Seq在果树学研究中的应用[J].果树学报2014,3,11:115~124.

[11] Sanger F, Nicklen S, Coulson A R. DNA sequencing with chain-terminating inhibitors[J]. Proceedings of the National Academy of Sciences, 1977, 74(12): 5463-5467.

[12]乔鑫,李梦,殷豪,等.果树全基因组测序研究进展.园艺学报,2014,41(1):165–177.

[13] Shendure J, Mitra R D, Varma C, et al. Advanced sequencing technologies: methods and goals[J]. Nature Reviews Genetics, 2004, 5(5): 335-344.

[14]许波,张伟强,冯晓曦,等.转录组测序技术在玉米中的应用研究进展[J].玉米科学,2014,22(1):67 ~72.

[15] Zhang G, Guo G, Hu X, et al. Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome[J]. Genome research, 2010, 20(5): 646-654.

[16]兰道亮,熊显荣,位艳丽,等.基于RNA-Seq高通量测序技术的牦牛卵巢转录组研究[J].《中国科学》杂志社,2014,44(3):307 ~ 317.

[17]潘嵩,陈岩,朱水芳,等.高通量测序技术及其在检验检疫中的应用展望[J].中国检验检疫科学研究院,2014,5.

[18]李新建.猪脂肪沉积关键基因筛选及TCTP基因功能研究[C].陕西:西北农林科

技大学,2011.

[19] Daines B, Wang H, Wang L, et al. The Drosophila melanogaster transcriptome by paired-end RNA sequencing[J]. Genome research, 2011, 21(2): 315-324.

[20]周家蓬,裴智勇,陈禹保,等[J]. 基于高通量测序的全基因组关联研究策略, 2014, 36(11): 1099―1111

[21] 刘金定, 张赞, 黄水清, 等. 昆虫RNA-Seq 数据的分析流程[J]. 应用昆虫学报, 2013, 50(5): 1458-1468.

[22] Ren S, Peng Z, Mao J H, et al. RNA-seq analysis of prostate cancer in the Chinese population identifies recurrent gene fusions, cancer-associated long noncoding RNAs and aberrant alternative splicings[J]. Cell research, 2012, 22(5): 806-821.

[23]刘玉林,李伟,张志翔,等.基于高通量测序的辽东栎转录组学研究[J].生物技术通报,2014,7.

[24] Tang F, Barbacioru C, Wang Y, et al. mRNA-Seq whole-transcriptome analysis of a single cell[J]. Nature methods, 2009, 6(5): 377-382.

[25] Ozsolak F, Milos P M. RNA sequencing: advances, challenges and opportunities[J]. Nature reviews genetics, 2011, 12(2): 87-98.

[26]宋作伟,黄茉莉,薛仁宇,等.基于RNA-Seq技术检测分析家蚕卵巢发育高表达基因[J].蚕业科学,2013,39( 4) : 0663-0673.

[27]刘金定,张赞,黄水清,等.昆虫RNA-Seq数据的分析流程[J].应用昆虫学报,2013,50( 5) :1458-1468.

有参考基因组的转录组生物信息分析

一、生物信息分析流程 获得原始测序序列(Sequenced Reads)后,在有相关物种参考序列或参考基因组的情况下,通过如下流程进行生物信息分析: 二、项目结果说明 1 原始序列数据 高通量测序(如illumina HiSeq TM2000/MiSeq等测序平台)测序得到的原始图像数据文件经碱基识别(Base Calling)分析转化为原始测序序列(Sequenced Reads),我们称之为Raw Data或Raw Reads,结果以FASTQ(简称为fq)文件格式存储,其中包含测序序列(reads)的序列信息以及其对应的测序质量信息。 FASTQ格式文件中每个read由四行描述,如下: @EAS139:136:FC706VJ:2:2104:15343:197393 1:Y:18:ATCACG GCTCTTTGCCCTTCTCGTCGAAAATTGTCTCCTCATTCGAAACTTCTCTGT + @@CFFFDEHHHHFIJJJ@FHGIIIEHIIJBHHHIJJEGIIJJIGHIGHCCF 其中第一行以“@”开头,随后为illumina 测序标识符(Sequence Identifiers)和描述文字(选择性部分);第二行是碱基序列;第三行以“+”开头,随后为illumina 测序标识符(选择性部分);第四行是对应序列的测序质量(Cock et al.)。 illumina 测序标识符详细信息如下:

第四行中每个字符对应的ASCII值减去33,即为对应第二行碱基的测序质量值。如果测序错误率用e表示,illumina HiSeq TM2000/MiSeq的碱基质量值用Q phred 表示,则有下列关系: 公式一:Q phred = -10log 10 (e) illumina Casava 1.8版本测序错误率与测序质量值简明对应关系如下: 2 测序数据质量评估 2.1 测序错误率分布检查 每个碱基测序错误率是通过测序Phred数值(Phred score, Q phred )通过公式1转化得到,而Phred 数值是在碱基识别(Base Calling)过程中通过一种预测碱基判别发生错误概率模型计算得到的,对应关系如下表所显示: illumina Casava 1.8版本碱基识别与Phred分值之间的简明对应关系 测序错误率与碱基质量有关,受测序仪本身、测序试剂、样品等多个因素共同影响。对于RNA-seq技术,测序错误率分布具有两个特点: (1)测序错误率会随着测序序列(Sequenced Reads)的长度的增加而升高,这是由于测序过程中化学试剂的消耗而导致的,并且为illumina高通量测序平台都具有的特征(Erlich and Mitra, 2008; Jiang et al.)。 (2)前6个碱基的位置也会发生较高的测序错误率,而这个长度也正好等于在RNA-seq 建库过程中反转录所需要的随机引物的长度。所以推测前6个碱基测序错误率较高的原因为随机引物和RNA模版的不完全结合(Jiang et al.)。测序错误率分布检查用于检测在测序长度范围内,有无异常的碱基位置存在高错误率,比如中间位置的碱基测序错误率显着高于其他位置。一般情况下,每个碱基位置的测序错误率都应该低于0.5%。 图2.1 测序错误率分布图

转录组学主要技术与应用研究

转录组学主要技术及其应用研究 姓名:梁迪 专业:微生物学 年级:2013 学号:3130179 二零一四年六月十五日

转录学主要技术及其应用研究 摘要:转录组(transcriptome)是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的集合。转录组学研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。目前,转录组学研究技术主要包括两种:基于杂交技术的微阵列技术(microarray)和基于测序技术的转录组测序技术,包括表达序列标签技术(Expression Sequence Tags Technology,EST)、基因表达系列分析技术(Serial analysis of gene expression,SAGE)、大规模平行测序技术(Massively parallel signature sequencing,MPSS)、以及RNA 测序技术(RNA sequencing,RNA-seq)。文章主要介绍了以上转录组学主要研究技术的原理、技术特点及其应用,并就这些技术面临的挑战和未来发展前景进行了讨论,为其今后的研究与应用提供参考。 关键词:转录组学;微阵列技术;转录组测序技术;应用 Study on the main technologies of transcriptomics and their application Abstract: The transcriptome is the complete set of transcripts for certain type of cells or tissues in a specific developmental stage or physiological condition. Transcriptome analysis can provide a comprehensive understanding of molecularmechanisms involved in specific biological processes and diseases from the information on gene structure and function. Currently, transcriptomics technology mainly includes microarry -based on hybridization technology and transcriptome sequencing-based on sequencing technology, involving Expression sequence tags technology, Serial analysis of gene expression, Massively parallel signature sequencing and RNA sequencing. The detailed principles, technical characteristics and applications of the main transcriptomics technologies are reviewed here, and the challenges and application potentials of these technologies in the future are also discussed. This will present the useful information for other researchers. Keywords: transcriptomics ; microarray ; transcriptome sequencing; application 随着后基因组时代的到来,转录组学、蛋白质组学、代谢组学等各种组学技术相继出现,其中转 录组学是率先发展起来以及应用最广泛的技术[1]。

转录组RNAseq术语解释

RNA-Seq名词解释 1.index 测序的标签,用于测定混合样本,通过每个样本添加的不同标签进行数据区分,鉴别测序样品。 2.碱基质量值 (Quality Score或Q-score)是碱基识别(Base Calling)出错的概率的整数映射。碱基质量值越高 表明碱基识别越可靠,碱基测错的可能性越小。 3.Q30 碱基质量值为Q30代表碱基的精确度在99.9%。 4.FPKM(Fragments Per Kilobase of transcript per Million fragments mapped) 每1百万个map上的reads中map到外显子的每1K个碱基上的fragment个数。计算公式为 公式中,cDNA Fragments 表示比对到某一转录本上的片段数目,即双端Reads数目;Mapped Reads(Millions)表示Mapped Reads总数, 以10为单位;Transcript Length(kb):转录本长度,以kb个碱基为单位。 5.FC(Fold Change) 即差异表达倍数。 6.FDR(False Discovery Rate) 即错误发现率,定义为在多重假设检验过程中,错误拒绝(拒绝真的原(零)假设)的个数占所有被拒绝 的原假设个数的比例的期望值。通过控制FDR来决定P值的阈值。 7.P值(P-value) 即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P<0.05 为显著,P<0.01为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05或0.01。 8.可变剪接(Alternative splicing)

转录组测序技术的应用及发展综述

转录组测序技术的应用及发展综述 摘要:转录组测序(RNA-Seq)作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。RNA-Seq利用高通量测序技术对组织或细胞中所有RNA 反转录而成cDNA文库进行测序,通过统计相关读段(reads)数计算出不同RNA的表达量,发现新的转录本;如果有基因组参考序列,可以把转录本映射回基因组,确定转录本位置、剪切情况等更为全面的遗传信息,已广泛应用于生物学研究、医学研究、临床研究和药物研发等。文章主要比较近年来转录组研究的几种方法和几种RNA-Seq的研究平台,着重介绍RNA-Seq的原理、用途、步骤和生物信息学分析,并就RNA-Seq技术面临的挑战和未来发展前景进行了讨论及在相关领域的应用等内容,为今后该技术的研究与应用提供参考。 关键词: RNA-Seq;原理应用;方法;挑战;发展前景 Abstract:Transcriptome sequencing (RNA-Seq) is a kind of high efficiency, quick transcriptome research methods are changing our understanding of transcriptome. RNA-Seq to use high-throughput sequencing of tissues or cells of all RNA reverse transcription into cDNA library were sequenced, through statistical correlation read paragraph (reads) numbers were calculated from the expression of different RNA transcripts, find new; if the genome reference sequence, the transcripts mapped to genomic, determine the position of the transcription shear condition, more genetic information, has been widely used in biological research, medical research, clinical research and drug development. This paper compared several methods of platform transcriptome studies and several kinds of RNA-Seq in recent years, RNA-Seq focuses on the principle, purpose, steps and bioinformatics analysis, and discusses the RNA-Seq technology challenges and future development prospect and the application in related field and other content, provide the reference for the research and application of the technology future. Key word:RNA-Seq ;application; principle; method; challenge; development prospects

一步一步教你做转录组分析(HISAT, StringTie and Ballgown)

一步一步教你做转录组分析(HISAT, StringTie and Ballgown) 该分析流程主要根据2016年发表在Nature Protocols 上的一篇名为Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown 的文章撰写的,主要用到以下三个软件:HISAT (https://www.360docs.net/doc/da5296322.html,/software/hisat/index.shtml)利用大量FM 索引,以覆盖整个基因组,能够将RNA-Seq的读取与基因组进行快速比对,相较于STAR、Tophat,该软件比对速度快,占用内存少。 StringTie(https://www.360docs.net/doc/da5296322.html,/software/stringtie/)能够应用流神经网络算法和可选的de novo组装进行转录本组装并预计表达水平。与Cufflinks等程序相比,StringTie实现了更完整、更准确的基因重建,并更好地预测了表达水平。Ballgown (https://https://www.360docs.net/doc/da5296322.html,/alyssafrazee/ballgown)是R语言中基因差异表达分析的工具,能利用RNA-Seq实验的数据(StringTie, RSEM, Cufflinks)的结果预测基因、转录本的差异表达。然而Ballgown并没有不能很好地检测差异外显子,而DEXseq、rMATS和MISO可以很好解决该问题。 一、数据下载Linux系统下常用的下载工具是wget,但该工具是单线程下载,当使用它下载较大数据时比较慢,所以选

转录组学领域研究进展一览(!!!)

转录组学领域研究进展一览 关键词:Transcriptomics;RNA;RT-PCR;Profiling;Synthesis;Sequencing;Purification;Micro arrays;Extraction 转录组学(tranomics),是一门在整体水平上研究细胞中基因转录的情况及转录调控规律的学科,也就是说,转录组学是从RNA水平来研究基因的表达情况。转录组即一个活细胞所能转录出来的所有RNA的总和,是研究细胞表型和功能的一个重要手段。 本文中,小编对近年来转录组学领域的相关研究进行了盘点,分享给各位!【1】北大教授开发单细胞全转录组测序新技术 2014年4月29日,北京大学生物动态光学成像中心黄岩谊、汤富酬课题组在《美国科学院院刊》(PNAS)上发表题为“Microfluidic single-cell whole-tranome sequencing”的论文。该研究利用微流控芯片技术实现了高质量单细胞的全转录组测序样品准备,全面提高了单细胞全转录组分析的准确性和可靠性。 细胞是生命活动的基本功能单位,而在生物体内没有任何两个细胞是完全相同的。传统的生命科学与医学研究,绝大多数情况下都是针对混合的大量细胞进行的,无法观察到单个细胞之间细微的差别。近年来不断发展的实验技术,提供了更加定量与客观的证据,表明在许多关键生命过程例如胚胎发育、细胞分化、疾病发生与发展等过程中,特定的单个细胞行为,以及其间的个体化差异与异质性,导致了极其重要甚至是决定性的结果。而之前基于大量细胞平均测量所获得的结果并无法正确反映复杂生物体系的全面真实信息,严重掩盖了独立个体样本的行为以及生命现象中大量存在的随机行为。针对单个细胞的研究,是细胞生命分析技术所追求的极限状态,是对传统技术极大的挑战。 【2】doi:10.1126/science.aaf2403 在一项新的研究中,来自瑞典卡罗琳斯卡研究所和皇家理工学院等机构的研究人员开发出一种新的被称作空间转录组学(spatial tranomics)的高分辨率方法研究一种组织中哪些基因是有活性的。这种方法能够被用于所有类型的组织中,而且在临床前研究和癌症诊断中是有价值的。相关研究结果发表在2016年7月1日那期Science期刊上,论文标题为“Visualization and analysisof gene expression

转录组ref流程工作手册

转录组ref流程工作手册 一、Reference 流程生物学原理 1.1 实验流程 图一:转录组实验流程 当我们得到样品时,必须对其测序,才能得到分析所需的数据。测序基本过程:提取样品总RNA后,用带有Oligo(dT)的磁珠富集真核生物mRNA(若为原核生物,则用试剂盒去除rRNA后进入下一步)。加入fragmentation buffer将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H 和DNA polymerase I 合成第二条cDNA链,在经过QiaQuick PCR试剂盒纯化并加EB缓冲液洗脱之后做末端修复并连接测序接头,然后用琼脂糖凝胶电泳进行片段大小选择,最后进行PCR扩增,使用建好的测序文库进行测序。 得到RNA的序列后,又可以找到它的参考序列(物种本身的基因、基因组)

时,可以用reference流程对数据进行详细的分析。Reference后面所有的流程都是基于参考序列进行的,所以选择正确的参考序列十分重要。 1.2信息分析流程 得到测序序列后,即可利用比对软件,将所测序列比对到参考基因或基因组上,并进行后续分析,信息分析流程图如下: 图二:转录组信息流程 1.2.1原始fq序列简介 测序得到的原始图像数据经base calling转化为序列数据,我们称之为raw data或raw reads,结果以fastq文件格式存储,fastq文件为用户得到的最原始文件,里面存储reads的序列以及reads的测序质量。在fastq格式文件中每个read 由四行描述: @read ID TGGCGGAGGGATTTGAACCC

华大转录组测序内部培训资料

(内部资料,请勿外传) 动植物转录组 (Transcriptome ) 产品说明书 科技服务体系 动植物研究方向

版本信息: 2011年07月08日

目录 1产品概述 (1) 1.1 什么是转录组测序 (1) 1.2 转录组测序的产品功能 (1) 1.3 转录组测序产品优势 (1) 1.4 转录组测序产品发展史 (1) 1.5 项目执行时间 (3) 1.6 产品交付结果 (3) 2转录组测序研究方法 (4) 2.1 产品策略 (4) 2.2 样品准备 (5) 2.2.1 RNA样品要求 (5) 2.2.2 RNA样品送样标准 (6) 2.2.3 RNA提取的组织用量建议 (6) 2.3 样品运输要求 (7) 2.3.1 样品包装 (7) 2.3.2 样品标识 (8) 2.3.3 样品运输条件 (8) 2.4 文库的构建及测序 (9) 2.4.1 实验流程 (9) 2.4.2 测序及数据处理 (10) 2.5 转录组生物信息学分析 (10) 2.5.1 没有参考序列的转录组De novo (10) 2.5.2 有参考序列的转录组Re-sequencing (18) 2.5.3 参考文献 (24) 3成功案例 (25)

3.1 华大成功案例 (25) 3.2 相关文献解读 (26)

1产品概述 1.1什么是转录组测序? 转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括mRNA和非编码RNA。转录组测序是指用新一代高通量测序技术对物种或者组织的转录本进行测序并得到相关的转录本信息。 1.2转录组测序的产品功能 1.获得物种或者组织的转录本信息; 2.得到转录本上基因的相关信息,如:基因结构,功能等; 3.发现新的基因; 4.基因结构优化; 5.发现可变剪切; 6.发现基因融合; 7.基因表达差异分析。 1.3转录组测序产品优势 覆盖度高:检测信号是数字信号,几乎覆盖所有转录本; 检测精度高:几十到数十万个拷贝精确计数; 分辨率高:可以检测到单碱基差异,基因家族中相似基因及可变剪切造成的不同转录本的表达; 完成速度快:整个项目周期只需要50个工作日时间; 成本低:基本上每个实验室可以承担相关研究经费。 1.4转录组测序产品发展史 转录组的研究手段大体包括:EST序列构建及研究,芯片研究,运用第二代测序技术研究等。EST是从一个随机选择的cDNA 克隆进行5’端和3’端单一次sanger测序获得的短的cDNA 部分序列,代表一个完整基因的一小部分,在

转录组ref流程工作手册

转录组ref流程工作手册

转录组ref流程工作手册 一、Reference 流程生物学原理 1.1 实验流程 图一:转录组实验流程 当我们得到样品时,必须对其测序,才能得到分析所需的数据。测序基本过程:提取样品总RNA后,用带有Oligo(dT)的磁珠富集真核生物mRNA(若为原核生物,则用试剂盒去除rRNA后进入下一步)。加入fragmentation buffer 将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(random hexamers)合成第一条cDNA链,然后加入缓冲液、dNTPs、RNase H 和DNA polymerase I合成第二条cDNA链,在经过QiaQuick PCR试剂盒纯化并加EB 缓冲液洗脱之后做末端修复并连接测序接头,然后用琼脂糖凝胶电泳进行片段大小选择,最后进行PCR扩增,使用建好的测序文库进行测序。 得到RNA的序列后,又可以找到它的参考序列(物种本身的基因、基因组)

时,可以用reference流程对数据进行详细的分析。Reference后面所有的流程都是基于参考序列进行的,所以选择正确的参考序列十分重要。 1.2信息分析流程 得到测序序列后,即可利用比对软件,将所测序列比对到参考基因或基因组上,并进行后续分析,信息分析流程图如下: 图二:转录组信息流程 1.2.1原始fq序列简介 测序得到的原始图像数据经base calling转化为序列数据,我们称之为raw data或raw reads,结果以fastq文件格式存储,fastq文件为用户得到的最原始文件,里面存储reads的序列以及reads的测序质量。在fastq格式文件中每个read由四行描述: @read ID TGGCGGAGGGATTTGAACCC

转录组学的一些概念

Gene Ontology可分为分子功能(Molecular Function),生物过程(biological process)和细胞组成(cellular component)三个部分。蛋白质或者基因可以通过ID对应或者序列 注释的方法找到与之对应的GO号,而GO号可对于到Term,即功能类别或者细胞定位。 功能富集分析: 功能富集需要有一个参考数据集,通过该项分析可以找出在统计上显 著富集的GO Term。该功能或者定位有可能与研究的目前有关。 GO功能分类是在某一功能层次上统计蛋白或者基因的数目或组成,往往是在GO 的第二层次。此外也有研究都挑选一些Term,而后统计直接对应到该Term的基因或蛋白数。结果一般以柱状图或者饼图表示。 1.GO分析 根据挑选出的差异基因,计算这些差异基因同GO 分类中某(几)个特定的分支的超 几何分布关系,GO 分析会对每个有差异基因存在的GO 返回一个p-value,小的p 值表示差异基因在该GO 中出现了富集。 GO 分析对实验结果有提示的作用,通过差异基因的GO 分析,可以找到富集差异 基因的GO分类条目,寻找不同样品的差异基因可能和哪些基因功能的改变有关。 2.Pathway分析 根据挑选出的差异基因,计算这些差异基因同Pathway 的超几何分布关系, Pathway 分析会对每个有差异基因存在的pathway 返回一个p-value,小的p 值表示差异 基因在该pathway 中出现了富集。 Pathway 分析对实验结果有提示的作用,通过差异基因的Pathway 分析,可以找到 富集差异基因的Pathway 条目,寻找不同样品的差异基因可能和哪些细胞通路的改变有关。与GO 分析不同,pathway 分析的结果更显得间接,这是因为,pathway 是蛋白质之间的 相互作用,pathway 的变化可以由参与这条pathway 途径的蛋白的表达量或者蛋白的活性 改变而引起。而通过芯片结果得到的是编码这些蛋白质的mRNA 表达量的变化。从 mRNA 到蛋白表达还要经过microRNA 调控,翻译调控,翻译后修饰(如糖基化,磷酸化),蛋白运输等一系列的调控过程,mRNA 表达量和蛋白表达量之间往往不具有线性关系,因此mRNA 的改变不一定意味着蛋白表达量的改变。同时也应注意到,在某些pathway 中,如EGF/EGFR 通路,细胞可以在维持蛋白量不变的情况下,通过蛋白磷酸 化程度的改变(调节蛋白的活性)来调节这条通路。所以芯片数据pathway 分析的结果需 要有后期蛋白质功能实验的支持,如Western blot/ELISA,IHC(免疫组化),over expression(过表达),RNAi(RNA 干扰),knockout(基因敲除),trans gene(转基因)等。 3.基因网络分析 目的:根据文献,数据库和已知的pathway 寻找基因编码的蛋白之间的相互关系(不超过1000 个基因)。

illumina 转录组测序简明实验流程(PE-oligodT NEB)

illumina 转录组测序简明实验流程一、实验基本流程图 mRNA Library Construction

二、mRNA建库流程 1.材料准备 1.2. 1.3.

2.样品准备和QC 选择质量合格的Total RNA作为mRNA测序的建库起始样品,其质量要求通过Agilent 2100 BioAnalyzer检测结果RIN≥7,28S和18S的RNA 的比值大于或等于1.5:1,起始量的要求范围是0.1∽1ug。用QUBIT RNA ASSAY KIT对起始的Total RNA进行准确定量。 3.建库实验步骤 3.1.mRNA纯化和片段化 3.1.1.mRNA纯化 纯化原理是用带有Oligod(T)的Beads对Total RNA中mRNA进行纯化。 3.1.2.mRNA片段化 3.2.1st Strand cDNA 合成 3.3.2nd Strand cDNA 合成 根据下表制备反应体系,然后在PCR仪上运行Program3,然后将第2链cDNA合成产物用144uL AMPure XP Beads进行纯化,最后用60μL的Nuclease free water进行重悬,取出 55.5μL以备下一步使用;

3.4.Perform End Repair/dA-tail 3.5.Adaptor Ligation 根据下表制备反应体系,然后在PCR仪上运行Program5、Program6,然后100uL AMPure XP Beads进行纯化后用52.5μL的Resuspension Buffer进行重悬,再用50uL AMPure XP Beads 3.6.PCR扩增 根据下表制备反应体系,然后在PCR仪上运行Program7,然后再45μL用AMPure XP Beads 进行纯化,最后用23μL的Resuspension Buffer进行重悬,取出20μL以备下一步使用;

转录组学研究进展精修订

转录组学研究进展集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

转录组研究前沿 随着转录组学,蛋白组学,代谢组学等组学的不断涌现,生物学研究已经跨入后基因组时代,转录组学作为一个率先发展起来的技术开始在生物学前沿研究中得到了广泛的应用。广义转录组(Transcriptome)系指从一种细胞或者组织的基因组所转录出来的RNA的总和,包括编码蛋白质的mRNA和各种非编码RNA(rRNA, tRNA, snoRNA, snRNA,microRNA 和其他非编码RNA等)。狭义转录组系指所有参与翻译蛋白质的mRNA 总和。 转录组研究历史: 自从上世纪90 年代中期以来,随着微阵列技术被用于大规模的基因表达水平研究,转录组学作为一门新技术开始在生物学前沿研究中展露头脚并逐渐成为生命科学研究的热点。原因如下:1)蛋白质组研究需要更多的转录组研究的信息:因为单一的蛋白质组数据不足以清楚地鉴定基因的功能,因此蛋白质组的数据需要转录组的研究结果加以印证。2)非编码RNA研究的不断发展,使得转录组研究的范围不断扩大和深化。 3) 随着新一代高通量测序技术运用到转录组研究之中,转录组研究中提供的数据量呈现爆炸式的扩增,极大拓宽了转录组研究解决科学问题的范围。

目前进行转录组研究的技术主要包括如下三种:1)基于杂交技术的微阵列技术;2)基于Sanger测序法的SAGE (serial analysis of gene expression)和MPSS(massively parallel signature sequencing);3)基于新一代高通量测序技术的转录组测序。各种转录组研究技术的特点如下: 基于杂交技术的DNA芯片技术只适用于检测已知序列,却无法捕获新的mRNA。细胞中mRNA的表达丰度不尽相同,通常细胞中约有不到100种的高丰度mRNA,其总量占总mRNA一半左右,另一半mRNA由种类繁多的低丰度mRNA组成。因此由于杂交技术灵敏度有限,对于低丰度的mRNA,微阵列技术难以检测,也无法捕获到目的基因mRNA表达水平的微小变化。 SAGE是以Sanger测序为基础用来分析基因群体表达状态的一项技术。SAGE 技术首先是提取实验样品中RNA并反转录成cDNA,随后用锚定酶(Anchoring enzyme)切割双链cDNA,接着将切割的cDNA 片段与不同的接头连接,通过标签酶酶切处理并获得得到SAGE 标签,然后PCR 扩增连接SAGE 标签形成的标签二聚体,最后通过锚定酶切除接头序列,以形成标签二聚体的多聚体并对其测序(关于SAGE方法细致的介绍请参考网站)。SAGE可以在组织和细胞中定量分析相关基因表达水平。在差异表达谱的研究中,SAGE可以获得完整的转录组学图谱以及发现新的基因并鉴定其功能、作用机制和通路等。

转录组测序

转录组分析 研究背景: RNA-Seq是通过结合实验和计算方法来鉴定生物样品中RNA序列的种类和丰度的一种技术。通过RNA-seq,我们就能够确定单链RNA分子中ATCG的顺序。整个过程主要包括:从细胞或组织中提取RNA分子、文库的构建以及后继的生物信息学数据分析。RNA-Seq技术具有许多早期研究方法(如:微阵列)所不具备的优点,如:RNA-Seq平台的高通量、新技术所带来的高灵敏度、发现新转录本、新基因模型以及非编码RNA的能力等。 RNA-Seq技术的到来,使人们认识到,无论是单细胞模式生物还是人类,我们对其转录组的认知异常匮乏。而RNA-Seq产生的新的数据,则可以帮助我们发现基因结构上的巨大差异、鉴定出新的转录本以及能够对small non-coding RNA和lncRNAs有着更好的了解。而且随着测序花费的降低,RNA-Seq的优势体现的更加明显。 服务流程: 样品选取

mRNA片段化 cDNA合成 末端修复、加polyA、加接头,PCR扩增 数据分析 测序方案: 内容:TotalRNA检测,普通转录组文库构建及测序及信息分析。测序方式:HiseqPE125。 项目周期:有参45天,无参50天。 分析内容: 无参考基因组: 1.1质量控制 1.11评估碱基质量 1.12过滤低质量reads 1.13 去掉低质量碱基和接头序列 1.14 统计N比例和reads长度 1.15 统计GC含量和reads重复度 1.2 Reads的从头比对组装

1.4基因表达差异分析 1.41 统计基因在不同条件下的差异表达情况 1.5差异基因富集分析 1.51 通过GO、KEGG对差异基因进行功能富集分析 1.6差异表达基因的蛋白质互作网络分析 1.7SNV/Indel分析 1.8样本间相关性分析 有参考基因组: 2.1质量控制(同无参) 2.2 Reads比对组装 2.22 统计reads与参考基因组比对情况 2.22 分析对插入、删除和连接体情况 2.23 统计转录本在参考基因组上位置、长度和覆盖度情况 2.3基因表达差异分析 2.4差异基因富集分析 2.5差异表达基因的蛋白质互作网络分析 2.6新转录本预测 2.7 SNV/Indel分析 2.8 UTR分析 2.9可变剪接分析 3.0 Non-coding RNA分析 3.1样本相关性分析 案例解读: 案例:通过poly(A)+ RNA-Seq分析Drosophila melanogaster转录组的动态性 本项研究通过poly(A)+ RNA-Seq技术对果蝇的细胞系进行测序,鉴定出一批通过替换启动子和RNA剪接来转录出大量转录本的神经特异性基因。通过后继分析还发现,对于RNA剪接变化,组织间的差异要远远大于发育阶段间的差异。另外,发现性腺表达了成百上千的未知的蛋白编码和lncRNAs,其中一些甚至是反义转录的。显示了果蝇转录组的动态性和多样性。 小部分的基因(0.2%)编码出大部分的转录本。

摘要--转录组

“寒淫”轻重强度致病及转归的转录组与代谢组整合研究 白斑病毒感染凡纳滨对虾的高通量转录组测序及分析 珍稀濒危药用植物台湾金线莲菌根差异表达的转录组研究 白桦雄花早期发育转录组分析及重要基因功能鉴定 柑橘不同抗性品种被黄龙病菌侵染后体内转录组变化的比较分析 鸡生长轴全转录组SNP关联分析及调控生长的作用机制研究 基于转录组测序筛选马铃薯块茎休眠与发芽相关基因及功能鉴定 基于转录组数据的芒属植物分子标记挖掘及分子图谱构建 基于转录组学的茶树冷驯化诱导抗寒性的分子机制研究 利用转录组测序挖掘甘蓝菌核病抗病相关基因 苜蓿共生结瘤体系响应重金属铜胁迫的转录组研究 坛紫菜应答高温胁迫分子机制的转录组学分析及相关候选基因克隆 摘要的编号: 30873212 项目名称: “寒淫”轻重强度致病及转归的转录组与代谢组整合研究 项目类型: 面上项目 在前期转录组研究搭建的技术平台上,寒证-基因组研究结果发现三羧酸循环(TCA Cycle)通路及相关基因显著表达,这与本课题合作单位之一(上海交大)得到的冷应激的代谢谱特征(TCA Circle通路异常)一致。提示若两个"组学"整合,可优势互补,在寒邪的研究上出现新突破。本计划设计冷暴露模拟"寒淫"强度,将大鼠分为6组,其中4个冷冻组分别置于2℃、-10℃、-20℃、-25℃冷库中,每天6-8小时;中药组-25℃冷库加每日麻黄附子细辛汤灌胃,各组均连续4-6周。研究从宏观至微观分三个层次:①行为、耳络、舌象等寒热纲领性量表评价;②寒淫作用随时间、强度动态的转录谱及代谢谱的信息特征;③温热药的转录谱、代谢谱网络修复作用。本研究以基因芯片和代谢组学互补技术,整合二者信息,重点定位于TCA代谢通路和与之相匹配基因(SDHC、DLD、IDH3B等)为组学交叉点,深化寒淫致病病因病机的科学内涵。

转录组学研究进展

转录组研究前沿 随着转录组学,蛋白组学,代谢组学等组学的不断涌现,生物学研究已经跨入后基因组时代,转录组学作为一个率先发展起来的技术开始在生物学前沿研究中得到了广泛的应用。广义转录组(Transcriptome)系指从一种细胞或者组织的基因组所转录出来的RNA的总和,包括编码蛋白质的mRNA和各种非编码RNA(rRNA, tRNA, snoRNA, snRNA,microRNA 和其他非编码RNA等)。狭义转录组系指所有参与翻译蛋白质的mRNA 总和。 转录组研究历史: 自从上世纪90 年代中期以来,随着微阵列技术被用于大规模的基因表达水平研究,转录组学作为一门新技术开始在生物学前沿研究中展露头脚并逐渐成为生命科学研究的热点。原因如下:1)蛋白质组研究需要更多的转录组研究的信息:因为单一的蛋白质组数据不足以清楚地鉴定基因的功能,因此蛋白质组的数据需要转录组的研究结果加以印证。2)非编码RNA 研究的不断发展,使得转录组研究的范围不断扩大和深化。3) 随着新一代高通量测序技术运用到转录组研究之中,转录组研究中提供的数据量呈现爆炸式的扩增,极大拓宽了转录组研究解决科学问题的范围。 目前进行转录组研究的技术主要包括如下三种:1)基于杂交技术的微阵列技术;2)基于Sanger测序法的SAGE (serial analysis of gene expression)和MPSS(massively parallel signature sequencing);3)基于新一代高通量测序技术的转录组测序。各种转录组研究技术的特点如下: 基于杂交技术的DNA芯片技术只适用于检测已知序列,却无法捕获新的mRNA。细胞中mRNA的表达丰度不尽相同,通常细胞中约有不到100种的高丰度mRNA,其总量占总mRNA 一半左右,另一半mRNA由种类繁多的低丰度mRNA组成。因此由于杂交技术灵敏度有限,对于低丰度的mRNA,微阵列技术难以检测,也无法捕获到目的基因mRNA表达水平的微小变化。 SAGE是以Sanger测序为基础用来分析基因群体表达状态的一项技术。SAGE 技术首先是提取实验样品中RNA并反转录成cDNA,随后用锚定酶(Anchoring enzyme)切割双链cDNA,接着将切割的cDNA 片段与不同的接头连接,通过标签酶酶切处理并获得得到SAGE 标签,然后PCR 扩增连接SAGE 标签形成的标签二聚体,最后通过锚定酶切除接头序列,以形成标签二聚体的多聚体并对其测序(关于SAGE方法细致的介绍请参考网站https://www.360docs.net/doc/da5296322.html,)。SAGE可以在组织和细胞中定量分析相关基因表达水平。在差异表达谱的研究中,SAGE可以获得完整的转录组学图谱以及发现新的基因并鉴定其功能、作用机制和通路等。 MPSS是SAGE的改进版,MPSS 技术首先是提取实验样品RNA并反转录为cDNA,接着将获得的cDNA克隆至具有各种adaptor 的载体库中,并PCR 扩增克隆至载体库中的不同cDNA 片段,然后在T4 DNA 聚合酶和dGTP 的作用下将PCR产物转换为单链文库,最后通过杂交将其结合在带有Anti-adaptor 的微载体上进行测序。MPSS 技术对于功能基因组研究非常有效,能在短时间内捕获细胞或组织内全部基因的表达特征。MPSS技术对于鉴定致病基因并揭示该基因在疾病中的作用机制等发挥了重要作用。

转录组测序相关问题

转录组测序相关问题 转录组是某个物种或者特定细胞类型产生的所有转录本的集合,转录组测序(RNA-seq) 是最近发展起来的利用深度测序技术进行转录分析的方法,可以对全转录组进行系统的研究。 转录组测序可以供研究者在转录本结构研究(基因边界鉴定、可变剪切研究等),转录本变异研究(如基因融合、编码区SNP研究),非编码区域功能研究(Non-coding RNA研究、miRNA前体研究等),基因表达水平研究以及全新转录本发现等方面进行深入研究。 1.mRNA的纯化分离方法? 答:进行mRNA研究中,首先需要对样本进行总RNA抽提,抽提得到的RNA除含有mRNA外,还含有rRNA和tRNA,为防止这两类RNA对转录组研究的影响,因此我们需要对mRNA进行分离纯化。真核细胞的mRNA分子最显著的结构特征是具有5’端帽子结构(m7G)和3’端的Poly(A)尾巴。绝大多数哺乳类动物细胞mRNA的3’端存在20-30个腺苷酸组成的Poly(A)尾,通常用Poly(A+)表示。这种结构为真核mRNA的提取,提供了极为方便的选择性标志,寡聚(dT)纤维素或寡聚(U)琼脂糖亲合层析分离纯化mRNA的理论基础就在于此。mRNA的分离方法较多,其中以寡聚(dT)-纤维素柱层析法最为有效,已成为常规方法。此法利用mRNA 3’末端含有Poly(A+)的特点,在RNA 流经寡聚(dT)纤维素柱时,在高盐缓冲液的作用下,mRNA被特异地结合在柱上,当逐渐降低盐的浓度时或在低盐溶液和蒸馏水的情况下,mRNA被洗脱,经过两次寡聚(dT)纤维柱后,即可得到较高纯度的mRNA。 2.使用Solexa进行转录组测序时,样本RNA如何进行片段化处理?cDNA 插入片段长度的选择? 答:Solexa转录组测序文库构建时采用专用的打断Buffer对RNA样本进行片段化处理,这种方法充分利用RNA对二价阳离子的敏感性,具有稳定性好的优点,通过这种方法打断能得到更加均匀的覆盖率。mRNA-seq可以既可以采用单端测序(single read)还可以采用双端测序(paired end),对于单端测序来说片段长度150-200bp是理想的长度范围,对于双端测序来说片段长度推荐300-500bp,由于两端加入了Solexa的锚定序列和引物序列,样品准备完成后所

转录组学

基于高通量测序的储粮害虫抗药性相关基因的转录组学分析及其技术研究 专业:食品科学姓名:陶冶心学号:1120140520 摘要:随着测序技术的发展,昆虫转录组数据不断积累,在昆虫学研究中的应用也越来越广泛。在害虫抗药性的研究中,转录组数据分析也是重要的最新研究手段。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理。RNA-Seq作为一种新的高效、快捷的转录组研究手段正在改变着人们对转录组的认识。本文简要介绍了转录组学及其定义,并以RNA测序为例着重介绍了高通量测序在转录组中的应用,并对其中有待进一步研究的问题进行展望。 关键词:转录组高通量测序抗性 Deep Sequencing-based Transcriptome Analysis in insect resistance research Abstract:With the development of sequencing technology,the number of known insect transcriptome sequences has increased and transcriptome data has become more useful in entomology,including research on insect resistance.Transcriptome can research from the overall level of gene function and gene structure, revealing the specific molecular mechanism in the process of biological processes and disease. RNA-Seq,as a new kind of efficient, fast transcriptome research techniques ,is changing people's understanding of the transcriptome. Transcriptomics and its definitions are briefly introduced and pick RNA sequencing as an example, fully introduced the application of high-throughput sequencing of the transcriptome, the further research problems are discussed at the same time. Key words: transcriptome ,High-throughput sequencing, resistance 由于杀虫剂的长期使用,昆虫产生的抗药性已成为农林虫害治理面临的重大问题研究昆虫抗药性机制有助于为农林害虫防控、资源昆虫抗性品系选育及新型杀虫剂研发提供科学指导。长期以来,人们通过对模式昆虫、卫生昆虫和农林害虫的研究,对昆虫代谢抗性、靶标抗性有了一定认识,继而利用分子生物学手段克隆、分析了一些抗性相关基因,上述研究方

相关文档
最新文档