欢迎各位老师及同学
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图2 All-Unigene 的Gap(N)分布图 Fig.2 Gap distribution of All-Unigene
5.我们的结果如何? ----- (2)组装结果 综合所有样品得到的Unigene序列: 原始组装结果:All-Unigene共66716 可确定方向的序列(5'->3'):All-Unigene.5-3.fa 无法确定方向的序列:All-Unigene.no_orientation.fa Unigene10_All size 3699 gap 8 0.21% GCAAGGAGCACATGTGTGACTGATGAAGGTAACCT GAAGCAAGCTGCTCA GCTTAATATTTTTGAGACCTCGACTCAACCAACCAA GGAGGGTCCCTCAG ATCCTTCAGATAANNNNNNNNGTTACAATCTTGCTT GCAAATAGAATCTT
单核苷酸突变
的精确结构
各种器官的基因 表达模式
选择性剪接
可选启动子 等位基因的差异
动植物疾病
作物抗逆性、适
应性研究 分子育种
不同发育阶段的
基因表达模式
表达
RNA编辑 融合基因
药用植物代谢途
径分析
3. RNA-Seq能做什么? ----- 实例(有参考基因组) Deep RNA sequencing at single base-pair resolution reveals high complexity of the rice transcriptome.
2.转录组是怎样做的------常用方法 基因芯片技术 —— Microarray 基因表达序列分析技术 —— Serial analysis of gene expression,SAGE 大规模平行测序技术—— Massively parallel signature sequencing,MPSS RNA 测序技术 —— RNA sequencing,RNA-seq
Load on microbeads and sequncing
Transcriptme
优点: 获得更长的短标签,因而 精度更高;此外,MPSS 技术特有的微球荧光测序 可直接高通量读出序列, 简化了测序过程 缺点: 涉及PCR 扩增、克隆等可 能会产生碱基偏向性的操 作步骤,从而影响转录本 的正确识别
Transcriptme
2.常用方法------基因表达序列分析技术
流程 RNA cDNA
Anchoring enzyme
cDNA fragment
Ligated with linker
cDNA fragment with linker
Tagging enzyme
Tag
Ligation and PCR
•
Genome Res. 2010 May;20(5):646-54.
3. RNA-Seq能做什么? ----- 实例(有参考基因组) Characterization of Transcriptional Complexity during Berry Development in Vitis vimifera Using RNA-Seq
实验结果
பைடு நூலகம்
3个stages共测了2.2G的数据量,82.4%的reads可以定位到1 个(66.6%)或多个(15.8%)基因组位置 •将测序所得reads 与reference(8.4X框架图)数据比较,鉴 定出85,870 个SNP
•
3. RNA-Seq能做什么? ----- 实例(有参考基因组)
diTag
Anchoring enzyme
Concatemers
Sequecing
优点: 不需基因序列的信息,能够 全局性地检测所有基因的表 达水平,可显示基因差异, 可获得未知基因特别是那些 低拷贝基因 缺点: 文库构建流程长,技术要求 高,单条短序列标签所含的 基因信息很少,不适于遗传 信息缺乏的植物
欢迎各位老师及同学!
香鳞毛蕨的转录组测序
报告人:佟伟霜 2012.01.07
Contents
1 转录组是什么---what 转录组的常用方法----how
2 3
RNA-Seq能做什么?
我们是怎样做的?
4
5
我们的结果如何?
1.转录组是什么?
DNA转录的 所有RNA
转录组即特定细胞在某一功能状 mRNA 态下所能转录出来的所有RNA 的 总和,包括mRNA和ncRNA。
实验结果
发现385个基因具有AS(alternative splicing),其中只在一 个浆果发育stage发生AS有210个基因,只在两个浆果发育 stage发生AS有97个基因,只在三个浆果发育stages都发生了 AS有78个基因 •鉴定了新的基因,发现了glutathione-S-transferase(GST)家族 的53个新基因,MYB转录因子家族中28个新基因,这些基因 因为表达丰度低、缺少探针序列而无法被芯片检测到 •随机选取15个基因进行qRT-PCR验证,发现12个基因qRTPCR结果与RNA-Seq相一致
2.常用方法------基因芯片技术 优点: 成本适中,其对较高表达 的基因检测比较准确,数 据分析软件较多,整个方 法较为成熟 缺点: 对低表达基因检测敏感度 不够,前期工作基础要求 较高,而且很难检测出融 合基因转录、多顺反子转 录等异常转录产物
流程
RNA
cDNA
Hydrization with microarrys
•
3. RNA-Seq能做什么? ----- 实例(无参考基因组) The Genetic Map of Artemisia annua L. Identifies Loci Affecting Yield of the Antimalarial Drug Artemisinin
研究目的 实验材料
Transcriptme
2.常用方法------大规模平行测序技术
流程
RNA cDNA
Cloned to adaptor vectors
cDNA library with adaptors
PCR
cDNA fragment with adaptors
T4 polymerase dGTP
ss cDNA fragment with adaptors
有参考基因组 ---转录组重测序
无参考基因组 ---转录组从头组装
2. RNA-Seq ------数据分析
有参考基因组 ---转录组重测序
无参考基因组 ---转录组从头组装
基因表达差异分析
检测基因融合 基因结构的优化 鉴定基因的可变剪接 新转录本预测 SNP分析
Unigene功能注释 Unigene Gene Ontology 分类结构的优化 Unigene 表达差异分析 蛋白编码区预测(CDS) Unigene Pathway 富集分 析
获得与香鳞毛蕨温光处理条件下酚类代 谢相关基因
5. 我们的结果如何?
(1).产量统计 (2).组装结果 结果 (3).Unigene 功能注释 (4).Unigene 的GO分类
(5).Unigene代 谢通路分析 (6).预测编码 蛋白框(CDS)
(7).Unigene表 达差异分析 (8).差异Unigene 的GO分析和 Pathway分析
录可变剪接序列
对低表达基因的检测更加准确,并且可以定量确定 转录水平。 RNA-seq 技术得到的标签长度(由采取的高通量测 序技术的读长而定,可达400 bp)比SAGE 和MPSS 显著增加,提高了识别转录本的特异性和准确性 成本更低
2. RNA-Seq ------分类
转录组测序
CK
26,775,874 2,409,828,660
92.36%
0.00%
49.57%
1
27,039,850 2,433,586,500
91.31%
0.00%
48.68%
2
27,047,380 2,434,264,200
92.47%
0.00%
49.88%
5.我们的结果如何? ----- (2)组装结果
属多年生蕨类植物。该属植物所含有的酚类化合物具有较强 的驱虫、抑制肿瘤、抗病毒和杀菌作用。在我国北部地区, 民间流传香鳞毛蕨能治疗各种皮肤病,因此近年来受到国内 外学者的高度关注。
4.我们是怎样做的?
实验材料
组培的香鳞毛蕨无菌苗
实验处理
Ck:25℃ 48h;1:4 ℃ 48h;2:35℃ 48h
预期结果
实验结果 研究目的 实验材料
全面了解水稻 基因表达情况
•
愈伤组织 •根尖(14d) •茎尖(14d) •叶(2 stages) •稻花/稻穗(3 stages)
•
总测序量28G,每个样本 不低于5 M的SE reads •鉴定了28563个基因的5’ 和3’UTR 区域 •发现7232个新转录本,新 转录本表达丰度低,且 具有组织表达特异性 •发现23800个可变剪接 •发现1356个融合基因
实验材料
•
Plant Physiology, April 2010, Vol. 152, pp. 1787–1795
选取在成熟季节开花后5,10, 和15个星期葡萄分别代表葡萄 果实成熟的着果期,始熟期和成熟期;分别选3棵向阳树和3棵 背阴树,每棵树相应位置随机摘取10个浆果,该实验设2个重 复,分别作为样本池进行total RNA提取。
2.常用方法------RNA-Seq流程
总RNA
用连有Oligo(dT)的 磁珠富集mRNA(真)
去除rRNA富集mRNA (原核生物)
反转录成cDNA
RNA片段化 (200-700 bp)
随机引物引导 cDNA合成
cDNA片段 (200-700 bp)
加接头
转录组测序
2.常用方法------RNA-Seq 提供更多信息,可以得到用基因芯片难以得到的转
京都基因和基因组百科全书(KEGG)是系统分析基因功能, 联系基因组信息和功能信息的知识库。
NCBI的BLUST网址是: http://www.ncbi.nlm.nih.gov/BLAST/
3. RNA-Seq能做什么? -----应用领域
功能基因组
癌症及复杂疾病
农业及药用植物
基因(转录本)
2. RNA-Seq ------无参考基因组的数据分析流程
原始序列数据
Clean reads
Unigenes
基因注释
Unigene 表达量注释 Unigene表达差异分析
预测编码蛋白框(CDS)
Unigene 功能注释
Unigene的GO和Pathway分析
GO功能显著性富集分析
Pathway显著性富集分析
5. 我们的结果如何? ----- (1) 产量统计 表1.测序产量统计 Tab.1 Yield statistical of RNA-Seq
Samples Total Reads Total Nucleotides (nt) Q20 percentage N percentage GC percentage *
2. RNA-Seq ------常用数据库 SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/ SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生 物信息学研究所(EBI)维护。 COG库的网址是::http://www.ncbi.nlm.nih.gov/COG 蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生 物的21个完整基因组的编码蛋白,根据系统进化关系分类 构建而成。 KEGG的网址是::http://www.genome.ad.jp/kegg/
构建与青蒿素 产量相关的遗 传图谱
•
浓缩的嫩叶, 成熟叶片,及 花芽上的腺毛 细胞
•
Science 327, 328 (2010)
3 RNA-Seq能做什么? ----- 实例(无参考基因组)
实验结果
4.我们是怎样做的? 香鳞毛蕨 Dryopteris fragrans(L.)Schott 鳞毛蕨科鳞毛蕨
表2 测序序列统计 Tab. 2 Distribution fragment of RNA-Seq
Contig
Scaffold
Unigene
ck
1 2
173137
189469 179214
75380
77130 88322
56095
52561 64292
5. 我们的结果如何? ----- (2)组装结果
图1 CK 的Unigene的长度分布图 Fig.1Unigene length distribution of sample CK
5.我们的结果如何? ----- (2)组装结果
0 0.02 0.04 0.06 0.08 0.1 0.12 0.14 0.16 0.18 0.2 0.22 0.24 0.26 0.28 0.3 0.01 0.03 0.05 0.07 0.09 0.11 0.13 0.15 0.17 0.19 0.21 0.23 0.25 0.27 0.29 >0.3