第五章基因组序列注释优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第五章基因组序列注释
基因组测序相关技术发展
Affy launches Gene
Expression microarrays
First microarray publication - on
Arabidopsis
Affy & ILMN both launched 100K genotyping arrays
2010 2012
<2 weeks
~$1,000
成熟的二代测序技术平台
Roche / 454 Genome Sequencer
FLX 500 Mb / run
Illumina / Solexa/GIIx Genetic Analyzer 50~95GB / run
Illumina / Solexa/HiSeq 200GB / run
▪ 元基因组测序 (meta-genome sequencing)
实验
数据分析
✓ DNA提取、建库
✓ 序列预处理(质量控制) ✓ 拼接、注释(功能、代谢通路) ✓ 丰度统计、比较元基因组
▪ 未知病毒检测(Unknown virus detecting)
实验
数据分析
✓ 低量RNA、DNA处理、 ✓ 与宿主、微生物、病毒数据库
Solexa,SOLiD
▪ microRNA测序(microRNA sequencing)
实验
数据分析
✓ microRNA提取、两头加 接头、反转录、建库
(Solexa or SOLiD)
✓ 序列预处理(质量控制)
✓ 已知microRNA丰度统计 ✓ 未知microRNA预测及丰度统
计
高通量测序服务
Applied Biosystems SOLiD4
100GB / run Applied Biosystems
SOLiD/HQ 300GB / run
高通量测序服务
▪ 未知基因组测序(De novo genome sequencing)
实验
数据分析
✓ Mate Pair 测序构建 Scaffold
(Solexa or SOLiD)
✓ 序列预处理(质量控制) ✓ 基因组分型技术 ✓ SNP、Indel、CNV、染色体结构变异
及注释
✓ 与表型相关的全基因组关联分析和功 能连锁性分析
高通量测序服务
▪ 外显子捕获测序(Target exome capture)
实验
数据分析
✓ >30X的覆盖率 (Solexa or SOLiD)
The 3rd Generation Sequencing will be launched
测序技术的发展带来测序价格的下降
Innovation of NGS throughput
Cost of per Human Genome
Throughput (Gb)
240
120
100
80
200Gb-300Gb
✓ 30X的覆盖率 (454&(Solexa or SOLiD))
✓ 序列预处理(质量控制)
✓ 基因组拼接(基于reference拼接) ✓ 注释(基因功能、代谢通路、比
较基因组) ✓ SNP发现及注释
▪ 基因组重测序(Whole genome resequencing)
实验
数据分析
✓ 30X以上的覆盖 率
✓ 序列预处理(质量控制) ✓ 基因组分型技术 ✓ SNP、Indel、CNV、染色体结构变异
及注释
✓ 与表型相关的全基因组关联分析和功 能连锁性分析
▪ 全基因组甲基化测wenku.baidu.com(DNA methylation sequencing)
实验
数据分析
✓ 30X以上的覆盖 ✓ 序列预处理(质量控制) 率(Solexa or ✓ 甲基化位点检测及注释
ILMN bought Roche GS Solexa; FLX launches launched
GA
ILMN HiSeq 2000 launched
2000 2002 2003 2005 2006 2007 2008 2009
2010
In the coming future
Rise of Genbank databases from DNA sequencing
Project; DNA sequencing goes
industrial
Hapmap 1st phase data
release
ABI SOLiD 1.0 Rise of Launched! Genome Wide Association Studies (GWAS)
SOLiD 3.0: 100GB out of the box!
$M
100,000.00 10,000.00 1,000.00 100.00 10.00
13 years ~$3,000,000,000
Moore’s Law
60
1.00
40 20-30Gb
0.10
20 3Gb
6Gb
0.01
0
0.001
2007
2008
2009
2010
1990
2001
2007
更低的价格使得基于测序的科研和临床应用越来越被接受
The Sequencing Shake up!!
ABI commercializes first automated DNA sequencer
1981 1986 1989
1991
1994
1998
ILMN launches gene expression
arrays
Hapmap project launched
SOLiD)
高通量测序服务
▪ 转录组测序 (RNA-seq sequencing)
实验
数据分析
✓ mRNA打断、反转录、 ✓ 序列预处理(质量控制)
加接头
✓ 表达丰度统计
✓ De novo 454 构建转录 ✓ 注释(功能、代谢通路、表达
图谱
差异比较)
✓ Reference barcode建库 ✓ 未知转录本的分析
Human Genome Project & Celera
Genomics completes first draft genome
Low hanging fruit: cystic fibrosis mutation identified
3700 DNA Analyzer in Human Genome
建库
比较
✓ 未知病毒的发现及预测
学习重点: 1) 基因注释的方法 2) 基因功能的研究方法
基因组序列所包含的全部遗传信息是什么? 基因组作为一个整体如何行使其功能? 用什么方法寻找基因? 用什么方法研究基因的功能?
基因组测序相关技术发展
Affy launches Gene
Expression microarrays
First microarray publication - on
Arabidopsis
Affy & ILMN both launched 100K genotyping arrays
2010 2012
<2 weeks
~$1,000
成熟的二代测序技术平台
Roche / 454 Genome Sequencer
FLX 500 Mb / run
Illumina / Solexa/GIIx Genetic Analyzer 50~95GB / run
Illumina / Solexa/HiSeq 200GB / run
▪ 元基因组测序 (meta-genome sequencing)
实验
数据分析
✓ DNA提取、建库
✓ 序列预处理(质量控制) ✓ 拼接、注释(功能、代谢通路) ✓ 丰度统计、比较元基因组
▪ 未知病毒检测(Unknown virus detecting)
实验
数据分析
✓ 低量RNA、DNA处理、 ✓ 与宿主、微生物、病毒数据库
Solexa,SOLiD
▪ microRNA测序(microRNA sequencing)
实验
数据分析
✓ microRNA提取、两头加 接头、反转录、建库
(Solexa or SOLiD)
✓ 序列预处理(质量控制)
✓ 已知microRNA丰度统计 ✓ 未知microRNA预测及丰度统
计
高通量测序服务
Applied Biosystems SOLiD4
100GB / run Applied Biosystems
SOLiD/HQ 300GB / run
高通量测序服务
▪ 未知基因组测序(De novo genome sequencing)
实验
数据分析
✓ Mate Pair 测序构建 Scaffold
(Solexa or SOLiD)
✓ 序列预处理(质量控制) ✓ 基因组分型技术 ✓ SNP、Indel、CNV、染色体结构变异
及注释
✓ 与表型相关的全基因组关联分析和功 能连锁性分析
高通量测序服务
▪ 外显子捕获测序(Target exome capture)
实验
数据分析
✓ >30X的覆盖率 (Solexa or SOLiD)
The 3rd Generation Sequencing will be launched
测序技术的发展带来测序价格的下降
Innovation of NGS throughput
Cost of per Human Genome
Throughput (Gb)
240
120
100
80
200Gb-300Gb
✓ 30X的覆盖率 (454&(Solexa or SOLiD))
✓ 序列预处理(质量控制)
✓ 基因组拼接(基于reference拼接) ✓ 注释(基因功能、代谢通路、比
较基因组) ✓ SNP发现及注释
▪ 基因组重测序(Whole genome resequencing)
实验
数据分析
✓ 30X以上的覆盖 率
✓ 序列预处理(质量控制) ✓ 基因组分型技术 ✓ SNP、Indel、CNV、染色体结构变异
及注释
✓ 与表型相关的全基因组关联分析和功 能连锁性分析
▪ 全基因组甲基化测wenku.baidu.com(DNA methylation sequencing)
实验
数据分析
✓ 30X以上的覆盖 ✓ 序列预处理(质量控制) 率(Solexa or ✓ 甲基化位点检测及注释
ILMN bought Roche GS Solexa; FLX launches launched
GA
ILMN HiSeq 2000 launched
2000 2002 2003 2005 2006 2007 2008 2009
2010
In the coming future
Rise of Genbank databases from DNA sequencing
Project; DNA sequencing goes
industrial
Hapmap 1st phase data
release
ABI SOLiD 1.0 Rise of Launched! Genome Wide Association Studies (GWAS)
SOLiD 3.0: 100GB out of the box!
$M
100,000.00 10,000.00 1,000.00 100.00 10.00
13 years ~$3,000,000,000
Moore’s Law
60
1.00
40 20-30Gb
0.10
20 3Gb
6Gb
0.01
0
0.001
2007
2008
2009
2010
1990
2001
2007
更低的价格使得基于测序的科研和临床应用越来越被接受
The Sequencing Shake up!!
ABI commercializes first automated DNA sequencer
1981 1986 1989
1991
1994
1998
ILMN launches gene expression
arrays
Hapmap project launched
SOLiD)
高通量测序服务
▪ 转录组测序 (RNA-seq sequencing)
实验
数据分析
✓ mRNA打断、反转录、 ✓ 序列预处理(质量控制)
加接头
✓ 表达丰度统计
✓ De novo 454 构建转录 ✓ 注释(功能、代谢通路、表达
图谱
差异比较)
✓ Reference barcode建库 ✓ 未知转录本的分析
Human Genome Project & Celera
Genomics completes first draft genome
Low hanging fruit: cystic fibrosis mutation identified
3700 DNA Analyzer in Human Genome
建库
比较
✓ 未知病毒的发现及预测
学习重点: 1) 基因注释的方法 2) 基因功能的研究方法
基因组序列所包含的全部遗传信息是什么? 基因组作为一个整体如何行使其功能? 用什么方法寻找基因? 用什么方法研究基因的功能?