基因组注释详解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Illumina / Solexa/GIIx Genetic Analyzer 50~95GB / run Illumina / Solexa/HiSeq 200GB / run
Applied Biosystems SOLiD4 100GB / run Applied Biosystems SOLiD/HQ 300GB / run
实验
数据分析
30X以上的覆盖率 序列预处理(质量控制) (Solexa or SOLiD) 甲基化位点检测及注释
高通量测序服务
转录组测序 (RNA-seq sequencing)
实验
数据分析
mRNA打断、反转录、加接头 De novo 454 构建转录图谱 Reference barcode建库
高通量测序服务
元基因组测序 (meta-genome sequencing)
实验
数据分析
DNA提取、建库
序列预处理(质量控制) 拼接、注释(功能、代谢通路) 丰度统计、比较元基因组
未知病毒检测(Unknown virus detecting)
实验 低量RNA、DNA处理、建库
Moore’s Law
60
1.00
40 20-30Gb
0.10
20 3Gb
6Gb
0.01
0
0.001
2007
2008
2009
2010
1990
2001
更低的价格使得基于测序的科研和临床应用越来越被接受
2007
2010 2012
<2 weeks
~$1,000
成熟的二代测序技术平台
Roche / 454 Genome Sequencer FLX 500 Mb / run
基因组测序相关技术发展
Affy launches Gene Expression microarrays
First microarray publication - on Arabidopsis
Affy & ILMN both launched 100K genotyping arrays
The Sequencing Shake up!!
ILMN HiSeq 2000 launched
2000 2002 2003 2005 2006 2007 2008 2009
2010 In the coming future
Rise of Genbank databases from DNA sequencing
Human GenomHale Waihona Puke Baidu Project & Celera Genomics completes first draft genome
外显子捕获测序(Target exome capture)
实验
数据分析
>30X的覆盖率 (Solexa or SOLiD)
序列预处理(质量控制) 基因组分型技术 SNP、Indel、CNV、染色体结构变异及注释 与表型相关的全基因组关联分析和功能连锁性分析
全基因组甲基化测序(DNA methylation sequencing)
Innovation of NGS throughput
Cost of per Human Genome
Throughput (Gb) 240
120
100
80
200Gb-300Gb
$M
100,000.00 10,000.00 1,000.00 100.00 10.00
13 years ~$3,000,000,000
Solexa,SOLiD
序列预处理(质量控制) 表达丰度统计 注释(功能、代谢通路、表达差异比较) 未知转录本的分析
microRNA测序(microRNA sequencing)
实验
microRNA提取、两头加接头、 反转录、建库 (Solexa or SOLiD)
数据分析
序列预处理(质量控制) 已知microRNA丰度统计 未知microRNA预测及丰度统计
Low hanging fruit: cystic fibrosis mutation identified
3700 DNA Analyzer in Human Genome Project; DNA sequencing goes industrial
Hapmap 1st phase data release
基因组重测序(Whole genome resequencing)
实验
30X以上的覆盖率 (Solexa or SOLiD)
数据分析
序列预处理(质量控制) 基因组分型技术 SNP、Indel、CNV、染色体结构变异及注释 与表型相关的全基因组关联分析和功能连锁性分析
高通量测序服务
ABI
SOLiD 1.0
Rise of
Launched!
Genome Wide
Association
Studies (GWAS)
SOLiD 3.0: 100GB out of the box!
The 3rd Generation Sequencing will be launched
测序技术的发展带来测序价格 的下降
ABI commercializes first automated DNA sequencer
1981 1986 1989
1991
1994
1998
ILMN launches gene expression arrays
Hapmap project launched
ILMN bought Roche GS Solexa; FLX launches launched GA
数据分析
与宿主、微生物、病毒数据库比较 未知病毒的发现及预测
两种测序策略:
基于BAC的方法: 先把基因组打碎成200-300kb的片段并制成BAC文库, 再选择一些BAC进一步打碎成3kb左右的小片段,测序 并拼接。
高通量测序服务
未知基因组测序(De novo genome sequencing)
实验
数据分析
Mate Pair 测序构建Scaffold 30X的覆盖率
(454&(Solexa or SOLiD))
序列预处理(质量控制) 基因组拼接(基于reference拼接) 注释(基因功能、代谢通路、比较基因组) SNP发现及注释