第3章 核酸序列分析
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
DNA序列分析基本内容 序列分析基本内容
43
序列一般性分析 基因识别与鉴定 非编码区分析及调控元件识别
一、序列统计
44
1 基本指标统计
序列统计包括核酸序列基本指标的计算:分子质量、GC百 序列统计包括核酸序列基本指标的计算:分子质量、GC百 分含量、融合温度(Tm值 又称退火温度)、 )、摩尔消光系 分含量、融合温度(Tm值,又称退火温度)、摩尔消光系 数等。可通过一些常用软件如JaMBW JaMBW软件包中的一个小工 数等。可通过一些常用软件如JaMBW软件包中的一个小工 Calculator、BioEdit、DNAMAN等进行综合计算 等进行综合计算。 具Oligo Calculator、BioEdit、DNAMAN等进行综合计算。 Oligo Calculator , /JaMBW/
Emulsion PCR Colony/Cluster
Sequence Read and Assembly
Image Acquisition and Processing
Fluorescence Chemiluminescence
Sequential Sequence Extension Reaction
三、基因测序的应用
36
以应用为主导的基因组学将阔步走向未来
• 走向人类的健康与生活 • 走向人类赖以生存的物质基
础 • 走向人类赖以生存的环境 • 走上人类社会和经济发展的 大舞台
37
1 基因组学研究成果将走近人类的健康与生活
• 疾病相关基因的发现、功能的鉴定和分子机制 疾病相关基因的发现、
的探讨
一、第一代测序技术
7
大规模基因组测序的几个支撑技术
Sanger双脱氧末端终止法(1977) Sanger双脱氧末端终止法(1977) 双脱氧末端终止法 PCR 技术(1985) 技术(1985) DNA 自动测序仪的发展(ABI,1995) 自动测序仪的发展(ABI,1995) 生物信息学分析软硬件设施
100um
23
25 Cycles Achieved on a Surface
5
4
Raw intensity values
3
2
C G A T
1
0 1 2 3 4 5 6 7 8 9 10111213141516171819202122232425
24
Solexa Genome Analyzer Workflow
• • • • • •
突破常见病(复杂疾病)基因水平的研究 突破常见病(复杂疾病) 以基因为基础的疾病诊断、预测和预防 以基因为基础的疾病诊断、 基因治疗与细胞治疗治疗的结合 以基因多态性为基础的“个体化” 以基因多态性为基础的“个体化”药物 以基因多态性为基础的“个体健康计划” 以基因多态性为基础的“个体健康计划” 传统药物、生物药物和“有机药物” 传统药物、生物药物和“有机药物”的自然回 归
SOLiD – ABI/Agencourt
SBL with dual base encoding
22
Individual Frame Image of Single Molecule Fluorescence
Hundreds of single molecules detected by CCD camera
38
2 走向人类赖以生存的物质基础
• 抗病、抗虫和抗极端环境的农作物 抗病、 • 高生殖率、高生长率、高营养率的家畜、家禽 高生殖率、高生长率、高营养率的家畜、
和水产品新品种
• 维生素和营养物质富集的水果和蔬菜 • 生物杀虫剂、除草剂和抗病药物 生物杀虫剂、 • 微生态环境下生产的有机食品
39
3 走向人类赖以生存的环境
25
26
27
28
29
30
31
32
33
34
35
Sequence by Synthesis
is a cyclic process involving multiple rounds of • A) incorporation of fluorescent nucleotide • B) washing • C) imaging • D) cleaving label
Polymerase Ligase
21
Next-Gen Platforms
GA – Illumina/Solexa
SBS with reversible fluorescent terminators (FISSEQ)
GS FLX – Roche/454 Life Sciences
SBS through pyrosequencing
• 全基因组霰弹法-鸟枪法(Whole Genome Shot-gun) 全基因组霰弹法-鸟枪法( Shot把基因组直接打碎成3kb左右的小片段,测序并拼接。 左右的小片段,测序并拼接。 把基因组直接打碎成 左右的小片段
逐步克隆法( 逐步克隆法(Clone by Clone) )
基因组DNA 基因组
19
20
Next-Gen Sequencing Workflow
Fragment Library Preparation
Random Pair-end
Immobilization of Fragment
Surface, Bead Covalent or noncovalent
Clonal Amplification
8
“双脱氧末端终止”的含 双脱氧末端终止” 义 1977) (1977)
Sanger 双脱氧末端终止法测序原理
9
10
大规模基因组测序的两种策 略
• 逐步克隆法--基于BAC的方法(Clone by Clone) 逐步克隆法--基于BAC的方法( --基于BAC的方法 Clone)
先把基因组打碎成200-300kb的片段并制成 - 的片段并制成BAC文 先把基因组打碎成 的片段并制成 文 进一步打碎成3kb左右的小片段, 左右的小片段, 库,再选择一些BAC进一步打碎成 再选择一些 进一步打碎成 左右的小片段 测序并拼接( 克隆的覆盖率不应低于3倍 , 测序并拼接 BAC克隆的覆盖率不应低于 倍),。 克隆的覆盖率不应低于
• 已形成了一条世界第六、亚洲最大的基因组测序 已形成了一条世界第六、 技术平台,共有MegaBACE测序仪 测序仪104台, 技术平台,共有 测序仪 台 ABI3730测序仪 台,ABI377测序仪 台,满负荷 测序仪2台 测序仪11台 测序仪 测序仪 运转日产可达50Mb,是一个低投入、高产出,高 运转日产可达 ,是一个低投入、高产出, 度自动化的测序平台。 度自动化的测序平台。
11 或contig
测序并进行 全基因组序 列组装
ห้องสมุดไป่ตู้
霰弹法克隆 用于霰弹法测 序的候选克隆 用于霰弹法测序 的亚克隆 测序并组装 ………ATGCCGTAGGCCTAGC TAGGCCTAGCTCGGA…… 完整的基因 ………ATGCCGTAGGCCTAGCTCGGA… 组序列 …
Sequencing Cost(成本) (成本)
Sample handling Difficult to miniaturize
18 $3,000 millions per human genome (phg) in 1984 $300 millions phg in 1994 $30 millions phg in 2004 $10 millions phg in 2005 NHGRI’s Immediate Goal by 2009: $100,000 phg $2 millions Watson’s genome with 454 in 2007 $60,000 phg (ABI claim in Mar. 2008) Goal by 2014: $1000 per human genome
• 基因组信息记录了物种亿万年来在环境变迁中 起源和进化的历史。 起源和进化的历史。 • 生物多样性资源的研究、保护与开发:地球上 生物多样性资源的研究、保护与开发: 估计有1 估计有1亿个物种 • 生态环境的研究、保护与开发: 生态环境的研究、保护与开发: – 巨大的海洋(占地球总面积71%) 巨大的海洋(占地球总面积71 71%) – 广袤的森林(占地球总面积40%) 广袤的森林(占地球总面积40 40%) – 诸多的湖泊与河流大规模测序平台的构成组 培养组 模板组 电泳组 反应组
MegaBACE 基因组随机的构建13含有质粒载体的大肠杆菌培养 测序模板的制备 检测模板质量与测序定量 测序反应与纯化 反应产物上机测序 序列数据的接收、质量评估、 序列数据的接收、质量评估、 组装等
上机组 数据处理组
14
中国基因组测序情况
15
我国测序能力的“三级跳”
• 人类基因组计划1%项目的 finishing (1999年) • 中-丹合作的家猪基因组计 划 (2000年) • 水稻工作框架图的绘制和 公布 (2001年) • 标志着我国已掌握了国际 先进的测序技术,具有相 当的测序能力。 • 测序能力和质量已达到国 际一流水平 ,以独立承担大 规模的基因组测序项目 • 我国已经成为继美国之后 世界上第二个具有独立完 成大规模的全基因组测序 和组装分析能力的国家
第三章 DNA序列分析 序列分析
2 免费分子生物学软件下载网址: 免费分子生物学软件下载网址:
Ebi
/software/software.html 或ftp:///pub/sofware/
Iubio (印地安纳州大学
/soft/molbio/ 或 ftp:///soft/molbio/
§3.2 DNA序列的一般分析 序列的一般分析
基因结构与功能简介 原核生物基因结构
41
特点: 特点:
1 长开放阅读框 2 高基因密度 3 简单的基因结构 基因组中GC GC含量变化非常大 4 基因组中GC含量变化非常大
真核生物基因结构
42
1 基因组规模大 特点: 特点: 非编码区序列占绝大部分(人类,97%) 2 非编码区序列占绝大部分(人类,97%) 3 基因结构复杂 4 具有复杂的基因转录调控方式 5 具有丰富的可变剪接 有明显的CpG CpG岛 6 有明显的CpG岛、密码子使用具有偏好性
Iubio Archive 主页 每一个文件夹里都有相关的免费软件可供下载
3
4
主要内容 §3.1 核酸序列测定 §3.2 序列的一般分析 §3.3 基因预测与鉴定 §3.4 非编码区分析与调控元件识别
§3.1核酸序列测定
世界大型基因组研究中心
6
美国: 美国:1) National Human Genome Research Institution in NIH 2) Genome Center at White Head/MIT 3) Washington University Genome Center 4) Joint Genome Institution at DOE 5) Genome Center at Baylor Medical Collage 英国: 英国:Sanger Center 日本: 日本:RIKEN 中国:华大基因研究中心(北京、杭州) 中国:华大基因研究中心(北京、杭州) 国家人类基因组中心(北京、上海) 国家人类基因组中心(北京、上海)
基因组DNA 基因组
全基因组霰弹法 (Whole Genome Shot-gun)
12
两种大规模基因组测序策略的比较
策 略 项 目 遗传背景 速度 费用 计算机性能 适用范围 代表测序物种 全基因组霰弹法 不需要 快 低 高(以全基因组为单位 进行拼接) 进行拼接) 工作框架图 果蝇、 果蝇、水稻 逐步克隆法 需要( 需要(需构建精确的物 理图谱) 理图谱) 慢 高 低(以BAC为单位进 为单位进 行拼接) 行拼接) 精细图 人、线虫
二、第二代测序技术
16
2006 - 2nd generation DNA sequencer on market
第一代测序技术的局限性
17
Limitation of 1st Gen Sequencer
Throughput (通量) 通量)
Time-consuming separation of chainterminated fragments Hard to produce massively parallel system based electrophoretic separation