最新基因组学概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
基因组学概述
11.1 人工染色体构建
1983年,美国的Dana-Farber癌症研究所和哈佛大学 医学院的教授首次在Nature上发表文章,报道了构建 YAC(Yeast Artificial Chromosome)库的过程。1987年, Burke等人发现,仅仅带有ARS序列(autonomous replicating sequence) 的载体虽然能够被复制,但极易在 有丝分裂时丢失。即使在选择培养基上,也只有5%20%的子代细胞带有ARS载体。加入Centromeres (CEN)能显著提高ARS质粒在有丝分裂时的稳定性, 90%以上子代细胞带有该载体。CEN还能显著降低拷贝 数,从20-50/细胞降为1-2/细胞。(Science, 236:806812)。
说明:
1.穿梭载体(sbuttle vector) 指在两种宿主生物体 内复制的载体分子,因而可以运载目的基因(穿梭 往返两种生物之间,如:YEP,DIDB219
2.YAC Yeast Artificial Chromsome 由酵母基因和 PBR322质粒衍生物构成,对克隆大的真核基因十分 有用,在HGP中发挥主要作用。
Dideoxynucleotides
(双脱氧核苷酸)
• ddNTPs 是反应终止剂
可以当作正常碱基参与复制, 一旦链入DNA中,其后就不能再继续
连接。
• 反应体系中dNTPs的浓度远高
于ddNTPs(一般1:3~4)。
脱氧核甘酸 与 双脱氧核甘酸 结构比较
少一个-OH
复制)和parA、 parB(控制拷贝数)等成分。
BAC的优点
1. 易于用电击法转化E.coli(转化效率比转化酵母高10100倍); 2. 超螺旋环状载体,易于操作; 3. F‘质粒本身所带的基因控制了质粒的复制; 4. 很少发生体内重排。
有人把人类染色体端粒DNA上单个α-卫星DNA单 元多聚化形成1Mb左右的大片段并与人类基因组DNA 混合,产生了能被复制、能正常分裂并得到长期稳定 保存的人工合成的染色体,长度约为6-10Mb,称为
内含子
20~30% 中度至高度重复序列
约60%
串联重复序列/ 成簇重复序列
约40% 分散重复序列
11.2 高通量DNA序列分析技术
在大规模DNA测序中,目标DNA分子的长度可达上百万个bp。现 在还不能直接测定整个分子的序列,然而,可以得到待测序列 的一系列序列片段。
序列片段是DNA双螺旋中的一条链的子序列(或子串)。这些序 列片段覆盖待测序列,并且序列片段之间也存在着相互覆盖或 者重叠。在一般情况下,对于一个特定的片段,我们不知道它 是属于正向链还是属于反向链,也不知道该片段相对于起点的 位置。另外,这样的序列片段中还可能隐含错误的信息。序列 片段的长度范围300-1000 bp,而目标序列的长度范围是3100 万bp,总的片段数目可达上千个。
DNA序列片段组装(sequence assembly),又称序列拼接)的任务 就是根据这些序列片段,重建目标DNA序列。如果能够得到 DNA一条链的序列,那么根据互补原则,另一条链的序列也就 得到了。
• DNA测序不能从染色体进行,首先必须克隆化,构建基因组 的物理图谱。
• 先构建片段DNA克隆(以YAC或BAC为载体),并把克隆依染 色体排序,这就是“染色体的克隆图”。依片段DNA克隆在 染色体上所在的位置排序,可以得到相互重叠的一系列克隆, 叫做“克隆重叠群”(contig)。选取有关的克隆进行DNA测 序,就可以“拼装”出整个染色体或基因组的DNA序列。如 果克隆片段太大仍不便于直接测序,则需通过亚克隆,构建 更小的片段。
经典方法:
Sanger双脱氧链终止法(Sanger,1977) Maxam-Gilbert DNA化学降解法(Maxam &Gilbert,1977)
新技术方法:
➢ 杂交测序法 ➢ 质谱法 ➢ 单分子测序法 ➢ 原子探针显微镜测序法 ➢DNA 芯片法
• Sanger双脱氧链终止法原理:
双脱氧链终止法要求使用一种单链的DNA模板和一 种适当的DNA合成引物。 利用DNA聚合酶的两种酶催化反应的特性: 第一,DNA聚合酶能够利用单链的DNA为模板,合成 出准确的DNA互补链; 第二,DNA聚合酶能够利用2’,3’-双脱氧核苷三磷酸 作底物,使之参入到寡核苷酸链的3’-末端,从而终止 DNA链的延长。
3.BAC 细菌人工染色体。
YAC的主要缺点
1.存在高比例的嵌合体,即一个YAC克隆含有两个本 来不相连的独立片段; 2.部分克隆子不稳定,在转代培养中可能会发生缺失 或重排; 3.难与酵母染色体区分开,因为YAC与酵母染色体具 有相似的结构。 4.操作时容易发生染色体机械切割。
以细菌寄主系统为基础的克隆载体形成嵌合体的频 率较低,转化效率高,又易于分离。科学家用"染色体 建造"法用F质粒及其调控基因构建细菌载体,克隆大 片段DNA。该质粒主要包括oriS, repE(控制F质粒
MAC或HAC。
人类基因组
核基因组(3200Mb)
约10% 基因和基因有关序列
约90% 基因外序列
线粒体基因组(16.6kb)
rRNA 基因
tRNA 基因
பைடு நூலகம்
蛋白编码 基因
专一或中等重复序列
<10%
>90%
70~80%
专一的或低 拷贝数序列
Coding DNA Non-coding DNA
假基因
基因片段
• 另外一种方法是对所有相互重叠的亚克隆进行测序,然后直 接通过计算机程序根据其重叠部分进行“拼装”。
完整基因组的测序过程一般包括三个步骤: (1)建立克隆的物理图谱:如酵母人工染色体YAC(Yeast Artificial Chromosome)克隆、细菌人工染色体BAC(Bacterial Artificial Chromosome)克隆等; (2)测定每个克隆的序列; (3)序列拼装和注释:当得到一段DNA序列之后,可以利用序 列分析工具,进行序列的拼接;继而通过与数据库序列的比较, 得到与该序列相关的信息,如基因、调控元件、重复区域等, 进而对序列的生物学特性进行注释。
11.1 人工染色体构建
1983年,美国的Dana-Farber癌症研究所和哈佛大学 医学院的教授首次在Nature上发表文章,报道了构建 YAC(Yeast Artificial Chromosome)库的过程。1987年, Burke等人发现,仅仅带有ARS序列(autonomous replicating sequence) 的载体虽然能够被复制,但极易在 有丝分裂时丢失。即使在选择培养基上,也只有5%20%的子代细胞带有ARS载体。加入Centromeres (CEN)能显著提高ARS质粒在有丝分裂时的稳定性, 90%以上子代细胞带有该载体。CEN还能显著降低拷贝 数,从20-50/细胞降为1-2/细胞。(Science, 236:806812)。
说明:
1.穿梭载体(sbuttle vector) 指在两种宿主生物体 内复制的载体分子,因而可以运载目的基因(穿梭 往返两种生物之间,如:YEP,DIDB219
2.YAC Yeast Artificial Chromsome 由酵母基因和 PBR322质粒衍生物构成,对克隆大的真核基因十分 有用,在HGP中发挥主要作用。
Dideoxynucleotides
(双脱氧核苷酸)
• ddNTPs 是反应终止剂
可以当作正常碱基参与复制, 一旦链入DNA中,其后就不能再继续
连接。
• 反应体系中dNTPs的浓度远高
于ddNTPs(一般1:3~4)。
脱氧核甘酸 与 双脱氧核甘酸 结构比较
少一个-OH
复制)和parA、 parB(控制拷贝数)等成分。
BAC的优点
1. 易于用电击法转化E.coli(转化效率比转化酵母高10100倍); 2. 超螺旋环状载体,易于操作; 3. F‘质粒本身所带的基因控制了质粒的复制; 4. 很少发生体内重排。
有人把人类染色体端粒DNA上单个α-卫星DNA单 元多聚化形成1Mb左右的大片段并与人类基因组DNA 混合,产生了能被复制、能正常分裂并得到长期稳定 保存的人工合成的染色体,长度约为6-10Mb,称为
内含子
20~30% 中度至高度重复序列
约60%
串联重复序列/ 成簇重复序列
约40% 分散重复序列
11.2 高通量DNA序列分析技术
在大规模DNA测序中,目标DNA分子的长度可达上百万个bp。现 在还不能直接测定整个分子的序列,然而,可以得到待测序列 的一系列序列片段。
序列片段是DNA双螺旋中的一条链的子序列(或子串)。这些序 列片段覆盖待测序列,并且序列片段之间也存在着相互覆盖或 者重叠。在一般情况下,对于一个特定的片段,我们不知道它 是属于正向链还是属于反向链,也不知道该片段相对于起点的 位置。另外,这样的序列片段中还可能隐含错误的信息。序列 片段的长度范围300-1000 bp,而目标序列的长度范围是3100 万bp,总的片段数目可达上千个。
DNA序列片段组装(sequence assembly),又称序列拼接)的任务 就是根据这些序列片段,重建目标DNA序列。如果能够得到 DNA一条链的序列,那么根据互补原则,另一条链的序列也就 得到了。
• DNA测序不能从染色体进行,首先必须克隆化,构建基因组 的物理图谱。
• 先构建片段DNA克隆(以YAC或BAC为载体),并把克隆依染 色体排序,这就是“染色体的克隆图”。依片段DNA克隆在 染色体上所在的位置排序,可以得到相互重叠的一系列克隆, 叫做“克隆重叠群”(contig)。选取有关的克隆进行DNA测 序,就可以“拼装”出整个染色体或基因组的DNA序列。如 果克隆片段太大仍不便于直接测序,则需通过亚克隆,构建 更小的片段。
经典方法:
Sanger双脱氧链终止法(Sanger,1977) Maxam-Gilbert DNA化学降解法(Maxam &Gilbert,1977)
新技术方法:
➢ 杂交测序法 ➢ 质谱法 ➢ 单分子测序法 ➢ 原子探针显微镜测序法 ➢DNA 芯片法
• Sanger双脱氧链终止法原理:
双脱氧链终止法要求使用一种单链的DNA模板和一 种适当的DNA合成引物。 利用DNA聚合酶的两种酶催化反应的特性: 第一,DNA聚合酶能够利用单链的DNA为模板,合成 出准确的DNA互补链; 第二,DNA聚合酶能够利用2’,3’-双脱氧核苷三磷酸 作底物,使之参入到寡核苷酸链的3’-末端,从而终止 DNA链的延长。
3.BAC 细菌人工染色体。
YAC的主要缺点
1.存在高比例的嵌合体,即一个YAC克隆含有两个本 来不相连的独立片段; 2.部分克隆子不稳定,在转代培养中可能会发生缺失 或重排; 3.难与酵母染色体区分开,因为YAC与酵母染色体具 有相似的结构。 4.操作时容易发生染色体机械切割。
以细菌寄主系统为基础的克隆载体形成嵌合体的频 率较低,转化效率高,又易于分离。科学家用"染色体 建造"法用F质粒及其调控基因构建细菌载体,克隆大 片段DNA。该质粒主要包括oriS, repE(控制F质粒
MAC或HAC。
人类基因组
核基因组(3200Mb)
约10% 基因和基因有关序列
约90% 基因外序列
线粒体基因组(16.6kb)
rRNA 基因
tRNA 基因
பைடு நூலகம்
蛋白编码 基因
专一或中等重复序列
<10%
>90%
70~80%
专一的或低 拷贝数序列
Coding DNA Non-coding DNA
假基因
基因片段
• 另外一种方法是对所有相互重叠的亚克隆进行测序,然后直 接通过计算机程序根据其重叠部分进行“拼装”。
完整基因组的测序过程一般包括三个步骤: (1)建立克隆的物理图谱:如酵母人工染色体YAC(Yeast Artificial Chromosome)克隆、细菌人工染色体BAC(Bacterial Artificial Chromosome)克隆等; (2)测定每个克隆的序列; (3)序列拼装和注释:当得到一段DNA序列之后,可以利用序 列分析工具,进行序列的拼接;继而通过与数据库序列的比较, 得到与该序列相关的信息,如基因、调控元件、重复区域等, 进而对序列的生物学特性进行注释。