基因组学概述 PPT课件

合集下载

动物基因组学PPT课件

常用动物模型
小鼠、大鼠、猴子、狗等都是常用的动物模型。
主要成果
通过动物模型研究，科学家们发现了许多与人类疾病和行为特征相关的基因和机制，为人类生物学和医学研究提供了重要依据。
农业动物基因组学研究
01
农业动物基因组学研究
农业动物基因组学研究旨在通过基因组学手段改良农业动物的遗传性状，
提高其生产性能和健康水平。
疾病诊断与预防
动物基因组学有助于发现与人类疾病相关的基因变异，为疾病的早期诊断和预防提供依据。
生物治疗
动物基因组学为生物治疗提供了新的手段，例如基因治疗和细胞治疗等，可用于治疗遗传性疾病和癌症等疾病。
农业领域
品种改良
动物基因组学为农业领域提供了新的育种手段，通过基因编辑和基因转移等技术，可以快速培育出抗逆性强、产量高、品质优良的动植物新品种。
主要研究对象
虎、狮、豹、过野生动物基因组学研究，科学家们深入了解了野生动物的生物学特征、进化和保护情况，为野生动物保护和生态平衡维护提供了重要依据。
04
动物基因组学应用前景
生物医药领域
药物研发
动物基因组学为药物研发提供了新的途径，通过研究动物基因的表达和调控，可以发现新的药物靶点，提高药物研发的效率和成功率。
现状
目前，动物基因组学的研究已经取得了丰硕的成果，包括多种动物的基因组测序和解析，以及基于基因组学的动物功能基因研究和应用探索。同时，随着新一代测序技术和计算生物学的发展，动物基因组学的研究将更加深入和广泛。
02
动物基因组学基础知识
基因与基因组
01
02
03
基因
遗传信息的最小功能单位，负责编码蛋白质或RNA分子。
表观遗传学

基因组学PPT课件

9
人类基因组计划的背景-----基因组计划最早始于美国
初衷1945年原子弹事件
1984年12月犹他大学魏特受美国能源部的委托，美国能源部
的广岛之争:突变率调查
资助召开的环境诱变物和致癌物的防护的会议上，
讨论DNA重组技术的发展及测定人类整个基因组
1985年6月，美国加州的会议上， DNA序列的意义，第一次提出测定人体基因和全部DNA序列，
1990年10月1日正式启动实施
目标：完成对人的基因组的30亿个核苷酸对的全部序列测定工作，阐明人体中全部基因的位置、功能、结构、表达调控方、德、日、中六国科学家的共同努力下， 2000年6月26日，国际人类基因组计划与塞莱拉公司联合发布“人类基因组工作草图”。 2001年2月12日两大科研小组联合发布人类基因组图谱及“基本信息”。宣告人类基因组计划基本完成。10
人类基因组计划是与曼哈顿原子计划、阿波罗登月计划一样伟大宏伟。
人类基因组计划的研究内容
美国的人类基因组计划总体规划是：拟在15年内至少投入30亿美元，进行对人类全基因组的
分析。 1993年作了修订，其主要内容包括：人类基因组的基因图构建与序列分析；人类基因的鉴定；基因组研究技术的建立；人类基因组研究的模式生物；信息系统的建立。人类基因组研究的社会、法律与伦理问题，交叉学科的技术训练，技术的转让，研究计划的外延等共9方面的内容。
美国能源部正式提出了展开人类
并检测所有的突变，计算真实的突变率。
基因组测序工作，形成了能源部的“人类基因组计划”初步草案。
1986年6月，新墨西哥州冷泉港吉尔伯特及伯格主持的讨论会上，进行了可行性讨论。美能源部宣布实施草案。意裔美肿瘤分子生
1987年，美国国家医学研究院和能源部联合提出了这一宏伟计划，即HGP）,先期

基因组学ppt课件

锁图。这一方法包括杂交实验，家系分析。遗传图距单位为厘摩(cM), 每单位厘摩定义为1%交换率。
2）物理作图（Physical mapping）采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组
实际位置。物理图的距离依作图方法而异，如辐射杂种（radiation hybrid）作图的计算单位为厘镭(cR), 限制性片段作图与克隆作图的图距为DNA的分子长度，即碱基对(bp, kb)。
散的顺序按原来位置组装,需要图譜进行指导. - 基因组存在大量重复顺序,会干扰排序, 因此要高密度基因组图.
2)由于一些分子标记同基因座位紧密连锁，为靶基因的图位克隆(map based cloning)提供了可能。
3)遗传图和物理图各有优缺点,必须相互整合校正.
5
二、遗传图与物理图
1）遗传作图（Genetic mapping）采用遗传学分析方法将基因或其它DNA分子标记标定在染色体上构建连
由于同源染色体同一区段DNA序列的差异，当用限制酶处理时，可产生长度不同的限制性片段。
14
什么是RFLP标记？(2)
Var. A
Var. B
EcoR I will not cut this squence 15
什么是RFLP标记？(3)
16
(二) RFLP methodology
Cutting DNA into smaller fragments by restriction enzymes
2）生化特征表型。如人类血型系列分析。
10
基因标记并非理想的标记，因为： - 可用作标记的基因十分有限。许多
性状都涉及多基因。 - 用基因做标记将在遗传图中留下大
片的无标记区段，因为存在大量的基因间区。

基因组信息分析PPT课件

GC含量
碱基G、C相对于A、T的丰度很早就被看作是区分细菌基因组的特征之一 .不同的原核生物中,GC含量(GC content)从25﹪到75﹪,变化非常大。大部分细菌是通过从其它生物体大规模获得基因(长度为几万甚至几十万个核苷酸)而进化的(水平转移).简而言之,许多细菌基因组表现为具有不同GC含量的区域的组合物,这些区域反映了细菌的进化历史。
G
0.1751306272192
T
0.3248693727808
酵母基因组核苷酸出现频率
在统计过程中,如果同时计算DNA的正反两条链,则根据碱基配对原则,A和T、C和G的出现频率相同。如果仅统计一条链,则虽然A和T、C和G的出现频率不同,但是非常接近。
核苷酸
频率
A
0.344
C
0.155
G
等值区
定义:具有一致碱基组成的长区域特征 :等值区基因组序列的长度超过1,000,000对碱基虽然不同的等值区其GC含量差别显著,但同一等值区的GC含量始终相对均衡人类基因组大约可以划分为五个不同类型的等值区:a) L1和L2,平均GC含量分别为39﹪和42﹪(欠GC)) b) H1、H2和H3,GC含量平均值分别为46﹪、49﹪和54﹪ (丰GC)
科学家对这本天书了解最多的部分就是遗传密码或者说掌握了DNA对蛋白质编码的规律关于密码子(1)密码子的使用是非随机的如果密码子的第一、第二位碱基是A、U, 那么第三位将尽可能使用G、C;反之亦然。如果三位都用G、C,则配对容易,分解难; 三位都用A、U,则相反。一般地说,高表达的基因,要求翻译速度快, 要求密码子和反密码子配对快、分手也快。
基因结构复杂
基因转录调控方式复杂
真核基因的表达涉及多种RNA聚合酶。与原核生物只使用一种由多个蛋白聚合而成的RNA聚合酶不同,真核生物至少使用由8到12个蛋白组成的三种不同类型的RNA聚合酶。RNA 聚合酶I和III负责转录生成RNA分子,这些分子本身执行重要的功能,在所有的真核细胞中需要始终保持相当恒定的水平。RNA聚合酶II专门负责转录编码蛋白质的基因。 RNA聚合酶II识别的启动子序列的多样性反映了区别基因的复杂程度,即在特定类型的细胞中和在特定的时间,区别哪些基因该表达而哪些基因不该表达。

第01讲微生物基因组学102页PPT

• Genomics is the study of the molecular organization of genomes, their information content, and the gene products they encode.
－－Prescott-Harley-Klein: Microbiology, Fifth Edition
关于基因组学的范畴
• 随着基因组和基因组学这两个术语变得流行起来，一系列新的术语也被创造出来，每个新的研究领域都冠以“…… 组学”（-omic)的名称，而被研究的对象则被称为“ …… 组”(-ome)。例如蛋白质组和蛋白质组学。
• 一个蛋白质组（proteome)表示某个时刻在一个细胞或生物体中全部的蛋白质组成。其它类似的词还有转录组、代谢组、糖组和变异组。这些新兴的领域能否归到“基因组学”之下，尚有较大的争议。
• 1987年，Victor Mckusick 和 Frank Ruddle 一起创办了“genomics”杂志，这是第一次“genomics” 这个词在科学界得到广泛的应用。
• 基因组学领域包括DNA测序、在物种内进行基因组多样性的采集以及基因转录调控的研究，即基因组学覆盖了从DNA序列分析到研究生物体对环境干扰的响应这样比较广的范围。
“基因是迄今为止最为复杂的程序”
——Bill Gates
（二）DNA测序技术的诞生与发展
1975，Frederick Sanger双脱氧链终止法； 1977，Maxam和Gilbert 氧化法
（1976年，在英国的Gordon会议上两个小组同时宣布，但Maxam和Gilbert直到1980年才正式发表研究结果）
基因组基学因研组究学的研究3大的主3 题大和主题6个和层6 面个层面

基因组学ppt课件

编辑课件
6
染色体带型命名
人类染色体带型最早确定的命名方式是从着丝粒向两侧按数字编号, 短臂以p代表 (p=petit),长臂以q代表. 短臂和长臂又可进一步分区，每个区又分为数个亚区，亚区又可划分为不同的区带，有的区带又可细分为区亚带。
编辑课件
7
人类染色体核型
编辑课件
8
四、基因组的结构成分
1) SAR和MAR 2) CpG岛 3) 等高线
5) MAR或SAR之间的距离平均为30 kb, 染色体DNA环突
长约25-600 kb, 因此并非所有MAR或SAR均与基质或
骨架结合. 或这说MAR(或SAR)与基质或骨架结合的
位置是动态的, 不固定的.
编辑课件
11
SAR和MAR的应用
由于发现许多功能基因的两侧含有SAR或 MAR的结构,并证实SAR和MAR具有阻止异染色质位置效应和隔离相邻基因彼此干扰的功能, 因此为了提高转基因的表达水平, 在构建表达载体时可在基因两侧安装SAR 或MAR顺序, 以减少转基因沉默效应.
编辑课件
12
MAR
的分离
编辑课件
13
（2）什么是CpG岛
满足CpG岛的条件为: 1. 连续200 bp的DNA顺序(已修改为500 bp); 2. C+G含量大于50%(已修改为55%); 3. 观测到的CpG双碱基数目与预期的数目
之比大于0.6(已修改为0.65).
(Gardiner-Garden, J.Mol.Bio., 196:261, 1987; Proc Natl Acad Sci USA 99:3740-3745, 2002 )
第6章真核生物基因组解剖
编辑课件

研究生基因组学PPT课件

研究生基因组学PPT课件
目录
• 基因组学概述 • 基因组学基础知识 • 基因组学研究方法 • 基因组学在医学中的应用 • 基因组学在农业中的应用 • 基因组学的伦理、法律与社会问题
01
基因组学概述
基因组学的定义与特点
总结词
基因组学的定义、特点与研究对象
详细描述
基因组学是一门研究生物体基因组的学科，其研究对象包括基因组的组成、结构、功能和演化等方面的内容。基因组学具有系统性、整体性和复杂性等特点，其研究范围涵盖了基因组的结构、功能、进化以及基因组与环境之间的相互作用等多个方面。
研究作物耐盐碱的基因基础，有助于培育出能在盐碱地生长的作物品种，扩大可耕地面积，提高农业生产效益。
抗病性基因
发掘和利用作物的抗病性基因资源，可以培育出抗病性更强的品种，减少农药使用，降低生产成本，同时保障食品安全。
转基因技术与作物改良
转基因技术原理
转基因技术是一种将外源基因导入到生物体基因组中的技术，通过该技术可以改良作物的性状和产量。
息被滥用或泄露。
基因歧视与公平性问题
基因歧视的问题
基因检测可以揭示个体的遗传疾病风险，这可能会引发就业、保险等方面的歧视问题。政府应该制定相关法律和政策，禁止基于基因信息的歧视行为。
公平获取基因技术的机会
虽然基因技术可以带来巨大的益处，但并不是每个人都能公平地获得这些技术。政府和社会应该采取措施，确保所有人都能公平地获得基因检测和治疗的机会。
基因表达与调控
基因表达
是指基因经过转录和翻译，将遗传信息转化为蛋白质或RNA分子的过程。
基因调控
是指对基因表达的调节和控制，以确保生物体在生长发育和应对环境变化时能够做Байду номын сангаас适当的反应。

动物基因组学基础PPT课件

第39页/共86页
Байду номын сангаас
物理作图的方法
• 基因组物理图谱的构建主要有三种途径： ①限制性酶图谱 ②荧光原位杂交技术(FISH) ③序列标签位点(STS)
如表达的序列标签(EST)，来自cDNA
第40页/共86页
描述染色体上限制性内切酶切割位点之间距离和顺序的图谱识别位点较多的内切酶：如 NotⅠ，其8个核苷酸出现的频率为 1/48=1/65536bp，而识别位点为 6个核苷酸的出现频率为 1/46=1/4094bp
• 基因组学的重要组成部分是基因组计划，如人类、水稻基因组计划
第2页/共86页
人类基因组计划
➢ 1990，美国国立卫生研究所和能源部投资＄30亿，启动了被誉为“人体阿波罗计划”的 “人类基因组计划”(human genome project，HGP)，预计15年时间完成人类基因组全部序列的测定
➢ 在美国提出人类基因组计划后，英、法、日、前苏联、中等，也相继启动了类似的研究项目
生化标记
• 又称蛋白质标记，就是利用蛋白质的多态性作为遗传标记
如：同工酶、等位酶
• 优点：数量较多，受环境影响小 • 缺点：受发育时间的影响、有组织特异性、只反映基因编码区的信息
第13页/共86页
DNA分子标记
简称分子标记，以DNA序列的多态性作为遗传标记优点： • 不受时间和环境的限制 • 遍布整个基因组，数量无限 • 不影响性状表达 • 自然存在的变异丰富，多态性好 • 共显性，能鉴别纯合体和杂合体
第27页/共86页
RAPD 标记特点 • PCR反应产物通过电泳分离：不同样品间可能存在差
异 • 主要用于分析群体间的遗传距离 • 引物短，不同生物基因组可以共用一套引物 • 实验快速简便，成本低，无需预先了解基因组DNA序

《基因组学》PPT课件

第十章基因组学 (Genomics)
ppt课件
1
Structural Genomics 结构基因组学 Functional Genomics 功能基因组学
Transcriptomics 转录物组学 Proteomics 蛋白质组学
ppt课件
2
第一节真核生物基因组组成
Organization of Eukaryotic Genome
ppt课件
16
1. Genetic map 遗传图
The map in which mutant alleles or DNA markers are assigned relative positions along a chromosome on the basis of the recombination frequencies between them
Tetrahymena, GGGGTT Human, GGGATT Telomere-associated sequences: is repetitive and is found both adjacent to and within the telomere. The sequences vary among organisms.
ppt课件
5
Highly repetitive sequences 高度重复序列 5~300bp , 105 copies
Middle-repetitive sequences 中度重复序列 10~1000 copies
Unique sequences 单拷贝序列
ppt课件
6
▪ Gene family（基因家族）: a set of genes in one genome all descended from the same ancestral gene.

基因组学.ppt1

James Watson
Francis Collins
• 1992年6月，Craig Venter离开国家卫生研究院，建立了基因研究所（The Institute for GenomeResearch, TIGR），此后， TIGR从流感嗜血菌开始测了大量的细菌基因组，流感嗜血菌也是第一个被测序的非寄生物种
• Human genome project • Goal: characterize all human genetic material by • determining the complete sequence of the DNA in the • human genome. • HGP is accomplished by the joint effort between • U.S. Human Genome Project (HGP), composed of the • DOE (Department of Energy )and NIH (National • Institutes of Health), and Celera Genomics
• 1986年3月，1975年诺贝尔奖得主、Salk Institute的癌症研究员杜贝可（Renato Dulbecco）在“Science”期刊上发表文章，题为“癌症研究的转折点：定出人类基因组序列”。这片文章引起了美国社论。 • 杜贝可提出了两种基因搜寻路线，即以测序为核心的“DNA”序列探测和以作图为中心的“基因图位”克隆。
• 基因组学（Genomics）：研究基因组及其基因的科学。 • 最初是Thomas Roderick于1986年提出，其主 • 要内容是指基因组作图（Mapping）和测序 • （Sequencing）。 • 21世纪从生物体整体上研究生命现象 • 研究整个物种基因组碱基的组成、基因的结构、 • 基因在染色体上的分布，基因的时空表达和调控 • 网络。

第01章-基因PPT课件

● 常见的上游启动子元件
3.增强子(enhancer）是一种较短的DNA序列，能够被反式作用因子识别与结合。与增强子元件结合后能够增强邻近基因转录。位于转录起始点上游－100～－300 bp处
4. 反应元件一类能介导基因对细胞外的某种信号产生反应的特异的DNA序列 ●特点具有较短的保守序列通常位于启动子附近、启动子内或增强子区域
第二节结构基因中贮存的遗传信息
一、 RNA的结构信息二、结构基因中贮存的蛋白质序列信息
●编码区一个特定蛋白质多肽链的序列信息，也称为开放阅读框（open reading frame，ORF）功能决定蛋白质分子的一级结构
RNA 聚合酶
转录因子
启动子类型
启动子构成
含有该类启动子的基因
I
TFI
I
核心元件，上游调控元件
rRNA
II
TFII
II
TATA盒（TATA box）、几个上游启动子元件和转录起始位点
5.poly(A)信号 II类基因除了调控转录起始的序列外，在结构基因的3‘端下游还有加尾信号。由AATAAA序列和GT丰富区，或T丰富区组成。作用: 终止mRNA转录和为其加上poly(A)尾
(三) 基因的基本结构特点 1.原核生物基因的基本结构 5′-启动子－结构基因－转录终止子-3 ′ ●操纵子（operon）功能上相关联的数个结构基因串联在一起，由一套转录调控序列控制其转录，构成的基因表达单位.
四、基因的结构特点
● 组成一个编码特定多肽链的DNA序列+与蛋白质编码无关的DNA序列(调控序列)
● 结构特点
1.原核生物结构基因的特点结构基因在DNA上是连续的 2.真核生物结构基因的特点结构基因在DNA上是不连续的（断裂基因）

微生物基因组学_PPT幻灯片

“双脱氧末端终止”的含义
Sanger 双脱氧末端终止法测序原理
自动化测序
荧光染料标记物的发明：使链终止法用于自动化测序，用不同的荧光色彩标记ddNTP，如ddATP标记红色荧光， ddCTP标记蓝色荧光，ddGTP标记黄色荧光， ddTTP标记绿色荧光。由于每种ddNTP带有各自特定的荧光颜色，而简化为由1个泳道同时判读4种碱基。
（四）影响测序的因素不管采用随机测序还是定向测序都可碰到下列影响因素。 1.计算机的设备。 2.靶DNA的性质。 3.完成测序所需的时间。 4.采用测序策略。
三．微生物基因组的注释（一）概念：在微生物基因测序的基础上，对其基本结构和部件进行认定，以进一步研究其功能。
（二）微生物基因组注释的内容 1.碱基组成分析，即G+C Mol%测定。 G+C含量是物种的一个重要特征，在微生物的分类上具有重要意义，是重要参数之一。 2．开放阅读框的鉴定： 3．编码序列分析
向测序法包括引物测序法和定向缺失测序法。 ⑴引物测序法即在第一次测序结果的基础上，设计新的寡核苷酸，来充当下一次测
序反应的引物，并依次类推，从而循序渐进获得靶DNA的全部序列。
⑵定向缺失法定向缺失法是将一个靶DNA变成若干套嵌套的缺失突变体，使靶序列中远
不可测的区段逐渐落入可用通用引物进行测序的方法。
黏粒载体（ cosmid ）
P1人工染色体载体（PAC）
目前常用的人造染色体载体
23
YAC载体应含有下列元件：
酵母染色体的端粒1 EcoRI CEN4
酵母染色体的着丝粒序列 Apr
pYAC
URA3
4
酵母系统的选择标记
ori
大肠杆菌的复制子标记

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

复制）和parA、 parB（控制拷贝数）等成分。
BAC的优点
1．易于用电击法转化E.coli（转化效率比转化酵母高10100倍）； 2．超螺旋环状载体，易于操作； 3． F‘质粒本身所带的基因控制了质粒的复制； 4．很少发生体内重排。
有人把人类染色体端粒DNA上单个α-卫星DNA单元多聚化形成1Mb左右的大片段并与人类基因组DNA 混合，产生了能被复制、能正常分裂并得到长期稳定保存的人工合成的染色体，长度约为6-10Mb，称为
(1)<1kb (2)<10kb (3)<22kb (4)<50kb (5)0.1-0.4Mb (6)0.5-2Mb
克隆扩增或表达 √√ √
举例 PBR322 PCDN3
PUC8 PBUDCE41 YE
(1)M13 (2)plasmid (3)λphage (4)casmid (5)BAC (6)YAC
3.BAC 细菌人工染色体。
YAC的主要缺点
1．存在高比例的嵌合体，即一个YAC克隆含有两个本来不相连的独立片段； 2．部分克隆子不稳定，在转代培养中可能会发生缺失或重排； 3．难与酵母染色体区分开，因为YAC与酵母染色体具有相似的结构。 4．操作时容易发生染色体机械切割。
以细菌寄主系统为基础的克隆载体形成嵌合体的频率较低，转化效率高，又易于分离。科学家用"染色体建造"法用F质粒及其调控基因构建细菌载体，克隆大片段DNA。该质粒主要包括oriS， repE（控制F质粒
殖的调控。
• 复制起点： DNA复制通常由起始蛋白与特定的DNA 序列相互作用开始。
载体的概念：
1.要把一个有用的基因（目的基因——研究或应用基因）通过基因工程手段送到生物细胞（受体细胞），需要运载工具（交通工具）携带外源基因进入受体细胞，这种运载工具就叫做载体（vector）。
2.凡来源于质粒或噬菌体的DNA分子，可以插入或克隆DNA片段统称为vector。
• 另外一种方法是对所有相互重叠的亚克隆进行测序，然后直接通过计算机程序根据其重叠部分进行“拼装”。
• 人工染色体含有三种必需成分：着丝粒、端粒和复制起点。
• 着丝粒(CEN)位于染色体中央，呈纽扣状结构，在有丝分裂时结合微管并调控染色体的运动，也是姐妹染色单体配对时的最后位点，接收细胞信号而使姐妹染色体分开。
• 端粒（TEL）：主要功能是防止染色体融合、降解、
确保其完整复制。端粒酶以其自身RNA为模板，在染色体端部添加上端粒重复序列，并参与端粒长度和细胞增
DNA序列片段组装（sequence assembly)，又称序列拼接）的任务就是根据这些序列片段，重建目标DNA序列。如果能够得到 DNA一条链的序列，那么根据互补原则，另一条链的序列也就得到了。
• DNA测序不能从染色体进行，首先必须克隆化，构建基因组的物理图谱。
• 先构建片段DNA克隆(以YAC或BAC为载体)，并把克隆依染色体排序，这就是“染色体的克隆图”。依片段DNA克隆在染色体上所在的位置排序，可以得到相互重叠的一系列克隆，叫做“克隆重叠群”(contig)。选取有关的克隆进行DNA测序，就可以“拼装”出整个染色体或基因组的DNA序列。如果克隆片段太大仍不便于直接测序，则需通过亚克隆，构建更小的片段。
内含子
20~30% 中度至高度重复序列
约60%
串联重复序列/ 成簇重复序列
约40% 分散重复序列
11.2 高通量DNA序列分析技术
在大规模DNA测序中，目标DNA分子的长度可达上百万个bp。现在还不能直接测定整个分子的序列，然而，可以得到待测序列的一系列序列片段。
序列片段是DNA双螺旋中的一条链的子序列（或子串）。这些序列片段覆盖待测序列，并且序列片段之间也存在着相互覆盖或者重叠。在一般情况下，对于一个特定的片段，我们不知道它是属于正向链还是属于反向链，也不知道该片段相对于起点的位置。另外，这样的序列片段中还可能隐含错误的信息。序列片段的长度范围300－1000 bp，而目标序列的长度范围是3100 万bp，总的片段数目可达上千个。
基因组学概述 PPT课件
11.1 人工染色体构建
1983年，美国的Dana-Farber癌症研究所和哈佛大学医学院的教授首次在Nature上发表文章，报道了构建 YAC（Yeast Artificial Chromosome）库的过程。1987年， Burke等人发现，仅仅带有ARS序列(autonomous replicating sequence) 的载体虽然能够被复制，但极易在有丝分裂时丢失。即使在选择培养基上，也只有5%20%的子代细胞带有ARS载体。加入Centromeres （CEN）能显著提高ARS质粒在有丝分裂时的稳定性， 90%以上子代细胞带有该载体。CEN还能显著降低拷贝数，从20-50/细胞降为1-2/细胞。（Science, 236:806812）。
3.基因工程所用的vector实际上是DNA分子，是用来携带目的基因片段进入受体细胞的DNA。
载体的分类
分类依据 1.按功能分成
类
别
（1）克隆载体（2）表达载体
2.按进入受体细胞类型分
3.按载体来源分 4.按克隆片段得大小（克隆能力）分
（1）原核载体（2）真核载体（3）穿梭载体
病毒载体＋
说明：
1.穿梭载体（sbuttle vector）指在两种宿主生物体内复制的载体分子，因而可以运载目的基因（穿梭往返两种生物之间，如：YEP,DIDB219
2.YAC Yeast Artificial Chromsome 由酵母基因和 PBR322质粒衍生物构成，对克隆大的真核基因十分有用，在HGP中发挥主要作用。
MAC或HAC。
人类基因组
核基因组(3200Mb)
约10% 基因和基因有关序列
约90% 基因外序列
线粒体基因组(16.6kb)
rRNA 基因
tR重复序列
<10%
>90%
70~80%
专一的或低拷贝数序列
Coding DNA Non-coding DNA
假基因
基因片段