3-基因组和基因

合集下载

基因与基因组的结构与功能讲课文档

基因与基因组的结构与功能讲课文档
DNA 与成熟RNA间的非对应区域 氨基酸的非编码区(uncoding region) 间隔区(spacer)
内含子存在意义:保证或增强基因的稳定表达;内含子中包含有其他 基因的编码序列(即基因内基因)。
GT-AG法则:真核生物基因内含子高度保守的一致序列:内含子5`端大 多数以GT开始,3`端大多数以AG结束,称为GT-AG法则。此法则 可用作真核基因中RNA剪接的识别信号。
基因与基因组的结构与功能
第一页,共75页。
3.1. 基因概念的变迁
3.2. 基因概念的多样性
3.3. 基因组
第二页,共75页。
3.1 基因概念的变迁
Theory of the gene (192实体
• 基因象链珠(bead)一样,孤立地呈 线状地排列在染色体上
OriC
0
4000K
大肠杆菌 1000K
C-Value: 4.6×106bp
3000K
2000K
TerC
大肠杆菌染色体DNA
第三十八页,共75页。
2. 结构基因大多组成操纵子
po z
y
at
promoter operator structural gene terminator
ß-galactosidase半乳糖苷酶 z ß-galactoside permease透酶 y
的结构基因的表达, 如:启动基因,操纵基因不转录 、不翻译
不是所有的基因都能为蛋白质编码
第七页,共75页。
✓ 基因命名无严格统一标准
1. 一般:三个小写英文斜体字母表示,lac、leu
2. 三个小写英文斜体字母后面加一个斜体大写字母表示
基因座, LacZ、 LacY、 LacA

基因和基因组(生物化学)

基因和基因组(生物化学)

GC盒(GC Box)
位于-35bp ,GGCGG,与转录因 子SP1结合,促进转录的过程。
-35
-35
+1
12
(2).增强子(enhancer)
与转录因子特异性结合,增强 转录活性,在基因任意位置都有效、 无方向性。
promoter
CAAT box TATA box 5′ exon intron
5′--------AAUAAA ------AAAAAAAA 3′ 多聚腺苷酸化 14
mRNA
真核生物基因的结构
调控序列
promoter
Enhancer
5′
CAAT box TATA box
结构基因
调控序列
Poly(A) 加尾信号 UTR
UTR
exon intron
exon intron
exon TGA Stop 3′
内含子的 5′端以GT开始, 3′端以AG结束。
AG GT AG
5′
GT
3′
intron1 intron2 exon3 exon1 exon2
6
(二) 转录调控序列
结构基因编码区两侧的一段不被翻译 的DNA片段(侧翼序列),参与转录调控。
侧翼序列
前导序列 5′
intron1 exon1 exon2
TATA盒(TATA Box): 位于-25~-30bp,TATAAAA/TATATAT 与TFII结合,启动基因转录。
-30
-25
+1
10
CAAT盒(CAAT Box)
位于-70~-80bp,GG C/ T CAATCT,
与CTF结合,决定启动子转录效率。
-80

(整理)第三章基因与基因组

(整理)第三章基因与基因组

第三章基因与基因组第一节基因概念的历史演变第二节DNA与基因第三节真核生物的割裂基因第四节基因大小第五节重叠基因第六节真核生物的基因组第七节真核生物DNA序列组织第八节细胞器基因组第九节基因鉴定第十节人类基因组计划第三章基因与基因组1 基因(gene)的概念基因是遗传的功能单位,DNA分子中不同排列顺序的DNA片段构成特定的功能单位;含有合成有功能的蛋白质多肽链或RNA所必需的全部核苷酸序列。

广义地说,基因是有功能的DNA片段。

第一节基因概念的历史演变2 基因概念的历史演变:(1)Mendel提出基因的存在(2)Morgan证实基因在染色体上(3)“一个基因一个酶”修正为“一个基因一个多肽链”“基因”一词的创立: 1909年,丹麦遗传学家约翰逊“基因”(gene)。

Gregor MendelThomas Hunt Morgan3 基因概念的理论基础3.1 一个基因一个酶1941年G W Beadle 和E L Tatum研究证实红色链孢霉各种突变体的异常代谢是一种酶的缺陷,产生这种酶缺陷的原因是单个基因的突变。

3.2 一个基因一条多肽链本世纪50年代,Yanofsky有些蛋白质不只由一种肽链组成,如血红蛋白和胰岛素,不同肽链由不同基因编码,因而又提出了“一个基因一条多肽链”的假设。

3.3 基因的化学本质是DNA(有时是RNA)1944年,O T Avery 证实了DNA是遗传物质。

有些病毒只含有RNA。

1953年沃森和克里克建立DNA分子的双螺旋结构模型。

3.4 基因顺反子(Cistron)的概念1955年,美国本兹尔(Benzer)提出顺反子的概念:是指编码一个蛋白质的全部组成所需信息的最短片段,即一个基因。

基因仅是一个功能单位,基因内部的碱基对才是重组单位和突变单位。

一对同源染色体上两突变(a和b)在同一染色体上时,称为顺式构型,在两个染色体上时,为反式构型;顺反互补测验(cis-trans test):比较顺式和反式构型个体的表型来判断两个突变是否发生在一个基因(顺反子)内的测验。

第三章--基因与基因组的结构PPT课件

第三章--基因与基因组的结构PPT课件

-
4
③近20年来,由于重组DNA技术的完善和应 用,人们已经改变了从表型到基因型的传统 研究基因的途径,而能够直接从克隆目的基 因出发,研究基因的功能及其与表型之间的 关系,使基因的研究进入了反向生物学阶段。
-
5
• 反向生物学:指利用重组DNA技术和离体 定向诱变的方法研究已知结构的基因相应的 功能,在体外使基因突变,再导入体内,检 测突变的遗传效应即表型的过程。
• 例如,对于大肠杆菌和其他细菌,用三个小写
字母表示一个操纵子,接着的大写字母表示不
同基因座,lac 操纵子的基因座:lacZ,lacY, lacA;其表达产物蛋白质则是lacZ,lacY,
lacA。
-
37
• 3.质粒和其他染色体外成分的命名 • 自然产生的质粒,用三个正体字母表示,第—
个字母大写,例如:ColEⅠ;
血破裂而使血红蛋白计数减少,造成贫血。
• 其本质是其血红蛋白的β-链与正常野生型
β-链之间的第6位氨基酸,由Val取代了 Glu所致。
-
32
• 这种贫血病是由基因突变造成的一种分子病,
除溶血后发生贫血外,还会堵塞血管形成栓塞, 从而伤及多种器官。
• 它的纯合子(通过单倍体形成的纯系双倍体)患
者在童年就夭折。
-
40
• 6.线虫基因的命名
• 用三个小写斜体字母表示突变表型,如存
在不止一个基因座,则在连字符后用数字
表示,如基因unc-86,ced-9;蛋白UNC-
86;CED-9。
-
41
• 7.植物基因的命名
• 多数用1~3个小写英文斜体字母表示。
-
42
• 8.脊椎动物基因的命名

3 基因组的结构与功能

3 基因组的结构与功能
➢ 松弛型质粒( relaxed plasmid) 即高拷贝质粒,每个细菌内的质粒数目可 达10-60个或更多。
目录
质粒对宿主的适应性
➢窄宿主谱质粒 仅能存在于一种或数种密切相关的宿主
➢广宿主谱质粒 可以在不同科、属、种的细菌之间传递
目录
➢ 卫星DNA 这类序列的碱基组成不同于基因组的其他部份, 可用等密度梯度离心法将其与主体DNA分开
➢反向重复序列(inverted repeats)
AGCTAGTACATGCATGCGTACTAGCT TCGATCATGTACGTACGCATGATCGA
➢总长度约占人基因组的5%。 ➢反向重复的单位长度约为300bp或略短。 ➢散在分布于基因组中
目录
➢ 假基因是由于在进化过程中,某些DNA片段发生 了缺失、倒位或点突变,导致调控基因丢失;或 无剪接加工信号;或编码区出现终止信号;或编 码无功能或不完整的基因。
➢ 与正常基因相比,缺少内含子,两侧有顺向重复 序列。
目录
四、线粒体DNA的结构
➢ 线粒体DNA(mitochondrial DNA, mtDNA) 属于真核细胞核外遗传物质,可独立编码存在 于线粒体中的多肽链、rRNA或tRNA。
① 大卫星DNA(macrosatellite DNA): ➢ 其重复单位为5~171 bp,主要分布于染色体 的着丝粒区。
② 小卫星DNA(minisatellite DNA): ➢ 其重复单位为15~70 bp,存在于常染色体。
③ 微卫星DNA(microsatellite DNA): ➢ 其重复单位为2~5 bp,存在于常染色体。
➢ mtDNA为双链环状DNA,其分子结构特点与 原核生物DNA相同。
目录
➢ 人类的mtDNA长16,569

基因和基因组及基因工程的概念

基因和基因组及基因工程的概念
1909年丹麦生物学家W.Johannsen为了强调“遗传因子”与生命的关系, 他根据希腊“给予生命”之义的词“gene”(基因)创造性地用“gene”这个术语来代替“遗传因子”。基因这个词当时被用来描述遗传性状,但对基因的物质概念还未能认识,只是遗传的一个符号。
圆形种子+皱形种子 杂交第一代(均为圆形) 回交 圆形豆 皱形豆 5474粒 1850粒 3 : 1
摩尔根果蝇杂交试验
有4对染色体,一对小粒状,2对V形,一对呈棒状XX或XY(性染色体) X1X2(红眼)+XWY(白眼) (野生型) (突变型) 杂交子一代(雌雄均为红眼) X1XW, X1Y , X2XW,X2Y X1X1,X1Y,XWX1,XWY,X2X1,X2Y,XWX2,XWY ¼为红眼雄性及白眼雄性
5、重复序列及重复基因
几乎所有的真核细胞(酵母除外)的基因组DNA中都具有重复序列(repeated sequence),它无转位移动能力,因此它区别于转位作用的IR(inverted repeat)。IR是指序列的重复性。但无基因序列的交叉重叠性,故不同于重叠基因序列。重复序列可分为四种类型: 不重复序列,是唯一的序列,只有一个拷贝。 低度重复序列,一般有1-10个拷贝。 中度重复序列,有数十至数万(105)拷贝。如图2-9、2-10 高度重复序列 拷贝数可达106以上,包括卫星DNA、高丰度SINE家族的Alu序列 。
第二章 基因和基因组及基因工程的概念
添加标题
第一节 基因的概念
01
添加标题
第二节 基因组
02
添加标题
第三节 基因工程的定义和研究内容
03
添加标题
第四节 基因工程的发展史
04
第一节 基因的概念
01.

3 基因组和基因

3 基因组和基因
将内含子算上,哺乳动物的一个基因长约5-8Kb, 少数10Kb,则哺乳动物应有40-60万个基因。 目前研究表明,实际基因数估计不会超过这个数 值的10%(3-4万)。 有些基因的序列不编码蛋白质,则基因组中只含 有1%-2%的DNA序列用于编码蛋白质。 余下那么多DNA序列具何功能? 难道不被表达的DNA序列都是调控基因吗? 目前还无法圆满解释。
C值矛盾表现在:
1、结构、功能相似的同一类生物中,甚至亲 缘关系十分接近的物种之间,它们的C值可 相差10倍乃至上千倍。 如: 豌豆的C值为14pg,而蚕豆只有2pg。 两栖类C值的变动范围很大,为109-1011bp。
被子植物间C值相差1000倍 原生动物间C值相差5800倍 鱼类间C值相差350倍 节肢动物间C值相差250倍
E.coli基因组DNA
大肠杆菌基因组的特点
功能上相关的基因串联在一起组成操纵子结构, 由一个启动子转录调控。 E.coli有260多个基因具有操纵子结构。 E.coli的 lac操纵子、 Trp操纵子和His操纵子分别 有3个、5个和9个相关酶蛋白串联在一起。
大肠杆菌基因组的特点
E.coli 基因组中,几乎所有的基因都是 单拷贝的。 基因组中几乎全都是由结构基因组成, 很少有非必需的DNA。
Why is cDNA shorter than the original eukaryotic DNA?
典型的原核和真核生物基因结构
一、概念
核苷酸序列中插入与氨基酸编码无关的 DNA间隔区,使一个基因分隔成不连续的 若干区段,这种不编码的间断基因称为不 连续基因。 编码的序列称为外显子( exon ),不编码 的序列称为内含子(intron)。
7 、 有 细 胞 器 基 因 组 , 如 chl DNA , mit DNA,其密码子有特异性。

4、基因与基因组

4、基因与基因组

碱基(1977年 Sanger测定)。
非编码区DNA占基因组的4%。
有重叠基因。
B在A基因内,E在D基因内; K和C部分重叠; D的最后一个碱基是J的第一个碱基。
重叠基因(overlapping gene):不同基因的核苷酸 (DNA)序列彼此重叠,这两个基因互为重叠基因。
噬菌体的基因组
Johannsen )根据希腊文“给予生命”之义创造而产生, 并用这个术语来代替孟德尔的“遗传因子”。
1925年美国著名的遗传学家摩尔根(Thomas Hunt
Morgan )创立了基因学说。他指出:种质必须由某种 独立的要素组成,这些要素我们叫做遗传因子或基因。
1941年美国的比德尔(G.W. Beadle )和塔特姆
(E.L.Tayum)提出“一个基因一个酶”(one geneone enzyme hypothesis)学说。
1957年美国的本柔(Seymour Benzer)将“一个
基因一个酶”学说发展为“一个基因一条多肽链” (one gene-one polypeptide chain)的概念。同时 把遗传单位称为“顺反子”(cistron),与基因同义。
• 经典遗传学的认知路线为由表及里,即通过杂交等手段 观察表型性状的变化而推知遗传基因的存在与变化。 • 随着分子遗传学及相关实验技术的发展,现已经能够在 分子水平上进行操作,有目的地对DNA进行重组或者定 点突变(in vitro site-directed mutagenesis)等。因此, 现代遗传学中就出现了另一条由里及表的认知路线,即 通过DNA重组等技术有目的地、精确定位地改造改造基 因的精细结构以确定这些变化对表型性状的直接影响。 • 由于这一认知路线与经典遗传学刚好相反,故将这个新 的领域作为遗传学的一个分支学科,称为反向遗传学。

3 基因组作图

3 基因组作图

sc-cv 的重组值:17.3
sc 7.6
一、 遗传图谱(genetic map)
3、遗传作图的方法 之
家系连锁分析
遗传标记系谱连锁分析图
“1”片段与疾病基因连锁
一、 遗传图谱(genetic map)
3、遗传作图的方法 之
非减数分裂分析
一、 遗传图谱(genetic map)
3、遗传作图的方法 之
二、 物理图谱(physical map)
1、物理图作图方法
例一
一线状DNA分子经两种限制酶完全酶切后得如下结果: EcoRI HindIII 3kb、7kb , EcoRI/HindIII 1、2、7kb 2kb 、8kb,将各限制酶位点绘制在DNA分子上。
之 限制性酶切作图
一线状DNA分子经两种限制酶完全酶切后得如下结果: EcoRI HindIII 分子上。 5kb , EcoRI/HindIII 1、2、3、4kb 1kb、3kb 、6kb,将各限制酶位点绘制在DNA
phc79phc796400bp6400bptcfragmentfragmentcoscosorioriappstipstibamhibamhisalisali黏粒cosmid物理图谱physicalmap片段装载范围为3145kb片段装载范围为3145kb13基因组限制性酶切作图的技术路线质粒plasmid物理图谱physicalmap分子量小拷贝数高操作方便片段装载范围数百bp到10kb片段装载范围数百bp到10kb13基因组限制性酶切作图的技术路线多克隆位点oriori复制起始点筛选标记物理图谱physicalmap重叠群的构建染色体步移13基因组限制性酶切作图的技术路线物理图谱physicalmap重叠群的构建克隆指纹排序一个克隆的指纹表示该克隆所具有的序列特征可以同其他克隆产生的同类指纹相比较

分子生物学:基因、基因组与基因组学

分子生物学:基因、基因组与基因组学

mRNA
cDNA 酶切
(不能被酶切)
DNA 酶切
DNA中有的序列在mRNA中丢失, 且丢失部分不响基因 功能, 酶切位点在内含子中。
(exon-intron-exon)n structure of various genes
histone
total = 400 bp; exon = 400 bp
操纵子(operon) 是指数个功能相关的结构基因串联在一起,构成信息区, 连同其上游的调控区(包括启动和操纵区)及其下游的转录终止信号构成的 基因表达单位。 4.结构基因无重叠现象,基因组中任何一段DNA不会用于编码2种蛋白质。 5.基因序列是连续的,无内含子结构。
6.编码区和非编码区(主要是调控序列)在基因组中约各占50%。(5%, 95%)
The size of the human genome is ~ 3 X 109 bp; almost all of its complexity is in single-copy DNA.
bony afimshphibians
reptiles
birds
The human genome is thought
2.4.1 原核生物基因组结构与功能的特点
1.基因组通常仅由一条环状双链DNA分子组成。 其DNA是与蛋白质结合,但并不形成染色体结构,只是习惯上将之称为染色 体。细菌染色体DNA在胞内形成一个致密区域,即类核(nucleoid),类核 无核膜将之与胞浆分开。 2.基因组中只有1个复制起点。 3.具有操纵子结构。
7.基因组中的重复序列很少。编码蛋白质结构基因多为单拷贝,但编码 rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装。(15AA/秒, 2AA/秒)

第三章基因与基因组的结构

第三章基因与基因组的结构
线粒体基因组至少包含以下基因或基因 簇:rRNA基因、tRNA基因、ATPase基因、 细胞色素COXase基因。线粒体是个半自主 性的细胞器。其自身基因组只能编码部分 所需产物,许多重要物质的产生需由核基 因组与线粒体基因组共同互作。
叶绿体基因组
叶绿体也属于半自主性的细 胞器,同mtDNA类似,叶绿体 DNA也以双链环状分子的形式 存在于细胞质中。
一般而言,一个顺反子就是一个基因, 大约1500个核苷酸。
它是由一群突变单位和重组单位组成 的线形结构(因为任何一个基因都是突变 体或重组体)。
基因是DNA分子上的功能单位,在染 色体或DNA分子上,基因成串排列,它既 是遗传的功能单位,同时也是交换单位 和突变单位。
但并非所有的DNA序列都是基因,只 有某些特定的多核苷酸区段才是基因的 编码区。
染色体上存在大量无转录活 性的重复DNA序列,主要有两 种形式:
➢ 串联重复的DNA,如卫星DNA,
成簇存在于染色体的特定区域;
➢ 分散重复的DNA,分散在染色体 的各个位点。
卫星DNA
有些高度重复的DNA序列 的碱基组成和浮力密度与主体 DNA不同,在CsCl密度梯度离 心时,可形成相对独立于主 DNA带的卫星带。
例如rRNA和某些tRNA基因以及重 复程度更高的卫星DNA等。
不同生物中 非重复基因占基 因组的比例差别 很大。原核生物 含有完全不重复 的DNA,低等真 核生物的大部分 DNA是非重复的, 高等真核生物中 非重复基因所占 基因组的比例更 低。
从不同种类的原核生物的Cot曲线可以看出, 各种原核生物的Cot曲线形状都很相似,跨度一 般只有两个数量级,只是Cot1/2值不同。表明各
➢ 单拷贝序列
➢ 轻度重复序列

分子生物学--基因与基因组课件

分子生物学--基因与基因组课件

2、物理图ቤተ መጻሕፍቲ ባይዱ:
以特异DNA序列为界标所展示的染色体图,它能反映生物 基因组中基因或标记间的实际距离,图上界标之间的距离是以 物理长度即核苷酸对数如bp、kb、Mb等来表示的。这些特 定的DNA序列可以是多态的,如RFLPs,但主要是非多态的如 STS、STR、EST和特定的基因序列等。
作图的基本方法:
1、家系分析定位
通过分析、统计家系中有关性状的连锁 情况和重组率而进行基因定位的方法。
有用的遗传标记: 取材方便 按孟德尔方式遗传 多态性标记位点
多态性:在一个群体中,某遗传特性存在若干种类型。

系性
分连

锁 分
定析

外祖父法
深绿代表红绿色盲患者,浅绿代表红 绿色盲基因携带者,黄色代表正常
家常
细胞融合技术

鼠细胞
人细胞






含全套鼠染色体 , 人 1号染色体,肽酶C
3、核酸分子杂交定位
• 应用已知的核酸探针与待定位的DNA序列进行杂交 对基因进行定位的方法 •具有互补序列两条单链核酸分子在一定条件下 按碱基互补配对原则退火形成双链的过程。 • 杂交的双方是待定位的核酸和已知核酸序列,已知 核酸序列称探针。
5’、、、AGCCGACTATGTCGAAGCTT、、、、、、 GCTTGACTATAAGACA、、、3’
3‘、、、TCGGCTGATACAGCTTCTAA、、、、、、 CGAACTGATATTCTGT、、、5‘
转录调控区
贮存RNA或蛋白质结构信息区 转录终止区
原核基因的结构特点
真核基因的结构特点
(二)基因作图的方法:
1、遗传图谱:

分子生物学课件 第3章 基因与基因组

分子生物学课件 第3章 基因与基因组
最初基因组被定义为一个单倍体细胞中的全套染色体,现 代分子生物学和遗传学则将基因组定义为一个生物体中的 所有遗传信息,由DNA或者RNA编码,包括所有的基因和 非编码序列。
实际应用中“基因组”这个词既可以特指储存在细胞核中 的整套DNA(即核基因组),也可以指储存在细胞器中的 整套DNA(即线粒体基因组或叶绿体基因组),还可以指 一些非染色体的遗传元件,如病毒基因组、质粒基因组和 转座元件等。
不同基因家族各成员之间的序列 相似度也不同:
序列高度相似:经典的基因家族,如rRNA基因家族和组蛋 白基因家族。 保守性较低,但是编码产物具有大段的高度保守的氨基酸 序列。
序列保守性很低,编码产物之间也只有很短的保守氨基酸 序列,但通常由于具有保守的结构和功能区域,因而编码产 物具有相似的功能。
基因家族的成员在染色体上 的分布形式不同:
成簇存在的基因家族(clustered gene family)或称基因簇 (gene cluster),如人类类α链基因簇和类β链基因簇。 散布的基因家族(interspersed gene family),如肌动蛋白 基因家族和微管蛋白基因家族。
基因间隔区较短且内含子较少,基因排列紧密。
3.2.7 沉默基因
沉默基因( Silent Gene)也叫隐蔽基因(Cryptic gene), 是处于不表达状态的基因。它可能是假基因,也可能是被关闭的 基因。这些基因以隐性的方式埋藏在染色体中,但遇到特殊因子 的刺激,有可能解除关闭变成显性基因。
3.2.8 RNA基因
tRNA、rRNA; 核仁小分子RNA(small nucleolar RNA, snoRNA) 微小分子RNA(microRNA, miRNA); 小分子干扰RNA(small interfering RNA, siRNA); 核内小分子RNA(small nuclear RNA, snRNA);

3第三章 基因与基因组的结构和功能

3第三章 基因与基因组的结构和功能

(七)基因常常成簇排列,没有间隔序列或间隔序列很小。功 能相关蛋白质基因在基因组的1个或几个特定部位,丛集成 簇被转录成多顺反子,然后加工成各种蛋白质的mRNA模板。 如腺病毒晚期基因。 (八)不规则的结构基因 1.几个结构基因的编码区不规则,因此有些结构基因无翻译 起始序列。 2.有的mRNA(=gene)没有5’帽子,但有翻译增强子。 (九)DNA或RNA 1种病毒基因组只是1种核酸。
(三)连续的和不连续的基因 病毒基因结构特征往往与其 宿主细胞基因结构相似。 原核病毒(如噬菌体)基因是连续的,没有内含子; 真核病毒(如多瘤病毒)基因是不连续的,有内含子。 有意思的是,有些真核病毒的内含子或其中的一部分对 某一基因来说是内含子,对另一基因却是外显子。 如SV40和多瘤病毒的早期区域就是这样的。 除了(+)RNA病毒外,真核病毒基因都是先转成mRNA前 体,再经过剪接等步骤能成为成熟的mRNA.
存在重叠基因 Sanger在x174噬菌体DNA的全部序列后发现了重 叠基因现象。发现其中的9个基因是重叠的。 a) 一个基因完全在另一个基因里面,如基因B 在基因A里面,基因E在基因D内。 b)部分重叠,基因K和基因C部分重叠 c)两个基因只有一个碱基对的重叠,如D基因的 终止密码子的最后一个碱基是J基因起始密码子 的第一个碱基。 基因之间的间隔区很小
腺病毒基因组
腺病毒是一种无外壳的双链DNA病毒,基因组长约 36kb, 由于每条DNA链的5’-端同相对分子质量为55X103Da 的蛋白质分子共价结合,可以出现双链DNA的环状结 构。人体腺病毒已知有33种,分别命名为adl~ad33 人类腺病毒基因组包括早期基因E1A、E1B、E2A、 E2B、E3和E4 以及晚期基因L1、L2、L3、L4和L5 早期基因在病毒感染后的复制前开始转录。 腺病毒DNA可以整合到感染细胞或转化的细胞DNA 中,在腺病毒感染许可性的人类细胞时,病毒DNA与 宿主细胞DNA也可以发生重组。

分子生物学课件第三章 基因与基因组的结构

分子生物学课件第三章 基因与基因组的结构

基因(gene) 1 基因(gene)
1.1 基因概念的发展
1866年G.J.Mendel提出 遗传因子”概念,但未将“基因” 提出“ ⑴ 1866年G.J.Mendel提出“遗传因子”概念,但未将“基因” DNA联系起来 联系起来。 遗传因子”只是一个假设的遗传单位。 与DNA联系起来。“遗传因子”只是一个假设的遗传单位。 1909年W.L.Johannson(丹麦 首创‘gene’一词 提出“ 丹麦) 一词, ⑵ 1909年W.L.Johannson(丹麦)首创‘gene 一词,提出“基 因型” 表现型” 因型”和“表现型”。“ A”、"B 代表显性。“ a”、"b ” 代 、"B” 代表显性。 、 表隐性。这些符号沿用至今。 表隐性。这些符号沿用至今。 1910年T.H.Morgen提出 基因”代表一个有机的化学实体。 提出“ ⑶ 1910年T.H.Morgen提出“基因”代表一个有机的化学实体。 40~50年代 DNA是遗传物质确成定论后 确立了“基因” 年代, 是遗传物质确成定论后, ⑷ 40~50年代,DNA是遗传物质确成定论后,确立了“基因” 是具有一定遗传效应的DNA片段的概念。 DNA片段的概念 是具有一定遗传效应的DNA片段的概念。 1955年Benzer提出顺反子 cistron)概念 提出顺反子( 概念。 ⑸ 1955年Benzer提出顺反子(cistron)概念。目前已从功能单 位的意义上把顺反子和基因统一起来。 位的意义上把顺反子和基因统一起来。一个顺反子可包含多个 突变子(muton)和重组子(recon)。 和重组子(recon) 突变子(muton)和重组子(recon)。
基因与基因组
gene and genome
引 言
基因的分子结构和组织对基因的表达有重要 的影响。 的影响。 基因的分子结构在原核生物中已搞的十分清 但在真核生物中还缺少完整的例子。 楚。但在真核生物中还缺少完整的例子。近几 年来各种生物基因组计划的开展, 年来各种生物基因组计划的开展,特别是最近 发展起来的生物信息学, 发展起来的生物信息学,为深入研究基因的分 子结构和组织奠定了基础。 子结构和组织奠定了基础。

基因与基因组3

基因与基因组3
SNP:是由于单个核苷酸改变而导致的核酸序列多态。
人类99.9%的基因密码是相同的, 而差异不到0.1%,不同人群仅有 140万个核苷酸差异。这些差异是由 “单一核苷酸多样性”(SNP)产 生的,它构成了不同个体的遗传基 础。在整个基因组序列中,人与人 之间的变异仅为万分之一,从而说 明人类不同“种属”之间并没有本 质上的区别。
重组DNA
❖ 构建 ❖ 转化 ❖ 扩增(克隆) ❖ 分离和检测
foreign DNA
restriction endonuclease
ligase
bacterial cell vector
重组DNA技术流程简图
host
限制性内切核酸酶
限制酶:能够识别DNA链的特定部位 并能进行切割。
❖ TypeⅠ
C C 3’ G G 5’
5’
G A T C 3’
3’ C T A G
5’
5’ G G A T C C 3’ 3’ C C T A G G 5’
5’ C T G C A G 3’ 3’ G A C G T C 5’
重组DNA
重 组 DNA 技 术 ( recombination DNA technique ) 指 将 目 的 DNA 片 段 或 人 工 合 成 的 基因,通过载体在体外重组、转移并插入到另 一种生物的基因组中,使其表达为新的性状或 用于进一步的研究,是基因操作的核心技术。 包括DNA克隆(DNA cloning)和分子杂交 (molecular hybridization)。
二、人类基因组计划的进展状况
(1)截至 1998 年 10 月,完成 1.8 × 108bp, 占计划的 6%。 (2)完成一系列模式生物全基因组测定。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节 基因的概念、演变与发展
分离规律 自由组合规律 基因在染色体上 等位基因 连锁与互换 一个基因一个酶 顺反子假说
第二节 基因概念的多样性 ——重叠基因
(Overlapping genes)
原核生物的重叠基因 (Overlapping genes)
概念: 指一个基因的序列中,含有另一基因的 部分或全部序列。基因重叠现象是英国 分子生物学家Sanger 1977年在测定噬菌 体ΦX174的DNA序列是发现的。
1、概念 一个基因组中只存在一个拷贝
2、含量 单拷贝序列占整个基因组的40%-60% 人:60-65%; 牛:55%; 小鼠:70%; 果蝇:79%
非重复序列
3、长度和类型 ❖750-2000bp,相当于一个结构基因的长
度。 ❖大多数蛋白质结构基因属于单拷贝序列,
如蛋清蛋白、蚕的丝心蛋白、血红蛋白 和珠蛋白都是单拷贝序列。
H1 H3 H4 H2A H2B 果蝇
H1
H3 H2B H2A
H4
蝾螈
图例:
图 10-31 组蛋白基因簇的重复单位
基因;
间隔区;
转录方向
间隔序列??内含子??
6000bp 6540bp 7240bp 4800bp
9000bp
果蝇、非洲爪蟾、大鼠tRNA基因
3、发育调控的复杂多基因家族
在不同组织、细胞类型、时间表达的复杂多 基因家族。 珠蛋白和免疫球蛋白基因,属于不同时态表 达的复杂多基因家族。
3、含量 占总DNA的10%-40% 小鼠:20%;果蝇:15%
中度重复序列
4、类型 i、短周期分散的重复序列:长100-300bp,
如人、爪蟾、海胆的Alu序列。
ii、长周期分散的重复序列:长5000bp, 如Kpn I家族。
Alu家族重复序列
1、含量
Alu家族序列占人基因组DNA总量的5%-6%
非重复序列
4、作用 ❖ 放大作用,单一拷贝序列通过基因扩增
可合成大量蛋白质。 ❖ 一个蚕丝心蛋白基因作为模板合成104
个丝心蛋白mRNA,每个mRNA可合成 105个丝心蛋白,因此,一个单拷贝蚕丝 心蛋白基因就可合成109个丝心蛋白分子。
二、轻度重复序列
1、概念 一个基因组中含有2-10个拷贝。
不存在内含子的基因 少数真核生物并不存在内含子,如编码 干扰素、组蛋白的基因和大多数酿酒酵 母的基因。
第五节 基因概念的多样性 ——跳跃基因
第六节 基因家族
一、概念 二、分类
一、概念
真核生物基因组中有许多来源相同、结 构相似、功能相关的一系列基因,成串 地排列在一起。这样一组基因称为基因 家族(gene family)。
7 introns 8 exons
3、S1核酸酶制图法(Berk-sharp制图法)
步骤: 变性的基因组DNA同mRNA杂交,形成 异源双链DNA-RNA杂种分子。 用S1核酸酶处理,除去没有杂交的单链 的间隔子序列。 用琼脂糖凝胶电泳检测。
Berk-sharp制图法
exon 1 intron exon 2
海胆 果蝇 烟草
450copies 100 copies 750 copies
各种真核生物rDNA重复单元的排列
5S rRNA基因的重复单元
5S rRNA由保守的120bp组成,单独成为复制单拷贝的5S rRNA基因,非洲爪蟾约 有2万个5S基因拷贝,人类有2000个拷贝。
Ori
stop1
97%
mRNA1
CP
mRNA1
stop2
DNA
3%
IP
5387 bp 11 genes 3 mRNA 9 peptides
重叠基因有以下几种情况:
一个基因完全在另一个基因里面。 如基因B在基因A里面,基因E在基因D里面。
部分重叠,如K和C、A和C。 两个基因只有一个碱基对的重叠,如D和J。 三重重叠,如G4噬菌体的基因A、B和K。
组蛋白基因家族
组蛋白有H1、H2A、H2B、H3、H4共5种基因。 这5种基因串联在一起形成一个重复单元。
5种基因的排列顺序、转录方向和基因间隔区因 生物种类不同而不同。
H1
H4
H2B
H3
H2A
组蛋白基因家族
各种生物的组蛋白基因家族的重复单元
海胆(R)
H1 H4 H2B H3 H2A
海胆(S)
海胆(L)
小鼠淀粉酶基因在两种组织内利用两 种启动子进行转录
S
L
2
3
唾液腺转录产物
转录
肝脏转录产物
剪接 S23
L23
大鼠肌肉的肌钙蛋白T
α型:W、X、Z、 α β型:W、X、Z、 β
两个或多个polyA位点
大鼠降钙素基因 IgM、D、E、G的H链基因 果蝇肌球蛋白碱性L链基因 牛前激肽原基因
五、内含子的可能功能
部分重叠
A和C的部分重叠 A的终止密码 -ATGAC的起始密码
D和J部分重叠 D的终止密码 -TAATGJ的起始密码
第三节 基因概念的多样性 ——重复基因
真核生物DNA序列的类型
非重复序列(单一序列、单拷贝序列) 轻度重复序列 中度重复序列 高度重复序列
一、非重复序列(unique sequence)
1、概念 一个基因组含有大于105个拷贝,分布于着 丝点, 端粒区, 结构基因两侧。
2、含量 占总DNA的10%-60%,高等真核生物中占 20%,由6-10bp组成。
3、种类 卫星DNA、小卫星DNA、微卫星DNA
卫星DNA(satellite DNA)
DNA的浮力密度决定于它的G﹢C含量,G﹢C含 量越高,浮力密度越大。 ρ = 1.660 + 0.00098(G + C)% g/cm3 在高度重复序列中,常有一些AT含量很高的简单 重复序列,AT含量有时高达97%(如螃蟹DNA 中的卫星DNA)。 在CsCl密度梯度离心时,易与其它DNA分开,形 成两个以上的峰,即含量较多的主峰和高度重复 序列的小峰。 小峰在主峰旁似卫星,称为卫星DNA。
二、分类
1、简单多基因家族 2、复杂多基因家族 3、发育调控的复杂多基因家族
1、简单多基因家族
家族中只有一个或数个基因以串联方式 重复排列,如rRNA基因。
NTS
rDNA gene family
NTS
NTS
NTS
TS 18s
TS 5.8s TS 28s TS
T图 S: 1TN0可 .ST2转 :S9可:录 非 不转的 洲 转间 录爪 录隔 蟾 的的(rs间Rp间Na隔Ac隔e基 序r序)因 顺 列列的 序串联重复排列 NTS:不可转录的间隔顺序
ζ ψ ζ ψ α ψ α α 2 α 1 θ
ε Gγ Aγ ψ β δβ
图 10-30人 类 血 红 蛋 白 的 α 和 β 基 因 簇
珠蛋白基因家族
血红蛋白分子是珠蛋白的四聚体,由2个α型 亚基和2个β型亚基组成,即α2 β2。
α家族包括1个活性的ξ基因、1个ψξ假基因、2 个α基因和2个ψα假基因,集中在28kbp的区 域内。
β家族包括ε、2个γ、δ和β基因,以及1 假基因,分布在50kbp的区域内。
个ψβ1
ζ ψ ζ ψ α ψ α α 2 α 1 θ
ε Gγ Aγ ψ β δβ
图 10-30人 类 血 红 蛋 白 的 α 和 β 基 因 簇
检测方法
1、蛋白质序列或mRNA序列与DNA序列相 比较。
2、电镜法——mRNA与DNA杂交法 将成熟mRNA分子与相应DNA进行杂交, 形成DNA-RNA异源杂交双链分子,在电 镜下观察到形成的R-环结构。
断裂基因的发现与证实
Ovalbumin DNA X cDNA
Electro-microscope
❖ GT-AG法则
外显子和内含子之间的关系
2、一个基因的内含子可 以是另一基因的外显子
不 同 的 外 显 子 连 接 方 式
产生多种mRNA的情况
利用多个5'端转录起始位点 多个3'端加polyA位点 利用不同的内含子剪接方式 以上3种情况的不同综合
小鼠淀粉酶基因
小鼠淀粉酶基因有两个启动区,一个在肝 脏中使用,另一个在腮腺中使用。 肝脏和腮腺的mRNA从不同的外显子开始 合成,具有不同的5'端。
第四节 基因概念的多样性 ——间隔基因
Splitting gene Interrupted gene
Why is cDNA shorter than the original eukaryotic DNA?
典型的原核和真核生物基因结构
RNA剪接
不连续基因的发现和检测方法
1977 年 , Sharp 和 Roberts 等 人 研 究 腺 病 毒mRNA时首次发现不连续基因。很快 在SV40中也发现了不连续基因。 1993 年 Sharp 和 Roberts 获 诺 贝 尔 生 物 医 学奖。 所有的哺乳动物、脊椎动物、高等植物 及简单的真核生物、甚至少数原核生物 都含有不连续基因。
内容
第一节 基因的概念、演变与发展 第二节 基因概念的多样性——重叠基因 第三节 基因概念的多样性——重复基因 第四节 基因概念的多样性——间隔基因 第五节 基因概念的多样性——跳跃基因 第六节 基因家族 第七节 基因组与C值矛盾 第八节 原核生物基因组 第九节 真核生物基因组 第十节 人类基因组计划
内含子1
内含子2
α-珠蛋白基因
β-珠蛋白基因
不连续基因的数目和大小
2、不同来源的内含子的分子大小相差悬殊 ❖SV40基因内含子长31bp ❖人的营养不良蛋白基因内含子长210kbp。
不连续基因的数目和大小
3、内含子的长度一般比外显子长 卵清蛋白基因总长7700bp,而mRNA只有 1859bp,内含子总长为5841bp。 二氢叶酸还原酶(DHFR)基因总长31kb, 而mRNA只有2kb,而内含子长为29kb。
相关文档
最新文档