基因组基本概念
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 基因组基本概念
本章主要内容
基因 基因组 转录组和蛋白质组
第一部分 基因
一、基因的含义与结构
所有生命都具有指令其生长发育、维持其结构 与功能所必需的遗传信息,生物中携带遗传信 息的遗传物质的总和称为基因组。
大部分生物的基因组都是由DNA组成,少数病 毒为RNA。
基因的含义
分子角度:基因的基本含义是指编码蛋白质或RNA分子遗传 信息的基本遗传单位。
编码蛋白基因包括结构基 因和调控基因。
化学角度:基因是一段具有特定功能和结构的连续脱氧核糖 核苷酸序列,是构成染色体的重要组成部分,是 染色体上的遗传功能单位。
基因的物质基础-----核酸
核酸:
脱氧核糖核酸(DNA) 核糖核酸(RNA)
DNA
腺嘌呤 (A) 鸟嘌呤 (G) 胞嘧啶 (C)
RNA
胸腺嘧啶 (T)
尿嘧啶 (U)
DNA的双螺旋结构
James Watson & Francis Crick
Erwin Chargaff (1905-1995)Chargaff ’s rule:A%=T%
G%=C%
DNA 分子X
射线衍射照片
Rosalind Franklin
RNA的化学与生物化学
RNA的功能:主要是传递遗传信息,参与基因的表达调控。
RNA与DNA的差异:
1)连接在核糖2碳原子上的基团是羟基非氢原子。
2)DNA中胸腺嘧啶T的位置由尿嘧啶U代替。
RNA的种类和功能
转运RNA(tRNA):转运氨基酸
信使RNA(mRNA):蛋白质合成的模板
核糖体RNA(rRNA):核蛋白体组成成分
不均一核RNA(hnRNA):成熟mRNA的前体
小核RNA(snRNA):参与hnRNA的剪接、转运
小核仁RNA(snoRNA):rRNA的加工和修饰
小胞质RNA(scRNA/7SL-RNA):蛋白质内质网定位合成的信号识别体的组成成分
1. 帽子结构:转录后加工中,在5′-端加上7甲基三磷酸鸟苷,并在第二位核苷酸的C2′上甲基化(m7GpppNm)。
真核生物mRNA 5'端帽子结构的重要性在于它是mRNA 做为翻译起始的必要的结构,对核糖体对mRNA的识别提供了信号,这种帽子结构还可能增加mRNA的稳定性,保护mRNA 免遭5'外切核酸酶的攻击。
2.多聚A尾:真核生物mRNA的3 ′-端转录后加上一段长短不一的多聚腺苷酸(poly A)尾巴,约十几个到一百几十个长。
帽结构与多聚A尾的功能:mRNA由胞核向胞质的转运;翻译起始的调控;mRNA稳定性的维系。
二、基因的结构
真核生物:其基因都以单顺反子的形式存在,它们编码的都是单基因产物;
原核生物:基因往往以多顺反子的形式存在,它所转录的是一种大分子量的mRNA,可同时编码两种或多种基因产物。
原核生物
真核生物
基因的一般结构
基因的特殊结构
(一)重叠基因
是指多个基因共用一段核苷酸的
现象。
该DNA序列能够编码两种
甚至三种蛋白质分子;而真核基
因组及细菌的基因组没有这种结
构。
借助于启始子和终止密码
子,可以最经济利用现有资源。
噬菌体φX174的重叠基因
(二)断裂基因
基因的编码序列在DNA分子上是不连续的,为非编码序列所隔开,其中编码的序列称为外显子(Exon),非编码序列称内含子(Intron)。
外显子:真核细胞基因DNA中的编码序列,这些序列被转录成RNA并进而翻译为蛋白质。
内含子:真核细胞基因DNA中的间插序列,这些序列被转录成RNA,但随即被剪除而不翻译。
1、外显子与内含子的连接区
概念:指外显子和内含子的交界或称边界序列。
特征:
Ê内含子的两端序列之间没有广泛同源性;
Ê连接区序列很短,高度保守,是RNA剪接的信号序列,一般是5'GT—AG 3’。
2、外显子与内含子的可变调控
z组成型剪接:一个基因的转录产物通过剪接只能产生一种成熟的mRNA。
z选择性剪接:同一基因的转录产物由于不同的剪接方式形成不同mRNA。
P S外显子S P L外显子L外显子2 外显子3
D N A
50b 2800bp 161bp 4500bp 205bp 327bp 初始转录本:
在唾腺中转录
成熟m R N A:
1663nt 初始转录本:
在肝中转录
成熟m R N A:
1773nt 图18-57 小鼠淀粉酶(am y) 基因利用不同启动子产生两个不同的m R N A
(三)基因家族
真核生物的基因组中有很多来源相同、结构相似、功能相关的基因,将这些基因称为基因家族。
如:编码组蛋白、免疫球蛋白和血红蛋白的基因都属于基因家族。
同一家族中的成员有时紧密地排列在一起,成为一个基因簇(gene cluster)。
The eukaryotic ribosomal DNA repeating unit
Organization of histone genes in the animal genome
(四)假基因
概念:假基因(pseudogene)是指核苷酸序列与编码某一蛋白质的基因相似,但不具功能,不能转录形成成熟mRNA或不能翻译出功能蛋白质。
产生原因:编码顺序出现终止密码子突变;或者插入和缺失某些核苷酸使mRNA移码,造成翻译中途停止或异常延伸。
第一部分基因组
基因组(genome):一个物种单倍体的染色体的数目及其所携带的全部基因称为该物种的基因组(genome)。
基因组包含了指令生物生长与发育、维持其结构与功能所必需的全部遗传信息。
一、原核与真核生物基因组的比较
1、基因组的结构与形式
真核生物基因组远大于原核生物的基因组,多是线性双链DNA分子,与蛋白质结合构成染色体,位于细胞核中,除配子细胞外,体细胞内的基因组是双份的(即双倍体,diploid),即有两份同源的基因组;原核生物基因组较小,没有核膜包裹,且形式多样。
2、基因组的构成
真核生物基因占整个基因组的比例很小,基因组中非编码序列远远多于编码序列,非编码序列可占80~90%。
而原核生物的DNA分子绝大部分用于编码蛋白质,只有一小部分是不翻译的,不翻译区(又称间隔区)通常包含控制基因表达的序列。
3、重复序列
真核生物基因存在大量重复序列,即在整个基因组中有许多重复出现的核苷酸序列,重复序列长短不一,短的仅含两个核苷酸,长的多达数百、乃至上千;重复频率也不尽相同。
根据重复频率的不同,可分为高度重复序列(106),中度重复序列(103~104)和单拷贝或低度重复序列。
4、基因的连续性
真核生物的基因是不连续的,即基因内部的编码序列(外显子)被非编码序列(内含子)所分隔;除真核细胞病毒外,原核生物的基因是连续的,基因内部没有非编码序列。
原核与真核基因组结构特点总结
z真核基因组结构庞大:3×109bp
z单顺反子:
z基因不连续性:断裂基因、内含子、外显子z非编码区较多:多于编码序列(9:1)
z含有大量重复序列
z基因组很小,大多只有一条染色体;
z结构简炼;
z存在转录单元多顺反子;
z有重叠基因.
二、基因组大小与C值矛盾
C值:一个物种单倍体基因组的DNA含量是相对恒定的,它通常称为该物种DNA的C值。
最小的C值:支原体(106bp),
最大的C值:某些显花植物和两栖动物(1011bp)。
C值悖理
C值悖理(C value paradox):C值的大小并不能完全说明生物进化的程度和遗传复杂性的高低,也就是说,物种的C值和它进化复杂性之间没有严格的对应系。
真核生物基因组比较庞大,人单倍体基因组3.16×109 bp。
按1000个碱基编码一种蛋白质计:理论上,有300万个基因,实际大概10万个基因。
说明:许多DNA序列并不转录mRNA指导合成蛋白质。
另外:一些物种之间的复杂性变化范围并不大,但C值却有很大的变化范围。
基因组DNA序列的类别
1、基因序列与非基因序列
基因序列:指决定蛋白质(或RNA)的DNA序列。
也可称之为ORF。
非基因序列:除基因以外的所有DNA序列,主要是
两基因间的间隔子(间插序列)。
2、编码序列与非编码序列
编码序列:指编码RNA和蛋白质的DNA序列。
非编码序列:指基因内的间隔序列以及居间序列的总和。
3、单一序列和重复序列
单一序列是指基因组内只出现一次的序列。
重复序列:指在基因组中重复出现的DNA序列。
4、重复序列的类别
¾低度重复序列:2-10个拷贝。
¾中度重复序列:10-几百份拷贝,平均长度300bp。
¾高度重复序列:几百份-几百万份拷贝。
高度重复顺序的功能
1. 调节反向序列常存在于DNA复制起点区的附近。
另外,许多反向重复序列是一些蛋白质(包括酶)与DNA的结合位点。
2. 参与基因表达的调控DNA的重复顺序可以转录到核内不均一RNA(hnRNA)分子中,并形成发夹结构,这对稳定RNA分子,免遭分解有重要作用。
3. 参与转位作用
几乎所有转位因子的末端都包括反向重复顺序,长度由几个bp到1400bp,形成回文结构,在转位作用中既能连接非同源的基因,又可以被参与转位的特异酶所识别。
4. 与进化有关
不同种属的高度重复顺序,具有种属特异性,但相近种属又有相似性。
如:人与非洲绿猴的α卫星DNA长度仅差1个碱基(前者为171 bp,后者为172bp),而且碱基序列有65%是相同的,表明它们来自共同的祖先。
5. 同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹。
6.α卫星DNA 成簇的分布在染色体着丝粒附近,可能与减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序。
重复序列家族
概念:在重复序列中,有一类核苷酸序列高度相似的重复序列。
类别:1)卫星DNA序列:小卫星和微卫星DNA。
2)散在重复序列:
第三部分转录组与蛋白质组。