三大基因组特点概述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4
Alu 6
(the other product is not shown)
2. rRNA基因家族
串联重复,有转录活性
大多数真核生物rRNA基因家族 集中分布 通常编码区较为保守,内间区具有种间特
异性,常被用作物种种类鉴定及进化分析。
在一条或几条染色体上,以核仁区含量最高。
rRNA基因家族(gene cluster)
不连续性
Gene structure (一个完整的具有转录功能的单元)
promoter region exons (filled and unfilled boxed regions)
+1 introns (between exons) transcribed region mRNA structure 5’ translated region 3’
基因的不连续性 • 发现 1977年研究病毒mRNA 时发现, 随后在 —珠蛋白基因、卵清蛋白基因中证 实了断裂基因的存在。
•Chow, L.T., Gelinas, R.E., Broker, T.R. and Roberts, R.J. (1977) An amazing sequence arrangement at the 5' ends of adenovirus 2 messenger RNA. Cell, 12: 1-8.
真核生物核基因组
1.基因组较大,
重楼百合 1.5X 10e11
•低等真核生物:107-108 bp,较原核生物大10倍;
•高等真核生物:5X108-1010 bp,某些植物和两栖生物 可达1011 bp; •哺乳类生物大于2X109它们可编码100万个基因。
2.真核生物核DNA与蛋白质结合,形成核小体, 再缠绕成染色质(染色体);
3. Genomic DNA, Genes 基因gene——具有遗传功能的DNA片段 1969分离到。 基因组genome——细胞内所携带的全部遗 传信息DNA的总和;对多倍体生物指单倍体 DNA的总和。 编码蛋白的结构基因 基因组DNA 复制转录的调控序列 功能尚不清楚的区域
Genome sizes in nucleotide pairs (base-pairs)
Nucleosome structure
Nucleosome core (left) • 146 bp DNA; 1 3/4 turns of DNA • DNA is negatively supercoiled • two each: H2A, H2B, H3, H4 (histone octomer) Nucleosome (right) • ~200 bp DNA; 2 turns of DNA plus spacer • also includes H1 histone
Ebola virus
• 以非洲刚果民主共和国的埃博拉河命名 • 生物安全四级,视为生物恐怖主义工具
•
SARS
dengue fever
HIV
显微镜下的HIV病毒
感染HIV病毒的T细胞
急性传染病中70%是病毒病,200次
• 柏林病人
费城故事
1966年
核基因组之一 病毒基因组 病毒基因组的结构 外壳蛋白:识别、侵袭特定的宿主细 胞,并保护基因组不被 核酸酶破坏; DNA(RNA):编码结构蛋白和少量 调控蛋白。 不能独立复制,必需进入宿主细胞,借 助细胞内一些酶类和细胞器才能得以复制。
病毒与其他微生物的区别
不具有细胞结构;也不进行蛋白质、糖和脂类 的代谢活动。 只含有一种核酸成分,要么DNA,要么RNA。 特殊的繁殖方式。缺乏完整的酶系统,不具备 生物产能所需的遗传信息。 绝对的细胞内寄生物。 对一般抗生素和作用于微生物代谢途径的药物 不敏感。 绝大多数病毒在不同程度上对干扰素敏感。
病毒基因组的特点: 1.基因组较小,大小差异较大;
乙肝病毒DNA 3kb,编码4种蛋白质 痘病毒DNA 300kb,编码几百种蛋白 基因组越小,对寄主依赖性越大。
2.化学组成多样;
DNA病毒、RNA病毒 单链、双链 线状、环状
• 3. 除反转录病毒外,病毒基因组只 有单一拷贝;
• 4.基因重叠现象
状。
• Antonio Tedeschi, et al. Wapl is an essential regulator of chromatin structure and chromosome segregation. Nature, 25 August 2013; doi:10.1038/nature12471
amphibians
reptiles birds
The human genome is thought to contain ~25,000 to 30,000 genes. 104 105 106 107
mammals
108 109 1010 1011
病毒基因组 核基因组 原核生物基因组 真核生物基因组 线粒体DNA 核外遗传物质 叶粒体DNA 质粒DNA 非独立的基因组: 转位因子—能在基因组DNA中移动的 DNA序列,不能独立存在,需插入核或核 外DNA中。
6.非编码序列较少<5%;
• 7.基因断裂 • 8.分段基因组 : 病毒基因组不是由一个,
而是由数个不同的核酸分子组成,这些 核酸片段具有不同的遗传功能。目前没 有发现节段性的DNA分子构成的病毒基 因组
• 9.有的病毒基因组中具有宿主细胞基 因组的结构特点;(帽子和ploy(A)结构;
启动子和增强子;内含子 )
真核生物中重要的基因家族 1. Alu基因家族 分散重复序列 在单倍体人基因组中有 5X10 5 个拷贝,约占 人基因组的 3-6% 。每个重复单元的长度为 300bp, 含一个 Alu 酶切位点,因而得名。酶 切后生成130bp和170bp两个片段,每个Alu 片段两侧有6-20bp的同向重复序列,存在于 间隔区(space)和内含子中。 功能:可能与基因转录、调控、加工有关。
• 2多,2少,2duan,单-重
原核生物
A, B, 衣原体 C, D, 支原体 E, 肺炎支原体 F, G, H立克次氏体
原核生物包括:三菌(细菌,放线菌,蓝细菌),三体
核基因组之二 原核生物基因组 细菌基因组的结构特点: 1. 拟核(类核)结构; 2. 除rRNA基因外,基本是单一拷贝的;
实质:两个基因虽共用一段核苷酸序列,但其读码结构 互不相同,编码不同的蛋白质。
SV40DNA基因组中,编码三个外壳蛋白VP1、VP2、VP3基因之间 有122个碱基的重叠,但密码子的读框不一样。而小t抗原完全在大
意义:DNA的利用率提高,是基因表达调控的方式之一。
T抗原基因里面,它们有共同的起始密码子。
基因家族 gene family
1.概念 基因组中来源相同、结构相似、功能相关的一 组基因成为基因家族(gene family)。一些基 因彼此靠近,成串地排列在一起,这种基因排列 结构叫基因簇(gene cluster)。在基因家族结 构中经常会看到基因簇结构。
基因簇——多顺反子结构
分类: • 串联重复多基因家族 组蛋白、tRNA rRNA • 分散重复多基因家族 Alu 家族 • 不同组织、细胞类型、发育时期表达的多基因 家族 同工酶(珠蛋白)
3. 基因组一般为双倍体(diploid); 4. 基因组中非编码序列多于编码序列,有大量的 冗余DNA; 5. 存在大量重复序列,重复次数可高达百万倍; 6. 基因为单顺反子。一个基因单独转录,一个基 因 一条mRNA, 翻译成一条多肽链; 7. 大部分基因有内含子,因此基因不连续; 8. 具有基因家族。 真核生物基因组的特点: 重复性、基因家族、不连续性。
利于核糖体的快速组装,短时间内合成大量核糖体。
3. 非编码序列相对较少; 4. 多顺反子结构;
nucleoid ; nuclear region / body; chromatin body
大肠杆菌的类核结构
Bacterial nucleoid-associated proteins, nucleoid structure and gene expression Shane C. Dillon & Charles J. Dorman Nature Reviews Microbiology 8, 185-195 (March 2010)
LDL receptor gene Alu repeats present within introns
4
unequal crossing over
5 6
Alu repeats in exons 4
ALeabharlann Baiduu
5
Alu
6
X
4
Alu
5
Alu
6 one product has a deleted exon 5
线粒体拟核
大肠杆菌基因组结构:
1. 基因组DNA在4000kb,估计有3500个基因, 每个基因平均长度1kb;已确定的基因有900个, 已确定有260个基因具有操纵子(75个)结构; 2. 已确定的基因中,多数是与代谢有关的酶、核 糖体蛋白; 3. 大多数基因是随机分布的,两条单链作为模板 的概率基本相等; 4. 多数基因是单拷贝。
Nucleofilament structure Video
DNA包装
• 人体 DNA 的总长度大约为3.5米,细胞核直径仅有
0.01毫米。按比例放大,相当于将150公里的长绳
硬塞进一个足球里。
• Wapl 控制 cohesin 与 DNA 结合紧密程度。
• Vermicelli (意,小虫子)骨架,维持染色体的形
plasmids viruses bacteria fungi plants algae insects mollusks bony fish
The size of the human genome is ~ 3 X 109 bp; almost all of its complexity is in single-copy DNA.
5S rRNA 基因家族 在所有染色体上都有,分布频率较高。 一般由120bp组成每个重复单元由 5sRNA基因和和转录区前的非转录区组成, 重复串联形成基因簇。 非洲爪蟾卵母细胞的5sRNA基因:富含 A-T的序列,由不同的15bp序列重复而成, (CAAAGTTTGAGTTTT)这段序列的串 连数不同,非转录的间隔区的长度会有所 改变。
• 证据 1.R—环结构 2.限制性内切酶分析
鸡的卵清蛋白基因用EcoRⅠ和HindⅢ两种酶切, 可得到3或4个片段,把该基因的mRNA逆转录产 物cDNA(双链)用以上两种酶切,发现cDNA不 能被这两种酶切。
mRNA 酶切 cDNA 酶切 DNA
(不能被酶切)
DNA中有的序列在mRNA中丢失, 且丢失部分不 影响基因功能, 酶切位点在内含子中。
目前,在少数原核生物(大肠杆菌)中发现,在少数 真核生物中也发现了类似的基因重叠现象(果蝇)。
普遍存在 频率:人类4-9%;鼠类1.7-14%;蝇类22%
5. 基因组中相关功能基因丛集成一个或几个 特定区域,转录在同一mRNA中, 构成多顺 反子结构;
ΦX174基因组中的D-E-J-F-G-H基因是多顺反子, 然后再翻译,编码外壳蛋白,病毒的装配,负责 细菌的裂解.
Carsonella ruddii---artifical life
• It was once proposed that the smallest bacteria would need at least 300 genes. Yet, Carsonella ruddii only has 182 genes. The DNA of C. ruddii is only 160 kb.
基因重叠现象
单链环状DNA X174 Genomic 5386nt
1795 aa
分子量 197kD
实际分子量262 kD?
1 kb of DNA = 333 aa of coding capacity = 37 kD
定义:核苷酸序列彼此重叠的2个基因为重 叠基因overlapping genes,或称嵌套基因 nested genes。 类型: ① 一个基因的核苷酸序列完全包含在另一个 基因中; ②两个基因的核苷酸序列部分重叠; ③两个基因的核苷酸序列的末端密码子相互 重叠。