基因组学分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第八章基因组学分析

基因组(Genome)指一个生物体中所有的遗传信息的载体DNA。原核生物基因组与真核生物基因组有着很大的区别,原核生物的基因组比较简单,一般由一条染色体(有些细菌有多条染色体)和若干个质粒组成。除少数细菌外,细菌的染色体一般由一条环状双链DNA组成。染色体高度折叠、盘绕聚集在一起,形成致密的类核(nucleoid),类核无核膜与胞浆分开,类核的中央部分由RNA和支架蛋白组成,外围是双链闭环的DNA超螺旋(图8-1)。染色体DNA链上与DNA复制、转录有关的信号区域优先与细胞膜结合,连接点的数量随细菌生长状况和不同生活周期而异。这种连接有助于细胞膜对染色体的固定,并在细胞分裂时将染色体均匀的分配到子代细胞中。

图8-1:大肠杆菌染色体DNA的类核结构,中间实心圆为中央类核,四周的为DNA环。

从1995年美国基因组研究所(The Institute for Genomic Research, TIGR)发表第一株细菌——流感嗜血杆菌(Haemophilus influenzae RD)的全基因组序列以来,现已发表了150多株细菌的基因组全序列(表8-1),其中包括古细菌和真细菌,既有病源微生物也有非病源微生物。这些已完成全基因组测序的细菌很具代表性,有在极端条件下生长的嗜热菌,耐盐菌,耐酸菌;有厌氧菌,兼性厌氧菌和需氧菌;有营养要求不高的大肠杆菌,较难培养的枝原体,只在活细胞内生存的衣原体和立克次体。在未来的几年时间里,还将有更多株原核生物的基因组全序列被测序,预示着原核生物基因组研究将对21世纪的生命科学研究中起着推波助澜的作用。

第一节微生物基因组概述

1、基因组大小

曾经有很多方法用于细菌基因组大小的研究,包括比色法、DNA复性动力学、酶切片段的二维胶电泳,这些方法现在都已经被脉冲场电泳(Pulsed Field Gel Electrophoresis, PFGE)技术所取代。虽然原核生物的基因组大小相对比真核生物要小,但是最大的原核生物基因组碱基数与最小的真核生物基因组碱基数大小有部分重叠(图8-2)。细菌的基因组大小相差也很大,目前已知完成全基因组序列测定的细菌中,基因组最小的生殖道支原体(Mycopalsma genitalium)只有0.58 Mb,最大的日本慢生根瘤菌(Bradyrhizobium japonicum USDA 110)有9.11 Mb(表8-1)。

2、编码密度高

与真核生物不同,原核生物基因组的编码序列占基因组总序列的比率很高,达90%左右。如果基因的

平均大小为1 kb,在一个基因组大小为1000 kb的原核生物,基因数接近900个,上下偏差一般不会超过20%,如基因组最小的生殖道枝原体(Mycoplasma genitalium G-37B0),其基因组大小为580 kb,编码523个基因,基因组中等大小的李斯德菌(Listeria innocua Clip11262)和根瘤土壤杆菌(Agrobacterium tumefaciens C58-DuPont),它们基因组的大小分别为3011 kb和4915 kb,编码3626和5482个基因,基因组较大的Mesorhizobium loti MAFF303099,基因组大小为7036 kb,编码6752个基因。两个已全基因组测序的低等真核生物,酿酒酵母(Saccharomyces cerevisiae)和裂殖酵母(Schizosaccharomyces pombe),基因组大小分别为12069和14000 kb,编码6294和4820个基因,编码序列只占基因组的57%和70%;秀丽隐杆线虫(Caenorhabditis elegans)和拟南芥(Arabidopsis thaliana)的基因组大小分别为97000和115428 kb,编码19099和25498个基因,拟南芥的编码区(CDS)的平均大小为430 bp,编码序列占基因组的28.9%(29)。而人类的基因组有3000000 kb,仅编码31000多个基因,编码序列(编码外显子的序列)占基因组的比率不到2%。由此可见,不同生物,不但基因组大小差异显著,而且编码序列占总基因组的比率相差也非常悬殊。

古细菌

真细菌

10101010101010

基因组大小(bp)

图8-2 古细菌、真细菌和真核生物这三界生物基因组大小分布图。古细菌和真细菌的基因组大小是根据PFGE数据,真核生物的基因组大小是根据PFGE和复性动力学实验两个结果。

3、基因组拓扑结构

约50种细菌的基因组拓扑结构是已知的,比较常见的是一个或多个封闭的环状染色体,但是也有些关于线状染色体的报道。关于线性染色体在复制阶段是否有一个环化过程,目前还不太清楚,但是已知有些细菌的染色体在复制时改变其拓扑结构。细菌基因组中比较多见的是一条环状染色体,关于有些细菌中存在多个染色体的报道很多,大家可能认为染色体越多基因组越大,其实基因组的大小与是否存在多个染色体没有什么直接关联。如基因组大小为9.4 Mb(Megabase,百万碱基对)的Myxococcus xanthus就只有一条环状染色体。多条染色体的存在,其实反应了细菌基因组的流动性特点。细菌基因组的同源重组频率很高,同源重组既能使染色体由一条分成多条,也可以使多条染色体重组合并成一条大的染色体。如Bacillus cereus的基因组大小基本在5 Mb,但是比较不同菌株的物理图谱发现,基因组的大部分经常会发生重排。在其中一种中,最大的染色体是2.4 Mb,另外的2.6 Mb分散成多个染色体。

4、原噬菌体(Prophages)和隐性原噬菌体(Cryptic Prophages)

噬菌体又称细菌病毒,是一种完全的细胞内寄生生活,利用宿主的生物合成系统在细菌体内繁殖。噬菌体分为温和噬菌体和烈性噬菌体,一些噬菌体的DNA可以通过位点特异性重组或转座作用插入到细菌染色体上,称为溶源生长。在溶源生长时期噬菌体的病毒功能被抑制,这时噬菌体又称为原噬菌体(Prophage),噬菌体的基因组随着细菌的染色体一起复制、遗传到下一代。由于在生长过程中,溶源菌的经常发生突变或原噬菌体部分缺失,导致溶菌生长的一些功能基因丧失,这时原噬菌体称为隐性原噬菌体(Cryptic Prophages)。从自然界分离的细菌也经常有原噬菌体,这些原噬菌体作为细菌基因组的一部分组成而存在,有时也难以发现它们的病毒起源性。

相关文档
最新文档