烟草基因组知识篇_4_结构基因组学

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

82 中国烟草科学 Chinese Tobacco Science 2010-08,31(4)

烟草基因组知识篇:4. 结构基因组学

龚达平

(中国农业科学院烟草研究所,青岛 266101)

基因组学的研究可分为两方面:以基因组测序为目标的结构基因组学和以功能鉴定为目标的功能基因组。结构基因组学是在基因组学研究的早期阶段,着重进行基因作图、序列分析以研究基因组成、定位的科学。染色体不能直接用来测序,必须将基因组分解成容易操作的较小的结构,即进行基因组作图,获得基因组图谱。根据作图使用的标志和手段,基因组图谱可分为遗传图谱(genetic map)、物理图谱(physical map)、转录图谱(transcription map)及序列图谱(sequence map)[1]。

1 遗传图谱

遗传图谱又称连锁图谱(linkage map),它是以连锁的遗传标记间的重组频率确定遗传学距离(一般用厘摩cM表示,即减数分裂事件中1%的重组率)的基因组图。早期使用的多态性标志有RFLP(限制性酶切片段长度多态性)、RAPD(随机引物扩增多态性DNA)、AFLP(扩增片段长度多态性);20世纪80年代后期,开始应用MS(微卫星)标记绘制图谱。MS的出现不但提高了遗传图的精度,同时也成为物理图谱上的标记,从而促进了遗传图谱与物理图谱的整合;近年来,第三代的多态性标记SNP(单核苷酸多态性)标记得到大量使用。Dib等在5264个AC/TG型微卫星的基础上绘制了人类的完整遗传图谱[2],平均密度是每0.6 Mb一个标记。遗传图谱的建立为基因识别和疾病相关基因的定位创造了条件。

2 物理图谱

遗传图谱的分辨率和精确度都非常有限,对于大多数真核生物来说,在进行大规模DNA测序前,需要用其它作图方法来补充遗传图谱。物理图谱是DNA序列上可以识别的标记位置和相互之间的距离(以碱基对的数目为衡量单位)的信息。这些标记包括限制性内切核酸酶的酶切位点、基因等。物理作图方法很多,主要为以下三类:限制性酶作图,荧光原位杂交(FISH)和序列标记位点(STS)。限制性图谱是指DNA链的限制性酶切片段的排列顺序,即酶切片段在DNA链上的定位,用于对如kb数量级的小区域做精细结构制图。最早的物理图谱是细胞遗传学图谱,通过原位杂交将基因定位在染色体各区带上。细胞遗传学图用于较大片段的区域制图;荧光原位杂交图谱使用荧光标记的DNA探针,来探测DNA序列在染色体上位置的物理图谱。但限制酶作图和FISH均不能满足快速简单绘制大基因组物理图谱的要求。最有效的物理作图技术是STS作图,其优点在于适合大规模测序并容易在染色体上定位。STS是具有位点专一性、染色体定位明确、而且可用PCR扩增的单拷贝序列。HGP在1998年完成了包含52 000个STS位标、覆盖人类基因组大部分区域的YAC或BAC 为载体构建的连续克隆系[3]。

3 转录图谱

转录图谱即基因图谱,是识别基因组所包含的蛋白质编码序列在基因组中的位置以及基因表达模式等信息的图谱。转录图谱是以表达序列标签(EST)为标志绘制的分子遗传图谱。通过从cDNA

2010年第31卷中国烟草科学83

文库中随机挑选克隆进行测序所获得的部分cDNA的5′或3′端序列称为表达序列标签,一般长为300~500 bp。EST在基因的鉴定、基因图谱的构建以及基因表达水平分析等方面起着重要的作用。目前公共数据库NCBI中人类的EST数量超过830万条。EST数据的不足之处在于其不能获得基因的完整信息,同时低丰度表达和那些在特殊环境条件胁迫下诱导表达的基因很难获得。构建全长文库以及利用新一代高通量的测序技术开展转录组测序可以提高对基因的认识。此外,必须开展全基因组测序,以获得基因结构的完整信息,如基因在染色体上的排列顺序、基因间的间隔结构、启动子的结构以及内含子的分布等。

4 序列图谱

基因组计划的最终目标是为了获得生物的全基因组序列,通过测序来得到基因组的序列图谱。基因组测序的基本策略主要有两种:逐步克隆法和全基因组鸟枪法。前者是对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装。后者是在获得一定的遗传及物理图谱信息的基础上,绕过BAC克隆逐个排序的过程,将基因组DNA分解成2 kb左右的小片段进行随机测序,辅以一定数量的10 kb的克隆和BAC克隆的末端测序,利用超级计算机进行序列组装。这两种方法各有利弊。逐步克隆法需要构建大片段基因组文库和精细的物理图谱,成本高,时间长,但组装相对容易。全基因组鸟枪法的优点在于测序速度快,并且不需要遗传图谱或物理图谱,可以在较短时间内完成对一个基因组的测序。但由于是随机测序,需要对基因组进行高冗余测序。同时,拼接过程中对计算机技术和新算法的要求比较高。随着计算机和测序技术的快速发展,特别是新一代测序仪的出现,大大降低了测序时间和成本[4-6]。全基因组鸟枪法已经应用在很多物种基因组测序中,如人类(美国Celera公司)、果蝇、水稻、家蚕、熊猫等。IHGSC和Celera Genomics公司分别于2001年宣布了人类基因组草图,2003年4月人类基因组精细图问世,2004年10月人类基因组完成图公布[7-9]。

基因组测序完成之后,基因组研究的重心由结构向功能转移。功能基因组学代表基因分析的新阶段,在结构基因组学提供的信息基础上系统地研究基因的功能,包括基因功能发现、基因表达分析及突变检测等。对生物学的研究也从对单一基因或蛋白质的研究转向多基因或蛋白质作用网络的系统研究[10]。

参考文献

[1] 布朗T A. 基因组2[M]. 袁建刚,等译. 北京:科学出版社,2002:192-218.

[2] Dib C, Fauré S, Fizames C, et al. A comprehensive genetic map of the human genome based on 5264 microsatellites[J].

Nature, 1996, 380: 152-154.

[3] Schuler G D, Boguski M S, Stewart E A, et al. A gene map of the human genome[J]. Science, 1996, 274: 540-546.

[4] Shendure J, Ji H. Next-generation DNA sequencing[J]. Nat Biotechnol, 2008, 26: 1135-1145.

[5] Branton D, Deamer D W, Marziali A, et al. The potential and challenges of nanopore sequencing[J]. Nat Biotechnol,

2009, 26: 1146-1153.

[6] Rusk N. Cheap third-generation sequencing[J]. Nat Methods, 2009, 6: 244-245.

[7] International Human Genome Sequencing Consortium. Initial sequencing and analysis of the human genome[J]. Nature,

2001, 409: 860-945.

[8] Venter J C, Adams M D, Myers E W, et al. The sequence of the human genome[J]. Science, 2001, 291: 1304-1351.

[9] International Human Genome Sequencing Consortium. Finishing the euchromatic sequence of the human genome[J].

Nature, 2004, 431: 931-945.

[10] Morot-Gaudry J –F, Lea P, Briat J –F. 植物功能基因组学[M]. 王元英, 时焦,等译. 北京:中国农业科学技术出版

社,2009:17-23.

相关文档
最新文档