生物信息学及其在动植物育种工作中的应用[1]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

当代畜牧2006年第2期
王雅琴山东银香伟业集团公司(曹县274400)康峰河北农业大学动物科技学院(保定071001)
摘要论述了生物信息学的一般概念及其数据库,并介绍了其在育种工作中的探索和应用。

关键词生物信息学数据库动物育种
20世纪80年代后期,随着计算机技术和人类基因组计划的不断发展,产生了一门新兴的交叉学科———生物信息学(bioinfor-
matics)。

生物信息学,是当今国际上正在迅速发展的自然科学领域中最重要的课题之一,它不仅对认识生物体和生物信息的起源、遗传、发育与进化的本质有重要意义,而且将为人类疾病的诊治开辟全新的途径,还可为动植物的物种改良提供坚实的理论基础。

1生物信息学
生物信息学这一概念,是于1956年在美国召开的“生物学中的信息理论研讨会”上被首次提出的。

1987年,林华安正式把这一学科命名为“生物信息学”。

此后,其内涵随着研究的深入和现实需要的变化而几经更迭。

1995年,在美国人类基因组计划第一个5年总结报告中,给出了一个较为完整的生物信息学定义:生物信息学是一门交叉学科,它包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。

1.1生物信息学的研究对象
生物信息学的主要研究对象是序列,即一维的分子排列顺序的分析,包括DNA分子碱基序列和编码蛋白质的氨基酸序列。

DNA序列分析的主要任务是基因识别和发现某些功能区(如启动子、增强子等),最终目的是说明遗传语言的语法和语法规则,从而最终读懂DNA序列。

蛋白质的结构预测研究始终是生物信息学的核心内容之一,目前研究工作是利用一级结构中的氨基酸排列顺序所隐藏的信息来预测蛋白质的高级结构,而蛋白质结构研究的最终目标是阐明肽链的折叠规律,即所谓破译“第二套生物学密码”。

1.2生物信息学的研究内容
生物信息学的研究内容是随着基因组研究而发展的。

广义地说,生物信息学从事对基因组研究相关生物信息的获取、加工、存储、分配、分析和解释。

这个定义的含义是双重的:一是对海量数据的收集、整理与服务,即管理好这些数据;二是从中发现新的规律,
也就是用好这些数据。

具体地说,生物信息学是把基因组DNA序列信息分析作为源头,找到基因组序列中代表蛋白质和RNA基因的编码区。

同时,阐明基因组中大量存在的非编码区的信息实质,破译隐藏在DNA序列中的遗传语言规律。

在此基础上,归纳、整理与基因组遗传信息释放及其调控相关的转录谱和蛋白质谱的数据,从而认识
代谢、发育、分化、进化的规律。

1.3生物信息学研究的重点内容
生物信息学研究的重点内容为基因组学(genomics)和蛋白质组学(proteomics),即以基因组DNA序列信息分析为源头,在获得了蛋白质编码的信息之后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能,进行必要的药物设计。

因此,基因组研究、基因组信息学、蛋白质的结构模拟及药物设计是紧密相连的,它们是生物信息研究的3个重要组成部分。

而生物信息学的核心是基因组信息学。

基因组信息学作为一个学科领域,包括基因组信息的获取、处理、存储、分配、分析和解释。

基因组信息学的关键是“读懂”基因组的核苷酸顺序,即全部基因在染色体上的确切位置及各DNA片段的功能。

具体地说,它的内涵包括:①要发展有效的能支持大尺度数据需要的软件和数据库;②需产生若干数据库工具,包括电子网络等远程通讯工具,能容易地处理日益增长的物理图、遗传图、染色体图和序列信息,并在这些数据资料中进行比较;③要研究算法和分析技术,用于解释基因组的信息,例如预测功能基因等。

1.4生物信息学的主要任务
生物信息学这门新学科的主要任务是:①发展有效的信息分析工具,构建适于研究的生物信息数据库,换句话说,就是从生物体中“读出”生物信息。

这首先要通过分子生物学相应理论和研究方法的建立和高效全自动DNA测序仪的应用,读出信息后按照一定格式存贮于因特网上的数据库中。

②配合研究试验,利用统计等数学方法及分子生物学理论,利用计算机软件研究基因、蛋白质等的结构及功能,即“读懂”生物信息。

2生物信息学数据库
生物信息学的产生使各类生物信息学数据库不断涌现,其规模迅速增长,同时数据结构日趋复杂,目前生物信息数据库服务已实现高度的计算机化和网络化。

算法和软件的进步、数据的一体化、服务器-
生物信息学及其在动植物育种工作中的应用
中图分类号:S813.2
文献标识码:A
文章编号:1002-2996-(2006)02-0037-02
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"
!!!!!!"
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!"
!!!!!!"
・遗传育种与繁殖・
37


当代畜牧2006年第2期
客户模式的建立使之成为生物、医药、农业等学科的强有力的工具。

2.1数据库的分类
根据数据来源,可以将数据库分成4大类:①原始数据库(pri-marydatabase):含有一种信息(例如序列数据),有许多来源,例如:大型序列计划,个人提交的资料,文献和其他数据库。

迄今为止,国际上4个大的生物信息中心,即美国的国家生物技术信息中心(NCBI)和基因组序列数据库(GSBD)、欧洲分子生物学实验室(EMBL)和日本DNA数据库(DDBJ)已经建立和维持了源自数百种生物的cD-NA和基因组DNA序列的大型数据库。

这些中心和全球的基因组研究实验室通过网点、电子邮件或者直接与服务器和数据库联系而获得的搜寻系统,使得研究者可以在多种不同的分析系统中对序列数据提出质询。

②继生数据库(secondarydatabase):含有一种信息,但只(或主要)来自其它数据库。

这个数据库可以是其它数据库的亚库,或来自另外的数据库的分析。

③知识库(knowledgebases):专家数据库包含多种来源的相关信息,例如:文献、经验和其他数据库。

④集成数据库系统(integrateddatabasesystem):是原始或继生数据库的集成。

2.2生物信息学的国内外发展现状
自从生物信息学诞生以来,国外一直就非常重视生物信息学的发展,各种专业研究机构和公司如雨后春笋般涌现出来,生物科技公司和制药工业内部的生物信息学部门的数量也与日俱增。

目前,绝大部分核酸和蛋白质数据库由美国、欧洲和日本的3家数据库系统产生。

它们共同组成国际核酸序列数据库,每天交换数据,同步更新。

我国对生物信息学领域也越来越重视,一些著名大学和研究所在各自领域取得了一定成绩。

北京大学于1997年3月成立了生物信息学中心,中科院上海生命科学研究院于2000年3月成立了生物信息学中心,分别维护着国内两个专业水平相对较高的生物信息学网站。

但从全国总体来看,与国际水平差距还很大。

目前,国内生物(医药)科学研究与开发,对生物信息学研究和服务的需求市场非常广阔,但是,真正开展生物信息学具体研究和服务的机构或公司却相对较少,仅有的几家科研机构主要开展生物信息学理论研究。

生物信息学服务公司提供的服务仅局限于简单的计算机辅助分子生物学试验设计,而且服务体系也不完善。

3生物信息学在育种工作中的应用
生物信息学与传统育种方法相结合来提高选育效率,将是育种的发展趋势。

随着遗传操作技术不断创新和完善,特别是动物和植物细胞的基因转移技术、基因扩增技术、基因修饰技术、基因克隆技术、蛋白质构像克隆技术等,并通过商业渠道,出售专项技术全套试剂,方兴未艾。

基因操作技术的进步,如外源基因在转基因禾谷类作物中的表达,“报告基因”用于植物的转化,分离优良性状基因的技术等一系列突破,与常规育种技术相结合,提高育种效率,创造遗传育种资源,加快育种进程,这已是育种界的发展趋势。

4加快我国生物信息学发展的措施
我国有关部门应该重视和扶持这一新兴学科,利用Internet这一高科技信息传输手段和大量的生物信息资源,开辟生物信息学为育种攻关服务的新领域,填补国内这一领域的空白,主要措施包括以下几个方面:
1)收集分析国内外基因库数据,并建立动、植物,特别是包括水稻、小麦、玉米、棉花、油菜和甘薯在内的6大作物优良品种、优良种质的基因库管理系统,并随时补充新的内容,对全球新种质、新品种所携带基因的熟练掌握,为育种家加快育种进程、加快农业生物技术研究与国际接轨提供条件。

2)收集与国内外最近出现的与新种质、新品种有关的性状数据,并建立新品种、新种质性状数据库。

3)收集国内外有关6大作物最新的试验设计及分析方法,并建立一个试验分析数据库。

4)利用数据库转换软件,将BA(生物数据)和CABI(国际农业与生物科学中心文摘)数据库中有关6大作物育种方面的文献转换、导录,建立6大作物分库检索系统,随时追踪国内外同类工作的研究进展。

以生物技术为龙头,多学科合作,带动其它学科发展,打破传统信息服务的格局,为动、植物育种加快进程提供信息条件。

5结语
从上世纪末到本世纪初的20年间,蛋白质及药物设计将处于一个迅速发展的时期。

生物信息学的兴起和发展是这一发展的基础,高性能的大规模计算机技术及超级计算机是这一发展的关键手段。

随着研究的深入,方法和技术的日趋成熟,可望产生一批性能优良的蛋白质工程制剂和药物,应用于医疗卫生,造福于人类。

将生物信息学(包括蛋白质结构的三维模型及其与小分子相互作用的参数的计算)作为工具,分析已完成的基因组和调节信号,是许多研究群体当前的任务,并且可望在不久的将来回答许多人们关注的问题。

参考文献
1陈颖健.生物信息学:融合生物科学与计算机科技的新学科.求是[J],2003,(7):53-54
2李伟编译,茅矛审校.生物信息学新进展—第六届国际生物信息学和基因组研究年会综述[J].国外医学遗传分册,1999,22(2):104-107
3李晓,雷波.生物信息学理论及农业应用的发展趋势.西南农业学报[J],1999(12):32-35
4刘玉庆,王禄山,张玉忠,等.生物信息学及其在农业上的应用前景.山东农业科学[J],2001,(5):51-54
5秦惠基,胡家荣.生物信息学的兴起及展望.广东药学院学报[J],1999,15(1):28-29
6王斌会,王霄.生物信息学数据库的新进展.医学信息[J],2001,14(2):63-64
7张立人.试论生物信息学在生命科学中的意义.浙江中医学院学报[J],2000,24(1):45-46
・遗传育种与繁殖・38
・・。

相关文档
最新文档