生物信息学在农业上的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物信息学在农业上的应用
学生:张玮
(湖南农业大学生物安全科学技术学院学院,长沙 410128)
摘要生物信息学是基因、基因结构、基因产物功能分析必不可少的技术手段。根据生物信息数据库的现状,讨论了生物信息学在农业上的应用,如挖掘新的基因、电子克隆及系统进化分析等。将生物信息学与常规育种技术相结合,对提高育种效率,创新遗传资源,加快作物改良进程都有重要意义。
关键词农业;生物信息;数据库;基因;作物育种
Abstract Biological inforrrmtion was the essential technique for a cultuml science,which could be used 1o analyze the gene,the gene structure,the function of gene product.1he present situation of biological inforrmtion database was inced.An application of a tuml biological inforrrmtion in dredging up gene.electric cloning and analysis of phylogenetie evolution was discussed.nle combination of biological information and c6nventional breeding technique was important for imoroving breeding eficiency.creating new genetic and the crop improvement Key words Agriculture;Biological information;Database;Gene;Crop breeding
生物信息学(Bioinformatics)是由生物科学、计算机科学、信息科学、应用数学、统计学等多学科交叉融合而成的一门新兴学科,由包括数据库、计算机网络和应用软件3大部分构成_l J。生物信息学以计算机为主要工具,开发各种软件,对日益增长的核苷酸、蛋白质的序列和结构等相关信息进行收集、储存、提取、分析和研究,同时建立理论模型,指导实验研究。生物信息学是进行农作物基因组学研究的基础,是基因、基因结构、基因产物功能分析必不可少的技术手段。随着遗传操作技术特别是动植物细胞基因转移技术的不断创新和完善,如外源基因在转基因禾谷类作物中的表达、“报告基因”用于植物的转化、优良性状基因的分离等一系列技术的突破,将生物信息学与常规育种技术相结合,对提高育种效率,创新遗传资源,加快作物改良进程都有重要意义2。
1 生物信息数据库
数据库是信息处理的基础,而生物信息数据库则是生物信息工作的出发点。全世界的农学家、生物信息学家已充分认识到生物信息学与农业结合将推动农业的发展,高质量的完善的农作物生物信息数据库的建立将为农作物基因组学的研究奠定基础_3 J。
1.1 序列数据库序列数据库主要存放DNA或蛋白质的序列信息,著名的序列数据库有GE~BANK、DDBJ、EMBL、SWISS-PORT以及PsD等。GENEBANK 序列数据库由美国国家生物技术信息中心(NcBI)维护(http://www.ncbi.nlm.nih.gov);EMBL由欧洲生物信息学研究所(EBI)维护(http://www.ebi.ae.uk),S阢S P0RT也由EBI维护;DDBJ由日本国立遗传学研究所维护(http://www.ddbj.nig.ac.iP)。GENEBANK、DDBJ和EMBL 共同构成“国际合作核酸数据库”,其每天都会交换数据,使这3个数据库的数据同步。
PIER国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序
列信息中心(M )和日本国际蛋白质数据库(J D)共同维护的国际上最大的公共蛋白质数据库(http://pir.geogetown.edu)。
1.2 基因组数据库基因组数据库描述不同分辨率下的基因组结构,以及不同层次上基因组的结构,包括基因定位、排列次序、分子之间的距离、克隆组集、探针、物理图等,表1列出了部分农业基因组数据库。部分农作物的物理图、遗传图、基因组序列、基因及基因组注解的信息可以从NCBI得到,如水稻、大豆、大麦、小麦、玉米和燕麦等的遗传图谱可通过NCBI Map Viewer(http://www.ncbi.nlm.nih,gov/mapview/)获得。
表1 农业基因组数据库
数据库名称网址
Plant Genome and Information Center http://www.Na1.usda.gov/pgdlc USDA
UK Crop Plant Bioinfonr~ticsNetwork http://Synteny.nott.ac.uk/agr/agr.himl
The Institute for Ce nomic Research http://www.tigr.org (TIGR)Database Grain Genome Database http://wheat.pw.usda.gov
Maize Genome Database http://www.argon.missouri.edu
Soybean Ce nomics and Microarmy http://psi081.ba.aIs.usda.gov/SGMD /Database default.him .
Netplant Gene V2.0 Web Prediction http://www.eb s.dtu.dk/Netplant Ce ne.Server himlThe Legume Information System(us) htto://www.Comparative-legumes.nIg
A cultural Ce nome Infonnatlon System http://ars-genome.comeU.edu/1.3 基因表达数据库基因表达数据库收集基因表达和微
阵列杂交数据并校对,是在线提供基因的表达浏览、查询和
检索的有用资源4J。在作物育种中常用的基因表达数据库
是NCBI的GEO(http://www.ncbi.nlm.nih.gov/geo/)。
2 生物信息学在农业上的应用2.1 数据挖掘与利用农业生物信息数据库可以高效地实现农业数据的录入、查询、统计等较低层次的功能,实现数据的积累。但从堆积如山的数据中提取有用的信息,如寻找数
据中存在的关系和规则、挖掘并识别作物的重要基因、发现新基因、加快基因克隆的速度等,都需要强有力的生物信息学工具。利用生物信息学工具就有可能对现有的农作物品种进行改造,甚至创造新的物种,丰富种质资源,以满足人类营养健康需要。张业勤利用ES'F数据库(dbEsr)对水稻新基因进行了搜索,并对其功能进行了预测_5 ;Picotdt.Newberg等在来自19个不同cDNA文库的EST 序列中完成了850个候选SNP位点的发掘u6 ;Jin等搜索公共数据库中与之高度同源的BAC克隆和EST序列,并根据多重比对的结果设计引物,所有扩增片段经再测序后,发现一个C/T型SNP (RsP04),定位在距基因2 cM处,并认为他可用于香米品种的筛选7J。李华盛等利用生物信息学方法在含有9 470条棉花Esr序列的数据库中进行微卫星标记筛选,共发现微卫星序列4 396个,占整个KS3"数据库的4.64%。其中双碱基重复序列1 282个、三碱基序列2 411个,分别占在Esr数据库中发现微卫星序列总数的29.27%和54.8%L8J。2.2 基因组分析农业生物信息学能够快速进行数据分析和研究,因此提供了高效基因组分析平台。从大规模基因测序所提供的关于DNA中核苷酸的分布序列