作物分子设计育种(精)
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
目前,对大多数作物的育种来说,育种家可供利用的亲本材料有几百甚至上千份,可供选择的杂交组合有上万甚至更多。由于试验规模的限制,一个育种项目所能配置的组合一般只有数百或上千,育种家每年花费大量的时间去选择究竟选用哪些亲本材料进行杂交;对配制的杂交组合,一般要产生2000个以上的 F2 分离后代群体,然后从中选择1%~2%的理想基因型,中选的 F2 个体在遗传上是杂合体,需要做进一步的自交和选择,每个中选的 F2 个体一般需产生100个左右的重组近交家系才能从中选择到存在比例低于1%的理想重组基因型。育种早期选择一般建立在目测基础上,由于环境对性状的影响,选择到优良基因型的可能性极低,统计表明,在配制的杂交组合中,一般只有1%左右的组合有希望选出符合生产需求的品种,考虑到上述分离群体的规模,最终育种效率一般不到百万分之一。因此常规育种存在很大的盲目性和不可预测性,育种工作很大程度上依赖于经验和机遇。
生物个体的表型是基因型和环境共同作用的结果,植物育种的主要任务是寻找控制目标性状的基因,研究这些基因在不同目标环境群体下的表达形式,聚合存在于不同材料中的有利基因,从而为农业生产提供适宜的品种。生物数据可以来自生物的不同水平,如群体水平、个体水平、孟德尔基因水平和 DNA 分子水平等,各类生物数据为作物育种提供了大量的信息。尤其随着分子生物学和基因组学的飞速发展,生物信息数据库积累的数据量极其庞大,但由于缺乏必要的数据整合技术,可资育种工作者利用的信息却非常有限,作物重要农艺性状基因( quantitative trait locus,QTL )的定位结果也难以用于指导作物育种实践。作物分子设计育种将在庞大的生物信息和育种家的需求之间搭起一座桥梁,在育种家的田间试验之前,对育种程序中的各种因素进行模拟筛选和优化,提出最佳的亲本选配和后代选择策略,从而大幅度提高育种效率。
1 作物分子设计育种相关基础研究现状及发展趋势
近年来,主要作物的基因组学研究,特别是拟南芥、玉米、水稻和小麦基因组学研究取得了巨大成就,基因定位和 QTL 作图研究为分子设计育种奠定了良好基础,计算机技术在作物遗传育种领域的广泛应用为分子设计育种提供了有效的手段。国内外生物领域的高技术飞速发展,主要表现在以下5个方面。
1.1 生物信息学遗传信息数据库中的数据呈“爆炸式”增长
在过去的几年里,由于基因组学和蛋白组学的飞速发展,3大核酸序列数据库,即欧洲生物信息研究所( European Bioinf ormatics Institute,EBI )维护的 EMBL 数据库、美国国家生物技术信息中心( National Center for Biotechnology Inform ation,NCBI )的 GenBank 数据库和日本国立遗传学研究所( Japan National Institute of Genetics Center for Informati on Biology )的 DDBJ 数据库,截至1992年1月总计收录核酸序列数据只有59317条,共77805556碱基对;截至2005年3月,3大数据库收录的核酸序列已经达到43118204条,共计47099081750碱基对,年份间呈几何级数增长。2002年,国际3大机构 PIR ( Protein Information Resources,蛋白质信息资源,美国国家健康研究所)、EBI 和 SIB ( Swiss Institute of Bioi nformatics,瑞士生物信息研究所)将3个蛋白质数据库 PIR、SWISS-PROT 和 TrEMBL 合并组建了单一的权威性蛋白质数据库UniProt,截至2005年5月24日已经收录了1748002条蛋白质序列共计555158414个氨基酸。在这些数据库中,有关植物 DNA 序列主要来源于拟南芥、玉米、水稻和小麦等。
水稻作为模式植物和世界上最重要的粮食作物之一,其基因组学研究一直走在其他作物的前列,是第一个完成测序的重要
农作物。我国在2002年完成了世界首张籼稻基因组草图,与 Syngenta 公司完成的粳稻基因组草图同时发表在 Science。随后完成了粳稻(日本晴)4号染色体的精确测序,是世界上首先完成的2条精确测序水稻染色体之一。同时还完成了籼稻(广陆矮4号)4号染色体80%的精确测序以及水稻4号染色体着丝粒的序列分析。上述工作的完成使我国水稻基因组测序研究处于世界领先水平。
所有这些序列以及基因和蛋白质结构和功能的数据成为全世界科学界的宝贵资源和财富,这些海量的序列信息给高效、快速的基因发掘和利用提供了新的契机,在若干研究领域实现跨越式发展甚至“革命”的时机已经到来’。但是,如何收集和处理这些 DNA 和蛋白质信息,并在作物改良中加以应用仍是一个巨大的挑战。
1.2 分子标记技术发展日新月异
自20世纪80年代以来,先后开发出基于 Southern 杂交的第一代分子标记( RFLP 为代表)和基于 PCR 的第二代分子标记( SSR 为代表)。随着植物基因组学研究的发展,全基因组序列、EST 及全长 cDNA 数量迅猛增长,成为开发新型分子标记的新资源。因此目前全世界正在大力开发基于基因序列的第三代分子标记,即来自 cDNA 序列的 SSR 和 SNP 标记。这类分子标记具有数目多、适于高通量检测的优点;更重要的是,由于 EST 和 cDNA 全长序列是表达基因序列,通过对现有的 EST 或全长cDNA 数据进行标记查寻,再进行合适的标记引物设计和多态性检测,就可以找到稳定可靠的基于表达基因的特定分子标记。因为标记来自基因的转录区域,因此这些标记能更好地对基因功能的多样性进行更直接的评估。cSSR 标记还具有一个优点,即部分标记可以跨物种应用,因为在不同物种中的表达基因大多数是相似的,针对这些表达基因设计的 SSR 标记就可以在物种间通
用。此外,根据 EST 序列信息或根据不同种质资源中的基因序列比较分析,还可以开发出针对特定等位基因的 SNP 标记,这些 SNP 标记将大大方便对有利基因的分子标记辅助选择。
1.3 基因和 QTL 定位研究广泛深入
作物重要农艺性状大多是数量性状,受多基因控制,这些基因间存在复杂的相互作用,基因的表达容易受环境因素的影响。分子标记技术的飞速发展,极大促进了基因定位特别是数量性状基因定位的研究,定位数量性状的基因位点( QTL ),阐明它们的效应、上位性以及与环境的互作,是当代遗传育种研究的一个重要方向。目前,植物 QTL 定位方面应用较广的方法有:区间作图、复合区间作图和基于混合线性模型的复合区间作图等。利用这些方法,对主要农作物的数量性状进行了大量的定位研究,截止2005年4月仅 CAB (国际农业和生物学中心文摘数据库)收录的各种 QTL 定位的论文就有3497篇,其中植物方面的 QTL 定位研究论文1581篇,研究比较深入的作物有水稻、玉米、小麦和番茄等。研究者从不同角度分析了 QTL 的主效应、 QTL 之间的互作效应、QTL 与环境的互作效应等,采用的作图群体包括重组自交系( RIL )、加倍单倍体( DH )、F2 及其衍生群体、回交群体、随机交配群体和染色体片段置换系( CSSL )群体等;在此基础上,进行单基因分解、精细定位和图位克隆研究。
等位基因变异的检测与表型性状的深入鉴定相结合已成为从种质资源中发掘新基因的有效手段。自1995年以来,Eshed 和 Zamir 倡导利用高代回交导入系结合定向选择,大规模发掘种质资源中有利基因,从而获取 QTL 的复等位基因在不同遗传背景下的表达效应,以便将 QTL 定位研究与植物育种紧密结合起来,为分子设计育种提供全面、准确的遗传信息。