EST分子标记开发及在比较基因组学中的应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
生物多样性 2006, 14 (6): 541-547 doi: 10.1360/biodiv.060148
Biodiversity Science http: //
—————————————————— 收稿日期: 2006-07-18; 接受日期: 2006-09-17
基金项目: 浙江省科委重点攻关课题“杂交油菜”项目(G2*******) * 通讯作者 Author for correspondence. E-mail: zml@
EST 分子标记开发及在比较基因组学中的应用
李小白 崔海瑞 张明龙*
(浙江大学原子核农业科学研究所, 杭州 310029)
摘要: 数量迅速增加的EST (expressed sequence tags) 为分子标记的开发提供了宝贵的资源。与来自于基因组DNA 开发的传统标记相比, 以EST 为基础的分子标记是一种新型分子标记, 具有其显著的优势, 如开发简便、信息量高和通用性好等, 在多方面都有重要的利用价值。本文详细地介绍了目前基于EST 开发的5类分子标记以及基于生物信息学方法的开发策略, 这些标记包括EST-PCR 、EST-SSR 、EST-SNP 、EST-RFLP 和EST-AFLP 。此外, 对这些标记在比较基因组学研究中的应用进行了评述, 包括比较作图、遗传多样性评价及系统发育研究等。 关键词: EST, 标记开发, 比较作图, 遗传多样性, 系统发育学
Molecular markers derived from EST: their development and applica-tions in comparative genomics
Xiaobai Li, Hairui Cui, Minglong Zhang*
Institute of Nuclear-Agricultural Sciences, Zhejiang University , Hangzhou 310029
Abstract: Expressed sequence tags (EST), which have been increasing rapidly in number recently, provide important resources for the development of molecular markers. Compared with conventional markers derived from genomic DNA, the EST-derived markers are a novel type of molecular tool with remarkable advantages such as being easy to develop, more informative, and highly transferable. EST markers have been used in many research fields. In the present paper, five kinds of recently developed EST markers, including EST-PCR, EST-SSR, EST-SNP, EST-RFLP, and EST-AFLP, as well as their development strategies based on bioinformatics, are introduced. Moreover, the applications of these markers in comparative genomics studies, including comparative mapping, genetic diversity evaluation, and phylogenetics and so on, are also reviewed.
Key words: EST, marker development, comparative mapping, genetic diversity, phylogenetics
EST(expressed sequence tags)是指通过对cDNA 文库随机挑取的克隆进行大规模测序所获得的cDNA 的5′或3′端序列, 长度一般为150–500 bp (骆蒙和贾继增, 2001)。自从美国科学家Craig Venter 首先提出EST 计划以来 (Adams et al ., 1991), 随着EST 计划在不同物种间的不断扩展和深入研究, 数据库中已积累了大量的 EST 。到2006年4月, NCBI 数据库已经收录了1,059个物种的、总数达35,248,039条的EST 序列。EST 资源库的不断扩增极大地方便和加快了生命科学领域的研究, 也为利用
这些数据来开发EST 分子标记奠定了基础。
1 EST 分子标记的类型及特点
EST 标记是根据EST 本身的差异而建立的分子标记。根据开发的方法不同, EST 标记可分为4类: (1) EST-PCR 和EST-SSR(微卫星)。这一类以PCR 技术为核心, 操作简便、经济, 是目前研究和应用最多的一类; (2) EST-SNP (单核苷酸多态性)。它是以特定EST 区段内单个核苷酸差异为基础的标记, 可依托杂交、PCR 等较多种手段进行检测; (3)
542 生物多样性 Biodiversity Science第14卷
EST-AFLP。它是以限制性内切酶技术和PCR相结合为基础的标记; (4) EST-RFLP。它是以限制性内切酶和分子杂交为依托, 以EST本身作为探针, 与经过不同限制性内切酶消化后的基因组DNA杂交而产生的。
EST标记除具有一般分子标记的特点外, 还有其特殊优势: (1) 信息量大。如果发现一个EST标记与某一性状连锁, 那么该EST就可能与控制此性状的基因相关 (Schubert et al., 2001; Bozhko et al., 2003); (2) 通用性好。由于EST来自转录区, 其保守性较高, 故具较好的通用性, 这在亲缘物种(closely related species)之间校正基因组连锁图谱和比较作图方面有很高的利用价值 (Lan et al., 2000; Cor-deiro et al., 2001; Brown et al., 2001; Varshney et al., 2005); (3) 开发简单、快捷、费用低, 尤其是以PCR 为基础的EST标记。
2 EST标记的开发策略
2.1 EST数据的取得与前期处理
从数据库中直接获取的EST中包含一些低质量片段 (<100 bp), 同时存在着带有少量载体序列及末端存在polyA/T“尾巴”的序列, 影响相关信息的分析, 所以在开发标记之前应去除这些“噪音”。这些处理可通过一些软件来进行, 如利用EST-trimmer (http://pgrc.ipk-gatersleben.de/misa/do- wnload/est_trimmer.pl)和cross-match(www.phrap. org)可分别去除“尾巴”和屏蔽载体序列。
2.2 EST聚类
EST是随机选取测序的, 因此导致同一基因重复测序的冗余现象也就不可避免。所以可以通过一些软件(如Phrap等) 进行拼接和聚类来去除这些冗余的EST, 以避免针对同一基因位点标记的重复建立而造成人力物力的浪费。但对于EST-SNP的开发, 聚类的目的并非剔除冗余EST, 而是为得到多序列聚类簇 (multi-member cluster), 可用于发掘单位点的多态性。
2.3各类EST标记的开发
2.3.1 EST-PCR和EST-SSR标记的开发
这两类标记都是以PCR为基础的, 其技术难度较小, 使用成本较低且准确度较高, 所以易为人们所接受。
根据EST建立SSR标记是目前采用较多的一种策略。在经过前处理和去冗余后, 利用Repeatmasker (/cgi-bin/WEBRepeatMa sker)、MISA (http://pgrc.ipk-gatersleben.de/misa/ misa.html) 等软件搜索SSR, 根据返回结果分析EST中SSR的频率、特点和分布, 然后选取目标SSR 设计引物, 即可通过PCR建立EST-SSR标记。
过去, 开发SSR标记的费用比较高, 往往只限在少数物种上; 而现在可从EST序列中直接筛选SSR, 成本低而且简便、有效。虽然不同植物中SSR分布的频率差异很大, 但其中2%以上的EST序列中都含有SSR (Cordeiro et al., 2001)。在小麦(Triticum aes-tivum)(Eujayl et al., 2001)、大麦(Hordeum vulgare) (Kota et al., 2001; Thiel et al., 2003)、甘蔗(Sac-charum)(Cordeiro et al., 2001)、玉米(Zea mays)、高粱(Sorghum)、水稻(Oryza sativa) (Kantety et al., 2002)、番茄(Lycopersicon esculentum) (Areshe-henkova & Ganal, 2002)、葡萄(Vitis vinifera) (Scott et al., 2000) 等多种植物中都建立了EST-SSR标记。
根据EST建立常规PCR标记也是一条可行的途径。根据EST序列设计引物对特定区域进行扩增, 这样就可能揭示出不同材料在编码区、非编码区及调控区序列的差异。目前, EST-PCR标记已在挪威云杉(Picea abies) (Schubert et al., 2001)、火炬松(Pinus taeda) (Temesgen et al., 2001)、洋葱(Allium cepa) (McCallum et al., 2001)和白菜(Brassica pe-kinensis) (忻雅等, 2005) 等植物中得到了应用。
扩增片段能否成为遗传标记的关键是其是否具有多态性 (Cato et al., 2001)。由于EST的高保守性, 故以PCR为基础的EST标记在种内的多态性较低。通过以下几种策略可提高多态性的频率: (1) 在选择EST-PCR和EST-SSR标记时, 尽量靠近3’或5’端非编译区段, 因为这些区域变异性较高(Scott et al.,2000)。(2) 对无多态性的EST-PCR扩增产物, 先用限制性内切酶消化, 然后对酶切产物进行电泳分离。这种策略的实质是在确定了扩增产物分子量大小差异的基础上, 进一步检测片段内部序列的差异, 其多态性的产生依赖于引物与限制性内切酶位点的组合, 即通常所说的切割扩增多态性 (cleav-age amplified polymorphism, CAP), 故可提高多态性EST-PCR标记的频率, 这在对日本柳杉 (Iwata et al.,2001)和洋葱 (McCallum et al., 2001) 的EST-CAP标记研究中已得到了证明。(3) 改进扩增产物的分析手段。采用分辨率较高的聚丙烯酰胺凝