表达序列标签的应用现状及分析方法研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

表达序列标签的应用现状及

分析方法研究

王晓娜,卢欣石

(北京林业大学草地资源与生态实验室,北京100083)

摘要:表达序列标签是由大规模随机挑取的cDN A克隆测序得到的组织或细胞基因组的表达序列标签。1个表达序列标签(EST)代表生物某一时期的某种组织或细胞的1个表达基因。数量迅速增加的表达序列标签已经成为开发分子标记的重要资源。介绍了EST原理、基因表达分析的方法比较、基因测序聚类分析的3个数据库比较及详细方法,表明EST在发现新基因及基因组研究中的应用具有良好的前景。

关键词:表达序列标签;聚类;分析方法

中图分类号:Q78 文献标识码:A 文章编号:1001 0629(2010)05 0076 09

表达序列标签EST(Ex pressed Sequence Tag)是从一个随机选择的cDNA克隆进行5 端和3 端单一次测序获得的短的cDNA部分序列,代表一个完整基因的一小部分,在数据库中其长度一般从20~7000bp不等,平均长度为360 120bp。EST作为表达基因所在区域的分子标签因编码DNA序列高度保守而具有自身的特殊性质,与来自非表达序列的标记(如AFLP、RAPD、SSR等)相比更可能穿越家系与种的限制,因此EST标记在亲缘关系较远的物种间比较基因组连锁图和比较质量性状信息上是特别有用的。另外,由于EST来源于一定环境下一个组织总mRNA所构建的cDNA文库,因此EST也能说明该组织中各基因的表达水平。EST s已经被广泛地应用于基因识别,研究发现EST s的数目比GenBank中其他的核苷酸序列多,研究人员更容易在EST库中搜寻到新的基因[1]。由于EST 测序只是测定部分序列,也不需要对克隆进行排序,因而完成EST测定所需要的人力、物力消耗与基因组测序和全长cDNA测序相比要少的多,具有经济和高效的特点。由于DNA测序技术的不断更新和大规模测序技术的出现,在DNA测序中逐步实现了工厂化和流水作业,因此测序费用大幅度降低[2]。

近年来,表达序列标签数据增长迅速。在GenBank102版本数据中,EST序列已经占用了2/3的记录[3]。美国国立生物技术信息中心(Na tional Center for Biotechno logy Information,NC BI)对EST进行了聚类分析,按基因划分EST,组成UniGene数据库。还有一些网站开发了基于Internet的EST延伸服务,如Labonw eb网站的IRACE(http://ww bonw ),Bio sino 网站的BioEclone(: 9090/bio eclone.htm l)等[4 5]。

因此对EST的技术要求及应用进行归纳分析,有利于对研究对象分析不同基因的表达水平,为挖掘和克隆基因提供理论支撑。

1 EST特点及其应用

EST计划作为植物基因组计划的一个重要组成部分,已经在多种植物物种中开展起来。相关标记包括EST SSR、EST PCR、EST SNP、EST AFLP、EST RFLP等[6]。近年来,EST的应用已经深入到生物学的领域,其中表达序列标签微卫星(EST SSR)技术的发展和应用较为普遍,根据SSR的来源可将其分为基因组SSR和

76-84 05/2010

草 业 科 学

PRA T A CU L T U RA L SCI EN CE

27卷05期

V ol.27.N o.05

收稿日期:2009 10 15

基金项目: 863 高产、多抗、优质苜蓿新品种分子聚合育种

项目(2008AA10Z149)

作者简介:王晓娜(1986 ),女,河北衡水人,在读硕士生,主要

从事牧草分子标记辅助育种研究。

E_mail:xiaotaoyan5070@

通信作者:卢欣石 E_m ail:luxins hi304@

EST SSR[7]。EST SSR标记狭义上是指位于EST序列上的或者基于EST序列开发的SSR标记,也被称为eSSR标记。

目前较为常用的核酸序列数据库有:美国国家信息中心的GenBank,欧洲分子生物学实验室的EMBL,日本国家数据库DDBJ,这3个数据库是收录范围最广并完全向公众开放的数据库,在它们中均含有EST子数据库dbEST。在核酸序列数据库中,EST的量要占65%以上[8]。

由于EST是功能基因的一部分,不同基因组间,基因编码区序列的保守性远远高于非编码区,与基因组SSR相比EST SSR表现出较好的物种之间的可转移性[9 10]。作为一种新型分子标记,EST SSR来自表达基因,因而除具备传统基因组来源的SSR标记的所有优势外,可能与基因功能表达具有直接或间接关系,从而强化了SSR 标记在遗传研究中的应用[11]。

在种质资源遗传多样性方面,张鹏等[12]利用SRAP和EST SSR分子标记对192份国内外芝麻S esamum ind icum进行分析。发现我国南部地区芝麻品种遗传多样性较中部和北部地区丰富。Eujayl等[13]利用EST SSR等3种不同类型的微卫星标记对64个硬粒小麦T riticum aesti vum品种的遗传多样性进行评价,表明EST SSR 可在硬粒小麦中揭示较高的多态性。

在基因连锁方面,利用分群分析法对多花黑麦草L olium p erenne抗叶斑病进行EST CA PS 标记,得到位点p56位于第5遗传连锁群,所处的基因为编码多花黑麦草天冬酰胺合成酶基因[14]。

在基因功能方面,郭久峰等建立沙冬青A m mop ip tan thus mongolicus的cDNA文库并通过EST分析技术研究其抗逆机理,得到的313个已知功能的基因标签中抗逆相关的有48条[15]。

杨成君等[16]建立了药用植物人参Panax qinseng的EST SSR标记。陈士林等[17]构建了西洋参P.quinquef olius的cDNA文库,经EST 分析获得与水分胁迫相关的基因7个,与受伤诱导相关的基因2个,编码抗氧化酶相关的基因6个。并在根系的EST文库中发现抗病基因12个,62个EST是其他物种尚未报道的新基因。佘玮等[18]以生长中期的苎麻Boehmer ia nivea茎皮为材料构建cDNA文库,并进行EST分析,随即测序得到275个有效序列,约53.5%的EST 序列可能是未报道的新基因序列。

综上所述,EST为种质资源的保护利用和遗传育种工作提供科学依据,同时作为功能基因组研究的重要手段,在功能基因的开发与研究中也发挥重要作用。

2 EST在苜蓿中的研究

近几年,苜蓿M edicago sativa分子水平的研究有所深入,利用RAPD分子标记研究苜蓿种质资源遗传多样性[19]及其他相关基因的克隆序列分析等研究相对较多,如蒺蒺藜状苜蓿中MtERF 6基因的克隆及序列分析[20]。但EST的研究相对较少,闫娟等[21]利用EST SSR标记分析了我国北部和中部地区天蓝苜蓿M.lup ulina 的遗传多样性和遗传结构,推测中等水平的遗传多样性和高度的居群间遗传分化主要受它的自交特性和分布方式影响。

在Genbank数据库中进行搜索,得出测序最多的20个物种中,除经济类作物玉米Zea may s、水稻Ory z a sativa、小麦等序列较多外,大部分物种为动物,蒺藜状苜蓿排在最后,序列条数为409757。在表达序列标签数据库(dbEST)中进行搜索,测序最多的前20个物种中,没有和苜蓿相关的物种序列(总序列45660524条)。由以上数据可以看出,苜蓿基因的测序分析研究相对较少,只有蒺藜状苜蓿得到的EST 较多,而紫花苜蓿和黄花苜蓿M.f alcata有待深入的研究。

3 EST获取及分析过程

3.1EST的获取过程 构建生物某一发育阶段的cDNA文库,然后大规模、随机地挑选cDNA 文库中的克隆或通过某种方法筛选cDNA中的某些克隆,最后对cDNA克隆的5 及3 进行测序,进而得到一个EST[22]。

77

05/2010草 业 科 学(第27卷05期)

相关文档
最新文档