EST-SSSR分子标记的建立
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程名称: 分子育种学 指导老师: 海瑞 成绩: 实验名称: EST-SSR 标记的开发 实验类型: 综合型
分工: 奕-EST 获取+结果分析+引物设计 王鹏潮-SSR 筛选+SSR 统计+结果分析
一、实验目的和要求
1、了解SSR 标记的开发策略;
2、明确EST-SSR 标记的特点和建立EST-SSR 标记的原理;
3、熟悉EST-SSR 标记的过程,掌握EST-SSR 标记的开发技术。
二、实验容和原理 1、实验容
通过从现有的EST 文库中获取序列,再用软件对其进行SSR 查找与引物设计。 2、实验原理 1)微卫星DNA
真核基因组中存在着大量的串联重复序列, 按重复单位的大小, 串联重复可分为卫星(重复序列>70bp )、小卫星(6~70bp )和微卫星DNA (1-6bp )。
微卫星(Microsatellite, MS )是指基因组中以少数几个核苷酸(多数为2~4个)为单位多次串联重复组成的长达几十个核苷酸的序列,又称简单序列重复(Simple Sequence Repeats , SSR )或短串联重复(Short Tandem Repeats , STR )、或简单序列长度多态性(Simple Sequence Length Polymorphism ,SSLP )。
重复数目是可变的,重复序列两侧都有物种特异性的保守序列,所以通过设计引物进行PCR 扩增,就可以检测到不同的DNA 区域重复数目的多态性。 2)SSR 标记的开发策略
SSR 包括基因组SSR (genomic SSR 或gSSR )和表达区EST-SSR (genic-SSR 或EST-SSR )。gSSR 是基于基因组序列开发的,开发起来费时费力,而且因为探针的缘故,种类比较局限。而EST —SSR 则是存在于表达的基因序列的SSR ,不包括含子及非表达的调控区等之中的SSR ,通常三个碱基重复的占多数,与不引起基因翻译过程中移码现象的发生相一致。
建立SSR 标记的前提是必需知道重复序列两列的DNA 序列。 与其他标记相比,SSR 标记具有如下特点: (1)数量较为丰富,覆盖整个染色体组; (2)具有多等位基因特性,信息含量高; (3)以孟德尔方式遗传,呈共显性;
(4)易于利用PCR 技术分析,对DNA 数量和纯度要求不高,结果重复性好; (5)每个位点由引物序列决定,便于交换。
近年来,EST-SSR 标记的开发引起关注。数量迅速增加的ESTs 为开发新的SSR 标记提供了宝贵的资源,各种植物中约有5-10%的EST 含有可用于建立标记的SSR 。建立EST-SSR 标记要经济得多,而且EST-SSR 标记来源于DNA 的转录区域,比gSSR 标记具有更高的通用性,此外,标记-信息量高。
开发EST-SSR原理基于生物信息学手段的可开发SSR的方法。在数据库中已存在大量的可免费下载EST序列数据并剔除冗余EST序列,再通过SSR搜索软件获得SSR位点信息,然后根据SSR位点两侧的核酸序列信息的统计与分析,利用软件设计相应的SSR 引物,进而开发SSR标记,最后进行PCR扩增及扩增产物电泳检测。
3)不同的SSR标记开发方法比较
传统方法开发SSR:
传统的SSR 分子标记开发方法简单、易掌握。这种方法在许多作物的SSR 标记开发中被广泛应用,现已获得的基因组SSR 标记中,四分之三以上的是利用传统开发方法获得的。但必须对每个克隆进行筛选鉴定,工作量大,需花费大量人力,财力,而且效率较低,植物中已报道的阳性克隆比率约为2 %~3 % ,成功获得引物的机率则更低。
图1 传统SSR开发方法流程图
通过富集策略开发SSR标记:
为简化技术环节,提高效率,降低开发成本,通过研究建立了多种采取富积策略的SSR 标记开发方法。
基于RAPD 的开发策略:将RAPD 随机引物与SSR连接,作为PCR扩增引物或者将RAPD扩增产物条带用SSR探针进行Southern杂交,可以有效富集重复序列。虽然目前尚不清楚RAPD有利于SSR 富集的机理,但这一发现大大激发了人们探求富集SSR方法的兴趣。
PIMA ( PCR Isolation of Microsatellite Arrays)方法:先用RAPD引物从基因组中获得随机扩增片段,扩增片段经载体克隆后,用特异SSR及载体引物对克隆阵列进行PCR检测筛选含SSR克隆,对阳性克隆测序。
以上两种利用RAPD 富集SSR的报道,避免了基因组文库的构建,有利于节省时间和人力、物力,但基于此方法进行大量SSR 分离的成功报道并不多。
4)PCR引物设计原则
引物长度:15-30bp,常用为20bp左右。太短会降低退火温度影响引物与模板配对,从而使非特异性增高;太长则比较浪费,且难以合成。
引物扩增跨度:1kb之是理想的扩增跨度,2kb左右是有效的扩增跨度,而超过3kb 就无法得到有效的扩增. 特定条件下可扩增长至10kb的片段。
引物碱基:G+C含量以40-60%为宜,G+C太少扩增效果不佳,G+C过多易出现非特异条带。A TGC最好随机分布,避免5个以上的嘌呤或嘧啶核苷酸的成串排列。
避免引物部出现二级结构,避免两条引物间互补,特别是3‘端的互补,否则会形成引物二聚体,产生非特异的扩增条带。
引物3’端的碱基,特别是最末及倒数第二个碱基,应严格要求配对,以避免因末端碱基不配对而导致PCR失败。
引物中有或能加上合适的酶切位点,被扩增的靶序列最好有适宜的酶切位点,这对酶切分析或分子克隆很有好处。引物5'端对扩增特异性影响不大,可在引物设计时加上限制酶位
点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等。通常应在5'端限制酶位点外再加1-2个保护碱基。
引物的特异性:引物应与核酸序列数据库的其它序列无明显同源性
所扩增产物本身无稳定的二级结构,以免产生非特异性扩增,影响产量。
引物量:每条引物的浓度0.1~1umol或10-100pmol,以最低引物量产生所需要的结果为好,引物浓度偏高会引起错配和非特异性扩增,且可增加引物之间形成二聚体的机会。
三、主要仪器设备
计算机
四、操作方法与实验步骤
1、EST序列的获取
可从数据库中直接下载,主要的数据库有:
美国国立生物技术信息中心GenBank/NCBI ( National Center for Biotechnology Information ):;目前有72098808条EST序列,其中植物EST序列24158363条,涉及到895个物种。其中单子叶植物:7263423条:玉米-2019114;水稻-1333022;小麦-11116126。
欧洲生物信息研究所European Bioinformatics Institute (EBI):/index.html ,包含European Nucleotide Archive;
日本DNA数据库DDBJ(DNA Data Bank of Japan):.ddbj.nig.ac.jp/;
先以从NCBI下载EST序列为例:首先
2、去冗余(EST序列前处理,在本次实验中由于软件收费略去)
采用EST分析软件前处理和剔除冗余EST:直接获取的EST中包含一些低质量片段(<100 bp),少量载体序列及末端存在polyA/T“尾巴”的序列,在开发标记之前应去除这些“噪音”——去冗余。
这些处理可通过一些软件来进行:cross-match(/)或EST-trimmer (.pgrc.ipk-gathersleben.de/misa/download/est-trimmer.pl),去除“尾巴”和屏蔽载体序列。
可用生物信息学软件去冗余:如Cluster W、CD-HIT [/cd-hi/](若只考虑建立标记而不求统计相关参数,也可搜索后聚类,剔除冗余的SSR)。
3、SSR的搜寻
可利用以下一些软件在线搜索SSR:
(1)RepeatMasker(/cgi-bin/WEBRepeatMasker)
(2)SSRIT(/db/searches/ssrtool):
①选择搜索参数:最大值;
②粘贴序列(<100Kb);
③获得结果和统计相关参数。
(3)Sputnik (bri.fr/outils/Pise/spumik.html)
也可利用MISA、DNAman、ssrhunter或ssrfinder等进行本地化搜索SSR,注意制定搜索SSR的标准。
4、设计SSR引物
利用软件设计相应的SSR引物,常用引物设计软件有primerpremier 5.0和oligo 6.0。