电子克隆及序列分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

常用软件及网络资源简介

EditSeq是输入并且修剪DNA或蛋白质序列的工具。 EditSeq能读取大部分的序列格式,也可以通过使 用键盘输入,或者从其他地方复制、粘贴得到。 序列被打开后,EditSeq能使用标准或者指定的遗 传密码进行翻译或反翻译、寻找开放读框以及进 行阅读校对
优点与缺点的讨论
传统的方法如同小规模地捕捞一条或几条鱼,电子克隆与之相比就如 同集约化地捕捞一群鱼

拼图游戏一样的原理

相近的物种在核酸序列上有相似性,相近物种中 的同源基因序列在一定程度上可以代表目的基因
的序列

可代表程度与两序列的相似度直接相关,加之遗
传密码的简并性,这种混同在理论上是可行的 ,
但需要作同源性检验以克服主观因素的影响
可能在这个物种上没有被测序。
(2)已已经测序得到的一段EST为探针。
(二)基于UNIGENE的电子克隆
2. 搜索同源的ESTs,选择同源性比分最高的一条 EST序列。从NCBI的UniGene数据库中进行检 索,得到相应的UniGene编号。 3. 可以将与UniGene Cluster的所有核酸序列下载
接cDNA序列以期挖掘新基因

另一方面是在全基因组已经测序的物种中,研究 整个基因组序列以推测其中可能尚未发现的基因

目前应用比较广泛的是第一方面
应用





数据库查询 数据库比对 文件下载 序列分析 序列装配 分子模型 结构分析 功能分析
应用

在全基因组已经测序的物种中推测新基因的步骤 如下: 分析和定位开放阅读框 虚拟翻译并对多肽链序列检索比对 可靠性检查
(一)基于EST的电子克隆
2. 搜索同源的ESTs,并下载到本地,成为 *.SEQ文件格式
采用Blast在线根据搜索与探针相似性高 (>80%)的大量ESTs,
http://blast.ncbi.nlm.nih.gov/Blast.cgi
(一)基于EST的电子克隆
3. 拼接
采用DNASTAR6.0的Seqman程序进行。
启动子预测
( 1 ) CpGProD(CpG Island Promoter Detection) , CpG 岛启动子鉴定, 是一款专注于预测哺乳动物 CpG 岛相关启动子序列的程序。可以下载下 来运行 : http://pbil.univ-lyonl.fr/software/cpgprod_query.html ( 2 ) Dragon Promoter Finder 启动子预测工具,适用于预测脊椎动物 启动子,支持多种序列格式,多参数可选。 http://research.12r.a-star.edu.sg/promoter/promoter1_5/DPF.hm ( 3 ) McPromoter, Markov Chain Promoter Prediction Server 是麻省理 工大学开发的真核生物 ( 主要是脊椎动物 / 果蝇 )DNA 转录起始位点预测 工具,其目标是尽量精确地预测 RNA 转录酶 II 的启示转录位点,需要提 供一个 Email 来接收预测结果,可以特异的选择脊椎动物或是果蝇。 http://tools.genome.duke.edu/generegulation/McPromoter/ ( 4 ) PromoterScan 启动子区预测工具,其预测基于比较所提交的序列 与真核生物 RNA 聚合酶 II 启动子序列同源性。 http://www-bimas.cit.nih.gov/molbio/prosean/ ( 5 ) TESS, Transcription Element Search System 是一款预测启动子 上转录因子结合位点的工具,通过所提交的序列与 TRANSFAC, JASPAR, IMD, CBIL-GibbsMat 数据库相比对,获得启动子上可能存在结合位点。 http://www.cbil.upenn.edu/cgi-bin/tess/tess?RQ=SEA-FR-Query
到本地,利用Seqman或其他的序列装配软件进
行组装,形成较长的新生序列。
常用软件及网络资源简介

DNAStar是一款电子克隆中常用的软件包,它以 功能全面和强大而著称,它主要包括以下几个应 用程序:EditSeq、GeneMan、GeneQuest、 MapDraw、MegAlign、PrimerSelect、Protean、 和SeqMan II
5. ORF预测:http://www.ncbi.nlm.nih.gov/gorf/gorf.html
6. 基因的电子表达谱预测: UNIGENE
电子克隆序列的生物信息学分析
7. DNA序列查找 8. 基因的电子定位: 与基因组比对。 9. 基因结构预测:http://www.itb.cnr.it/sun/webgene//
注意:对序列进行末段修剪去掉冗余部分。
(一)基于EST的电子克隆
3. 拼接
采用DNASTAR6.0的Seqman程序进行。
注意:序列剔除,以提高准确性。
4. 保存contig序列。
5. 重复:
以4中的contig为探针,重复步骤2,3,4。
直到不能在延伸为止。
(二)基于UNIGENE的电子克隆
1. 确定探针序列 (1)以已知物种的基因序列为探针,这个基因
核酸序列分析实例:
电子克隆及序列分析
王兴平
内容

什么是电子克隆
拼图游戏一样的原理


应用
操作过程


优点与缺点的讨论
现状与展望
什么是电子克隆
Watson & Crick 成功解析了DNA分子二级 结构,开创了分子生物学时代 Karry Mullis 发明了PCR反应,体外大规 模、有目的和快速地克隆目标基因成为可 能 信息科学技术特别是数据库技术在战后飞 速发展


什么是电子克隆

电子克隆技术是生物学数据库中EST数据库、核
酸序列数据库、基因组数据库,采用同源性序列 比对和归类分析、重叠区域组装和拼接等方法延 长EST序列,直至没有与之同源的序列可供拼接 为止,所得到的序列可以认为是相对应基因的全
长cDNA,根据所得的cDNA序列设计囊括开放阅
读框两端的引物,进行RT-PCR克隆出相应基因
拼图游戏一样的原理

借助计算机找到具有相同或相似图案的图块,拼 成完整的图案,我们需要做的是进行局部的微调。 剩下的工作就是对拼接出的cDNA进行可能的开 放阅读框的分析,设计囊括开放阅读框两端的引 物,RT-PCR扩增侯选基因
应用

电子克隆主要应用于两个方面:
一个是利用EST序列检索同源性序列,并由此拼
10.外显子/内含子切割位点分析
11.启动子预测: http://www.fruitfly.org/seq_tools/promoter.html
Байду номын сангаас
12.启动子区和转录因子结合位点: http://bioportal.bic.nus.edu.sg/tres/
13.Cpg岛预测: http://www.ebi.ac.uk/Tools/emboss/cpgplot/index.html

分析与之相关的调控序列
如何做拼图游戏

基于EST的电子克隆 基于Unigene的电子克隆

(一)基于EST的电子克隆
1. 确定探针序列(电子克隆的基因)
(1)以已知物种的基因序列为探针,这个基因
可能在这个物种上没有被测序。
(2)已已经测序得到的一段EST为探针。
如:以小鼠Alox12 mRNA为探针,电子克隆牛的Alox12基 因
电子克隆序列的序列分析
1. 鉴定电子克隆的准确性:序列同源性比对(不同 物种多序列比对)
2. 进化树构建: DNAMAN; CLUSTAL-W软件 3. 碱基含量分析: DNASTAR6.0 EDITSEQ 4. 限制性酶切位点分析 http://www.restrictionmapper.org
现状与展望


国外的科研人员做了许多有益的贡献,特别是水 稻、拟南芥等全基因组测序完成后,借助软件分 析,从中发现和克隆了一系列全新的基因 我国的研究人员也进行不少的具有建设性和创造 性的探索和尝试,也取得了令人鼓舞的成果
现状与展望


随着科学技术的不断发展,以及数据库准确性的 逐渐提高,电子克隆的两大制约因素,辅助设计 软件和数据库将日臻完善,电子克隆技术将日趋 成熟。 电子克隆技术有可能从根本上改变人们对与基因 克隆的看法,改变基因克隆长久以来沿用的策略, 改变科研人员关注焦点,促使研究人员致力与生 物大分子的功能,以更好的造福于全人类


与传统的基因克隆方法相比,电子克隆有以下的 优点: 简便快速,成本低廉,设备简单 对操作人员技术要求不高 成功率高
优点与缺点的讨论



尽管电子克隆在理论上已没有什么障碍,然而在 实际操作中依然存在些不足之处: 电子克隆得到的cDNA序列是由计算机虚拟出来 的,现实中可能并不存在 研究人员不可完全迷信软件提供的结果,最好对 分析做人工可靠性验证 普遍适用性较差 电子克隆后需要研究其指导合成的蛋白质的功能 才更有实际意义
的方法
什么是电子克隆

传统的克隆方法是利用基因特异性引物大量扩增 cDNA末端或构建cDNA文库并采用原位杂交进行 筛选,实验进程长、步骤繁琐、成本高、得率低; 运用电子克隆的方法延伸得到的cDNA几乎囊括 了所有疑似为目的基因的cDNA序列,无论表达 转录如何调控,都能通过PCR扩增出表达的那一 段基因

什么是电子克隆

表达序列标签(expressed sequence tags,EST) 是对某个基因cDNA克隆测序所得的部分序列片 段,长度大约为200~600bp 由于基因表达调控作用不同,同一个基因的 mRNA剪接位点和方式不同,所以同一个基因的 全长cDNA可能包含多个EST
EST既代表了基因cDNA的某一区段,也表征了成 熟mRNA可能的剪接方式
相关文档
最新文档