基因比对的基本方法综述
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 序列同源性分析:是将待研究序列加入到 一组与之同源,但来自不同物种的序列中 进行多序列同时比较,以确定该序列与其 它序列间的同源性大小。这是理论分析方 法中最关键的一步。完成这一工作必须使 用多序列比较算法。 • 常用的程序有CLUSTAL等。
FASTA简介
• Fasta算法是由Lipman和Pearson于1985年 发表的,基本思路是识别与代查序列相匹 配的很短的序列片段,称为k-tuple。 • 以下是EBI提供的fasta的服务: http://www.ebi.ac.uk/fasta33/
BLAST的资源
• 网络版本:在线的blast服务是我们最经常 用到的blast服务。 • 单机版本:可以通过NCBI的ftp站点获得, 有适合不同平台的版本包括linux,dos等。获 得程序的同时必须获取相应的数据库才能 在本地进行blast分析。
网络版本
网络版 http://www.ncbi.nlm.nih.gov/Blast/ • 优点:服务使用方便,容易操作,数据库 同步更新等优点; • 缺点:不利于操作大批量的数据库,同时 也不能自己定义搜索的数据库。
BLAST分类
程序名 Blastn 查询序列 核酸 数据库 核酸 搜索方法 核酸序列搜索逐一核酸数据库中的 序列
Blastp
Blastx Tblastn Tblastx
蛋白质
核酸 蛋白质 核酸
蛋白质
蛋白质 核酸 核酸
蛋白质序列搜索逐一蛋白质数据库 中的序列
核酸序列6框翻译成蛋白质序列后和 蛋白质数据库中的序列逐一搜索 蛋白质序列和核酸数据库中的核酸 序列6框翻译后的蛋白质逐一比对 核酸序列6框翻译成蛋白质序列,再 和核酸数据库中的核酸序列6框翻译 成的蛋白质序列逐一进行比对,执 行相当久
BLAST
• BLAST是一个NCBI开发的基因序列相似性 数据库搜索程序,还可作为鉴别基因和遗 传特点的手段。 • BLSTA是Basic Local Alignment Search Tool‘局部相似性基本查询工具’的缩写 • Compare a query sequence to all the sequences in a specified database
序列比对的基本方法(二)
内
容
• 1.基本方法概述
• 2.FASTA简介
• 3.BLAST介绍
概
述
序列比对(alignment):为确定两个或多 个序列之间的相似性以至于同源性,而将 它们按照一定的规律排列。,将两个或多 个序列排列在一起,标明其相似之处。
序列相似性比较:就是将待研究序列与 DNA或蛋白质序列库进行比较,用于确定 该序列的生物属性,也就是找出与此序列 相似Leabharlann Baidu已知序列是什么。完成这一工作只 需要使用两两序列比较算法。 常用的程序包括BLAST,FASTA等;
THANK YOU!
单机版本
• 单机版: ftp://ftp.ncbi.nlm.nih.gov/blast/executables/ • 优点:是可以处理大批的数据,可以自己 定义数据库; • 缺点:需要耗费本地机的大量资源,此外 操作也没有网络版直观,方便,需要一定 的计算机操作水平。
BLAST分类
• Blast是一个序列相似性搜索的数据包,其 中包含了很多个独立的程序,这些程序是 根据查询的对象和数据库的不同来定义的。