序列相似性检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2020/3/1
序列相似性检索
• Blast是为从相同和不同的有机体中,提供 对比核酸或蛋白质序列,寻找相似性序列片 断的工具。
• 通过寻找不同基因的相同序列片段,可以推 断最新测定的基因功能、预测基因家族的新 成员、探索基因的进化关系,预测蛋白质代 码和翻译产物的功能和定位。
2020/3/1
2020/3/1
序列比对的其他应用与实 际操作
1. DNA的碱基组成分析 2. 限制性核酸内切酶酶切位点分析 3. 核酸序列的检索与比较 4. 序列的数据库检索 5. 多重序列比
序列相似性检索
• Basic Local Alignment Search Tool
• 是核酸和蛋白质序列的局部对准相似 性检索工具。
第三讲 序列的分析与相似性搜索
序列分析的意义
生物信息主要以基因的形式存在于DNA分子中,表现 为DNA分子上不同的核苷酸顺序。如果核苷酸的排列顺序发 生改变,那么它代表的生物学意义可能也会随之改变。因此, 测定DNA分子中的核苷酸排列顺序是生物学研究的基本内容 之一。核算序列分析方法,对于揭示基因组数据的生物学意 义、研究基因的结构和功能、揭示生命的奥秘具有十分重要 的意义
基于ClustalX的多重序列比对实例
ClustalX是Clustal多重序列比对程序的 Windows版本。它为进行多重序列比 对和分析结果提供一个整体的环境。
1.序列格式 序列利用菜单文件输入, 所有的序列必须放到一个文件中,文 件格式可以是*.txt格式,如现有6种序 列在一个文件中的输入格式上图 2.序列载入 打开软件界面中的文件 栏,点击“载入序列”,将文件载入 ClustalX中。 3.运行“完全比对”,得到的结果下图
基因组对比
基本对比 选择对比程序
特殊对比
2020/3/1
将序列数据 库中的复制 序列在此粘

序列对比报告
对比资源 类似性图谱
2020/3/1
复旦大学图书馆文献检索教研室
数据库标识符 对比积分报告
基因定义
类似性积分
2020/3/1
复旦大学图书馆文献检索教研室
百度文库
E值为匹配期 望值。说明可 以找到与搜索 序列相匹配的 其它序列的几 率。E值越接 近零,越不可 能找到其它的 匹配序列,其 背后的含义就 是E值越少, 匹配度越好
2008-3-17
19
1. 多序列对位排列分析 (multiple sequence alignment)
两条以上序列的对位排列分析
反转录转座子的反转录酶序列片段
核苷酸序列或氨基酸序列 可以发现保守的结构域(重要功能位点?) 多序列排列时允许插入空位
ClustalW:目前公认的的最好的进行 Multiple sequence alignment 的方法之一
Internet 上的许多网站具有ClustalW分析软件
可以下载
对要分析的序列的输入格式有要求,FASTA (Pearson)格式
>sequence 1 A…TT…GCAGTTCGCA >sequence 2 A…TAGCACATCGCA…
分析方法(举例) 在Swiss Institute Bioinformatics(SIB)的EXPSY 分析主页(http://www.expasy.ch)的“Tools and software package” 栏目中点击“Alignment”
序列比对的作用
1 分析功能 2 分析物种进化 3 检测突变、插入或缺失 4 序列延长 5 序列定位 6 预测基因功能
4
由核酸序列分析得到的信息
序列同源性分析
核酸序列
序列结构分析
聚类分析
染色体定位 同源核酸序列
外显子信息 启动子信息 转录子信息
重复序列分析
限制性酶切图谱
开放阅读框
进化关系
系统发育
5
进入Format界面,点击“Format!”
得到比对的结果如左图
第四讲
多序列对位排列分析
主要应用于分析基因或蛋白质的进化
通过分析多个基因或蛋白质序列之间的同源性 确定它们在进化上的关系
分析基因家族中新成员的翻译起始位点和内含 子(预测的氨基酸序列的对位排列分析)
分析基因或蛋白质的功能
点击“BLAST”后,进入该命令的主 界面,然后在“Nucleotide”栏中点 击“BLASTn”
进入nucleotide – nucleotide BLAST界面,将获得的DNA序列 粘贴到“Search”所对应的方框中, 随后根据需要在“Options”和 “Format”栏中对相关参数进行选择。 一般都可以不变。随后点击 “BLAST!”
2008-3-17
2
序列相似性比较和序列同源性
分析
序列相似性比较:
就是将待研究序列与DNA或蛋白质序列库进行比较, 用于确定该序列的生物属性,也就是找出与此序列相似 的已知序列是什么。完成这一工作只需要使用两两序列 比较算法。常用的程序包有BLAST、FASTA等;
序列同源性分析:
是将待研究序列加入到一组与之同源,但来自不同 物种的序列中进行多序列同时比较,以确定该序列与其 它序列间的同源性大小。这是理论分析方法中最关键的 一步。完成这一工作必须使用多序列比较算法。常用的 程序包有CLUSTAL等;
注:“*”代表各序列碱基完全匹配,“*” 越多表示序列同源性越高,“-”代表 空位
24
在“Alignment” 网页的Sequence alignment- Multiple-CLUSTALW栏目中选择“My Hits”网 站
在ClustalW网页粘贴序列,点击“align”
多序列对位排列结果
点击“Optional output formats”中的“clustalw (aln)获得文本格式的排列结果
点击可得待检序列与库存 序列对排
单基因库
基因信息库
基因表达库链接
2020/3/1
复旦大学图书馆文献检索教研室
2020/3/1
人类染色体上的抗肿瘤基 因序列对排表
序列对排报告
对排序列 不一致处
2020/3/1
GenBank数据库中的两个序列比对实例
进入NCBI (http://www.ncbi.nlm.nih.gov/)
相关文档
最新文档