序列比对基本过程
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
序列比对基本过程
序列比对(SequenceAlignment)是生物信息学领域中一项重要的分析技术,它旨在比较两个或更多序列的相似性和差异性。
序列比对是生物学进步的基石,其研究对象包括基因序列、蛋白质序列以及其它任何有用的序列。
序列比对的基本过程如下:
首先,选择将要比较的两个或多个序列,并以字母或计算机语言编码表示,一般用A、C、G、T来表示DNA序列,用A、C、G、U来表示RNA序列,用字母表示氨基酸序列。
之后,计算序列之间的相似程度,构建最佳比对结果,以及评估比对结果的可信度。
在进行最佳序列比对时,通常遵循下列三个步骤:
一是序列预处理。
这一步骤涉及对输入的序列进行排序、格式标准化、噪声过滤等处理手段,以减少计算开销,提高比对结果质量。
二是比对矩阵构建。
这一步骤涉及对给定的两个序列构造比对矩阵,也就是两个序列之间元素正向和反向比较得出的一个表格。
一般情况下,这种矩阵称为“马尔科夫链”或“马尔科夫阵”,三项评分模型则用来评估相似性,并用来评判两个序列的不同情况。
三是比对算法调整。
这一步骤是最关键的步骤,它包括调整比对算法参数以及生成比对结果。
比对算法包括基于穷举法、局部比对法、全局比对法等。
常见的比对结果生成算法包括动态规划算法(Dynamic Programming)、后向推理算法(Backward Inference)、HMM算法(Hidden Markov Model)等。
总的来说,序列比对的基本过程是:预处理、构建比对矩阵、应
用比对算法。
它们的结果可以表示为一个矩阵,其中包括序列的相关性、差异性以及可信度等数据。
序列比对在生物信息学中有着重要的价值,它极大地推动了生物学研究方面的工作,为科学家们解决生命科学中的重要问题提供了有效技术支持。