引物设计、序列比对、进化树制作
05多序列比对和进化树分析
common carp
zebrafish
rainbow trout teleost
Orthologs: members of a gene (protein) family in various organisms. This tree shows RBP(视黄醇结合蛋白) orthologs.
Multiple sequence alignment programs How to get multiple sequences?
Sequence format BLAST Program
Multiple sequence alignment programs
Genedoc
Clustal X Clustal W Align X MultAlin T-Coffee MAFFT
Definitions: two types of homology Orthologs Homologous sequences in different species that arose from a common ancestral gene during speciation; may or may not be responsible for a similar function.
2.采用ClustalW在线分析( AAQ84722.1 )
来的各分类单位间的相互关系。
离散特征法则主要包括 MP 法(最大简约法)和 ML 法(最大 似然法)。 距离法在构成距离矩阵(故而也称距离矩阵法)后,要么通过 某个标准来筛选出进化树的最佳估计,可以用最小二乘标准来 估计进化树,称最小二乘进化树;或者根据某种算法得到一个 聚类的树形图,不必对每个树都进行比较,计算量小,因此也 不一定是最佳的树,常见的有UPGMA法(类平均法)和NJ法 (neighbor-joining method,邻接法)。
PCR引物设计
PCR引物设计PCR(聚合酶链式反应)是一种常用的分子生物学方法,用于扩增特定的DNA片段。
PCR引物的设计对PCR反应的成功与否至关重要。
下面将详细介绍PCR引物的设计过程。
第一步,选择目标序列。
在设计PCR引物之前,首先需要确定要扩增的目标序列。
目标序列可以来自已知基因的特定片段,也可以通过测序等方法获得。
第二步,引物长度和温度。
PCR引物通常为单链DNA片段,一般长度在18-30个碱基对之间。
引物长度过短容易引起非特异性扩增,引物长度过长则会导致特异性降低。
此外,引物的长度还会影响PCR反应的温度。
一般情况下,引物的长度越长,PCR反应的温度就需要越高。
通常,引物的长度最好在20-24个碱基对之间。
第三步,引物序列的选择。
为了确保PCR反应的特异性,引物的选择至关重要。
引物应具有与目标序列完全互补的碱基序列,以确保引物能够精确结合到目标序列上。
此外,引物的序列还应避免序列内部的反向重复和结合位点之间的重复序列。
第四步,引物的熔解温度(Tm)的确定。
引物的熔解温度是引物与模板DNA结合的温度。
引物的熔解温度应该尽量接近反应的最低温度,以确保引物能够与目标序列特异性结合。
引物的Tm可以通过以下公式计算:Tm = 69.3 + 0.41 * (G+C%) - 650/length其中G+C%表示引物中鸟嘌呤(G)和胞嘧啶(C)的百分含量,length表示引物的长度。
第五步,特异性分析。
在设计引物之前,可以通过生物信息学工具对引物进行特异性分析。
特异性分析可以通过引物序列与目标序列的比对来进行。
引物在目标序列上应有唯一的结合位点,并且不应该与其他非目标序列有任何重复的位点。
第六步,引物的杂交性能。
为了确保引物的杂交性能,引物应具有适当的糖尖端修饰和杂交性能。
糖尖端修饰可以增强引物的杂交性能,并减少非特异性结合。
此外,引物的GC含量应该适中,过高或过低都可能导致非特异性结合的问题。
第七步,引物的交叉反应。
引物设计的详细步骤
引物设计是PCR(聚合酶链式反应)技术中的关键步骤,以下是引物设计的详细步骤:选择合适的引物长度:通常选择18-30个核苷酸长度的引物。
引物太短可能降低特异性,
而太长则可能导致非特异性结合。
选择合适的引物GC含量:通常选择40%-60%的GC含量。
GC含量过高或过低都可能
影响PCR的效率。
避免引物二聚体和发夹结构:这些结构可能导致引物自身结合,从而影响PCR的效率。
可以使用软件工具检查引物的这种可能性。
避免引物间的互补:引物之间互补的序列可能导致引物结合,从而影响PCR的效率。
选择合适的引物位置:引物应位于目标基因的特异区域,通常选择基因的编码区。
此外,应避免选择有高突变率的区域,这可能影响引物的特异性。
使用软件进行引物设计:有许多在线和离线软件可以帮助设计PCR引物,如Primer3、Oligo 等。
这些软件可以根据输入的基因序列自动设计和选择最佳的引物。
实验验证:即使通过软件设计的引物看起来很好,也需要在实验中进行验证,以确保其特异性、有效性和可靠性。
引物浓度和退火温度的优化:引物的浓度和退火温度也是PCR的重要参数,需要针对特定的反应条件进行优化。
请注意,对于具体的实验和目的,可能需要更具体和详细的设计考虑,建议咨询相关领域的专家或具有丰富经验的实验员。
mega操作过程-多序列比对、进化树、
基 在NCBI/EBI的FTP服务器上可以找到下载的软件包。
础 生
ClustalW 程序用选项单逐步指导用户进行操作,用户
物
可根据需要选择打分矩阵、设置空位罚分等。
信 息
ftp:///pub/software/
学
EBI的主页还提供了基于Web的ClustalW服务,用户可以
物
信
随着序列数量的增加,算法复杂性也不断增加。用O
息
(m1m2m3…mn)表示对n个序列进行比对时的算法复杂性,
学
其中mn是最后一条序列的长度。若序列长度相差不大,则
及 应
可简化成O(mn),其中n表示序列的数目,m表示序列的长
用
度。显然,随着序列数量的增加,序列比对的算法复杂性
按指数规律增长。
第二节 多序列比对程序及应用
及 应
把序列和各种要求通过表单提交到服务器上,服务器
用
把计算的结果用Email返回用户(或在线交互使用)。
/clustalw/
Progressive Alignment Method
ClustalW 程序
基
ClustalW对输入序列的格式比较灵活,可以是FASTA格式,还可
1 2 3 4 5 6 7 8 91
ⅠY D G G A V - E AL
基
础
ⅡY D G G - - - E AL
生
物
ⅢF E G G I L V E AL
信
息
学
ⅣF D - G I L V Q AV
及
应
ⅤY E G G A V V Q AL
用
表1 多序列比对的定义
表示五个短序列(I-V)的比对结果。通过插入空位,使5个序列中 大多数相同或相似残基放入同一列,并保持每个序列残基顺序不变
Mega的使用以及进化树的绘制
1.MEGA构建系统进化树的步骤2.CLUSTALX进行序列比对1.MEGA构建系统进化树的步骤1. 将要用于构建系统进化树的所有序列合并到同一个fasta格式文件,注意:所有序列的方向都要保持一致( 5’-3’)。
如图:2. 打开MEGA软件,选择"Alignment" - "Alignment Explorer/CLUSTAL",在对话框中选择Retrieve sequences from a file, 然后点OK,找到准备好的序列文件并打开,如图:。
3. 在打开的窗口中选择”Alignment”-“Align by ClustalX” 进行对齐,对齐过程需要一段时间,对齐完成后,最好将序列两端切齐,选择两端不齐的部分,单击右键,选择delete即可,如图:。
4. 关闭当前窗口,关闭的时候会提示两次否保存,第一次无所谓,保存不保存都可以,第二次一定要保存,保存的文件格式是.meg。
根据提示输入Title,然后会出现一个对话框询问是否是Protein-coding nucleotide sequence data, 根据情况选择Yes或No。
最后出现一个对话框询问是否打开,选择Yes,如图:。
5. 回到MEGA主窗口,在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” -“Neighbor-joining”,打开一个窗口,里面有很多参数可以设置,如何设置这些参数请参考详细的MEGA说明书,不会设置就暂且使用默认值,不要修改,点击下面的Compute按钮,系统进化树就画出来了,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Minimun-evolution”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“Maximun-parsimony”,如图:在菜单栏中选择”Phylogeny”-“Bootstrap Test of Phylogeny” –“UPGMA”,如图:6. 最后,使用TreeExplorer窗口中提供的一些功能可以对生成的系统进化树进行调整和美化。
16SrDNA鉴定细菌的方法具体操作步骤与注意事项
16S rDNA鉴定细菌的方法细菌16S rDNA鉴定主要分为7个部分:1.提取细菌基因组DNA,2.设计/选择引物进行PCR扩增,电泳检测纯度与大小。
3.琼脂糖凝胶电泳分离4.胶回收目的片段5.目的片段测序。
6.BLAST比对获取相似片段。
7.构建系统进化树试剂:1、培养基:通常选择组分简单且细菌生长良好的培养基(培养基组分过于复杂会影响DNA 的提取效果,也可以在裂解细菌前用TE缓冲液对菌体进行洗涤。
)。
2、1M Tris-HCl (pH7.4, 7.6, 8.0)(1L):121.1g Tris,加浓盐酸约(70ml, 60ml, 42ml),高温高盐灭菌后,室温保存。
冷却到室温后调pH,每升高1℃,pH大约下降0.03个单位。
3、0.5M EDTA(pH8.0)(1L):186.1g Na2EDTA•2H2O,用NaOH调pH至8.0(约20g),高温高压灭菌,室温保存。
4、10×TE Buffer(pH7.4,7.6,8.0)(1L):组分:100 mM Tris-HCl,10 mM EDTA。
1M Tris-HCl (pH7.4,7.6,8.0)取100ml,0.5M EDTA(pH8.0)取20ml。
高温高压灭菌,室温保存。
1×TE Buffer用10×TE Buffer稀释10倍即可。
5、10%SDS(W/V):称10g,68℃加热溶解,用浓盐酸调pH至7.2。
室温保存。
用之前在65℃溶解。
配置时要戴口罩。
6、5M NaCl:称292.2gNaCl,高温高压灭菌,4℃保存。
7、CTAB/NaCl(10%CTAB,0.7M NaCl):溶解4.1g NaCl,加10g CTAB(十六烷基三甲基溴化铵),加热搅拌。
用之前在65℃溶解。
8、氯仿/异戊醇:按氯仿:异戊醇=24:1(V/V)的比例加入异戊醇。
9、酚/氯仿/异戊醇(25:24:1):按苯酚与氯仿/异戊醇=1:1的比例混合Tris-HCl平衡苯酚与氯仿/异戊醇。
系统进化树的构建
系统进化树的构建一、什么是系统进化树系统进化树,又称为生命进化树或物种树,是描述生物进化关系的一种图形表达方式。
它通过比较不同物种之间的形态、生理特征以及遗传信息等多方面的数据,将它们按照演化顺序排列在一个分枝结构图中,以展示各个物种之间的亲缘关系和演化历程。
二、系统进化树的构建方法1. 形态学比较法形态学比较法是最早被使用的构建系统进化树的方法。
该方法主要通过对不同物种之间形态特征的比较,确定它们之间的亲缘关系。
例如,通过对鸟类翅膀长度和颜色等特征进行比较,可以确定它们之间的亲缘关系,并将它们排列在一个分枝结构图中。
2. 分子生物学方法随着分子生物学技术的发展,越来越多的研究者开始使用DNA序列等遗传信息来构建系统进化树。
这种方法主要是通过比较不同物种DNA 序列或蛋白质序列之间的差异性,来推断它们之间的亲缘关系。
例如,通过对人类、猩猩和大猩猩的DNA序列进行比较,可以确定它们在进化过程中的亲缘关系。
3. 综合方法综合方法是将形态学比较法和分子生物学方法结合起来,以获得更准确的系统进化树。
该方法主要是通过对不同物种之间形态特征和遗传信息等多方面的数据进行综合分析,来推断它们之间的亲缘关系。
例如,通过对恐龙化石的形态特征和DNA序列进行比较,可以确定它们在进化过程中的亲缘关系。
三、系统进化树的构建步骤1. 收集数据构建系统进化树需要收集大量的数据,包括形态特征、遗传信息等多方面的数据。
这些数据可以通过实验、文献调查等方式获取。
2. 数据处理收集到的数据需要进行处理和分析,以便于构建系统进化树。
这些处理包括序列比对、计算差异性等操作。
3. 构建树型结构在经过数据处理后,就可以开始构建系统进化树了。
该步骤主要是将不同物种之间的亲缘关系按照演化顺序排列在一个分枝结构图中。
4. 树型验证构建完系统进化树后,需要对其进行验证。
这可以通过计算分支长度、计算拓扑稳定性等方式来实现。
四、系统进化树的应用1. 生物分类学研究系统进化树可以帮助生物学家更准确地确定不同物种之间的亲缘关系,从而更好地进行生物分类学研究。
引物设计步骤
分享:简并引物设计过程及原则简并引物常用于从已知蛋白到相关核酸分子的研究及用于一组引物扩增一类分子。
简并引物设计过程(1)利用NCBI搜索不同物种中同一目的基因的蛋白质或cDNA编码的氨基酸序列因为密码子的关系,不同的核苷酸序列可能表达的氨基酸序列是相同的,所以氨基酸序列才是真正保守的。
首先利用NCBI的Entrez检索系统,查找到一条相关序列即可。
随后利用这一序列使用BLASTP(通过蛋白查蛋白),在整个NR数据库中查找与之相似的氨基酸序列。
(2)对所有的序列进行多序列比对将搜索到的同一基因的不同氨基酸序列进行多序列比对,可选工具有Clustal W/X, 也可在线分析。
所有序列的共有部分将会显示出来。
“*”表示保守,“:”表示次保守。
(3)确定合适的保守区域设计简并引物至少需要上下游各有一个保守区域,且两个保守区域相距50~400个氨基酸残基为宜,使得PCR产物在150~120 0bp之间,最重要的是每一个保守区域至少有6个氨基酸的保守区,因为每条引物至少18bp左右。
若比对结果保守性不是很强很可能找不到6个氨基酸序列的保守区,这时可以根据物种的亲缘关系,选择亲缘关系近的物种进行二次比对,若保守性仍达不到要求,则需进行三次比对,总之,究竟要选多少序列来比对,要根据前一次的结果反复调整。
最终目的就是有两个6个氨基酸且两者间距离合适的保守区域。
(4)利用软件设计引物当得到保守区域后,就可以利用专业的软件来设计引物了,其中Primer 5.0 支持简并引物的设计,将参与多序列比对的序列中的任一条导入Primer 5.0 中,将其翻译成核苷酸序列,该序列群可用一条有简并性的核苷酸链来表示(其中R=A/G,Y=C/T,M=A/C, K=G/T, S=C/G, W=A/C/T,B=C/G/T,V=A/C/G, D=A/G/T, N=A/C/G/T, 该具有简并性的核苷酸链必然包含上一步中找到的氨基酸保守区域的对应部分,在Primer 5.0 中修改参数,令其在两个距离合适的保守的nt区域内寻找引物对,总之要保证上下游引物都落在该简并链的保守区域内,结果会有数对,分数越高越好。
设计引物的方法
设计引物的方法引物是在分子生物学实验中非常重要的一种试剂,它可以用来扩增特定的DNA片段,是PCR技术的关键组成部分。
设计引物的方法需要考虑多个因素,包括目标序列的特点、引物的特性以及实验条件等。
下面将介绍一些常用的设计引物的方法。
首先,确定目标序列。
在设计引物之前,首先需要明确要扩增的目标DNA序列。
这可以通过测序技术或者文献检索来获取。
了解目标序列的长度、GC含量、重复序列等特点对于引物的设计非常重要。
其次,选择引物设计工具。
目前有许多在线的引物设计工具可以帮助科研人员设计引物,如Primer3、NCBI Primer-BLAST等。
这些工具可以根据用户输入的目标序列信息自动设计合适的引物,大大简化了引物设计的过程。
接着,考虑引物的特性。
设计引物时需要考虑引物的长度、GC 含量、Tm值等特性。
一般来说,引物的长度应在18-25个碱基对之间,GC含量应在40%-60%之间,Tm值应在55-65摄氏度之间。
这些特性的合理选择可以提高引物的特异性和扩增效率。
然后,进行引物的比对和分析。
设计好引物之后,需要对引物进行比对和分析,确保引物只扩增目标序列,不会扩增到其他非特异的DNA片段。
这可以通过生物信息学分析软件来实现,如BLAST 等。
最后,进行引物的合成和验证。
设计好引物之后,可以选择将引物提交给生物试剂公司进行合成,也可以选择自行合成。
合成好的引物需要进行验证,包括聚合酶链式反应(PCR)扩增、电泳分析等,确保引物的质量和特异性。
总之,设计引物是分子生物学实验中非常重要的一步,合理的引物设计可以提高实验的成功率和准确性。
通过以上介绍的方法,希望可以帮助科研人员更好地设计引物,开展相关实验工作。
mega操作过程-多序列比对、进化树、
启发式算法
启发式算法(heuristic algorithms):
计算机程序自动比对 通过特定的算法(如穷举法,启发式算法等),由计算机程 序自动搜索exhaustive alignment method)
将序列两两比对时的二维动态规划矩阵扩展到多维矩阵。即用 矩阵的维数来反映比对的序列数目。这种方法的计算量很大, 对于计算机系统的资源要求比较高,一般只有在进行少数的较 短的序列的比对的时候才会用到这个方法
大多数实用的多序列比对程序采用启发式算法 (heuristic algorithms),以降低运算复杂度。
随着序列数量的增加,算法复杂性也不断增加。用O (m1m2m3…mn)表示对n个序列进行比对时的算法复杂性, 其中mn是最后一条序列的长度。若序列长度相差不大,则 可简化成O(mn),其中n表示序列的数目,m表示序列的长 度。显然,随着序列数量的增加,序列比对的算法复杂性 按指数规律增长。
根据自己的需要选择合适的输出格式。
用ClustalW得到的多序列比对结果中,所有序列排列在一起,
并以特定的符号代表各个位点上残基的保守性,“*”号表示保 守性极高的残基位点;“.”号代表保守性略低的残基位点。
Progressive Alignment Method
Clustal W 使用
输入地址:/clustalw/ 设置选项 (next)
用于描述一组同源序列之间的亲缘关系的远近,应用到 分子进化分析中。 序列同源性分析:是将待研究序列加入到一组与之 同源,但来自不同物种的序列中进行多序列同时比 较,以确定该序列与其它序列间的同源性大小。
mega操作过程-多序列比对、进化树
及
把序列和各种要求通过表单提交到服务器上,服务器
应 用
把计算的结果用Email返回用户(或在线交互使用)。
/clustalw/
Progressive Alignment Method
ClustalW 程序
基
➢ ClustalW对输入序列的格式比较灵活,可以是FASTA格式,还可
生
物
➢ 为了便于描述,对多序列比对过程可以给出下面的定义:把多序
信
列比对看作一张二维表,表中每一行代表一个序列,每一列代表
息
一个残基的位置。将序列依照下列规则填入表中:
学 及
(a)一个序列所有残基的相对位置保持不变;
应
(b)将不同序列间相同或相似的残基放入同一列,即尽可能将序列
用
间相同或相似残基上下对齐(下表)。
物
说是非常必要的。
信
息
➢ 为了便于进行交互式手工比对,通常使用不同颜色表示具有
学
不同特性的残基,以帮助判别序列之间的相似性。
及 计算机程序自动比对
应
用
➢ 通过特定的算法(如穷举法,启发式算法等),由计算机程
序自动搜索最佳的多序列比对状态。
穷举法
穷举法(exhaustive alignment method)
础
以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。
生
物
➢ 输出格式也可以选择,有ALN、GCG、PHYLIP和GDE等,用户可以
信
根据自己的需要选择合适的输出格式。
息 学
➢ 用ClustalW得到的多序列比对结果中,所有序列排列在一起,
及
并以特定的符号代表各个位点上残基的保守性,“*”号表示保
引物设计流程
2010级动科2班杨教童2220103282101511.引物设计的原理和步骤PCR引物设计的目的是为了找到一对合适的寡核苷酸片段,其中在扩增的DNA片断5'端的引物对应于有意链DNA序列,3'端的引物对应于无意链DNA序列,使其能有效地扩增模板DNA序列。
因此,引物的优劣直接关系到PCR的特异性与成功与否。
要设计引物首先要找到DNA序列的保守区。
同时应预测将要扩增的片段单链是否形成二级结构。
如这个区域单链能形成二级结构,就要避开它。
如这一段不能形成二级结构,那就可以在这一区域设计引物。
现在可以在这一保守区域里设计一对引物。
一般引物长度为15~30碱基,扩增片段长度为100~600碱基对。
1.引物设计的原则(1)碱基组成:GC含量应在40%-60%(45%-55% )之间,4中碱基在引物中分配均匀。
没有多聚嘌呤或多聚嘧啶序列,如AAAAA等,没有二核苷酸重复序列,如GCGCGC等;(2)引物长度:引物中与模板互补的区应为18-25个核苷酸长度,上下引物长度差别不能大于3bp,如上游引物为19bp,下游引物为24bp等。
(3)重复或自身互补序列:形成发夹结构,会阻止引物和模板之间的复性。
(4)上下引物的互补性:一个引物的3'末端序列不允许结合到另一个引物的任何位点上,因为PCR中引物浓度较高,会形成引物二聚体。
当一个PCR有多对引物时,注意检查任何一个3'末端都不能和其他任何引物互补。
(5)解链温度(Tm 值):计算出来的两个引物的Tm 值相差不能大于5 ℃,扩增产物的Tm 值与引物的Tm 值相差不能大于10 ℃;引物的Tm 值一般为50-70℃。
这些特性保证了扩增产物在每一个PCR 循环可有效变性。
(6)3’末端3’末端的性质非常关键。
如果可能的话,每个引物的3’末端碱基为G或C;最好不要A,或AA等多聚A;(7)5’端序列添加限制性酶切位点:2.用Primer Premier 5.0 软件设计两对引物(1)在网页上找到要制作引物的一段序列,最好在1000左右,比如:ORIGIN1 atgaatccaa atcaaaagat aataacaatt ggttctgttt ctctcatcat tgccacaata61 tgtttcctta tgcaaattgc tatcctagta actactgtaa cattacattt caagcagcat121 gactacaact cccccgcaaa caaccaagca atgctgtgta aaccaacaat aatagaaaga181 aacacaacag agattgtgta tttgaccaac accaccatag agaaagaaat atgccccaaa241 ctagtagaat atagaaactg gtcaaagccg caatgtaaca ttacagggtt tgcacctttt 301 tccaaggaca attcaattcg gctttctgct ggtggggaca tctgggtgac aagagaacct361 tatgtgtcat gcgatcctga caagtgttat caatttgccc ttgggcaggg aacaacatta421 aacaacggac attcaaataa cactgtacat gataggaccc cttatcgaac cctattgatg481 aatgaattgg gtgttccatt tcatttagga accaggcaag tgtgcatggc atggtccagc 541 tcaagttgtc acgatggaaa agcatggctg catgtttgta taactgggga tgatagcaat 601 gcaacagcta gcttcattta caatgggagg cttgtagata gtattggttc atggtccaaa 661 aatatactca gaacccagga gtcggaatgc gtctgtatca atggaacctg tacagtagta721 atgactgatg ggagcgcttc aggaaaagct gatactaaaa tactattcgt tgaggagggg781 aagatcgttc atgttagcac attgtcagga agtgctcagc atgttgagga gtgctcctgt 841 tatccacgat ttcctggtgt cagatgtgtc tgcagagaca actggaaagg ctccaatagg901 cccatcgtag atataaatgt aaagaattat agcattgttt ccagttatgt atgctcagga961 cttgttggag acacacccag aaaaggcgac agcgtcagca gtagttattg cctagatcct1021 aacaatgaga aaggtggtca tggggtgaaa ggctgggcct ttgatgatgg aaatgacgtg1081 tggatgggaa ggacaatcaa cgagacgtta cgcttaggtt atgaaacctt caaagtcatt1141 gaaggctggt ccaaagctaa ctccaaatta cagacaaata gacaagtcat agttgaaaag1201 ggcgacaggt ccggttattc tggtattttc tccgttgaag gcaaaagctg catcaatcgg 1261 tgcttttatg tggagttgat aaggggaagg aaagaggaaa ctaaagtctg gtggacctca1321 aacagtattg ttgtgttttg tggcacctca ggtacatatg gaacaggctc atggcctgat 1381 ggagcggata tcaatctcat gcctatataa(2)将序列粘贴到制作区域(3)点击Primer后点击Search开始搜索引物,如:上述设计得如下一对引物5’CCTAAGCGTAACGTCTCGT3’TGGGAG GCTTGTAGATAGT优点:转化率为80%,产物长度比较长,为495bp.能够很到限度的利用所选序列的,在5’端没有A或者多聚A结构,引物的Tm值的差距小于5,GC含量在45%到55%之间。
进化树构建的基本过程(上)
进化树构建的基本过程(上)通过进化树,我们可以得到⼀些⾮常有价值的信息,⽐如说某⼏个物种在同⼀分⽀上,说明他们有着较近的亲缘关系,更有可能他们之间存在着祖先与进化的关系。
⽐如最近来势汹汹的新冠肺炎,下图为从⽹上找的冠状病毒遗传进化分析,其中图中2019-nCoV即为本次新型冠状病毒。
今天我们就来简单介绍⼀下进化树构建的基本过程。
这次我们以YTHDF家族和YTHDC家族作为例⼦来进⾏演⽰。
PART1准备1. 基因蛋⽩序列打开NCBI gene数据库(https:///gene/),将所要查询的基因名称输进去即可,例如分析⼈YTH家族,将该家族的5个基因(YTHDF1/2/3、YTHDC1/2)依次输进基因栏。
选择对应物种,例如此处分析⼈,选择Homo sapiens,选择要分析的序列,本⽂分析蛋⽩序列,点击NP链接,若要分析mRNA序列,点NM即可。
转进来后点击FASTA后即可看到该基因的蛋⽩序列,通过右上⽅send to发送⾄本地保存为fasta格式。
然后将5个基因蛋⽩序列合在⼀个fasta格式⽂件。
具体合并就是把⽂件⽤⽂本打开,然后粘贴到⼀起就⾏。
注意:所有序列的⽅向都要保持⼀致 ( 5’-3’)。
序列⼯作就做好啦另:Uniprot数据库(/)也可获取蛋⽩序列哦,步骤与此类似,⾃⾏探索即可2.下载MEGA软件官⽹(https:///)下载即可,有多种版本可供下载,由于本⼈电脑上为MEGA-X版本,下⾯就此版本介绍具体⽤法。
PART2序列⽐对做系统进化树之前要做多序列⽐对,将⽐对结果提交给MEGA建树。
打开MEGA,点击File→Open A File/Session…→找到⾃⼰要⽐对的序列,打开弹出对话框,选Align然后5条要⽐对的序列就进来啦!接下来我们进⾏序列⽐对,在Alignment⾥⾯有Alignment by ClustalW和Muscle两个选项。
其中ClustalWClustalW是现在⽤的最⼴和最经典的多序列⽐对软件,基本原理是⾸先做序列的两两⽐对,根据该两两⽐对计算两两距离矩阵,然后⽤NJ或者UPGMA⽅法构建Binary进化树作为guide tree,最后⽤progressive的⽅法根据guide tree逐步添加序列进⾏⽐对,⼀直到所有序列都⽐对好。
blast引物设计流程
blast引物设计流程Blast引物设计是基因组、转录组和蛋白质组研究中不可或缺的一环。
BLAST(基本局部序列比对工具)是用于在数据库中相似序列的一种工具。
它能够在数据库中找到一条或多条与查询序列相似的序列,并计算相似度分数。
利用BLAST工具进行引物设计可以帮助研究人员快速鉴定和选择目标基因、转录本或蛋白质,并进行后续实验。
下面将详细介绍BLAST引物设计的流程。
1.确定目标序列:确定要设计引物的目标序列,可以是基因组、转录组或蛋白质组中的一个特定基因、转录本或蛋白质。
2. 数据库选择:选择适当的数据库进行BLAST。
根据实际需要,可以选择不同的数据库,包括NCBI的GenBank、RefSeq、EST、非冗余蛋白质数据库等。
3.引物设计参数:根据实验需求和目标序列的特点,设置合适的引物设计参数。
参数包括引物长度、引物Tm值、引物GC含量、引物之间的距离等。
4. 引物设计工具选择:选择合适的引物设计工具进行设计。
目前有许多在线工具和软件可以进行BLAST引物设计,例如Primer-BLAST、Primer3、Geneious等。
5.引物设计:根据设置的参数和目标序列,使用选择的引物设计工具进行引物设计。
工具通常会生成多个潜在的引物序列,根据设计要求和实验条件进行筛选。
6.引物特性分析:对设计的引物进行分析,包括引物的Tm值、互补性、二聚体形成、酶切位点等。
高Tm值可增加引物与目标序列的稳定性,互补性较低可以避免二聚体的形成,酶切位点可能会影响后续实验的结果。
7.引物合成:选择合适的引物合成厂商进行引物合成。
根据实验需求,可以选择合成标记有荧光染料或其他分子的引物。
8.引物验证:将合成的引物进行验证,可以通过聚合酶链反应(PCR)或其他测序技术进行验证。
验证引物的特异性和效率,并根据需要进行优化。
9.实验应用:将验证通过的引物应用于实验中,如PCR扩增、基因表达分析、基因组重组等。
BLAST引物设计的流程如上所述,通过合理设置参数、使用适当的工具和对引物进行验证,在基因组、转录组和蛋白质组研究中可以选择出最合适的引物。
专题-序列分析和引物设计
此图对于设计体外表达引物或 转基因载体构建引物十分重要。 原则为:设计引物添加酶切位 点必须是目的基因中没有的酶 切位点。
多序列比对
应用: 简并引物设计
差异位点分析(SNP或氨基 酸差异等)
进化树的构建
保守区
DNAMAN1形式
DNAMAN2形式
GCG形式
GDE形式
选择某区段
Ux Ax1 Ax2 Bx7 Cx Dx5 Kx Rx Consensus Ux Ax1 Ax2 Bx7 Cx Dx5 Kx Rx Consensus Ux Ax1 Ax2 Bx7 Cx Dx5 Kx Rx Consensus Ux Ax1 Ax2 Bx7 Cx Dx5 Kx
MAKRLVLF AVVVALVALTVAEGEASGQLQCERELQE MAKRLVLFVAVVVALVALTVAEGEASGQLQCERELQE...RELKACQQVMDQQLRDISPK RELKACQQVMDQQLRDISP MTKRLVLFAAVVVALVALTAAEGEASGQLQCERELQE...HSLKACRQVVDQQLRDVSPE M KRLVLFAAVVVALVALT AEGEASGQLQCERELQE H LKAC QVVDQQLRDVSPE MTKRLVLFAAVVVALVALTAAEGEASGQLQCERELQE...HSLKACRQVVDQQLRDVSPE M KRLVLFAAVVVALVALT AEGEASGQLQCERELQE H LKAC QVVDQQLRDVSPE MAKRLVLFAAVVVALVALTAAEGEASGQLQCEHELEA........CQQVVDQQLRDVSPG M AKRLVLFAAVVVALVALT AEGEASGQLQCEHELE CQQVVDQQLRDVSPG MAKRLVLFVAVVVALVALTVAEGEASGQLQCERELQE...RELKACQQVMDQQLRDISPK M AKRLVLF AVVVALVALTVAEGEASGQLQCERELQE RELKACQQVMDQQLRDISP MAKRLVLFVAVVVALVALTVAEGEASEQLQCERELQELQERELKACQQVMDQQLRDISPE M AKRLVLF AVVVALVALTVAEGEASEQLQCERELQE RELKACQQVMDQQLRDISPE MAKRLVLFAAVVVALVALTIAEGEASGQLQCERELQE...RSLKACRQVMDQQLRDVSPE M AKRLVLFAAVVVALVALTIAEGEASGQLQCERELQE R LKAC QVMDQQLRDVSPE MAKRLVLFAAVVVALVALTVAEGEASGQLHCERELQE...RELEACRQIVDQQLRDTSPG M AKRLVLFAAVVVALVALTVAEGEASGQLHCERELQE REL AC QIVDQQLRD SPG m krlvlf avvvalvalt aegeas ql ce el c q dqqlrd sp CHPVVVSPVAGQYEQQIVVPPKGGSFYPGETTPPQQLQQSIFWGIPALLKRYYPSVTSPQ C HPVVVSPVAGQYEQQIVVPPKGGSFYPGETTPPQQLQQSIFWGIPALLKRYYPSVTSPQ CQPVGGGPVARQYEQQVVVPPKGGSFYPGETTPPQQLQQSILWGIPALLRRYYLSVTSPQ C QPV GPVA QYEQQVVVPPKGGSFYPGETTPPQQLQQSILWGIPALLRRYY SVTSPQ CQPVGGGPVARQYEQQVVVPPKGGSFYPGETTPPQQLQQSILWGIPALLRRYYLSVTSPQ C QPV GPVA QYEQQVVVPPKGGSFYPGETTPPQQLQQSILWGIPALLRRYY SVTSPQ CRPITVSPGTRQYEQQPVVPSKAGSFYPSETTPSQQLQQMIFWGIPALLRRYYPSVTSSQ C RPI VSP QYEQQ VVP KAGSFYPSETTP QQLQQ IFWGIPALLRRYYPSVTS Q CHPVVVSPVAGQYEQQIVVPPKGGSFYPGETTPPQQLQQSIFWGIPALLKRYYPSVTSPQ C HPVVVSPVAGQYEQQIVVPPKGGSFYPGETTPPQQLQQSIFWGIPALLKRYYPSVTSPQ CHPVVVSPVAGQYEQQIVVPPKGGSFYPGETTPPQQLQQRIFWGIPALLKRYYPSVTCPQ C HPVVVSPVAGQYEQQIVVPPKGGSFYPGETTPPQQLQQ IFWGIPALLKRYYPSVT PQ CHPVVISPIARQYEQQIVVPPKGGSLYPGETTPPQQLQQSIFWGIPTLLRRYYPSVTSSQ C HPVVISPIA QYEQQIVVPPKGGSLYPGETTPPQQLQQSIFWGIP LLRRYYPSVTS Q CRPVAVSPGTGQHEQQTVVPLKGGSFYPDETSPPQQLEQRILWGIPTLLKRYYPSVTSPH C RPV VSP GQ EQQ VVP KGGSFYPDET PPQQLEQ ILWGIP LLKRYYPSVTSPH c p p q eqq vvp k gs yp et p qql q i wgip ll ryy svt QVSYYPGQASPQWSGQGQQPGQGQQSVQGQQGYYSTSPQQ......PGQWQ......... Q VSYYPGQASPQW GQGQQPGQGQ Q YY TSPQQ PGQ Q QVSYYPGQASSQRPGQGQQPGQGQ......QEYYLTSPQQSGQWQQPGQGQAGYYPTSPQ Q VSYYPGQAS QRPGQGQQPGQGQ Q YY TSPQQ PGQGQ QVSYYPGQASSQRPGQGQQ............EYYLTSPQQSGQWQQPGQGQSGYYPTSPQ Q VSYYPGQAS QRPGQGQQ YY TSPQQ PGQGQ QGSYYPGQASPQQSGQGQQPGQ...............EQQ......PGQGQQD......Q Q SYYPGQASPQ GQGQQPGQ QQ PGQGQ QVSYYPGQASPQRPGQGQQPGQGQQSVQEQQGYYSTSPQQ......PGQWQ......... Q VSYYPGQASPQRPGQGQQPGQGQ Q YY TSPQQ PGQ Q QVSYYPGQASPQRPGQGQQPGQGQ......QGYYPTSPQQ......PGQWQ......... Q VSYYPGQASPQRPGQGQQPGQGQ Q YY TSPQQ PGQ Q QASYYPGQASPQRPGQGQQ...........................PGQGQ......... Q SYYPGQASPQRPGQGQQ PGQGQ QGSYYLGQTSLRQPGQAQQPGQGQQPG...QAQQPGQGQQ......PGQRQ......... Q SYY GQ S PGQAQQPGQGQ Q QQ PGQ Q q syy gq s gq qq pgq q QPEQGQPEYYPTSLQQPGQLQ Q PEQGQPEYYPTS QQPGQLQ QSGQEQPGYYPTSPWQPEQLQ Q GQEQPGYYPTSP QPEQLQ QSGQKQPGYYPTSPWQPEQLQ Q GQ QPGYYPTSP QPEQLQ QPGQRQQGYYPTSPQQPGQGQ Q PGQ Q GYYPTSPQQPGQ Q QPEQGQPGYYPTSLQQPGQLQ Q PEQGQPGYYPTS QQPGQLQ QPEQGQQGYYPTSPQQPGQLQ Q PEQGQ GYYPTSPQQPGQLQ QPGPEQQGYYPISPQQPE... Q PG EQ GYYP SPQQPE
引物设计的详细步骤
引物设计的详细步骤引物设计步骤如下:1.目标序列选择:根据研究目的选择需要扩增或检测的目标DNA序列。
这个目标序列可能是基因的特定区域、启动子区域、外显子、cDNA序列等。
选择一个合适的目标序列对于引物设计至关重要,因为它将决定引物的特异性和扩增产物的大小。
一般而言,目标序列具有良好的保守性和特异性。
2.引物长度和Tm计算:引物通常是15-30个核苷酸长度。
引物长度的选择取决于目标序列的特点以及所使用的实验条件。
合适的引物长度应该综合考虑引物的特异性和扩增效率。
引物的熔解温度(Tm)是指DNA链的两个链断裂开所需要的温度,它是引物设计中一个重要的参数。
Tm可以通过计算引物的碱基组成、盐度和引物浓度等因素来估计,通常约为55-65℃。
3. 引物特异性检查:使用生物信息学工具,如BLAST(Basic Local Alignment Search Tool)或NCBI(National Center forBiotechnology Information)数据库来检查所设计引物的特异性。
确保引物不会扩增与目标序列不匹配的区域,避免非特异性扩增和假阳性结果。
4.引物序列设计:根据目标序列和引物长度选择合适的引物序列。
引物设计的要求包括:GC含量约为40-60%、避免重复序列和目标序列内部的局部重复、避免碱基偏差和突变等。
此外,引物的碱基组成应该是均匀的,避免多个连续G或C碱基的存在。
6.引物的合成:将设计好的引物交给合成公司进行合成,通常采用化学合成方法。
引物的质量控制非常重要,合成的引物应进行质控检测,如毛细管电泳或质谱分析。
推荐文献:2. Untergasser A, et al. (2024) Primer3--new capabilities and interfaces. Nucleic Acids Res. 40(15): e115.。
引物设计是分子生物学研究中必不可少的技术之一、通过遵循上述步骤和参考推荐文献,可以设计出特异性高、效率好的引物,为后续实验的顺利进行提供支持。
dna引物的设计方法
dna引物的设计方法DNA引物的设计方法引物(primer)是DNA扩增反应中的关键组成部分,它的设计直接影响到扩增反应的效果和结果。
DNA引物的设计方法是基因组学和分子生物学研究中的重要内容之一,合理的引物设计可以提高扩增反应的特异性和敏感性。
本文将介绍几种常见的DNA引物设计方法。
1. 引物长度的选择DNA引物的长度一般在18-30个碱基对之间。
引物长度的选择要根据目标序列的长度和GC含量来确定。
过短的引物可能导致非特异性扩增,而过长的引物则会降低扩增的效率。
一般来说,引物的长度应该在20个碱基对左右。
2. 引物序列的选择引物序列的选择是DNA引物设计中的关键步骤。
引物序列应该是与目标序列互补的DNA序列。
在选择引物序列时,需要遵循以下几个原则:(1) 引物序列应该与目标序列的5'末端互补,这样可以保证引物能够与目标序列的起始位置结合;(2) 引物序列不能与非靶DNA序列互补,以避免非特异性扩增;(3) 引物序列的GC含量应在40%-60%之间,这样可以提高引物与目标序列的互补性。
3. 引物的熔解温度计算引物的熔解温度是指引物与目标序列结合的温度,它是DNA引物设计中的重要参数。
引物的熔解温度可以通过计算工具或公式来估算,一般公式为:Tm = 4(G+C) + 2(A+T)。
其中,G、C、A、T 分别代表引物中G、C、A、T的个数。
通过计算得到的熔解温度可以用来评估引物与目标序列结合的稳定性。
4. 引物的特异性检测引物的特异性是指引物只能与目标序列结合,而不能与其他非靶DNA序列结合。
为了确保引物的特异性,可以使用引物设计软件或在线工具来进行特异性检测。
这些工具可以帮助识别引物与非靶序列的互补性,以确保引物只能与目标序列结合。
5. 引物的杂交性检测引物的杂交性是指引物与目标序列的互补性。
为了检测引物的杂交性,可以使用引物设计软件或在线工具来进行杂交性分析。
这些工具可以帮助预测引物与目标序列的互补性和可能的二级结构形成。
进化树的构建[整理版]
烦请各位看看,有没有什么大的问题,请直接贴上你的意见和建议,我会尽快修改。
主要是针对初学者,写得尽量简单一些。
谢谢!phylogentics_lylover.doc (73.0k)lz还真勤劳,一个字:顶Amazing!Thank you for your hard work!oldfish的批评意见也一并上传。
写得不错。
呵呵phylogentics_lylover_with_comments.doc (105.5k)晕,出丑了...改过来了。
谢谢再贴一个来自yzwpf 的批评意见。
写得很不错。
NJ,ML,Bayes均需要选择模型,对PAUP和MrBayes而言,ModelTest有专门的版本可自动选择模型,意味着它会输出两者专用的设置模型的命令,用户需要的只是将该命令简单的复制粘贴。
MrBayes和MAC5均可利用gap信息构建进化树。
ml法无需比对应该是错误的。
至少在paup中未比对会出错。
计算基因分化的年代,这个更一般的是知道进化树中某两个或更多物种的分歧时间,然后可以使用r8s软件分析进化树中其他序列的分歧时间。
在mega中打开树后也可进行极为简单的年代分析,但必须满足分子钟假设且无法根据多个分歧时间进行校正!>楼主,这是我写的帖子呀!怎么变成了mediocrebeing,呵呵!NJ,ML,Bayes均需要选择模型,对PAUP和MrBayes而言,ModelTest有专门的版本可自动选择模型,意味着它会输出两者专用的设置模型的命令,用户需要的只是将该命令简单的复制粘贴。
MrBayes和MAC5均可利用gap信息构建进化树。
ml法无需比对应该是错误的。
至少在paup中未比对会出错。
计算基因分化的年代,这个更一般的是知道进化树中某两个或更多物种的分歧时间,然后可以使用r8s软件分析进化树中其他序列的分歧时间。
在mega中打开树后也可进行极为简单的年代分析,但必须满足分子钟假设且无法根据多个分歧时间进行校正!1Mega的功能:▲数据输入▲排序功能数据处理▲密码子分析▲序列综合编辑▲序列阅读▲Substitution Pattern Homogeneity Test 单因子模式替换分析▲遗传距离▲选择测试▲分子钟▲进化树构建▲距离矩阵▲系统树分析2Bioedit的功能:序列处理和编辑功能▲用于序列处理和编辑的简单的图形界面▲使用编辑选项包括残基的select and drag 选择和拖动和grab and drag 抓取和拖动变量选择选项鼠标点击插入和删除缺口全框选择全屏编辑中剪切复制和粘贴编辑窗口的自动刷新。
设计引物的方法
设计引物的方法引物设计是分子生物学和遗传学研究中的重要环节,它的质量直接影响到PCR 扩增、基因克隆和序列分析等实验的结果。
因此,设计引物的方法显得尤为重要。
在进行引物设计时,需要考虑引物的长度、GC含量、配对特异性、副产物形成和二聚体等因素,以下将详细介绍设计引物的方法。
首先,引物的长度是影响引物特异性和PCR扩增效率的重要因素。
通常,引物的长度应在18-25个碱基对之间,过短的引物可能导致特异性不足,而过长的引物则可能影响PCR扩增效率。
因此,在设计引物时,需要根据目标序列的特点合理确定引物的长度。
其次,GC含量对引物的特异性和稳定性也有重要影响。
一般来说,引物的GC 含量应在40%-60%之间,过高或过低的GC含量都可能导致引物的特异性不足。
因此,在设计引物时,需要通过计算目标序列的GC含量,并合理调整引物的序列,以保证引物的特异性和稳定性。
此外,引物的配对特异性也是设计引物时需要考虑的重要因素。
在目标序列中,需要避免引物与非特异靶序列的配对,因此在设计引物时,需要通过比对目标序列和相关非靶序列,以保证引物的特异性。
另外,引物的副产物形成和二聚体的形成也是设计引物时需要注意的问题。
副产物形成可能导致PCR扩增产物的杂交和非特异性扩增,而引物的二聚体可能导致引物的特异性和扩增效率下降。
因此,在设计引物时,需要通过计算引物的热力学特性,以避免副产物形成和二聚体的形成。
综上所述,设计引物的方法需要综合考虑引物的长度、GC含量、配对特异性、副产物形成和二聚体等因素。
通过合理设计引物,可以保证PCR扩增的特异性和效率,从而确保实验结果的准确性和可靠性。
在实际操作中,可以借助生物信息学工具和引物设计软件,以辅助设计高质量的引物。
希望本文介绍的引物设计方法对您有所帮助。