图解引物设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2013-10-27
实例图解简并引物设计(By Raindy)
【絮语】
设计一对合适的引物是PCR扩增目的基因成功的关键,但许多人往往过度依赖 Primer Premier(以下简称PP)或Oligo 等引物设计软件,有时候引物没设计成,却身陷软件之中无法自拔。其实,不论特异性引物或简并引物,只要掌握了几个关键点,手动也可以设计出一对好引物。如果不是大批量设计引物或设计复杂的引物序列,下面的四个常用工具即可轻松胜任引物设计任务。下文以马铃薯Y病毒CP基因简并引物设计为示例,分享一些个人经验,希望对初学者能起个抛砖引玉作用。受专业领域及水平所限,文中有不当之处,敬请各位同仁、童鞋批评指正。
【相关工具】
(1)MEGA5-多重序列比对、选取基因区域、序列编辑
(2)DNAMAN8-检测两引物的互补性
(3)Oligo Calc-评估引物的属性
(4)Web Logo 3-直观显示简并碱基
-------------------------------------------------【华丽分割线】------------------------------------------------- 【基本原则】
设计一对好的引物,归结起来就是5′端引物、3′端引物之间以及两者与模板的关系处理得恰到好处:
(1)两引物的序列要与模板的序列紧密互补;
(2)两引物不能在模板的非目的位点发生错配;
(3)两引物之间尽量减少二聚体或发夹结构生成。
【延伸原则】
(1)引物长度:常用为 18-27bp,最大不可超过38bp,否则容易导致延伸温度过高,不适合DNA聚合酶反应;
(2)GC含量:一般介于40%-60%之间,且两个引物之间的GC含量相差不能过于悬殊;
(3)碱基分布:随机分布最佳,但避免连续的GC,GC富集区容易导致错误引发反应。【特别注意】
5′端引物的作用主要限定PCR产物的长度,对扩增特异性影响不大;引物的延伸是从3′端开始的,所以3′端引物是影响特异性扩增的最关键因素,因此,在实际设计过程中,设计3′端引物时,需要综合考虑以下几个内容:
(1)不要终止于密码子的第 3 位
(2)末位碱基避免使用碱基 A
(3)避免出现3个以上连续的G或C,如GCG或CCC或GGG
(4)ΔG的绝对值不可超过 9
(5)与非特异扩增的序列同源性不能超过70%或有连续8个互补碱基同源
(6)不能进行任何修饰
---------------------------------------【华丽分割线】-------------------------------------------------
【设计流程】
【示例背景】
马铃薯Y病毒(Potato virus Y, PVY)是侵染马铃薯、烟草、辣椒等茄科作物并造成严重危害的病毒之一,广泛分布全球各马铃薯种植区。RT-PCR技术具有高度的特异性和灵敏性等特点,已经成为 PVY检测最常见的方法。但由于PVY株系分化严重,不断有新的重组株系产生,单一的特异性引物无法适应PVY不同株系的检测需求,需要设计一对简并引物以能够满足生产上的检测需求。
【详细图解】
1.序列准备:
(1)GenBank 下载PVY全基因组序列
(2)由于基因序列比较大,且数量多,推荐用MAFFT多重序列比对
(3)扩增片段区域选择,CP基因长度及位置如下图所示:
先将光标定位在第一条序列任意位置,然后在左下角"Site"处直接输入CP基因上游分界点位置(8391)后回车。接着点击“Speicaes/Abbrv”和8391那一列的交界点时按下键盘上“Shift”不放,移动光标到“1”那一列,此时点击鼠标右键“Delete”删除冗余序列。
裁切后得到CP基因编码区序列,“Export Alignment”导出CP基因序列(推荐fasta格式)。
2. 引物设计
推荐先设计3′端引物,至于原因,上面的【特别注意】中已提到,这里不再赘述。
(1)选择引物序列
综合考虑引物设计原则及特别注意,在CP基因3'端位置选取一段合适的序列
(784-803bp),804bp位置为A且是第三个密码子位置,所以弃去末位的A碱基。
---------------------------------------------------------------------------------------------------
PS:是否位于密码子的第3位,可以通过“Tranlated Protein Sequences”-“DNA sequences”切换查看,如下图,CP基因的末端3个碱基是终止密码子所在的位置,A是第三位密码子。
---------------------------------------------------------------------------------------------------
(2)生成 Seq Logo
选定序列后,参考上述步骤,删除冗余序列,保留CP基因3'端序列,同样导出为Fasta 文件,将序列粘贴入Web Logo3(/create.cgi)的文本框内或
直接上传序列文件,设置相关参数后点击“Create”生成 Seq Logo格式的文件CP-3.fas。
参数设置: “Output format”(输出格式)推荐用“PDF”,“Color scheme”(颜色方案)
推荐用“Classic (NA)”,设置完毕,点击右下角“Create Logo“即可得下图的Seq Logo 格式文
件。
通过Web Logo 生成的多重比对图片可以很直观得到3'端序列为
CTTGGAGT(C/T/G)AA(G/A)AACATGTG,查询简并碱基代码表(下图),可知C/T/G=B,G/A=R,简并度=3 ×2 =6,整理后3′端序列为 CTTGGAGT B AA R AACATGTG,故而需要合
成的3′端引物序列: CACATGTT Y TT V ACTCCAAG (与原序列是反向互补关系)。