引物设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、引物设计step by step
1、在NCBI上搜索到目的基因,找到该基因的mRNA,在CDS选项中,找到编码区所在位置,在下面的origin中,Copy该编码序列作为软件查询序列的候选对象。
2、用Primer Premier5搜索引物
①打开Primer Premier5,点击File-New-DNA sequence, 出现输入序列窗口,Copy目的序列在输入框内(选择As),此窗口内,序列也可以直接翻译成蛋白。
点击Primer,进入引物窗口。
②此窗口可以链接到“引物搜索”、“引物编辑”以及“搜索结果”选项,点击Search按钮,进入引物搜索框,选择“PCR primers”,“Pairs”,设定搜索区域和引物长度和产物长度。
在Search Parameters里面,可以设定相应参数。
一般若无特殊需要,参数选择默认即可,但产物长度可以适当变化,因为100~200bp的产物电泳跑得较散,所以可以选择300~500bp.
③点击OK,软件即开始自动搜索引物,搜索完成后,会自动跳出结果窗口,搜索结果默认按照评分(Rating)排序,点击其中任一个搜索结果,可以在“引物窗口”中,显示出该引物的综合情况,包括上游引物和下游引物的序列和位置,引物的各种信息等。
④对于引物的序列,可以简单查看一下,避免出现下列情况:3’不要出现连续的3个碱基相连的情况,比如GGG或 CCC,否则容易引起错配。
此窗口中需要着重查看的包括:T m应该在55~70度之间,GC%应该在45%~55%间,上游引物和下游引物的T m值最好不要相差太多,大概在2度以下较好。
该窗口的最下面列出了两条引物的二级结构信息,包括,发卡,二聚体,引物间交叉二聚体和错误引发位置。
若按钮显示为红色,表示存在该二级结构,点击该红色按钮,即可看到相应二级结构位置图示。
最理想的引物,应该都不存在这些二级结构,即这几个按钮都显示为“None”为好。
但有时很难找到各个条件都满足的引物,所以要求可以适当放宽,比如引物存在错配的话,可以就具体情况考察该错配的效率如何,是否会明显影响产物。
对于引物具体详细的评价需要借助于Oligo来完成,Oligo自身虽然带有引物搜索功能,但其搜索出的引物质量感觉不如Primer5.
⑤在Primer5窗口中,若觉得某一对引物合适,可以在搜索结果窗口中,点击该引物,然后在菜单栏,选择File-Print-Current pair,使用PDF虚拟打印机,即可转换为Pdf文档,里面有该引物的详细信息。
3、用Oligo验证评估引物
①在Oligo软件界面,File菜单下,选择Open,定位到目的cDNA序列(在primer中,该序列已经被保存为Seq文件),会跳出来两个窗口,分别为Internal Stability(Delta G)窗口和Tm窗口。
在Tm窗口中,点击最左下角的按钮,会出来引物定位对话框,输入候选的上游引物序列位置(Primer5已经给出)即可,而引物长度可以通过点击Change-Current oligo length来改变。
定位后,点击Tm窗口的Upper按钮,确定上游引物,同样方法定位下游引物位置,点击Lower按钮,确定下游引物。
引物确定后,即可以充分利用Analyze
菜单中各种强大的引物分析功能了。
②Analyze中,第一项为Key info,点击Selected primers,会给出两条引物的概括性信息,其中包括引物的T m值,此值Oligo是采用nearest neighbor method计算,会比Primer5中引物的Tm值略高,此窗口中还给出引物的Delta G和3’端的Delta G.3’端的Delta G 过高,会在错配位点形成双链结构并引起DNA聚合反应,因此此项绝对值应该小一些,最好不要超过9。
③Analyze中第二项为Duplex Formation,即二聚体形成分析,可以选择上游引物或下游引物,分析上游引物间二聚体形成情况和下游引物间的二聚体情况,还可以选择
Upper/Lower ,即上下游引物之间的二聚体形成情况。
引物二聚体是影响PCR反应异常的重
要因素,因此应该避免设计的引物存在二聚体,至少也要使设计的引物形成的二聚体是不稳定的,即其Delta G值应该偏低,一般不要使其超过4.5kcal/mol,结合碱基对不要超过3个。
Oligo此项的分析窗口中分别给出了3’端和整个引物的二聚体图示和Delta G值。
④Analyze中第三项为Hairpin Formation,即发夹结构分析。
可以选择上游或者下游引物,同样,Delta G值不要超过4.5kcal/mol,碱基对不要超过3个。
Analyze中第四项为Composition and T m,会给出上游引物、下游引物和产物的各个碱基的组成比例和Tm值。
上下游引物的GC%需要控制在40%~60%,而且上下游引物之间的GC%不要相差太大。
Tm值共有3个,分别采用三种方法计算出来,包括nearest neighbor method、%GC method和2(A+T)+4(G+C)method,最后一种应该是Primer5所采用的方法,T m值可以控制在50~70度之间。
第五项为False Priming Sites,即错误引发位点,在Primer5中虽然也有False priming 分析,但不如oligo详细,并且oligo会给我正确引发效率和错误引发效率,一般的原则要使误引发效率在100以下,当然有时候正确位点的引发效率很高的话,比如达到400~500,错误引发效率超过100幅度若不大的话,也可以接受。
⑤Analyze中,有参考价值的最后一项是“PCR”,在此窗口中,是基于此对引物的PCR反应Summary,并且给出了此反应的最佳退火温度,另外,提供了对于此对引物的简短评价。
若该引物有不利于PCR反应的二级结构存在,并且Delta G值偏大的话,Oligo在最后的评价中会注明,若没有注明此项,表明二级结构能值较小,基本可以接受。
⑥引物评价完毕后,可以选择File-Print,打印为PDF文件保存,文件中将会包括所有Oligo 软件中已经打开的窗口所包括的信息,多达数页。
因此,打印前最好关掉Tm窗口和Delta G 窗口,可以保留引物信息窗口、二级结构分析窗口(若存在可疑的异常的话)和PCR窗口。
4、引物确定后,对于上游和下游引物分别进行Blast分析,一般来说,多少都会找到一些其他基因的同源序列,此时,可以对上游引物和下游引物的blast结果进行对比分析,只要没有交叉的其他基因的同源序列就可以。
二、引物设计过程中的心得
1、Primer 5.0搜索引物
①Primer Length我常设置在18-30bp,短了特异性不好,长了没有必要。
当然有特殊要求的除外,如加个酶切位点什么的。
②PCR Product size最好是100-500bp之间,小于100bp的PCR产物琼脂糖凝胶电泳出来,条带很模糊,不好看。
至于上限倒也不必要求苛刻。
③Search parameters还是选Manual吧,Search stringency应选High,GC含量一般是40-60%。
其它参数默认就可以了。
④搜索出来的引物,按Rating排序,逐个送Oligo软件里评估。
当然,搜索出的引物,其扩增产物很短,你可以不选择它,或是引物3端≥2个A或T,或引物内部连续的G或C太多,或引物3端≥2个G或C,这样的引物应作为次选,没得选了就选它。
对于这样的引物,如果其它各项指标还可以,我喜欢在引物末端去掉一个不满意的或加上一个碱基,看看引物的评估参数有没有变好点。
2、Oligo 6.0评估引物
①在analyze里,Duplex Formation不管是上游引物、下游引物还是上下游引物之间,The most stable 3’-Dimer绝对值应小于4.5kcal/mol, The most stable Dimer overall绝对值一般应小于多少kcal/mol跟PCR退火温度有关,我几次实验感觉在PCR退火温度在65°的时候,The most stable Dimer overall 6.7kcal/mol没有问题。
②Hairpin Formation根据黄金法则
③False priming sites: Primer的priming efficiency应该是错配地方的4倍左右,更多当然更好。
④在PCR栏,丁香园战友感觉其所显示的optimal annealing temperature数值值得参考。
在PCR摸索条件的时候,退火温度为其数值加减2的范围就可以了。
⑤Internal stability很重要:我们希望引物的内部稳定性是中间高、两边低的弧形,最起码保证3端不要过于稳定。
下图引物3端过于稳定,很容易导致不适当扩增。
△G参照黄金法则,这其实很好理解:把一滴水放到大海里,这滴水就会不停的扩散分布,扩散的越厉害越稳定,所以△G绝对值越大结构越稳定。
3、其他
①两个评价系统不一样,丁香园战友感觉oligo评价引物好点,primer出来的引物,一般按效率排序,再结合退火温度和引物长度,选择引物到oligo测试。
这是初步的选择,其实引物到了oligo里,退火温度也不一样。
②3端的二聚体应该避免,这个要看退火温度决定,一个50°的退火温度肯定和65°对二聚体的影响不一样了,一般来讲尽量控制在-4.5kcal/mol以下(丁香园战友观点,很多东西真得还是需要自己摸索)。
③丁香园战友感觉3端有A无A影响不大,3端有T是不是一定不行,不见得。
软件是评估,法则也不是没有例外,不是1+1=2那么确定。
④错配和二聚体谁轻谁重,丁香园战友觉得“到致命的程度”谁都重要,在设计的时候,尽量两个都不得罪。
⑤GC含量并非不重要,它直接影响引物各端稳定性,3端来两个G或C,稳定性就上去了,粘在模板上很牢。
所以丁香园战友设计引物的时候,会尽量避免这样的情况出现。