生物信息学序列分析生物信息学常用软件及其使用优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如EcoRI 识别序列:
n5’GAATTC 3’ 3’CTTAAG 5’
5’GGATCC 3’ 3’CCTAGG 5’
限制性核酸内切酶命名
❖Smith和Nathame命名原则(1973)
属名 + 种名 + 株名 + 流水 例如: 流感噬血杆菌d株
(Haemophilus influengae d)
❖ 推荐使用自动搜索软件(商业软件): Primer Premier 5.0
❖ 推荐使用引物评价软件(商业软件) :Oligo 6 网址: http://www.oligo.net
OLIGO 6.0 PCR 引物设计
设计引物的免费在线软件Primer3,
(三)引物设计要点
❖ 一般引物的长度为15-30bp,常用的长度为18-24bp,过长 或过短都不合适。
❖ 引物3’端的碱基一般不用A,因为A在错误引发位点的引发 效率相对比较高,而其它三种碱基的错误引发效率相对小一 些。
❖ 引物的GC含量一般为45-55%,过高或过低都不利于引发反 应。上下游引物的GC含量不能相差太大。
❖ 引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生 引物二聚体带,且会降低引物浓度从而导致PCR正常反应不能 进行。
❖ 对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别 序列确定,常常对上下游引物修饰的序列选用不同限制酶的识 别序列,以有利于以后的工作。
(四)、引物设计软件的使用
TCTAG/A
SmaⅠ CCC/GGG
GGG/CCC
EcoRⅠ G/AATTC
CTTAA/G
sticky end
5’
3’
EcoRⅠ GAATTC
CTTAAG
3’
Байду номын сангаас
5’
blunt end
5’
3’
SmaⅠ CCCGGG
GGGCCC
3’
5’
5’
3’
5’
3’
G
AATTC
CTTAA
G
3’
5’
3
5’
5’
3’ 5’
生物信息学序列分析生物信息学常用 软件及其使用
一、DNA 序列片断拼接
(电子基因克隆)
❖ 获得感兴趣的EST,在dbEST数据库中找出EST的最有途径是寻 找同源序列,标准:长度≥100bp,同源性50%以上、85%以 下。
❖ 然后将检出序列组装为重叠群(contig),以此重叠群为被检 序列,重复进行BLAST检索与序列组装,延伸重叠样系列,重 复以上过程,直到没有更多的重叠EST检出或者说重叠群序列 不能继续延伸,有时可获得全长的基因编码序列。
❖ 引物所对应模板序列的Tm值最好在72℃左右,当然由于模 板序列本身的组成决定其Tm值可能偏低或偏高,可根据具 体情况灵活运用。
❖ ΔG值反映了引物与模板结合的强弱程度,也是一个重要的引 物评价指标。
❖ 一般情况下,在Oligo 5.0软件的ΔG值窗口中,引物的ΔG值 最好呈正弦曲线形状,即5’端和中间部分ΔG值较高,而3’端 ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对 值),如此则有利于正确引发反应而可防止错误引发。
❖ 其原理,引物与模板应具有较高的结合能量,这样有利于引 物与模板序列的整合,因此5’端与中间段的ΔG值应较高,而 3’端ΔG值影响DNA聚合酶对模板DNA的解链,过高则不利 于这一步骤。
❖ 可能的错误引发位点决定于引物序列组成与模板序列组成的相 似性,相似性高则错误引发率高,错误引发的引发率一般不要 高过100,最好没有错误引发位点,如此可以保证不出非目的 产物的假带。
❖ 再与GeneBank核酸数据库进行相似性检测,假如有精确匹配 基因,将EST序列数据据EST六种阅读框翻译成蛋白质,接着 与蛋白质序列数据库进行比较分析。
v Vector NTI 5.2 中的contig Express v Contig Express软件: v Sequencer软件:
ftp://genecodes.com/pub/SequencherPC.zip
(包括杂交探针设计)
(一)引物设计的原则 引物要跟模板紧密结合; 引物与引物之间不能有稳定的二聚体或发夹结构存在; 引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。
(二)引物设计需要考虑的因素
❖ 引物长度(primer length), ❖ 产物长度(product length), ❖ 序列Tm值 (melting temperature), ❖ ΔG值(internal stability), ❖ 引物二聚体及发夹结构(duplex formation and hairpin), ❖ 错误引发位点(false priming site), ❖ 引物及产物GC含量(composition),有时还要对引物 进行修饰,如增加限制酶切点,引进突变等。
DNA的一类内切酶。即一类能识别双链DNA分子中特异核苷酸 序列的DNA水解酶。
是细菌内存在的保护性酶。分为I、II、III三类。
其中的II类限制性核酸内切酶是重组DNA技术中的重 要工具酶。
II类酶识别序列特点为回文结构,大多为 4~6 bp 回 文结构(palindrome sequence),
举例说明使用
二、DNA序列测定图谱分析 Chromas软件:
http://www.technelysium.com.au/chromas230.exe
三、限制性核酸内切酶位点的分析
(一)定义:
限制性核酸内切酶(restriction endonuclease)
识别DNA的特异序列,并在识别位点或其周围切割双链
3’
CCC GGG
GGG CCC
3’
5’ 3’
5’
v利用NEB Lab在线免费软件分析:
http://tools.neb.com/NEBcutter2/index.php
❖DNAStar、DNAClub、DNATool 等其他商业软件均能分析。 以DNAClub为例说明。
四、PCR 引物设计
Hind Ⅰ Hind Ⅱ Hind Ⅲ Hind Ⅳ
常用的限制性核酸内切酶酶切序列
限制酶 识别序列及切口 限制酶 识别序列及切口
Alu Ⅰ AG/CT
TC/GA
Hind Ⅲ A/AGCTT
TTCGA/A
BamHⅠ G/GATCC
CCGAG/G
SalⅠ G/TCGAC
CAGCT/G
BglⅠ A/GATCT