dna序列分析4

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章

基因组测序的步骤:1、选择物种2、从细胞中分离DNA,获得大量高质量的样品3、吧经纯化的DNA随机切割成大小合适的重叠的片段4、把DNA片段插入载体中,这就可无限扩增5.、测出每一DNA片段的碱基序列6、确定片段间的重叠,把序列组装成最终的基因组序列

概念性翻译:给定一个DNA序列,可以利用遗传密码将其翻译为蛋白序列。

分子生物学的主要研究对象是核酸and 蛋白质生物大分子序列分析是生物信息学的核心方法。

“六框翻译”的步骤1对正向序列作Frame Shifting三次;2利用遗传密码表,得到三个正向翻译结果3将正向序列首尾对调,得到反向序列4对反向序列作A T G C 互补变换5对反向互补序列再作Frame Shifting三次6利用遗传密码表,得到三个反向翻译结果;

EST分析工具通常分为3类:

①序列相似性查询( sequence similarity search )②序列组装( sequence assembly) ③序列聚类( sequence clustering)

EST 要素1)EST字母表2)INDEL(插入/缺失)和移码(frame shift) 3)剪接变体4)非编码区EST

如何检测DNA序列中潜在的CDS?

(1) ORF长度很难随机地发现很长的ORF,因而长的ORF很可能意味着存在CDS(2) Kozak 序列该序列是在起始密码子之前与核糖体作用的位点。在高等原核生物中其一致序列为GCCACC(ATG)而在酵母中为AAAAAA(ATG)。它们可以用来检测CDS的起始(3) 密码子用法(codon usage)在编码区和非编码区中,密码子用法是不同的。尤其是对特定氨基酸,密码子的用法可能随物种而变。因而,统计密码子用法可以用来推断5’和3’ UTR,并且有助于检测错译

当mRNA在编辑过程中产生不同的多肽时,所产生的蛋白质称为剪接变体(splice variant)或选择剪接形式(alternatively spliced form)。

表达序列标签(expressed sequence tag,EST)EST是从cDNA文库中生成的一些很短的序列(300-500bp),它们代表在特定组织或发育阶段表达的基因,有时可代表特定的cDNA。EST 可能是编码的,也可能不是,而两端有重叠序列的EST可以组装成全长的cDNA序列。

电子克隆,又称虚拟克隆(virtual cloning),其原理是根据大量EST具有相互重叠的性质,通过计算机算法获得cDNA全长序列。

子序列如果整个序列A与序列B的一部分完全一致,则称A为B的子序列。

序列对位排列分两大类全局对位排列(Global Alignment)针对序列的全长范围进行最优对位排列。局部对位排列(Local Alignment)只对局部范围进行最优对位排列。

相关文档
最新文档