基因组学和蛋白质组学工具 ppt课件

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
功能基因组在评估和检测新药时十分有用。
基因组学和蛋白质组学工具
DNA微阵列——功能基因组中的新兴技术 DNA微阵列(DNA microarray)又称DNA阵列或DNA芯片,比
较通俗的名字是基因芯片(gene chip)。是一块带有DNA微阵列 (micorarray)涂层的特殊玻璃片,在数平方厘米之面积上安装 数千或数万个核酸探针,经由一次测验,即可提供大量基因序列 相关资讯。它是基因组学和遗传学研究的工具。研究人员应用基 因芯片就可以在同一时间定量的分析大量(成千上万个)的基因达 的水平,具有快速、精确、低成本之生物分析检验能力 。
现在常用的DNA芯片有两种:cDNA阵列和原位合成的寡核苷 酸阵列。
cDNA阵列是通过机械手将DNA 点样到涂层的玻片表面,点样 直径为5O~150um,中等尺寸的DNA芯片在3.6平方厘米上有10000 个点。
基因组学和蛋白质组学工具
原位合成的寡核苷酸阵列,是将寡核苷酸合成和照相平版印 刷术结合起来,紫外光通过掩罩(mask)的孔照射到玻片上控制合 成,产生的DNA芯片在1.6cm 玻片表面可容纳65000~400000个DNA 寡核苷酸。
基因组学和蛋白质组学工具
功能基因组学的概念: 功能基因组学(Functuional genomics)又往往被称为后基
因组学(Postgenomics),它利用结构基因组所提供的信息和产 物,发展和应用新的实验手段,通过在基因组或系统水平上全面 分析基因的功能,使得生物学研究从对单一基因或蛋白质得研究 转向多个基因或蛋白质同时进行系统的研究。
其中可以用来检测基因表现程度之 cDNA 微阵列(cDNAmicroarray),已开始商业化,市场主要以研发实验室为主。
基因组学和蛋白质组学工具
DNA 微阵列技术的基本原理是序列特异性核酸杂交,其核心 技术是逆Southern blot印迹法,即:将基因特异的探针固定在 膜上,再与荧光标记的诱变物的基因组或cDNAs靶杂交。不过, 点印迹通常制备在膜上,很少能超过700个基因,DNA 微阵列可 以制备在玻片或硅片等片基上,点的数量和密度也高得多。
当基因组被提取成限制性片段时,它只是被部分提取。用于 DNA样品的限制性酶数量只能够切开50%的酶切位点。这就意味 着有些片段会跨过某个特殊的限制性位点,而另一些片段会在那 个特定位点切开,而跨过其他的限制性位点。因此,这些限制性 片段组成的克隆库会包含重叠片段。这些重叠片段正是序列拼接 的基础。
基因组学和蛋白质组学工具
基于特征子串的重复片段屏蔽方法:
DNA 序列和每一个片段序列都可以看做是字符集{A,C,T, G}上的字符串,每个长为k的字符串称为k-串;若它是某个片段 (或序列)的一部分,则称它为此片段(或序列)的k-子串.
特征子串:当一个k-子串为某个片段的标识性信息时,称该 k-子串为该片段的特征子串。
PL条件:两片段含有至少一个公共的特征子串,称之满足可 能相邻(PL)条件。
经计算,k需满足条件: 其中n为要拼接片段的总数。
基因组学和蛋白质组学工具
算法原理: 即使两个本不相邻的片段因为重复片段的原因存在很长的重
叠,但只要它们的特征子串均不相同,处理时就不会对它们进行 比对,也就不会认为它们是相邻的。这样就达到了“屏蔽”重复 片段干扰的目的,也为后续的拼接产生了有用的依据。
基因组学和蛋白质组学工具
本科08级通信工程1班 况玲
Biblioteka Baidu
基因组学和蛋白质组 学工具
一、序列组装 二、功能基因组学 三、蛋白质组学
基因组学和蛋白质组学工具
研究内容:
1、怎样将散的序列拼接起来 2、如何去掉序列中重复的部分
基因组学和蛋白质组学工具
我们知道,使用鸟枪法的DNA测序提供了成千上百万个小序 列,每一个片段长度有400~500个碱基对。
基因组学和蛋白质组学工具
直接鸟枪法序列拼接:
从已测序的小片段中寻找彼此重叠的测序克隆,依次向两侧 邻接的序列延伸,组装成一个完整的基因组。不需预先了解任何 基因组的情况,即使缺少遗传图或物理图也可完成整个基因组顺 序组装。
优点:最大优点是经济、快速、高效。 缺点:“鸟枪法”对高性能计算的方法和设备要求非常高, 且无法测到人类基因组中重复出现的DNA片段,这些片段占到基 因组的3%至5%,对于理解遗传性疾病具有重要意义。
在得到了每个片段的序列后,序列拼接(sequence assembly) 的任务就利用这些片段间的重叠,将它们拼接成原来的序列。拼 接的关键问题是得到每个片段在一个长序列中的位置信息,这种 组合的集合称为contig(contiguous segment)。
序列拼接问题可以抽象为最短超序列问题(Shortest Superstring Problem,SSP)。假设一个序列片段集合A={a1,a2, ⋯,an},我们希望发现一个最短的序列S,A中所有的片段都是S的 子序列。例如有序列集合:{000,001,010,011,100,101, 110,101,111},包括集合中所有序列的最短超序列是: 0001110100。
基因组学和蛋白质组学工具
Phrap算法序列拼接:
1、找出序列片段间的重叠信息。 2、将存在有重叠的片段组合起来,形成一个contig结构。 3、形成Consensus序列(Consensus)。 优点:精确度较高。 缺点:运算时间较长且对存储空间的需求较大。
基因组学和蛋白质组学工具
重复片段是指在目标片段中多次出现的片段。对于小规模的 拼接工作例如细菌的基因组(重复序列约占全序列的1.5%)和果 蝇基因组(约占全序列的3%)等,问题不明显,然而,人类基因 组中含有50%以上的重复序列,这就对基因组测序产生了很大的 困难。
目前已经出现的很多用于shotgun片段拼接的工具,在处理 重复片段时,都是采用对大量的片段数据进行反复迭代的方法, 此间还需要加入很多人工的经验分析和干预。一定程度上增加了 拼接所花费的时间,降低了机器的使用效率。
所以,在使用过程中,我们应该选择可以屏蔽重复片段的 拼接算法。
基因组学和蛋白质组学工具
相关文档
最新文档