数据挖掘基因注释

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
蛋白质基因组学: 运用蛋白质组技术注释基因组
基因组注释是在基因组上确定基因及其他元件的位置和 结构,并赋予这些基因和元件生物功能的过程. 随着高通量DNA 测序技术的飞速发展,越来越多的物种 完成了基因组测序.定位编码基因、确定编码基因结构 是基因组注释的基本任务。 基因组的注释分为三个层次:核酸层注释,蛋白质层注 释,代谢层注释. 利用蛋白质组学数据, 结合基因组数据(DNA)、转录组 数据(RNA)来研究基因组注释问题,被称为蛋白质基因 组学.
wk.baidu.com
质谱&串联质谱
基于串联质谱技术的蛋白质组学在2008 年仍然被看作是 少数派的做法,但随着质谱技术的发展,越来越多的基 因组注释研究开始采用核酸数据与蛋白质组学数据相结 合的方法.
串联质谱技术已经逐渐成为大规模研究蛋白质组学的常 用方法,发展相对成熟,该技术称为鸟枪法蛋白质组学。 鸟枪法是将目的DNA随机地处理成大小不同的片段,再 将这些片段的序列连接起来的测序方法。
蛋白质基因组学对基因组的注释可分为三个注释过程:编码 基因的注释,编码基因结构的注释和翻译后处理的注释。 编码基因及其结构的注释属核酸层注释范畴,而翻译后处理 的注释属蛋白质层注释范畴.
编码基因的注释 编码基因注释的目的,是要在基因组上获得所有表达(编码)基因的列 表.验证基因预测算法从核酸序列数据中预测得到的编码基因是否有正 确表达的蛋白质产物,以及发现基因从头预测算法遗漏的编码基因,是 蛋白质基因组学在编码基因注释方面的主要任务. 编码基因结构的注释 获得了编码基因列表后,就需要对基因的精确结构进行研究.对原核生 物来说,编码基因的起始和终止位点注释是否准确,或者对真核生物来 讲,外显子、内含子边界注释是否准确,有多少可变剪接体表达成蛋白 质等,是编码基因结构注释要解决的主要问题. 翻译后处理的注释 广义的基因组注释包括蛋白质功能和结构注释,尽管目前蛋白质基因组 学研究主要集中在核酸层,即编码基因注释和基因结构注释,一些在蛋 白质组学层面特有的现象,如翻译后修饰、信号肽,对蛋白质功能研究 非常重要,近年来有研究逐渐拓展到翻译后处理的注释.
The end
相关文档
最新文档