真核生物的基因序列识别
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
真核生物的基因序列识别
问题回顾
• 对于真核生物,我们可以利用哪些信息来识别基因序列?
• 问题分析 • 真核生物基因组规模大,识别真核生物的基因困难
• 含有大量的内含子
• 真核基因基因上游区域具有更加丰富的基因调控信息
/lifesciences/40-114250-1.html
Bioinformatics [M]. 孙啸等,译.北京:清华大学出版社,2004:110-116.
[3]王永宏. 真核生物基因及其翻译起始点的识别[D]. 天津大学, 2002.
[4]真核细胞基因结构与特点
1.html
/lifesciences/40-114250-
Q&A
终止密码子
• 终止密码子:TAA TGA TAG
转录终止信号
• 转录终止子:由一段回文序列及其特定的序列AATAAA(或ATTAAA)组成。
References
[1]孙啸 陆祖宏 谢建明.生物信息学基础[M].北京:清华大学出版社,2005.5:
174-208.
[2]Dan E. Krane & Michael L. Raymer. Fundamental Concepts of
解决方法
用于基因识别的生物信息
• 信号信息
• 由一些特殊的序列构成,预示着周围存在着基因
• 内容信息
• 蛋白质编码基因所具有的某些统计学特征
序列特征信号
• 转录启动信号 • 起始密码子 • 外显子剪接位点 • 终止密码子 • 转录种植信号
转录启动信号区
• 启动子:直接与RNA聚合酶及其转录因子结合,决定基因转录其实与否的DNA序列
• TATA-box:TATATATA 转录起始点上游30~50bp 决定基因转录始的选择
• CAAT-box:GGGTCAATCT 真核生物基因常有的调节区 转录起始点上游,80~100bp
• GC-box:有两个拷贝,位于CAAT框的两侧
起始密码子
• 翻译起始位置:ATG
剪接位点
• 外显子与内含子接头——GT-AG法则 • 外显子与内含子相连部位通常是一段高度保守的特定序列,即内含子5‘端都 是GT开始,3’端都是AG结尾。
问题回顾
• 对于真核生物,我们可以利用哪些信息来识别基因序列?
• 问题分析 • 真核生物基因组规模大,识别真核生物的基因困难
• 含有大量的内含子
• 真核基因基因上游区域具有更加丰富的基因调控信息
/lifesciences/40-114250-1.html
Bioinformatics [M]. 孙啸等,译.北京:清华大学出版社,2004:110-116.
[3]王永宏. 真核生物基因及其翻译起始点的识别[D]. 天津大学, 2002.
[4]真核细胞基因结构与特点
1.html
/lifesciences/40-114250-
Q&A
终止密码子
• 终止密码子:TAA TGA TAG
转录终止信号
• 转录终止子:由一段回文序列及其特定的序列AATAAA(或ATTAAA)组成。
References
[1]孙啸 陆祖宏 谢建明.生物信息学基础[M].北京:清华大学出版社,2005.5:
174-208.
[2]Dan E. Krane & Michael L. Raymer. Fundamental Concepts of
解决方法
用于基因识别的生物信息
• 信号信息
• 由一些特殊的序列构成,预示着周围存在着基因
• 内容信息
• 蛋白质编码基因所具有的某些统计学特征
序列特征信号
• 转录启动信号 • 起始密码子 • 外显子剪接位点 • 终止密码子 • 转录种植信号
转录启动信号区
• 启动子:直接与RNA聚合酶及其转录因子结合,决定基因转录其实与否的DNA序列
• TATA-box:TATATATA 转录起始点上游30~50bp 决定基因转录始的选择
• CAAT-box:GGGTCAATCT 真核生物基因常有的调节区 转录起始点上游,80~100bp
• GC-box:有两个拷贝,位于CAAT框的两侧
起始密码子
• 翻译起始位置:ATG
剪接位点
• 外显子与内含子接头——GT-AG法则 • 外显子与内含子相连部位通常是一段高度保守的特定序列,即内含子5‘端都 是GT开始,3’端都是AG结尾。