开放阅读框与基因识别
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 胰岛素由A、B两个肽链组成。人胰岛素 (Insulin Human)A链有11种21个氨基酸,B 链有15种30个氨基酸,共16种51个氨基酸 组成 • 其中A7(Cys)-B7(Cys)、A20(Cys)-B19(Cys) 四个半胱氨酸中的巯基形成两个二硫键, 使A、B两链连接起来。此外A链中A6(Cys) 与A11(Cys)之间也存在一个二硫键。
ORF预测的可靠性
• 密码子第3碱基趋向于相同的几率是否远大 于仅仅由随即产生的几率 • 分析ORF中的密码子是否与那些用于同一 生物其他基因中的密码子相一致 • 将ORF翻译成氨基酸序列,然后将结果序 列与序列数据进行比较,如果发现1个或多 个显著相似序列,则所预测ORF的可信度 较高
Fra Baidu bibliotek
• 在 B细胞的细胞核中,第11对染色体短臂上胰岛 素基因区DNA向mRNA转录,mRNA从细胞核移 向细胞浆的内质网,转译成氨基酸相连的长 肽——前胰岛素原(Proinsulin),前胰岛素原经 过蛋白水解作用除其前肽,生成胰岛素原。胰岛 素原随细胞浆中的微泡进入高尔基体,由86(84) 个氨基酸组成的长肽链 ——胰岛素原在高尔基体 中经蛋白酶水解生成胰岛素及C肽,分泌到B细胞 外,进入血液循环中。未经过蛋白酶水解的胰岛 素原,一小部分随着胰岛素进入血液循环,胰岛 素原的生物活性仅及胰岛素的5%。
实现方法
① 扫描给定的DNA序列,在3个不同的阅读 框中寻找较长的ORF ② 当遇到终止密码子后,回头寻找起始密码 子,以确定完整的编码区域
举例
• 胰岛素由A、B两个肽链组成。人胰岛素 (Insulin Human)A链有11种21个氨基酸,B 链有15种30个氨基酸,共16种51个氨基酸 组成 • NM_000207
——06生信 黄鑫章 2006062114
Ø开放阅读框(ORF,open reading frame) Ø基本思路 Ø实现方法 Ø举例
ORF
☼ORF(open reading frame)
是一个没有终止编码的密码子序列。 对于任何给定的核酸序列(单链DNA或 mRNA),根据密码子的起始位置,可以按照 3种方式解释。
• 例如,对于序列ATTCGATCGCAA,一种可 能的密码子阅读顺序为ATT、CGA、 TCG、CAA,另外两种可能的密码子阅读 顺序分别为A、TTC、GAT、CGC、AA和 AT、TCG、ATC、GCA、A。这三种顺序 被称为阅读框(ORF,open reading frame)
基本思路
☼找到一比较长的序列,其相应的密码子序 列不含终止密码子,那么这段序列可能就 是编码区域