决策树算法预测人类病毒的蛋白质磷酸化位点

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

蛋 白质磷酸 化是 真核细 胞 r f 1 最为广 泛 的蛋 白质翻 译后修饰之一 , 据估计大致 有一 分之一的蛋 白质 能发生
磷酸化修饰 。磷酸化 介导 了多种真核细胞 内的生化/ 生 理过程 ,包括细胞 期 、新 陈代谢、神经活动 、信号转
导 以及肿瘤发生等 。 蛋n质磷 酸化 足在蛋 白激酶 的催化
黄 淑 云
( 萍 乡学院 ,江西 萍 乡 3 3 7 0 0 0)
摘 要 :木 文基 f决 策树 分类 算 法构 建人 类病 毒 蛋 白质磷 酸化 修饰 位 点的预 测模 型 。采用 氨基 酸物 理化 学性 质对 蛋 白质 序
列进 行特 征提 取 ,并 分析 丝氮 忮 、苏 氨酸 和酪 氨 酸磷 酸化 位 点邻近 序列 的氨 基酸 性质 。 同时考 察 _ 『 同分类 算法对 预测 结 果 的影响 。 通过 l 0倍 交叉 验 . 利 用决 策树 算法 预测 丝 氨酸 、 苏氨 酸和 酪氨 酸磷 酸化位 点 的 MC C 分别达 到 7 7 . 3 1 %、 7 5 . 9 1 %
酸 Y) 。已有研究 汪明蛋 广 1 质’ 的磷 酸化作用对抑制人类 病毒的复制起到重要的作用【 I 】 , , 例如 ,激活的蛋 白激酶 P K R 通 过 使 真 核 细 胞翻 译 起 始 因子 2 a( e u k a r y o t i c t r a n s l a t i o n i n i t i a t i o n f a c t o r 2 c t , E I F 2 a )第 5 1 位丝氨酸磷 酸化,在细胞 内引起 非特异的 来 , 通 过氨基 酸序 列预测蛋 白质磷酸化的 位点方法发展 出一系列新 的算法 ,如 :支持 向量机、k 最近邻和 隐马尔科夫模 型等。 本研 究提 出一种基于决策 树的分类算法预测人类病 毒的蛋 白质磷酸化修饰位 点。 采用 氨基酸 物理化学 性质得 到 的生化特 性作 为系统 的 输入 向最 ,系统分析磷酸化修饰位点邻近序列的特 征。
和7 1 . 9 4 %,表 明奉 文提 的 ’ 法能 有效 地预 测 人类 病毒 的磷 酸化 修饰位 点 。 关键 词 :人类 病毒 : 蛋 白质 磷 睃化 位 点 :决策 树
中图分 类号 :Q5 1
文 献标 识 码 :A
文章 编号 :1 0 0 7 . 9 1 4 9( 2 0 1 3) 0 3 . 0 0 4 1 . 0 5
人类 病毒 的发病机 制研 究和筛 选潜在 药物靶 标具有 重
要 的意 义 。
目前 , 确定 T a u蛋 门翻详肝修饰位点 的实验 方法主
要有质谱分析 ( ma s s s p e c t r o m e t r y , MS ) 、同位素标记和 免疫 印迹. 化学 发光法 等1 2 1 。 然 而, 通过实验方法来鉴定 病毒蛋 白质 的磷酸化修饰位 , 仅耗时 、 成本高且效率 低 ,无法满足 蛋 白质磷酸化序 列增长 的速度 。因此,发 展 快捷 、 有效的计算方法对磷 酸化修饰 位点预测足十分
。 4 2・
萍 乡高等专科学校 学报
2 0 1 3 年
肽链 , 如果氨基酸残基序 列 同, 仅仅保 留一条肽链 。 根据 以上严格的筛选 过稃,最终得 到 1 4 1 2个丝氨 酸磷 酸化位点 、 3 6 1 个苏氨 酸磷酸 化位 点和 1 5 6个酪氨 酸磷 酸化位点 。 为了 衡训练集 中的正负样 本,从非磷酸化 位点巾随机选取 与正样本数 目相 同的负样本 。
制 R NA病 毒的复制 。因此 , r 解 蛋 白的磷酸化作用对
的方法能有效地预测人类病毒 的磷酸化修饰位点。
2实验数据与方法 2 . 1数据收集 根据关键词 “ Hu ma n v i r u s ”和 “ P h o s p h o r y l a t i o n ” 从N C B I 数据库 中检索实验验证的蛋 白质磷酸化位点, 获得 3 2 0条蛋 白质序列 。 再通过滑动窗口提取以丝氨酸 、 苏氨酸和酪氨酸位点为中心 的 4 1 个连续残基肽链, 含有 磷酸化注释的肽链 为正样本,没有注释的为负样本。为 了获得高质量的、定义 明确的数据集 ,严格按照以下标 准筛选仲点数据 。首先,排除 N C B ! 中标注含糊小清或
2 . 2 氨基酸物理化学性质 蛋 门质结构与 功能的特 异性和 多样性 ,在 很大程
巾f 生 和疏水l 生 氨基酸 c 1 ={ G , A , V, L , I , M, P , F , W} 中性和极性氨基酸 c 2 ={ Q 。 N, S . T 。 Y . C }
不确定词语的磷酸化位点,如 “ 相似 ” ,“ 潜在”或 “ 可 能” 。 然后, 移除肽链长度小于 4 1 个氨基 酸残基 的序列, 因为它们可能包含的信息 完全 。最后,对 比磷酸化位
收稿 日期 :2 0 1 3 — 0 4 - 1 7
作者简介:黄淑云 ( 1 9 8 7 一) , 女 ,江西抚州人,硕士,助教,研究方向:化学计量学、生物信学和电化学。
第3 O卷第 3期
V O 1 . 3 0 NO- 3
萍 乡高等专科学校学报
J o u na r l o f Pi n g xi a n g Col l e ge
2 0 1 3年 6月
J u n . 2 O 1 3
决 策 树 算 法 预 测 人 类 病 毒 的 蛋 白质 磷 酸 化 位 点
下 ,将 A T P或 GT P巾的磷 酸基 团通过共价修饰转移到
底 物蛋 白质 的受体位 上 ( 丝氨酸 S 、苏氨 酸 T 、酪氨
通过 1 0倍交叉验 证详细考察决策树算法与 k最近邻 、
支持 向量机算法 的预测性 能, 并 同已知的预测人类病毒 磷酸化位点 的隐马尔科夫模型方法对 比, 显 本文提 山
相关文档
最新文档