抗原肽与MHC分子相互作用的QSAR模型研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
[9]
变量. 若抗原肽在第 i 个位置出 现 第 j 种氨基酸 , 则 残基对与 MHC I 类 分子结合的亲合力 贡献 的 权 重 系数 , 即 这 种 氨基酸 在 该 位 置出 现 的 几 率 . 将 式 (3) 代入到式(2a)中可得: pIC50=const+∑∑aijgij
i=1 j=1 9 20
(7)
同理, 由式(1)也能够化为相同形式:
200 pIC50=constant+∑xiai
i=1 m 14580
Acta Phys. -Chim. Sin., 2007 表 1 氨基酸的 3 个 z 描述符[3]
Vol.23
(8)
Table 1 The three z descriptors of amino acids[3]
9
8
9-j
用变量 x(取值范围为 1 或 0)代替 gij, 则式(4)变成: (1) pIC50=constant+∑xiai
i=1 9 20 180
(5)
8
个位置氨基酸残基 Pi 的贡献和; ∑j=1 ∑i=1 CiCi+j 为
9-j
同样将式(3)代入到式(2b)中可得: pIC50=constant+∑∑aijgij+∑
(2b)
模型 3
若考虑 短肽的 主 链 , 每 个位 置 上 氨基酸残
基的独立作用及所有位置上氨基酸残基相互作用对 MHC I 类分子结合的亲合力的贡献 , 则该 模型 就 可 以用式(1)表示. 由 于 短肽的 每 个位置 可能 出 现 20 种 氨基酸残 基中的任意一种, 可以用 20 个变量对应每个位置上 的相应的 20 种氨基酸残基, 即 Ci=∑aijgij
No.2
宋
哲等: 抗原肽与 MHC 分子相互作用的 QSAR 模型研究
199 (2a)
质相对应的描述符或利用蛋白质的空间结构信息进 行研究, 因 为 一 个配 体蛋白质分子的 活性 主要 取决 于它和受体之 间的 非键 相互 作 用 特 性. 氨基酸残基 结构描述符在文献中, 有通过实验测定的 z-scales[3,4], values [7] 和 MHDV [8] 等 . z-scales 描述符 中 的 z1 反映
其中 gij 是 短肽 第 i 个位 置 上 , 第 j 种 氨基酸对 应 的
该氨基酸对应的 gij 为 1, 否则为 0; aij 为相应氨基酸
(4)
式中, constant 为主链的贡献; ∑i=1 Ci 为抗原肽的每
9
pIC50=constant+∑Ci+∑∑CiCi+j
i=1 j=1 i=1 8
SONG Zhe
LIU Tao
LIU Wei*
ZHU Ming-Hua
WANG Xiao-Gang*
T 细胞是重要 的 免疫细胞之一 , 它 的 主要作 用 是介导细胞免疫 , 调节机体 的 免疫功能 . 外周成熟 的 T 细胞实际上是由异质性群体构成的, 按功能不 同可分为辅助性 T 细胞(help T cell, Th)、 细胞毒性T 细胞(cytotoxicy T lymphocyte, CTL)和抑制性 T 细胞 (suppressor T cell, Ts). 现已 证 实 CTL 细胞能够 对 肿 瘤靶细胞直接进行特异性杀伤 , 其过程是肿瘤抗原
[1]
类)结合, 形成的短肽-MHC 复合体被提呈到 APC 细 胞表面, 与 T 细胞表面抗原受体 TCR(T cell receptor) 增殖 、 分化, 特异 性结合 , 使得 CTL 细胞 开始活化 、 从而对肿瘤细胞进行特异 性 杀伤. 通常 将能够启动 免疫应答的抗原短肽称为 T 细胞表位. 目前, 实验上采用先合成大量的交叠肽, 再通过 多肽结合实验或 CTL 杀伤效应检测来选取 CTL 表 位 . 但这 种 方法预测 CTL 表位的效 率较低 . 虽然文 献[2]已报道大量的经合成和实验的 CTL 细胞表位, 但对 CTL 细胞如何识别抗原短肽, 以及抗原短肽如 何 与 主要组织相容 性 复 合 体 MHC 的 相 互 作 用 , 这 一机理还不是很清楚. 对一 个 蛋白质分子的 活性及 其定量构效关系(QSAR), 可利用氨基酸物理化学性
抗原肽第 i 位置氨基酸残基 Pi 与近邻位置氨基酸残 基 Pi+j 相 互 作 用的 贡献 和 . 采用 不同 方 式 考虑 抗原 肽的氨基酸残基之间的相互作用对与 MHC I 类分子 结合亲合力的贡献, 能够得到下面 4 种不同的模型: 模型 1 若只考虑 短肽的 主 链 , 及 其 每 个位 置 上 氨 基酸残基的 独立 作 用对 MHC I 类 分子结合的亲合 力的贡献, 则(1)式可写为
*
Received: July 12, 2006; Revised: September 14, 2006. English edition available online at www.sciencedirect.com Corresponding author. Email: jchjys@dlut.edu.cn, Tel: +86411-84707872 Ⓒ Editorial office of Acta Physico-Chimica Sinica
蛋白在抗原提呈细胞 (antigen-presenting cells, APC) 的 胞浆中被蛋白酶体 (proteasome) 裂解成 短肽 片段 (短肽长度一般为 8-11), 由转运相关蛋白(TAP)将蛋 白酶体裂解产生 的短肽 片段从胞浆转运至内质网 腔, 短肽在内质网中与新生成的主要组织相容性复 合体(major histocompatibility complex class I, MHC I
i=1 6180
∑ ∑∑a
20 20 i=1 j=1 k=1
7
(
i=1
j=1
i=1
i,jk ij (i+2)k
gg
( )
∑∑a
j=1 k=1
20
20
i,jk ij (i+1)k
gg
)
+ (6)
那么式(6)变为
图 1 含有 9 个氨基酸的抗原肽二维模型 Fig.1 2D-model of a nonamer peptide
其中 , ai,jk 表 示 短肽第 i 个位 置 上 的第 j 种 氨基酸与 第 i +1 个位 置 上 的 第 k 种 氨基酸 相 互 作 用对短肽 能 取 1 或 0, 那么 gijg (i+1)k 与 gijg(i+2)k 也只 能 取 1 或 0. MHC 结合亲合力的 贡献. 由 于式 (6) 中 变量的 gij 只 用变量 x(取值范围为 1 或 0)代替 gij、 gijg(i+1)k 和 gijg(i+2)k, pIC50=constant+∑xiai
Amino Z acid z1 Ala(A) 0.07 Cys(C) 0.71 Asp(D) 3.64 Glu(E) 3.08 Phe(F) -4.92 Gly(G) 2.23 His(H) 2.41 Ile(I) -4.44 Lys(K) 2.84 Leu(L) -4.19 descriptors Amino acid z2 z3 -1.73 0.09 Met(M) -0.97 4.13 Asn(N) 1.13 2.36 Pro(P) 0.39 -0.07 Gln(Q) 1.30 0.45 Arg(R) -5.36 0.30 Ser(S) 1.74 1.11 Thr(T) -1.68 -1.03 Trp(W) 1.41 -3.14 Val(V) -1.03 0.98 Tyr(Y) Z descriptors z1 z2 z3 -2.49 -0.27 -0.41 3.22 1.45 0.84 -1.22 0.88 2.23 2.18 0.53 -1.14 2.88 2.52 -3.44 1.96 -1.63 0.57 0.92 -2.09 -1.40 -4.75 3.65 0.85 -2.69 -2.53 -1.29 -1.39 2.32 0.01
j=1 20
1
模
型
(i=1,2,…,9)
(3)
1.1 预测模型的建立及方法 通常与 MHC I 类分子结合的 抗原 肽是由 8-10 个氨基酸组成 , 图 1 为 一 个 由 9 个氨基酸 组成 的短 肽的二维结构图. 从图 1 可看出, 主链是由 N—Cα— C—N 排列组成, 侧链为氨基酸残基 P1-P9. 抗原肽和 MHC I 类 分子 相 互 作 用的结合亲合力大 小 为 pIC50 值 , pIC50=-lg(IC50) [9]. pIC50 值 为短肽的 主 链贡献加 上每个位置上的氨基酸残基独立作用及各个位置上 氨基酸残基之间相互作用的贡献之和 , 即
QSAR Model Study of Interaction between Peptides and MHC Molecules
(Department of Physics, College of Advanced Science and Technology, Dalian University of Technology, Dalian 116023, Liaoning Province, P. R. China) Abstract: The binding affinity model of a peptide -major histocompatibility complex (MHC) was studied using the methods of partial least squares (PLS) and amino acid structure descriptors. Using these models, the predictive sets of 805 peptides are predicted for the binding affinity of the HLA-A*0201 complex, and the predictive accuracies of the two models are 66.8% and 65.5%, respectively. To test the robustness of the models, the outliers are eliminated, and it is proved that the robustness of the models is good. This shows that the models using the PLS and amino acid structure descriptors are feasible on predicting of CTL (cytotoxicy T lymphocyte) epitopes. Key Words: CTL epitopes; Amino acid structure descriptors; QSAR; Partial least squares method
i=1 i=1 i=1 9 8 7
映氨基酸的 电 子特 性 . 应 用这些 能够 反映 氨基酸物 理 化 学性 质 的结构描述符 , 建立 抗原 短肽与 MHC 分子相互作用的 QSAR 模型, 这对了 解免疫机 理和 指导肿瘤疫 苗 的开发 都具有 重 大 意义. 本 文 采用氨 基酸残基结构描述符 z-scales, 通过偏最小二乘算法 (PLS) 建立 抗原 肽的 2D-QSAR 模型. 提 出 了 判断 抗 原短肽和 MHC 分子是否相互作用结合的理论预测 模型.
王晓钢 *
116023)
(大连理工大学物理系; 大连理工大学高科技研究院, 辽宁 大连
分别采用氨基酸序列及氨基酸结构描述符方法定量研究了短肽-MHC(major histocompatibility complex)
分子结合亲合力的定量构效关系(QSAR)模型, 用这两个模型对短肽与 HLA-A*0201 分子结合的 805 个预测样本 进行了预测, 预测准确度分别达到 66.8%和 65.5%. 采用了去除 “劣点” 方法检验模型的鲁棒性, 结果证明两个模 型都具有良好的鲁棒性. 通过改变两个模型的参数, 对氨基酸残基个数为 8 或 10 的 CTL(cytotoxicy T lymphocyte) 表位进行预测. 关键词: CTL 表位; 中图分类号: O641, 氨基酸结构描述符; Q811.4 定量构效关系; 偏最小二乘法
模型 2
pIC50=constant+∑Ci
i=1
9
若考虑 短肽的 主 链 , 每 个位 置 上 氨基酸残
有采用理论计算的参数 ISA-EC I[5], MSW-scores[6], t氨基酸的 疏水 性 , z2 反映 氨基酸的 空间 特 性 , z3 反
基的独立作用及近邻、次邻位置上氨基酸残基相互 作用对 MHC I 类分子结合的亲合力的贡献, 则(1)式 可写为 pIC50=constant+∑Ci+∑CiCi+1+∑CiCi+2
198 [Article]
Acta Phys. -Chim. Sin., 2007, 23(2): 198-205
物理化学学报(Wuli Huaxue Xuebao)
February www.whxb.pku.edu.cn
抗原肽与 MHC 分子相互作用的 QSAR 模型研究
宋ຫໍສະໝຸດ Baidu
摘要:
哲
刘
涛
刘
伟*
朱鸣华
变量. 若抗原肽在第 i 个位置出 现 第 j 种氨基酸 , 则 残基对与 MHC I 类 分子结合的亲合力 贡献 的 权 重 系数 , 即 这 种 氨基酸 在 该 位 置出 现 的 几 率 . 将 式 (3) 代入到式(2a)中可得: pIC50=const+∑∑aijgij
i=1 j=1 9 20
(7)
同理, 由式(1)也能够化为相同形式:
200 pIC50=constant+∑xiai
i=1 m 14580
Acta Phys. -Chim. Sin., 2007 表 1 氨基酸的 3 个 z 描述符[3]
Vol.23
(8)
Table 1 The three z descriptors of amino acids[3]
9
8
9-j
用变量 x(取值范围为 1 或 0)代替 gij, 则式(4)变成: (1) pIC50=constant+∑xiai
i=1 9 20 180
(5)
8
个位置氨基酸残基 Pi 的贡献和; ∑j=1 ∑i=1 CiCi+j 为
9-j
同样将式(3)代入到式(2b)中可得: pIC50=constant+∑∑aijgij+∑
(2b)
模型 3
若考虑 短肽的 主 链 , 每 个位 置 上 氨基酸残
基的独立作用及所有位置上氨基酸残基相互作用对 MHC I 类分子结合的亲合力的贡献 , 则该 模型 就 可 以用式(1)表示. 由 于 短肽的 每 个位置 可能 出 现 20 种 氨基酸残 基中的任意一种, 可以用 20 个变量对应每个位置上 的相应的 20 种氨基酸残基, 即 Ci=∑aijgij
No.2
宋
哲等: 抗原肽与 MHC 分子相互作用的 QSAR 模型研究
199 (2a)
质相对应的描述符或利用蛋白质的空间结构信息进 行研究, 因 为 一 个配 体蛋白质分子的 活性 主要 取决 于它和受体之 间的 非键 相互 作 用 特 性. 氨基酸残基 结构描述符在文献中, 有通过实验测定的 z-scales[3,4], values [7] 和 MHDV [8] 等 . z-scales 描述符 中 的 z1 反映
其中 gij 是 短肽 第 i 个位 置 上 , 第 j 种 氨基酸对 应 的
该氨基酸对应的 gij 为 1, 否则为 0; aij 为相应氨基酸
(4)
式中, constant 为主链的贡献; ∑i=1 Ci 为抗原肽的每
9
pIC50=constant+∑Ci+∑∑CiCi+j
i=1 j=1 i=1 8
SONG Zhe
LIU Tao
LIU Wei*
ZHU Ming-Hua
WANG Xiao-Gang*
T 细胞是重要 的 免疫细胞之一 , 它 的 主要作 用 是介导细胞免疫 , 调节机体 的 免疫功能 . 外周成熟 的 T 细胞实际上是由异质性群体构成的, 按功能不 同可分为辅助性 T 细胞(help T cell, Th)、 细胞毒性T 细胞(cytotoxicy T lymphocyte, CTL)和抑制性 T 细胞 (suppressor T cell, Ts). 现已 证 实 CTL 细胞能够 对 肿 瘤靶细胞直接进行特异性杀伤 , 其过程是肿瘤抗原
[1]
类)结合, 形成的短肽-MHC 复合体被提呈到 APC 细 胞表面, 与 T 细胞表面抗原受体 TCR(T cell receptor) 增殖 、 分化, 特异 性结合 , 使得 CTL 细胞 开始活化 、 从而对肿瘤细胞进行特异 性 杀伤. 通常 将能够启动 免疫应答的抗原短肽称为 T 细胞表位. 目前, 实验上采用先合成大量的交叠肽, 再通过 多肽结合实验或 CTL 杀伤效应检测来选取 CTL 表 位 . 但这 种 方法预测 CTL 表位的效 率较低 . 虽然文 献[2]已报道大量的经合成和实验的 CTL 细胞表位, 但对 CTL 细胞如何识别抗原短肽, 以及抗原短肽如 何 与 主要组织相容 性 复 合 体 MHC 的 相 互 作 用 , 这 一机理还不是很清楚. 对一 个 蛋白质分子的 活性及 其定量构效关系(QSAR), 可利用氨基酸物理化学性
抗原肽第 i 位置氨基酸残基 Pi 与近邻位置氨基酸残 基 Pi+j 相 互 作 用的 贡献 和 . 采用 不同 方 式 考虑 抗原 肽的氨基酸残基之间的相互作用对与 MHC I 类分子 结合亲合力的贡献, 能够得到下面 4 种不同的模型: 模型 1 若只考虑 短肽的 主 链 , 及 其 每 个位 置 上 氨 基酸残基的 独立 作 用对 MHC I 类 分子结合的亲合 力的贡献, 则(1)式可写为
*
Received: July 12, 2006; Revised: September 14, 2006. English edition available online at www.sciencedirect.com Corresponding author. Email: jchjys@dlut.edu.cn, Tel: +86411-84707872 Ⓒ Editorial office of Acta Physico-Chimica Sinica
蛋白在抗原提呈细胞 (antigen-presenting cells, APC) 的 胞浆中被蛋白酶体 (proteasome) 裂解成 短肽 片段 (短肽长度一般为 8-11), 由转运相关蛋白(TAP)将蛋 白酶体裂解产生 的短肽 片段从胞浆转运至内质网 腔, 短肽在内质网中与新生成的主要组织相容性复 合体(major histocompatibility complex class I, MHC I
i=1 6180
∑ ∑∑a
20 20 i=1 j=1 k=1
7
(
i=1
j=1
i=1
i,jk ij (i+2)k
gg
( )
∑∑a
j=1 k=1
20
20
i,jk ij (i+1)k
gg
)
+ (6)
那么式(6)变为
图 1 含有 9 个氨基酸的抗原肽二维模型 Fig.1 2D-model of a nonamer peptide
其中 , ai,jk 表 示 短肽第 i 个位 置 上 的第 j 种 氨基酸与 第 i +1 个位 置 上 的 第 k 种 氨基酸 相 互 作 用对短肽 能 取 1 或 0, 那么 gijg (i+1)k 与 gijg(i+2)k 也只 能 取 1 或 0. MHC 结合亲合力的 贡献. 由 于式 (6) 中 变量的 gij 只 用变量 x(取值范围为 1 或 0)代替 gij、 gijg(i+1)k 和 gijg(i+2)k, pIC50=constant+∑xiai
Amino Z acid z1 Ala(A) 0.07 Cys(C) 0.71 Asp(D) 3.64 Glu(E) 3.08 Phe(F) -4.92 Gly(G) 2.23 His(H) 2.41 Ile(I) -4.44 Lys(K) 2.84 Leu(L) -4.19 descriptors Amino acid z2 z3 -1.73 0.09 Met(M) -0.97 4.13 Asn(N) 1.13 2.36 Pro(P) 0.39 -0.07 Gln(Q) 1.30 0.45 Arg(R) -5.36 0.30 Ser(S) 1.74 1.11 Thr(T) -1.68 -1.03 Trp(W) 1.41 -3.14 Val(V) -1.03 0.98 Tyr(Y) Z descriptors z1 z2 z3 -2.49 -0.27 -0.41 3.22 1.45 0.84 -1.22 0.88 2.23 2.18 0.53 -1.14 2.88 2.52 -3.44 1.96 -1.63 0.57 0.92 -2.09 -1.40 -4.75 3.65 0.85 -2.69 -2.53 -1.29 -1.39 2.32 0.01
j=1 20
1
模
型
(i=1,2,…,9)
(3)
1.1 预测模型的建立及方法 通常与 MHC I 类分子结合的 抗原 肽是由 8-10 个氨基酸组成 , 图 1 为 一 个 由 9 个氨基酸 组成 的短 肽的二维结构图. 从图 1 可看出, 主链是由 N—Cα— C—N 排列组成, 侧链为氨基酸残基 P1-P9. 抗原肽和 MHC I 类 分子 相 互 作 用的结合亲合力大 小 为 pIC50 值 , pIC50=-lg(IC50) [9]. pIC50 值 为短肽的 主 链贡献加 上每个位置上的氨基酸残基独立作用及各个位置上 氨基酸残基之间相互作用的贡献之和 , 即
QSAR Model Study of Interaction between Peptides and MHC Molecules
(Department of Physics, College of Advanced Science and Technology, Dalian University of Technology, Dalian 116023, Liaoning Province, P. R. China) Abstract: The binding affinity model of a peptide -major histocompatibility complex (MHC) was studied using the methods of partial least squares (PLS) and amino acid structure descriptors. Using these models, the predictive sets of 805 peptides are predicted for the binding affinity of the HLA-A*0201 complex, and the predictive accuracies of the two models are 66.8% and 65.5%, respectively. To test the robustness of the models, the outliers are eliminated, and it is proved that the robustness of the models is good. This shows that the models using the PLS and amino acid structure descriptors are feasible on predicting of CTL (cytotoxicy T lymphocyte) epitopes. Key Words: CTL epitopes; Amino acid structure descriptors; QSAR; Partial least squares method
i=1 i=1 i=1 9 8 7
映氨基酸的 电 子特 性 . 应 用这些 能够 反映 氨基酸物 理 化 学性 质 的结构描述符 , 建立 抗原 短肽与 MHC 分子相互作用的 QSAR 模型, 这对了 解免疫机 理和 指导肿瘤疫 苗 的开发 都具有 重 大 意义. 本 文 采用氨 基酸残基结构描述符 z-scales, 通过偏最小二乘算法 (PLS) 建立 抗原 肽的 2D-QSAR 模型. 提 出 了 判断 抗 原短肽和 MHC 分子是否相互作用结合的理论预测 模型.
王晓钢 *
116023)
(大连理工大学物理系; 大连理工大学高科技研究院, 辽宁 大连
分别采用氨基酸序列及氨基酸结构描述符方法定量研究了短肽-MHC(major histocompatibility complex)
分子结合亲合力的定量构效关系(QSAR)模型, 用这两个模型对短肽与 HLA-A*0201 分子结合的 805 个预测样本 进行了预测, 预测准确度分别达到 66.8%和 65.5%. 采用了去除 “劣点” 方法检验模型的鲁棒性, 结果证明两个模 型都具有良好的鲁棒性. 通过改变两个模型的参数, 对氨基酸残基个数为 8 或 10 的 CTL(cytotoxicy T lymphocyte) 表位进行预测. 关键词: CTL 表位; 中图分类号: O641, 氨基酸结构描述符; Q811.4 定量构效关系; 偏最小二乘法
模型 2
pIC50=constant+∑Ci
i=1
9
若考虑 短肽的 主 链 , 每 个位 置 上 氨基酸残
有采用理论计算的参数 ISA-EC I[5], MSW-scores[6], t氨基酸的 疏水 性 , z2 反映 氨基酸的 空间 特 性 , z3 反
基的独立作用及近邻、次邻位置上氨基酸残基相互 作用对 MHC I 类分子结合的亲合力的贡献, 则(1)式 可写为 pIC50=constant+∑Ci+∑CiCi+1+∑CiCi+2
198 [Article]
Acta Phys. -Chim. Sin., 2007, 23(2): 198-205
物理化学学报(Wuli Huaxue Xuebao)
February www.whxb.pku.edu.cn
抗原肽与 MHC 分子相互作用的 QSAR 模型研究
宋ຫໍສະໝຸດ Baidu
摘要:
哲
刘
涛
刘
伟*
朱鸣华