蛋白质结构与功能的生物信息学研究汇总

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

结果 1:该蛋白质序列的氨基酸数为 1255 个,相对分子质量为 137910.5,等电 点为 5.58,由 C、 H、N、O、 S 五种原子组成,共有 19180 个原子。

消光系数、半衰期、不稳定系数、脂肪系数和总在特定波长下吸收可见光或不可见光的能力,可用 来测蛋白浓度。由上图知,该序列在 280nm 的波长下,假设所有成对的半胱氨 酸残基形成胱氨酸,则该序列的消光系数 1.003;假设所有的半胱氨酸残基都减 少了,改序列的消光系数为 0.976。半衰期为 30 小时 (哺乳动物的网织红细胞 ,体 外 );> 20 小时 (酵母、体内 ),> 10 小时 (大肠杆菌、体内 )。该蛋白不稳定系数为 56.13,提示该蛋白质不稳定。脂肪系数是计算球状蛋白脂肪族氨基酸侧链所占 相对体积,反映了蛋白质的热稳定性,为 82.35. 蛋白质的疏水性预测可以根据 GRAVY 值来预测。 GRAVY 值的范围在 2 与-2 之间,正值表明此蛋白为疏水性 蛋白,负值表明为亲水蛋白。该蛋白的 GRAVY 值为 -0.247,因此预测该蛋白为 亲水蛋白。
实验名称:蛋白质结构与功能的生物信息学研究
实验目的 :1. 掌握运用 BLAST 工具对指定蛋白质的氨基酸序列同源性搜索 的方法。
2.掌握用不同的工具分析蛋白质的氨基酸序列的基本性质 3 掌握 蛋白质的氨基酸序列 进行三维结构的分析 4. 熟悉对 蛋白质的氨基酸序列 所代表蛋白的修饰情况、 所参与的 代谢途径、相互作用的蛋白,以及与疾病的相关性的分析。
越大。 Expect 是输入序列被随机搜索出来的概率,该值越小越好。 Identities 是相似程度,即匹配率, 100%表示序列全部匹配。 Method:代表不同的打分矩阵方法, 选择不同的打分矩阵会得到不同的打分结果。 显示结果按越后面匹配率越低。
二、 分析蛋白质的氨基酸序列的基本性质
ProParam 是计算氨基酸理化参数常用的工具,提供计算蛋白质的分子量、
相互作用的 蛋白网络图
所输入序列的代码
序列 基本信 息
由结果可知,该蛋白质序列相互作用的蛋白有 10 个。所输入序列的代码为
ERBB。2 根据基本信息可知, ERBB2是 表皮生长因子受体( EGFR)家族成员之一 是白血病病毒致癌基因同族体 2。蛋白酪氨酸激酶( ERBB2基因表达产物) 是几 个细胞表面受体复 合 物的一 部 分 , 但 这 需要一 个 coreceptor 配体结 合 。 Neuregulin 受体复杂的重要组成部分 , 尽管 neuregulin 不单独与之交互。 GP30 是一个潜在的配体受体。调节产物和周边稳定微管 (MTs)。
实验方法和流程: 一、 同源性搜索
同源性从分子水平讲则是指两个 核酸 分子的 核苷酸 序列或两个蛋白质分子 的氨基酸序列间的相似程度。 BLAST 工具能对生物不同蛋白质的氨基酸序列或 不同的基因的 DNA 序列极性比对,并从相应数据库中找到相同或相似序列。对 指定的蛋白质的氨基酸序列进行同源性搜索步骤如下:
↓ 匹配序列列表及得分
可选择不同的比对工具
各序列得分
备注 :
Clustal 是一款用来对 () 的软件。可以用来发现特征序列,进行蛋白分类,证明
序列间的同源性,帮助预测新序列二级结构与三级结构,确定
PCR 引物,以及
在分子进化分析方面均有很大帮助。 Clustal 包括 Clustalx 和 Clustalw( 前者是图

登录网址 /blast/
↓ 输入序列后 ,运行 blast 工具
↓ 序列比对的图形结果显示
序列比对的图形结果 :用相似性区段( Hit )覆盖输入序列的范围判断两个序列 的相似性。 如果图形中包含低得分的颜色 (主要是红色 ) 区段,表明两序列的并非完全匹配。
四、蛋白质序列的修饰情况、所参与的代谢途径、相互作用的蛋白,
以及与疾病的相关性分析
↓ 登录 /colipedia/index.php/ExPASy_proteomics_server
在database里面找到string工具。 ↓
↓ 输入序列号
↓ 结果:
所输入序列的 代码。
理论等电点、氨基酸组成、原子组成、消光系数( extinction coefficient
)、
半衰期、不稳定系数、脂肪系数和总平均疏水性( GRAV)Y 等。

登录网址: /protparam
并输入序列号

↓ 蛋白质的氨基酸组成、相对分子质量、等电点和原子组成。

↓ 结果
提示有 2 个蛋白质跨膜区。 其跨膜区 比 TMpred 预测的结果少了 2 个。少 了序列前面 2 个位置的跨膜区。
三、
蛋白质三维结构分析 ↓
登录网址 ,/ 输入相应的序列号


建模部分结果

有 A 、 B、 C、 D 四条晶体结构的单链阵线。
形化界面版本后者是命令界面 ),是生物信息学常用的多序列比对工具。
该序列的比对结果有 100 条,按得分降序排列,其中最大得分 2373,最小得分
分为 1195.
第一个匹配 序列
↓ 详细的比对序列的排列情况
第一个序列的匹配率为 100%
Score 表示打分矩阵计算出来的值,由搜索算法决定的,值越大说明匹配程度
↓ 利用 TMPred 工具对该蛋白进行跨膜区结构预测 登录网址 /software/TMPRED_form.html

最优拓扑结构: 2 种模型都预测有 4 个蛋白质跨膜区。
↓ 用 TMHMM 预测是否存在跨膜区 登录网址 http://www.cbs.dtu.dk/services/TMHMM-2.0/
总结:该蛋白质序列的比对结果有 100 条,按得分降序排列, 其中最大得分 2373, 最小得分分为 1195. 该蛋白质序列的氨基酸数为 1255 个,相对分子质量为 137910.5 ,等电点为 5.58 ,由 C、H、 N、 O、 S 五种原子组成,共有 19180 个原 子。该序列在 280nm的波长下, 假设所有成对的半胱氨酸残基形成胱氨酸, 则该 序列的消光系数 1.003 ;假设所有的半胱氨酸残基都减少了,改序列的消光系数 为 0.976 。半衰期为 30 小时 ( 哺乳动物的网织红细胞 , 体外 ) ;> 20 小时 ( 酵母、 体内 ) ,> 10 小时 ( 大肠杆菌、体内 ) 。该蛋白不稳定系数为 56.13 ,结果提示该 蛋白质不稳定。脂肪系数为 82.35. 该蛋白的 GRAVY值为 -0.247 ,通过亲疏水性 分析得出该蛋白为亲水蛋白。三级结构分析显示该利用 TMPred工具对该蛋白进 行跨膜区结构预测得到 4 个跨膜区, 而用 TMHMM预测则存在 2 个跨膜区。 该蛋白 质序列由 4 条链构成,通过相互作用分析得,该蛋白质序列相互作用的蛋白有 10 个,是 表皮生长因子受体( EGFR)家族成员之一,参与细胞膜的表面受体的 组成,与白血病的发生有关。

利用 ProtScale工具对蛋白质进行亲疏水性分析 ↓
登录网址 /protscale并输入序列号 ↓

GFAP 亲疏水性分布图,横坐标为序列位置,纵坐标为氨基酸的标度值。 Hphob.kyte&Doolittle 标度(default)定义疏水性氨基酸较高的打分值 (>0 值表示 疏水性 ,<0 值表示亲水性。从图可看出,标度值 <0 的区域比 >0 的较为密集,因 此,结合上面的 GRAVY 值为 -0.247,预测该蛋白为亲水蛋白。
相关文档
最新文档