蛋白质结构与功能的生物信息学研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
实验名称:蛋白质结构与功能的生物信息学研究
实验目的:1.掌握运用BLAST工具对指定蛋白质的氨基酸序列同源性搜索的方法。
2.掌握用不同的工具分析蛋白质的氨基酸序列的基本性质
3掌握蛋白质的氨基酸序列进行三维结构的分析
4.熟悉对蛋白质的氨基酸序列所代表蛋白的修饰情况、所参与的
代谢途径、相互作用的蛋白,以及与疾病的相关性的分析。实验方法和流程:
一、同源性搜索
同源性从分子水平讲则是指两个核酸分子的核苷酸序列或两个蛋白质分子的氨基酸序列间的相似程度。BLAST工具能对生物不同蛋白质的氨基酸序列或不同的基因的DNA序列极性比对,并从相应数据库中找到相同或相似序列。对指定的蛋白质的氨基酸序列进行同源性搜索步骤如下:
↓
登录网址/blast/
↓
输入序列后,运行blast工具
↓
序列比对的图形结果显示
序列比对的图形结果:用相似性区段(Hit)覆盖输入序列的范围判断两个序列
的相似性。如果图形中包含低得分的颜色(主要是红色)
区段,表明两序列的并非完全匹配。
↓
匹配序列列表及得分
各序列得分
可选择不同的比对工具
备注: Clustal是一款用来对()的软件。可以用来发现特征序列,进行蛋白分类,证明序列间的同源性,帮助预测新序列二级结构与三级结构,确定PCR引物,以及
在分子进化分析方面均有很大帮助。Clustal包括Clustalx和Clustalw(前者是
图形化界面版本后者是命令界面),是生物信息学常用的多序列比对工具。
该序列的比对结果有100条,按得分降序排列,其中最大得分2373,最小得分
分为1195.
↓
详细的比对序列的排列情况
第一个匹配
序列
第一个序列的匹配率为100%
Score表示打分矩阵计算出来的值,由搜索算法决定的,值越大说明匹配程度
越大。
Expect是输入序列被随机搜索出来的概率,该值越小越好。
Identities是相似程度,即匹配率,100%表示序列全部匹配。
Method:代表不同的打分矩阵方法,选择不同的打分矩阵会得到不同的打分结果。显示结果按越后面匹配率越低。
二、分析蛋白质的氨基酸序列的基本性质
ProParam是计算氨基酸理化参数常用的工具,提供计算蛋白质的分子量、理论等电点、氨基酸组成、原子组成、消光系数(extinction coefficient)、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)等。
↓
登录网址:/protparam并输入序列号
↓
↓
蛋白质的氨基酸组成、相对分子质量、等电点和原子组成。
结果1:该蛋白质序列的氨基酸数为1255个,相对分子质量为137910.5,等电点为5.58,由C、H、N、O、 S五种原子组成,共有19180个原子。
↓
消光系数、半衰期、不稳定系数、脂肪系数和总平均疏水性(GRAVY)
结果2:消光系数反映了蛋白在特定波长下吸收可见光或不可见光的能力,可用来测蛋白浓度。由上图知,该序列在280nm的波长下,假设所有成对的半胱氨酸残基形成胱氨酸,则该序列的消光系数1.003;假设所有的半胱氨酸残基都减少了,改序列的消光系数为0.976。半衰期为30小时(哺乳动物的网织红细胞,体外);> 20小时(酵母、体内),> 10小时(大肠杆菌、体内)。该蛋白不稳定系数为56.13,提示该蛋白质不稳定。脂肪系数是计算球状蛋白脂肪族氨基酸侧链所占相对体积,反映了蛋白质的热稳定性,为82.35. 蛋白质的疏水性预测可以根据GRAVY值来预测。GRAVY值的范围在2 与-2之间,正值表明此蛋白为疏水性蛋白,负值表明为亲水蛋白。该蛋白的GRAVY值为-0.247,因此预测该蛋白为亲水蛋白。
↓
利用ProtScale工具对蛋白质进行亲疏水性分析
↓
登录网址/protscale并输入序列号
↓
↓
GFAP亲疏水性分布图,横坐标为序列位置,纵坐标为氨基酸的标度值。Hphob.kyte&Doolittle 标度(default)定义疏水性氨基酸较高的打分值(>0值表示疏水性,<0值表示亲水性。从图可看出,标度值<0的区域比>0的较为密集,因此,结合上面的GRAVY值为-0.247,预测该蛋白为亲水蛋白。
↓
利用TMPred 工具对该蛋白进行跨膜区结构预测
登录网
址
/software/TMPRED_form.html ↓
最优拓扑结构:2种模型都预测有4个蛋白质跨膜区。
↓
用TMHMM预测是否存在跨膜区
登录网址http://www.cbs.dtu.dk/services/TMHMM-2.0/
↓
↓
结果
三、蛋白质三维结构分析
↓
登录网址/,输入相应的序
列号
↓
提示有2个蛋白质跨膜区。其跨膜区比TMpred预测的结果少了2个。少了序列前面2个位置的跨膜区。
↓
建模部分结果
↓
有A、B、C、D四条晶体结构的单链阵线。
四、蛋白质序列的修饰情况、所参与的代谢途径、相互作用的蛋白,
以及与疾病的相关性分析
↓
登录
/colipedia/index.php/ExPASy_proteomics_server
在database里面找到string工具。
↓