生物信息学作业

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

生物信息学试题

1、构建分子系统树的主要方法有哪些？并简要说明构建分子进化树

的一般步骤。（20分）

答：（1）构建进化树的方法包括两种：一类是序列类似性比较，主要是基于氨基酸相对突变率矩阵（常用PAM250）计算不同序列差异性积分作为它们的差异性量度（序列进化树）；另一类在难以通过序列比较构建序列进化树的情况下，通过蛋白质结构比较包括刚体结构叠合和多结构特征比较等方法建立结构进化树

(2)序列比对——选取所需序列——软件绘制

具体如下：

a测序获取序列或者在NCBI上搜索所需的目的序列

b在NCBI上做blast：比对相似度较高的基因，并以fast格式下载，整合在*txt文档中。

c比对序列，比对序列转化成*meg格式

d打开保存的*meg格式文件，构建系统进化树

2、氨基酸序列打分矩阵PAM和BLOSUM中序号有什么意义？它们各自

的规律是什么？（10分）

（1）PAM矩阵：基于进化的点突变模型，如果两种氨基酸替换频繁，说明自然界接受这种替换，那么这对氨基酸替换得分就高。一个PAM就是一个进化的变异单位, 即1%的氨基酸改变。

BLOSUM矩阵：首先寻找氨基酸模式，即有意义的一段氨基酸片断，分别比较相同的氨基酸模式之间氨基酸的保守性（某种氨基酸对另一种氨基酸的取代数据），然后，以所有60％保守性的氨基酸模式之间的比较数据为根据，产生BLOSUM60；以所有80％保守性的氨基酸模式之间的比较数据为根据，产生

BLOSUM80。

（2）PAM用于家族内成员相比，然后把所有家族中对某种氨基酸的比较结果加和在一起，产生“取代”数据（PAM-1 ）；PAM-1自乘n次，得PAM-n。

PAM-n中，n 越小，表示氨基酸变异的可能性越小；相似的序列之间比较应该选用n值小的矩阵，不太相似的序列之间比较应该选用n值大的矩阵。PAM-250用于约 20%相同序列之间的比较。

BLOSUM-n中，n越小，表示氨基酸相似的可能性越小；相似的序列之间比较应该选用 n 值大的矩阵，不太相似的序列之间比较应该选用n值小的矩阵。BLOSUM-62用来比较62％相似度的序列，BLOSUM-80用来比较80％左右的序列。

3、蛋白质三维结构预测的主要方法有哪些？试选择其中的一种方

法，说明蛋白质三维结构预测的一般步骤。（10分）

（1）

a同源建模（序列相似性低于30%的蛋白质难以得到理想的结构模型

b折叠识别(已知结模板的序列一致率小于25%)

c从头预测的方法(无已知结构蛋白质模板)。

（2）

4、你所熟悉的生物信息学软件有哪些？请选择其中的至少一种软

件，结合自己的研究课题，谈谈你所选择软件的基本原理，使用方法与用途。（25分）

（1）序列比对工具BLAST和ClustalX；分子进化遗传分析工具(MEGA 4) （2）ClustalX基本原理：渐进法，CLUSTAL是一种渐进的比对方法，先将多个序列两两

比对构建距离矩阵，反应序列之间两两关系；然后根据距离矩阵计算产生系统进化指导树，对关系密切的序列进行加权；然后从最紧密的两条序列开始，逐步引入临近的序列并不断重新构建比对，直到所有序列都被加入为止。

ClustalX功能：多序列比对

ClustalX使用方法：输入序列文件——设定比对的一些参数——开始序列比对

——比对完成，选择保存结果文件的格式

5、假如你现在有100个来自同一科的不同植物或者动物的基因组数

据，根据现有学过知识，谈谈你可以从那些方面进行生物信息学分析，并简述可能的结果。（20分）

可以研究其中的一个基因家族情况，系统进化树和保守结构分析，，分析生物进化过程中（参进化树）的同源性差异，

结构预测：基因数量相似，大部分高度保守区，且该区基因均表达相同的氨基酸，变异区为同科不同生物进化过程中形成的；某一基因结构和染色体分布情况，

结构预测：内含子数量或多或少，保守区域略有不同，某一特定基因在染色体上的分布情况相类似

6、你所熟知的生物信息学前沿领域有哪些？请结合文献信息，谈谈

生物信息学前沿领域在你所在生物学专业的应用。（15分）

核酸序列分析；蛋白质序列分析；序列对比；分子系统发生分析；基因组信息学分析；生物芯片

利用生物信息学进行序列比对：

序列比较是生物信息学中最基本、最重要的操作，通过比较可以发现生物序列中的功能、

结构和进化的信息。此较的根本任务是：通过比较生物分子序列，发现它们的相似性，找出序列之间共同的区域，同时辨别序列之间的差异。

在分子生物学中，DNA或蛋白质的相似性是多方面的，可能是機|或氧基酸序列的相似，可能是结构的相似，也可能是功能的相似。研究序列相似性的目的之一是通过相似的序列得到相似的结构或相似的功能，通过比较未知序列已知序列(尤其是结构和功能已知的序列) 之间的相似性，可以很容易得知未知序列的功能。研究序列相似性的另一个目的是通过序列的相似性，判别积序列之间的同源性，推测序列之间的进化关系。