生物信息学实验指导书_新版本

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

生物信息学实验指导书

重庆邮电大学

生物信息学实验指导书生物信息教学部谭军编

重庆邮电大学生物信息学院

前言

生物信息学是上世纪90年代初人类基因组计划(HGP)依赖，随着基因组学、蛋白组学等新兴学科的建立，逐渐发展起来的生物学、数学和计算机信息科学的一门交叉应用学科。目前生物信息学的研究领域主要包括基于生物序列数据的整理和注释、生物信息挖掘工具开发及利用这些工具揭示生物学基础理论知识等领域。生物信息学作为新型交叉应用学科，可以依托本校已有的计算机科学、信息学、生物学和数学等学科优势，充分展现投入少、见效快、起点高的特色，推动学校学科建设和本科教学水平。

本实验指导书中的8个实验均设计为综合性开发实验，面向生物信息学院全体本科学生和研究生，以及全校对生物信息学感

兴趣的其他专业学生开放。生物信息学实验室将提供系统的保障，包括采用mail服务器和linux帐号管理等进行实验过程管理和支持。限选《生物信息学及实验》的生物技术专业本科生至少选择其中5个实验，并不少于8个学时，即为课程要求的0.5个学分。其他选修者按照课时和学校相关规定计算创新学分。

实验一熟悉生物信息学网站及其数据的

生物学意义

实验目的：

培养学生利用互联网资源获取生物信息学研究前沿和相关数据的能力，熟悉生物信息学相关的一些重要国内外网站，及其核酸序列、蛋白质序列及代谢途径等功能相关数据库，学会下载生物相关的信息数据，了解不同的数据文件格式和其中重要的生物学意义。

实验原理：

利用互联网资源检索相关的国内外生物信息学相关网站，如：NCBI、SANGER、TIGR、KEGG、SWISSPORT、Ensemble、中科院北京基因组研究

所、北大生物信息学中心等，下载其中相关的数据，如fasta、genbank格式的核算和蛋白质序列、pathway等数据，理解其重要的生物学意义。

实验内容：

1.浏览和搜索至少10个国外和至少5个国内生物信息学相关网站，并描

述网站特征；

2.下载各网站的代表性数据各10条（组）以上，并说明其生物学意义；

3.讨论各网站适合做何种生物信息学研究的平台，并设计一个研究设想。实验报告：

1.各网站网址及特征描述；

2.代表性数据的下载和生物学意义的描述；

3.讨论：这些生物信息学相关网站的信息资源，可以被那些生物信息学

研究所利用。

参考书目：

《生物信息学概论》罗静初等译，北京大学出版社，2002；

《生物信息学手册》郝柏林等著，上海科技出版社，2004；

《生物信息学实验指导》胡松年等著，浙江大学出版社，2003。

实验二利用BLAST进行序列比对

实验目的：

了解BLAST及其子程序的原理和基本参数，熟练地应用网络平台和Linux 计算平台进行本地BLAST序列比对，熟悉BLAST结果的格式和内容并能描述其主要意义，同时比较网上平台和本地平台的优缺点。

实验原理：

利用实验一下载的核算和蛋白质序列，提交到NCBI或者其他拥有BLAST 运算平台的网页上，观察其基本参数设定库文件类型，并得到计算结果；同时在本地服务器上学会用formatdb格式化库文件，并输入BLAST命令进行计算，获得结果文件。

实验内容：

1.向网上BLAST服务器提交序列，得到匹配结果；

2.本地使用BLAST，格式化库文件，输入命令行得到匹配结果；

3.对结果文件进行简要描述，阐述生物学意义。

实验报告：

1.阐述BLAST原理和比对步骤；

2.不同类型BLAST的结果及其说明；

3.讨论：不同平台运行BLAST的需求比较。

参考书目：

《生物信息学概论》罗静初等译，北京大学出版社，2002；

《生物信息学实验指导》胡松年等著，浙江大学出版社，2003；/Education/BLASTinfo/information3.html。

实验三利用ClustalX(W)进行

多序列联配

实验目的：

掌握用Clustal X(W)工具及其基本参数，对具有一定同源性和相似性的核酸与蛋白质序列进行联配和聚类分析，由此对这些物种的亲缘关系进行判断，并且对这些序列在分子进化过程中的保守性做出估计。

实验原理：

首先对于输入的每一条序列，两两之间进行联配，总共进行n*（n-1）/2次联配，这一步通过一种快速的近似算法实现，其得分用来计算指导树，系统树图能用于指导后面进行的多序列联配的过程。系统树图是通过UPGMA方法计算的。在系统树图绘制完以后，输入的所有序列按照得分高低被分成n-1个组，然后再对组与组之间进行联配，这一步用Myers和Miller算法实现。

实验内容：

1.明确软件所支持的输入文件格式，搜集整理出合适的数据；

2.在Windows环境运行Clustal X，在Linux环境运行Clustal W；

3.实验结果及分析，用TREEV32或Njplotwin95生成NJ聚类图。

实验报告：

1.整理好的符合Clustal的序列数据；

2.提交数据网页记录和各步骤记录；

3.提供聚类图和多序列联配图，并说明意义。

参考书目：

《生物信息学概论》罗静初等译，北京大学出版社，2002；

《生物信息学实验指导》胡松年等著，浙江大学出版社，2003。

实验四ESTS分析

实验目的：

熟悉使用一系列生物信息学分析工具对测序得到ESTs序列数据进行聚类处理，由此对获得表达基因的丰度等相关信息，并且对这些表达基因进行功能的初步诠释，为后续实验通过设计RACE引物获得全长基因，以及进一步的功能注释和代谢途径分析做好准备。

实验原理：

首先用crossmatch程序去除ESTs原始序列中的载体成分和引物成分，然