分子生物学常用软件
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
随着计算机技术和Internet数字化高速公路日新月异的飞速发展,生物信息(Bioinformation)和生物电脑化(Biocomputing)也飞速发展,愈来愈多的生物学家(Bioscientist)根据生物科学(Biosience)研究的实际需要,编写了大量的生物科学应用软件。生物科学软件应用范围非常广泛,从最基本的多媒体互动式教学到最高级的虚拟细胞生命过程的互动式模拟,可谓应有尽有[1,2,3]。这些软件的实际应用,为医学进一步信息数字化、信息全球共享化带来了光明的前景。而分子生物学作为生命科学一个极为重要的分枝,理所当然倍受重视,其相应的生物科学应用软件可谓枚不胜举[2,3,4]。分子生物学专业软件(Molecular Biology Software;Biosoft)的应用,为广大分子生物学研究人员的医、教、研工作带来了极大的便利性。
与普通的应用软件相同,分子生物学专业软件的种类主要有纯商业软件(只提供软件功能演示)、商业共享演示软件(全部或部分软件功能但使用时间极为有限)和免费软件[2]。对于前两种软件而言,只有付出一定的费用,才会得到全功能的商业软件,而后者却完全免费使用。对于大多数资金有限的从事分子生物学研究的教师、工作人员和学生等,免费软件通常是唯一的选择。因此,本文着重介绍在PC机WINDOWS95/98和Mac机OS操作系统上应用的分子生物学免费软件及其重要性,并指出在何处可以找到自己所需的免费软件以及在论文写作和发表中如何处理免费软件应用的相关问题。
一.分子生物学专业软件在分子生物学领域应用的重要性
在分子生物学研究领域中,引物设计、多序列比较分析、基因进化树结构分析、核酸/蛋白质高级结构预测等等,若单纯依靠手工设计与分析,几乎很难达到理想要求。而通过使用分子生物学专业软件,则可以很轻松地设计出符合要求的引物、简便快速地进行多序列的分析比较等。不仅如此,它还可制作具有专业水平的图形图像,如质粒图谱、克隆表达载体构建图谱、限制性酶切片段图谱等。分子生物学专业软件应用可以比较方便地解决分子生物研究人员从立项到最后写论文的实际问题,它在分子生物学的应用范围主要有:研究资料收集整理(如序列查询、文献检索)、序列分析和实验设计(如引物设计、限制性酶切分析、同源序列比较、质粒作图、基序查找、RNA二级结构预测、蛋白二级结构预测、克隆策略图谱、蛋白三级结构显示、序列格式转换、DNA 测序样品原始胶图文件分析等)、实验数据统计和分析(如电泳条带定量分析、数据统计分析作图)、论文写作和发表(如文献引用、生成发表质量的图片、序列递交)。
二、分子生物学免费软件的索取与应用
从国际互联网Internet中可以发现并收集到大量分子生物学医、教、研免费软件。其中,大部分应用软件均由生物学家、化学家和软件开发者所写。
2.1免费软件与商业软件
当分子生物学家的科研需要一类新的分析演算法则时,就将其具体化成软件,如大部分免费的基本分子生物学序列分析软件包均是由生物科学家开发的,包括FastA、BLAST、Clustal、MFOLD、PHYLIP、Paup、CAP等。通常此类软件的源代码属于免费共享。与商业软件相比,免费软件往往在用户界面、易用性及集成性方面稍逊一畴,而且,商业软件包在软件的升级支持、技术支持等方面也有一定的优势。因此,在资金许可的情况下,商业软件通常是一种更好的选择。但免费软件的最大优势就在于它为广大从事分子生物学研究的相关人员提供了专业性相关最好的软件资源,甚至某此免费软件提供的功能比商业软件更强大,或者还提供了商业软件未能提供的功能。
此外,随着生物信息和生物电脑化的飞速发展,许多优秀的程序员都正在开发软件,其中许多人将此类软件作为一种免费软件。现在,许多免费软件都特别注重用户界面、易用性及集成性。对于大部分科学应用软件,由于其潜在的市场非常小,以致于有时免费软件包与昂贵的商业软件包在功能上没有明显的差别。
2.2Internet资源——分子生物学免费软件资源点
自从80年代开始,生物科学免费软件已经可以广泛地通过Internet获得。现在有许多专用于存放生物科学免费软件及其相应资料的档案文件库(Archives),而且,还有许多免费软件作者自己提供的网络服务器,从这些站点上,可以最大限度地收集到各种用途的分子生物学免费软件。
目前,存放分子生物学软件最常用的两个档案库是印地安那州大学的IUBio档案文件库(IUBio)和欧洲生物情报协会(European Bioinformatics Institute,EBI)软件档案文件库,其统一资源定位器(RUL)地址分别是/或ftp:///(IUBio)和/或ftp:///(EBI)。
通过EBI可以连接到EMBL数据库及其它数据库的主页及许多分子生物学软件档案库主页,如生物软件目录表(Bio Catalog of software,/biocat/biocat.html)。
IUBio也与许多生物软件主页相连,并提供对GenBank、SwissPort和PIR数据库关键字查询及生物网络新闻档案库服务(Bionet Network News Archives)。IUBio在世界各地有许多镜像站点,包括芬兰、瑞典、日本、英国、法国、西班牙、以色列等。
除上述两个主要的档案库外,还有许多类似的分子生物学免费软件档案库,如:8088/search-launcher/launcher.html、/、http://expasy.hcuge.ch/。
2.3查询与索取软件技巧
在知道软件名称及网址时,可直接方便地从网上下载相应的软件。但当不知道软件网址或仅仅想了解大部分软件时,就可以通过Internet上的各类搜索引擎进行查询,如Google()、Yahoo(/)、网易()、Altavista(/)等,此时,以软件名称进行特定的搜索查询,或以其它关键词,如molecular biological software进行广泛的搜索,即可查询到相关软件网址。
索取软件的方式通常有以下几种。首先可在软件所在网站直接下载:如Netscape、Internet Explore及其它网页浏览器均可通过HTTP (超级文本传输协议)或FTP(文件传输协议)下载软件。其次,某些软件还可通过Internet网站向用户以软盘或光盘形式免费提供商业软件演示版本软件包,此外,某些免费软件还可向软件作者直接以电子邮件的形式索取。
要牢记一点的就是软件是不断升级的,如果使用软件版本有问题的话,也许现在或很快就有新的版本。软件作者的主站点是检查软件是否升级的最好的地方,而档案服务器并不总贮存有软件的最新当前版本。
2.4安装和使用
通常,免费软件含有安装说明,但并不总是很详细,或不能涉及软件运行时涉及的所有问题。软件的特殊安装一般只有商业软件才会有,一般而言免费软件是不需要特殊安装的。对于部分特殊软件,特别是用Java或Perl语言写的软件,常会要求您还要安装其它免费的常用软件后才能使用,因此,一定要首先详细地阅读免费软件的安装说明。
2.5多平台软件
以1998年的统计而言,在当年访问IUBio及其它生物网络服务器的INTERNET浏览器中,30-50%的生物学家使用Mac计算机,40-70%使用Wintel系统(Microsoft和Intel的联合),少于10%使用XWindows系统作为工作平台。生物科学家对计算机系统及软件的保持不同,根据软件的运行环境,许多已经使用或将要使用多平台操作系统。在今后,有可能Mac上运行MS Windows软件运行,而在Wintel系统运行一些Mac OS程序。
近年出现的Java语言使得开发跨平台的多种操作系统的软件成为可能,从而使一应用软件可在任何一台计算机上被任何需要它的人所使用,这无疑是软件应用的一种理想境界。诞生于Sun Microsystems()的Java开发系统虽然与C++、C语言及其它语言所开发的程序相比,Java软件的运行速度还比较慢,但有望开发出多平台操作系统中运行流畅的应用软件。在今后,将会有许多用Java语言开发的生物科学软件,例如来自于Licor的序列分析软件包()。
2.6客户端服务器软件
许多生命科学软件开发者的观念是将用户界面从分析应用程序中分离出来,从而增强应用程序的易用性。这一观念构成了软件客户端服务器软件的理论基础,如目前可以进行多种数据分析的网页界面的应用程序(如SeqPup)。
SeqPup功能及原理如下:它充许用户使用任何自己需要的分析软件,如Clustal、CAP、tacg、fastDNAml或别的软件,在客户端计算机或服务器计算机上运行。SeqPup提供了序列编辑、多序列比较、序列输入输出选项等功能。并可配置如上所述分析软件。这些分析应用程序通常没有命令行选项,但可对复杂的数据进行编辑和分析。有了如SeqPup的客户端应用程序后,使用这些软件就比较简单,并可按照自己的方法组织和管理自己的数据。
由Peter Rice开发的一套免费分子生物学分析应用软件EMBOSS(/Software/EMBOSS/)将运行于UNIX服务器计算机,有命令行界面。EMBOSS将包括多种序列分析项目,而且力求提供与其它公众域(Public Domain,用户可以免费获得公众域的服务或文件)软件包集成的简便性。分析功能包括快速的数据库序列搜索、小片段基因组密码子作用分析、微生物基因序列识别、多序列的快速鉴别、蛋白基序识别、发表论文的出版工具等。
三.优秀免费软件举例
3.1Clustal:多序列比较(sequence alignment)
Clustal是一类多序列比较软件,目前最新版本叫Clustal W,可以应用于MacOS、Wintel、UNIX和VMS计算机。对多个核酸或蛋白序列的比较目前是分子生物学中一类很有用的分析工具,可用于寻找特征化蛋白家族的诊断模式、预测新序列的二级/三级结构、设计PCR引物,以及分析分子演变进程。Clustal可在EBI和IUBio的档案库ftp://ftp-igbmc.u-strasbg.fr/pub/ClustalW中下载。此软件的商业版本称之为ClustalX,它提供了一种图形界面,但功能相似。
3.2Entrez:基因组序列搜索引擎及MEDLINE检索工具
Entrez是可通过关键字搜索基因序列和检索MEDLINE文献的多平台操作系统软件,由美国国家生物技术信息中心(National Center for Biotechnology Information,NCBI)的成员开发,可以从/或ftp:///下载。Entrez的优点之一就是它包含了对MEDLINE的查询,从而可以检索向序列数据库递交的文献摘要。NCBI的万维网(WWW)服务还提供了可以通