计算机新技术在生物多样性信息系统中的计算机新技术在生物多样性
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计算机新技术在生物多样性信息系统中的计算机新技术在生物多样性信息系统中的应用前景应用前景应用前景
夏经世1
伍玉明2
(1北京麋鹿生态实验中心,北京 100076)
(2中国科学院动物研究所,北京 100080)
摘要 生物学及相关学科长期积累的资料和现代计算机技术是建立生物多样性信息系统 (BIS)的基础,两者缺一不可。在日新月异的计算机领域,硬件技术进步之快有目共睹,易于 理解。然而软件技术的进步经常不为人们注意,如何应用这些技术而又保护以前的工作比起 应用硬件复杂得多。这里介绍几种计算机新技术的发展过程,并且讨论了在BIS中的应用前 景。
Internet/Intranet、Java语言的使用日益受到广泛关注。参加BIS的各个单位之间连接和 数据调用可以应用这些技术,成为以网络为中心的分布式计算方式。BIS的一个重要功能是 决策分析。数据仓库(数据商场,Data Warehouse)是在关系数据库的基础上发展,为决策支持 系统(DSS)需求而产生的。数据仓库更多的依赖历史数据,而不是时时变化的数据,因此适 合于处理庞大的数据,因此符合BIS的要求。
关键词 生物多样性信息系统 互联网/内联网 Java语言 数据仓库
1 1 生物学生物学生物学数据与计算机技术是生物多样性信息系统的基础数据与计算机技术是生物多样性信息系统的基础数据与计算机技术是生物多样性信息系统的基础
生物多样性不仅仅指狭义的生物学,而且包括农业、林业、海洋、环境和人文科学等等相关 学科,这些学科的科学工作者经过长期研究积累了大量宝贵的资料,它是建立生物多样性信息 系统(以下简称BIS)的基础之一。收集整理这些资料,将它们变为计算机数据并使之成为信 息是BIS最重要的任务。信息系统中如果没有数据,或者数据太少,无论数据库、模型的建立, 还是理论研究、决策分析都是毫无意义的,信息系统也不可能存在。现代计算机技术的飞速发 展为建立BIS奠定了软硬件基础。计算机领域技术进步日新月异,例如近两年受到广泛关注 的Internet、Intranet、Java语言、数据仓库(Data Warehouse,简称DW)等等,如何将这些技术应 用到BIS中是从事BIS科研人员的共同课题。
2 Internet 2 Internet与与Intranet Intranet的进展与在的进展与在的进展与在BIS BIS BIS中的应用中的应用中的应用
计算机技术到目前经历了三个阶段:以主机为中心的主机一终端模式,分布计算的服务器 /客户机模式和以综合网络为中心的分布计算模式。第三种模式以Internet(互连网,或称国 际互连网,网际网)为主,辅以局域网、城市网、广域网。Internet起源于60年代美国国防部的 ARPAnet,以后用于连接各大学和研究机构之间。进入90年代随着PC机的普及得以迅速膨 胀(Tittle,1995)。1996年Internet遍布大部分国家和地区,连接1000万台主机,现以每月 20%~30%的速度递增。美国正投资1亿多美元建下一代Internet,将比现在的Internet快 100~1000倍,用于连接美国的100多所大学和联邦实验室。这才是真正意义的信息高速公 路的开始.椐称到,2000年时将有1亿多台计算机、10亿个用户使用Internet。我国在这方面
也发展很快,1995年底已有1万台主机、10万用户加入Internet。
Internet的基本功能包括电子邮件(Email)、文件传输(FTP)、远程终端(Telnet)、信息检索 服务(如YAHOO)、超文本(WWW和Gopher)和电子商业(EC)等(Moody,1996)。以上这些 功能也是BIS所需要的。防火墙(Firewall)是Internet的安全机制(Siyan,1995)。BIS通过防 火墙可以与外部进行信息交流,使外部有条件地访问BIS(图1)
我国的计算机信息管理同时处于三种状态:单机应用,传统MIS(管理信息系统)和基于 Intranet的网络应用系统。单机系统是最原始的方式,现仍运行于许多单位,但作为BIS资源 共享、配合作业的有机系统,其性能价格比是最差的。MIS是围绕数据库技术和计算机网络 技术进行开发和组建的。对于BIS而言,MIS有以下缺陷:由于过多地依赖于使用的硬软件、 编程语言及开发者的个人素质引起标准性、可维护性差;没有标准的用户界面和操作流程使得 培训工作复杂,用户难于使用等等;其他原因。这些是造成我们现有系统用户很少的直接原因 之一。Intranet很好地解决了这些问题,并正在取代MIS。Internet和Java的使用使得标准性 和可维护性的大部分负担转给了硬软件提供商,Web浏览器使用户界面统一、简单、直观,无
需培训就可以享受BIS的
应用。
Intranet(内连网,企业互连网)正是基于Internet迅速发展而产生的。它沿用Internet的 产品和技术,因此Internet的功能它都具有(Ablan,1996)。它可以有自己的专用网络,也可借 用外部的Internet进行企业(广义概念,包括商业、事业、政府部门等等)内部通讯和管理。它 通过防火墙与外部的Internet用户和协作伙伴作有条件的信息交流。现在支持Intranet的软 件已经不少,例如,新版IBM/Lotus Notes、微软的Exchange、Netscape的SuiteSpot就是不错的 产品。将BIS看作一个大型企业,使用Internet/Intranet完成各个分中心和台站的连接、数据 的共享和复制。完成以网络为中心的分布式计算。
World Wide Web(WWW,Web)是Internet发展最快的技术之一。现在,中国科学院动物 所和微生物所已建立了自己的WW W站点。WW W浏览器遵循HT TP(超文本传输协议),
页
图l Intemet在生物多样性信息系统中的应用示意图
面用HTML(超文本描述语言)生成(Rick,1996)。新版的字处理、数据库等都支持Internet/ Intranet,例如微软的Word 97和Access 97将支持HTML。Access 97允许用户向Web发布静 态和动态的数据库页,还能够部分地复制到表(Form),增加超链接至其他的Office文件和 Web站点。使用Web浏览器可以大幅度降低软件开发时间和费用,延长软件生命周期,尤其 适合于非专业的科研人员浏览、管理、操作BIS的数据。
3 3 与计算机硬件和操作系统无关的与计算机硬件和操作系统无关的与计算机硬件和操作系统无关的Java Java Java语言语言语言
Java语言原由美国Sun公司于1991年6月为家用电器程序控制设计的通用语言(Oak), 虽然十分先进但却毫无市场。1994年秋,Internet和WWW开始快速发展,Sun将Oak修改成 Java,运行于Internet的WWW上,成为目前唯一的跨硬件平台,不受操作系统影响的计算机 语言。Java一经问世立刻受到计算机界的普遍欢迎,发展与应用十分迅猛。今年在美国、日 本,中国香港和中国台湾都举行过Java编程大赛。目前在WWW上运行着许多由Java编程 的applet。
Java语言之所以流行是与它的特点密切相连的。
1.跨平台独立性:Java的字节码(byte-code)使程序代码的执行与硬件、操作系统无关。 因此只要一次编程,在不同的平台上配备Java解释器都可运行该程序。
2.安全性:编译程序保证原代码不违反安全原则,字节代码校验功能保证不出现非法执 行,因此可以防止制造病毒和外部病毒的人侵。
3.面向对象:具有C+ +面向对象特点,同时去除了不常用和不良的特性,因此大大地减 少了软件开发和维护的成本。
4.分布式界面:具有各类扩充程序库,易与TCPFIP结合。
5.多线程界面:可执行多线程操作。
Java编程语言不仅可以作为BIS的Intranet跨硬件平台使用,而且外部的Internet用户和 协作伙伴利用浏览工具查询BIS中的数据、模型、GIS、决策分析等等(图2)。
利用Java编制的JavaOS(Java操作系统)能够运行在各种Java虚拟机。虚拟机可以是一 般的计算机,如NC(网络计算机),也可是PDA(个人数字助手)、打印机、蜂窝电话,甚至电冰 箱、洗衣机等家用电器。因此我们可利用JavaOS的这个特点,改造BIS台站种的仪器,使之智
能化,自动收集数据。
图 2 Web浏览器利用Java applet调用数据库数据
4 4 数据仓库与决策分析数据仓库与决策分析数据仓库与决策分析
数据仓库(Data Warehouse,DW)是基于数据库系统,为决策支持系统(Decision Support System,DSS)需求而产生的(Turban,1993)。DSS由三部分组成:DW、联机分析技术(On- Line Analytical Processing,OLAP)和数据挖掘技术(Data Mining,DM)。其中DW是核心,
用