网络信息资源组织方式
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2002-07-29
网络信息资源组织方式
郭学娟
(华中科技大学图书馆 武汉430074)
【摘要】 从网络环境下信息资源的特点入手,提出了从网上一次信息、二次信息、三次信息的角度探讨网络信息组织方
式的特点:一次信息组织方式有自由文本方式、数据库方式、超文本方式、主页方式;二次信息组织方式有搜索引擎方式、指示数据库方式、菜单方式、主题树方式;三次信息组织方式有元搜索引擎等方式。
【关键词】 网络信息资源 组织方式 一次信息 二次信息 三次信息 【分类号】 G250.73
The M odes of I n ternet I nforma tion Orgn iza tion
Guo Xuejuan
(T he L ibra ry of Cen tra l Ch ina U n iversity of S cience and T echnology ,W uhan 430074,Ch ina )
【Abstract 】 Starting w ith the characteristics of netw o rk info r m ati on resources under the netw o rk
environm ent ,the paper puts fo r w ard the view po int of the modes of netw o rk info r m ati on o rganizati on from th ree angles of p ri m ary info r m ati on ,secondary info r m ati on and tertiary info r m ati on .T he mode of p ri m ary info r m ati on o rganizati on includes free -text ,database ,hypertext and hom e page .T he mode of secondary info r m ati on o rganizati on includes search engine ,referral database ,m enu ,etc .T he mode of tertiary info r m ati on o rganizati on includes m etasearch engine ,etc .
【Keywords 】 N etw o rk info r m ati on resources M odes of o rganizati on P ri m ary info r m ati on Secondary
info r m ati on T ertiary info r m ati on
现代计算机技术、通讯技术和网络技术的飞速发展,使我们进入到一个全新的网络信息时代。网络信息资源是指通过计算机网络可以利用的各种信息的总和。网络环境下的信息资源和以往的信息资源相比,具有很大的差异。
1 网络环境下信息资源的特点
自90年代以来,伴随着信息资源的网络化、数字化发展,网络信息资源变的十分丰富。其特点有:
1.1 信息量大,来源广
Internet 已经成为继电视、
广播和报纸之外的第四媒体,是信息资源存储和传播的主要媒介之一,是集各个部门、各个领域的各种信息资源为一体的供网上用户共享的信息资源网。任何人都可以十分容易地在网上发布信息、传播观点。因此信息资源数量十分巨大,有“海量”信息之称。并且信息来源十分广泛,信息发布者既有政府部门、大学院校、研究机构、学术团体、行业协会,更有大量的公司企业和个人。
1.2 信息内容丰富,结构复杂
因特网已成为全球最大的信息资源基地,在因特网上几乎可以获得任何领域的信息。它的信息资源主要以数据库为主体,还包括采用多媒体技术形成的集声音、图像、文字等为
一体的包罗万象的综合性信息系统。其存储形式为文本??超文本??多媒体??超媒体,使信息组织方式也发生了巨大的变化,不仅以知识和信息为存贮单元,而且同时展示这些单元之间的逻辑关系,为网络环境下不同形式的信息资源的管理和开发提供技术支持;由传统的顺序、线性排列,通过利用数字化存储技术,发展到超文本、超媒体技术,促使信息资源按照自身的逻辑关系组成相互联系的、非线性的网状结构。
1.3 信息传播速度快,变化频繁
在非网络信息中,信息传播速度快且变化最大的莫过与报纸,但是报纸一经出版,其信息便无法更改。而在Internet 上,信息的更新非常及时,不少新闻站点、商业站点的信息每日更新;信息传播速度非常快,信息交流能瞬间完成。并且在因特网上,信息地址、信息链接、信息内容经常处于变动之中,信息资源的更换、消亡更是无法预测。为用户选择、利用网络信息资源带来了不便,同时也为信息的组织带来不便。
1.4 信息层次多,品种多样
Internet 上的信息资源层次多,有零次信息、
一次信息、二次信息、三次信息;有文本信息、图像信息、图形信息、表格信息、超文本信息等。同时还包括各种电子书刊、树目数据库、联机数据库、软件资源等,是多媒体、多语种、多类型信息的混合体。
1.5 信息分布缺乏组织,分散无序
・
561・
Internet信息资源的分散表现在没有一个中心点,也没有全面性的权限,甚至连本身的意义也显得模糊和多样。通过一种文献可以连接到更多相关或相类似的文献;同样,这份文献也可能从另一份文献链接而来,这种前所未有的自由度使Internet信息资源的共建和共享变的潜力无穷,然而也使Internet信息资源处于无序状态,而且“海量”的信息和快捷的传播加剧了网络信息的无序状态。许多信息资源缺乏加工和组织,其往往只是时间序列的信息堆积,缺乏系统性和组织性,而且其更新和消失往往无法预测,这无疑增大了对Internet信息资源的选择、搜集、管理和维护的难度。
可见,随着数字化、网络化技术的飞速发展,网络信息资源呈现出动态性、分布性、多元性和无序性等特点,使信息的查找和检索变的越来越困难。对于21世纪的信息用户和信息管理者来说,困扰他们的不是信息太少,而是信息过多。因此,如何对网络信息资源进行合理的描述、组织、序化和提高信息的利用率是当前研究的重要课题。
2 网络信息资源组织方式探讨
到了21世纪的今天,随着网络通讯技术的发展,出现了大量的网络信息,它们多以数据库、超文本、多媒体的形式存在,电子型、数字型信息资源逐步占据网络时代的主导地位。随着网络信息数量的不断扩充,对网络信息进行有效的组织与控制的要求日益迫切,人们普遍感受到由于网络信息杂乱无序而带来的检索困难。在这种情况下,许多学者开始着眼于网络信息的组织,并且产生了大量有见地的文章。而笔者将从一次信息、二次信息、三次信息的角度探讨网络信息的组织方式。
2.1 一次网络信息的组织
一次网络信息,指在网络环境下,没有经过加工、处理的原始信息。其范围包括网络电子书刊、网络学术期刊、网络会议论坛、网络新闻组等。任何一次网络信息,都有其独立存在的标志,即唯一的U RL(U nifo r m R esource L ocato r,统一资源地址,是Internet上WWW服务程序上用于指定信息位置的表示方法)。其具体的组织方式有:
(1)自由文本方式(F ree-text) 这种信息资源组织方式主要用于全文数据库的建造,是对非结构化的文本信息进行组织和处理的一种方式。所谓全文数据库,是将一部分图书、一篇文章或一种杂志、一份报纸的全部文本都输入计算机,使之成为计算机可以阅读和处理的文本。它不是对文献特征的格式化描述,而是用自然语言深入揭示文献中的知识单元,按文献全文的自然状况直接设置检索点。它所组织的是人们创造或采集到的网外全文信息,是输入网络的新资源。
(2)数据库方式(D atabase) 数据库是对大量的规范化数据进行管理的技术。利用数据库技术对网络信息资源进行管理可极大地提高信息的有序性、完整性、可理解性和安全性,可以有效地处理大量结构化的数据。数据的最小存储单位是信息项(字段)。可以根据用户的需求灵活地改变查询结果集的大小,从而大大降低了网络数据传输的负载。目前以数据库技术为基础建立了大量的信息系统,形成了一整套系统分析、设计与实施的方法,为人们建立网络信息系统提供了现成的经验和模式,数据库技术与网络技术的融合极大地方便了用户利用和开发信息资源,提高了效率。尤其是对象数据库(O bject D atabase)方式,它在通常情况下是用户在指引库中检索,再将检索结果对应到对象数据库中索取原始信息。这样不仅可以提高用户的查询效率,而且可以减少网上数据流量,提高网络服务能力。
(3)超文本(H ypertext)方式 超文本方式打破了顺序线性存取的局限,采用非线性组织方式,能提供非顺序性浏览功能,比传统的组织方式更符合人们思维联想和跳跃性的习惯。这种信息组织方式将网络上相关文本的信息有机地编织在一起,以节点为基本单位,节点间以超链接(H yper-link)方式相连,将文本信息组织成立体网状结构,使用户可以从任一结点开始,根据网络中信息间的联系,从不同角度,灵活、方便地浏览和查询信息。目前,因特网上绝大部分一次信息均采用这种组织方式。
(4)主页(Hom e Page)方式 这种组织方式类似于档案全宗的组织方式,它将有关某机构或个人的一次信息集中组织在一起,是对某机构或个人的全面介绍。目前因特网上关于机构或个人的信息几乎毫无例外地采用这种组织方式。
2.2 二次网络信息的组织
二次网络信息,其范围包括搜索引擎、虚拟图书馆等。二次网络信息的生成原理是对一次网络信息的搜集和对已搜集一次网络信息的组织。具体有以下几种组织方式:
(1)搜索引擎(Search Engine)方式 这是目前因特网上对网上二次信息进行组织的主要形式,如Ho tbo t,Yahoo,A ltavista,A rch ie 等。它一般采用网络自动索引软件(如Robo t,Sp iders,或W o r m)自动跟踪、浏览网页、搜集网络信息,并对搜集来的信息进行自动标引,形成一份摘要,按一定格式创建一个详尽的、可供用户进一步按关键词查询的索引数据库方式。其实质是一种报道、存储网上信息的检索工具,起到网络导航的作用。
(2)指示数据库(R eferral D atabase)方式 作为网上二次信息形式之一的指示数据库,其存储的是有关网上一次信息的名称、地址及相关信息的描述信息,即对网上的信息资源进行分类编目,并存储其U RL或IP地址,这类似于图书馆中的书目信息数据库。具体而言,它把因特网上与某一或某些主题相关的结点进行集中,按照用户方便的原则,以用户熟悉的语言组织起来,向用户提供这些资源的分布情况,指引用户查找。指示数据库在网络中处于核心地位,它一方面补充了因特网检索工具的不足,另一方面充实我国的信息资源,探索出了一条建设具有专业或学科特色信息资源的新途径。形象地说,因特网是信息的海洋,指示数据库是航海图。利用指示数据库技术,我们可以将因特网上的信息资源进行集中、分类、整理,然后再以主题树的形式指引用户查找。这种方式最大的优点是入库记录都经严格选择,具有较强的针对性和较高的可靠性,检索结果适应性强。因此,指示数据库方式常用来组织专题性的或专用网上二次信息。
(3)菜单(M enu)方式 这种方式主要组织用于浏览的网上二次信息。以菜单方式组织的网上二次信息本来是一个超文本文件,一般是围绕某一专题,采用分类法、地序法、时序法、主题法等方式,将与该专题有关的网上一次信息的线索(一般是其地址)和有关描述信息依次罗列,供用户浏览选择,用户若对其中一项感兴趣,直接用鼠标在其上click即可。这种方式类似于手工检索在某一专题下对款目的浏览。由于菜单方式组织的网上二次信息专题性较强,且能较好的满足族性检索要求,因而受到用户的欢迎。如目前因特网上的Jobhunter, resources fo r L ibrarian on the Internet,resources fo r s m all business
・
6
6
1
・