第六章 网络信息资源管理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第六章网络信息资源管理
本章提要】
本章主要讲解了网络信息资源这种重要而又独特的信息资源的管理。在介绍网络信息资源类型和特点的基础上,从多个层次对网络信息资源的组织进行了探讨,并着重对网络信息资源的检索进行了详细论述。介绍了网络信息检索的过程、网络信息检索的工具,并对搜索引擎这一众所周知的最常用网络检索工具进行了多角度探讨。在此基础上,本章从检索技术的角度,对网络检索技术做了较大篇幅的讨论,并结合常用的搜索引擎进行了案例分析。本章最后对网络信息资源的评价进行了研究。
【学习目标】
1、网络信息资源的类型及特点;
2、网络信息资源组织的方法;
3、网络信息检索的过程;
4、网络信息检索的工具;
5、搜索引擎的基本概念、类型及其作用;
6、网络信息资源的评价。
【学习指南】
本章的重点是第1节、第3节、第4节。
【预习思考题】
1、网络信息资源主要有哪些类型?
2、和传统信息资源相比,网络信息资源具有什么特点?
3、目前网络信息资源的组织主要有哪些方法?
4、请简述网络信息检索的过程。具体的网络信息检索技术主要有哪些?
5、网络信息检索的工具有哪些?
6、搜索引擎主要有哪些类型?各类搜索引擎各有什么特点?
7、网络信息资源评价主要从哪几个方面进行考虑?
第一节网络信息资源概述
本节内容
一、网络信息资源类型二、网络信息资源的特点
一、网络信息资源的类型
★网络信息资源的分类有多种标准,根据不同的分类标准,可以将网络信息资源分为不同的类型。
第一,网络信息资源从内容范围上可以分为五个大类:学术信息,教育信息,政府信息,文化信息,有害和违法信息等。
第二,按信息源提供信息的加工深度分,可分为一次信息源、二次信息源、三次信息源等。
第三,依据信息源的信息内容则可将网络信息资源分为以下类型:一是联机数据库,即各类数据库是联机存储电子信息源的主体。二是联机馆藏目录。三是电子图书。四是电子期刊。五是
电子报纸。六是软件与娱乐游戏类。七是教育培训类。八是动态性信息。
第四,如果认为网络中的信息存取方式所要达到的功能是在简单地模拟和再生人类信息传播方式的话,那么参照非网络环境中信息存取方式的方法对网络信息资源进行归类,主要有六种网络信息资源的类型。一是邮件型,以电子邮件和电子邮件群体服务(mailinglist)为代表的。二是电话型,代表性的手段有会话(talk)和交互网中继对话(IRC Internet Relay Chat)。三是揭示板型,比较具有代表性的是网络新闻和匿名FTP。四是广播型,可以在网络上向特定的多数的利用者即时提供图像和声音的信息的传播方式。五是图书馆型。六是书目型,主要用于检索网络信息资源的各种检索工具,如查人物机构团体的finger和Whois,查FTP文件的提供者的Archie和WAIS,以及在WWW上的Yahoo,Infoseek等。这样的分类方法尽管考虑到了网络信息资源的特点,但是比较粗糙,有的地方也不尽合理。
第五,如果从科学的正式交流渠道与非正式交流渠道的思想出发,网络信息资源可以分为稳定的信息资源和不稳定的信息资源两类。
稳定性的信息资源的特点是:一是从信息来源上讲,由一定的机构运营,相对来说,信息资源的提供比较稳定;二是从信息内容来讲,经过一定的加工和处理,相对来说,信息的精度和准确度是可以信赖的;三是从信息存取的方式来讲,有比较稳定的存取途
径和手续,可以重复进行操作。
二、网络信息资源的特点
第一、以网络为传播媒体。
第二,以多媒体为内容特征。
第三,以超文本形式组织信息。
第四,传播方式的多样性、交互性。
第五,变化更新快。
第二节网络信息资源的组织
本节内容
一、网络信息资源组织的概念与组织的必要性二、网络信息资源类型三、网络信息资源的特点
一、网络信息资源组织的概念与组织的必要性
★网络信息资源的组织是指对网上的各种概念、数据(包括声音、图像、软件等)、事实、文献等,通过分析、标引(分类的和语词的)、著录(信息特征的描述)、链接(把相关的信息加以联系)、排序、存储等手段,形成一个有序的、便于用户理解和查询的信息系统的过程。
★组织网络信息资源的必要性:
主要表现在以下三个方面:
一是在Intemet上存在着大量可获得的有价值、可利用的信息。
二是为了检索的便易,这些资源需要组织。人们希望能够方便快捷地检索到他们所需要的网络信息资源,这时,组织这些资源就十分必要了。
三是为了方便人们对网络信息资源进行管理与控制。利用一定的数据格式将这些资源组织起来不仅是获得它们的最有效的方式,也是管理与控制它们的有效方式。
从宏观角度来看,网络信息资源的组织通常是由Internet、局域网上的各种网站来实现的,而网站信息资源的组织则是通过各个网页来完成的。和传统的印刷型文献相比,一个网站就相当于一本书籍,而构成网站的各个网页则相当于构成书籍的各个页面。网页承载着具体的信息内容,并通过相互之间的各种链接关系达到对网络信息资源的组织,因此,网页链接结构的组织就显得相当重要。
二、网页的组织
★网页的链接结构主要是指各网页间的链接形式,反映的是网页彼此间的关联状况,网站中各网页的链接形式决定了用户在访问该网站时的浏览次序和效率。在实际的网页制作中,网页结构的设计直接影响到网页的版面布局。
★网页的链接结构通常可以分为两种基本形式:树状结构(层级结构)和网状结构(平级结构)。
●树状结构类似于目录结构,网页按内部逻辑分为不同层次,一个上级网页指向一个或多个下级网页,层层进入,层层退出。这种结构的优点是条理清晰,用户可以很容易地知道自己所处的位置,但是这种层次分明的结构使得用户浏览时,必须按部就班、逐步进行,因而浏览效率较低。
●网状结构是一种很少具有或者根本不具有总体结构的文档结构,网页之间也无所谓等级,只要有相互关系的任何两个网页都可以建立超链接。网状结构有利于用户对所需信息的快速定位,从而提高浏览速度,但是由于这种结构的无序性,容易使用户迷路,而且随着网站信息量的增加,会使得网站的维护工作日益困难。
★在实际的设计中,通常采用树状结构和网状结构混合使用的方式来组织网页之间的链接。
三、文件的组织
★文件的目录结构则是网页在服务器上的存放状况;文件的目录结构影响的则是管理者对网站的日常维护。文件目录结构合理与否,将直接影响到文件的增加、删除、修改、更新、上传等。
文件的组织通常有以下方法:一是将文件分级存放,这样在寻找某一特定文件时可以减少搜索时间;二是按文件所属的栏目进行存放,如可以将一级网页存放在一级子目录下,二级网页存放在二级子目录下,依此类推。
网页的链接结构和目录结构不存在一一对应的关系,但如果按照链接结构所划分的栏目内容设立相应的目录,存放相应的文件,将会给维护管理工作带来极大的便利。
★目前Internet上最为通用的组织方法有以下几种。
1.主题树方式
主题树方式(subject Tree)是一种可供检索和查询的等级式主题目录。以超文本链接的方式将不同学科、专业、行业和区域的信息按照分类或主题目录的方式组织起来,也有人把它称为“基于目录的搜索引擎”,如Yahoo!,Medweb等。
目前主题树系统与关键词检索系统相结合,是大型网络搜索引擎普遍采用的一种形式,以弥补各自的不足。
2.文件组织方式
以文件方式组织网络信息资源简单方便,但随着网络信息资源利用的不断普及和信息量的不断增多,以文件为单位共享和传输信息会使网络负载越来越大;而且当信息结构较为复杂时,文件系统难以实现有效的控制和管理。因此,文件方式只能是组织网络信息资源的辅助形式。
3.数据库组织方式
就是将所有获得的信息资源按照固定的记录格式存储组织,用户通过关键词及其组配查询就