数字图书馆个人空间构想

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

数字化图书馆中个人信息空间之构想
A Conception of Persional Information Space for Digital Libraries
曾元显
辅仁大学图书信息学系副教授
Email: tseng@.tw
中国图书馆学会会报，第 56 期，1996，页 69-75
/counter
前言
数字化图书馆的运作问题
个人信息空间
技术的可行性
结语
参考数据
Abstract:
The favorable characteristics of digital data, namely information are ready for manipulation, transmission, and archiving by computers, have made libraries an opportunity for providing better services ever imagined. This paper proposes the paradigm of Personal Information Space (PIS) as an
interface to the future digital libraries. In this model, the user collects frequently used information and resources in a virtual space where he can easily access. The user retrieves information from the WWW or
instead, he/she asks the digital librarian for help when he is not familiar with the retrieving tools or when he/she can not form proper search strategies. He or she in this space can concentrate on information consuming and producing rather than manipulating computer files. The space
provides a NEWS-like channel so that the user can communicate with experts from other fields. By analyzing the user's information need and search patterns, the PIS can provide better services in an active fashion. The feasibility of the PIS idea is also discussed. This paper shows that the technological foundations for the PIS model to come true are already in place.
摘要：
数字化数据便于储存、整理、修改、传输、复制与运用的特性，使图书馆有机会以
过去无法想象的便利方式，提供使用者更好的服务。

本文提出「个人信息空间」的观
念与运作模式，试图作为未来数字化图书馆与用户互动的接口。

在这模式里，读者
可将常用的信息汇集在一起，以便随手取得，随时运用，其功能类似目前大型图书馆
开辟的研究室，只不过使用者不占有一实质的地方，而是拥有一虚拟的空间。

此模式
重要的特性如下：一、读者根据自己的需求在信息网络中找数据，若不谙网络使用方
式或无法有效检索数据，可以请求数字图书馆员的协助；二、数字图书馆里的实质收
藏由专业的馆员来做适当的分类编目，对于汇入个人信息空间里的资源，则依适合读
者的方式各自处理；三、读者透过浏览器签入自己的信息空间，直接接触信息，而不
必费心于低层次的档案操作，以提高信息的生产能力；四、读者专业的参考问题，可
以透过公开的讨论空间获得解答或指引；五、信息空间里有读者的信息需求与检索行
为的记录，分析这些数据，可使数字图书馆主动提供读者更好的服务。

此外，本文也
针对个人信息空间的可行性提出探讨，说明目前全球信息网络上的相关技术，已可用
来实现此一构想。

关键词（Keywords）：
数字化图书馆（digital libraries），
个人信息空间（persional information space），
全球信息网络（World Wide Web）
壹、前言
信息科技在近数十年来发展得非常快速。

过去计算机技术的发展，促使图书馆作业自动化，达到书目数据可经由计算机检索查询的便利。

近几年计算机与网络技术
的结合，除了便利书目数据的查询外，更进一步可以透过网络存取其内容。

不仅如此，声音、图像、视讯等其他信息媒体也都可以数字化，储存成计算机可以立即
处理的型态。

这些进展，使得数字化图书馆不仅成为未来图书馆发展的方向，甚
至在某种程度上，已经存在于现有的国际网络（InterNet) 或全球信息网络（World Wide Web，以下简写成 WWW）上了。

近两三年来，探讨「数字化图书馆」的期刊、研讨会及项目计划纷纷涌现。

如一九九五年四月 Communications of The ACM 期刊推出了「数字化图书馆」
专辑，内容包括数字化图书馆的多项议题、ACM 尔后的出版政策、以及美国数所
大学在 NSF、ARPA、NASA等政府机构二千四百四十万美元经费支助下，发展的
数
位化图书馆计划 [1]。

另外，美国德州农工大学于九四年举办第一届「数字化图
书馆」研讨会[2]，九五年德州奥斯汀举办第二届 [3]。

同年，日本 [4]、新加
坡 [5] 也纷纷加入探讨的行列。

九六年则有 ACM 及英国的研讨会 [6,7]。

显见
国际间对数字化图书馆发展的重视。

国内的情形则发展较慢，目前教育部正在推动图书馆自动化和网络系统整合
工作 [8]，未来几年各级学校、各级图书馆将经由网络链接，形成「全国图书资
讯网络」，以配合国家信息基础建设（NII）的发展。

而图书数据数字化将是 NII 能否发挥功能的重要关键。

图书数据数字化后一个重要的效益是：数字化的数据便于储存、整理、修改、
传输、复制、运用。

这些特性使得信息更能够达到「为全体国民公开、公平使用」
的目的，对于民主社会的发展、人民权利的保障极具重大的意义 [9] 。

贰、数字化图书馆的运作问题
相对于传统图书馆的采、编、典藏、流通服务的运作流程，数字化图书馆的
运作方式也需考虑这些问题，以提供图书馆的用户最便利的信息存取服务。

但
是由于数字数据（尤其是网络资源）的特性与纸本数据不同，以及数字数据运用
方式的极具弹性，若以传统的运作流程来推导未来图书馆的作业模式，将无法使
图书馆的服务达到最大的效用。

与兹列举重要的问题如下：
一、网络资源的采访：最近几年，政府机构、公司行号、研究单位、乃至于
个人均可透过免费的服务器如 http、gopher、wais、news等系统在网络上提供
资
讯。

由于硬件价格的滑落、免费软件安装的简易、全世界均可看到的宣传效果以
及商业上潜在的利益，网络上的信息站几乎每半年即成长一倍。

这种数量庞大、分散各处、而且随时随地就会冒出信息站的情况，对网络资源的采访工作是极大
的挑战。

目前有三种主要方法[10]：第一是人工方式：由熟悉网络资源检索技术
的人员来过滤、筛检网络上的资源；第二为自动方式：透过像 Web walkers, worms, spiders, harvesters 等自动采访器（robot）或检索引擎（search engine）来
搜集网络上各节点的数据；第三种方式则由大众推荐：网络用户透过传送
Email 或填写服务器所提供的 WWW form 来推荐有用的数据。

在此情况下，数字
图书馆的馆员如何发展适当的方式采访数据，并且摘要精确，使人一目了然，以
迅速满足读者的需求？
二、网络资源的分类、编目：传统分类、编目方式虽可对馆藏数据作精确的
掌握，但数字化数据存在的格式与纸本数据不同，不仅版本加多、不定期更新、编目索引的项目不同，而且分散各地、文件与文件相互连结，内容短而数量大，这些特性将使传统想要掌握全部信息而做分类、编目的努力，不符合成本效益，也难以跟上网络资源扩张的速度。

三、网络资源的管理：网络上的信息具有定期或不定期修订、变动的特性
[11]。

因此，我们应当典藏采访得来的数据，以确保数据存在本地随时可用，或是仅储存链接（hyperlink），分享别人的数据，以确保数据为最新的版本？
四、如何提供读者服务：网络信息的变动性、零碎性、相互连结特性，再加
上网络利用需要相关的计算机、网络技术，将对传统图书馆的用户造成信息检索与利用的更大困扰。

传统的服务如何持续，以满足读者使用信息的需求，而不会使原本为便利而提供的特性，变成读者使用上的障碍？
五、开发新的服务：数字化图书馆出现后，信息的生产者─「作者」不必再
透过印刷、出版的手续，即可将作品置于网络上，供消费者─「读者」直接利用。

数据经过数字化后，修改、复制、储存、与传输的便利性，使信息的整理中介者──「图书馆」得以利用计算机与网络技术提供新的服务。

面对使用信息网络的新
兴读者群，发展哪些新的服务，可以充分发挥信息科技的效益？
本文的目的，在提出「个人信息空间」（Personal Information Space, PIS）这样的观念与运作模式，藉由一种整合的接口与用户互动，来试图解决上述数位化图书馆所面临的问题。

参、个人信息空间
传统图书馆，受限于空间、工具、技术、与资源的限制，是以「建构一个一
致的图书馆以服务读者」为思考方向。

在这个架构里，每个人看到的图书馆都一样，必须遵守一致的规定，图书馆才能以合理的资源服务最多的人。

「个人信息空间」的概念则藉助进步的信息科技，以读者的角度来思考图书馆的服务方式。

例如，从信息需求密集的用户角度思考，他可能需要属于个人的数字化图书馆，将其常常需要的信息、资源汇集在一起，以便随手可得，随时运用。

此功能类似目前大型图书馆开辟的研究室，只不过使用者不占有一实值的空间，而是拥有一虚拟的「个人信息空间」。

同理，由一群信息密集的用户角度思考，他们常需要与志同道合的人交流信息、交换意见，他们可能就需要一个「信息交流空间」，排除无关的信息干扰，集中某一议题的思考与讨论，并且不会受到时间、空间的限制。

另外，以区域性考虑，数字化图书馆里可轻易的建构「小区电子出版社」，提供小区、学校、或区域性机构一个公共的空间，做为言论出版、政令倡导、或传播与大众利益相关的事宜。

将上面的思考具体化后，一个可能的「个人信息空间」的运作方式将如下所述：读者跟某个数字图书馆申请账号后，可以藉 WWW 浏览器签入这个数字图书
馆的个人信息空间。

在这个空间里，他可以将常用的信息集合起来，以他偏好的方式分类摆设。

他可以摆设自己在全球信息网络上撷取的数据（也许是全文文件、也许只是个连结），也可以将自己的档案、文件拷贝进来。

最重要的是，他如果不熟悉网络资源的撷取，或尝试很久后在网络上仍找不到满意的数据，他可以向数字图书馆里的馆员求助。

馆员获得读者留下的问题或提供的关键词后，分析出较佳的检索策略，帮读者透过网络寻找数据。

当数据找到时，透过软件的协助，数据会自动分派到有登记需求的读者的信息空间去。

读者在常用的数据随手可得的情况下，可以更专注于信息的组织、整理，进而更快速的生产出新的信息，回馈到网络里供自己或别人利用。

如果他需要与别人讨论，可以连上 News 或BBS 之类的讨论区，或是透过 Email 与人通讯。

如果他只需要与局部（local) 地区的人讨论，他可以进入数字图书馆所提供的研讨室与别人交换意见，甚至互相参阅对方的电子出版品。

数字图书馆藉由在这样的运作模式与用户互动，前面所说一些数字化图书
馆面临的问题，某种程度上可以得到解决。

第一：数字图书馆里的馆藏方向是根据读者的需求形成的。

至于是收藏文件
的内容，或仅收藏文件的连结，则以「最佳的运作方式」原则决定。

例如，由读者在自己的信息空间中决定要收录文件内容，或是文件的连结。

收录文件的内容，可以保证文件的存在性，不受网络断线或链接改变的影响；收录文件的连结，可以减少储存空间，确保资料的一致性及以及最新版本，而不会过时。

读者对其使用的数据最清楚，图书馆应当保留这项决定权予读者。

此外，读者也可以选择
将文件摆在公共的信息空间，让文件收藏的方式留给图书馆处里。

这样做除了不能掌握文件的存在性、一致性、与最新版本外，如果图书馆有收藏，他一样可以随时取得文件不受网络的影响；而如果馆里面不收藏文件内容，仅留住连结位址，则他可以与别人共享这份文件，节省自己以及图书馆的馆藏空间。

在这里我们假设文件内容的收藏不会侵害到著作财产权，惹出法律上的问题，而如果有此问题，当然保留文件的连结是目前唯一的收藏方法了。

第二：读者根据自己的需求在信息网络中找数据，若不谙网络使用方式或无
法有效检索数据时，可以请求数字图书馆馆员协助。

图书馆是提供「终身学习」的绝佳场所，重要的任务之一是为广大的民众服务，使用者也许专精于某个领域，但并非都能娴熟计算机网络的使用方式或对搜寻数据有明确概念。

虽然目前已
有讨论智能网络代理员（agent）的研究出现[12]，但要达到人性化、普及化
的服务还有一段距离。

因此「个人信息空间」里，必须有人员，亦即图书馆员的协助，以提供一般民众人性化的服务。

第三：数字图书馆根据读者需求的主题或提供的关键词，将馆员或自动采访
器搜索来的数据自动分派到读者的信息空间去，读者可以不定期收到图书馆送来与自己需求有关的资料，经过进一步分析后，可以决定收录起来、或保留在公共空间、或者回绝这项数据。

因此，「个人信息空间」里的数据采访是读者自己为主角，图书馆员、或自动采访器为配角。

读者采访自己所要的信息，最能达到精
确的效果。

图书馆员、自动采访器、或检索引擎最大的好处，是节省读者的力气、拓展读者搜寻的范围。

第四：全球信息网络上的数据是以分散储存的方式存在，而且呈现动态的演
变发展。

依此想象，要对网络里的所有信息做分类编目是不可能的。

每个数位图书馆仅能就自己实质的收藏做分类编目，便利外界查询检索，这部份的分类编目工作可由专业的馆员来做。

对于外来的资源，就留给读者在个人的信息空间，依自己的偏好处理。

他可以不遵守传统分类编目的规则，引进大量的链接互相参照，以切合本身的要求。

第五：读者只要能利用浏览器进入网络，就可在图书馆员的指导与协助下建
构自己的信息空间。

他不再像签入主机型计算机一样，面对的是一层层的子目录与
一个个的计算机档案，而是直接接触到抽象层次比较高的「信息」而不是「档案」。

在此，「信息」与「档案」的差别在于，「档案」需要知道其性质（如确定其为文本文件、图形文件、声音文件、图像文件，或是确定其储存的格式），并以手动的方式
选用适当的工具，才能打开档案浏览其内容；而「信息」虽然是以档案的方式存在计算机里，但是透过浏览器的协助，我们就不再关心此档案的性质与低阶层次的
操作，只专注于其实质的内容。

让读者掌控信息，在信息消费与生产的循环当中扮演主要的角色，是设计图书馆时的最高目标，而不是图书馆本身存在的形式。

第六：利用参与共同空间的讨论区，协助解答读者的问题。

图书馆的参考问
题可概略分为四种：指引型（direction）、快速参考问题（ready reference）、特殊检索（specific search）与研究型问题（research）[13]。

前面描述的数位图书馆馆员所提供的服务约略涵盖了指引型、特殊检索型、与研究型参考问题。

至于快速参考型问题，我们认为目前 News 或 BBS 讨论区的模式相当理想：读者在某个适当的讨论区提出问题，网络里对这些问题专精的人士可以提供快速的解答，若不幸有人提供了谬误的答案或观念，由于这个讨论空间是公开的，就会有人再提出指正。

图书馆员的专业有限，而网络上的用户遍及各行各业的人士，所触及的问题包含个个层面，而一个问题在讨论时可得到的回答，其广度是目前为止没有任何媒体可以望其项背的。

此种网络上的讨论，可以模拟成脑神经思考网络，每个用户的智能，经由网络的组合，可以输出更好的答案。

因此在「个人信息空间」里建立读者与专业人士类似的接触与沟通的管道，可以提供读者更完整的参考服务。

第七：数字化图书馆里有读者的基本数据与需求条件，甚至可以获知读者检
索的行为。

分析这些数据，可以随时掌握图书馆经营的情形，据以提供读者更好的服务。

肆、技术的可行性
目前浏览器市场上网景（Netscape）公司推出的领航员（Navigator），由
于连接速度快、功能较多、教育人员可以免费使用，使得它在极短的时间，占有广大的市场。

领航员有多项功能可以支持「个人信息空间」的构想。

例如：一、它提供网络检索工具（InfoSeek Search），用户可以根据关键词来
搜寻网络上的资源。

二、提供卷标（Bookmark）功能，可以将拜访的信息站地址或阅读时遇到的
链接存起来，并透过卷标编辑功能依用户的偏好做分类。

三、支持 FTP （文件传输协议）与存盘功能，用户可以将网络上的文件
存在自己的磁盘驱动器，或将自己的档案上传到某个文件传输站。

四、支持 News 功能，可以连到某个 News 讨论区，参与某个议题的讨论。

五、透过预先设定的方式，可以自动分辨文件类型，叫用适当的软件开启网
路上的文件，使用者不会感受到浏览文件的不便。

然而，目前全球信息网络使用的 HTTP （HyperText Transfer Protocol）
协议是属于「不记录状态的」（stateless）。

这使得服务器与浏览器之间的连线迅速、制作也较为简单。

但是从另一个角度看也有缺点：每次浏览器向服务器要求一份文件，就要重新建立连结，传送完文件后，就断线。

这情形就像跟某个人讲电话时，每讲完一句就必须挂断，要讲下一句，需要再重新拨通电话。

这种协议方式对于需要交谈、对话（session-based）的应用极不适合 [14]。

无法记录使用者状态、无法辨识使用者，就无法保留用户的信息空间，数字图书馆的馆员就无从将使用者的需求响应到这个空间去。

上述的情况并非无解，不过需要额外的程序设计技巧。

HTTP 协定里有几种
特别的方法让使用者端与服务器端做较复杂的互动。

当服务器收到使用者的需求时，如果此项需求是要求传回一个档案，服务器就找出档案传回然后结束与使用者的联机。

如果此项要求是其他情况需要额外的处理，服务器不会去执行这项处理，而是传给「信道程序」（Gateway Programs）来执行。

「共同信道接口」(Common Gateway Interface）就是在定义 HTTP 服务器与「信道程序」的沟通方式[15]。

因此解决上述的情况，需要了解「共同信道接口」及熟悉任何一种程序语言来撰写我们所要的「信道程序」，必要时可能再加入一些机制来加强 HTTP 这项通讯协定。

网景公司的作法，是在标准的 HTTP 协议之外，加入了「饼干」（Cookie）
这样的通讯机制，使得服务器与浏览器透过这项协议得以记录用户状态[16- 17]。

网景的解决方式是属于「浏览器端的饼干」（client-side cookies），也就是说需要浏览器的配合，服务器端才能记录用户状态。

目前大多数的浏览器并未支持此项功能，有少部分的单位甚至发展自己的「饼干」作法[18]。

相对的，另一种相似的作法则是「服务器端的饼干」（server-side cookies）[19]。

它不需要浏览器额外的功能，只要服务器支持「共同信道接口」即可。

这项要求，几乎目前的服务器都已具备。

这使得「个人信息空间」的构想，只剩下「通到程式」的设计以及加强浏览器功能的整合，即可实现。

伍、结语
由于计算机与网络技术的发展，使完全以读者为导向的图书馆服务变得可行。

本文提出的「个人信息空间」，就是此一构想下的产物。

这个构想，某种程度上，可以解决未来数字化图书馆面临网络资源的分类、编目、馆藏发展与读者服务的问题。

而这些问题应当是图书馆学或信息科学急切探讨的课题。

在全球信息网络的环境下，发展克服其「不记录状态」（stateless）的技
术，对以「对话」为导向（sessio n based）的应用非常重要。

这项技术将使更多的信息网络应用变得可行，网络上的用户也将因此获得更好的服务。

全球信息网络上的浏览器、服务器毕竟属于应用程序的层次，是一种介于使
用者与操作系统之间的软件，其中操作系统则是介于应用软件（或用户）与电脑硬件之间的系统。

Windows 95 操作系统出现时标榜其设计理念以「文件为中心」，让用户透过操作系统来管理抽象层次较高的文件，而不是档案。

虽然此种设计理念早在苹果（Apple）公司推出麦金塔（Macintosh）个人计算机时就已存
在，但微软（Microsoft）的努力，将会加速促使后续的操作系统具备更佳的亲和性。

未来不管网络应用程序与操作系统如何结合、怎么发展，我们需要的是像「个人信息空间」这样的系统或者更好的构想，使我们专注于信息的消费与生产，而不必只为了拥有一个 Email 账号，却必须签入（login）一部计算机，面对
学习一大堆指令的困扰。

参考数据
[1] Special Issues on Digital Libraries, Communications of The ACM., Vol. 38, No. 4, April 1995.
[2] Digital Libraries '94, Proceedings of the First Annual Conference on the Theory and Practice of Digital Libraries. College Station, Texas, USA. June 19-21, 1994, /DL94
[3] Digital Libraries '95, Proceedings of the Second International Conference
on the Theory and Practice of Digital Libraries. Austin, Texas, USA. June 11-13, 1995, /dl95/README.html
[4] ISDL'95: International Symposium on Digital Libraries 1995. University of
Library and Information Science, Tsukuba Science City, Ibaraki, Japan, August 22 - 25, 1995, http://www.DL.ulis.ac.jp/ISDL95
[5] Digital Libraries Conference. Singapore Information Technology Institute.
March 27-28, 1995,.sg/personal/kwanghan/dl/dl.html
[6] ACM Digital Libraries '96. First ACM International Conference on Research
and Development in Digital Libraries (announcement),
/DL96
[7] ELVIRA`96 3rd International Conference on Electronic Library & Visual Information Research, The UK Digital Libraries Conference. 30 April - 2 May 1996,/elvira/elvira3.html
[8] 曾宪雄，"图书馆网络系统整合之计划与目标"，图书信息学刊，第十四期，1─6页，1995
[9] "Library Applications of the National Information Infrastructure", /lbr.html
[10] Green, David G.,.au/people/dgg/virtual.html, "Proposed operation of a virtual library.", Environmental and Information Science, Charles Sturt University, Albury NSW 2460 Australia.
[11] David M. Levy and Catherine C. Marshall, "Going Digital: A Look at Assumptions Underlying Digital Libraries", Commu. of The ACM, Vol.38, No.4,
April 1995, pp.77-84.
[12] Issue on intelligent Agents, Communications of the ACM, 37, 7, July, 1994.
[13] 陈雪华，网络资源与图书馆参考服务，信息传播与图书馆学，第一卷，第四期，
民84年，页41─52。

[14] Stuart L. Webel, "The World Wide Web and Emerging Internet Resource Disco-very Standards for Scholarly Literature," Library Trends, Spring 1995,
pp.627-644.
[15] Ian S. Graham, HTML Source Book: A Complete Guide to HTML, John Wiley &
Sons, 1995.
[16] "How can I keep 'state' information between calls to my CGI program?" /help/wwwfaq/hfields.htm
[17] "Persistent Client State HTTP Cookies"
/newsref/std/cookie_spec.html
[18] "Form Test Results for Netscape Cookies"
/nsl/formtest/stats-by-test/NetscapeCo olie.html
[19] "SCAT: Sessioneer CGI Authorization Toolkit"
/scat/scat.htm。