古籍数字化的困局及应对策略
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
古籍数字化的困局及应对策略
邵正坤
【摘要】我国的古籍数字化工作已经取得了很大的进展,但也产生了一些问题,无论是版本选择、文件格式、支持系统,还是选题控制、资源共享、版权意识等方面,都亟待加强。
从技术革新、人才培养、宏观调控、司法介入等几个方面入手,能够在很大程度上解决目前的困境,使古籍数字化朝健康有序的方向发展。
【关键词】古籍数字化困局策略
Abstract:The digitization of ancient books has already made much progress in our country,and also produces many problems during this process.Either version selection,file formats,support systems,or control of the topic,resource sharing,awareness of copyright,etc,should be strengthened.The current difficulties can be solved from the aspects of technical innovation,personnel training,macro-control and judicial intervention.The digitization of ancient books can be developed healthily and orderly in this way.
Key words:ancient book digitization dilemma strategy
古籍数字化是将传世文献中的语言文字或图形符号转化为能被计算机识别的数字符号,制成古籍文献数据库的一种技术[1]。
对古籍进行数字化处理不仅能够有效地保护古籍,提高文献利用率,对于文化遗产的传承也不无裨益[2]。
我国在20世纪80年代就开始了古籍数字化的历程,经过30多年的探索与发展,已经取得了举世瞩目的成就。
但是,在古籍数字化的过程中,一些问题也逐渐凸显出来,如果得不到及时有效的解决,对其后续发展颇为不利,因此,本文即对古籍数字化所面临的困境及其应对策略加以探讨。
1版本的选择
1.1问题
古籍数字化以传世文献为加工对象,其核心内容是古籍,数字化为外显形式,因此,最终的决定性因素还是古籍本身。
有些古籍在流传过程中产生了各种不同的版本,这些版本可能在文字和内容上都存在差别,这就在客观上决定,优秀的古籍数字化产品,必然要以最佳的版本为加工对象。
就目前的产出情况来看,有的部门、机构和公司在古籍数字化的过程中,往往倾向于选择那些数字化比较容易的版本,而不是学界公认的最佳版本,由此产生的结果可以预见,数字化之后所得并不是最优成果,这无论对于普通读者还是研究人员来说,都会造成不良影响。
1.2应对策略
版本的选择极为重要,选择古籍的版本时,首先是对版本的比较。
有些传世文献经过学者们的研究和对比,已经有了公认的最佳版本,有些相对冷僻的文献,则仍有待于学者的比较和甄别。
因此,在古籍数字化的过程中,文献辨伪、文字校勘和内容考证都是非常重要的前期工作。
当然,有些版本各有优势,参差互见,很难对它们做出一个准确的价值判断,在这种情况之下,就需要延请相关领域的专家,分析版本异同,以优势版本为主,进行不同版本之间的比较和互勘,去粗取精,去伪存真,最后定本。
以校勘后的版本为数字化对象,就能在很大程度上避免前述弊病。
2人才的培养
2.1问题
古籍数字化是一项系统而又复杂的工程,需要大量高素质人才的参加。
数字化是整理手段的革新,实质仍属于古籍整理的范畴,它所面对的主要是各类传世文献,这些文献内容繁复,文字各异。
这就要求古籍数字化的参与者和执行者既要熟悉版本、目录、校勘、编目乃至于古文字学知识,与此同时,还要熟练地掌握计算机技术,能够充分利用多媒体资源。
换句话说,深厚的古代文献功底和高超的计算机技术缺一不可。
但是,就学科分类来说,前者属于传统国学的研究范畴,后者则应归于现代的理工科领域。
而传统
和现代之间,文科和理科之间,一直存在难以逾越的鸿沟。
随着社会的发展,学科分类日趋精细,这个鸿沟也有日益加大的趋势,与此相应,文理兼通的人才也日益稀缺。
由于学科之间的壁垒,从事古典文献学的学者很难对计算机有精深的掌握,最多是在简单的应用方面有些心得,而从事计算机专业的人才又对古典文献学的知识感到陌生。
上述情况,对于高质量数字化古籍的产出是相当不利的。
2.2应对策略
为了打破专业分工之间的区隔,有两种解决方法可供参考。
其一,适应古籍数字化的发展趋势,改革现有的专业人才培养模式,培养既具备古典文献学功底,又精通计算机技术的复合型人才。
进入研究生阶段之后,专业方向大多已经定型,因此,这一工作要从本科阶段就开始进行。
课程设置上文理兼顾,为培养高素质的古籍整理人才打下坚实的基础。
其二,打破现有的专业设置要涉及方方面面的问题,不可能一蹴而就,因此,更具可行性的方式是加强古籍整理专业人才和计算机领域人才的交流与合作,建立一支能够取长补短的综合型团队。
团队的成员不但专业素质过硬,而且对于古籍数字化和古典文化的传承抱有责任感、使命感。
团队成立之后,日常的培训必不可少,培训的过程既是加强交流与协作的过程,也是向古籍整理专业的人才进行计算机技术教育,向计算机专业人才进行古典文献知识普及的过程。
3子系统的建立
3.1问题
为了契合古籍本身的特点,开发方通常会向读者提供两个版本:即原本图像和全文检索系统。
前者可以使读者窥见古籍原貌,后者则为学者进行研究节省了大量资料阅读、翻检的时间。
但这种方式也有弊端,数字化古籍大多保持原始文本状态,后人的校勘、注释和其他研究成果无法得到反映。
如何使数字化产品既保留古籍的本来面貌,又能使后人的相关研究成果得到有效利用,以满足不同层次读者的需求,也是一个亟待解决的问题。
3.2应对策略
对此,业界已经进行了诸多有益的尝试。
就现有的成果来看,除了在数字化古籍中进行标注以外,使用超级链接的方式,在疑难之处链接相关的文字和图片信息,甚至是动态媒体资源,使那些有需求的读者即刻得到相关信息,是最为便捷有效的途经。
这个过程说来容易,实际操作起来却很复杂,需要投入大量的人力物力,建立起强大的支持系统。
这个系统不仅能够扩展原文的文本功能,而且能够引导古籍的研究在历时性和共时性两个方向延伸。
举例说来,国家图书馆的“敦煌遗珍”项目,在对存世的珍稀敦煌文献进行数字化的同时,也与西域历史地理以及敦煌学的研究建立起链接[3]。
由此,通过一句话或者一本书,就能辗转获得很多相关知识点。
为了实现这一目标,除了在古籍数字化的过程中有意识地与其他相关领域文献进行关联,也要大力加强相关子系统的开发,与此同时,还要密切关注学界的最新研究动态,并将成果吸收到自己的数字化体系中去。
4格式的统一
4.1问题
由于盗版横行,开发方为了保护各自的版权,避免经济损失,在古籍数字化完成之后,通常会开发自己的数据库系统,并制定与之适配的文件格式[4]。
由此导致文件格式各异。
除了比较常见的doc、txt和html以外,还有pdf、ceb、wdl、exe、edk、pdg等,名目繁杂,这对于保护开发者的经济利益的确起到了应有的作用。
问题是由于文件格式不同,对于资源共享造成很大的阻碍。
用户在使用这些数字化产品时,不得不下载与之相对应的阅读器,既占用电脑资源,又减缓了阅读速度。
尽管如此,在相当长的一段时间之内,建立统一的机读目录格式仍然是难以实现的目标。
道理很简单,在知识产权无法得到切实有效保护的前提之下,开发者必然争相维护甚至升级自己所设计的壁垒,以保证自己的经济利益不被侵害。
4.2应对策略
那么究竟如何打破这种僵局呢?相关单位在开发数据库时,能够考虑实现多种文件格式的兼容,而非只保留一种,完全排斥其他,目前看来是较为可行的策略。
已有公司在这方面取得进展,如方正德赛数字化系统中就可以导入ceb、pdf和doc等格式的文件[5],相对于此前壁垒森严的状况而言,这无疑是一大进步。
但是,为了从根本上改变目前的状态,业界仍需要一个更为长远的规划。
相关机构、部门和公司应该联合起来,就此进行磋商,建立起能为多数开发者认可和接受的统一、规范的文件格式。
该格式至少能够完成以下几个方面的任务:首先是适合繁体字以及各种异体字和自造字的储存,可以最大程度呈现古籍的原貌;其次,能够对文件进行超强加密,以解决开发者最为关心的版权问题。
5选题的控制
5.1问题
传世文献浩如烟海,而目前的人力和物力又极为有限,因此并不是所有的古籍都有数字化的机会。
在市场经济的条件下,资源的流向有其自身的规律,它
33RESEARCH ON LIBRARY SCIENCE
主要受供需关系的调节。
那些需求量大的热门产品,在数字化过程中占有绝对优势,数字化的天平也主要向这部分古籍倾斜。
这就使开发单位将精力聚焦于热门古籍,一拥而上,有的甚至在条件不是很成熟的情况下仓促上马。
由此导致的后果不难想象,部分古籍被不同机构和部门重复数字化,如举世瞩目的《四库全书》、《四部丛刊》等在海内外就有多个版本的数字化产品,而另一些相对冷门的文献就乏人问津,但从文化传承和学术研究的角度来说,这些古籍同样重要。
毋庸讳言,热门古籍的重复建设,必然导致人力、物力、财力的极大浪费,而那些相对较冷的古籍一直处于蒙尘状态,对于学术发展也相当不利。
5.2应对策略
数字化古籍与一般商品不同,作为中华文明和文化的重要载体,它的产出和发展不能全由市场控制。
为了改变古籍数字化的无序状态,上级主管部门的及时介入便显得十分必要。
在坚持市场调节的前提之下,有意识地控制资金和技术流向,对于国家支持的各种古籍整理项目,在选题上予以调控,向冷门古籍适当倾斜,并对已有和正在开发的数字化成果进行通报,使各单位和部门及时了解其进展情况,就能在很大程度上避免重复开发的问题。
为了实现这一目标,至少要做到以下几点:(1)制定业界共同遵守的章程与协议。
有关开发方联合起来,在业界内部建立协会,并制定行业规章和行为规范,在行业内部实现良性竞争。
(2)成立专门管理机构。
现有的问题大部分是缺乏全盘考虑和合理规划造成的,因此,由政府成立古籍数字化的专门管理机构,并充分发挥古委会等现有机构和部门的作用,对古籍数字化的选题、立项和开发进行管理,并对最终成果进行审核,便成为实现资源整合、优势互补的有效保证。
(3)在上级管理部门、资源开发部门、数据库使用部门以及个体用户之间构筑桥梁与纽带,使各个主体之间信息交流通畅,产品上线之后,能够得到及时的反馈,推动古籍数字化事业健康有序地发展。
6资源的共享
6.1问题
由于各个制作单位各有其利益诉求,因此在标准和规范方面难以统一,当数字化资源进入图书馆及其他文献收藏机构时,也是独立成库,互相隔绝,就目前的状况而言,无论海内外,在数字化古籍的资源共享方面都很薄弱。
因此,在各个开发主体之间,港台与大陆之间,国内与国外之间,进行密切的交流与合作,实现资源共享与数据库共建,便成为未来的发展方向。
6.2应对策略
各部门与机构之间的交流与合作至少应该涵盖以下几个方面:首先,联合编目,共建数据库[6],尤其是具有公益性质的图书馆之间的交流与合作,更应如此。
其次,在实现资源共享的前提之下,各个开发主体只需将手中掌握的特色资源进行数字化转换,然后与其他开发者建立交互式联系,资源共享,互通有无,这样既可以节省全面开发所需要的人力物力,也有助于优化选题,集中精力开发重点项目和优势项目,从而保证并提升数字化古籍的质量。
7版权意识的加强
7.1问题
由于互联网的迅猛发展,人们的传统阅读方式发生很大的改变,各种掌上电脑、智能手机和阅读器的开发在很大程度上加速了这一进程,由此导致数字化产品的盗版也成为一个突出的问题。
近几年来,由于作品在互联网上被盗用而引起的法律纠纷屡见不鲜。
事实上,不仅通俗作品存在这样的问题,数字化古籍被盗版也经常发生。
正版的古籍数字化产品价格昂贵,动辄上千,盗版产品往往几百、几十块钱就可收入囊中。
为了增加网站的点击率,有些破解版甚至分文不收,作为开放性的公共资源随意下载。
即便开发者对文件进行加密,仍然防不胜防。
一部数字化古籍的问世,往往要投入大量的人力、物力和财力,盗版现象的出现,直接损害开发者的经济利益,使他们的投入和产出不成正比,或者根本无法产生经济效益,而这必然会打击开发者的积极性和主动性,甚至使古籍数字化工作处于停滞状态。
7.2应对策略
要解决这个矛盾,除了进行技术升级以外,更重要的是拿起法律武器,维护自己的合法权益。
此外,在国家的层面,出台相关的法律,为知识产权的保护提供强大的后盾。
司法部门也要加强对市场的监管力度,如有侵权行为,一经发现,便按照相关法规予以严惩,以免盗版资源泛滥成灾,出现“劣币驱逐良币”效应。
当然,对于开发者本身而言,也有一个遵纪守法、维护版权的问题。
很多古籍在进行数字化处理之前,早已经历了校勘、标点、注释等整理,已经不复其最初的面貌。
这个过程凝聚了整理者的心血和大量无差别的人类劳动,理应受到保护和尊重。
因此,在古籍数字化的过程中,首先要解决版权的转让问题,通过合法渠道取得版权,这既是对他人劳动成果的尊重,也能尽量避免日后因为版权问题引起的纷争。
(下转第79页)
43图书馆学研究2014.12
表4学科评估信息咨询表
排名机构简称网址
QS World UniversityRankings(QS世界大学排名)QS http://
Times Higher Education World UniversityRankings(泰
晤士高等教育世界大学排名)
THE http:// AcademicRanking of World Universities(世界大学学术
排名)
ARWU http://
教育部学位与研究生教育发展中心http:///xwyyjsjyxx/xxsbdxz/ index.shtml
武汉大学中国科学评价研究中心http:///
高等教育观察(HER)HERhttp:///her/
4.2.2重点学科定题信息服务
重点学科的实力水平体现了大学的办学水平,因此,开展重点学科定题信息服务,是图书馆利用其资源优势和人才优势,为学科建设服务的重要工作。
重点学科定题信息服务的方式是由专门学科馆员跟踪重点学科国内、外相关学科的发展动态,按年度为学校的重点学科建立科学研究成果及学术梯队的信息统计档案,提供年度学科信息咨询报告,为学校的重点学科的建设与发展提供强有力的信息服务。
5结束语
学科建设工作是体现大学办学实力的重要方面。
各大学都将学科的建设与发展作为学校最重要的工作之一。
高校图书馆作为文献信息中心,具有信息资源处理的资源优势和人才优势。
面对学科建设这一专项工作,图书馆人有义务创新服务模式,为学校的核心工作服务,构建学科信息服务新模式,提供较完善的学科信息服务内容,通过学科信息自助服务和重点学科定题信息服务两种方式,为学校的学科建设与发展提供优质的信息服务。
注释
[1]朱振国.2012年学科评估结果公布[N].光明日报,2013-01-03:005.
[2]董琳等.国外学科评价及其文献计量评价指标研究[J].理论与探索,2008(1):37-40.
[3]张宇光.微博在参考咨询服务中的研究[J].图书馆论坛,2013(3):164-166.
[4]胡尊利等.对我国学科建设评价的若干思考[J].陕西师范大学学报,2007(7):65-71.
[5]晁卫华.信息时代高校图书馆信息服务模式[J].河北理工大学学报,2011(5):84-86.
[6]宁耀莉.高校数字图书馆信息服务模式发展综述[J].图书馆,2011(9):137-139.
任传荣中国民航大学图书馆副馆长,副教授,博士。
周荃卉中国民航大学图书馆助理馆员,硕士。
(上接第34页)
注释
[1]毛建军.古籍数字化的概念与内涵[J].图书理论与实践,2007(4):82.
[2]李玉海,宋燕辉.面向数字图书馆的古籍数字化模型构建[J].
图书馆学研究,2008(8):24.
[3]许彤.古籍文献特点及其在保存保护工作中的数字化探讨[J].
资治文摘,2010(6):203.
[4]陈力.中文古籍数字化方法之检讨[J].国家图书馆学刊,2005
(3):15.
[5]郑永晓.古籍数字化对学术的影响及其发展方向[J].社会科学管理与评论,2006(4):87.
[6]朱锁玲,包平.我国古籍数字化进展与研究述评[J].图书馆理论与实践,2009(9):21.
邵正坤吉林大学古籍研究所副教授,硕士研究生导师,历史学博士。
97RESEARCH ON LIBRARY SCIENCE。