数字文献的版本鉴定

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数字文献的版本鉴定

摘要:在数字文献事业迅速发展的今天,我们必须注意到,不只是古籍文献有版本的差异,数字文献也存在版本方面的优劣,甄别数字文献版本对于规范电子文献标准,提高数字文献质量,方便读者查阅等都有重要作用。

关键词:数字文献版本学电子古籍古籍

整理

一、为什么要提出数字文献版本的概念?

随着计算机和互联网的发展和普及,传统的书籍文献资料被数字化的进程大大加快,电子文献的形式和种类不断变化和更新,甚至文献的传播方式也在不断创新。我们知道,传统的古籍文献因为各种原因,存在着很大的区别,同样的书籍,不同的注疏,不同的钞本,不同的刻本校勘,流传到现在都有非常大的版本差异。这个问题在古籍版本学方面有专门的论述,可以参考黄永年先生的《古籍整理概论》、《古籍版本学》①等书

籍。

之所以要提出数字文献版本的概念,是因为:一、古籍文献本身存在版本方面的差异,这主要是数字文献在进行数字化加工的过程

中选择的底本②依据不同造成的,这种情况和实体古籍鉴别方法基本相同;二、电子文献在制作完成以后,成为数字图片或文档,这些数字文献存在被修改的可能性,不同的人对同一实体文献进行数字化加工后,肯定会出现良莠不齐的不同版本,这主要是在加工过程中受到制作者的知识水平、工作严谨程度等因素影响的,加上录入方式的区别,制成的数字文献或多或少都会存在各种问题。举个例子,不同的人在录入“魏徵”两个字的时候,可能会有“魏征”、“魏徴”、“魏徽”等多种差异,很明显,对于文献中的人名,后面的几种录入都应该视为错讹版本;三、文献在传播过程中,很多人会根据自己的爱好,或者处于各种目的,或者添加注解,甚至有人采用字体转换工具改变文档,这样就会导致同样的文档出现不同的电子

版本。姚伯岳也认为“近代图书的版本问题

丝毫不比古籍中的版本问题简单,有的甚至更加复杂。一书多种不同版本的现象大量存在,横排本、竖排本、初版本、再版本、删改本、伪装本、普及本……”[]。如果没有数字文献本版概念的存在,我们就没办法去解释这种现象,很显然这些原因都不是古籍文献本身原因所引起,我们必须单独来探讨。所谓的数字文献③版本是指同一本或的原

始文献底本经过数字化加工以后存在的不

同电子文档形式、文献内容具有差异的电子文献数据,包括具体内容的差异、字体编码的差异、电子文档格式的差异。例如某人手头上有一本中华书局出版的阮刻本的《史记》,发行时间是1999年第1次印刷,那么经过数字化处理后,就有可能存在多种数字文献版本:原书原样翻印的《史记》和在此基础上被人校订删改的《史记》、只是做了

字体区分的简体《史记》和繁体《史记》、

不同的数字文献输出格式PDF格式和DOC格式《史记》,等等,我们可以把这些所有的

数字文献《史记》版本视为同一底本的不同数字文献版本。合理的对数字文献版本加以

区分,对于选择善本、指导阅读,以及下载收藏很有很多帮助。

二、那么,学会鉴别数字文献的版本有什么用处呢?

首先对于我们甄别底本,发现实体纸本④文献的谬误,脱落,错排等很有帮助。原始书籍可能因为各种原因出现错字、脱漏、避讳、残缺等,在数字化时选用底本不当,没有使用校勘性善本,引起文献内容谬误而无法阅读等情况,经过数字化处理后利用电子检索程序进行本校、对校或他较,会很容易发现这些错误并快速给予识别更正。如果是纸本文献本身的错误,不仅对于校正数字文献加工有好处,对于校勘纸本文献、辨识版本优劣也是有帮助的。

其次,对于同一底本的数字文献,其大致内容应该相同,在检索和查阅文献的时候应该尽量使用不同底本的数字文献,这样更容易发现问题,对于写作和研究可以起到事半功倍的效果。同一底本的不同文献,由于差异较小,经过一些对比软件工具或者程序⑤甚至肉眼就可以发现差异,择优筛选后保留较

好的本子或自己批校的版本即可。

第三,对数字文献版本有所了解后,在网上下载和查找相关数字文献资料时可以避免

做重复劳动,相同的版本,或者相同底本的版本可以视需要下载。特别是对于一些很大的文献资料,保留优良版本的电子文献可以节省不少电脑的磁盘空间。

第四,对于电子文献加工制作者而言,如果网上已经存在相同版本的电子书籍,自己就没必要再去加工整理,或者只需做二次加工校勘即可。同时,出于对版权保护的目的,可以对网上流传的数字文献版本进行鉴别,有助于维护自己的合法版权,避免自己加工整理的文献流失或遭剽窃。

第五,有助于推动互联网资源的整合和净化。由于网络的迅速发展,网络资源不断膨胀,但是原创资源依然稀缺,大量重复资源在网络泛滥。试问,当你从搜索引擎检索出来的文献资料全部是相同内容,你是否会对互联网感到满意?有了统一的版本概念,并能有效甄别,那么对于网络资源的整合和利用则大有裨益。

三、既然如此,如何鉴别电子文献的版本呢?对于影印扫描文件,版本的鉴别主要还是鉴别底本,因为这些数字文献基本保存了原文献的原貌,除了不能触摸实物、无法鉴别纸张墨迹刻工外,基本可以用古籍版本学的鉴别方法鉴别此类文献书籍。这类资料主要包括:图片文件(tif,gif,jpg,bmp,png文档)、扫描书籍、复印资料,这类电子文献主要是图像电子数据[]。

我们重点介绍文本型[]数字文献的鉴别。文本数据主要是经过文字录入深加工的数字

文档,这类文档必须有汉字字库的支持才能显示饕袷接校?/spanHTM类网页文档,DOC或WPS经过排版的文本,没有经过排版的TXT、RTF等格式文本,某些非图片类型PDF文档[]

1、文档标题。很多网站在制作发布电子文献版本时都会将出处附注在标题或者简介中,简单查看标题、简介就可以区分是否同一版本。例如A网站有《金刚经》电子书一本,在简介中已经注明了来自国学网站,那么该书肯定是后秦·鸠摩罗什译的电子定

相关文档
最新文档