试论中国古籍数字化与人文学术研究(一)

合集下载

数字人文学对人文社会科学的研究

数字人文学对人文社会科学的研究

数字人文学对人文社会科学的研究随着信息化进程的加快,人们对文化遗产的继承和推广越来越重视。

数字人文学作为数字技术与人文学科的交叉领域,为人们提供了一个全新的研究角度和手段,也成为了文化遗产数字化传承的重要工具。

数字人文学以数字化信息技术为基础,运用计算机、互联网、虚拟现实等计算机科学技术手段,对人文学科领域的各类文献、资料、文化遗产进行数字化处理、保护、传播和研究,为人文社会科学的发展提供了新的支撑和推动力。

一、数字人文学在人文社科研究中的应用数字人文学不仅能够对文化遗产进行数字化保护和传承,还能够推进人文社科领域的研究。

在欧洲地区,数字人文学已经成为学术研究的重要手段之一。

比如利用数字人文学技术进行的历史文化领域的研究表明,它可以挖掘出更多具有学术价值的信息,辅助科研人员准确分析文化遗产,发掘出更多文化价值。

数字人文学以其强大的可视化、交互性及运算能力,为研究人文社科问题提供了新的角度和方法,从而推动了人文社科领域的发展。

二、数字人文学与文化领域数字化传承的联系数字人文学最初的出发点在于文化遗产数字化传承,随着数字人文学的快速发展,它已成为实现文化领域数字化传承的重要手段。

数字人文学通过互联网、移动终端等方式,将人类文化遗产数字化展示,并提供全球人们追寻文化遗产的途径,使文化遗产得以永久保存。

也提高了用户的观赏体验。

数字人文学已经成功地保护了大量的文化遗产,如恐龙化石、千年尘封的古书等等,使人们不必再亲身前往文化遗产的保护地,享受文化遗产的魅力。

三、数字人文学推进数字化人文社科学科建设数字人文学是数字化人文社科学科的重要科学问题之一。

通过数字人文学的学习,不仅可以提高学生的实际技能,还可以使学生更深入地了解人文学科的理论知识,并加深对人文学科中的各类文献、资料及文化遗产的认识。

数字人文学使人文学科不再滞于传统的人文学科通道,能够更加全面、立体地探讨人类文化与思想的演变历程,拓展学科视野,提高人文社科学科的实际应用能力。

我国古籍数字化理论研究综述

我国古籍数字化理论研究综述

2009年11月情报探索第11期(总145期)我国古籍数字化理论研究综述水孥产龙(成阳师范学院文学与传播学院陕西712000)摘要以21世纪以来古籍数字化的理论研究为基础,提出古籍数字化理论研究包括古籍数字化的概念、性质、特征等内部基础理论和技术处理层面的外部理论两个方面,并对这两个方面在21世纪以来的研究成果加以爬梳、总结。

关键词古籍数字化理论研究综述中图分类号:G256.1文献标识码:A文章编号:1005—8095(2009)11—0012-031引言我国古籍数字化的实践工作早在上世纪80年代初就已起步,经过了近30年的发展,古籍数字化工作取得了可喜的成绩。

但是,这20多年来,有关古籍数字化的理论研究却远远滞后于实践的发展。

使得古籍数字化研究工作缺乏整体的理论指导与支持,未能形成一定的理论体系。

因此。

为了推动我国古籍数字化研究工作不断走向深入。

有必要对古籍数字化的相关理论研究成果加以爬梳和整理。

“古籍数字化”这一词组,其重心在“古籍”二字.而“数字化”是对“古籍”的技术处理过程。

所以从严格意义上来讲.古籍数字化属于古籍整理的研究范畴,但又涉及图书馆学、文献学、情报学、信息学等多种学科,具有边缘性、综合性、交叉性的学科特点。

史睿先生在《试论中国古籍数字化与人文学术研究》一文中说:“古籍数字化的理论比技术问题更为重要.因为一旦理论发生了偏差。

技术越高明,则解决方案越是难以成功。

”史先生将古籍数字化的理论与技术分开来讲。

但是,笔者以为虽然“数字化”与“古籍”之间存在着内容与形式的关系。

然而两者对构建古籍数字化的理论框架却是同等重要的。

因此,笔者以为对古籍数字化理论的研究应该包括古籍数字化的概念、性质、特征等内部基础理论架构和技术处理层面的外部理论研究两个方面。

2基础理论研究从上世纪80年代到本世纪初期。

古籍数字化研究多侧重于实践层面(包括古籍数字化的现状、成果以及发展趋势等等)的研究与开发。

而有关古籍数字化的概念、性质、特征等基础理论研究却相对滞后.未能引起学术界的足够重视。

数字人文如何推动古籍文献的数字化

数字人文如何推动古籍文献的数字化

数字人文如何推动古籍文献的数字化在当今数字化的时代,数字人文这一新兴领域正以其独特的方式为古籍文献的数字化注入强大的动力。

古籍文献作为人类文明的重要遗产,承载着丰富的历史、文化和知识,然而,由于时间的流逝和保存条件的限制,许多古籍面临着损坏、遗失甚至灭绝的危险。

数字人文的出现为解决这些问题提供了新的思路和方法,为古籍文献的保护、传承和利用带来了前所未有的机遇。

数字人文是什么呢?简单来说,它是将数字技术与人文研究相结合的跨学科领域。

通过运用数字化工具和方法,如数据库建设、文本挖掘、数据可视化等,对人文领域的资料进行收集、整理、分析和展示,从而推动人文研究的创新和发展。

在古籍文献数字化的过程中,数字人文发挥着至关重要的作用。

首先,数字人文为古籍文献的数字化提供了技术支持。

传统的古籍数字化往往只是将纸质文献扫描成图像文件,这种方式虽然在一定程度上保存了古籍的原貌,但无法实现对文本内容的深入挖掘和利用。

而数字人文技术则可以将古籍文献转化为可编辑、可搜索的电子文本,通过光学字符识别(OCR)技术和人工校对相结合的方式,提高文本识别的准确率。

同时,利用自然语言处理技术对文本进行分词、标注和语义分析,为后续的研究和利用奠定基础。

其次,数字人文促进了古籍文献的整理和编目。

在过去,古籍的整理和编目工作主要依靠人工完成,不仅效率低下,而且容易出现错误。

数字人文技术的应用可以实现对大量古籍文献的快速分类、编目和索引。

通过建立古籍文献数据库,将古籍的基本信息、版本、作者、内容摘要等进行规范化整理,方便学者和读者进行查询和检索。

此外,还可以利用数据挖掘技术发现古籍之间的关联和传承关系,为学术研究提供新的视角和线索。

再者,数字人文推动了古籍文献的知识发现和创新研究。

通过对数字化后的古籍文献进行文本分析和数据挖掘,可以发现隐藏在其中的知识和规律。

例如,通过对历史文献中人物关系、事件发生的时间和地点等信息的分析,可以构建历史知识图谱,直观地展示历史发展的脉络和趋势。

古籍数字化的发展概述

古籍数字化的发展概述

中医古籍数字化资源建设的成果
中医古籍数字化资源建设取得了以下成果:
1、建立了多个中医古籍数字化资源库,涵盖了多种著名的中医典籍,方便 了学术研究和社会公众的查阅。
2、实现了中医古籍资源的快速检索和精准查询,提高了学术研究的效率。
3、通过数字化资源的建设和共享,促进了中医药文化的传播和发展,增强 了社会对中医药的认识和认可。
2、博物馆
博物馆中的文物和展品也需要进行数字化保护和展示。通过数字化技术,博 物馆可以将珍贵文物进行高精度扫描和3D打印,以便更好地保存和展示这些文化 遗产。
3、教育机构
教育机构可以利用古籍数字化技术,让学生和教师更好地了解历史文化。例 如,可以将古籍中的故事和人物融入课程中,增加学生对历史文化的兴趣和了解。
3、国际合作加强
随着全球化的不断推进,国际合作在古籍数字化领域也将得到加强。各国之 间的合作可以促进古籍资源的共享和技术的交流,进一步提高古籍数字化的水平。
参考内容
随着信息技术的不断发展,数字化已经成为保护和传承中医古籍的重要趋势。 中医古籍作为中华民族宝贵的文化遗产,具有极高的学术价值和实用价值。然而, 由于年代久远、流传版本繁多、保存条件有限等原因,中医古籍面临着损坏和失 传的风险。因此,中医古籍数字化资源建设显得尤为重要。本次演示将介绍中医 古籍数字化资源建设的意义、现状、策略及成果,以期为相关工作提供参考和借 鉴。
3、促进中医药文化传播:数字化资源建设有利于中医药文化的传播和普及, 让更多人了解和认识中医药的魅力,从而促进中医药事业的发展。
中医古籍数字化资源建设的现状
目前,中医古籍数字化资源建设已经取得了一定的成果,但仍存在以下问题:
1、数字化标准不统一:由于缺乏统一的数字化标准,各机构的数字化格式、 标点符号等均有差异,影响了中医古籍资源的共享和利用。

浅谈图书馆古籍的数字化管理

浅谈图书馆古籍的数字化管理

浅谈图书馆古籍的数字化管理浅谈图书馆古籍的数字化管理古籍是我国几千年文化的传承,是我国极为宝贵的精神和智力财富。

为了更好保护和利用这些财富,很多大型图书馆,都利用了现代化的计算机技术,以下就是由小编为您提供的浅谈图书馆古籍的数字化管理。

将古籍中的语言文字及图形转化成能为计算机所识别的数字符号,以此来制成古籍文献书目数据库以及古籍全文数据库,即对古籍进行数字化管理。

这也将是今后图书馆古籍管理的一个发展的必然趋势。

一、古籍数字化管理的必要性1、古籍数字化管理有利于古籍的保护,解决藏与用的矛盾古籍经过几千年的辗转流传至今,往往具有唯一性并且不可再生,因此在保护古籍方面除了提高古籍的保存技术使其免受损坏外,也应借助现代化的科学技术,让这些珍贵的文化遗产得以永久的保存。

另正是由于古籍的唯一性以及不可再生性,因此它们不仅具有罕见的文化价值,而且还有珍贵的文物价值。

因此图书馆为了避免古籍遭受破坏,往往重藏轻用,造成藏与用的矛盾,不利于古籍文化的传播。

2、古籍进行数字化管理,可使古籍中蕴藏的特有信息资源得到充分利用古籍的目录的分类、编排与检索方法与现代的都不同,如果用传统的手工检索方法来检索古籍,不仅速度慢,而且查全、查准率也较低,很可能会花费好几个小时甚至几天来查找一个人或事,或者一段引文。

如果引进数字化管理,便可改进古籍的检索方式。

从而更有利于对古籍中所蕴藏的特有信息资源进行开发,提高了阅读古籍的广度和深度,使古籍得到了充分的利用。

二、古籍数字化管理方法1、古籍书目数据化及古籍全文的数据化(1)古籍书目及古籍全文数据化方法及注意事项古籍数量大,语言繁琐,而且在分类排架和管理上都不同于一般的图书,检索方法也很复杂,很多古籍犹如天书,极大的影响了读者阅读利用古籍文献的积极性。

利用计算机技术,建立古籍书目数据库,便简化了古籍书的检索方法,而且新增了许多检索途经让读者对图书馆内古籍藏书一目了然。

古籍全文数据库的建立,便可方便读者更简单的阅读古籍资料,并可快速准确全面的找到所需的资料。

中国古籍数字化保护与利用

中国古籍数字化保护与利用

中国古籍数字化保护与利用中国古籍是我们中华文明的重要遗产,这些经典蕴含着丰富的历史、文化和哲学价值。

然而,随着时间的流逝和社会的发展,古籍面临着被破坏、流失和易损毁的危险。

为此,数字化保护和利用成为了古籍传承和研究的重要手段。

一、数字化保护数字化保护是指将古籍转换成数字形式,通过计算机网络保存和传输,以保护其原貌和价值。

这种方式能够有效地保护古籍,使其不再遭受自然灾害、人为破坏等威胁。

数字化保护的最大特点是可以保存原版文件的绝大部分内容,包括文字、图像、书籍文件等,并且可以通过互联网与世界分享。

数字化保护为古籍的传承和推广提供了宝贵的资源和保障。

中国古籍数字化保护的工作重心在于实现数字化文件的高保真还原。

为了达到这个目标,需要对古籍进行详细的阅读和解析,同时结合各种影像技术进行数字化转化。

数字化保护非常注重古籍的原貌和保真度,必须尽可能地还原原人手抄写的风格、笔画、色彩等要素。

在数字化保护过程中,需要经过多次校对、比对和校验,以保证数字文件的准确性和完整性。

二、数字化利用数字化古籍还原后,就可以在计算机网络中进行数字化利用。

数字化古籍能够为各类文化研究者、学生和普通民众提供更加便捷和快速的古籍查阅和学习途径。

利用数字化古籍,可以远程查阅、学习、研究各种古籍,更好地挖掘中国文化精髓,加强中外文化交流。

数字化利用也能使人们对古籍研究有更深刻的认识和理解,加深对中国传统文化的认知。

数字化古籍还原后,还可以开发出各种数字化产品,如软件、APP、数字化评注等,这些产品为古籍的普及和保护带来了新的机会与突破。

数字化产品的出现,让人们能够更加深入细致地了解古籍的内容,同时还可以将古籍和现代科技相融合,形成了更加丰富的古籍文化。

三、数字化保护与利用面临的问题及解决方案数字化保护与利用虽然给中国古籍的传承和研究提供了新的途径和机会,但同时也面临着一些问题和挑战。

首先,数字化保护所需的成本很高,涉及到大量设备和技术的投入,还需要人力、时间和金钱方面的支出。

试论图书馆古籍的管理及其利用9篇

试论图书馆古籍的管理及其利用9篇

试论图书馆古籍的管理及其利用9篇第1篇示例:古籍是一种珍贵的文化遗产,它们承载着丰富的历史信息、文化传承和人类智慧。

图书馆是保存、管理和传播古籍的重要场所,对于保护和利用古籍具有重要意义。

本文将从图书馆古籍的管理和利用两个方面进行讨论。

一、古籍的管理1.分类整理图书馆收藏的古籍数量庞大,多为手抄本或古版本书籍,需要进行分类整理。

首先需要对古籍进行鉴定和编目,确定其所属类别和内容,然后按照专题或年代进行分类整理。

这样有利于古籍的保存、查找和利用。

2.数字化保护古籍多为纸质材料,易受到时间、环境等因素的影响,容易产生褪色、虫蛀等问题。

为了更好地保护古籍,图书馆可以通过数字化技术对古籍进行拍摄、扫描和存储,建立数字化古籍库。

这样不仅可以减少对原件的翻阅,还可以减少损坏的风险。

3.保管与维护古籍是不可替代的文化资源,图书馆应该加强对古籍的保管和维护工作。

首先要设立专门的古籍阅览室,为读者提供合适的环境和设备,保证古籍在阅读过程中不受损坏。

其次要定期对古籍进行防腐防虫处理,保证其保存时间长久。

二、古籍的利用1.学术研究古籍是研究历史、文化的重要资料,对于学术研究具有不可替代的价值。

图书馆可以通过推出古籍展览、举办讲座等形式,鼓励学者和研究人员利用古籍进行研究,促进学术交流和发展。

2.教育教学古籍中蕴含着丰富的知识和智慧,可以为教育教学提供宝贵的素材。

图书馆可以通过开设古籍阅览课程、组织古籍导读活动等形式,引导学生了解和利用古籍,提高他们对历史文化的认识和理解能力。

3.社会传承古籍是传统文化的重要组成部分,对于促进社会文化传承和发展有着重要意义。

图书馆可以通过展览、讲座等活动,向公众普及古籍知识,提高公众对古籍的认识和重视程度,促进古籍的传承和发展。

图书馆古籍的管理和利用是一项重要的文化工作,图书馆应该加强对古籍的管理和保护工作,促进古籍在学术、教育和社会传承中的应用和发展,推动古籍文化的传承和发展。

希望通过各方共同努力,让古籍的价值得到更好的体现和传承。

浅析数字化时代传统文化的创新与发展研究

浅析数字化时代传统文化的创新与发展研究

浅析数字化时代传统文化的创新与发展研究第一篇范文在数字化时代的浪潮中,传统文化面临着前所未有的挑战与机遇。

如何创新与发展,成为了当下亟待解决的问题。

本文将从以下几个方面,浅析数字化时代传统文化的创新与发展研究。

一、数字化时代对传统文化的影响1. 传播方式的变革在数字化时代,信息传播速度加快,范围更广。

传统文化原有的传播方式逐渐显得力不从心。

相较于传统媒体,新媒体具有互动性强、传播速度快、覆盖面广等特点,使传统文化在传播过程中得以迅速推广。

2. 受众需求的多样化随着社会的进步,人们的生活方式和审美观念发生了很大改变。

传统文化若想获得广泛的认同,必须满足现代人多样化的需求,对自身进行改革和创新。

3. 市场竞争加剧数字化时代,各种文化产品层出不穷,传统文化在市场中面临着激烈的竞争。

如何在众多文化产品中脱颖而出,成为传统文化创新与发展的关键。

二、传统文化创新与发展的1. 融入现代元素传统文化创新首先要做到的就是融入现代元素,让传统文化与现代生活相融合。

例如,将传统艺术与现代设计相结合,推出富有创意的文化产品。

2. 利用数字技术数字化时代,传统文化可以充分利用数字技术,提升自身传播力和影响力。

例如,将传统文化资源数字化,开发各类文化应用软件,让传统文化在数字世界中焕发新的生机。

3. 强化人才培养传统文化创新与发展离不开人才的支持。

加强传统文化的教育和培训,培养一批具有创新精神和实践能力的传统文化传承者,是传统文化创新与发展的重要保障。

4. 深化跨界合作传统文化可以与其他领域的优秀资源进行整合,实现跨界合作。

例如,与文化创意产业、旅游业、互联网产业等领域的企业合作,推出具有市场竞争力的文化产品。

三、结语第二篇范文在数字化浪潮的冲击下,传统文化的发展和创新显得尤为重要。

那么,数字化时代传统文化究竟该如何应对挑战、把握机遇呢?本文将运用3W1H (What、Why、Who、How)模型和BROKE(Background、Reason、Outlook、Key point、Example)模型,以全新的视角探讨这一问题。

数字化古籍文献资源的整理与智能检索研究

数字化古籍文献资源的整理与智能检索研究

数字化古籍文献资源的整理与智能检索研究古籍是世界文化遗产的重要组成部分,其中蕴含着宝贵的历史、文化和学术信息。

为了保护和传承这些宝贵的资源,数字化已成为一种常见的手段。

数字化古籍文献资源的整理与智能检索研究旨在将传统的纸质古籍转变为电子形式,并通过技术手段实现对这些古籍资源的整理和智能检索,便于用户快速准确地查找到所需信息。

整理古籍资源是数字化过程的首要任务之一。

传统的纸质古籍存在着书写不规范、文字模糊、受损严重等问题,使得其内容难以获取和理解。

为了解决这些问题,数字化整理需要进行图像处理和文字识别。

图像处理技术可以对古籍图像进行清晰化、灰度化和纠偏,以提高文字识别的准确度。

文字识别技术则可以将图像中的文本转换为可编辑的文本,实现对纸质古籍的数字化。

智能检索是数字化古籍文献资源的关键技术之一。

古籍资源的庞大数量和复杂内容使得传统的人工检索方法受限。

为了提高检索效率和准确度,利用人工智能和自然语言处理技术进行智能检索是一个值得研究的方向。

人工智能可以通过机器学习和深度学习算法,对大量古籍文献进行语义分析,建立模型从中提取关键信息,并构建精确的语义检索系统。

自然语言处理技术则可以实现对古籍文献内容的语义理解和推理,提高检索的准确度和效果。

数字化古籍文献资源的整理与智能检索研究不仅有助于古籍资源的保护与传承,也可以为学术研究和文化推广提供更多便利。

通过数字化整理,古籍资源得以保存和展示,避免了纸质古籍在长期保存中的腐朽和损坏问题。

而智能检索则使得研究者和广大读者能够在庞大的古籍数据中快速准确地找到所需信息,节省了时间和精力。

这对于学术研究者而言,尤为重要。

此外,数字化的古籍资源也可以通过网络和移动终端进行传播,使得更多的人能够了解和研究古籍文化,促进文化的交流与传播。

然而,数字化古籍文献资源的整理与智能检索研究仍然面临着一些挑战。

首先,古籍文献的多样化和复杂性增加了数字化的难度。

古代文字的形式和结构,与现代文字存在较大差异,使得文字识别存在困难。

数字人文视角下古籍资源知识挖掘与可视化研究——以《隋唐演义》为例

数字人文视角下古籍资源知识挖掘与可视化研究——以《隋唐演义》为例

∗本文系山东省高等学校青年创新科技计划 儒家文化与文学关系研究 (项目编号:2020RWC004)的研究成果之一㊂作者简介:董守轩,博士研究生,研究方向为数字人文㊂收稿日期:2023-10-29㊀㊀㊀㊀责任编辑:杨千子ʌ数字㊃人文ɔ数字人文视角下古籍资源知识挖掘与可视化研究∗以‘隋唐演义“为例Ә董守轩中国海洋大学文学与新闻传播学院,青岛,266100[摘㊀要]文章从数字人文角度出发,以图书馆馆藏资源及各类电子数据库为主要来源,运用SNS ㊁Python ㊁Ge-phi ㊁QGIS 等技术和软件,通过数据模型和传统图表结合的形式,绘制历史演义小说‘隋唐演义“人物关系及时空分布的可视化图谱㊂相关的分析结果有助于完成古籍的深入挖掘,丰富人文研究的范式,为古籍资源的整合与知识数据的联结提供新的思路㊂[关键词]数字人文㊀‘隋唐演义“㊀人物关系㊀时空分布[中图法分类号]G353㊀㊀㊀㊀㊀[文献标识码]A㊀㊀㊀㊀[文章编号]1003-7845(2024)01-0056-08[引用本文格式]董守轩.数字人文视角下古籍资源知识挖掘与可视化研究 以‘隋唐演义“为例[J ].高校图书馆工作,2024(1):56-63.引言数字人文(Digital Humanities),是以数据为基础,以平台为支撑,运用数字技术方法来研究人文科学的一门学科[1]㊂这一术语最初来自人文计算(Humanities Computing)领域,早期的人文计算仅是一种纯粹的技术工具㊂此后,随着技术的进步及时代的发展,人文计算理论与实践不断完善,逐渐被用于一些人文社科领域㊂20世纪90年代初,人文计算开始被当作一个独立的交叉学科[2]㊂2001年,约翰纳㊃德鲁克(Johanna Drucker)计算机与人文协会和在文学与语言计算协会(ACH /ALLC)联合会议上作的报告‘现状核实:数字人文项目与前景“(Re-ality Check :Projects and Prospects in Digital Humani-ties )是 数字人文 在学术领域的首次出现㊂2004年,苏珊㊃施莱布曼等人编纂的‘数字人文指南“使用数字人文概念,标志着这一术语从人文计算到数字人文的转变[3]㊂事实上,数字技术的发展对传统人文学科产生了极为重要的影响,比如各类古籍数据库的出现,如爱如生中国基本古籍库[4]㊁鼎秀古籍全文检索平台[5]㊁中华经典古籍库[6]等㊂这些数据库往往存储了海量的古籍文献,研究者可以通过其检索功能迅速㊁精确㊁全面地找出目标古籍的相关内容,从而开展研究㊂部分高校图书馆还提供书籍的电子扫描㊁文本识别㊁资源共享等服务,对文献资料的保存㊁整理㊁研究起到重要作用㊂除数据库外,数字人文还促进了学术地图平台及各类人物世系数据资源的建构,如王兆鹏教授团队开发的 唐宋文学编年地图 平台[7],徐永明教授团队开发的 学术地图发布平台 [8],美国哈佛大学包弼德教授联合北京大学等机构合作建立的 中国历代人物传记资料库 [9]等㊂目前,部分高校图书馆也将这些非文献类的新型数据库纳入馆藏,作为师生学术研究的重要依据及来源㊂除上述宏观层面的实践外,部分学者也开始使用SNS㊁GIS㊁NLP 等数字技术及相关软件对文学作品进行数字化呈现㊂如赵薇[10]借助SNS 对‘大波“三部曲人物关系及社会网络进行可视化研究㊂徐永明等[11]利用GIS 软件将‘全元诗“作者的地理分布进行可视化呈现㊂孙建旺等[12]借助SVM 作为机器学习模型,分析微博文本的不同情感类型㊂传统文学作品的早期研究只能通过例证的形式对其中的主要人物或篇目进行分析,难以做到全面覆盖㊂而利用数字技术处理文本信息,则可以帮助研究者进行全景式 阅读,有效提取目标信息,并通过软件进行可视化㊂这一过程实际上是借助大数据计算及科学图谱模型完成的,利用数字技术处理文本信息改变了传统人文研究的固化思维,并为其提供了新的研究路径㊂‘四雪草堂重订通俗隋唐演义“(以下简称‘隋唐演义“)是清代文学家褚人获所编的长篇章回体小说,也是明清小说的代表之作㊂全书以史为经,以事件为纬,叙述了隋朝至中唐的百余年历史,塑造了众多的人物形象,故事情节中蕴含大量地名㊂书中的人物涉及社会各个阶层,既有王侯将相,也有平民百姓,这些人物以时间为序依次出场,构成了交错复杂的网状结构㊂因此,本文以书中的人物关系㊁空间分布为例,采用数字人文技术及相关理论,运用各类数据库㊁数字软件,以数据模型和图表相结合的形式,对书中人物的社交网络及地理空间分布等要素进行可视化呈现,将书中的人名㊁地名等实体具象化,并挖掘其内在的联系,从而为数字人文研究提供借鉴㊂书中的地名涵盖南北,基本囊括了隋唐时期的重要城市,具有重要的文学与史学价值,对了解明清小说家的创作倾向㊁隋唐的历史发展及图书资源知识的发现有着深刻的意义㊂1㊀‘隋唐演义“数据来源及数据清洗本文选取鼎秀古籍全文检索平台扫描识别的‘隋唐演义“电子版为原始数据来源,利用Python㊁Gephi㊁QGIS等工具,通过数据采集㊁数据清洗㊁数据处理㊁数据可视化㊁数据分析等流程对‘隋唐演义“进行全面而系统的研究,实现对小说知识的挖掘和发现㊂其中,数据采集阶段主要是对书的文本进行爬取,并以txt文件的形式保存爬取出来的数据㊂数据清洗阶段是利用Python中的jieba库进行分词,提取书中的人物㊁地名等内容,并绘制相应的表格㊂数据处理阶段是运用Gephi㊁QGIS等数字软件对书中的社交网络㊁地理分布等进行分析㊂数据可视化阶段是运用Gephi软件对数据进行可视化呈现,形成可视化图谱㊂数据分析阶段主要是对可视化图谱内容展开分析发掘,实现文本内容与数字技术的结合,具体流程如图1所示㊂2㊀‘隋唐演义“社会网络与人物共现关系首先,利用Python中的jieba库对‘隋唐演义“的txt文本进行分词,通过jieba库的posseg模块提取人名,排除非人名词语㊂然后,结合书的具体文本内容及相关的历史文献,对同一个人物的不同指代称谓进行设置,建立映射词表㊂通过软件得到具体数据后,再结合书的文本内容进行人工比对和增补,由此得出‘隋唐演义“所有人物的人名数据㊂再次,使用Python对‘隋唐演义“txt文本进行识别,如果两个人物同时出现在同一段落中,则可认为二者存在某种联系㊂经数据分析与人工核对统计,最终得到书中的302位人物及7220组共现关系㊂最后,将人物与共现关系数据导入Gephi软件进行处理,获得人物共现关系的可视化图谱,并进行网络直径㊁网络平均度等网络特征指标的计算㊂图1㊀‘隋唐演义“资源知识发现流程2.1㊀‘隋唐演义“人物关系挖掘2.1.1㊀共现网络关系图谱建构图,也叫网络,表示为G=(V,E),其中V表示图中的节点集合,E表示图中边的集合[13]㊂在图论中,度数表示一个节点的连接数,即与该节点相连接的边的数目,一个节点的度越大就意味着这个节点在某种意义上越 重要 [14]㊂节点的度与节点的大小相关,节点度值越大则节点面积越大㊂将所得到人物与共现关系数据绘制到Excel表格,以CSV格式保存,利用Gephi软件读取表格数据,并进行人物矩阵网络关系图绘制㊂在操作过程中设置节点的大小,节点大小与度相关,度越大则节点面积越大㊂此外,连接两节点的边的粗细程度反映了两节点联系的紧密程度,两节点间的边越粗则代表联系越紧密,可视化结果如图2所示㊂图2㊀‘隋唐演义“人物共现网络关系2.1.2㊀人物共现关系的网络特征指标分析人物共现关系网络的拓扑结构可以通过网络平均度㊁平均路径长度㊁平均聚类系数等指标进行分析,‘隋唐演义“人物共现关系的网络特征指标数据如表1所示㊂表1㊀‘隋唐演义“人物共现关系的网络特征指标数据集节点数边数网络直径网络平均度平均聚类系数平均路径长度人物共现关系网络3027220623.910.684 2.4㊀㊀通过表1可以看出,本次录入的人物共有302位,他们相互之间构成的社交关系共7220条㊂共现关系网络中的人物,平均需要2 3步即可建立联系,而最长则需要6步才能建立㊂网络中的每个人物平均与23 24个其他人物存在共现关系㊂每个人物之间的平均聚类系数为0.684,即共现概率为68.40%㊂综上所述,‘隋唐演义“中的人物联系较为紧密,具有较为明显的小世界特性㊂2.1.3㊀基于中心度的网络人物中心性分析计算出人物共现关系网络中每个人物的中心度,统计出‘隋唐演义“前40位核心人物,按照中心度的大小依次排列,结果如表2所示㊂表2㊀基于中心度的‘隋唐演义“前40位核心人物㊀㊀结合图2和表2可以看出,秦琼的度中心性最高,在人物关系网络中处于中心地位㊂秦琼出场时间早㊁社交网络广,全书以其为中心连接了众多人物㊂从小说来看,秦琼出身没落的将门,混迹于市井草莽之中,因而结交了各路绿林豪杰㊂本书的前半部分以秦琼为中心,塑造了秦母宁夫人㊁秦妻张氏等女性形象,以及单雄信㊁王伯当㊁徐世勣等英雄形象㊂随着事件的发展引出瓦岗寨与李唐的线索㊂李渊和李世民作为唐王朝的缔造者,广泛联络豪杰㊁讨平各方势力,自然是书中的核心人物㊂而徐世勣㊁程咬金㊁李靖等人都是经历隋末动乱和大唐初建的功臣,与唐密切相关,也是较为重要之人㊂李密㊁窦建德㊁王世充及与之相关的单雄信㊁王伯当等人作为起兵反隋的重要领袖,在小说前半部分有较多的戏份,因此地位也比较突出㊂至于隋炀帝杨广㊁萧后,及与之相关的宇文化及㊁沙夫人㊁花夫人等,在小说中作为反面形象出现,在书里是连接隋唐历史交替的重要纽带,具有不可或缺的作用㊂此外,还有李隆基㊁杨贵妃㊁安禄山等历史人物,虽在小说中出场较晚,但也具有多的戏份,处于重要的社交网络位置,因此地位也较高㊂2.2㊀‘隋唐演义“社交网络人物群体分析2.2.1㊀基于模块化的凝聚子群分解一般认为,模块化指数大于0.3,即代表网络具有较明显的社区结构,真实世界社区的模块化指数通常介于0.3 0.7之间[15]㊂经过计算,‘隋唐演义“网络的模块化指数为0.482,表明其具有较为明显的网络社区结构㊂利用Gephi模块化功能对‘隋唐演义“中的不同群体进行着色,以图谱的形式呈现人物的共现关系网络,从而较为清晰地区分互动相对频繁的群体,结果如图3所示㊂从图3可以看出,‘隋唐演义“人物的共现关系网络大致可分为4个群体,分别是以秦琼等为中心的A群体,占比43.05%;以杨广为中心的B群体,占比33.11%;以李隆基为中心的C群体,占比22.52%;以王勃为中心的D群体,占比1.32%,该群体完全处于边缘位置㊂除群体间的不同外,人物的共现关系网络还存在 中心 边缘 的差异㊂人物的共现关系网络边缘存在的大量孤立节点,说明众多边缘人物共现关联较少㊁地位较低㊂2.2.2㊀基于k-core的人物群体过滤利用k-core社交网络对人物的共现关系网络进行过滤,可以更为直观地看出核心人物及其存在的共现关系㊂根据计算出的人物关系网络特征数据,结合本研究的实际情况,最终以k=12为标准对‘隋唐演义“中人物的共现关系网络进行过滤,保留核心人物群体共现关系,并进行可视化呈现,结果如图4所示㊂图3㊀‘隋唐演义“人物模块化分解共现网络图4㊀‘隋唐演义“人物k-core结构共现网络由于设置了k=12的参数,故图3人物模块化分解共现网络中的D群体因重要程度较低而消失㊂需要说明的是该群体比较特殊,仅有王勃㊁宇文钧㊁阎伯屿㊁吴子章4人㊂此4人仅出现在小说的第71回 武才人蓄发还宫秦郡君建坊邀宠 ㊂究其原因,是作者褚人获在撰写‘隋唐演义“的过程中,有意地将王勃为滕王阁撰写‘滕王阁序“的历史典故穿插进去㊂此章过后,书中便再未对该群体4人的生平活动进行交代㊂2.2.3㊀核心人物群体分析根据‘隋唐演义“人物在共现关系网络中的中心度排名㊁基于模块化的凝聚子群分解以及基于k-core的人物群体过滤,统计并划分前40名核心人物群体,结果如表3所示㊂表3㊀‘隋唐演义“核心人物群体划分编号核心人物核心人物数/所在群体数1秦琼㊁李世民㊁李密㊁李渊㊁窦建德㊁单雄信㊁贾润甫㊁王伯当㊁徐世勣㊁程咬金㊁王世充㊁翟让㊁李靖㊁李如珪㊁柴绍㊁罗士信㊁罗成㊁齐国远㊁秦怀玉㊁魏征㊁张公谨㊁窦线娘㊁张氏㊁尉迟恭㊁刘武周㊁李元吉㊁宁夫人㊁宇文述㊁孙安祖29/1302杨广㊁萧后㊁袁紫烟㊁宇文化及㊁沙夫人㊁杨义臣㊁朱贵儿㊁花夫人8/1003李隆基㊁杨贵妃㊁安禄山3/684无0/4㊀㊀‘隋唐演义“的人物分属4个群体,设置编号为1㊁2㊁3㊁4㊂结合表2可以看出,前40位核心人物在其中3个群体中都有分布㊂以秦琼㊁李世民㊁李密等人为代表的群体1所涵盖的核心人物最多㊂这些人物主要活动于小说的前期和中期,部分经历了隋唐两朝,见证了隋亡唐兴的历史进程,也是书中最为重要的一个群体㊂从人物构成来看,其主要是李渊父子及隋末的各路豪杰,如李密㊁窦建德㊁贾润甫等㊂需要注意的是,宇文述虽被归为这一群体,但其与以杨广为代表的群体2也有着密切联系,情况较为特殊㊂以杨广㊁萧后㊁袁紫烟为代表的群体2主要活动在隋末这一时间段,在书中的前半部分出场㊂从人物构成来看,这一群体具有明显的 隋 属性,多为隋朝的武将谋臣和后宫妃子㊂其中,萧后㊁袁紫烟等都是后妃,长期陪伴在杨广周围㊂宇文化及㊁杨义臣两人一奸一忠,都是杨广较为倚重的臣子㊂他们常出入宫廷,为杨广出谋划策,也形成较为紧密的人物关系㊂群体3的人数较少,只有李隆基㊁杨贵妃及安禄山3人㊂他们虽出场时间较晚,但却是全书后半部分的关键人物㊂李隆基晚年沉迷享乐,任用李林甫㊁杨国忠等人,导致朝政腐败,最终爆发安史之乱㊂在小说里,李隆基专宠杨贵妃,两人往来频繁,关系极为密切㊂而安禄山前期刻意讨好唐玄宗李隆基,后期则形成敌对,构成了复杂的人物关系㊂上述群体不仅在内部互相联系,还在外部与其他群体保持沟通与互动㊂尤其是群体1和群体2的多位人物都有着双向的互动,如群体1的所有人原先都是群体2中隋炀帝杨广的臣子,李渊㊁李世民更是传统意义上的 皇亲国戚 ,只是随着隋炀帝杨广的倒行逆施才反叛㊂此外,群体2中的袁紫烟本是隋炀帝的妃子,隋亡后流落民间,结识了群体1中的贾润甫㊁徐世勣等人,并最终嫁给徐世勣,加入李氏父子的阵营㊂由此完成了从群体2到群体1的转变㊂而群体3的李隆基在小说中不仅是李渊的后代,还被设定为隋炀帝宠妃朱贵儿的托生,而杨贵妃则相应地成为杨广的转世,两人由隋入唐,经历了两世的姻缘结合,这一点带有轮回果报的宗教思想㊂因此小说不同群体人物之间往来频繁,联系紧密㊂2.3㊀数字人文视角与传统人文视角人物研究对比与传统人文视角相比,数字人文视角下的‘隋唐演义“人物研究具有以下3个新的特点:其一,研究的人物数据更多㊁涉及范围更广㊂数字人文研究借助数字技术,对书中的全体人物进行分门别类的详细探究,研究对象更加全面,研究结论更加可信㊂其二,利用Python㊁Gephi等软件将书中的文本信息进行可视化呈现,还原所有人物的社交网络关系,能更为直观地识别人物之间的社会关系及联系的密切程度㊂其三,在图谱的基础上,运用科学的SNS理论分析文本,借助相关的技术理论将书中人物划分为不同的凝聚子群,了解其内部关系及外在联系,更好地把握书中的人物布局㊂3 ‘隋唐演义“府㊁州㊁郡的时空分布首先,利用中国历史地理信息系统(CHGIS)及中国历代人物传记资料库(CBDB)的地名沿革系统,限定时期为 隋(公元581年 公元618年) 唐(公元618年 公元907年) ,查找书中府㊁州㊁郡的经纬度坐标,保留3位小数㊂其次,将书中府㊁州㊁郡地名和出现频次绘制成Excel表格,结果如表4所示㊂表4㊀‘隋唐演义“中的府㊁州㊁郡空间及密度分布3.1㊀‘隋唐演义“府㊁州㊁郡时间分布特点作为一部历史演义小说,‘隋唐演义“以时间顺序进行叙事,但时间线索相对隐晦,只能通过不同皇帝的在位情况予以辨别㊂从书中的文本内容来看,大体可分为3个阶段:隋文帝 隋炀帝时期,唐高祖 唐太宗时期,唐高宗 唐代宗时期㊂将‘隋唐演义“的txt 文本按照上述3个阶段进行划分,并将其保存为3个txt 文件,运用Python 软件依次统计长安㊁洛阳㊁潞州等7个府㊁州㊁郡在3个时期的出现频次,绘制出河流图,结果如图5所示㊂图5㊀‘隋唐演义“代表城市各个时期频次河流分布㊀㊀从图5中可以较为直观地看出,除西都长安㊁东都洛阳在3个时期内的分布较为均匀外,其余府㊁州㊁郡的分布都呈现出明显的下降态势㊂这些州㊁府㊁郡都集中在书中的第一个阶段(隋文帝 隋炀帝时期),而到了唐代以后,他们的出现频次陡然减少㊂结合书中的具体内容来看,隋末群雄并起㊁逐鹿中原的情节显然是全书的中心,也是作者着力刻画的部分㊂书中的主要人物秦琼㊁李世民㊁李渊等主要活跃于这一时期㊂而自第47回隋炀帝身死,至第100回唐代宗即位㊂作者用了一半的篇幅描写了唐朝百余年的历史,略显冗长散漫㊂通过历时变化可以看出,书中所讲述事件的后期从关注全国各地的人物事件,到只关注东㊁西二京的历史人物,经历了由整体地域空间到局部中心城市的转变㊂3.2㊀‘隋唐演义“府㊁州㊁郡空间分布特点‘隋唐演义“中出现的府㊁州㊁郡一级地点共57处,涉及较多的地名㊂从表4空间及密度分布来看,频次区间为 1 5 的府㊁州㊁郡级地名有30处,约占地名总数的一半㊂此外,区间为 6 10 的地名有9处,区间为 11 20 的地名有7处,区间为 21 50 的地名有4处,区间为 51 100 的地名有4处,区间为 101 300 的地名有3处㊂可见,即使是那些重要性不高的府㊁州㊁郡,‘隋唐演义“也给予了一定的记录㊂而涉及重要人物㊁事件的地方,更是加强着墨㊂ 记所遇之地,即系地;记相见之时,即编年㊂ [1]‘隋唐演义“已具备一定的 系地 意识,有意识地对地域空间进行记录,从而使文本内容更加真实可信㊂此外,这样的行文方式对事件的展开起到了一定的辅助作用,可以帮助受众更好地理清人物与空间的交互关系㊂小说描绘的是隋唐故事,这一时期的重大历史事件往往集中在长安㊁洛阳㊁幽州等北方都会,如李渊父子起兵于太原㊁安史之乱爆发于范阳㊁张巡死守睢阳等㊂同时,书中前半部分出场的豪杰也多为北方人士,故小说总体以北方各州郡为中心,呈现北多南少的特点㊂此外,书中的地名主要集中于唐代的河东㊁河南㊁河北3道㊂其中,河东道下辖的太原府是李渊父子的根据地,聚集了众多英杰,河东道的泽州㊁潞州也是小说较早出现的地名,重要人物秦琼㊁单雄信等人早期活动于此;河南道包括今山东大部及河南一部,其下辖的齐州㊁青州等属现在的山东,早期王伯当㊁程咬金等英雄人物位于此,导致此道地名较多;与之有别,河北道各州郡出现时间较晚,多在第14回后出现,其所属的幽州㊁贝州㊁涿州,属反派窦建德㊁安禄山等人的势力范围㊂3.3㊀数字人文视角与传统人文视角时空研究对比与传统人文视角相比,数字人文视角下的‘隋唐演义“空间研究具有几个新的特点:其一,可以采集的地理数据更多㊂传统研究往往只能选取个别地域,如对关陇地区隋唐人物进行研究[16-17]等㊂而数字人文研究可借助GIS技术及Python㊁QGIS等软件,对书中出现的地名及人物活动地域进行精确的经纬度定位,从而得出更为准确且全面的结论㊂其二,传统空间研究无法直观还原空间分布特点,而数字技术可以在唐代当时的历史地图上直接实现标注,形成空间及密度分布表,以图表和数据的形式使府㊁州㊁郡的区划分布变得一目了然,便于后续研究的展开㊂其三,传统研究不能做到深入理解书中不同时期的空间分布特点,而通过数字技术可以实现对‘隋唐演义“文本的拆分,从而对不同历史时期的府㊁州㊁郡分布有更为直观的了解,由此探知书中的编排布局及创作规律,从而更好地分析书中人物与时空分布之间的联系㊂4 结语本研究充分运用数字人文技术及SNS㊁GIS的相关方法论,从非结构化的‘隋唐演义“的小说文本中抽取出结构化的人物与府㊁州㊁郡实体,进行社交网络及地理空间分布的可视化分析㊂需要注意的是,本文仅是基于长篇历史小说‘隋唐演义“的文本所展开的人物关系挖掘,网络所呈现的人物关系及地域空间与真实的历史可能会有所出入㊂此外,小说中的一些人物塑造得比较简略,地名存在偏差,因此一定程度上会影响研究的准确性㊂总之,本研究是将社会网络分析及地理信息系统用于分析古典长篇历史演义小说的实践尝试㊂通过数据采集㊁数据清洗㊁模型构建㊁数值统计㊁分析阐释等步骤完成从质化描述到量化分析㊁传统文学研究到数字人文结合的转变,在一定程度上拓宽了学术视野,为文学研究带来新的思路与方法㊂期待未来有更多的学者运用先进的数字技术研究传统人文学科,并推动其向前发展㊂参㊀考㊀文㊀献[1]㊀王兆鹏,邵大为.数字人文在古代文学研究中的初步实践及学术意义[J].中国社会科学,2020(8):108-129,206-207. [2]㊀赵雪芹,党昭,李天娥.数字人文视角下的档案信息资源开发问题与对策[J].北京档案,2021(1):18-22.[3]㊀薄一航.后数字时代计算思维下的电影研究新范式[J].北京电影学院学报,2023(10):23-32.[4]㊀爱如生中国基本古籍库个人版[EB/OL].[2023-11-17].ht-tp:///.[5]㊀鼎秀古籍全文检索平台[EB/OL].[2023-11-17].https://.[6]㊀中华经典古籍库[EB/OL].[2023-11-17].http://publish.an-/docShuju/platformSublibIndex.jspx?libId=6.[7]㊀搜韵.唐宋文学编年地图平台[EB/OL].[2023-11-17].ht-tps:///MPoetLifeMap.aspx.[8]㊀学术地图发布平台[EB/OL].[2023-11-17].http://amap..[9]㊀中国历代人物(CBDB)[EB/OL].[2023-11-17].https:///biog.[10]赵薇.社会网络分析与 ‘大波“三部曲 的人物功能[J].山东社会科学,2018(9):50-64.[11]徐永明,唐云芝.‘全元诗“作者地理分布的可视化分析[J].浙江大学学报(人文社会科学版),2019(1):150-160. [12]孙建旺,吕学强,张雷瀚.基于词典与机器学习的中文微博情感分析研究[J].计算机应用与软件,2014(7):177-181. [13]Even S.Graph Algorithms[M].Cambridge:Cambridge UniversityPress,2011:1.[14]张春红,于翠波,朱新宁,等.社交网络(SNS)技术基础与开发案例[M].北京:人民邮电出版社,2012:42.[15]Green D G,Liu J,Abbass H A.Dual-phase evolution[M].NewYork:Springer,2014:3-40.[16]徐清廉.论隋唐的门阀之争与关陇集团[J].西北大学学报(哲学社会科学版),1981(1):91-98,111.[17]刘彭冰.关陇集团与关中文化本位研究综述[J].西部学刊,2017(12):36-38,63.Study on the Exploitation and Visualization of Knowledge in Ancient Book Resources from the Perspective of Digital Humanities: Taking Romance of the Sui and Tang as an ExampleDong ShouxuanCollege of Liberal Arts,Journalism and Communication of Ocean University of China,Qingdao,266100 Abstract㊀This article,from the perspective of digital humanities,utilizes library collection resources and various electronic databases as the main basis.It employs methods and software such as SNS,Python,Gephi,and QGIS to draw the visualized charts of character relationships and temporal-spatial distribution in the historical fiction Romance of the Sui and Tang through a combination of data mod-els and traditional charts.The analysis results contribute to the in-depth exploration of ancient books,enrich the paradigm of humani-ties research,and provide new ideas for the integration of ancient book resources and the linkage of knowledge data. Keywords㊀Digital humanities;Romance of the Sui and Tang;Character relationship;Temporal-spatial distribution㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀(上接第48页)A Systematic Review of Research Data ManagementCapability Maturity Assessment ModelsJin YegangFudan University Library,Shanghai,200433Abstract㊀The research data management capability maturity assessment model identifies and improves deficiencies in practices by comparing current research data management practices with best practices.This study aims to describe the current state of development of research data management capability maturity assessment models in the context of Big Science. To this end,a systematic mapping study was conducted on a series of high-quality research results published in five related databases.The analysis of30research out-comes highlights the deficiencies and challenges in the field.Despite the gradual refinement of the concept of research data manage-ment,there is a lack of good consensus on the domain ontology among scholars,and the absence of objective factors in the models leads to insufficient innovation motivation in the field.In addition,there are issues with the unclear role positioning of management institu-tions in the assessment models and a significant lack of interaction between model construction and entities outside academia.The arti-cle hopes to provide new research directions and suggestions for the future study of research data management capability maturity assess-ment models.Keywords㊀Research data management;Capability maturity;Maturity assessment;Systematic review;Systematic mapping study。

古籍数字化的文化意义

古籍数字化的文化意义

古籍数字化的文化意义
古籍数字化是将传统纸质古籍通过数字技术转化为电子版,使古籍的内容得以保存、传承与普及,具有非常重要的文化意义。

首先,古籍数字化保护了珍贵的文化遗产。

随着时间的推移,许多古籍逐渐腐朽、破旧、丢失。

将这些古籍数字化后,可以将它们永久保存在数字库中,使它们免受时间的损害和自然灾害的破坏,为后人留下更多文化遗产。

其次,古籍数字化方便了古籍的传承和研究。

古籍的传承需要大量的时间和精力,而数字化古籍可以节省大量的时间和人力,使得更多人可以接触到古籍,了解文化底蕴。

同时,数字化古籍方便了研究人员的研究,可以在电子版中进行更方便快捷的搜索、对比、分析等操作,使得古籍的研究更加深入。

第三,古籍数字化促进了文化交流。

古籍是各民族、各国家文化交流的重要桥梁。

数字化古籍使得古籍的传播更为广泛,让更多人了解、接触到其蕴含的文化内涵,从而促进了各民族、各国家之间的文化交流和融合。

总而言之,古籍数字化不仅保护了古籍文化遗产,方便了古籍的传承和研究,还促进了文化交流,具有重要的文化意义。

数字化古籍是一项非常有意义的工作,应该得到广泛的关注和支持。

- 1 -。

文化研究知识:数字人文学的理论与实践

文化研究知识:数字人文学的理论与实践

文化研究知识:数字人文学的理论与实践数字化时代的到来为人类的思考与创造提供了全新的可能性。

数字人文学作为其中之一,既体现了学科融合与跨学科思维的特点,又对传统文化产生了深刻的影响,成为学术研究以及文化传承的重要手段。

本文将从数字人文学的概念、理论和实践三个角度出发,讨论数字人文学在当代文化研究中的意义和价值。

一、数字人文学的概念数字人文学又称数字人文学科,是一门研究数字技术在人文学科中应用的学科。

作为数字时代的文化产物,数字人文学是数字技术与人文学科的跨界融合,是一种综合了计算机技术、统计学、文学和人文学科相关领域的学科。

数字人文学主要集中在文本分析、人文信息学、数字文化遗产等方向,这些方向覆盖了人文社会学、历史学、语言学、文学、艺术史等领域,涵盖文化、社会、艺术等人文学科的多个学科领域。

数字人文学的研究方法主要利用计算机技术对大量文本信息进行自动化处理和分析,从而提高对文本数据的研究效率和准确度。

数字人文学不仅仅是一种单纯的技术手段,更是在技术与人文学科互动的过程中诞生的一种全新学科。

二、数字人文学的理论数字人文学的理论主要包括数字人文学文献的描述,分析和解释三个部分。

数字人文学的文本描述主要是指数字人文学文献的数字形态,包括原始的文本信息、文本的格式和文本数据的结构等。

数字人文学文献的分析侧重于利用数字技术和各种算法对文本数据进行处理、解析和分析,以获得关于文本数据的深层次信息。

数字人文学的文本解释主要是指对数字人文学文献的解释和说明,包括其特有的分析方法、识别和评估技术等。

数字人文学理论能够有效促进人文学科研究的数字化、可视化和计算化,实现信息的自动化、智能化和高效化。

在数字人文学研究方面,数字技术可以在大数据资源上提供快速且准确的解读,帮助研究者更好地掌握大规模文本语料库的结构、内容和风格。

三、数字人文学的实践数字人文学的实践应用主要包括应用于数字文化遗产的保护和传承、文本研读和编辑、文化分析、可视化技术等方面。

古典文献学与数字人文研究的交叉领域

古典文献学与数字人文研究的交叉领域

古典文献学与数字人文研究的交叉领域在当今数字化时代,各个学科领域都在经历着深刻的变革,古典文献学也不例外。

数字人文作为一种新兴的研究方法和学术领域,正与古典文献学产生日益紧密的交叉与融合,为古典文献的研究、传承和利用带来了新的机遇和挑战。

古典文献学是一门研究古代文献的学问,它涵盖了文献的产生、流传、整理、校勘、注释、编纂等多个方面。

其研究对象包括古籍、金石碑刻、档案文书等各种承载着历史文化信息的文本。

长期以来,古典文献学主要依靠传统的研究方法,如版本学、目录学、校勘学等,学者们通过对实物文献的仔细研读和比对,来揭示文献的内涵和价值。

然而,随着信息技术的飞速发展,数字人文逐渐崭露头角。

数字人文是将数字技术应用于人文研究的跨学科领域,它借助计算机技术、数据库管理、数据分析、可视化等手段,对人文资料进行处理和分析。

在古典文献学中,数字人文的应用为研究带来了诸多新的可能性。

一方面,数字技术为古典文献的整理和保存提供了更为高效和便捷的手段。

以往,对大量的古籍进行整理和编目是一项极为繁琐的工作,需要耗费大量的人力和时间。

而现在,通过数字化扫描和建立数据库,可以将海量的文献快速转化为数字形式,并进行分类和索引,极大地提高了文献整理的效率。

同时,数字存储还能够更好地保护文献原件,减少因频繁翻阅和保存不当造成的损坏。

另一方面,数字人文为古典文献的研究方法带来了创新。

例如,通过文本挖掘技术,可以对大规模的古典文献文本进行自动分析,提取关键词、主题词,发现文本之间的关联和模式。

这有助于学者更快速地把握文献的核心内容和整体特征,为进一步的深入研究提供线索。

此外,利用数据可视化手段,可以将复杂的文献关系和研究结果以直观的图形、图表等形式呈现出来,使研究成果更易于理解和传播。

在古典文献的传播与利用方面,数字人文也发挥着重要作用。

借助网络平台和数字化工具,古典文献能够更广泛地传播给社会大众,打破了传统研究中时间和空间的限制。

《古籍数字化技术》课件

《古籍数字化技术》课件

人工智能
人工智能技术将帮助解决文字 识别等难题,提高数字化的准 确性和质量。
古籍数字化的意义
古籍数字化有助于保护文化遗产,防止古籍因时间流逝或人为破坏而丧失。 数字化还使古籍更容易被广泛使用和分享,促进学术研究和文化交流。
古籍数字化的步骤
1
扫描
对古籍进行高分辨率的扫描,生成数字图像。
2
OCR
利用光学字符识别技术将扫描的图像转换为可编辑的文本。
3
图像处理
对扫描的图像进行去噪、增强等处理,提高可读性。
2 虚拟修复
3 大数据分析
利用数字化技术对破损的 古籍进行虚拟修复,恢复 其原貌并保护其原始状态。
借助数字化技术处理大量 的古籍数据,实现文本分 析和知识挖掘。
未来古籍数字化技术的发展趋势
自动化技术
未来数字化技术将借助自动化 技术,实现更快速、高效的古 籍数字化。
虚拟现实
虚拟现实技术将使用户能够 字化档案库,内容涵盖了丰富的 古籍资源,为学者和研究者提供 了独特的参考资料。
敦煌石窟数字化保护项目
敦煌石窟通过数字化技术,记录 和保护了珍贵的壁画和古籍,为 后世留下了宝贵的文化遗产。
数字化技术在古籍保护中的运用
1 在线馆藏
通过网络将数字化的古籍 资源公开,方便公众随时 访问和浏览。
古籍数字化的难点
脆弱性
古籍可能因纸张老化或虫蛀 等原因变得脆弱,增加了数 字化的难度。
字体多样性
古籍中的字体繁多,有时难 以准确识别和转换为可编辑 的文本。
版式复杂性
古籍中的版式可能错综复杂, 处理起来具有一定的挑战性。
古籍数字化项目案例
故宫博物院数字化项目
国家图书馆数字化档案库

数字人文视角的古籍数字化开发和利用研究

数字人文视角的古籍数字化开发和利用研究

●本文系国家社科基金项目“图书馆古籍文献的数字人文开发与应用模式研究”(17XTQ003)研究成果之一。

收稿日期:2021-11-22数字人文视角的古籍数字化开发和利用研究覃 熙1,欧阳剑2(1 广西民族大学图书馆,南宁 530006;2 上海外国语大学,上海 200083)摘 要:文章通过梳理人文学者利用数字人文范式进行古籍研究的视角,拟探寻数字人文的古籍开发及利用路径。

提出了遵循算法驱动的数据库开发、数字人文基础设施构建、研究平台的构建、数字研究环境的创造的方法,体系化地完成古籍开发和利用。

关键词:数字人文;古籍数字化;基础设施;研究环境中图分类号:G256 文献标识码:A 文章编号:1003-7136(2022)04-0046-06ResearchontheDigitalDevelopmentandUtilizationofAncientBooksfromthePerspectiveofDigitalHumanitiesQINXi,OUYANGJianAbstract:Bysortingouttheperspectivesofhumanitiesscholarsusingthedigitalhumanitiesparadigmtostudyancientbooks,thispaperintendstoexplorethedevelopmentandutilizationofancientbooksindigitalhumanities Itproposesthemethodsofdatabasedevelopmentdrivenbyalgorithm,constructionofdigitalhumanitiesinfra structure,constructionofresearchplatform,andcreationofdigitalresearchenvironment,soastosystematicallycompletethedevelopmentandutilizationofancientbooks Keywords:digitalhumanity;digitizationofancientbook;infrastructure;researchenvironment0 引言中华文明源远流长,丰富的古籍文献涵盖语言学、历史、文学、社会学、考古学、艺术、政治、经济等领域。

我国古籍数字化理论研究综述

我国古籍数字化理论研究综述
关 键 词 古 籍 数 字 化 理 论研 究 综述
中图 分 类 号 : 2 61 G 5.
文 献 标 识 码 : A
文章 编 号 :0 5 8 9 ( O 9 1 - 0 2 0 10 — 0 52 O ) 10 1— 3
1 引 言
我 国 古籍 数 字 化 的实 践工 作 早 在 上世 纪 8 0年 代初 就 已起 步 , 经过 了近 3 0年 的发 展 , 籍 数 字化 古 工作 取得 了可 喜的成 绩 。 但是 , 2 这 0多 年来 , 关 古 有 籍数 字 化 的 理论 研究 却远 远滞 后 于 实践 的发 展 , 使 得 古 籍 数 字 化 研 究 工 作 缺 乏 整 体 的理 论 指 导 与 支 持 , 能 形成 一定 的理 论体 系 。因此 , 了推动 我 国 未 为 古籍 数字 化研 究工 作 不断走 向深 入 ,有必要 对 古籍 数字 化 的相关 理论研 究成 果加 以爬 梳 和整理 。 “ 古籍 数 字化 ” 这一 词组 . 其重 心在 “ 籍 ” 古 二字 . 而“ 数字 化 ” 是对 “ 古籍 ” 的技 术处 理过 程 。所 以从 严 格意 义上 来讲 。古籍 数字化 属 于古籍 整理 的研 究 范 畴 , 又 涉及 图书 馆学 、 但 文献 学 、 报 学 、 息学 等 多 情 信 种学 科 . 具有边 缘性 、 综合 性 、 交叉 性 的学科 特点 。 史 睿先 生在 《 论 中国古 籍数 字化 与人 文学术 研 究》 试 一 文 中说 :古 籍 数字 化 的理 论 比技 术 问题 更 为 重 要 , “ 因为 一旦 理论 发生 了偏 差 , 技术越 高 明 , 则解 决 方 案 越是 难 以成功 。 史先 生将古 籍数字 化 的理论 与技术 ” 分开来 讲 , 但是 , 者 以为虽 然“ 字化 ” “ 籍 ” 笔 数 与 古 之 间存 在着 内容 与形 式 的关系 ,然 而两 者对 构建 古籍 数字 化 的理论框 架却 是 同等重要 的 。 因此 , 笔者 以为 对古籍 数 字化 理论 的研 究应 该包 括古 籍数 字化 的概 念、 质、 性 特征 等 内部基 础理 论架构 和 技术处 理 层 面 的外部 理 论研究 两个 方面 。

古籍数字化的技术实现与应用研究

古籍数字化的技术实现与应用研究

古籍数字化的技术实现与应用研究随着现代科技的快速发展,古籍数字化成为了一项重要的任务。

古籍是一种非常珍贵的文化遗产,记录着人类的历史和智慧。

然而,由于古籍的脆弱性和保存条件的限制,它们很容易遭受损坏或丢失。

因此,将古籍数字化成为了一种保护和传播古籍的重要手段。

本文将探讨古籍数字化的技术实现与应用研究。

古籍数字化的技术实现主要包括扫描技术、图像处理技术和数据库建设等。

首先,扫描技术是古籍数字化的基础。

通过高分辨率的扫描设备,可以将古籍的每一页都以数字化的形式记录下来。

在扫描过程中,需要注意保持古籍的原始状态,避免造成破损。

其次,图像处理技术是古籍数字化的关键。

由于古籍的文字和图案较为模糊,图像处理技术可以对扫描后的图像进行增强和修复,使得古籍的内容更加清晰可读。

最后,数据库建设是古籍数字化的目标。

将数字化的古籍以数据库的形式存储,可以方便人们进行搜索和利用。

古籍数字化的应用研究主要包括学术研究、教育推广和文化传播等方面。

首先,古籍数字化为学术研究提供了更为便捷的工具。

传统的古籍阅读需要亲自前往图书馆或博物馆,而数字化的古籍可以通过互联网随时随地访问。

学者们可以通过数字化的古籍进行研究和对比分析,从而更好地探索古人的智慧和思想。

其次,古籍数字化在教育推广方面发挥了重要作用。

通过数字化的古籍,学生们可以更加直观地了解古代文化和历史。

教育机构可以利用数字化的古籍制作教材和课件,丰富教学内容,激发学生的学习兴趣。

再者,古籍数字化也为文化传播做出了积极贡献。

利用互联网和社交媒体,数字化的古籍可以传播至全球。

这为世界各地的人们提供了深入了解古代文化和历史的机会,促进了不同文化之间的交流和对话。

然而,古籍数字化也面临一些挑战和问题。

首先,古籍的特殊性导致数字化过程需要大量的人力和物力投入。

古籍的扫描和图像处理都需要专业的技术人员进行操作,而数据库的建设也需要相应的硬件设备和软件支持。

其次,古籍数字化需要保证数据的安全性和可靠性。

数字人文学科的理论与实践研究

数字人文学科的理论与实践研究

数字人文学科的理论与实践研究随着信息技术的不断发展,数字化运用已经成为人文学科研究的一个重要趋势。

数字人文学科涉及到数字化技术在人文学科领域的应用与实践。

数字人文学科的理论与实践研究在今天的社会中愈发受到关注,这是因为数字人文学科的应用不仅能够提高人文学科研究的效率和质量,而且有利于推动人文学科研究向智能化、数字化和全球化方向发展。

一、数字人文学科的概念与内涵数字人文学科是指数字化技术在人文学科领域的应用与实践。

数字人文学科的内涵即是将人文学科领域中的文化、历史、艺术等多个领域的资源数字化,使之可供更广泛的学术研究、民众普及和文化传承使用。

数字人文学科包括数字化文学、数字化历史、数字化艺术、数字化语言学、数字文化遗产等。

二、数字人文学科的意义和作用数字人文学科的出现不仅对人文学科的研究提供了新的思路和方法,而且有助于推动数字技术与人文学科的融合发展。

数字人文学科在多个领域中均产生了重要的作用。

(一)数字人文学科在学术研究中的作用数字人文学科在人文学科领域中有着重要的学术研究作用。

数字技术的应用有助于人文学科领域中的古籍资料的数字化处理、分析、归纳、编辑和整理,从而有助于人们更好地理解古代文化、故事、历史和情感。

同时,数字化技术的应用也能够帮助人文学科领域中的研究者更好地发现重要的研究问题和线索,有助于学术外部的合作和开放式的研究。

(二)数字人文学科在文化传承和传播中的作用数字人文学科的应用有助于促进文化资源的数字化传承和传播。

例如,数字化技术提供了更好的方式来记录和保护文化遗产、丰富民众的文化生活。

数字化博物馆等数字文化遗产的构建使得人们可以通过网络亲身体验文化遗产的魅力,从而拓宽了获取文化知识的途径,有助于提高公众对文化的理解和认知。

(三)数字人文学科在教育和培训中的作用数字人文学科也在教育和培训中发挥着重要的作用。

数字化技术的应用有助于对学生的人文素养和技能的培养,同时也是晋升人文学科教育质量和效率的一种方式。

图书馆的数字化古籍保护与利用

图书馆的数字化古籍保护与利用

图书馆的数字化古籍保护与利用在数字化时代,图书馆的数字化古籍保护与利用成为了一个重要的话题。

古籍作为文化遗产的重要组成部分,其保存和传承一直备受关注。

数字化技术以其高效快捷的特点,为古籍保护与利用提供了新的途径和手段。

本文将探讨数字化古籍保护与利用在图书馆中的重要性,并讨论其面临的挑战和发展方向。

一、数字化古籍保护的重要性数字化古籍保护是指将古籍进行数字化处理,包括扫描、图像处理、文本识别等技术,使之能够以数字化形式保存和传播。

数字化古籍保护具有以下几个重要的方面。

首先,数字化古籍保护可以有效地保护古籍的原貌。

传统的纸质古籍容易受到时间、灰尘、虫蛀等自然因素的侵蚀,导致古籍的损坏和丢失。

而数字化处理可以将古籍以数字化形式保存,避免了这些自然因素的影响,从而保护了古籍的原貌。

其次,数字化古籍保护可以提高古籍的可访问性。

传统的古籍保存在图书馆的馆藏中,只能在图书馆内进行阅览,对于广大公众来说不太便利。

而数字化古籍可以通过互联网等方式进行在线访问,不受时间和空间限制,使更多人能够方便地接触到古籍,了解和学习其中的知识。

最后,数字化古籍保护可以促进古籍的研究和学术交流。

数字化古籍可以进行全文检索,方便研究者查找和分析古籍中的内容。

同时,数字化古籍可以与其他数字资源进行链接,形成丰富的学术资源网络,促进学术交流和合作。

二、数字化古籍利用的挑战尽管数字化古籍保护与利用带来了诸多好处,但也面临着一些挑战。

首先,数字化古籍保护的成本较高。

数字化过程需要专业的设备和技术支持,同时还需要大量的人力和时间投入。

这些都增加了数字化古籍保护的成本,限制了许多图书馆在数字化古籍方面的进展。

其次,古籍的数字化处理可能会损害其原始材料。

例如,扫描古籍过程中的高温、紫外线等因素可能对古籍造成损坏。

如何在数字化处理中兼顾对古籍的最大保护,成为一个亟待解决的问题。

另外,数字化古籍的版权问题也是一个重要的挑战。

许多古籍的版权归属不明确,涉及到版权保护和使用的问题。

【高三试卷】2023届甘肃省兰州市等5地高三二模语文试题及答案

【高三试卷】2023届甘肃省兰州市等5地高三二模语文试题及答案

2023届甘肃省兰州市等5地高三二模语文试题注意事项:1.答卷前,考生务必将自己的姓名、准考证号填写在答题卡上。

2. 作答时,将答案写在答题卡上。

写在本试卷上无效。

3.考试结束后,将本试卷和答题卡一并交回。

一、现代文阅读(36分)(一)论述类文本阅读(本题共3小题,9分)阅读下面的文字,完成1~3题。

数字人文是在计算机技术的推动下发展而来的,数字人文时代最大的特点是人文资料可以利用计算机实现数据化、使人文资料可以被量化分析。

图书馆古籍文献具有丰富的学术与研究价值,同时又具有一定的特殊性,经常性的翻阅会对古籍造成一定的损害。

通过计算机技术实现古籍数据化组织,对于古籍的保护、利用和共享具有重要的意义。

图书馆古籍数据化组织有两个基本的要求。

第一个要求是古籍数据的可计算性,这是古籍数据化组织的基础。

古籍本不具备数字特征,通过计算机技术实现古籍的数字化,使古籍具有明确的计量属性,揭示古籍的多种属性,并通过对这些属性进行描述与标注,为后续古籍数据的挖掘与知识关联奠定基础。

第二个要求是古籍数据的可获得性、可访问性。

由于古籍数据差异性大,数据混杂,可能存在数据孤岛现象,而古籍数据化组织的目的是提高古籍数据的利用效率以及更好地服务于学术研究,因此古籍数据化组织的过程需要保证古籍数据的可获得性、可访问性。

数字人文时代图书馆古籍数据化组织要注重知识关联,利用可视化工具直观地展示古籍数据化组织结果。

传统模式下的古籍数据化管理主要是深入分析单一数据源,数字人文时代的古籍数据化管理强调对古籍数据源的多视角分析,实现古籍知识关联。

古籍数据化管理包含古籍数字化、古籍数据融合、实现知识关联及应用三方面内容。

古籍数字化是古籍数据化组织的基础,将纸质资源转化为数字贵源,实现古籍资源在数字世界的映射,使得古籍资源能够被计算机存储。

古籍数字化的过程需要保证古籍的完整性、准确性,同时还需要减少对古籍的损伤。

如通过冷光扫描仪,采用非接触扫描结合冷光技术、可以大幅度减少对古籍的损害,同时扫描速度快,扫描准确度高,可以将扫描完成的古籍转化为PDF、WORD 等格式,为后续古籍处理和分析提供了便利。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

试论中国古籍数字化与人文学术研究(一)【提要】本文从人文研究角度出发讨论古籍数字化意义及解决方案,强调了在数字化时代传统古籍整理工作的重要性。

史文认为古籍数字化能为人文研究提供便捷、准确的查询工具,但要实现这一目标,必须对传统古籍整理工作进行变革,要求建立数据库统一的规范,包括分类法、著录格式都要有一定的修改,以建立国家标准,并使古籍数据库与数字图书馆的其他数据库保持整体的统一性。

文章对计算机技术也给予了同样的重视,分析了人文研究对计算机技术的要求,计算机技术为古籍数字化准备的条件,并讨论了两者的有效结合。

【关键词】人文学术研究、数据库、知识发现、中国古籍数字化解决方案、图书馆自动化中国古籍的数字化是一个非常复杂的跨学科课题,本来应由专家来解决,绝非学识浅陋如不佞者所应妄言的。

但是,计算机产业界的专家对于计算机技术在人文学术研究上的应用缺少了解和兴趣,而学术界的专家都忙于各自的名山事业,两方面又无良好的沟通,所以创获甚少。

此前虽有学术机构曾进行过类似课题的研究,获得了初步的成果,但旧的思路和成果已很难跟上计算机技术飞速发展的步伐1]。

鉴于目前中国古籍数字化问题的日益紧迫和相关专题研究的相对滞后,笔者不揣谫陋,撰此小文,以期引起有关专家就例如数字化、网络化时代对人文学术研究提出怎样的机遇和挑战,如何利用计算机及网络技术推动人文学术研究的发展以及如何规划、评估古籍(以至一切图书文献)的数字化方案等问题的深入讨论。

一、古籍数字化——现代学术研究的基础我们中华民族创造了无比丰富的历史文化遗产,对于世界文化具有巨大贡献。

古代典籍是中国历史文化遗产最为重要的物质载体,面对蕴藏于浩如烟海的古籍之中的文化思想,究竟应该如何解读,如何履践,不免令人有“一部十七史,不知从何说起”的感觉。

胡适之先生认为传统的经史研究存在范围太狭窄,注重功力而忽略理解,缺乏参考比较的材料等积弊,故以清代三百年间第一流人才的心思精力,都用在经学的范围内,却只取得了一点点的成果,关键是缺少对古籍的系统整理,又不注重学术成果的积累,两千四百多卷的《清经解》,大多是一堆流水烂帐,没有条理,没有系统,人人从“粤若稽古”、“关关雎鸠”说起,怪不得学者看了要望洋兴叹了2]。

针对清儒治学方法的缺陷,胡适之先生着重提出,必须系统地整理古籍,包括索引式、结帐式和专史式的整理。

此后,学界编纂了多种引得、通检、索引、汇编等工具书,部分完成了索引式整理的目标,拜前辈学者之赐,我们查阅古籍不知享受了多少便利。

但是我们也发现,中国古籍汗牛充栋,经过系统整理的毕竟只是少数,方便的检索工具也还嫌太少,离胡适之先生的标准还有相当的距离。

即使是已有索引的古籍,我们用来解决具体问题时仍会感觉到种种不便。

至于结帐式的整理,则尚未受到学术界的普遍重视,而在未有结帐式整理之前,所作的专史研究,其完整性、可靠性都值得怀疑。

刘家和先生在《〈崔述与中国学术史研究〉序》中说道:“记得从前有一位学术前辈说过:‘上穷碧落下黄泉,动手动脚找材料。

’这已很不容易。

而现在是要‘上穷碧落下黄泉,以求有所新发现’,这就更是难上加难了。

由此我想到了美国科学哲学家库恩(ThomasKuhn,1922—1996)的一篇文章《必要的张力:科学研究中的传统和创新》(TheEssentialTension:TraditionandInnovationinScientificResearch)。

他说,科学的发现,既需要发散思维,即对于传统具有突破性的创新思维,又必须有向心思维,即深入传统的思维。

这是因为,没有前一思维,就会限于传统而失去创新的可能;没有后一种思维,就不能深知传统中的问题与病因所在,就不知到底为何需要突破,应该从何突破,即使突破也破不到点子上,何来创新?所以他概括地说:‘成功的科学家常常必须同时扮演传统主义者和离经叛道者的角色。

’库恩讲的是科学发展的要求,其实对于史学的发展来说,这几乎是同样适用的。

这就是要‘上穷碧落下黄泉’,要有微观与宏观、传统与创新两极之间的张力。

”3]确如刘家和先生所说,经常保持这种张力是推动学术创新的要素,如果认真反省一下就不难发现,在人文学术研究中,我们有时忽视对古籍文本的深入解读,导致研究结论发生偏差;有时又被前人的成说所左右,不能有所推进。

为了中国现代学术的自主、自立,促进中外学术的对话,我们必须比以前任何时候都更加致力于中华元典以至全部古代典籍的深入解读,以求在此基础之上作出更大的学术突破。

有人看不起古籍点校或是索引、目录、汇编的编纂,可又有谁能说自己的名山事业从未受惠于点校本《二十四史》、《资治通鉴》或是《二十史朔闰表》、《中国历史地图集》、《十三经索引》、《二十四史人名索引》这样经典的点校本或检索工具呢?人文学术研究是个人的事业,一个人的精力和时间是有限的,而人类知识的积累又绝非一个人所能把握的,如果我们不能大幅度地提高自己的学习效率,而是将有限的时间、精力都花费在浩繁、琐碎的翻检工作之中,那么还谈何学术进步呢?为此,我们需要有经过认真梳理的、反映全部前人研究成果的古籍文本供学术界使用,需要有便捷、高效、准确的查询工具为人文学术研究服务。

古籍数字化是一项重要的人文学术研究基础工程,不仅需要全体学术研究者和计算机专家的勤奋和努力,更需要现代化技术的支持。

我们认为,利用计算机及网络技术进行深入的古籍整理工作,在当今数字化时代势在必行,它必将大幅度地提高我们学习中国古代文化的效率,定会将学者的时间和精力从艰苦而繁琐的爬梳、翻检工作中解放出来,用于推动人文学术研究的发展,对此我们充满了希望。

同时我们还应认识到,古籍文献的数字化实际上也是全部中文文献数字化事业的一个复杂特例,它所积累的经验和取得的成果必能广泛地应用于后者,而中文文献的数字化又是数字化图书馆事业的一部分,是国家知识基础设施(NationalKnowledgeInfrastructure简称NKI)的一部分4],具有十分广阔的应用前景。

此外,积极建设网上中文资源库,打破某些国家或某种语言对网络资源的垄断,这将有利于中外学术文化的交流,树立中国人的学术自信心和自尊心。

二、古籍数字化的理论思考当前,衡量个人电脑的性能标准已不再是中央处理芯片(CPU)的时钟频率,而是看它的整体可用性如何。

软件亦是如此,应用放在了越来越重要的位置上。

由于缺乏利益驱动,计算机软件在传统人文学术研究领域的应用还远未提到中国计算机产业界的议事日程上来,这不能不说是一种遗憾。

目前,台湾中央研究院已建立起十余个重要的古籍资料库,并逐渐开放于网络5]。

近期日本出版了一本《电脑中国学》(东京好文出版社,1998年11月),书中探讨了计算机技术应用于中国研究的问题,并且提供了大量与中国研究有关的网址,其中绝大部分是属于台湾学术机构的。

本来应由最具人才资源和技术优势的大陆学术界完成的事业,却被台湾学术界抢先了一步,不能不说又是一重遗憾。

最近,大陆出版界推出了几种大型的电子版古籍6],引起了社会的普遍关注。

然而此类电子读物大多难以差强人意,究其原因就在于我国的计算机产业界很少有人专门从事计算机技术在传统人文学术研究领域的应用研究,对中国古籍及其研究方法也缺乏必要的了解。

同时,文史研究者不能勇敢地迎接数字化时代对人文学术研究提出的挑战与机遇,积极地参与古籍的数字化工作,则是另一个重要原因。

问题的关键在于人文学术研究向计算机提出怎样的要求,当代计算机技术又为古籍数字化准备了哪些条件,两者究竟如何契合。

笔者认为,古籍数字化的理论问题比技术问题更为重要,因为一旦理论发生了偏差,技术越高明,则解决方案越是难以成功。

而此种理论是基于对人文学术研究一般过程和计算机数据处理基本原理的认识之上的,所以只有学术界与计算机产业界的密切合作,才能达成尽善尽美的结果。

笔者认为,以人文学术研究的角度来看,古代典籍一方面是古代先贤完整地表述思想体系的“撰述”,另一方面又可看作是保存古代历史断片的“记注”7]。

研究先贤的思想,固然要尊重其“撰述”的完整性及其内部的逻辑,将其还原于它的时代语境之中,作“同情之了解”;而研究历史则如艺术家一般,将零星的断片(即史料)小心地补缀成一件完整的艺术品。

无论何种研究,每当我们将零星的断片按照一定规则重新排列、组合以后,都会有一种豁然开朗的感觉,因为我们由此发现了那些材料在原有脉络(context)之中难于发现的字面之外的第二甚至第三重含义,以及它们之间的各种内在关联,我们对这些含义和关联作进一步的分析或综合,总会有新的发现及解释,这就是人文学术研究的一般过程。

其具体操作过程往往是突破文献的原有结构,将原文献划分为若干基本单位,提取其中指向内部含义的关键词,依照它们的属性进行排序、筛选、统计和分类,比较相关文献中的关键词,寻求他们之间的相关性。

这一过程在手工查阅纸本文献的时代,需要学者具有深湛的功力,否则很难得到完美的解决,因为纸本古籍大多缺少必要的索引,而纸本检索工具既不能随读者的要求提供多种排检方式,又无法按照读者的要求产生再生资源,可用性有限;此外,研究者对文献本身的认识是随着研究工作的深入而逐步清晰起来的,其工作初期往往难以明确提出与自己的研究题目完全切合的全部关键词,而是要在较大范围内进行模糊查询或渐进式查询,这更是纸本检索工具所不能解决的。

当然我们也看到,传统的点校本古籍为数字化古籍提供了基本样式,纸本检索工具为数字化古籍的查询积累了有益的经验。

中华书局版《二十四史》,尤其是《前四史》的点校,可称古籍整理的优秀范本,它吸收了此前的全部前人校勘的成果,为学术界提供了准确、可靠的古籍文本。

洪煨莲先生主持的哈佛燕京学社编纂的引得丛书、谭其骧先生主编的《中国历史地图集》、中华书局出版的《二十四史人名索引》、上海图书馆编纂的《中国丛书综录》等,都是嘉惠士林的工具书。

引得丛书的语词逐字索引堪称同类索引的典范,《二十四史人名索引》严格的规范控制使读者获益匪浅,《中国历史地图集》所具备的古今地名对照、地名方位查询等检索功能,绝非其他类别的工具书可以替代。

数字化古籍一方面应继承纸本古籍及检索工具的优点,一方面又要克服其原有缺陷,淋漓尽致地发挥电子媒体的优势。

鉴于中国古籍中知识发现的复杂性及其广阔的应用前景,笔者认为古籍数字化事业对计算机产业界是一个严峻的挑战,无论是系统、软件在中文环境下的易用性,还是信息产业的运营和服务的水平,都须经过古籍数字化事业的检验才是真正的合格。

虽然我们一再强调计算机技术一日千里的发展,但还是有必要检讨一下其为古籍数字化所作的技术准备。

首先,网络技术的飞速发展使信息资源的共享成为可能。

几年前网络通信还是少数人的奢侈品,如今信息高速公路已经修到我们每个人的家门口,将世界连接为一个名副其实的地球村。

相关文档
最新文档