档案文献遗产知识管理模型构建研究——以韩国钧《朋僚函札》为例
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
48
档案与建设
ARCHIVES & CONSTRUCTION
2023年 第12期
档案文献遗产知识管理模型构建研究
——以韩国钧《朋僚函札》为例
邵澍赟
(江苏省档案馆,江苏南京,210019)
摘 要:档案文献遗产对触发大众深层文化认同、推进文化自信自强有重要价值。
当前档案文献遗产知识管理与开发利用需求日益显著,文章探究基于本体的档案文献遗产资源知识管理模型,以江苏省档案馆收藏的韩国钧《朋僚函札》档案文献为例,结合资源特征阐述本体构建过程与设计原则,希望在文献资源要素特征分析、本体类和属性确定、关联关系定义、知识发现等环节为档案文献遗产知识管理提供参考。
关键词:档案文献遗产;本体;知识组织;数字资源
档
案文献遗产反映一个国家、民族的群体记忆,通过一定历史、文化、艺术、科学、技术或社会价值的真实记录[1]引发社会公众深层次的文化认同。
当前社会对档案文献遗产资源的研究需求、文化需求日益显著,《“十四五”全国档案事业发展规划》提出,实施档案文献遗产影响力提升工程,实施中国档案文献
遗产宣传推广计划。
[2]
伴随档案文献遗产数字化程度逐步提升,数字人文与知识组织等理论重塑了档案文献遗产资源开发利用形态,关注技术要素在档案资源基本属性表达与深化方面的实践效用、探究基于文化传承保护的档案文献遗产资源知识管理具有现实与理论意义。
本文以江苏省档案馆收藏的韩国钧《朋僚函札》档案文献为例,试图为构建档案文献遗产知识管理模型提出一种参考方案。
本体可以规范化、抽象化描述档案文献遗产知识资源,通过概念及概念间的关系实现逻辑推理和语义关联,为档案文献遗产知识管理智能化提供了新契机。
在档案文献遗产相关领域,当前国内外对其数据化开发、信息采集与保护、元数据设计与应用[3-5]等较为关注并展开研究,清代文官官制档案文献[6]、南侨机工档案文献遗产[7]等应用案例也逐渐丰富,但整体上在档案文献遗产知识管理的系统性、内容描述的关联性方面还有较大的拓展空间。
一、 韩国钧《朋僚函札》档案文献本体
1. 基本情况介绍
韩国钧《朋僚函札》系1915—1937 年间韩国钧与康有为、梁启超、黄炎培、张謇等700余人交往的信函。
共计57册,3600余件,现藏于江苏省档案馆,2003年入选《中国档案文献遗产名录》。
该档案文献涉及的地域范围广泛,主题内容丰富,除江苏外,还涉及浙江、福建、上海等地乃至全国的政治、经济、军事、文化等多方面的史实与重要历史人物,是深入研究二十世纪初江苏及中国历史、相关历史名人的第一手原始史料,具有重要的学术和历史价值。
2. 本体构建介绍本研究探讨的韩国钧《朋僚函札》本体在明确档案文献涉及的人物、事件、地区、时间概念和特征基础上,分析其数字资源要素,深入知识单元层面精细化描述资源特征,解构知识对象属性,希望通过对韩国钧《朋僚函札》档案文献的精细化语义揭示,拓展《朋僚函札》数字资源个性化知识关联,同时展现文献的实物数字化成果、面向档案检索利用服务,为推进档案文献遗产知识组织体系、构建知识管理模型提供参考。
一方面,细粒度展示二十世纪初中国从清王朝专制统治向共和制度过渡、北洋军阀政权交替、国民政府北伐、东西方文化冲突、日本帝国主义侵略等重大历史;另一方面,关注这些典型的中国传统纸质书信档案内容,对相关历史事件与历史人物展开资源层面的细节描述与分析,深入挖掘其背后的信息元素关联。
对于跟档案文献遗产实体、数字资源管理相关的业务活动与遗产项目信息,同时纳入本体构建范围。
3. 韩国钧《朋僚函札》档案资源要素特征分析(1)人物内容。
社交互动是人的社会属性的重要
表现形式,书信作为人际交往的产物反映人作为社会存在形成的一系列社会关系。
韩国钧,江苏泰县海安镇(今江苏海安)人,民国政要,爱国民主人士。
北洋政府时期曾任江苏省省长,晚年任抗日民主政权苏北临时参政会名誉议长。
韩国钧《朋僚函札》较为系统、完整地反映了韩国钧与当时政权核心至地方各类历史人物的关系,涉及众多历史名人和政界要人。
《朋僚函札》围绕韩国钧人物实践活动而形成,内容体现突出的人物要素,因而本体中定义“人物”类加以概括,描述相关人物以及他们之间存在的关系。
(2)事件内容。
《朋僚函札》对于中国近现代史上的一些重大事件,如府院之争、对德绝交案、贿选总统、第二次直奉战争、北京政变、江浙战争、浙奉战争、苏浙战争等均有涉及,对江苏运河海塘工程、黄灾救赈、江苏泰源盐垦公司等方面的情况也有所记述。
根据描述的事件内容要素确定“事件”类,目的在于帮助相关研究人员与机构精确定位、准确考证相关历史原貌与具体细节,同时引导社会公众了解具有重要影响力的历史事件。
(3)地区、时间内容。
《朋僚函札》档案资源呈现时间上的流变和区域的动态转换,关注其在时空维度上的变化,由此更准确真实地反映历史事实。
该档案文献记述和反映了1915—1937年前后23年时间段,其中又存在着大量的点性和线性时间信息,通过时间要素梳理可以帮助公众明晰历史脉络。
而在地区维度上,跨区域覆盖江苏、浙江、上海、安徽、福建等多地,蕴含大量的地理位置信息,描述“地区”“时间”类用以体现档案文献资源内容的时空演变过程。
(4)实物数字资源。
《朋僚函札》全部为寄信人用毛笔撰写的手工书信,集中了同一历史时期众多历史名人和书法名家信函,具有极高的书法欣赏价值与文物价值。
其稀有性、原始性和唯一性也是其他史料不可替代的,体现出《朋僚函札》档案文献作为中国档案文献遗产的重要意义和宝贵价值,目前江苏省档案馆已完成实物文献资源数字化。
“实物数字资源”类与人物、事件、时空等内容特征类共同构成互相联系的档案文献遗产本体有机整体。
(5)档案管理信息。
《中国档案文献遗产名录》将珍贵档案文献以名录的形式向社会公布,推动珍贵档案文献的保护和宣传,韩国钧《朋僚函札》入选第二批中国档案文献遗产。
档案文献遗产入藏后涉及收管存用等一系列档案业务活动。
提炼《朋僚函札》档案文献遗产管理的业务行为,包括确定的归档专题、全宗号、案卷号、件号、责任者、立卷日期、密级等。
通过
对文献遗产资源管理层面的描述关联档案管理信息。
4. 韩国钧《朋僚函札》本体类及属性
韩国钧《朋僚函札》本体既具有档案文献遗产本体的共性,又具备历史特征的个性,根据七步法本体构建规则,比较相关领域本体,可以结合档案文献遗产特点进行一定程度的复用。
CIDOC CRM(CIDOC Conceptual Reference Model,概念参考模型)[8]常用于文化遗产领域,提供了一个将文化遗产信息源与相关人物、时间、地区等链接的背景框架,其中的“actor”“time-span”“place”类等适用于《朋僚函札》档案文献遗产本体原始资源特征。
结合涉及的人物、事件、时间、地区等类型,本研究参考FOAF、Event、GeoNames本体并对部分属性进行了自定义扩展。
同时为描述档案文献遗产保管情况,根据《档案著录规则》及《朋僚函札》档案文献管理信息将其分别明确为一类。
定义六个一级类目及其数据属性,见表1。
其中人物类描述与韩国钧《朋僚函札》相关的参与主体;事件类描述《朋僚函札》提及的具体史实;地区类描述《朋僚函札》涉及的地理位置;由于《朋僚函札》作为信件的特殊属性,时间类描述定义撰写信函时间与其内容关联时间;实物数字资源类描述文献遗产数字化情况;档案管理信息类描述文献遗产管理信息。
通过对象属性建立类间关联关系,从而使知识单元从点性信息向网络化转变。
结合对韩国钧《朋僚函札》文本分析与内容分解,确定本体对象属性主要包括内容情境关系、资源与内容关系。
其中内容情境关系包括“参与”“涉及”“发生”等,资源与内容关系包括“具有”“所属”等。
二、 韩国钧《朋僚函札》档案文献知识关联
根据韩国钧《朋僚函札》档案文献本体类与属性提取元数据元素填充实例并进行语义关联,实现对资
表1 韩国钧《朋僚函札》本体类及数据属性
49
2023年 第12期
50
档案与建设
ARCHIVES & CONSTRUCTION
2023年 第12期
源的描述、组织、存储与知识管理,这也成为档案文献
遗产资源智能化利用服务的前提。
知识关联情境下
要坚持全面性与适用性原则。
全面性指覆盖《朋僚函
札》资源信息的全部内容,保持知识完整性、数据对象
关联性和形式一致性;适用性指关联结构和目标要符
合当前档案文献遗产资源的研究需求和文化需求,设
计关联对象时对数量的选择要适度。
以人物类为例,元数据包含韩国钧在履官、乡居
期间交往的名流贤达、同僚属吏以及故旧知交,有黄
炎培、陶行知、史量才、曾朴、冷遹、张謇、张一麐、冯
国璋、齐燮元、赵尔巽、卢殿虎、陈陶遗等。
事件类元
数据记录了当时政治、经济、军事、实业、税赋、水利、教育、艺术等领域不同侧面、不同程度的情况。
由于
所涉元数据资源量多庞杂,层次多元,数据间存在隐
性关联,总体上呈现出复杂的网络系统特征。
1998年,
Hearn 等最早提出知识超网络的概念[9],知识超网络
多维、多级、多属性的特征与韩国钧《朋僚函札》档案
文献遗产本体资源多层级、多数据的特征相契合,能
将显性数据关联,隐性关系显化,所以可结合知识超
网络理论进行《朋僚函札》知识资源
整合。
六个本体类关联形成具有复杂
联系的知识网络:一是人物事件关联,主要指同一人物与不同事件的关联,比如史量才致韩国钧函,“涉
及”事件包括“江浙战争才平”“北京政潮突起”等。
二是事件时间关联,主要指函述不同历史事件的开
始时间与结束时间范围,以及致函
发生时间的关联。
仍以史量才致韩
国钧函为例,“发生”时间即“1924
年10月25日”。
三是事件地区关联,指文献中不同事件涉及的不同
地区。
四是人物事件和文献属性关
联,指不同人物事件与其所属的信函档案管理和具有的数字化信息的关联。
三、 韩国钧《朋僚函札》档案文献知识管理模型
本体构建完成了对韩国钧《朋僚函札》档案文献遗产资源的知识抽取与知识建模,知识关联实现了分散异构的档案文献信息整合与共享,
最终目的是要实现档案文献遗产资源知识利用。
在保持原有档案文献信息独立性的前提下,本研究尝试构建韩国钧《朋僚函札》档案文献遗产知识管理模型,分为数据资源模块、知识处理模块、语义关联模块和应用服务模块,见图1。
数据资源模块主要是对韩国钧《朋僚函札》档案文献的基础数据进行采集和存储。
由于该文献遗产载体、所处年代的特殊性以及其撰写主体、书写方式各异,造成数据资料提取存在一定难度。
尤其当涉及的信函实物存在字迹难以辨认或表达模糊时,需要从多方渠道努力,参考相关档案说明、编研成果和学术文献,
并结合领域专家访谈的方式,补全相关知识信息。
因而数据预处理尤为关键,要反映正确真实的历史信息。
知识处理模块进行知识清洗、抽取与校对,将收集到的信息转化为结构化数据,形成细粒度的知识单元,建立韩国钧《朋僚函札》档案文献遗产资源数据库。
通过自动化工具结合人工核校对基础数据进行整理,完成人物、事件、地区、时间、实物数字资源、档案图1 韩国钧《朋僚函札》档案文献遗产知识管理模型
语义关联模块知识处理模块
应用服务模块
数据资源模块档案文献遗产知识发现
档案文献遗产知识检索
档案文献遗产知识共享档案文献遗产知识图谱社会大众
专业用户
知识管理平台
韩
国钧《朋僚函札》档案文献遗产
结构化数据
韩国钧《朋僚函札》档案文献遗产资源数据库档案管理信息
地区
知识清洗人物事件时间实物数字资源数据校对
知识整合韩国钧《朋僚函札》档案文献遗产本体
自建复用资源内容
韩国钧《朋僚函札》档案文献遗产知识网络
关联链接
语义揭示
资源管理目标
韩国钧《朋僚函札》档案文献遗产文
献数
据
采
集
文献数据存储文献内容抽取载体年代
撰写主体书写方式
51
2023年 第12期
管理信息抽取和冗余信息合并,将其转换为可用于分
析和关联的数据,形成概念与特征的有序、语义化组
织。
分析比较可复用的常用本体构建类和属性,便于
后续知识关联。
语义关联模块将分散的数据资源整合成关联开放
的韩国钧《朋僚函札》档案文献遗产知识网络,拓展
有价值的语义连接,关联范围包括资源内容关联和资源管理关联。
定义人物、事件、文献等的关联关系,解
决了抽取的基础数据平面化、缺少逻辑层次的问题,利用各类关系规则设置,将无序、独立的档案文献遗
产知识单元转化为立体、多元的知识组织模式,加深
对《朋僚函札》的知识挖掘与知识增值,同时体现档
案文献遗产管理、保存等活动。
应用服务模块可以面向用户提供优质高效的档案
文献遗产知识检索、共享、可视化浏览等服务。
《朋僚
函札》研究者、机构或社会公众能够结合本身需求选
择粗粒度或细粒度的知识获取方式,既能完成对《朋
僚函札》档案文献遗产的总体知识概况浏览,也能实
现对其涉及的某一人物、历史事件等具体知识点的信
息获取,或通过关联联系实现知识查询,完整了解相
关知识,如历史事件起因、经过、结果等。
四、 研究价值与意义
1. 实现韩国钧《朋僚函札》档案文献遗产知识管
理应用
引入本体的方法实现韩国钧《朋僚函札》档案文
献遗产知识管理,对资源内容属性与管理特征进行揭示,构建的《朋僚函札》本体为后续档案专题利用与
知识发现打下基础,对于《朋僚函札》档案文献遗产
知识共享与开发有促进作用。
如通过黄炎培致韩国钧
函知识检索,可关联人物韩国钧、黄炎培、章太炎,地点江苏、上海,事件卷烟税变化、教育费减少、上海水电事纠纷,时间1924年12月3日等,相关人物生平、事件发展经过等可依据需求拓展呈现,亦可查阅原函
保存情况或数字化附件。
通过资源数字存储与知识管
理,充分展示《朋僚函札》档案文献资源价值,助力档
案文献遗产数字化保护与传承。
2. 提供了档案文献遗产知识管理通用模型
本研究以韩国钧《朋僚函札》为样本,知识提取、
本体建模、知识关联、知识服务的具体策略可以为档案文献遗产知识管理提供参考。
展示了设计档案文献遗产本体的具体过程,在文献资源选择分析、元数据收集、类和属性确定、关联关系定义等环节有一定共识性,提出的人物、事件、地区、时间的内容特征和实
物数字资源、档案管理信息的管理特征可供同类档案文献遗产资源本体在一定程度上复用,搭建突出内容聚合的档案文献遗产知识管理框架模型,最终满足档案管理的数字化、信息化、标准化要求。
3. 推动档案文献遗产知识化智能化服务档案文献遗产本体的构建能够打破档案数字资源“孤岛”,实现数字档案资源之间的知识关联,体现知识检索、推理与发现的价值。
通过推理可以实现档案文献遗产信息的知识聚合,
从而完成更加深入的逻辑验证与知识发现。
通过知识化智能化服务给档案利用带来更好的用户体验,面向用户展示的不再仅仅是原始的档案文件或数字件,而是可视化、可组织、可拓展的档案知识,利用者能够根据自身兴趣或需求自主选择延展想要了解的知识信息,完成档案资源共享,这也有助于进一步提升档案服务满意度,发挥档案文献遗产讲述历史、传承文明的意义。
当然,本研究过程中尚存在一些不足之处,后续将不断完善本体的修订补充以及提高知识管理模型的系统成熟度,以期更好地服务于档案文献遗产知
识管理。
注释与参考文献
[1]徐拥军.推进档案文献遗产工程建设与研究[J].档案学刊,2022(6):4.[2]中办国办印发《“十四五”全国档案事业发展规划》[EB/OL].
[2023-08-25]. https:///daj/toutiao/202106/ecca2de5bce44a0eb55c890762868683.shtml.
[3]黄霄羽,高艳.档案文献遗产数据化开发的国外典型
案例及启示——以荷兰GLOBALISE项目为例[J].中国档案,
2023(9):67-69.
[4]周耀林,吴化.数字人文视野下少数民族档案文献遗产数字化保护研究[J].档案学研究,2022(5):123-129. [5]牛力,黄赖华,贾君枝,等.本体驱动的档案文献遗产元
数据设计与应用研究——以苏州丝绸档案为例[J].信息资源管理学报,2023(5):15-31.[6]宋雪雁,张伟民,邢阁,等.清代档案文献知识重组研究——以清代文官官制为例[J].图书情报工作,2023(20): 4-14.
[7]华林,张继蓉,李婧楠.南侨机工档案文献遗产新媒体
开发研究[J].档案与建设,2019(6):27-30.
[8]Version7.1.1 of the CIDOC-CRM[EB/OL].[2023-06-23].https:///version/version-7.1.1.[9]GREG H, DAVID S. Students Staying home: Questioning the wisdom of a digital future for Australian universities[J].Futures,
1998,30(7):731-737.。