档案数字化的元数据研究

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

兰台世界2012·5月中旬

中国科学院档案馆屠跃明翟瑶

本文通过对档案数字化工作的内涵与三个层次的分析以及对档案数字化元数据功能和内容的描述,阐明了档案数字

化工作的基本要求以及元数据在其中的重要作用,并总结了档案数字化元数据的评价标准。

档案数字化元数据信息关联历史联系评价标准摘要关键词元数据在数字化工作中扮演着基础与核心的角色。档案数字化

工作者对档案数字化工作与元数据的认识,直接影响到档案数字化元数据的设计与管理,进而影响到档案数字化工作的开展与成效。将档案信息中蕴藏的历史联系在数字化工作中揭示和体现,是档案数字化工作的长远发展趋势和要求。

一、档案数字化工作的内涵与层次

档案数字化是指利用计算机等技术手段将经过鉴选、原本存储于传统载体上的档案信息进行数字化转换并加以存储、保护、检索利用的系统工程。档案数字化应以需求为导向,在信息优选的基础上,提供便于检索、共享、在线利用等服务。随着网络时代的发展与信息利用需求的日益增长,“数字遗产”已被联合国列为新的遗产种类,数字档案作为“数字遗产”的重要部分,其数字化工作已成为我国信息

化建设的重要内容。目前我国档案数字化工作大致可分为三个层次。1.以扫描为主的档案数字化。当前档案行业所开展的数字化工作大多只是以扫描为主,这种工作方式所产生的数字化成果是将档案的信息载体作了转换和备份,对方便档案利用起到了一定作用,同时更加完整准确地保证了档案信息的原始性与真实性,但它没有将档案数字化信息的元数据描述和信息之间关联的揭示重视起来。这是档案数字化工作的最低级层次。

2.提供检索利用的档案数字化。这个层次的档案数字化与图书的数字化类似。它是在扫描的基础上,以准确翔实的著录与元数据描述使得数字化成果不仅能够提供扫描文件,还能够提供一般与高级的数字检索的功能。一般应伴随一个比较成熟的档案检索与利用系统的开发与生成。这是较第一层次更高一级的层次。

3.反映档案信息之间历史联系的档案数字化。“档案的历史联系”是对文件之间客观历史关系的反映,文件之间的历史关系根源于文件与产生这些文件的社会实践之间的内在联系。档案数字化能够通过元数据设计、信息采集与挖掘,将档案实体中所蕴含的历史联系挖掘和显现出来,并提供便捷准确的利用,使档案数字化信息的利用实现实体档案的利用所达不到的效果,可谓档案信息的“深加工”。主要包括两个功能:第一,能够提供智能与模糊检索,让用户在只提供其所需信息的相关信息的情况下仍能够准确地找到所需信息;第二,能够提供关联检索,为用户呈现与其所需信息直接或间接相关的所有信息,即一个完整的内在相互关联的信息集。举一个简单的例子,某用户希望在数字化档案信息中找到某人A,但并不知道A的准确姓名,而只知道有关A的相关信息,即A是某人B的同事C,那么这个用户通过B或C的名字便能够检索出A的姓名,同理,当用户提供A的姓名时,能够找到与A相关的所有信息,并且这些信息并不一定都存在于原纸质目录信息中。因此,在这个数字化成果中找到的不是一个单一的文件,而应该是一整套相关的文件,能够反映一个完整的历史主题。要真正充分地挖掘蕴藏在档案中潜在的信息关联,需要对档案目录乃至档案内容进行信息的鉴定、抽取、筛选、关联,这是个复杂而庞大的工程,需要编制专门的元数据工具并建立智能的网络和检索系统,它是建立在第一、二层次上的最高层次。

二、档案数字化元数据的功能与基本内容

1.档案数字化元数据的功能。元数据是关于数据的数据,其主要功能是描述数据与数据环境。档案数字化元数据可以看做档案数字化工作的标准化框架,用来描述和表征数字档案信息资源的基本特征,对数字档案信息进行定位和管理并为用户提供获取的线索。其应具备以下功能:(1)建立档案数字化资源和数字化过程的控制机制;

(2)检索与利用档案数字化资源;(3)管理档案数字化资源。2.档案数字化元数据的基本内容。总结各类信息元数据的一般特征,

档案数字化元数据可包括以下内容:(1)内容元数据。主要描述档案资源的内容特征,包括题名、文摘、定义、主题词或关键词等,是元数据体系的必备组成部分。(2)责任元数据。也可称为“机构人员元数据”,对它的描述非常重要,因为它关系到档案信息的知识产权法律状态、凭证效力或政策效力。为了确保档案信息描述的准确、真实与可靠性,需要对各类相关的责任者进行尽可能详细的描述和反映。(3)表达元数据。所谓档案信息的表达,是指关于档案信息资源的数据结构、数据类型、文本格式、载体形态、文种与语言等的不同形式。为保证档案信息资源长期可获取性,需要对表达元数据进行尽可能详尽的描述。(4)获取元数据。是指用户在获取档案信息时所可能遇到的获取途径、信息来源、使用权限等问题,比如密级、隐私权与版权、阅读所需硬软件条件等。为帮助用户有效地获取资源,提高档案信息的利用效益,需要对这类元数据进行描述。(5)关系元数据。这是档案数字化元数据中最具特点的元数据,是描述主要或重点内容信息之间相互关联和参照关系的元数据,包括关联的信息范围、信息类别、关联类型等,为用户提供在复杂信息中寻找关联信息的功能。(6)管理元数据。为了使档案资源得到长期保存,保证其原始记录性并对信息价值进行评价,需要对信息的使用、备份、升级、更新维护等管理活动进行记录,这实质上是对档案信息管理属性进行描述。

三、档案数字化元数据的评价标准

档案馆本身的组织目标与发展方向以及服务理念与模式会影响馆藏档案数字化资源的功能设计,档案数字化元数据的设计思想体

现不同的档案属性,研发元数据必须首先针对馆藏档案特性进行分析。但无论怎样设计数字化元数据,都必须使得数字化档案达到基本的要求和具备基本的功能。

1.符合数字化档案长久保存的基本要求。数字化档案长久保存需要利用元数据来保障和实现,即描述和记录管理信息资源长期保存的信息的保存元数据,包括有关格式结构和信息内容的使用,操作

ANQUANBAOZHANG

60

兰台世界2012·5月中旬

中国医科大学赵丽清

对城乡社区居民健康档案管理现状及水平进行调查与分析,探索与构建城乡社区居民健康档案科学化管理工作方法。

城乡社区居民健康档案管理还存在很多不足,建议采取措施,加强管理,提高水平。

社区居民健康档案档案管理摘要关键词一、背景及调研概述

建立城乡社区居民健康档案,跟踪城乡社区居民健康状况,是促进城乡社区居民身体健康的重要抓手。全国第四次卫生服务调查结果显示,2008年全国慢性病总病例数达到2.6个亿。专家预测到2020年,慢性病死亡比例将上升到85%[1]。实践证明,有效的健康服务管理是降低慢性病死亡率和国家医药费支出的有效手段,是各级政府及卫生行政部门制定政策的参考依据。

为推进城乡社区居民健康档案管理,卫生部制定了工作目标,到2011年底,居民建档率农村要达到30%,城市要达到50%。到2020年,初步建立起覆盖城乡科学规范的居民健康档案,更好地为城乡居民提供基本医疗服务[2]。就此,

卫生部出台了《城乡居民健康档案服务规范》、《城乡居民健康档案基本数据集标准》等一系列制度规范,推动了健康档案工作深入发展。为进一步了解我省城乡社区居民健康档案管理现状,研究其管理水平,促进其健康发展,2012年初,笔者随辽宁省卫生厅组织的调研组,深入辽宁省的沈阳、大连、鞍山和盘锦四个城市,即我省城乡基层医疗卫生机构新医改的试点城市,每个城市抽取四家城乡社区卫生服务站,开展居民健康档案管理情况调研。

二、我省城乡社区居民健康档案管理现状与水平

根据2011年全国第六次人口普查显示,辽宁省总人口4375万人,其中,城镇人口占62.10%;乡村人口占37.90%[3]。调研的4个城市中,共有社区卫生服务站228个,乡镇卫生院320个,分别占全省53.8%和32.9%。

1.取得的成绩

(1)建档率较高。通过调研我们了解到,到2011年底,上述四个城市为城乡居民建立健康档案达60.21%,为高血压、糖尿病等慢性病居民的建档率为30.03%。沈阳市118家社区卫生服务机构承担“健康调查”任务,96家社区卫生服务站入户为每位居民建立健康

档案。其中,于洪区陵西卫生服务站,在全社区64983人口中开展健康档案管理工作。他们通过义诊、入户走访、门诊、住院患者信息记录、孕妇产前检查、儿童体检、预防接种等多种途径,在街道、派出所、防保站等部门协助下,建立健康档案61146份,建档率达94.1%;其中,高血压人数11400,建档率31.7%;糖尿病人数3409,

建档率56.38%;残疾人数642,建档率98.13%。

(2)内容丰富。居民健康档案主要由个人基本信息表、健康体检表、接诊记录表、居民健康档案信息卡等组成[4]。个人基本信息除了有居民个人血压、血糖、身高、体重等信息外,还有既往病史、遗传病史、生活习惯(抽烟、喝酒)、家庭成员等记录。对18岁以上的糖尿病、高血压、精神病以及残疾人、孕产妇、儿童等有特殊的健康档案。还有卫生服务站人员对糖尿病、高血压等慢性病居民合理用药指导记

录,有为孩子预防接种、孕产妇定期检查提醒记录。(3)分类管理。健康档案分为儿童保健、妇女保健、疾病控制和医疗服务等档案。这些卫生服务站将若干份健康档案进行有机的分类,管理规范。其中,儿童保健档案含有出生登记、新生儿疾病筛查、儿童健康体检、体弱儿童管理等;妇女保健档案含有婚前保健服务、妇女病普查、孕产期保健服务、产前筛查等;疾病控制档案含有预防接种、传染病报告、结核病防治、艾滋病综合防治、职业病报告等;疾病管理档案含有高血压病、糖尿病、肿瘤、精神病等管理记录;医疗

服务档案含有门诊及住院的诊断与治疗、健康体检资料等。(4)有数据分析。我们在调研中发现,四个不同城市的16家卫生服务站都有资料分析记录。儿童计划免疫“四苗”接种率,2009年至2010年13个社区卫生服务站的1—6岁儿童脊灰疫苗、百白破历史记录,有关责任和产权信息等,同时,相关发现和定位信息的描述型元数据和帮助数字内容当前存取利用的技术元数据也应符合数字化档案长久保存的基本要求,即要保证数字化档案的真实性和可靠性。可理解为两个方面:第一,并非所有的数字化信息都是真实与正确的,而是与档案实体信息保持一致;第二,数字化档案本身和产生过程是按计划和要求创建的,且在创建并得到确认之后未被作任何改动。在此基础上,还有一些诸如完整性、可操作性、可理解性、潜在的可利用性等也应该受到重视。

2.实现和确保数字化档案检索与利用。元数据能够描述档案信息或数据本身的特性,对提高搜索效果起到巨大的作用,元数据的设计和实现是档案资源管理与组织的核心问题,也是用户获取档案信息、获得档案信息服务、实现信息共享的重要工具。

3.展现档案信息的关联性。档案信息之间存在着千丝万缕的联

系,档案历史联系的记录功能就是将文件按照其内在联系串联成历史,记录一个历史事件的全过程,这是档案所特有的属性。正如怀特所说:“档案的实质在于:它不仅记录了成就,而且记录了获得成就的过程。”因此,能够体现档案信息历史联系的档案数字化才是真正意义的档案数字化。将档案信息之间的历史联系挖掘和抽取,进行信息关联性分析,建立关系元数据,是元数据设计体系的重要部分,是揭示档案信息,实现智能检索的最高层次,也是知识时代档案信息服务

工作的长远要求。

参考文献

[1]张正强.论电子文件长久保存基本要求体系的建立[J].中国档案,2010(3).[2]王健.关于档案数字化优化模式的探讨[J].档案学通讯,2007(1).[3]王芳.数字档案馆学[M].北京:中国人民大学出版社,2010.11.[4]陈令.档案元数据标准分析[J].湖北档案,2008(4).

[5]连天奎.对藏书数字化元数据进行评估的因素与条件[J].河南图书馆学刊,2008(2).★作者屠跃明为中国科学院档案馆馆长,研究员;翟瑶为中国科学院档案馆馆员,档案学硕士。

………………………………………………………………………………………………………………………………………………………

ANQUANBAOZHANG

61

相关文档
最新文档