数字档案系统通用标准接口规范
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
数字档案管理系统外部系统通用接口规范说明
目录
1业务系统电子文件归档法律规范与要求 (2)
2技术架构 (3)
3接口规范要求说明 (4)
4功能调用 (4)
4.1上传归档文件 (4)
4.1.1归档目录文件的文件夹结构 (4)
4.1.2归档电子文件的文件夹结构 (5)
4.2归档状态 (6)
4.3元数据描述规范 (7)
5档案数据交换标准接口运行过程描述 (11)
6XML标准案卷信息表字段列表 (12)
7XML标准元数据表字段列表 (12)
8XML标准电子原文表字段列表 (13)
1业务系统电子文件归档法律规范与要求根据国家档案局发布法律法规文件要求,在《企业数字档案馆(室)建设指南》和《企业电子文件归档和电子档案管理指南》两个文件中明确提出企业在业务系统建设时应充分考虑电子文件归档要求。
归档接口应与业务系统同设计、同开发、同测试和同实施,实施时未开发归档接口的业务系统应及时通过二次开发实现。
企业已实施的支撑主营业务的信息系统均应具有归档功能,导出的归档电子文件存储格式、元数据等均应符合电子文件归档和电子档案管理的有关要求。
企业电子文件归档范围应包括各业务活动中形成的各种结构化和非结构化数据,以独立文档形式存储的具有保存价值的信息记录,包括办公自动化系统、产品或业务系统、财务会计管理信息系统、人力资源管理信息系统、门户网站、微博、微信、公务邮件系统及本企业其他职能活动业务系统中形成的电子文件,以及从外部接收的电子文件。
企业有些信息系统有可能通过租用基础设施或以云计算服务的形式存在,所形成的电子文件不一定存在于本企业的服务器中,但其产生的电子文件也应纳入本企业文件材料归档范围予以归档。
数字档案馆系统建设时充分考虑未来业务需求及系统可扩展性,避免每新上业务系统要求实现电子文件归档时档案系统平台都要作相应的开发及调整,档案系统与业务系统集成采用建立档案数据交换标准接口的方式,以提供良好的可扩展性、可重用性、可维护性和可
管理性。
2技术架构
(1) 档案系统与业务系统集成采用建立档案数据交换标准接口的方式,以提供良好的可扩展性、可重用性、可维护性和可管理性。
(2) 档案数据交换标准接口提供与外围业务系统的接口规范、统一模型、数据交换格式定义等。
(3) 业务系统主动将数据上传到档案服务器,即采用推的方式将包含了元数据和电子原文的档案数据主动推送给档案系统。
(4) 档案系统对业务系统推送过来的档案数据不做二次加工,保证档案数据的准确性和原始性。
(5) 档案数据交换标准接口的日志与监测通过档案系统消息模块统一实现。
3接口规范要求说明
档案系统通用标准接口定义了业务系统归档数据包标准,按照此标准由前端业务系统开发把需要归档的数据和电子文件打包推送到档案系统中间平台,归档数据表都以目录(XML格式)+电子文件(PDF格式)形式推送,每个文件都有相应的描述目录信息、电子文件属性信息,同时电子文件作为目录的附件推送。
要求:目录信息要求XML格式,电子文件要求PDF格式。
4功能调用
4.1上传归档文件
归档文件包采用FTP方式上传至档案服务器的指定目录,业务系统每个批次的归档文件集中在一个文件夹中上传。
文件夹结构下:4.1.1归档目录文件的文件夹结构
|-ArchiveData
|-20130328abc
|-data.xml
|-flag.txt
➢其中“ArchiveData”为FTP的根目录。
➢20130328abc为批号,由业务系统生成,数据长度不超过128.每个批次的归档文件夹的批号应唯一。
➢data.xml为归档文件属性信息的描述文件,详细见第4、5、6部分《案卷信息描述规范》《元数据描述规范》《电子原文描述规范》。
➢flag.txt为上传状态标记文件,归档接口使用此文件中的数据来判定FTP上传是否结束。
业务系统在完成上传后,应将此文件中的内容置为1.(0:未结束;1:上传已结束;2归档已正常结束;3归档已失败结束)。
4.1.2归档电子文件的文件夹结构
|-ArchiveData
|-20130328abc
|-2013032801efg
|-招标基础信息表.doc
|-审批记录.doc
|-中标通知书.doc
➢其中“ArchiveData”为FTP的根目录。
➢20130328abc为批号,由业务系统生成,数据长度不超过128.每个批次的归档文件夹的批号应唯一。
➢2013032801efg为该文件夹下的文件对应的归档目录的主键。
➢招标基础信息表.doc、审批记录.doc和中标通知书.doc为需要归档的电子文件,具体内容以实际情况为准。
4.2归档状态
归档状态的文件由本接口程序产生,业务人员可读取状态文件来确定文件是否已归档。
当完成上传后,档案系统的归档接口会以一定的时间间隔来轮询出来归档文件夹(轮询时间视配置而定),当接口程序开始处理归档文件时,会将结果输出到指定的结果文件夹中,如下面的文件结构:
|-Results
|-20130328abc.status.txt
|-20130328abc.error.txt
在结果文件夹中会以【批号】+“.status.txt”为文件名来生成状态文件,如果有错误信息会以【批号】+“.error.txt”为文件名来生成错误信息文件。
以下为状态文件的例子:
BatchNumber=20100701abc
BatchStatus=1
UpdateTime=2010年7月2日14:23:05
➢BatchNumber 为此批处理的批号
➢BatchStatus 为本批处理的状态(1:已经上传至档案系统;2:处理出错)
➢UpdateTime 为此状态文件最后一次更新的时间
错误信息文件中以可读的字符串形式简要列出出错信息。
批次状态和归档文件状态关系说明:当批次中所有的归档文件都
已处于“已经归档”状态时,批次的状态为“已经上传至档案系统”。
归档成功后,回写该批次中flag.txt的标志:2为归档成功,3位归档失败。
说明:2.1中上传的归档文件是由业务系统接口产生的
2.2中的状态文件是由档案系统接口产生的。
4.3元数据描述规范
对于data.xml格式的定义由以下的例子来说明:
按件:
<ArchiveData>-------------------------根节点
<parentNodeName>OA节点</parentNodeName>--------------根节点下面的第一层节点名称
<BatchNumber>20100701abc </BatchNumber>--------批次号
<ajxxs>
<ajxx>
<ajid>A0001<ajid>------------------案卷id
<wjlx>收文<wjlx>------------------文件类型(第二层节点名称)
<cjr>admin<cjr>------------------创建人
<ajtm>XX案卷<ajtm>------------------案卷题名
<zfs>3<zfs>------------------总份数
<bzdw>XX科<bzdw>------------------编制单位
<ztc>XX标<ztc>------------------主题词
<nd>2005<nd>------------------年度
<bzh>备注信息<bzh>------------------备注信息
<ajly>OA<ajly>------------------案卷来源,如OA、ERP、招标投标、合同
<sbwh><sbwh>------------------设备位号
<xmdh><xmdh>------------------项目代号
<ysh>2<ysh>------------------页数
<jcr>王五<jcr>------------------移交人
<jcsj>2005/2/13<jcsj>------------------移交时间
<zrr>XX单位<zrr>------------------责任人
<ajxx>
<ajxx>
......
<ajxx>
<ajxxs>
<ysjs>
<Row>-------------------------------行节点,元数据
<ajid>A0001<ajid>------------------案卷id
<sjid>S0001</sjid >------------------数据id
<ywbz>1</ywbz >------------------原文标志
<cjr>admin</cjr >------------------创建人id
<cjrm>系统管理员</cjrm>------------------创建人名
<wjtm>测试文件</wjtm>------------------文件题名
<wjsj>2005/2/13</wjsj>-------------------文件时间
<bzdw>XX科</bzdw >------------------编制单位
<wjbh>20130808 </wjbh>----------------文件编号(合同号、招标编号、订单号等等)
<ysh>6</ysh>-------------------页数
<wjly>OA</wjly>-----------------------文件来源,如OA、ERP、招标投标、合同
<nd>2005</nd>-----------------------年度
<bgqx>永久</bgqx>-----------------------保管期限
<mj>公开</mj>-----------------------密级
<ztc>主题词</ztc>-----------------------主题词
<yjr>王五</yjr>------------------------移交人
<yjsj>2005/2/13</yjsj>------------------移交时间
<yc>3</yc>-------------------页次
<xmdh>OA-1</xmdh>-------------------项目代号
<gddw>测试单位</gddw>-------------------归档单位(移交单位)
<lzdw>测试单位</lzdw>-------------------录制单位
<lzsj></lzsj>-------------------录制时间
<zhishi></zhishi>-------------------制式
<dplx></dplx>-------------------底片类型
<zrz>XX责任单位</zrz>-------------------责任者。
请传递责任单位。
<wjlx>收文</wjlx>-----------------------文件类型(第二层节点名称)
<bzh>备注信息</bzh>-----------------------备注
<Entries>
<Entry>----------------------每一个Entry代表一个归档文件
<dzmc>oa1489563355148882.pdf</dzmc>-----------------------电子名称
<xshmc>测试文件</xshmc>-----------------------显示名称
<dzgs>pdf</dzgs>-----------------------电子格式
<dzdx>20</dzdx>-----------------------电子大小
<dzly>OA</dzly>-----------------------电子来源
<ysh>2</ysh>-----------------------页数
<ywid>oa1489563355148882</ywid>-----------------------电子名称
<cjr>admin</cjr>-----------------------创建人
<zkd>200</zkd>-----------------------帧宽度(单位像素)
<zgd>378</zgd>-----------------------帧高度(单位像素)
<sc>00:00:15.09</sc>------------------时长
<zbtl>539 kb/s</zbtl>-----------------总比特率(视频)
<wdpi>300 dots per inch</wdpi>-----------------------水平分辨率(图片)
<hdpi>300 dots per inch</hdpi>-----------------------垂直分辨率(图片)
<bhsb>NIKON D200</bhsb>-----------------------捕获设备(照相机型号)
<zsl>25 fps</zsl>-----------------------帧速率
<spbmbz>200</spbmbz>-----------------------视频编码标准
<ypbmbz>aac (HE-AAC) (mp4a / 0x6134706D)</ypbmbz>--------音频编码标准
<ypbtl>47 kb/s (default)</ypbtl>-----------------------音频采样精度
<ypcyl>44100 Hz</ypcyl>-----------------------音频采样率
<ypcyjd>fltp</ypcyjd>-----------------------音频采样精度
<ypsds>2</ypsds>-----------------------音频声道数(1单声道2立体声0无)
<sckj>yuv420p</sckj>-----------------------色彩空间
<sysj>2010/9/17 9:20:51</sysj>-----------------------摄影时间(图片)
<ywpx>1</ywpx>-----------------------原文排序
<md5>8F119D3CE2FD8CE409C51FFE065DB91B</md5>---------电子文件校验码
<cflj>12stgyufwq23143141/0EDCEB2BF935E159482576D40009C1A4/评标报告.PDF</cflj>-----------------------存放路径
</Entry>
<Entry>
......
</Entry>
</Entries>
</Row>
<Row>-------------------------------行节点
......
</Row>
<ysjs>
</ArchiveData>
XML文件实例如下:
data.xml
注:WJLY(文件来源)为必须字段,用于区分业务系统数据来源;WJLX(文件类型)为必须字段用于区分业务系统内的业务分类节点,便于数据分类显示。
非图片和音视频格式的文件无需写入蓝色标识信息
5档案数据交换标准接口运行过程描述
接口有手动执行和自动执行两种运行方式,手动执行需要人工点击执行按钮,接口会到ArchiveData文件夹遍历该文件夹下所有的flag.txt文件的内容,若flag.txt文件内容不为1,则跳过该文件夹,若flag.txt文件内容为1,则将该文件夹下的data.xml文件里的案卷数据、元数据数据和其对应的电子文件归档到档案系统,否则跳过该文件夹继续执行,直到所有文件夹遍历结束。
自动执行需要人工先设置接口轮询执行的间隔,然后点击执行启动程序,接口会到ArchiveData文件夹遍历该文件夹下所有的flag.txt 文件的内容,若flag.txt文件内容不为1,则跳过该文件夹,若flag.txt 文件内容为1,则将该文件夹下的data.xml文件里的数据和其对应的电子文件归档到档案系统,并写status.txt,如果失败跳过该文件夹并写status.txt和error.txt继续执行,直到所有文件夹遍历结束,当到达轮询时间,程序会再次执行归档操作。
归档时,除了写入data.xml中传递的值到数据库表中,还需设置系统默认值,YG_BZ_AJXX_MIDDEL设置SFSD默认为0;YG_BZ_YSJ_MIDDLE表中设置YLZSFL1默认为0,SFSD默认为0;YG_BZ_DZYW_MIDDLE表中设置SJBM为YG_BZ_YSJ_MIDDLE、CJSJ 为当前时间、GLJ为flag.txt所在的路径(/结尾),CKCS查看次数默认为0。
说明:
保存期限和密级的可用值依赖于档案系统的设定,在档案系统部
署后,会设定可用值。
业务系统接口可根据文件的保存期限和密级在XML文件中写入相应的值。
6XML标准案卷信息表字段列表
7XML标准元数据表字段列表
8XML标准电子原文表字段列表。