古籍数字化加工技术解决方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
附件:地方资料数字化加工处理招标及技术要求
•投标供应商资质要求
1、投标供应商注册资金在50万兀以上。
2、投标供应商应提供至少两个从业人员资格证明文件。
通过对项目加工要求的仔细分析,本次地方资料数字化加工的内容主要为地方资
料图书进行扫描加工,完成的数据应用于数字图书馆平台发布,具体详细实施方案如
下:
12.1生产流程
对图书馆地方资料进行数字化加工,其加工流程如下:
书书书书书书书书书书书书书书书书书
数据验收和交付
一、数据内部验收
二、数据备份
三、数据交付和验收
四、资料归还和移交
五、备份移交
工程后期服务
一、项目总结和报告
二、各类文档提交
三、方案建议
四、服务和维护阶段
地方资料数据加工工艺流程
根据地方资料文件全文转换及版式还原的技术要求和工作特点制定如下工
作流程:
古籍整理扫描
一、清单核对
二、扫描加工
三、图像质量检测
四、加工分类
五、交接信息记录
图像处理
一、去污
二、纠斜
三、清晰度
四、尺寸
图像版面分析
一、文字图像版面分析
二、插图版面分析
三、纹饰版面分析
成品数据提交
一、图像文件
二、造字列表
三、单层矢量PDF
四、XMI文件
五、IDS描述文件
六、古籍清单
七、认同字列表
单页图像TIFF文件
插图TIFF文件
全文识别和编改
一、图表信息处理
二、标引信息著录
三、认同字记录
四、IDS信息描述
五、贴图处理
XML制作单层矢量
PDF合成打版
•地方资料数字化加工技术解决方案
工程规划和预处理
一、分析理解加工要求
二、配置流水工艺
三、制定加工环节质量控制标准
四、建立数据规范、配置标引数据库
过程管理
一、项目进度管理
二、信息安全管理
三、过程改进和工艺配置
四、数据核算管理
五、项目通报
12.2地方资料数字化加工数据标准
1221 图像
序号制作标准
1全部页面扫描成300DPI的彩色TIF图像
2图像清晰,版心居中,无视觉倾斜,无污点,无颜色失真现象。3图像版心大小统一,图像尺寸相同,图像完整无缺损。
4图片分页问题按实际页展现。
1222 MARC文件包含有元数据项目的图书索引信息,正确率须达到100%
12.2.3 PDF文件
序号制作标准
1在PDF还原过程中,对原书版式进行一定的统一和规范处理,包括对鱼尾、版框、版心和书口的处理按照原书还原。
2所有版面文字均用宋体字还原,文字的颜色一律为黑色。文字的位置按原书还原。双行小字和多行小字按原书版式和比例还原。
3版面插图、牌记、印章、草书和行草序按照图片处理,信息必须在XML文件中体现。
4贴字图均为二值图像,按原书位置做贴图处理,PDF文件米用100%显示比例时,贴字图与其他文字大小相当,对贴字图中的文字进行IDS描述。
1224技术元数据标准
针对需进行加工的纸质地方资料原始资料,建立基本属性对应的著录项目, 并生成基本地方资料附属信息、目次信息等规范数据,同时为规范数据建立相应的代码识别体系,该代码识别体系将贯穿整个工程的信息交换和数据交换,避免出现信息和数据不一致的情况。结合计算元数据标准并通过智能检测模块可以有效的避免在数字化过程中可能出现的漏扫、重扫等情况。
针对需进行加工的地方资料,建立基本属性对应的著录项目,并生成规范数据,为各规范数据建立相应的代码识别体系,同时建立辅助信息标引库。本次加工的地方资料图书所需著录的字段如下表:
图书必备检索字段----
书名
B 责任者
C版本类型D出版责任
E、出版时间
F、版本形式G所属丛书H卷数
I、卷次
12.2.5 工程信息库
通过对地方资料纸质资料和文档进行归类整理,在技术元数据标准基础上, 根据工程各环节所需要公用的基础信息,将地方资料的基础著录项目抽取成为资料内部特征,建立信息标引配置数据库和相关流水线工艺文档,制定项目评价标准和环节控制标准等。
工程信息库与方正业务流程管理系统挂接,工程信息库在整个工程实施中会围绕基础信息,随着数据流转不断增加相关的信息,通过方正业务流程管理系统,可以实时的掌握每一批次、每本地方资料的生产进展和所处的生产环节, 也能掌握到数据的状态、收发时间、生产责任人等相关信息。
1226管理元数据标准
12.3数字化工程管理、资料管理和工程信息预处理
为保障地方资料数字化加工过程的有效性,成立工程管理部门。该部门按照地方资料数字化工程的需求,全面负责具体工程的实施,包括生产工艺调整, 工程调度,组织具体的数字化及标引著录等生产工作,进行环节控制,数据合成和测试,以及最终数据的提交。
全面负责工程进度和质量、考核和评价环节衔接、协调衔接问题,帮助环节内部整理影响进度和质量的因素,并出具各种进度和质量报告。
建立整体工程的信息库,为整个生产流水线提供生产任务规划。在工程完毕之后,负责回收原始资料并进行整理归还。
对原始资料进行归类整理,并按图书地方资料的书名、书号、作者、版别、出版时间、版次、页数、加工后文件夹名等著录项目的要求抽取资料内部特征建立信息标引配置数据库和相关流水线工艺文档,制定项目评价标准和环节控制标准等。
加工前的准备:
12.3.1 地方资料整理
由方正项目经理和用户方指定人员进行地方资料/ 卷的领用、归还交接工作。地方