图书数字资源库管理
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
图书数字资源库管理
1.图书资源存储
1.1.资源分类存储
图书生产、加工、阅读、销售过程中会涉及不同格式、不同用途的数据资源,这里用七个资源库将他们分类管理,分别为原始资源库、成品库、素材库、版权库、元数据信息库、临时资源库和副本资源库。其中,前五个资源库存储各类数字资源;临时资源库存放未经处理或审核的临时文档;副本资源库存放用于在线预览查看的低精度或流媒体格式的内容副本。
(1)原始资源库:未经任何处理和转换的原始的电子内容资源,如PSD、Idd、PS等格式的内容资源(编辑加工过程中的文件)。
原始资源库主要存放两类文件:各生产节点的结果文件和加工过程文件。如通过初审的稿件、排版校对后的稿件、封面设计过程中的PS工程文件等。
(2)成品库:可用于外部用户使用、销售的数字内容。
(3)素材库:对原始资源进行内容拆分加工,形成的文字、图片等规范化的、标准格式的片段内容。
(4)版权库:存储图书、图书章节、碎片化素材的版权信息。
(5)元数据信息库:存放内容资源描述信息的结构化数据。如资源结构信息(篇章结构等)、图书关键字、图书版权信息、试题难度等。
(6)临时资源库:上传到服务器临时目录中的资源,捡入完成后将临时资
源从临时资源库删除。
(7)副本资源库:存放系统自动转换生成的HTML、JPG、PDF、MP3、FLV 格式的低精度或流媒体格式的内容副本,用于内容的预览和查看。(注:成品库中的视频、图片、图书资源可能是高分辨率、大容量或者非通用格式的,将事先转换好格式的资源副本单独存放,用户使用网页、手机等工具在线访问时可以直接调用副本资源、快速预览查看)
1.2. 资源生产过程存储流程
开 始
未经任何处理和转换的原始的电子内容资源,如PSD 、Idd 、PS 等格式的内容资源(编辑加工中的过程文件)
对原始资源进行内容拆分加工,形成的文字、图片等规范化的、标准格式的片段内容。
上传到服务器临时目录中的资源,捡入完成后将临时资源从临时资源库删除
存放内容资源描述信息的结构化数据
转换生成的HTML 、JPG 、PDF 、MP3、FLV 格式的低本,用于内容存储图书、图书章节、碎片信息
2.图书数字资源库管理
图书资源库管理系统分业务功能和系统功能两大模块。
业务功能主要是图书加工、资源入库、资源管理、格式转换四个大功能点。存储管理图书从纸质书到成品电子书过程中产生的各项资源。
系统功能主要是版权保护、统计分析、日志管理、权限管理、系统接口五个功能点。
下面展开说明。
2.1.业务功能
2.1.1.图书加工
资源加工分图书加工和素材加工两种。素材加工指对单个的图片、音视频等资源加工,操作同图书加工,这里不另外做说明。(图书加工中文档拆分和格式转换两步是否放在系统中需要技术验证)
2.1.1.1.历史图书
历史图书指出版社现有的纸质图书、胶片、电子文件等资源。这类资源因为各种原因不符合入库标准,需要加工处理后放入系统。主要有三个步骤:、
1、数据加工:将历史图书数字化、加工成符合标准的数据。
2、文档拆分:将加工后的数据碎片化,分三步进行:
(1)抽图:使用工具将纸质图书或电子文件中的图片抽出,形成图片素材;
(2)拆分:按章或节拆分,形成以章或节为单位的图书素材;
(3)打包:按篇章节结构生成文件夹或压缩包。(保证图书的篇章结构不变)
3、格式转换:将电子图书转换成适用于不同平台、不同阅读器的电子书,或兼容主流平台的统一格式的电子书。
(注:各阅读平台使用的电子书格式不同,如亚马逊kindle使用MOBI格式的电子书,移动联通电信三大运营商指定的电子书格式为OCF。所以同一本书可能要转换成很多格式来适应不同平台。从需求调研的反馈看,各出版社都希望制作e-pub格式的电子书用于出版和发售,需要技术验证e-pub格式是不是在各大平台通用。)
2.1.1.2.新增图书
新增图书指在内容生产平台制作完成的图书。现阶段内容生产平台的设计是让图书以数字化的形式在系统中流转,并以篇章结构创作,生产出来的内容本身就是符合标准的。所以新增图书没有历史图书数据加工、文档拆分的步骤,可以直接进行格式转换。
2.1.2.资源入库
资源入库模块管理资源从线下到服务器的录入过程(如图,各项操作需要分别提供对单个资源和批量资源的处理,下边功能说明不再赘述),主要分七个步
骤:
1、资源导入:各类资源从线下导入服务器,上传服务器后暂存服务器临时目录,审核录入后从临时库删除。
2、资源审核:对导入的资源审核,确认无误后进入相关资源库。
3、资源标引:对资源进行标引,标引分两种
(1)结构标引:标注资源的内容结构(文章的篇章节结构、试题的题干
解答结构等)。
(2)语义标引:资源关键字、版权信息、试题难度等资源描述信息。
(注:需要提供系统自动标引和人工手动标引、修改功能。系统自动标
引包括文本关键词提取、批量导入以标引的excel表等)
4、资源分类:对资源所属学科、类目进行分类。
5、资源关联:同资源标引,资源关联包括结构关联和内容关联。
如某一章节属于哪本书,哪些素材资源属于农业资源等。
6、资源定价:资源经过标引、分类、关联后已经达到使用要求,最后为资
源定价。
7、资源发布:资源发布后,可在数字内容发布服务平台搜索购买。
这里对“动态发布”功能进行说明:“动态发布”类似资源包、产品包的概念。主要是对专题库的发布,如通过检索后找到涉
及三农的资源,使用动态发布可以将分属不同类别的资源打包,
发布成某个学科的专题库。