我国高校数字资源长期保存挑战与策略

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
模仿环境(Emuபைடு நூலகம்ation)
Provide software tools to emulate or mimic essential viewing applications and operating environments
a
32
不同类型数字资源的保存策略
重要商业资源的存档:商业资源的服务一般是有保障 的,对这类资源CALIS将和其他共享组织联合起来分 工协作保存,并做战略性存档,防止突发的事件和突 然的灾害
我国高校数字资源长期保存的 挑战与策略
朱强 2008年11月
a
1
提纲
引言 高校数字资源建设现状 高校数字资源保存现状 高校数字资源长期保存的策略 结语
a
2
引言
a
3
我们面临一个全新的数字环境
无所不在的网络和无所不在的计算 信息化成为国家建设五大战略任务之一 电子商务、电子政务、数字出版、无纸办
a
21
单馆自建数字资源
以北大图书馆为例
1) 祕籍琳琅—北京大学图书馆古文献资源库 2) 北京历史地理数据库 3) 北京大学学位论文数据库 4) 北大名师数据库 5) 视频点播多媒体数据库 6) 热点话题数据库 7) 新书导读数据库 8) 网上咨询台—常见问题数据库 9) 一小时讲座—课件数据库
自建数据库数据量已超过12TB,品种和数量将继续增加
a
22
高校数字资源保存现状
a
23
目前的模式
引进数字资源的存档 镜像模式 裸数据模式
自建数字资源的存档 备份模式 镜像模式
a
24
镜像数据库
1 CALIS本地服务-Nature 2 CALIS本地服务-RSC 3 CALIS本地服务-IOP 4 CALIS本地服务-Kluwer 5 PQDD 6 Beilstein/Gmelin CrossFire 7 Genome Database 8 Science Online 9 Ei Village 10 CSA 11 NTIS 12 SDOS 13 Zbl.Math 14 SpringerLink 15 ACM 16 WSN
粮油食品专题特色数据库
电子科学与技术重点学科特色库
食品科学与工程专题数据库
东北亚研究数据库
书院文化数据库
潮汕文献数据库
猪养殖特色数据库
汽车工程信息数据库
饲料添加剂专题特色库
钱伟长特色网站数据库
a 民国时期文献资源库
20
CALIS 自建特色数字资源(续)
巴蜀文化特色数据库
潮汕文献数据库
中国年谱数据库
a
5
学术交流的渠道增多、范围更广,开放获取运 动和机构存储成为网络环境下学术界传播及出 版学术信息的一种新的方式
据西安交大图书馆的统计,国外开放获取期刊 已超过12000种
a
6
学习和研究的方式在变化,许多人习惯于用搜 索引擎查找资料,对电子书刊的阅读日益增加
中国出版科学研究所有关报告表明:我国国民传统介 质阅读率持续6年下降的同时,网络阅读率6年来则 上升了6.5倍。今年发布的第五次全国国民阅读调查 报告也显示,互联网阅读已达44.9%,比2005年提 高了17.1%,已经接近了48.8%的图书阅读率。
解读和迁移; 多样(diversity),多种格式并存,以便某些格式过时
时,其他格式仍可替代; 稽核(audit),不断对数字资源的状态进行检查,确保
其完好; 经济(economy),确定保存项目的轻重缓急,首先确
保最重要的部分; 怠速(sloth),有意降低系统运行速度,以便在数据崩
溃时增加修复的可能性
网上全文电子期刊达45,000多种,各类电子图书和学位 论文等近50万册
数字扫描加工的古文献、民国图书、学位论文、教学参 考书和民国旧报刊等印刷型资源超过12TB
拥有近16TB的本地数字资源,并且每年以7-8TB的速度 增长
a
15
CALIS数字资源类型
中/外文
全文电子刊 数据库
中/外文 全文电子 教学参考
a
18
其中,全文电子期刊30,636种(去重后约 24,000种)
会议录8,557种
电子图书(包括学位论文) 145,052种
平均回溯年限大约15年
a
19
CALIS 自建特色数字资源(65)
中国科技史数字图书馆资料库
高校古文献资源库
猪养殖特色数据库
高校音乐教育资源数据库
铁路交通运输特色数据库
镜像数据库
覆盖年份
17 SpringerLink
2003年-现在
18 INSPEC
2003年-现在
19 RefWork
2003年-现在
20 BioOne
2004年-现在
21 SAGE
2005年-现在
22 SIAM
2005年-现在
23 ASTM
2005年-现在
24 DIN
2005年-现在
25 Bowker
8
美国同行认为, 到2025年,纸本
书刊将会从图书 馆消失
数字资源越来越 多,甚至占据主 体地位,应该是 趋势
a
9
已有数字资源类型一览
文献(技术报告、会 议论文、预印论文)
图书 学位论文 数据集 计算机程序 视觉、模拟模块 多媒体出版物
电子刊物 书目、目次、摘要 图像 视听资料 格式化数字收藏 电子教学资料 网页 管理资料
朱子研究
湖南人物数据库
特色农产品加工专题数据库
长江资源库
东南亚及闽台研究数据库
中国年谱数据库
无人驾驶飞机专题文献数据库
跨国公司研究专题数据库
红色江西特色数据库
上海百个著名作家学术研究资料数据库
《红楼梦》特色数据库
机器人信息系统
大珠三角地区研究文献数据库
河南地方文献数据库
经济学学科知识门户
华侨华人文献信息专题数据库
无人驾驶飞机专题文献数据库
中国年谱数据库
北大名师多媒体特藏数据库
民族相关文献特色库
中国邮政数据库
小麦文献信息数据库
建筑艺术与技术资料库
《北大讲座》视频点播资源库
经济学学科知识门户
河南地方文献数据库
中国建筑文化特色数据库
陆相油气勘探开发专题数据库
兽药文献信息数据库
汽车资源数据库
中国航运信息资源库
邮电通信专题文献数据库
书库
中/外文 学位论文
文摘与全文 数据库
其它的全文 数据库、事 实数据库、 二次文献库
高校中外文 书刊联合目
录数据库
中外文期刊 目次数据库
重点学科网 络资源导航
数据库
高校 专题特色 资源数据库
参考咨询 信息库
数字图书
a
16
CALIS 数字资源数量
数字资源类型
建设情况
外文电子期刊 中文学位论文 英文学位论文 教学参考资源
a
10
图书馆借助于信息技术走向数字化
大量的纸质文献和其他文献被数字化,形成图 书馆的特色资源
超过三分之一的经费被用于购买数字资源或购 买数字资源访问权
互联网上的学术信息被加以组织,形成导航库; 许多网站的信息被有计划地下载,与上述资源 共同构成图书馆的数字资源
a
11
图书馆实体资源和虚拟资源的结合必然要求 加强对数字资源的管理和保存
覆盖年份
2002年-现在 2003年-现在 2002年-现在 2002年-2005年 2002年-现在 2004年-现在 2000年-现在 1997年-2004年
1998年-现在 1999年-现在 1999年-现在 2000年-现在 2002年-现在 2002年-现在 2002年-现在 2002年-现在 a
2006年-现在
26 IEE Computer Society
2006年-现在
27 Ingenta
2006年-现在
28 Micromedex Health Series 2006年-现在
29 Nature Series
2005年-现在
30 CCC
2005年-现在
31 Emerald 32 CRC
2003年-现在 2005年-2现5 在
高校自建资源的存档:这类资源是有组织建设的,目 的性强,应在组织大家建设的同时,集中存档。但是
约24000种 11.6万篇 13.3万篇 11.2万种
其他全文资源(报告、会议论文 、专利、标准、百科全书等)
2400万篇
备注 CALIS集团引进 CALIS数据采集 CALIS集团引进 CALIS扫描、购买
CALIS集团引进
中外文联合书目数据库
中外文现刊目次库 重点学科导航数据库 重点学科特色数据库
a
26
问题与挑战
总体上缺乏完整的数字资源长期保存政策和 战略规划
引进资源方面,缺乏强制性的有效的措施和 手段
自建资源方面,缺乏政策指导、规划协调和 监督检查
技术上,缺乏系统的研究和完善的方案 最根本的,缺乏资金投入
a
27
高校数字资源长期保存的策略
a
28
关于数字资源长期保存
美国研究图书馆组织(RLG)对“可信赖的数字 仓储”(trusted\reliable digital repository) 作了如下定义:“一个可信赖的数字仓储,是以 提供对受控数字资源长期存取为使命的仓储;其 职责是为了存储者以及当前和将来用户的利益对 数字资源进行长期维护;按照普遍接受的惯例和 标准设计系统以保证实时管理、存取和存储其中 的资料的安全;建立系统评估方法以满足用户对 于文档真实性的需求;可以被可靠地用来公开和 明确地履行对存储者和用户的长期职责;其政策、 运行和表现可以被稽核和测量。”
数字资源的虚拟性 数字资源的多样性 数字资源的脆弱性 数字资源建设和使用的复杂性
a
12
高校数字资源建设现状
a
13
高校图书馆的数字资源包括
商业化的数字资源(多数为租用,少数为拥 有)
多馆共建的数字资源 单馆自建的数字资源
a
14
以北大图书馆为例
各种数字资源学科门类基本齐全,引进的SCI、中国期刊 网、Jstor、新东方网络课程等国内外数据库已达近500 个
公… 数字地球、数字城市、数字社区、数字校园、
数字图书馆… 家电数字化和数字产品家电化(数字家庭)
a
4
信息技术促使学术交流体系发生变化
出版从“分子书”走向“电子书”,使得电子 出版、网络出版变得越来越普遍
刚刚落幕的法兰克福书展上,超过30%的展品是数字 化产品
统计显示,我国现有电子图书50万种,互联网期刊 9000种,数字报纸600多份。预计未来5年,将有 30%的手机用户通过手机阅读电子书和数字报,由 图书馆等机构用户采购的电子书、数字报的销售规模 将达到10亿元,由网民和手机用户带动的电子书、 数字报内容销售及广告收入将达到50亿元。
a
31
保护数字资源的几种做法
载体更新(Refreshing)
Tape->harddisc->CD->DVD, copy without change 原始形态保存(Static Preservation)
Preserve the bits 旧新迁移(Migration)
Periodic transfer of materials from one hardware/software configuration to another
西夏文化数据库系统
民用航空专题数据库
行为科学专题数据库
摩托车信息特色资源数据库
复合材料专题特色数据库
中国水力发电工程
高校音乐教育资源数据库
猪养殖特色数据库
中国民族音乐数据库系统
《江南制造局》专题特色库数据库
河洛文化文献专题数据库
CAD/CAM专题文献数据库
中国农村问题研究文献数据库
心血管疾病信息资源数据库
280 万 条 ( 其 中 规 范 数据86万条)
CALIS建设
大于2400万条
CALIS建设
77 个 一 级 学 科 14 万 个网站
CALIS建设
75个a数据库
CALIS建设 17
CALIS集团引进数据库
目前,CALIS集团共 购买数据库283个, 其中文摘索引数据库 126个,电子期刊数 据库80个,电子图书 数据库21个,事实型 数据库52个,其它数 据库4个。
a
29
数字资源保存的目标
数字资源在存储媒体上的可读性 数字字符串可以被人或电脑阅读和处理 格式化内容可以被它的使用者理解 数字资源与它所代表的原体相同(或记载不同
之处)
a
30
Rosenthal等人提出了系统的保存策略:
复制(replication),提供对数字资源的备份; 迁移(migration),将数字资源迁移到新的系统或平台; 透明(transparency),公开数字资源的编码,以利于
-- 《解放日报》2008年11月8日
a
7
关于未来信息资源获取的预测
Percentages
100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0%
1999
2002
2005
2007
2010
Services: 1999, 2002, 2005, 2007, 2010
a
Dynamic Digital Print
相关文档
最新文档