爱如生数据库与翰堂典藏数据库的对比

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

爱如生数据库与翰堂典藏数据库的对比

一.简介

爱如生数据库:

爱如生数据库包括中国方志库,中国谱牒库,中国丛书库,中国类书库,中国俗文库,中国经典库,敦煌文献库,申报数据库以及《中国基本古籍库》。各据善本,采用爱如生独有的数字再造技术制作,还原式页面,左图右文逐页对照,眉批、夹注、图表无障碍显示;毫秒级全文检索,可编辑、下载和打印。其中,中国基本古籍库——由四个子库构成: 哲学库、史地库、文艺库、综合库,共20 大类,收录自先秦至民国历代典籍1 万种,17万卷,版本12500 个、20 万卷,全文17 亿字、影像1200万页,数据总量约320G。

翰堂典藏:

《翰堂典藏》古籍数据库是由北京时代瀚堂科技有限公司推出的核心产品,其采用基于Unicode 四字节编码和自然语言全文检索的典籍文献数字化构建。《瀚堂典藏》古籍数据库由14 个子库构成: 小学工具、类书集成、出土文献、中医药文献、经部集成、史部集成、子部集成、集部集成、古典戏曲、古本小说、佛教典籍、道教典籍、敦煌文献、专题文献。《瀚堂典藏》加工入库的图书自先秦至民国,从甲骨文到近代文献约有10190 种,图片数量约1200 万张,文字总量超过15 亿字,可全文检索和连续图文对照阅读的记录条目1500 万条以上,并持续定期增加中。

二.收录内容及标准

《中国基本古籍库》所收历代典籍及所附重要版本,均经严格筛选。

1.收书标准: 历代名著,各学科基本文献,有拾遗补阙意义的特殊著作;

2.选本标准: 完本而非残本、现存最早之本或晚出精刻精钞精校本;未经删削窜改之本。

《瀚堂典藏》

1.收书标准: ⑴加工小学工具类,包括古代字书、韵书等瀚堂具有加工和管理优势的图书。这类图书是《瀚堂典藏》全库的基础;⑵由于瀚堂典藏可以依据用户的要求安排加工种类和进度,也可根据用户的科研要求调整入库品种。

2.选本标准: 尽量多收集不同版本的图书,力争收录所有公开影印出版的唐五代写本和宋元珍本。

三.检索方式

《中国基本古籍库》提供4 条检索路径,并提供模糊匹配:

1.分类检索,通过库、类、目的树形结构进行定向检索;

2.条目检索,限定书名、时代、作者、版本、篇目等条件进行目标检索;

3.全文检索,输入任意字、词或字符串进行爬梳检索;

4.高级检索,可以进行多次检索,或组合字词进行逻辑检索,或综合

选项进行关联检索,可以保存最近一次检索结果。

基本古籍库的二次检索与一般数据库的二次检索稍有不同,并不是将检索结果进行二次检索,而是将第一次检索的词与多次检索词进行组合检索。

《瀚堂典藏》的检索限定词包括全文、出处、标题、书目,有三种检索模式:

1.绝对精准模式,不对检索条件启动任何转换处理,完全按照输入词条进行检索;

2.精准模式,启动简繁体和常用异体字自动转换;

3.模糊模式,启动人工智能分词检索功能和简繁体、异体字自动转换。在检索过程中,可以在左侧“书目树”中选择库、类、书目录,以缩小检索范围,并且可以二次检索、跨库检索,也可以选择某本书进行内容检索。如果注册个人用户,可以保存10 次的检索式,方便读者使用。

相同:

虽然两个数据库的检索界面不同,但是检索方式基本相似,都能够对检索词进行智能模糊匹配,检索的准确率及相关率也是很高的

四.使用比较

《中国基本古籍库》

1.使用时要求必须下载安装客户端,因此可以使用一些个性化的工具,但是安装客户端比较麻烦,查看内容的时候是全屏显示,使用者要做其他操作时会略有不便

2.在使用细节方面,《中国基本古籍库》可以繁体字与简体字进行转换,这种转换虽然符合现代人的识字习惯,但是繁简要自由转换,暂时没有技术手段保证不出现错误。

3.可以将查看内容与图书原版的图像进行对比,这样就可以减少错误,同时也可以通过图书的原版图像查看到一些无法识别的字。

4.该库还自带常用字典,可查询所收录典籍中常用字的发音和释义

5.中国基本古籍库》还可以改变背景颜色、增加列线、将文字从竖排改变成横排,并且可以对原文增加标点批注以及书签,可自动收藏并分类管理以前查阅的信息,方便归纳研究。

《瀚堂典藏》

1.采用浏览器/服务器模式,对系统及浏览器无特殊要求和限定,使用时不需要安装客户端及特殊浏览器,直接使用IE 浏览器查看,比较方便。

2.可以将内容与原版进行对比查看,正文为了适应当代人的阅读习惯自动排版为横排,每周对数据更新校勘,因此差错率非常低,能控制在1 /10000 以内。

3.在查看全文的时候,自动将原版书图像与内容对照。并且该数据库利用Unicode 四字节编码技术基本解决了生僻汉字在计算机平台上

无法录入、显示、编辑的难题,从根本上彻底突破了古籍整理和研究中生冷僻汉字数字化的瓶颈,因此只要使用时安装宋体-扩展字符集,就可以查看到所有的生冷僻汉字,极大地方便了使用者。这一点是其他古籍数据库无法办到的。

在原文文献下载方面

相同:《中国基本古籍库》和《瀚堂典藏》都可以检索后找到相应文献,并对其进行选择下载。两个数据库可能是考虑到古籍资源的数据保护,所以分别对复制内容和查看内容都有所限制,对于需要下载较大内容读者来讲可能有些不方便

不同:《中国基本古籍库》每次最多只能复制200字。《瀚堂典藏》则是开放自检索信息点上下共7 页与原版图片对照连续的文字,可以直接复制。图片则可以查看检索信息点上下13 页的内容。对于常用品种的古籍,开放章节内的全部内容,可以图文对照连续浏览并且复制,这些图书,在目录树中显示为绿色封皮。

五.不足

《中国基本古籍库》在查看出处方面略显不足,虽然已经在不断改进中,在6.0 版能在检索到的条目页面下显示出处,并在复制文本时提供出处复制,但也只有书名和卷数,使用者还得通过翻检补充朝代、作者、篇名、版本等信息。另外该库在内容方面将原书序跋删去,而这些内容对使用者的研究会有很大帮助,这一不足很让人遗憾。

相关文档
最新文档