信息资源组织方法
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
CNMARC
MODS
❖ 元数据描述对象模式:Metadata Object Description Schema ❖ 2002.6 美国国会图书馆:采用XML描述书目数据 ❖ MODS 有20 个元素, 包括Title Info (题名信息) 、Name ( 名称) 、
Type of Resource (资源类型) 、Genre (体裁形式) 、Origin Info (出版 信息) 、Language (语种) 、Physical Description (载体形态描述) 、 Abstract (文摘) 、Table of Contents ( 目次) 、Target Audience ( 目标 读者) 、Note (附注) 、Subject (主题) 、Classification (分类) 、 RelatedItem (相关文献) 、Identifier (标识符) 、Location (馆藏位置) 、AccessCondition ( 获取条件) 、Part ( 部) 、Extension ( 扩展) 、 Record Info(记录信息)。每个元素又具有数量不等的子元素, 并采用 W3C的XML Schema 语言来表达主元素、子元素以及它们的属性。 ❖ MODS优点:适合用于描述各种较复杂的数字化资源。
《都柏林核心集》(Dublin Core,简称DC)
《政府信息定位服务》(Government Locator Service,简称GILS)
Information
《联合地理数据委员会的数字地球空间元数据》 (Content Standard Digital Geospatial Metadata,简称 CSDGM)
standard Digital Geospatial Metadata,简称CSDGM) ❖ 《可视资源核心范畴》(Core Categories for Visual
Resources,简称CCVR) ❖ 《编码档案描述》(Encoded Archival Description,简称
EAD) ❖ 《博物馆信息的计算机交换》(Computer Interchange of
❖ 1034页;20cm ❖ 本书另有译名:飘 ❖ISBN 7-539-0367-6:¥10.70 ❖Ⅰ.乱… Ⅱ.①米…②Mitchell③黄…④朱… Ⅲ.长
篇小说 Ⅳ.I712.45
AACR2
❖1978:the Anglo-American Cataloguing Rules:2 ❖ 组成
▪ 著录(书目描述):对各种文献的著录格式 规定,依据ISBD
RDF & XML
•W3C(World Wide Web Consortium),W3C理事会或万 维网联盟。W3C于1994年10月在麻省理工学院计算机科学实 验室成立。创建者是万维网的发明者Tim Berners-Lee。 •是对网络标准制定的一个非赢利组织,像HTML、XHTML、 CSS、XML的标准就是由W3C来定制。 • 基于W3C的组织原则和工作宗旨,以及Web的实际应用情 况,W3C提出了其长远目标,包括3个方面的内容,分别是: • * 建立一个普遍的、全社会易于使用的公共网络环境; • * Web上的语义可管理和正确使用; • * Web应该是安全可信的。
2005)
信息描述规范
❖ 《文本编码倡议》(Text Encoded Initiative,简称TEI) ❖ 《都柏林核心集》(Dublin Core,简称DC) ❖ 《政府信息定位服务》(Government Information locator
Service,简称GILS) ❖ 《联合地理数据委员会的数字地球空间元数据》(Content
CNMARC
❖ CNMARC基本字段介绍 ❖ 中文(普通)图书CN-MARC著录格式分类:默认栏目 ❖ 标识块 指示符 文字数据 ❖ 头标区 无标识字段号、指示符、子字段标识符,定长24
个字符 ❖ 001 记录标识号 ❖ 010 |aISBN号|b装订方式|d获得方式和/或定价|z错误的
ISBN号 ❖ 100 |a通用处理数据,定长36个字符 ❖ 101 0 |a正文语种|b中间语种|c原作语种 ❖ 102 |a出版或制作国|b出版地区 ❖ 105 |a图书编码数据 ❖ 106 |a文字资料代码—物理形态标志
▪ 标目、统一书名和参照:对著录标目的选择 、个人和团体标目、地理名称、统一书目作 了规定
数字信息资源的描述
•元数据(Metadata)
•关于数据的数据,或关于数据的结构化的数据。 •早期主要指网络资源的描述数据,用于网络信息资源的组织; 目前,实际用于各种类型信息资源的描述记录。
什么是元数据
•例如,在一个大型的医疗卫生机构,拥有一个专门的数据资料 管理机构,来统一管理各类需要提交和归档的数据资料。
信息资源组织方法
信息资源的组织与存储
信息描述 信息揭示 信息资源的组织方法 信息资源索引系统的建立
信息描述
❖信息描述(information description),是根据 一定的描述规则和技术标准,对信息的外 在特征和部分内容特征进行分析、选择和 记录的过程。
❖一种初级的信息组形式
wk.baidu.com
信息描述的程序
著录项目
❖ ISBD(International standard Bibliographic Description国际 标准书目著录) ▪ ISBD(G)的八大著录项目 ▪ 题名与责任者说明项 ▪ 版本项 ▪ 材料或出版类型特殊细节项 ▪ 出版发行项 ▪ 载体形态项 ▪ 丛编项 ▪ 附注项 ▪ 文献标准号及获得方式项
•对医药卫生科学数据共享网来说,针对 每一个共享数据集,都要以元数据著录的 形式来“填写”一张这样的“表格”。
•这时候,这张“表格”上规定的内容, 以及关于填写的一些规定,就可以看作是 《医药卫生科学数据共享网元数据标准》
网络信息资源描述的相关标准
《文本编码倡议》(Text Encoded Initiative,简称TEI)
•查重
•描述
•复核并 •输入系统
文献的著录
文献的著录
文献的著录
信息描述规范
❖ 《中文书刊名称汉语拼音拼写法》(GB3259—82) ❖ 《检索期刊条目著录规则》(GB3803—83) ❖ 《文献著录总则》(GB3792.1—83)(GB/T 3792.1-2009) ❖ 《普通图书著录规则》(GB3792.2—85) ❖ 《连续出版物著录规则》(GB3792.3—85) ❖ 《非书资料著录规则》(GB3792.4—85) ❖ 《档案著录规则》(GB3792.5—85) ❖ 《地图资料著录规则》(GB3792.6—86) ❖ 《古籍著录规则》(GB3792.7—87) ❖ 《文后参考文献著录规则》(GB7714—84) (GB7714—
CNMARC
❖ CNMARC基本字段介绍 ❖ 200 1 |a正题名|b一般资料标识|c另一作者的正题名|d并列题名|e副题名及其他说明题
名的文字|f第一责任者|g其它责任者|h分册(辑)号|i分册(辑)名|v卷册号标识|z并列题名 语种|9正题名汉语拼音205 |a版本说明 ❖ 210 |a出版、发行地|c出版、发行者名称|d出版、发行日期 ❖ 215 |a类型标识和文献的数量及单位|c其它形态细节|d尺寸或开本|e附件 ❖ 225 |a正丛编题名|d并列丛编题名|e丛编副题名及其它信息|f丛编责任者|h分册(辑)号|i 分册(辑)题名 ❖ 300 |a一般附注内容 ❖ 327 |a内容附注内容 ❖ 461 用来连接本著录实体所从属的丛编的有关数据,设子字段|1 ❖ 606 |a主标目|x主题复分|y地区复分|z年代复分 ❖ 690 |a分类号|v版次 ❖ 701 0或1 |a人名—等同责任者款目要素|b名称的其它部分(不包括款目要素)|4著作责任 |9款目要素汉语拼音 ❖ 702 0或1 |a人名—次要责任者款目要素|b名称的其它部分(不包括款目要素)|4著作责任 |9款目要素汉语拼音 ❖ 711 0或1 |a团体名称—等同责任者款目要素|4著作责任|9款目要素汉语拼音 ❖ 712 0或1 |a团体名称—次要责任者款目要素|4著作责任|9款目要素汉语拼音 ❖ 801 |a国家代码|b机构名称代码|c处理日期 ❖ 905 |a收藏馆代码|b登录号|d分类号|e书次/种次号|f复本数|v入藏卷期|y年代范围
•填好这张关于要入库光盘的表格,就 是这张光盘中数据的元数据!
•而这一张表格所规定的要填写的内容( 以及填写规定),就可以看作是这个单 位内部的“元数据标准”!
•我们把这张表格中所规定填写的项目 ,作为一个一个的属性字段,可以建立 一个关于元数据的数据库———就是 元数据库:
•这张表格每填写好一张,就可以录入 成为元数据库中的一条元数据记录:
ISBD文献描述格式
❖ 正题名=并列题目:副题名及说明题名文字/第一责任者 ;其他责任者.—版次及其他版本形式/与本版有关的责任 者.—文献特殊细节.—出版发行地:出版发行者,出版发 行年(印刷地:印刷者,印刷日期)
❖ 页数或卷册数:图;尺寸或开本+附件.—(丛编名/负责者 ,国际标准连续出版物编号;从编编号附属从编)
•这些要统一入库归档的数据各不相同: 从数据内容来看,可能有管理类、业务类和科学研究类; 从学科来看,可能有基础医学、临床医学、预防医学等等; 从存储类型来看,可能有DBase、EXCEL、文本文件等等; …… 总之,内容、结构、数据量、介质各不相同。
•当我拿着自己的数据光盘去入库归档 的时候,管理员要求我填写一张关于要 入库数据的表格,以便于管理和查阅。
中文元数据标准
❖ 中国国家图书馆:中文核心元数据集 ❖ 22个元素名称、主题、版本、内容摘要、内容类
型、语种、内容覆盖范围、内容创建者、其他责 任者、内容创建日期、出版、出版所有者、资源 标识符、版权说明、数字资源制作者、数字资源 制作日期、数字资源制作地、权限声明、公开对 象、操作许可、许可行为、许可协议,其中包括 了DC的大部分元素。 ❖ 该方案的特点是数据元素由描述、结构、管理3 种元数据类型组成,并支持数字资源的保持和检 索利用。
MODS
RDF & XML
•* RDF(Resource Description Framework):RDF是第一个 有关构建语义网络的推荐标准,它提供了一种技术标准来 描述Web上的词汇、编码和元数据(Metadata),并建立这 些对象与Web上丰富资源之间的联系。RDF于1999年2月 发布,至今仍是最重要的语义Web方面的技术标准,也是 其他技术的基础之一。
MARC
❖机器可读目录:Machine Readable Catalogue ❖ 以编码形式和特定结构记录在计算机存储载体上
的,由计算机程序自动控制、处理与编辑输出的 目录。 ❖CNMARC是中国机读目录(China MachineReadable Catalogue),1992年2月正式出版《中 国机读目录通讯格式》,即CN-MARC。
《可视资源核心范畴》(Core Categories for Visual Resources,简称CCVR)
《编码档案描述》(Encoded Archival Description,简称 EDA)
《博物馆信息的计算机交换》(Computer Interchange of Museum Information,简称CIMI)
Museurn Information,简称 CIMI )
文献著录总则
传统文献的描述著录
❖ 著录:依据一定的规则,对文献外表形式、物质 形态和内容特征进行分析、选择和记录的过程, 其结果为款目。
❖ 著录项目 ▪ 图书外表的文字记载:书名、责任者、出版 发行情况 ▪ 图书的物质形态:页数、图、尺寸、开本、 装订、附件
❖ 附注 ❖ 国际标准书号;中国标准书号(装订):获得方式 ❖ 提要 ❖ Ⅰ.题目 Ⅱ.责任者 Ⅲ.主题词 Ⅳ.分类号
ISBD中文信息描述(专著)实例
❖乱世佳人=Gone with the wind/(美)米切尔 (Mitchell,M.) 著;黄怀仁,朱攸若译.—杭州:浙 江文艺出版社,1991.4