元数据定义

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

元定义:
元数据是与对象相关联的数据,用来满足潜在用户对对象的存在和特征的全面了解的需要(Dempsey & Heery,1997)。

元数据是对信息对象在任意层次上的聚集的总的描述(Gilliland-Swetland,2000)。

国际图联(IFLA)将元数据定义为描述数据的数据(Data about data),指可用来协
助对网络数字资源进行识别(identification)、描述(description) 和定位(location)的任何资料。

元数据的类型,Gilliland-Swetland(2000)将其分为五种:管理型(Administrative)、描述型(Descriptive)、保存型(Preservation)、技术型(Technical)和使用型(Use)。

了元数据的五大功能,包括资源定位(Location)、发现(Discovery)、记录(Documentation)、评估(Evaluation)和选择(Selection)。

根据元数据的特征和结构,将它分为三类:第一类,来源于全文索引的元数据;第二类,结构简单和有着通用格式的元数据,如Dublin Core;第三类,结构复杂的特定领域元数据,如MARC和GILS(Government Information Locator Service),和属于更大的语义框架的一部分,如TEI headers和EAD(Encoded Archival Description)
3.1 Metadata的应用目的
(1)确认和检索(Discovery andentification),主要致力于如何帮助人们检索和确认所需要
的资源,数据元素往往限于作者、标题、主题、位置等简单信息,Dublin Core是其典型代表。

(2)著录描述(Cataloging),用于对数据单元进行详细、全面的著录描述,数据元素囊括
内容、载体、位置与获取方式、制作与利用方法、甚至相关数据单元方面等,数据元素数量往往较多,MARC、GILS和FGDC/CSDGM是这类Metadata的典型代表。

(3)资源管理(Resource Administration),支持资源的存储和使用管理,数据元素除比较
全面的著录描述信息外,还往往包括权利管理(Rights/Privacy Management)、电子签名(Digital Signature)、资源评鉴(Seal of Approval/Rating)、使用管理(Access Management)、支付审计(Payment and Accounting)等方面的信息。

(4)资源保护与长期保存(Preservation and Archiving),支持对资源进行长期保存,数据元素除对资源进行描述和确认外,往往包括详细的格式信息、制作信息、保护条件、转
换方式(Migration Methods)、保存责任等内容。

幻风阁|kent.zhu'sBlog
最肤浅的关注·最玩票的体验·最扯淡的思考·最无聊的记录
∙HOME
∙ABOUT ME
订阅到Google
订阅到鲜果
订阅到抓虾
订阅到有道
订阅到哪吒
订阅到QQ 邮箱
订阅到任意邮箱
订阅到豆瓣9点
更多订阅选择>>
什么是元数据(MetaData)
在读《Web信息架构》的时候第九章讲到叙词表、受控词表和元数据。

当时书中的定义很模糊,所讲的篇幅也少,就没有在意,一直也没有能完全理解。

今天在读《锦绣蓝图》的时候第四章中再次提到元数据这个概念。

遂多查了些资料认真的理解了一下。

什么是元数据?
元数据(Meta Date),关于数据的数据或者叫做用来描述数据的数据或者叫做信息的信息。

这些定义都很是抽象,我们可以把元数据简单的理解成,最小的数据单位。

元数据可以为数据说明其元素或属性(名称、大小、数据类型、等),或其结构(长度、字段、数据列),或其相关数据(位于何处、如何联系、拥有者)。

举几个简单的例子:
使用过数码相机的同学都应该知道,每张数码照片都会存在一个EXIF信息。

它就是一种用来描述数码图片的元数据。

根据EXIF标准,这些元数据包括:Image Description(图像描述、来源. 指生成图像的工具)、Artist(作者)、
Make( 生产者)、Model (型号)、….、等等。

生活中我们填写的《个人信息登记表》,包括姓名、性别、民族、政治面貌、一寸照片、学历、职称等等这些就是锁定kent.zhu这个人的元数据。

通常情况下元数据可以分为以下三类:固有性元数据、管理性元数据、描述性元数据。

固有性元数据;与事物构成有关的元数据。

管理性元数据;与事物处理方式有关的元数据。

描述性元数据;与事物本质有关的元数据。

当然,并不是说所数据总能清晰的划分在以上3类中。

比如:一张由kent 拍摄的大小为20K的JPG格式的印着一只小狗的圣诞卡照片。

它的固有性元数据包括:20K、JPG;管理性元数据:kent拍摄、圣诞卡;描述性元数据:狗、小狗、圣诞、照片、圣诞节、…
但是,圣诞卡则可以放在以上任何一个分类中。

与事物构成有关(说明这个东东是什么)、与事物处理方式有关(说明这个东东的用途是什么)、与事物本质有关(可以直接用来描述这个东东)。

元数据之于信息架构的意义
元数据是一种很有效的方法,用以确保网站上各种形式的内容确实都能被查找到。

比如我们常常为搜索很久之前看到的一张美女图片犯愁,而如果一个图片网站如果信息架构足够好,我们就能凭借我们回忆到的元数据(关于武藤兰的?2000年拍摄的?)清晰的找到。

元数据之于信息架构就像是房子的砖瓦,它可以根据需要摆放成不同的信息检索系统。

元数据是所有组织系统的基础,从搜索到电子商务网站上的导航系统都强烈的依赖于元数据。

前面提到,元数据实际上是为产品的可查找性(Findability)服务的。

而用户在查找信息的时候不会按照机器思维去找(不会输入该照片的ID),而是直接输入关于信息的描述性信息如:“小狗圣诞卡”。

也就意味着在创建关于描述性元数据的时候要尽量的提取出任官关于这个对象所讲述的故事,这些才是人们能记住的和习惯搜索的细节。

我们会发现,机械生成的元数据常常是不靠谱的,如在UCH系统下发布日志的时候系统会自动根据标题进行机械分析生成的一些元数据。

而充分利用手工元数据(handcrafted metadate)是提高可查找性的一个好方法。

最常见的例子就是我们见到的Tag。

Tag就是一种用户自创的元数据,
其特点是无层次结构、自定义。

比如这张Flickr照片下的手工元数据就为在Flickr 上查找提供了更多的方便。

相关文档
最新文档