第5章 数字媒资的编目与检索

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《数字媒体资产管理》
第5章 数媒资产的编目与检索
刘士军 lsj@sdu.edu.cn
本章内容

5.1 数字媒体资产的编目技术 5.2 数字媒体资产的检索技术
2
数字媒体资产管理
1.编目技术



所谓编目就是对信息资源的形式及内容特征进行分析、 选择和记录,然后再将这些描述信息按照一定的规则 有序化地组织起来 数字媒体资产的编目是对音、视频对象整理和提炼的 过程,将其中有价值的画面和资料的相关信息整理成 为独立的文件,便于检索和再利用 编目是数字媒体资产应用的基础和关键,各类音、视 频节目和素材资料的入库必须经过科学严格的编目, 否则对于海量存储系统来说,其后果可能是永远也找 不到该资料

——片段

Biblioteka Baidu
——场景


——镜头

18
数字媒体资产管理
编目系统的业务流程

通过一次编目完成从导人的数据或者EDL表中提取相关信息。 二次编目对一次编目后的信息进行加工、处理,对素材进行分 类、增加主题词、详细说明等;正常编目工作完成之后,提供 对已编目资料进行多次编目的功能,丰富并完善编目的信息
视音频资料元数据的层次、结构
数字媒体资产管理
片段层
题名 主题 描述 创建者 其他责任者 出版者 版权 语种 日期 类型 格式 标识符 空间覆盖范围 来源 关联 题名 主题 描述 创建者 其他责任者 出版者 版权 语种 日期 类型 格式 标识符 空间覆盖范围 来源 关联 题名 主题 描述 格式 关联
场景层
22
数字媒体资产管理
编目系统的描述

编目工作站

编目工作站的客户端软件,主要用于生成对编目数据库的初 级新闻资料编目文件进行详细编目处理,建立稿件关联,并 将生成的编目数据上载到编目数据库服务器中,由它完成数 据入库的工作
23
数字媒体资产管理
编目系统的描述

编目数据库服务器



编目数据库服务器主要用于创建和维护编目数据库和用户身 份数据库 建立一个结构严谨、数据完整的编目据库对媒体资产管理的 后期运行非常重要 通常系统构建编目数据库结构时应采用分层结构,采用挑选 编目标准字段子集,并过字段映射的方式建立自己的编目数 据库结构
24
数字媒体资产管理
编目工作方式

媒资系统数据编目必须同时支持自动和手动两种方式

自动方式主要用于基本编目数据的提取。如关键帧的提取可 在采集时,利用软件画面比较技术,实时或后台自动提取切 换镜头转换帧,见图所示
以此类推……
比较 初始化参考关键帧 关键帧
比较 关键帧
25
数字媒体资产管理
编目工作方式
3
数字媒体资产管理
传统的卡片目录
4
种植优良新品种/李登春等 主编.—北京 32 气象出版社,1992.08 4015 298页; 7-5029-0961-3 (平) 5.50元. 92303030-31(2) ○ 数字媒体资产管理 S
国际联机检索

Dialog OpenAccess


美国DIALOG系统是世界上最早和最大的专业情报检索系统, 也是我国科技界广泛使 用的系统。该公司自1972年起,开 始为用户提供服务工作 DIALOG系统拥有600多个数据库。其数据库类型主要 有四种:即文献型、数值型、名录字典型、全文型。涉及4 0多个语种,收录的信息涉及的专业范围广泛 中国高等教育文献保障系统(China Academic Library & Information System,简称CALIS 联机合作编目始于2000年3月
9
数字媒体资产管理
MARC编目的历史


1965年美国国会图书馆首先研制; 1966年9月生产出试验性磁带—MARCI式; 1967年试制出MARCII式; 1969年正式向该国图书馆订购馆发行MARCII式英文 图书磁带; 1971年成为美国国家标准; 1973年其格式成为国际标准(ISO2709)
8
数字媒体资产管理
机读目录MARC编目



MARC编目是通过编制目录来控制文献的存在状况及 存在特征,对文献信息进行整序和控制,以达到利用 馆藏资源、交流书目和资源共享的目的 MARC编目是使文献有序化,包括对文献信息的著录、 标引和组织。它是图书馆的基础工作,是图书馆读者 服务工作得以顺利开展的根本保证 MARC数据就是元数据。是详细的、严谨的、专业性 要求高的一种元数据

——元数据


——素材

素材是指具有使用价值的、可用于制作节目的视音频资料
17
数字媒体资产管理
与编目相关的术语和定义

——节目

节目是指具有独立主题意义的、已经制作完成的完整的视音 频资料 片段是节目或素材中一段连续的视音频资料,由—个以上相 互关联的场景构成 场景是指节目或素材中背景或场景不变的一段连续视音频部 分,由时间或空间上相关的一个或多个镜头组成 镜头指同一摄像机一次摄录的连续画面

媒资系统数据编目必须同时支持自动和手动两种方式



还可以通过422协议,读取磁带上的U – bit或IC芯片信息, 实时或后台捕获画面获取转换帧 自动编目的另一个应用是自动继承业务系统中产生的元数据, 如素材的压缩格式、时码、人员信息等 此外,编目系统还要支持通过浏览高或低码流数据,手动选 取关键帧,或按时间间隔生成序列关键帧
20
数字媒体资产管理
编目系统的描述

编目系统应具备的功能




(1)编目系统要符合编目标准,建立节目、片段、场景、镜头 具有层次关系的视音频元数据结构 (2)编目系统要能够浏览低码流的视音频数据对象,同时可以 方便快速地浏览和帧精度定位 (3)编目系统要能够对关键帧进行浏览和编辑,并可以实现自 动或手动进行节目或节目片段的关键帧分析和提取 (4)编目系统可以采用各种灵活的字段结构以及编目输入界面, 能够灵活方便的处理各种复杂编目元数据,如受控词处理、 重复字段处理、绑定关系处理、分类树处理等
27
数字媒体资产管理
检索系统的流程


通过浏览器直接进入检索页面 输入检索条件或节目信息,查询浏览库存节目数据 检索命中结果可立即浏览低码率视音频信息,并可察 看关键帧信息 满足需要的节目可提交下载申请,或设置入点、出点 信息后提交该片段下载申请
检索用户
输入检索条件
检 索 开 始
接收检索请 求

CALIS联合目录


5
数字媒体资产管理
CALIS联合编目系统例子
6
数字媒体资产管理
7
数字媒体资产管理
编目标准

目前一般类资料编目中可借鉴的标准主要有 UNIMARC标准和CNMARC标准



MARC就是机读目录,即Machine-Readable Catalogue,称 机器可读目录,是计算机编目的产品 UNIMARC ( Universal Machine-Readablee Catalogue,通 用机读目录)于1976年在USMARC的基础上由国际图书馆 联合会制定,目的是能够适应不同文种和文献类型间数据交 换的需要 CNMARC我国依据UNIMARC制定的中国机读目录格式,主 要用于国内图书情报部门和其他国家书目机构之间的信息交 换与检索
15
数字媒体资产管理
我国广播电视音像资料编目规范
节目层



国家广电总局的编目规范规 定,视音频资料的元数据总 体上分为四个层次,从上到 下分别为节目层、片段层、 场景层和镜头层 各层次分别包含相应的元素 类,在元素类下面是各层对 象的具体编目元数据项 对视音频资料编目时,应从 节目层开始著录,片断层、 场景层、镜头层著录可以根 据实际需要灵活选择


编目的内容有些是非常简单的物理特征,而有些则需 要编目人员具有高度的专业知识才能完成标引;用户 可以根据自身的需要进行多层次编目 引入编目签章和审核签章的概念,用于控制编目流程 与编目质量
数字媒体资产管理
26
2.数字媒体资产的检索技术



检索是系统的窗口,是数字资产再利用的关键,随着 数字媒体资产内容的日益益积累,如何在海量视音频 资料中快速检索出所需要的内容就显得至关重要 传统的基于文本信息(即关键词)的检索方法是建构 于关系型数据库基础之上的,是结构化的方法,因为 其述能力有限、主观性强、手工标注等原因,已经不 能满足海量数字媒体资产检索的需求 目前基于内容的视频分析和检索技术成为应用的热点
30
数字媒体资产管理
检索方式

1.客户端检索软件与WEB检索方式
镜头层
镜头层
场景层
镜头层
镜头层
题名 主题 描述 日期 格式 关联
16
与编目相关的术语和定义

——著录、标引

著录、标引是指对视音频资料的内容和形式特征进行分析、 归纳和记录的过程 著录项是用以揭示视音频资料内容和形式特征的记录项目 元数据是用于描述数据的数据,指对视音频资料的描述信息

——著录项

进行检索
输出结果
检索结果
28
数字媒体资产管理
检索系统的数据流程

(1)发出检索指令 (2)传递给应用服务器解析 (3)查询数据库检索 (4)传递回WEB服务器 (5)WEB服务器传递给用户
(6)查看流媒体数据指令给应用服务器 (7)URL文件定位给流媒体服务器 (8)从媒资在线存储区找到媒体文件 (9)通过RTP/UDP将流媒体文件数据传 递给用户端
编 目 开 始 接收工作流 任务 提取初编目信息 或待编目信息
工作流派发任务
编目审核 合格
编目入数据 库 节目层编目 片段层编目 不合格 编目结束
场景层编目 精编目环节
镜头层编目 可串并行
进入下一工作流
19 数字媒体资产管理
编目系统的描述

编目系统的基本原则

高效性原则 易用性原则 开放性原则 高可靠性原则
12
数字媒体资产管理
Z39.50信息检索协议

信息检索协议

ANSI/NISO Z39.50 ISO 23950 MARC数据的交换和共享通过Z39.50协议实现 http://lcweb.loc.gov/z3950/agency/

Z39.50 维护管理机构 – 美国国会图书馆

13
数字媒体资产管理
3 媒资数据库
应用服务器
2 1、6 5
4
用户检索
Web服务器
7
9
29
流媒体服务器
数字媒体资产管理
8
媒资在线存 储区
检索系统的功能要求

1.快速整合检索能力 2.支持混合检索并提供友好的查询界面 3.向用户提供多种用途的检索服务 适应网络化、智能化和个性化的检索方式是视音频内 容检索实现的目标
21
数字媒体资产管理
编目系统的描述

编目系统应具备的功能




(5)编目系统应支持工作流程的管理、运行和配置,能够实现 多结点、多用户的协调流水线方式的编目生产,以提高编目 效率 (6)在整个编目流水线上,应具备审核机制,并可以对任何未 能通过审核的编目元数据建立返工机制 (7)编目管理要能够配置各种编目参数,包括流程的配置,同 时能够提供对不同流程的编目功能定义以及功能权限的限制 (8)编目管理要能够方便地对整个或单个的编目流程进行数据 统计和分析,对编目流程、在编条目进行工作量统计计算, 以便于管理人员进行工作量统计和流程管理。
Z39.50原理

Z39.50的服务和机制

11种机制与相应服务、服务类型、启动方式 但称之为源端( Origin)与目的端 (Target)

Z39.50 是客户机、服务器模式

Client/origin
14
Server/target
数字媒体资产管理
我国广播电视音像资料编目规范



音频媒体资料有其自身的特殊属性,广电总局于2004 年10月13日发布了广播电影电视行业标准《广播电视 音像资料编目规范第一部分:电视资料》(GY/T 202. 1 -2004) 该标准提出的编目项目对广播电视节目采编、制作、 存储、交换、播出、接收等各个环信息的规范化收集 整理起到指导作用,同时方便海量的音像、文字和图 片息资料的再利用 我国编目规范中使用的元数据标准为都柏林核心 ( Doulin Core,DC)元数据集
10
数字媒体资产管理
UNIMARC

国际机读目录,1972年由IFLA推出。 随后产生了

英国 — UKMARC; 日本 — JMARC; 中国 — CNMARC
11
数字媒体资产管理
CNMARC——中国机读目录通讯格式


1979年,北京图书馆、北京大学图书馆、清华大学图 书馆、中国科学院图书馆等共同引进并研究了美国国 会图书馆的MARC磁带,成立了北京地区机读目录研 制协作组,于1992年出版 1995年正式成为文化行业标准
相关文档
最新文档