第七章-多媒体信息检索

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• ②颜色数:通常,图片颜色数的可能的取值有:2色
(这时图片只有黑白两色)、16色、256色、16位增强色 (共216即65536种颜色)、24仿真彩色(共224即 16777216种颜色)等。自然图片的颜色数越多,图片的 视觉效果就越好。
图片文件的格式类型
位图:是由许多个像素点组成的图片,相应的图片文件记 录了图形或图像的每一个像素点的位置及代表该像素颜色 的数值等信息。根据有无压缩或压缩的方法等,该类型的 图片文件又分为许多种格式,如:.bmp图 、.tif图 、.gif 图 、.jpg图。
AVI文件使用的压缩方法有好几种,主要使用有损压缩,压缩比高。 MOV文件:MOV文件格式是Quick for Windows视频处理软件所选
用的视频文件格式,与AVI文件格式相同,MOV文件也采用Intel公 司的Indeo视频有损压缩技术以及视频信息与音频信息混排技术,一 般认为,MOV文件的图像质量较AVI格式好。它是Macintosh计算机 用的视频文件格式。 MPG文件格式:PC机上的全屏幕活动视频的标准文件为MPG格式文 件,也称为系统文件或隔行数据流。 DAT文件格式:DAT是Video CD或Karaoke CD(卡拉 OK)数据文 件的扩展名,也是基于MPEG压缩方法的一种文件格式。 DIR文件格式:DIR是Macromedia公司使用的Director多媒体著作工 具产生的电影文件格式。
多媒体信息检索:是多媒体信息的特征元数据提 取、索引建库,相似度匹配运算,识别和返回用 户所需信息,通过与用户之间的反馈,不断优化、 调整显示结果的过程。
多媒体信息的特点
数据量庞大 数据类型繁多 相关性强,同步性高 动态性强
多媒体信息的分类
按作用于人体感官形式划分
– 视觉类媒体:点阵图像、矢量图形、动画、视频、符号和文字等 – 听觉类媒体:波形声音、语音和音乐等 – 触觉类媒体:环境媒体,如皮肤感觉的温度、湿度 – 活动媒体 – 抽象事实媒体
矢量图:是计算机通过数学运算而产生的图形,而不是像 位图那样逐点描述的,因此,该图形所占容量很小,而且 它的显示效果不受大小或显示器分辨率的影响。
矢量图的文件格式视生成它的软件的不同而不同。矢量图 形格式也很多,如Adobe Illustrator的*.AI、*.EPS和 SVG、AutoCAD的*.dwg和dxf、Corel DRAW的*.cdr、 windows标准图元文件*.wmf和增强型图元文件*.emf等 等。
数字视频文件格式
AVI:Video for Windows所使用的文件称为音频-视频交错文件 (Audio-Video Interleaved),文件扩展名为AVI。AVI格式的文件 将视频信号和音频信号混合交错地存储在一起,是一种不需要专门硬 件参与就可以实现大量视频压缩的视频文件格式。在各种多媒体演示 系统中被广泛应用。
MIDI文件的数据量要比波形音频文件小得多,可用于满足播放较长时 间的音乐需要。
MIDI音乐毕竟是电子合成模拟的,其声音效果远不如真实乐器的效果, 而且回放的质量受声卡的影响比较大。
视频
帧 :数字视频利用人的眼睛的视觉暂留原理,将 一系列顺序排列的静态画面连续播放,从而产生 动态效果,其中的每一个画面就是该视频文件的 一帧。
影像文件:主要指那些包含了实时的音频、视频 信息的多媒体文件,其多媒体信息通常来源于视 频输入设备,由于同时包含了大量的音频、视频 信息。 如AVI文件(.AVI ) 、QuickTime文件 (.MOV/.QT )、MPEG文件 (.M源自文库EG/.MPG/.DAT )、RealVideo文件 (.RM )。
MIDI是乐器数字接口(Musical Instuments Digital Interface)的英 文缩写,是数字音乐/电子合成乐器的统一的国际标准。
MIDI音乐是利用电子合成技术来模拟各种乐器音效的方法生成,它并 不对声音进行采样和量化,记录的也不是声音本身,它只是像记录乐 谱一样将每个音符记录为一个类似乐谱符号的数字,并且规定了各种 音调的混合发音,最后通过合成器将这些数字转化为对应的音效进而 组合成为音乐播出。
多媒体信息检索
南京中医药大学 文献检索教研室
教学内容
多媒体信息检索基础知识 多媒体信息检索的方式 多媒体信息检索的分类检索
概述
多媒体:把不同的但相互关联的媒体集成在一起 而产生的一种存储、传播和表现信息的载体,通 常包括文本、音频、图形、图像、动画和视频。
多媒体信息:是各种媒体的组合体,即将音频、 视频、图像和计算机技术、通信技术集成到同一 数字环境中,以协同表示更丰富和复杂的信息。
全运动播放:播放速度在30帧/s以上,播放的 效果才不会感到跳跃和闪烁,这样的播放速度即 所谓全运动播放。
全屏幕播放:视频的播放满足画面大小为640 x 480以上、颜色在256色以上,即可以在整个显示 器屏禁区域播放,而不仅仅是在一个小窗口播放, 即为全屏幕播放。
数字视频文件格式
动画文件:指由相互关联的若干帧静止图象所组 成的图象序列,这些静止图象连续播放便形成一 组动画,通常用来完成简单的动态过程演示;该 类型的图片文件又分为许多种格式,如:GIF文 件——.GIF。
按照国际电信联盟ITU-T 建议划分
– 感觉媒体 – 表示媒体 – 表现媒体 – 存储媒体 – 传输媒体
重点讨论的是感觉媒体和表示媒体,即声音、图形、图像、 文字、视频和动画等
图形与图像
图形与图像文件通常混称为图片文件。 特性
• ①分辨率 :图片文件都要在计算机的显示器屏幕上
显示出来,显示器是用均匀排列的像素来显示画面的, 因此文件也是由许多的像素来组成。一张图片其横行 的像素个数和竖列的像素个数便决定了该图片的大小。 如800×600,1024×768
声音
波形音频:是从真实的声音录制并数字化后而得到的一种声音文件, 这样的一个过程称为声音采样。采样频率越高,录制的声音效果就越 好,需要花费的代价是声音文件需要的存储空间加大了。波形音频文 件常见的格式有: Wave文件(*.wav) 、MPEG音频文件(.mp1 /.mp2/.mp3)、RealAudio文件(ra/.rm/.ram) 、WMA(.wma) 格式 。
相关文档
最新文档