多媒体技术第一章
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章
1.媒体是指承载信息的载体。按照ITU-T(CCTV)建议的定义。
2.媒体包括以下五种:感觉媒体(视觉,听觉,触觉)、表示媒体(图象,声音,视频,运动)、显示媒体(显示器,打印机,扬
声器,键盘,摄象机和运动平台)和传输媒体(光缆,电缆,电磁波,交换设备)存储媒体(磁盘,光盘)。
3.多媒体技术:以数字为基础,能够对多种媒体信息进行采集、编码、存储、传输、处理和表现,综合处理多种媒体信息并使之
建立有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。
4.多媒体∶是在不同应用环境中文本、图象、声音和视频等各种媒体的集成。是组合两种以上媒体的人机交互式信息传播媒体。
5.用户及计算机的信息交流采用的4种方式:人—人(经由计算机)、人—计算机、机—人和计算机—计算机。
6.多媒体数据库包括3个方面∶体系结构、数据模型和用户接口。
7.多媒体的主要特性为:多样性、集成性、交互性、非线性、实时性、信息使用的方便性和信息结构的动态性。
8.简答多媒体的关键特性?
答:多媒体的关键特性主要包括信息载体的多样性、交互性、集成性3个方面
(1)信息载体的多样性是相对与计算机而言的,指的就是信息载体的多样化,有人称之为信息多维化。
(2)交互性可以增加对信息的注意力和理解力,延长信息在头脑中的保留时间
(3)多媒体的集成性主要表现在两个方面,一是多媒体信息媒体的集成,二是处理这些媒体的设备与设施的集成9.多媒体的研究一般分为两个主要的方面:(1)是多媒体技术,主要关心基本技术层面的内容;
(2)是多媒体系统,主要重心在多媒体系统的构成与实现.
10.处理大批非规则数据主要有两个途径∶(1)是扩充现有的关系型数据库,
(2)是建立面向对象数据系统,以存储和检索特定信息.
11.多媒体技术主要包括:媒体处理基础技术、数据压缩技术、软硬件平台技术、基础环境技术、信息管理技术、通信与网络技术。
12.多媒体技术研究的主要内容?
答:1)多媒体技术的基础2)多媒体软硬件平台技术3)多媒体操作系统技术
4)多媒体信息管理与处理技术。
第二章
1.常见的媒体元素主要有∶文本、图形、图像、声音、动画和视频图像等。
2.媒体元素:多媒体的媒体元素是指多媒体应用中可显示给用户的媒体形式。常见的媒体元素主要有文本、图形、图像、声音、动画和视频图像等。
3.文本:文本是用字符代码及字符格式表示出来的数据。(计算机在进行文字处理时,依据的就是字符代码的识别,它是文本处理程序的基础,也是多媒体应用程序的基础)
4.图形:图形一般指用计算机绘制的几何画面,如直线、圆、矩形、任意曲线和图表等。
5.图形格式:图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。6.图像处理一般考虑三个因素:分辨率、图像灰度、图像的文件大小。
7.矢量图:在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。
8.图形的用途:图形主要用于表示线框型的图画、工程制图和美术字等。绝大多数CAD和3D软件使用矢量图形来做为基本图形存储格式。
9.用字节为单位表示图像文件的大小,描述方法为:高×宽×灰度位数/8
10.掩蔽:声音的响度不仅取决与自身的强度和频率,而且也依赖于同时出现的其他声音。声音的掩蔽特性常常用于声音的压缩。11.MIDI:与波形声音相比,MIDI数据不是声音而是指令,所以它的数据量要比波形声音少得多。12.电视主要有三种制式:即NTSC(525/60)PAL(625/50) 和SECAM(625/50)括号中的数字为电视显示的线行数和频率;视频文件的存储格式有:A VI、MPG MOV等。
13.在视频中有三个重要的技术参数:帧速数据量图像质量。
14.数字音频可以分为波形声音、语音和音乐。
15.计算机中音频技术主要包括声音的采集、数字化、压缩/解压缩以及声音的播放。
16.影响数字声音波形质量的主要因素有三个:采样频率、采样精度和通道数。
17.通道数一般分为单声道和立体声道,单声道产生一个波形,立体声道产生两个波形。
18.媒体的种类:可以分为视觉类媒体、听觉类媒体、触觉类媒体、嗅觉类媒体和味觉类媒体。19.媒体的性质和特点:媒体数据具有一下性质:第一,媒体是有格式的;第二,不同媒体表达信息的特点和程度各不相同;第三,媒体之间可以相互转换,但可能会丢失部分原始信息,或增加一些伪信息;第四,媒体之间的关系也具有丰富的信息。20.人的听觉频率范围是:20Hz~20KHz
21.人们对声音的感觉主要有音量、音调和音色3个指标。
22.最基本的声音数字化方法是取样—量化法,它分成3个步骤:采样、量化和编码。
第三章
1.评价一种数据压缩技术的性能好坏主要有3个关键指标:压缩比、图像质量、压缩和解压的速度。
a)第一指标是压缩比,压缩性能常常用压缩比来定义,也就是压缩过程中输入数据量和输之比。
b)第二指标是图像质量,这与压缩的类型有关。压缩方法可以分为无损压缩和有损压缩。
c)第三指标是压缩解压速度,希望压缩和解压速度要快。
2.无损压缩:是指压缩以及解压过程中没有损失原始图像信息,不必担心图像的质量。
3.有损压缩:是指压缩以及解压过程中对原始图像做一些改变,虽然压缩前后图像不完全相同,
4.简答数据冗余的类型?
答:(1)空间冗余(2)时间冗余(3)信息熵冗余(4)视觉冗余(5)听觉冗余(6)其他冗余,包括结构冗余,知识冗余。5.数据压缩方法的分类:
㈠根据解码后数据与原始数据是否完全一致进行分类,压缩方法可被分为有失真编码(不可逆压缩法)和无失真编码(可逆压缩法)两大类。
㈡根据编码原理进行分类,大致有:预测编码、变换编码、统计编码、分析-合成编码、混合编码和其他一些编码方法。其中统计编码(包括行程编码、LZW编码、霍夫曼编码)是无失真的编码,其他编码方法基本上都是有失真的编码。
6.常用数据压缩方法的基本原理:统计编码、预测编码、变换编码。
(1)统计编码(无失真编码):它包括行程编码、LZW编码和霍夫曼编码等,属于无失真编码。它是根据信息出现概率的分布特性而进行的压缩编码。
1、行程编码(RLE)其算法是:重复的数据值序列用一个重复的次数和单个数据代替。格式:先写控制符,其是重复的次数,再是被重复字符。
2、LZW编码Lempel-Ziv-Welch Encoding ,简称 LZW 的压缩算法。 LZW压缩算法的基本概念:LZW压缩有三个重要的对象:数据流(CharStream)、编码流(CodeStream)和编译表(String Table)。
3、霍夫曼编码霍夫曼压缩是个无损的压缩算法
4、算术编码:把一信源集合表示为实数线上的0-1之间的一个区间。
(2)预测编码(有失真编码):是根据原始的离散信号之间存在着一定关联性的特点,利用前面的一个或多个信号对下一个信号进行预测,然后对实际值和预测值的差(预测误差)进行编码。包括一下两种预测编码:
1、DPCM 差分脉冲编码调制,(PCM 脉冲编码调制:是将原始的模拟信号经过时间采样,然后对每一样值进行量化,做为数字信号传输。)
2、ADPCM是自适应差分脉冲编码。
(3)变换编码(有失真编码):变换编码系统中压缩数据有3个步骤:变换、变换或采样和量化。是JPEG、MPEG、H.261、H.263等所采用的基本算化.有以下两种:
1、最佳变换(K-L变换)。
2、离散余弦(DCT变换)典型的准最佳变换有DCT、DFT(DCT是从DET引出的)、WHT和HrT,最常用的是DCT。
(4)分成-合成编码又分为1、量化编码2、小波变换编码3、分形图像编码4、子带编码。
7.音频压缩信号的基本方法:
1.无失真压缩包括:霍夫曼编码、行程编码。
2.有失真压缩包括:(1)波形编码包括:全频带编码(PCM、DPCM、ADPCM)、子带编码(自适应变换编码ATC、心理学模型)、矢量量化(量化编码)。
(2)参数编码包括:线性预测。
(3)混合编码包括:矢量和激励线性预测VSELP、多脉冲线性预测MP-LPC、码本激励线性预测CELP。
8.图像和视频压缩方法:
1.无失真压缩包括:霍夫曼编码、行程编码、算术编码、LWZ编码。
2.有失真压缩包括:预测编码(运动补偿)、交换编码(DCT变换、小波变换编码、子带编码)、模型编码(分形编码)、基于重要性(虑波、子采样、矢量量化)、混合编码(JPEG、MPEG、H.26L)等六种。
9.简述R、G、B方式、Y、I、Q方式和Y、U、V方式的关系?
答:1.原始的彩色图像,一般由红、绿、蓝3种基色的图像组成。然而H(色调)、S(饱和度I(光的强度或亮度)彩色空间比R、G、B彩色空间更符合人的视觉特性。
2. R、G、B方式、Y、I、Q方式和Y、U、V方式三者之间是互相有关联的,Y、U、V 与R、G、B之间可以转换。
3.原始图像的R、G、B信号,经过坐标空间转换,生成信号Y、U、V信号。再经A/D变换(抽样、量化)得到数字信号。10.音频信号可分为:电话质量的语言、调幅广播质量的音频信号、高保真立体声信号。
1.电话质量语音信号的是10Hz-20KHz用标准的PCM,采样频率为8KHz,量化为数为8bit,信号速率为64kbit/s,采用G.711标准。
2.语音信号的频率范围是300Hz-3.4KHz。
3.调幅广播质量音频信号的频率范围是50Hz-7KHz。采样频率为16KHz,量化为数为14bit,信号速率为224kbit/s,采用
G.712标准。
4.高保真度音频信号的频率范围是10Hz-20KHz。采样频率为44.1KHz,量化为数为16bit,信号速率为705kbit/s,