多媒体选择、填空、简答、计算
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1.多媒体的含义;(重点)
指能够同时获取、处理、编辑、存储和展示两个以上不同类型信息媒体的技术,这些技术包括:文字、声音、图形、图像、动画和视频等
媒体的种类:感觉、表示、显示、存储和传输媒体
2.多媒体技术的定义:计算机综合处理文本、图形、图像、音频、视频等多媒体信息,使多种信息建立逻辑连接,集成为一个系统并具有交互性
3.多媒体技术的主要特征;(重点)
多样性:
把机器处理的信息多维化,使之在信息交互的过程中具有更加广阔和更加自由的空间。
多媒体的信息多维化不仅是指输入,而且还指输出,目前主要包括视觉和听觉两个方面集成性:
主要表现在两个方面:一是多媒体信息媒体的集成(既各种信息媒体尽管可能会是多通道的输入或输出,但应该为一体)。
另一是处理这些设备的集成(既这种集成包括信息的多通道统一获取,多媒体信息的统一存储于组织,多媒体信息表现合成等各个方面)
交互性:交互性
向用户提供更加有效的控制和使用信息的手段,为应用开辟了更加广阔的领域。
当我们完全地进入到一个与信息环境一体化的虚拟信息空间自由遨游时,这才是交互式应用的高级阶段,这就是虚拟现实
4.多媒体技术研究的主要内容。
(重点)
多媒体技术:主要关心基本技术层面的内容;
多媒体系统:主要重心在多媒体系统的构成与实现。
还有专门研究多媒体创作与表现的,则更多的属于艺术的范畴。
5.媒体的种类
感觉媒体
表示媒体:为了加工、处理和传输感觉媒体而人为研究、构造的媒体。
如语言编码、图像编码、声音编码、电报码等。
显示媒体:指感觉媒体传输中电信号和感觉媒体之间转换用的媒体。
输入显示媒体:键盘、鼠标、扫描仪、麦克风
输出显示媒体:显示器、打印机、音箱
存储媒体:如纸张、磁盘、光盘等。
传输媒体;如电话线、电缆、光纤等。
第二章
媒体的种类与特点(重点)
听觉媒体技术(重点)加//
视觉媒体技术(重点)加//
触觉媒体技术
多媒体媒体元素是指多媒体应用中可显示给用户的媒体形式。
常见的媒体元素主要有文本、图形、图像、音频、动画、视频等。
1、文本(text)
文本分为非格式化文本文件和格式化文本文件。
非格式化文本文件:只有文本信息没有其他任何有关格式信息的文件,又称为纯文本文件。
如“.TXT ”文件。
格式化文本文件:带有各种文本排版信息等格式信息的文本文件。
如“.DOC ”文件。
2、图形(graphics)
图形一般指用计算机绘制的画面,如直线、圆、圆弧、矩形、任意曲线和图表等。
图形的格式是一组描述点、线、面等几何图形的大小、形状及其位置、维数的指令集合。
在图形文件中只记录生成图的算法和图上的某些特征点,因此也称矢量图。
3、图像(image)
图像是指由输入设备捕捉的实际场景画面,或以数字化形式存储的任意画面。
位图是将一副图像在空间上离散化,即将图像分成许许多多的像素(pixel),每个像素用若干个二进制位来指定该像素的颜色或灰度值和亮度。
图像处理的三个因素
分辨率
图像灰度
图像文件的大小
4)声音的三要素(音强(响度),音调,音色。
)
***音频的数字化过程
a采样:将声音信号在时间上离散化,即每隔一个时间间隔在模拟声音波形上取一个幅度值。
时间间隔称为采样周期。
b 量化:量化过程是对模拟信号的幅度进行离散化。
对声波每进行一次采样,其声音幅值用一个二进制位数表示。
c 编码:把声音数据写成计算机二进制数据形式,称为编码。
在实际中,量化和编码是同时进行的。
d压缩
对声音进行采样用奈奎斯特采样定理来决定采样的频率,标准的采样频率有11.025kHz、22.05kHz和44.1kHz(11.025两次乘2)
数字音频的技术参数
数字音频的质量取决于采样频率、采样精度和通道数
存储量=采样频率×量化位数/8×声道数×时间
声音的数据量= (采样频率X每个采样位数X声道数)/8(B/s)
***MIDI音频的特点
*用乐谱指令代替声音数据
*有效记录和重现各种乐器声音
*数据量较小,占用存储空间极小
*编辑灵活
*MIDI音频与波形音频完全不同
2.3.1 视觉媒体元素
(1)文本。
(2)图形
(3)图像(图像处理时要考虑的三要素:分辨率、图像灰度和图像文件大小(高*宽*灰度位数)/8)
(4)视频
*视频中的技术参数:
帧速:利用快速变换帧的内容而达到运动的效果
数据量:如不计压缩,数据量就是帧速乘以每幅图像的数据量。
图像质量:与原始图像的数据量及视频压缩的倍数有关
*动画:是运动的图画,将一幅幅静态的图像进行连续播放(造型动画和帧动画)
色彩的三要素:色彩可用色调、亮度和饱和度三个特征来综合描述。
***3.1.2 数据冗余的类型(1)
空间冗余、时间冗余、信息熵冗余、结构冗余、知识冗余、视觉冗余、其他冗余***3.1.3 数据压缩技术的性能指标(2)
压缩比:压缩前后文件大小之比,越高越好,但受速度、消耗资源等的影响
图像质量:还原后与原图像相比,评估的方法有客观评估和主观评估
压缩和解压的速度:与压缩方法和压缩编码的算法有关,一般压缩比解压缩计算量大,因而压缩比解压缩慢
***预测编码的思想
a线性预测
基本原理是基于图像中相邻像素之间具有较强的相关性。
每个像素可根据已知的前几个像素来作预测。
因此在预测编码中,编码和传输的并不是像素采样值本身,而是这个采样值的预测值与其实际值之间的差值。
包括差分脉冲编码调制DPCM和自适应差分脉冲调制编码ADPCM。
适用于声音和图像数据的压缩。
是一种有失真编码。
b非线性预测(不讨论)
***JPEG算法的计算步骤(4)
块准备、量化、Z字形编码、对直流系数DC的编码、对交流AC的编码、熵编码
***在MPEG中将图像分为3种类型:(5)
I图像 (帧内图):利用图像自身的相关性压缩,提供压缩数据流中的随机存取的点。
采用基于 ADCT 的编码技术, 压缩后,每个像素为 1~2 比特。
P图像 (预测图):用最近的前一个I图像(或P图像)预测编码得到(前向预测)。
也可以作为下一次预测的参照图像。
B图像 (双向预测)。
B图像在预测时,既可使用了前一个图像作参照,也可使用下一个图像做参照或同时使用前后两个图像作为参照图像。
4.1.1声卡的功能与工作原理
1. 声卡的功能
(1)音频的播放
(2)音频的录制:形成wav格式文件
(3)语音通信
(4)MIDI电子音乐合成
(5)音频源的混合
***差分脉冲编码调制DPCM的基本思想?(3)
是降低每个像素所需平均比特数最实用的方法。
对于绝大多数图像来说,在局部空间和时间上是高度相关的,因而可以在已得到像素的基础上通过对当前像素的预测来减少图像的数据量。
基本原理:它不是对每一样值都进行量化,而是预测下一个样值,并量化实际值和预测值之间的差,以达到压缩的目的。
X
备注:看编码行程、霍夫曼、算术、LZW。