多媒体技术复习资料
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多媒体技术
感觉媒体直接作用于人的感官、使人能直接产生感觉的一类媒
体。声音、文字、图形和图像,物体的质地、形状、温度
表示媒体为了加工感觉媒体而构造出来的一种媒体。各种编码:语音编码、图像编码等
显示媒体感觉媒体与通信电信号进行转换的一类媒体可分为:输入表现媒体,输出表现媒体
存储媒体用于存放表示媒体的一类媒体如:硬盘、光盘等
传输媒体用来将表示媒体从一处传送到另一处的物理传输介质,如各种通信电缆。
多媒体概念以数字化为基础,能够对多种媒体信息进行采集、编码、存储、传输、处理和表现,综合处理多种媒体信息并使之建立起有机的逻辑联系,集成为一个系统并能具有良好交互性的技术。简言之, 多媒体技术就是计算机综合处理声、文、图信息, 具有多样性、集成性和交互性
多媒体的关键特性
多样性—适应了信息载体的多样性 交互性—易于人和计算机的交互集成性—实现了信息处理的集成性
多媒体计算机的关键技术
视频音频信号获取技术;多媒体数据压缩编码和解码技术;视频音频数据的实时处理和特技;视频音频数据的输出技术。
要把一台普通的计算机变成多媒体计算机需要解决哪些关键技术?答:视频音频信号的获取技术;多媒体数据压缩编码和解码技术;视频音频数据的实时处理和特技;视频音频数据的输出技术。
多媒体计算机的关键技术及其主要应用领域。
答:多媒体计算机的关键技术是:①视频音频信号获取技术;②多媒体数据压缩编码和解码技术;③视频音频数据的实时处理和特技;
④视频音频数据的输出技术。多媒体计算机的主要应用领域:①多媒体数据库和基于内容的检索;②多媒体通信;③多媒体创作工具。
音频处理技术
什么是模拟音频和数字音频?它们的特点是什么?
声音是机械振动。振动越强,声音越大,话筒把机械振动转换成电信号,模拟音频技术中以模拟电压的幅度表示声音强弱。在计算机内,所有的信息均是以数字表示的。各种命令是不同的数字,各种幅度的物理量也是不同的数字。当然,语音信号也是由一系列数字来表示,称之为数字音频。数字音频的特点是保真度好,动态范围大。模拟声音在时间上是连续的。数字声音在时间上是断续的。
什么是音频信息的数字化?
计算机内的音频必须是数字形式的,因此必须把模拟音频信号转换成用有限个数字表示的离散序列,即实现音频数字化。在这一处理技术中,涉及到音频的采样、量化和编码。
声音数字化的两个步骤是什么:
声音数字化的两个步骤是:采样和量化。采样就是每间隔一段时间就读一次声音信号的幅度,量化就是把采样得到的声音信号幅度转换为数字值。时间 上的离散叫采样,幅度上的离散称为量化。
什么是采样和量化?
音频实际上是一个连续的信号,或称连续时间函数x(t)。用计算机处理这些信号时,必须先对连续信号采样,即按一定的时间间隔(T)取值, 得到x(nT)(n为整数)。T称采样周期,1/T称为采样频率。称x(nT)为离散信号。离散信号x(nT)是从连续信号x(t)上取出的一部分值,在满足采样定理的条件下,可以用x(nT)通过数字---模拟转换恢复出x(t)。为了把采样序列x(nT)存入计算机,必须将样值量化成一个有限个幅度值的集合x(nT)。通常情况下用二进制数字表示量化后的样值。
常用的音频采样频率有哪些?
常用的音频采样频率有:8kHz、11.025kHz、16kHz、22.05kHz、37.8kHz、44.1kHz、48kHz等。如果采用更高的采样频率,还可以做出DVD的音质。
音频编码的目的是什么?从哪些方面来考虑音频信号的冗余度?
音频编码的目的在于压缩数据。在多媒体音频数据的存储和传输中,数据压缩是必须的。通常数据压缩造成音频质量的下降、计算量的增加。因此,人们在实施数据压缩时,要在音频质量、数据量、计算复杂度三方面进行综合考虑。从信息保持的角度讲,只有当信源本身有冗余时,才能对其进行压缩。根据统计分析结果,语音信号中存在多种冗余,其最主要部分可以分别从时域和频域来考虑。另外,由于语音主要是给人听的,所以也要考虑人的听觉感知机理。因此,可以从以下三个方面来考虑音频信号的冗余度:时域信息的冗余度频域信息的冗余度人的听觉感知机理。
时域信息和频域信息的冗余度体现在哪些方面?如何从人的听觉感知机理方面对音频信息进行压缩?
时域信息冗余度体现在以下几个方面:幅度的非均匀分布样本间的相关周期之间的相关基音之间的相关静音系数长时自相关函数频域信息冗余度体现在以下几个方面:非均匀的长时功率谱密度语音特有的短时功率谱密度人的听觉感知机理方面人的听觉
具有掩蔽效应人耳对不同频段的声音的敏感程度不同人耳对语音信号的相位变化不敏感。
音频编码是如何分类的?
音频编码的分类如下:(1)基于音频数据的统计特性进行 编码,其典型技术是波形编码。其目标是使重建语音波形保持原波形的形状。PCM(脉冲编码调制)是最简单最基本的编码方法。它直接赋予抽样点一个代码,没有进行压缩,因而所需的存储空间较大。为了减少存储空间,人们寻求压缩编码技术。利用音频抽样的幅度分布规律和相邻样值具有相关性的特点,提出了差值量化(DPCM)、自适应量化(APCM)和自适应预测编码(ADPCM)等算法,实现了数据的压缩。波形编码适应性强,音频质量好,但压缩比不大,因而数据率较高。(2)基于音频的声学参数,进行参数编码,可进一步降低数据率。其目标是使重建音频保持原音频的特性。常用的音频参数有共振峰、线性预测系数、滤波器组等。这种编码技术的优点是数据率低,但还原信号的质量较差,自然度低。将上述两种编码算法很好地结合起来,采用混合编码的方法。这样就能在较低的码率上得到较高的音质。如码本激励线性预测编码(CELP)、多脉冲激励线性预测编码(MPLPC)等。(3)基于人的听觉特性进行编码:从人的听觉系统出发,利用掩蔽效应,设计心理声学模型,从而实现更高效率的数字音频的压缩。其中以MPEG标准中的高频编码和DolbyAC-3最有影响。