多媒体技术教程课后习题答案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第1章 多媒体技术概要
1.1 多媒体是什么?
多媒体是融合两种或者两种以上媒体的一种人-机交互式信息交流和传播媒体。使用的媒体包括文字、图形、图像、声音、动画和视像(video)。
1.4 无损压缩是什么?
无损压缩是用压缩后的数据进行重构(也称还原或解压缩),重构后的数据与原来的数据完全相同的数据压缩技术。
无损压缩用于要求重构的数据与原始数据完全一致的应用,如磁盘文件压缩就是一个应用实例。根据当前的技术水平,无损压缩算法可把普通文件的数据压缩到原来的1/2~1/4。常用的无损压缩算法包括哈夫曼编码和LZW 等算法。
1.5 有损压缩是什么?
有损压缩是用压缩后的数据进行重构,重构后的数据与原来的数据有所不同,但不影响人对原始资料表达的信息造成误解的数据压缩技术。
有损压缩适用于重构数据不一定非要和原始数据完全相同的应用。例如,图像、视像和声音数据就可采用有损压缩,因为它们包含的数据往往多于我们的视觉系统和听觉系统所能感受的信息,丢掉一些数据而不至于对图像、视像或声音所表达的意思产生误解。
1.9 H.261~H.264和G.711~G.731是哪个组织制定的标准?
国际电信联盟(ITU)。
1.10 MPEG-1,MPEG-2和MPEG-4是哪个组织制定的标准?
ISO/IEC ,即国际标准化组织(ISO)/ 国际电工技术委员会(IEC)。
第2章 无损数据压缩
2.1假设{,,}a b c 是由3个事件组成的集合,计算该集合的决策量。(分别用Sh ,Nat 和Hart 作
单位)。
H 0 = (log 23) Sh = 1.580 Sh = (log e 3) Nat = 1.098 Nat
= (log 103) Hart = 0.477 Hart
2.2 现有一幅用256级灰度表示的图像,如果每级灰度出现的概率均为()1/256i p x =,
0,,255i =,计算这幅图像数据的熵。
221
11()()log ()256(
log )256256
n i i i H X p x p x ==-=-⨯⨯∑=8 (位), 也就是每级灰度的代码就要用8比特,不能再少了。
2.3现有8个待编码的符号07,,m m ,它们的概率如练习_表2-1所示,计算这些符号的霍
夫曼码并填入表中。答案不唯一)。
2.4 现有5个待编码的符号,它们的概率见练习表2-2。计算该符号集的:(1) 熵;(2)霍夫曼
码;(3) 平均码长。
21
()()log ()n
i i i i H a p a p a ==-∑=-0.4×2log (0.4)-2×0.2*2log (0.2)-2×0.12log (0.1)
=0.4×1.3219+0.4×2.3219+0.2×3.3219=0.5288+-0.9288+0.6644=2.1220 (位) (2) 编码树和霍夫曼码
练习图2-1 编码树
编码表
(3) 平均码长
L 0.4+0.4+0.6+0.4+0.4=2.2(位/符号)
2.5 使用算术编码生成字符串games 的代码。字符g, a, m, e, s 的概率见练习表2-3。
g a
m
e
s
1.0
0.0
0.10.20.4
0.6
0.6
1.0
0.84
0.76
0.792
0.776
0.7776
0.7792
a m e s 0.77776
0.7776
练习图2-2 games 的算术码
2.10 你是否同意“某个事件的信息量就是某个事件的熵”的看法?
参考解答:“信息量(information content)是具有确定概率事件的信息的定量度量”,而“熵(entropy)是事件的信息量的平均值,也称事件的平均信息量(mean information content)”。
第3章 数字声音编码
3.1 音频信号的频率范围大约是多少?话音信号频率范围大约是多少?
(1) Audio: 20~20000 Hz (2) Speech: 300~3400 Hz
3.2 什么叫做模拟信号?什么叫做数字信号?
(1) 幅度或频率发生连续变化的一种信号。
(2) 以二进制代码形式表示有无或高低的一种信号。
3.3 什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?
(1) 采样:在某些特定的时刻对模拟信号进行测量的过程。
(2) 量化:幅值连续的模拟信号转化成为幅值离散的数字信号的过程。 (3) 线性量化:在量化时,信号幅度的划分是等间隔的量化。 (4) 非线性量化:在量化时,信号幅度的划分是非等间隔的量化。
3.4 采样频率根据什么原则来确定?
奈奎斯特理论和声音信号本身的最高频率。采样频率不应低于声音信号最高频率的两倍,这样就能把以数字表达的声音还原成原来的声音。
3.5 样本精度为8位的信噪比等于多少分贝?
48 分贝。
3.7 选择采样频率为22.050 kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,
计算录制2分钟的立体声需要多少MB(兆字节)的存储空间(1MB=1024×1024B)
(22050×2×2×2×60)/(1024×1024) =10.09 MB
3.8 什么叫做均匀量化?什么叫做非均匀量化?
(1) 均匀量化:采用相等的量化间隔对采样得到的信号进行量化。它是线性量化的另一种说法。
(2) 非均匀量化:采用非相等的量化间隔对采样得到的信号进行量化。例如,对大的输入信号采用大的量化间隔,对小的输入信号采用小的量化间隔。它是非线性量化的另一种说法。
3.9 什么叫做率压扩?什么叫做A率压扩?
(1) 在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在北美PCM电话网中,使用率压扩算法。
(2) 在脉冲编码调制(PCM)系统中,一种模拟信号和数字信号之间进行转换的CCITT压(缩)扩(展)标准。在欧洲电话网,使用A律压扩算法。
对于采样频率为8 kHz,样本精度为13比特、14比特或16比特的输入信号,使用律压扩编码或使用A律压扩编码,经过PCM编码器之后每个样本的精度为8比特,输出的数据率为64 kbps。
3.11 自适应脉冲编码调制(APCM)的基本思想是什么?
根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应,即量化阶的大小每隔几个样本就改变,也可以是音节自适应,即量化阶的大小在较长时间周期里发生变化。
3.12 差分脉冲编码调制(DPCM)的基本思想是什么?
利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术。这种技术是根据过去的样本去估算(estimate)下一个样本信号的幅度大小,这个值称为预测值,然后对实际信号值与预测值之差进行量化编码,从而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是,PCM是直接对采样信号进行量化编码,而DPCM是对实际信号值与预测值之差进行量化编码,存储或者传送的是差值而不是幅度绝对值,这就降低了传送或存储的数据量。此外,它还能适应大范围变化的输入信号。
3.13 自适应差分脉冲编码调制(ADPCM)的基本思想是什么?
ADPCM综合了APCM的自适应特性和DPCM系统的差分特性,是一种性能比较好的波形编码。它的核心想法是:(1) 利用自适应的思想改变量化阶的大小,即使用小的量化阶(step-size)去编码小的差值,使用大的量化阶去编码大的差值;(2) 使用过去的样本值估算下一个输入样本的预测值,使实际样本值和预测值之间的差值总是最小。