多媒体技术作业解答
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中南大学网络学院
《多媒体技术》作业题参考解答
第一章绪论
1. 什么是媒体?国际电信联盟定义了哪几类媒体?
媒体是指信息存储、加工和传输的各种技术或手段。
国际电信联盟定义了五大类媒体:存储媒体、传输媒体、显示媒体、表示媒体、感觉媒体。
2. 什么是多媒体?多媒体的主要特点是什么?
多媒体是指融合两种以上不同媒体的人-机交互式信息交流的传播媒体。
多媒体的特点是:① 多媒体形式的多样性;②多媒体应用的交互式性;③多媒体技术的集成性;④媒体传输的实时性。
3. 什么是超媒体?多媒体与超媒体之间有什么区别?
超媒体是指通过超级链接技术将多媒体对象以非线性方式组织成网络结构的技术。
超媒体与超文本之间的不同之处是,超文本主要是以文字的形式表示信息,建立的链接关系主要是文句之间的链接关系。超媒体除了使用文本外,还使用图形、图像、声音、动画或影视片断等多种媒体来表示信息,建立的链接关系是文本、图形、图像、声音、动画和影视片断等媒体之间的链接关系。
4. 多媒体技术的主要研究内容是什么?
多媒体技术是一门综合性、理论性和实践性都很强的学科。作为一门相对独立的学科,它主要解决多媒体应用的各种理论和技术问题,主要包括:数据压缩与解压缩技术、音/视频专用芯片技术、多媒体软件技术、网络多媒体技术和多媒体存储技术。第二章数字语音技术
1.什么叫做采样?什么叫做量化?什么叫做线性量化?什么叫做非线性量化?
以某种特定的频率对模拟信号进行测量得到一系列离散样本的过程叫做采样(sampling)。量化是指把样本表示成二进制数的过程。线性量化是指量化间隔(样本幅值之差)为均匀值的一种量化。非线性量化则是指量化间隔(样本幅值之差)为非均匀值的一种量化。
2.选择采样频率为22.050 kHz和样本精度为16位的录音参数。在不采用压缩技术的情况下,计算录制2分
钟的立体声需要多少MB(兆字节)的存储空间(1MB=1024×1024B)
存储空间
= 22.050 x 1000 样本/秒 x 16 位/样本 x 1字节/8位 x 2 (立体声) x 2 分钟 x 60秒/分
= 5292000 字节
= 5292000 / 1024 KB = 5168 KB
= 5168 / 1024 MB = 5.047 MB
第三章话音编码
1.用自己的语言说出下面3种话音编译码器的基本想法。
2.①波形编译码器,②音源编译码器,③混合编译码器
答:①波形编译码器的基本思想是,通过对话音波形信号采样来生成一种与原始话音波形尽可能一致的重构信号。一般来说,这种编译码器的复杂程度比较低,数据速率在16 kb/s以上,质量相当高。低于这个数据速率时,音质急剧下降。②音源编译码的想法是企图从话音波形信号中提取生成话音的参数,使用这些参数通过话音生成模型重构出话音。在话音生成模型中,声道被等效成一个随时间变化的滤波器,它由白噪声—无声话音段激励,或者由脉冲串——有声话音段激励。因此需要传送给解码器的信息就是滤波器的规格、发声或者不发声的标志和有声话音的音节周期等。③混合编译码的想法是企图填补波形编译码和音源编译码之间的间隔,混合使用波形编译码和音源编译码技术。
一般来说,波形编译码器的话音质量高,但数据率也很高;音源编译码器的数据率很低,产生的合成话音的音质有待提高;
混合编译码器使用音源编译码技术和波形编译码技术,数据率和音质介于它们之间。
3.什么叫做均匀量化?什么叫做非均匀量化?
采用相等的量化间隔对采样得到的信号进行的量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度,也称为线性量化。非均匀量化的基本想法是,对输入信号进行量化时,大的输入信号采用大的量化间隔,小的输入信号采用小的量化间隔,这样就可以在满足精度要求的情况下用较少的位数来表示整个信号。
4. 什么叫做μ 律压扩?什么叫做A 律压扩?
μ 律压扩是非均匀量化的一种,又称为对数PCM ,其量化输出值与作为输入的采样样本值之间的关系由如下的关系式规定: 式中:x 为输入信号幅度,规格化成 -1 ≤ x ≤ 1;sgn(x )为x 的极性;μ 为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比,取100 ≤ μ ≤ 500。具体计算时,用μ =255,
A 律压扩也是非均匀量化的一种,其量化输出值与作为输入的采样样本值之间的关系由如下的关系式规定:
0 ≤ |x | ≤
1/A
1/A < |x | ≤ 1
式中:x 为输入信号幅度,规格化成 -1 ≤ x ≤ 1;sgn(x )为x 的极性;A 为确定压缩量的参数,它反映最大量化间隔和最小量化间隔之比。
5. G.711标准定义的输出数据率是多少?
对于采样频率为8 kHz ,样本精度为13位、14位或者16位的输入信号,使用μ 律压扩编码或者使用A 律压扩编码,经过PCM 编码器之后每个样本的精度为8位,输出的数据率为64 kb/s 。这个数据就是CCITT 推荐的G .711标准。
第四章 无损数据压缩
1、 现有8个待编码的符号,它们的概率为:0.15 ,0.4 , 0.2 , 0.03, 0.07 , 0.04 , 0.10, 0.01。使用霍夫
曼编码算法求出这8个符号的所分配的代码,并计算平均码长。
① 将各个码元的概率值按升序(或者降序)排列。
0.4 , 0.2 , 0.15 , 0.10 , 0.07 , 0.04 , 0.03, 0.01
② 把最小的两个概率值相加,得到一个新的概率值,将这个新概率值与剩下的其他概率值一起重新按升序排序。
0.4 , 0.2 , 0.15 , 0.10 , 0.07 , 0.04 , 0.03, 0.01
③ 重复第2步,直到生成一个二叉树形结构,其根节点为概率值1。
0.4 , 0.2 , 0.15 , 0.10 , 0.07 , 0.04 , 0.03, 0.01
④
为生成树的各个分支分配编码,原则是:对于一个父节点的两个分支,概率值大的分支赋予1,概率值小的分支赋予0。 0.4 , 0.2 , 0.15 , 0.10 , 0.07 , 0.04 , 0.03, 0.01
⑤ 从根节点开始,沿到各个叶节点
(对应码元)的路径,读取路径各个链路的编码,所得到的编码序列即为各个码元的 Huffman 0.04 0.04
0.08 0.15 0.25 0.35 0.60 1.0
0.04 0.08 0.15 0.25 0.35 0.60 1.0 1 1 1 1 1 1 1 0
0 0 0 0 0 0