第4章--多媒体音频处理技术

合集下载

多媒体技术与应用答案

第一章多媒体技术概述1、什么是媒体?媒体是如何分类的？（简答题）答：（1）媒体指的是信息表示和传输的载体，是人与人之间沟通及交流观念、思想或意见的中介物。

在计算机科学中，媒体具有两种含义：一是承载信息的物理实体，例如磁带、磁盘、光盘、半导体存储器；二是表示信息的物理载体，例如文本、图形、图像、声音、动画及影像等。

多媒体技术中的媒体一般指后者。

（2）按照国际上一些标准化组织制定的分类标准，媒体主要有一下6种类型。

（1）感觉媒体（2）表示媒体（3）显示媒体（也称表现媒体）（4）存储媒体（5）传输媒体2、什么是多媒体？它有哪些关键特性？（简答题）答：（1）多媒体是由两种以上单一媒体融合而成的信息综合表现形式，是多种媒体的综合、处理和利用的结果。

（2）多维化：计算机处理媒体信息的多样化，使人与计算机之间的交互不再局限于顺序的、单调的、狭小的范围，而有充分自由的余地。

交互性：人、机对话，是多媒体技术的关键特征。

在多媒体系统中，除了操作上控制自如之外，在媒体的综合处理上也可以随心所欲。

集成性：将各种不同的媒体信息有机地进行同步组合，形成一个完整的多媒体信息；把不同的媒体设备集成在一起，形成多媒体系统。

3、多媒体技术如何定义？多媒体技术有哪些特点？答：（1）多媒体技术是以计算机（或微处理芯片）为中心，将文本、图形、图像、音频、视频和动画等多种媒体信息进行数字化综合处理，使多种媒体信息建立逻辑连接，并集成一个具有交互性的系统技术。

（2）多媒体技术特征：多样性，集成性，交互性，实时性和数字化。

4、什么是多媒体系统？答:多媒体系统是指由多媒体网络设备、多媒体终端设备、多媒体软件、多媒体服务系统及相关的多媒体数据组成的有机整体。

5、什么是虚拟现实技术？答：虚拟现实技术（VR）是一种可以创建和体验虚拟世界的计算机系统，一种逼真的模拟人在自然环境中视觉、听觉和运动等行为的高级人机交互（界面）技术。

一、单选题1．媒体有两种含义，即表示信息的载体和 ( B )。

大学信息技术基础(第三版)第4章

原理，以图4-5所示的CD-ROM光盘读取过程为例。光盘是一种多层材料组成的圆盘结构。以CD-ROM为
例，其物理结构如图4-6所示。
精品课件
§4.2 光盘存储系统
图4-5 光盘数据读取原理
剖面结构
精品课件
图4-6 CD-ROM的
§4.2 光盘存储系统
CD-ROM只读光盘是利用在盘上压制凹坑的机械办法，利用凹坑(Pit) 和平面(Land)部分来记录“0” 和 “1”。
第4章多媒体技术基础
主要内容：
§4.1 多媒体的概念 §4.2 光盘存储系统 §4.3 多媒体音频信号处理 §4.4 多媒体图像信息处理 §4.5 计算机图形处理技术简介 §4.6 多媒体视频信息处理
本章小结思考与练习
精品课件
精品课件
§4.1 多媒体的概念
4.1.1 媒体的分类
在计算机领域中媒体有两种含义：
1.声音的采样
声音的采样就是按一定的时间间隔将声音波形在时间轴（即横轴）上进行分割，把时间和幅度上都是连续的模拟信号转化成时间上离散、幅度连续的信号（图4-9a）。
采样频率越高，即采样的间隔时间越短，则在单位时间内计算机得到的声音样本数据就越多，对声音波形的表示越精确，声音的保真度也越好，但所要求的存储空间也越大。
CD-R光盘增加了一层有机染料作为记录层。 CD-RW记录原理为在光盘的记录层镀上一层结晶层，
这个结晶层的特色是能呈现出结晶与非结晶的状态，借助于激光的照射，可在这两种状态之间互换，而这两种状态也对光的反射不同，产生的0与1的信号，经过解码器分析后，获得所需的数据。
精品课件
精品课件
§4.3 多媒体音频信号处理
一种是指用以存储信息的实体（媒质）；另一种是指信息的载体。多媒体计算机技术中的媒体是指后者。

(重点)多媒体技术及应用考试(1-4章)复习大纲

第1章多媒体技术基础1.1 多媒体技术概述1.1.1 多媒体技术的发展1.1.2 多媒体技术的基本概念1.1.1 多媒体技术的应用1.1.4 多媒体的关键技术1.2 多媒体硬件系统1.2.1 多媒体输入输出设备1.2.2 多媒体接口设备1.2.3 多媒体存储设备1.3 多媒体软件系统1.3.1 多媒体软件1.3.2 多媒体应用系统的设计流程1.1.1 多媒体技术的发展1.1.2 多媒体技术的基本概念1.媒体的含义⏹表示信息的载体：如文字、声音、图像、动画、视频、语言等。

⏹存储信息的实体：如磁盘、磁带、光盘、纸张等。

⏹传播信息的载体：如电视、电影、报纸、杂志、网络等。

2.媒体的类型¡ª¡ª CCITT（国际电报电话咨询委员会)⏹感觉媒体：指能直接作用于人的感官，使人能直接产生感觉的一类媒体。

如语言、音乐，自然界的各种声音、图形、图像、文字、数据等。

⏹表示媒体：即感觉媒体的表示媒介。

如图像编码、文本编码和声音编码等。

⏹显示媒体：即输入输出媒体的设备，如键盘、显示器、话筒，喇叭和打印机等。

⏹存储媒体：用来存放表示媒体的物理载体，如磁盘、磁带、光盘等。

⏹传输媒体：传输媒体的物理载体。

如空气、电话线、电波、电缆和光缆等。

1.1.2 多媒体技术的基本概念3. 多媒体（Multimedia）主要包括文字、图形、图像、音频、动画和视频等多种信息载体。

⏹文字：指各种字母、数字和符号等文本信息；⏹图形：由描述点、线、面的大小、形状、维数和位置的图形指令生成的几何图形(矢量图形) ⏹图像：由许多的像素点构成，每个像素点用若干二进制位来表示颜色和亮度等信息(位图)⏹音频：包括语音、音乐和各种声音效果；⏹动画：通过计算机自动生成关键帧之间的连续图像，按照一定速度连续播放形成动画；⏹视频：若干静态图像画面的连续播放形成了视频，每一幅画面称为一帧；4. 多媒体技术利用计算机及相应的多媒体设备，采用数字化处理技术，将文字、声音、图形、图像、动画和视频等多种媒体有机结合起来进行处理的技术。

音响设备原理与维修第四章音频信号处理设备

二、压限器的基本组成和原理
压限器的组成框图如下图所示。它主要由输入放大器、检测电路、压控放大器、输出放大器和缓冲放大器组成。
16 第四章音频信号处理设备
压限器的组成框图
§4-2 压限器
二、压限器的基本组成和原理
压限器的特性曲线如下图所示。
17 第四章音频信号处理设备
压限器的特性曲线
§4-2 压限器
§4-3 调音台
一、调音台的作用
6. 声像方位两路或四路主输出的调音台都没有声像方位电位器。声像方位电位器用于拾取、录制立体声节目，按照声源方位或乐曲艺术的要求而分配声像方位。 7. 监听或检测一般调音台都设置有耳机插孔，用耳机来监听，或外接监听功率放大器，用扬声器监听。台面上通常还设有指针式或发光管式音量表，以便协同听觉的监听，以视觉对电平信号进行监测。
18 第四章音频信号处理设备
§4-2 压限器
二、压限器的基本组成和原理
从给出的 2:Βιβλιοθήκη 曲线可以看出，进入压缩后，输入信号增加 2 dB，输出信号只增加 1 dB；同样，对于 4:1 压缩的情况，输入信号增加 4 dB，输出信号增加 1 dB。压限器的压缩比是可调的。当压缩比调至∞:1 时，输入信号大于设定的门限电平后，输出便保持一个固定的值不变，即输出幅度被限定，其特性曲线为一条水平直线。在实际应用中，通常认为压缩比在 10:1 以上便是限幅了。
第四章音频信号处理设备
§4-1 音频信号处理设备概述 §4-2 压限器 §4-3 调音台
1 第四章音频信号处理设备
§4-1 音频信号处理设备概述
学习目标： 1. 了解常见音频信号处理设备的基本概念。 2. 熟悉常见的音频信号处理设备。

第四章多媒体技术基础总结

28
ASF文件—— .ASF/.WMA ASF和WMA都是微软公司针对Real公司开发的新一代网上流式数字音频压缩技术。这种压缩技术的特点是同时兼顾了保真度和网络传输需求，所以具有一定的先进性。可以利用WinAMP或媒体播放机播放。
AIFF文件——.AIF/.AIFF
苹果公司开发的声音文件格式，被Macintosh平台和应用程序所支持。
奈奎斯特采样定理：采样频率≥2×信号最高频率。目前最常用的三种采样频率分别为：电话效果（11 kHz）、FM电台效果（22 kHz）和CD效果（44.1 kHz）。
20
2）量化
量化：对声波波形幅度的数字化。
量化位数：量化时采用的二进制位数，位数越多，精度也越高，音质越细腻。例如，用16个二进制位（bit）表示声音，可将声音强度分为216 =65536级。每秒声音的数据量 =采样频率×量化位数×声道数/8（字节）
2）图像量化是将采样值划分成各种等级，用一定位数的二进制数（量化字长）来表示采样的值。
量化字长（也称颜色深度）越大，则越能真实地反映原有图像的颜色。但得到的数字图像的容量也越大。
3）图像编码是按一定的规则，将量化后的数据用二进制数据存储在文件中。位图文件（.bmp）：Microsoft Windows 中使用的一种非压缩图像文件格 35 式。
RGB模型（显示）：将红（Red）、绿（Green）、蓝（Blue）三原色的色光以不同的比例相加，以产生多种多样的色光。 CMYK模型（打印）：印刷四分色模式利用色料的三原色混色原理，加上黑色油墨，共计四种颜色混合叠加，形成所谓“全彩印刷”。四种标准颜色是：

C：Cyan ＝青色；
M：Magenta ＝品红色（洋红色）。 Y：Yellow ＝黄色。

《多媒体技术与应用》课程教学大纲

《多媒体技术与应用》课程教学大纲一、课程教学目标及学生应达到的能力多媒体技术是在计算机技术基础上发展起来的一门学科，、由于多媒体技术一直处于高速的发展变化过程中，因此课程内容应该根据这种变化做相应的调整和变化，注意知识和内容的更新，保持时效性。

本门课程实践性强。

多媒体技术不仅理论体系完整，而且更要求将理论与实践紧密结合，只有在实践的基础上才能掌握理论内涵和技术要点。

通过本门课程的学习，学生可以掌握多媒体技术的基础知识和基本技能，能够使用工具软件制作多种类型的多媒体作品，从而为学生日后的学习和工作打下良好的基础。

教学目标是使学生系统地掌握多媒体技术的基本理论和知识，形成基本的知识体系逻辑；掌握各种媒体的基本处理技术和常用多媒体外设的使用，培养学生实际操作的动手能力；结合多媒体作品设计，培养学生综合运用所学知识能力并发挥想象力和创造力，这也是信息时代对人才的需求；通过对各种多媒体软件的介绍和学习，培养学生通过自己的探索和利用软件中提供的帮助进行自我学习的能力；通过布置课后作业，学生分组完成，培养学生的学习兴趣和合作精神。

二、课程教学内容和要求•第一章多媒体技术概论教学内容1、多媒体技术的基本概念2、多媒体技术的研究对象3、多媒体关键技术4、多媒体技术的应用和发展教学要求• 1、掌握：媒体定义、媒体的种类和特点。

• 1、理解：多媒体的概念、多媒体技术的内容。

• 2、了解：多媒体技术的发展历程。

教学建议• 根据具体情况，对多媒体关键技术以及应用的最新发展作适当介绍。

第二章多媒体计算机系统教学内容1、多媒体技术的基本概念2、多媒体计算机3、多媒体关键技术4、多媒体技术的应用和发展教学要求• 1、掌握：多媒体计算机的组成、光存储设备的使用。

• 1、理解：多媒体接口卡的工作原理、光存储系统的原理。

• 2、了解：多媒体系统的特点与分类,常用多媒体输入输出设备。

教学建议• 根据具体情况，对多媒体系统的运行环境作适当介绍。

多媒体信息处理技术

《多媒体信息处理技术》教学大纲一、课程基本信息课程名称：多媒体信息处理技术课程性质：专业必修先修课程：计算机应用基础适用专业：计算机信息管理、软件技术开课学期：第2学期学时：54学时学分：3学分二、课程的性质和任务《多媒体信息处理技术》课程是广东理工职业学院计算机信息管理专业与软件技术专业的一门专业必修课。

主要任务是介绍多媒体技术的基本概念、硬件环境，多媒体音频、图像、视频、动画制作技术及多媒体作品的设计与制作。

三、相关课程的衔接学习该课程前要求学生对计算机系统的构成和Windows操作界面的使用有所了解，多媒体信息音频、图像、视频、动画制作技术应用于计算机辅助教育，为其他专业课程做辅助。

四、教学方法与重点、难点教学方法：理论+课内实践重点和难点：第3章多媒体音频技术、第4章多媒体图像处理技术、第5章多媒体视频处理技术、第6章多媒体动画制作技术、第7章多媒体作品的设计与制作五、建议学时分配以表格方式表现各章节的学时分配，表格如下：六、课程考核本课采用闭卷上机操作考试，时间120分钟。

平时成绩占总评成绩的50%，期末成绩占总评成绩的50%。

七、教材及主要参考书教材：《多媒体技术与应用教程》雷运发主编，清华大学出版社，2019年9月第1版。

参考书：《Adobe Audition2.0经典教程》美国Adobe公司著，人民邮电出版社，2019年9月第1版《计算机图像处理技术—Adobe Photoshop CS2》汪可、张明真主编，高等教育出版社，2019年1月第1版《精通Authorware 7.0》张远龙王兢等编著，中国科学技术出版社，2019年4月第1版、《Adobe Premiere Pro CS3经典教程》美国Adobe公司著，人民邮电出版社，2019年9月第1版八、教学内容以“章节”为单位说明本章节的教学内容、教学基本要求和重点、难点，各章节格式如下：第一章多媒体的基本概念1、教学内容●多媒体的基本概念●多媒体相关技术简介●多媒体技术的发展与应用2、教学基本要求●了解媒体、多媒体的定义以及媒体的分类；●了解多媒体的相关技术（如压缩技术、音视频技术等）及其应用；●掌握多媒体的特征和多媒体系统的构成；●了解多媒体的发展历史及其发展趋势。

音频处理技术ppt课件

15
上海建桥学院信息技术系
16
上海建桥学院信息技术系
借助于A/D或D/A转换器，模拟信号和数字信号可以互相转换
17
上海建桥学院信息技术系
18
上海建桥学院信息技术系
▪ 4.2.1采样
为实现A/D转换，需要把模拟音频信号波形进行分割（每隔一定的时间间隔测一次模拟音频的值(如电压) ），
以转变成数字信号，这种方法称为采样(Sampling)。每秒钟采样的次数称为采样率。
22
输出
输入
非均匀量化
上海建桥学院信息技术系
数字音频等级
信号类型
频率范围Hz
电话语音宽带音频调频广播 CD-DA SACD DVD-AUDIO HDTA …
200~3400 50~7000 20~15k 20~22k 2-100k 100k
23
采样频率KHz 量化精度(位)
8
8
16
16
37.8
44 100（Hz）×（16/8）（B）×2×５×60=51600kb
26
上海建桥学院信息技术系
▪ 4.2.3 声音采样与量化过程示例
27
上海建桥学院信息技术系
图4-10 采样频率为1000Hz，10个量化等级的波形
28
上海建桥学院信息技术系
图4-11 经过D/A转换器得到的信号波形(直线段的波形)有较大的失真
非语音信号：音乐，自然界的声音，信息量低，识别简单。
6
上海建桥学院信息技术系
图4-4 在自然界，声波与水波一样都是一种振动波
7
上海建桥学院信息技术系
图4-5 用声音录制软件记录的英文单词”Hello”语音的实际波形

第四章数字音频处理技术

④ 音质：即声音聆听效果的好坏，例如噪音信号强的声音就比噪音信号弱的声音音质要差。
⑤ 波形：在数字环境下用来加强声音编辑的一种图形表示。
⑥ 振幅：一个特定时间上的声音信号强度。
多媒体技术与应用
（2）数字化声音的基本参数：
•
① 采样频率：声音数字化过程中，每秒钟抽取
声波幅度样本的次数。
•
② 量化位数：记录每次抽样结果的数据长度，
常采用的有8位、16位等。
•
③ 声道数：我们通常讲的立体声，也就是具有两
个相对独立声道的声音。
•
④ 编码方法（压缩方法）：将采样所得数据记录
下来的格式。
多媒体技术与应用
4．1．2声音的常见类型
• 1．从用途角度可分为语音，音乐和效果声。 • 2．从处理的角度可分为波形音频（用于windows环
境时，扩展为wav），MIDI音频，CD音频。
第四章数字音频处理技术
多媒体技术与应用
学习目标
• 1.通过本章的教学是学生初步具备音频处理的基础能力。
• 2.了解数字音频编码 • 3.掌握音频处理软件Goldwave
多媒体技术与应用
4．1数字音频技术基础知识
• 4．1．1声音的基本概念 • 在多媒体系统中，声音是指人耳能识别的音频信息，
对音频信号的处理方法大致可分为两类：数字音频方式，分析——合成的方式。这里首先介绍音频信号处理过程中所涉及的基本概念。
多媒体技术与应用
4．2音频素材的获取
• 4．2．1音频素材的获取方法 • 1．使用声卡录制 • 2．从CD、DVD中截取 • 3．从因特网上下载或从素材库获取 • 4．用电脑软件生成声音
多媒体技术与应用

第四章语音信号处理技术

语音信号处理简称语音处理，是以语音学和数字信号处理为基础而形成的一门综合性学科，处理的目的是要得到一些语音参数以便高效的传输或存储，或者通过处理的某种运算以达到某种用途的要求，例如人工合成出语音，辨识出说话者，识别讲话的内容等。基础：指导：技术手段:

语音信号处理的发展
在语音波形片断拼接之前首先根据语义用psola算法对拼接单元的韵律特征进行调整使合成波形既保持了原始语音基元的主要音段特征又使拼接单元的韵律特征符合语义从而获得很高波形合成法参数合成法规则合成法基本信息波形特征参数语言的符号组合语音质量词汇量小500字以下大数千字无限合成方式pcmadpcmapclpclsp共振数码率9664kbits2496kbits5075bits1mbit可合成的语音长度15100s100s7分钟无限合成单元音节词组句子音节词组句子因素音节装置简单比较复杂复杂目前的语音合成方法实质上并未解决机器说话的问题本质上只是一个声音还原的过程
量化等级的划分
量化级越多，量化误差越小。每个采样点占用的 Bit就会越多，在语音信号处理中常用的有16bit、 8bit等量化。
xa(t)
xa(nT)
x(n)
采样
x1
xa1
量化
xk
xak xak+1
x(n)=Q[xa(nT)]
xk+1
xaL
xL xaL+1

量化后的信号值与原信号值之间的差值称为量化误差(噪声) e(n)=x(n)- xa(nT) -/2 e(n) /2

建立数学模型：寻求一种可以表达一定物理状态下量与量之间关系的数学表示。语音生成系统：在声门以下，负责产生激励振动——激励系统从声门到嘴唇的呼吸通道是声道——声道系统语音从嘴唇辐射出去，嘴唇以外——辐射系统语音信号的分析，就是找出语音产生模型的各种参数（语音的特征参数），应用于语音的编码、识别和合成等。

多媒体信息技术第4章音频理论

习题解析一、单选题1．人耳可以听到的声音频率范围通常为D。

A）10-20 kHz B）200-15 kHzC）50-20 kHz D）20-20kHz答案：D解析：人耳可听到的声音频带范围是有限的，在20~20000Hz之间，这些频域的声音信号被称为音频信号；频率低于20Hz（称为亚音信号或次音信号）和高于20000Hz（称为超音频信号）的声音信号人类是听不到的。

2．描述模拟音频信号的三个物理量中，C决定了声音的音调。

A）振幅——音强B）音色C）频率——音调D）周期答案：C解析：音调与频率有关，代表了声音的高低。

频率越高，音调越高，反之亦然。

各种不同的声源具有自己特定的音调，如果改变了某种声源的音调，则声音会发生质的转变，使人们无法辨别声源本来的面目。

3．将模拟声音信号转换为数字音频信号的数字化过程是D。

A）采样→编码→量化B）编码→采样→量化C）量化→编码→采样D）采样→量化→编码答案：D解析：模拟音频数字化就是将连续变化的模拟声音信号转换成离散的数字音频信号。

一般需要完成采样、量化和编码三个步骤。

4．在模拟音频数字化过程中，A实现了将模拟音频信号在时间上离散化。

A）采样B）量化C）编码D）压缩答案：A解析：模拟音频信号不仅在幅度取值上是连续的，而且在时间上也是连续的，要使模拟音频信号数字化，首先要在时间上进行离散化处理，即在时间上用有限个采样点来代替连续无限的坐标位置。

采样就是每隔一段时间从连续变化的模拟音频信号中取一个幅度值（也称为采样值），从而把时间上的连续信号变成时间上的离散信号。

采样的时间间隔称为采样周期；每秒内采样的次数称为采样频率；采样后所得的一系列在时间上离散的样本值称为样值序列。

5．奈奎斯特采样理论指出，采样频率不应低于声音信号最高频率的D倍。

A）3 B）1/2C）1/3 D）2答案：D解析：采样频率是对声音波形每秒钟进行采样的次数。

奈奎斯特理论指出：采样频率不应低于模拟音频信号最高频率的两倍，这样才能将数字化的声音还原为原始声音，这叫做无损数字化。

多媒体技术与应用考试复习题(含答案)

多媒体技术及应用（含答案）第1章多媒体技术概念多媒体技术是将（）融合在一起的一种新技术。

A．计算机技术、电子技术和通信技术B．计算机技术、视听技术和通信技术C．计算机技术、音频技术和视频技术D．音频技术、视频技术和网路技术多媒体的（）是其区别于一般媒体的关键属性。

A．交互性B．多样性C．集成性D．交互性、多样性、集成性以下（）不是多媒体数据的主要特点。

A．数据的输入和输出复杂B．数据量大C．数据类型多D．数据类型间差别小计算机辅助教学的英文缩写是（）。

A．CAMB．CADC．CAID．E-Learning多媒体驱动软件是多媒体计算机软件中直接和（）打交道的软件。

A．操作系统B．软件C．软硬件D．硬件多媒体诞生于（）年代。

A．21世纪初B．20世纪70年代C．20世纪90年代D．20世纪80年代多媒体应用软件也称多媒体应用系统，以下不是多媒体应用软件的是（）。

A．视频会议系统B．计算机辅助教学C．数据库系统D．电子出版物以下（）不是动画数据的文件格式。

A．swfB．mpgC．flcD．gif多媒体创作软件是将多媒体素材集成为多媒体产品的开发创作工具，下面不属于多媒体创作软件的是（）。

A．AuthorwareB．3DsmaxC．DirectorD．PowerPoint我们说磁盘、光盘以及相关的播放设备等也是信息媒体，指的是它的（）。

A．逻辑性B．物理性C．集成性D．多样性下面不是三维动画软件的是（）。

A．PoserB．FlashC．MayaD．3Dsmax人类通过感官获取各种信息，其中，所占比例最大的是（）。

A．视觉B．触觉C．听觉D．嗅觉以下（）不是图形数据的文件格式。

A．epsB．rtfC．cmxD．wmf我们通常讲媒体包括文本、声音、图形、图像、动画和视频等，指的是信息媒体的（）。

A．集成性B．物理性C．逻辑性D．多样性多媒体关键技术包括（）。

A．数据压缩技术、通信技术、网络技术、操作系统软件技术B．数据压缩技术、集成电路制作技术、存储技术、操作系统软件技术C．数据压缩技术、通信技术、存储技术、操作系统软件技术D．数据压缩技术、通信技术、存储技术、网络技术请根据多媒体的特性来判断，以下属于多媒体范畴的是（）。

第4章多媒体音频制作技术

识别系统可大致分为三部分：
2、声学模型与模式匹配（识别算法）：声学模型通常通过学习算法来获语言模型对中、大词汇量的语言识别系统特别重要。当分类发生错误时可以得语音特征。在识别时将输入的语音特征同声学模型进行匹配与比较，从根据语言学模型、语法结构、语义学进行判断纠正，对于一些同音字则必须
通过上下文结构才能确定词义。而得到最佳的识别结果。
采用44.1KHZ采样频率的高品质CD品质音频，每秒钟取44100个点，这样可记录的最高频率为22KHZ，这正是人耳能分辨的最高音频再加上一定的保护频带，因此CD的音质与原始声音几乎毫无差别。而把一段语音录制为数字音频时，采样频率以11KHZ为宜，因为语音的频带宽度为3KHZ，过高的采样频率不仅不能提高声音质量，反而会增加文件的容量。
1、采Байду номын сангаас一定的格式来记录数字数据；
2、采用一定的算法来压缩数字数据以减少存储空间和提高传输效率。最简单的编码方案是直接用二进制表示，也称作PCM脉冲编码调制。保真度高，解码速度快，但编码后的数据量大。
1001 1011 1011 这些被编码后的数字信号就可以被CPU所处理
衡量一种编码方法的性能指标：码流速率、量化噪声
音源
话筒
模拟电信号
压缩量化
声波
模数转化
数字信息
模拟信号
采样
量化
编码
数字信号
PCM（Pulse Code Modulation）脉冲编码调制是一种模数转换的最基本编码方法。它把模拟信号转换成数字信号的过程称为模/数转换，它主要包括：采样：在时间轴上对信号进行离散化处理；量化：在幅度轴上对采样后声音信号的振幅值进行离散化处理；编码：将采样和量化后的数字化声音信息以二进制形式并按照一定的数据格式进行表示

《多媒体技术应用》PPT课件

二、多媒体关键技术
1. 数据压缩和编码技术 P.199 2. 多媒体信息存储技术 3. 多媒体数据输入、输出技术 4. 多媒体通信网络技术 5. 多媒体信息同步技术 6. 多媒体专用芯片技术 7. 多媒体软件技术
4.2音频信号的处理
4.2.1 音频的数字化与MIDI合成音乐
1. 波形音频的数字化
多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件
4.2.2 声频文件的管理
音频的格式 P.208
WAV格式
文件体积较大，不适合在网上播放
MP3格式
高压缩率、文件小、音质好
MIDI格式
文件小，播放效果由软、硬件决定
CD格式
近似无损，忠于原声
二、多媒体软件系统 P.195
1.多媒体操作系统
多媒体操作系统是具有处理声音、图形和影视功能的计算机操作系统。
常用的多媒体操作系统有： Windows 2000 Windows XP Windows Vista
1. 操作系统中的多媒体功能
支持多媒体功能的系统功能
具有管理大容量存储器的功能虚拟内存技术多任务 “即插即用”功能
RealAudio格式
适用网上在线音乐欣赏
WMA格式
支持音频流技术，适合在网络上在线播放
4.2.3 音频处理技术
声音的处理包括录音、剪辑、和效果设置 GoldWav是一个集音频录制、播放、编辑和格式转换
多功能于一体的数字音乐编辑器处理的基本工具播放音频文件时显示正在播放的声音波形从“编辑”菜单可进行声音文件的剪辑操作从“效果”菜单可进行加快、放慢声音速度，加入
特色
多种媒体集成
集文字、声音、图像、视频、动画等媒体为一体

多媒体技术课后答案

多媒体技术课后答案《多媒体技术及应⽤》习题参考答案第1章多媒体技术概论1．什么是多媒体？答：使⽤计算机交互式综合技术和数字通信⽹络技术处理多种表⽰媒体——⽂本、图形、图像和声⾳，使多种信息建⽴逻辑连接，集成为⼀个交互式系统。

2．多媒体技术中的主要多媒体元素有哪些？答：图形、图像、⽂本、动画、⾳频、视频等。

3．什么是多媒体技术？什么是多媒体计算机？简述多媒体技术的主要特点。

答：多媒体技术可以定义为：计算机综合处理⽂本、图形、图像、⾳频与视频等多种媒体信息，使多种信息建⽴逻辑连接，集成为⼀个系统并且具有交互性。

多媒体计算机是指具有多媒体处理功能的计算机。

多媒体技术的主要特点有：集成性、实时性、交互性、媒体的多样性等。

4．多媒体计算机标准的意义是什么？答：对于技术开发⼈员⽽⾔是⽤来指导多媒体个⼈计算机及其软件的设计规范；对于⽤户⽽⾔，是把现有PC机升为MPC的指导原则；对于经销商⽽⾔，可作为多媒体的性能及兼容性的尺度。

5．简述多媒体系统的组成。

答：⼀般多媒体系统由多媒体硬件系统、多媒体软件系统两个部分组成。

硬件是多媒体系统的物质基础，是软件的载体，软件是多媒体系统的核⼼，两者相辅相成，缺⼀不可。

6．试从实例出发，谈谈多媒体技术的应⽤对⼈类社会的影响。

略7．谈谈你如何看待多媒体技术的发展前景。

略8．选择题。

（1）⾳频卡是按（）分类的。

（A）采样频率（B）声道数（C）采样量化位数（D）压缩⽅式（2）⼀个⽤途⼴泛的⾳频卡应能够⽀持多种声源输⼊，下列（）是⾳频卡⽀持的声源。

①话筒②线输⼊③CD Audio ④MIDI（A）仅①（B）①②（C）①②③（D）全部（3）（）是MPC 对视频处理能⼒的基本要求。

①播放已压缩好的较低质量的视频图象②实时采集视频图象③实时压缩视频图象④播放已压缩好的⾼质量分辨率的视频图象（A）仅①（B）①②（C）①②③（D）全部（4）（）是MMX 技术的特点。

①打包的数据类型②与IA 结构安全兼容③64 位的MMX 寄存储器组④增强的指令系统（A）①③④（B）②③④（C）①②③（D）全部（5）下列关于触摸屏的叙述（）是正确的。

多媒体复习题校验版

多媒体复习题第1章多媒体技术基础一、选择题1A．音乐B．香味C．鸟鸣解析：感觉媒体：能直接作用于人们的感觉器官，从而能使人产生直接感觉的媒体。

如语言、音乐、自然界中的各种声音、各种图形、图像、动画、文本等。

2．下列选项属于表示媒体的是： D 。

A．照片B．显示器C．纸张D．条形码解析：表示媒体：为了传送感觉媒体而人为研究出来的定义信息特性的数据类型，用信息的计算机内部编码表示。

借助于此种媒体，能更有效地存储感觉媒体或将感觉媒体从一个地方传送到另一个地方。

如条形码、乐谱3．下列选项属于显示媒体的是： B 。

A．图片B．扬声器C．声音 D.语言编码解析：显示媒体：用于将表示媒体和感觉媒体之间相互转换用的媒体，指人们再现信息的物理工具和设备（输出设备），或者获取信息的工具和设备（输入设备）。

如显示器、键盘、鼠标。

4．下列选项属于存储媒体的是： A 。

A.磁带B．照片C．扬声器D．打印机解析：存储媒体：用于存放表示媒体的媒体。

如光盘、软盘、SD卡等存储介质。

5A．光盘B．照片解析：传输媒体：用于传输表示媒体的媒体。

如光缆、双绞线。

6．能直接作用于人们的感觉器官，从而能使人产生直接感觉的媒体是： A 。

A．感觉媒体B．表示媒体C．显示媒体D．传输媒体7．为了传送感觉媒体而人为研究出来的媒体称为： B 。

A．感觉媒体B．表示媒体C．显示媒体D．传输媒体8. 语言编码、电报码、条形码和乐谱邓属于： B 。

A. 感觉媒体B. 表示媒体C. 显示媒体D. 传输媒体9.A. 多样性B. 交互性C.解析：多媒体的基本特征：多样性、交互性、集成性。

10.A. 图像质量B.质量服务C.解析：多媒体技术的研究内容：多媒体处理和编解码技术、多媒体支持环境与网络、多媒体工具及应用系统、多媒体通信与分布式多媒体系统11.对人类视觉系统反应最敏感的是： A 。

A. 亮度B. 红色C. 绿色D. 蓝色解析：视觉系统对颜色和亮度的响应情况是不同的，人眼对亮度比对颜色敏感。

2023年多媒体技术基础形成性考核册答案

多媒体技术基础课程作业（计算机专科）第一次作业（共100分）第一章多媒体技术概论一、填空题（每空1分, 共10分）1.文本、声音、图形、图像和动画等信息的载体中的两个或多个的组合构成了多媒体。

2.多媒体系统是指运用计算机技术和数字通讯网技术来解决和控制多媒体信息的系统。

3.多媒体技术具有集成性、实时性、交互性和高质量等特性。

4.计算机网络是现代通信技术和计算机技术结合的产物。

二、单项选择题（每题1分, 共5分）1.请根据多媒体的特性判断以下属于多媒体范畴的是（）。

（1）交互式视频游戏（2）有声图书（3）彩色画报（4）彩色电视A. 仅（1）B.（1）（2）C.（1）（2）（3）D.所有2.下列属于是多媒体技术发展方向的是（）。

（1）高分辨率, 提高显示质量（2）高速度化, 缩短解决时间（3）简朴化, 便于操作（4）智能化, 提高信息辨认能力A. （1）（2）（3）B.（1）（2）（4）C.（1）（3）（4）D.所有3.最早用图形用户接口（GUI）取代计算机用户接口（CUI）的公司是（）。

A.美国无线电公司RCAB.美国Commodore公司C.美国Apple公司D.荷兰Philips公司4.多媒体技术应用的关键问题是（）。

（1）建立技术标准（2）压缩编码和解压（3）提高开发质量（4）减少多媒体产品的成本A.仅（1）B.（1）（4）C.（2）（4）D.所有5.多媒体的核心系统在多媒体计算机系统的层次结构中的位置是（）。

A. 在多媒体I/O控制及接口层与创作系统之间B. 在创作系统与应用系统之间C. 在计算机硬件与多媒体实时压缩/解压缩之间D. 在最顶层三、简答题（14分）1.（4分）促进多媒体技术发展的关键技术有哪些？答：促进多媒体技术发展的关键技术是（1）CD-ROM解决了多媒体信息的存储问题；（2）高速计算机网络可以传送多媒体信息；（3）高速位解决技术、专用集成电路技术和亚微米集成电路技术的发展, 为多媒体技术提供了高速解决的硬件环境；（4）多媒体压缩技术、人机交互技术和分布式解决技术的出现促进了多媒体系统的产生与发展。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

4.1.2 数字音频的采样、量化和编码
3. 编码
编码是根据一定的协议或格式把模拟信息转换成二进制比特流的过程。多媒体信息数字化的过程中，最简单的编码方式就是直接用量化后的二进制数作为输出的数字信号，这种编码方式也就是PCM（脉冲代码调制）编码。多媒体信息的一个特点是存在各种冗余信息，具有很大的压缩潜力。因为在多媒体数据中，存在着空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、统计冗余等，它们为数据压缩技术的应用提供了可能的条件。因此，在多媒体系统中可以采用数据压缩技术对数字信号进行压缩，在保证人的主观感受不变的前提下，使得存储的数据量大大下降。采用不同的压缩技术，也即采用了不同的编码技术。
2．数字音频
模拟音频信号主要有下述几点缺点：
一、抗干扰能力差
二、噪声会累积三、无法使用计算机进行存储，不能在网络中传输
4.1.1 数字音频基础
由于模拟音频信号存在上述难以克服的缺点，为了使人们能够获得更好的声音质量，更加便捷的处理方式，随着数字电子技术的发展，数字音频技术逐渐出现在音频应用的各个领域，并成为多媒体技术及应用的核心。音频是连续变化的模拟信号，而数字音频是一个数据序列，在时间上是断续的。把模拟音频信号通过采样和量化转换成用由许多“0”、“1”表示的数字信号，这个过程就是音频的数字化。在这一处理技术中，涉及到音频的采样、量化和编码。
4.1.2 数字音频的采样、量化和编码
4. 数字音频文件的存储量
以字节为单位，模拟波形声音被数字化后未被压缩的音频文件的存储量为：存储量=采样频率×量化位数/8×声道数×时间其中，声道是指处理的声音是单声道还是立体声。单声道在声音处理过程中只有一个数据流，而立体声则需要左右声道两个数据流。数字音频质量的三要素：采样频率、采样的量化位数（8位或者16位）、采样的声道数（单声道或者立体声）
4.2 音频编码技术
4.2.1 编码基础
4.2.2 编码标准
4.2.1 编码基础
音频信号数字化之后数据量巨大，为存储和传输带来了一定压力。因此，为了降低传输或存储的费用，就必须对数字音频信号进行编码压缩。音频信息在编码技术中通常分成两类来处理，分别是语音和音乐，各自采用的技术有差异。语音编码技术又分为三类：波形编码、参数编码以及混合编码；音乐的编码技术主要有自适应变换编码（频域编码）、心理声学模型和熵编码等技术。
4.1.1 数字音频基础
次声：<= 20Hz 超声：>= 20kHz 可听声（音频）：20Hz--20kHz 电话语音：20Hz--3.4kHz 调幅广播：50Hz--7kHz 调频广播：20Hz--15kHz
宽带音频：20Hz--20kHz
声音三要素：音调（音高）、音强（响度）和音色
4.1.1 数字音频基础
4.1.3 数字音频文件格式
2. AIF或AIFF文件
AIF是音频交换文件格式(Audio Interchange File Format)的英文缩写，是Apple公司开发的一种声音文件格式，被Macintosh平台及其应用程序所支持。 Netscape Navigator浏览器中的LiveAudio也支持AIFF格式。 SGI平台及其他专业音频软件包也同样支持这种格式。 Windows的Convert工具可以把AIF格式的文件转换成Microsoft的 WAV格式的文件。
4.1.3 数字音频文件格式
5. PCM（脉冲代码调制）文件
PCM文件是模拟的音频信号经模数转换直接形成二进制序列的文件，该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中，可以利用VOC-HDR程序，为PCM格式的音频文件加上文件头，而形成VOC格式。 Windows的Convert也具有将PCM音频文件转换成Microsoft的WAV格式的功能。
4.1.3 数字音频文件格式
3. WMA文件
WMA就是Windows Media Audio编码后的文件格式，由微软开发。 ASF、WMA都是微软公司为了和Real Networks公司竞争而开发的网上流式数字音频压缩技术，可以一边下载一边播放，因此WMA可以很轻松的实现在线广播。这种压缩技术同时兼顾了保真度和网络传输的需求, 微软声称，在只有64kbps的码率情况下，WMA可以达到接近CD的音质。WMA支持防复制功能，通过Windows Media Rights Manager加入保护，可以限制播放时间和播放次数甚至于播放的机器等等。
4.1.3 数字音频文件格式
4. RA文件
RA文件是Real Networks公司开发的一种流媒体音频文件，在网络上非常流行，在低速率的广域网上实时传输音频信息。网络连接速率不同，客户端所获得的声音质量也不尽相同。对于传输速率为14.4kbit/s的网络连接，可获得调幅(AM)质量的音质；对于传输速率为28.8kbit/s的网络连接，可以达到广播级的声音质量；如果拥有ISDN或更快的线路连接，则可获得CD音质的声音。和WMA一样，RA不但都支持边下载边播放，也同样支持使用特殊协议来隐匿文件的真实网络地址，从而实现只在线播放而不提供下载的欣赏方式。
4.1.3 数字音频文件格式
8. CD-DA文件
CD-DA文件是CD光盘采用的文件格式，在大多数播放软件的“打开文件类型”中，都可以看到该格式。一个CD音频文件是一个.cda文件，这只是一个索引信息，并不真正的包含声音信息，不论CD音乐的长短，在电脑上看到的“*.cda文件” 都是44字节长。注意：不能直接复制.cda文件到硬盘上播放，需要使用抓音轨软件把CD格式的文件转换成WAV。
4.3 音频素材的获取
4.3.1 从素材库直接获取或从网站下载
4.3.2
自行录制声音
4.3.3
从CD、VCD/DVD中截取声音
4.3.1
从素材库直接获取或从网站下载
用户可直接使用以上光盘或者网站上的音频素材, 也可以先找到与要求相接近的声音，再通过音频编辑软件适当加以处理后使用。
4.1.3 数字音频文件格式
WAV文件 PCM文件 MP1/MP2/MP3文件
AIF/AIFF文件
MHale Waihona Puke DI文件WMA文件 CD-DA文件 RA文件 MP4
4.1.3 数字音频文件格式
1. WAV文件
WAV文件也叫作波形文件，是Microsoft公司开发的一种声音文件格式，存储文件扩展名为“.wav”。 WAV格式文件的数据是直接来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点，以不同的量化位数（8～64bit）把这些采样点的值转换成二进制数，然后存入磁盘，这就产生了声音的WAV文件，WAV文件所需要的存储容量很大，如果对声音质量要求不高的话，可以通过降低采样频率、采用较低的量化位数或利用单声道来录制WAV文件，此时的WAV文件大小可以大大减小。 WAV文件数据没有经过压缩，数据量大，但音质最好。大多数压缩格式的声音都是在它的基础上经过数据的重新编码来实现的，这些压缩格式的声音信号在压缩前和回放时都要使用WAV格式。
4.1.2 数字音频的采样、量化和编码
1. 采样
模拟音频信号实际上是连续信号，或称连续时间函数x(t)。在对模拟音频信号进行数字化时，必须先对连续信号采样，即按一定的时间间隔(T)取值，得到x(nT)，n为整数。T称为采样周期，1/T称为采样频率，x(nT)是离散信号。虽然数字音频信号可以克服模拟音频的缺点，但是在播放声音的时候，数字音频必须重新还原为模拟音频，为了保证还原的音频信号不失真，数字化时采样频率必须满足采样定理的要求。采样定理：在进行模拟/数字信号的转换过程中，为保证还原后的信号不出现失真，采样频率至少是信号最高频率的2倍。常用的音频采样率有：8kHz、11.025kHz（普通声音）、22.05kHz （盒式磁带质量）、16kHz、37.8kHz、44.1kHz（CD质量）、48kHz。
4.1.3 数字音频文件格式
6. MPl、MP2、MP3文件
MPl、MP2和MP3文件是指“MPEG运动图像专家组”所制定的音频文件格式，根据压缩质量和编码复杂程度的不同分为3层，分别对应MPl、 MP2和MP3三种声音文件。 MPEG音频文件的压缩是一种有损压缩，MPEG音频编码具有很高的压缩率，MPl、MP2的压缩率为4:1～8:1，而MP3的压缩率则高达12:1，也就是说1分钟CD音质的音乐，未经压缩需要10MB存储容量，而经过 MP3压缩编码后不到1MB。 MP3的特点是体积小、有较好的声音质量，所以MP3是目前最为流行的一种音乐文件。
4.1.3 数字音频文件格式
7. MIDI文件
MIDI是数字音乐电子合成乐器的统一国际标准，它规定计算机音乐程序、电子合成器和其他电子设备之间交换信息与控制信号的方法。 MIDI文件中包含音符、定时和多达16个通道的乐器定义，每个音符包括键、通道号、持续时间、音量和力度等信息，可以模拟大提琴、小提琴和钢琴等常见乐器。当播放MIDI音乐的时候，其实就是将各种预先设计好的声音元素按乐谱合成为一首音乐。 MIDI的数据容量很小，适合作为音乐背景音响效果，用来播放长时间的、高质量的音乐。MIDI文件的扩展名是MID和RMI。
第4章多媒体音频处理技术
4.1 4.2 4.3
音频技术简介音频编码技术音频素材的获取 4.4 音频素材的编辑
4.1 音频技术简介
4.1.1 数字音频基础
4.1.2
数字音频的采样、量化和编码
4.1.3
数字音频文件格式
4.1.1 数字音频基础
1. 声音
声音是一种由机械振动产生的波，叫声波（多普勒效应，当声源离观测者而去时，声波的波长增加，音调变得低沉，当声源接近观测者时，声波的波长减小，音调就变高）。声音的强弱体现在声波振动的幅度大小上，音调的高低体现在声波振动的频率上，人们可以使用麦克风（话筒）把声波转换成电信号，即音频信号。音频信号是一种频率范围为20Hz～20KHz的波形信号，它有两个基本的参数：频率和幅度。电压的幅度表示声音的强弱，频率表示声音的音调，它是一种在时间和幅度上都是连续的模拟信号。