多媒体技术及应用第二章音频信息的获取与处理

合集下载

多媒体技术与应用答案

第一章多媒体技术概述1、什么是媒体?媒体是如何分类的？（简答题）答：（1）媒体指的是信息表示和传输的载体，是人与人之间沟通及交流观念、思想或意见的中介物。

在计算机科学中，媒体具有两种含义：一是承载信息的物理实体，例如磁带、磁盘、光盘、半导体存储器；二是表示信息的物理载体，例如文本、图形、图像、声音、动画及影像等。

多媒体技术中的媒体一般指后者。

（2）按照国际上一些标准化组织制定的分类标准，媒体主要有一下6种类型。

（1）感觉媒体（2）表示媒体（3）显示媒体（也称表现媒体）（4）存储媒体（5）传输媒体2、什么是多媒体？它有哪些关键特性？（简答题）答：（1）多媒体是由两种以上单一媒体融合而成的信息综合表现形式，是多种媒体的综合、处理和利用的结果。

（2）多维化：计算机处理媒体信息的多样化，使人与计算机之间的交互不再局限于顺序的、单调的、狭小的范围，而有充分自由的余地。

交互性：人、机对话，是多媒体技术的关键特征。

在多媒体系统中，除了操作上控制自如之外，在媒体的综合处理上也可以随心所欲。

集成性：将各种不同的媒体信息有机地进行同步组合，形成一个完整的多媒体信息；把不同的媒体设备集成在一起，形成多媒体系统。

3、多媒体技术如何定义？多媒体技术有哪些特点？答：（1）多媒体技术是以计算机（或微处理芯片）为中心，将文本、图形、图像、音频、视频和动画等多种媒体信息进行数字化综合处理，使多种媒体信息建立逻辑连接，并集成一个具有交互性的系统技术。

（2）多媒体技术特征：多样性，集成性，交互性，实时性和数字化。

4、什么是多媒体系统？答:多媒体系统是指由多媒体网络设备、多媒体终端设备、多媒体软件、多媒体服务系统及相关的多媒体数据组成的有机整体。

5、什么是虚拟现实技术？答：虚拟现实技术（VR）是一种可以创建和体验虚拟世界的计算机系统，一种逼真的模拟人在自然环境中视觉、听觉和运动等行为的高级人机交互（界面）技术。

一、单选题1．媒体有两种含义，即表示信息的载体和 ( B )。

数字音频资源的获取、处理及应用

数字音频资源的获取、处理及应用音频泛指人类能够听到的所有声音，它是信息交流的重要媒介。

音频属于过程性信息，有利于限定和解释画面。

音频作为一种信息载体，在教学中的作用主要有三个方面:一是作为解说，用于说明事物和现象，对学习者给予指导和引导；二是作为背景音乐，用于烘托特定的内容情节的气氛，对学习的节奏和氛围给予一定程度的调节；三是用作模拟在特定场合中产生效果声，用于丰富教学内容所涉及的事物和现象，增加内容的表现力，不仅让学生观其形，还能闻其声。

【实验目的】1.了解数字音频资源的常用格式2.学会数字音频资源的获取方法3.能够对数字音频资源进行简单的加工处理4.学会在多媒体课件、主题学习网站中使用数字音频资源的方法【实验类型】基础型实验【实验任务】运用本实验中学习的数字音频获取与处理技术，制作自己课件中所需的音频资源，并运用于课件或网站中。

要求做到：1. 根据课程教学内容表达的要求，设计好相应的音频资源，如配音、音效或背景音乐等。

2. 采取多种音频素材获取方法获取音频素材(网络下载、自己录制或音频片段截取)，并用cooledit音频处理软件对获取的素材进行合成处理，使其符合课件需要。

3. 运用于PowerPoint或Dreamweaver制作的课件或网站中。

【实验环境】1．能够连接Internet的多媒体计算机；2．耳麦；3．Cool Edit、Microsoft PowerPoint、Macromedia DreamWeaver等软件。

【实验指导】一、常用数字音频文件的格式1．WAV文件格式W A V（Waveform Audio) 文件格式，扩展名为W A V，是Microsoft公司开发的一种音频文件格式。

WA V音频文件是对声音模拟波形的采样而形成的文件格式，即将声音源发出的模拟音频信号通过采样、量化转换成数字信号，再进行编码，以波形文件(.W A V)的格式保存起来，记录的是数字化波形数据。

其中声音信息采样频率和量化的精度直接影响声音的质量和数据量。

《多媒体通信技术》

信息压缩的可行性
（6）视觉听觉冗余视觉听觉冗余是指人的视觉、听觉分辨率低于实际图象、音频的分辨率所产生的冗余。
例如，人的视觉对灰度等级的分辨率是2个等级，而一般图象量化所采用灰度等级是2等级。
例如，人的视觉对于图像边缘的急剧变化不敏感，对图像的亮度信息敏感，对颜色的分辨率较弱等。因此，如果图像经压缩或量化发生的变化（或称引入了噪声）不能被视觉所感觉，则认为图像质量是完好的或是够好的，即图像压缩并恢复后仍有满意的主观图像质量。
编程类
Vb VC Delphi Java
3. 多媒体信息的特点
多媒体数据类型复杂（多样性）
多媒体数据种类繁多也决定了多媒体数据表示的复杂性
多媒体数据的实时性
由于在多媒体技术中新引入的复杂媒体类型大部份都含有与时间有关的信息，因此在许多场合都要求实时处理
3. 多媒体信息的特点
多媒体数据的同步性
(4) 存储媒体（storage medium）
存储媒体是指进行信息存储的媒体。包括：硬盘、光盘、软盘、磁带、ROM、RAM等。
(5) 传输媒体（transmission medium）
传输媒体是指承载信息，将信息进行传输的媒体。包括：双绞线、同轴电缆、光缆、无线电链路等。
在多媒体技术中的“多媒体”通常是指感觉媒体的组合，即声音、文字、图像、数据等各种媒体的组合。
3．多媒体通信
多媒体通信技术是多媒体技术、计算机技术、通信技术和网络技术等相互结合和发展的产物。
多媒体通信系统同时具有以下三个特征：
集成性交互性同步性
集成性：主要是对各类信息进行存储、传输、处理、显现的能力。
1）内容数据信息：文本、图形、静止图像与二值图像、声音、运动图像。

多媒体技术之音频信息的获取与处理PPT课件( 75张)

则可由 x(nT) 完全确定 x(t)。当 fN = 1/(2T) 时，称 fN 为奈奎斯特频率
常用音频采样率：8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的，为把 x(nT) 存入计算机，就必须将采样值离散化，即量化成一个有限个幅度值的集合 x(nT)
多媒体技术及其应用
第二章音频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
实时性声音具有实时性。对处理声音的计算机硬件和软件提出很高要求
2.2 数字化音频
转换
模拟信号
数字信号
音频数字化需要考虑的问题
采样、量化、编码
模拟信号的数字化过程
100101100011101
音频信号处理过程流程
音
频采
开信样
始
号频
频率
率
采样
量化
保存为声音文件
周期
用声音录制软件记录的英文单词“Hello”的语音实际波形
2.1.2 声音特点
● 声音的传播方式
声音是依靠介质 ( 比如：空气、液体、固体 ) 的振动进行传播的声源是一个振荡源，它使周围介质产生振动，并以波的形式传播人耳感觉到这种传播过来的振动，反映到大脑，就意味听到声音声音在不同的介质中传播，其传播速度和衰减速率都是不一样的

多媒体技术及应用教程

多媒体技术基础及应用自学指导书李知菲2005年4月20日于浙江师范大学课程简介多媒体计算机技术及其应用是当今计算机产业发展的新领域。

本课程从设计、开发和应用的角度综合讲述了多媒体计算机的基本原理和关键技术。

主要内容有：多媒体计算机定义、分类、现状及发展趋势；视频和音频信号的获取、处理及输出；多媒体数据压缩编码的基本算法及现行的编码国际标准；多媒体计算机硬件及软件系统结构；同时还讲述了计算机产业的发展方向，将通讯和多媒体技术作到CPU芯片的实例；最后介绍了三个多媒体应用领域及其核心技术：多媒体数据库及基于内容检索技术、多媒体创作工具及同步技术、多媒体通讯和分布式多媒体系统。

它包括：视频会议、多媒体交互式电视技术及计算机支持的协同工作(CSCW)系统。

自学目标本课程可作为计算机专业学员的必修课程及其它相关专业学员的选修课程早期的计算机只能处理数字与文字，现在多媒体计算机能够综合处理声、文、图及视频信息，并具有集成性和交互性，因此，它促进了通讯、娱乐和计算机的融合，从而形成新一代的产品，为人类的生活和工作提供全新的信息服务，它是计算机产业重要的发展趋势。

通过本课件的学习，使同学了解多媒体计算机发展趋势，掌握多媒体计算机的基础理论知识、熟悉多媒体计算机的应用领域，从而使同学能够设计开发多媒体计算机硬件和软件系统以及多媒体的应用系统。

学员自学要求：（学员需要具备的相关知识）为了学好本课程，希望学员先修：（1）数字逻辑电路；（2）操作系统；（3）计算机原理；如果有可能可以辅修：（1）数字信号处理；（2）数字图象处理；（3）数字音频信号处理；（4）模式识别及（5）计算机视觉等课程的相关章节。

本课程要求：（教师对学员自学本课程的要求）学好基础理论知识，提高同学分析问题和解决问题的能力。

具体要求是：1．了解多媒体计算机的关键技术、现状及发展趋势，2．掌握多媒体计算机的基础理论知识：a)视频音频信息的获取、实时处理和输出；b) 多媒体数据压缩编码的原理及现行编码的国际标准；c) 多媒体计算机硬件和软件系统结构.3．熟悉多媒体计算机的应用技术：a) 多媒体数据库及基于内容检索；b)多媒体著作工具及同步技术;c) 多媒体通讯及分布式多媒体系统，4．通过实验，如设计并编程实现一个多媒体网站或者制作一个电子像册，提高同学的动手能力。

《多媒体技术与应用》课程教学大纲

《多媒体技术与应用》课程教学大纲一、课程教学目标及学生应达到的能力多媒体技术是在计算机技术基础上发展起来的一门学科，、由于多媒体技术一直处于高速的发展变化过程中，因此课程内容应该根据这种变化做相应的调整和变化，注意知识和内容的更新，保持时效性。

本门课程实践性强。

多媒体技术不仅理论体系完整，而且更要求将理论与实践紧密结合，只有在实践的基础上才能掌握理论内涵和技术要点。

通过本门课程的学习，学生可以掌握多媒体技术的基础知识和基本技能，能够使用工具软件制作多种类型的多媒体作品，从而为学生日后的学习和工作打下良好的基础。

教学目标是使学生系统地掌握多媒体技术的基本理论和知识，形成基本的知识体系逻辑；掌握各种媒体的基本处理技术和常用多媒体外设的使用，培养学生实际操作的动手能力；结合多媒体作品设计，培养学生综合运用所学知识能力并发挥想象力和创造力，这也是信息时代对人才的需求；通过对各种多媒体软件的介绍和学习，培养学生通过自己的探索和利用软件中提供的帮助进行自我学习的能力；通过布置课后作业，学生分组完成，培养学生的学习兴趣和合作精神。

二、课程教学内容和要求•第一章多媒体技术概论教学内容1、多媒体技术的基本概念2、多媒体技术的研究对象3、多媒体关键技术4、多媒体技术的应用和发展教学要求• 1、掌握：媒体定义、媒体的种类和特点。

• 1、理解：多媒体的概念、多媒体技术的内容。

• 2、了解：多媒体技术的发展历程。

教学建议• 根据具体情况，对多媒体关键技术以及应用的最新发展作适当介绍。

第二章多媒体计算机系统教学内容1、多媒体技术的基本概念2、多媒体计算机3、多媒体关键技术4、多媒体技术的应用和发展教学要求• 1、掌握：多媒体计算机的组成、光存储设备的使用。

• 1、理解：多媒体接口卡的工作原理、光存储系统的原理。

• 2、了解：多媒体系统的特点与分类,常用多媒体输入输出设备。

教学建议• 根据具体情况，对多媒体系统的运行环境作适当介绍。

音频信息处理

温度
15 10 5 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
时间
图 2-1
气温变化曲线
(2). 影响数字音频质量的技术参数对模拟音频信号进行采样量化编码后，得到数字音频。数字音频的质量取决于采样频率、量化位数和声道数三个因素。 1). 采样频率采样频率是指一秒钟时间内采样的次数。在计算机多媒体音频处理中，采样频率通常采用三种：11.025KHz(语音效果)、22.05KHz(音乐效果)、44.1KHz(高保真效果)。常见的CD唱盘的采样频率即为44.1KHz。
返回
音频是指人类听觉神经所能感知范围内的声音频率，也称声频。人耳能听到的频率范围是 20Hz~20KHz，低于20Hz的音频称为次声波，高于 20KHz的音频称为超声波，两者间的音频为可听声波，即属于多媒体音频信息范畴。但人类最敏感的声音频率范围是3KHz~5KHz，我们说话时产生的声波频率大约在300Hz~3KHz，音乐的频率可达到10-20KHZ。对于高于18~20kHz和低于16~20Hz的声音信号，无论音强如何，一般人都会听不到。在处理声音素材时，可通过调节不同频率的音强来优化声音的质量，如低于200Hz的低频信号可用来增强语音的自然度和谈话风度。
(4). 数字音频信号的编码一般情况下，声音的制作是使用麦克风或录音机来产生，再由声卡上的WAVE合成器的 (模/数转换器)对模拟音频采样后，量化编码为一定字长的二进制序列，并在计算机内传输和存储。在数字音频回放时，再由数字到模拟的转化器(数/模转换器)解码可将二进制编码恢复成原始的声音信号，通过音响设备输出。如下图所示。模拟音频信号输入播放解码采样/量化编码传输/存储

《多媒体技术及应用》教学大纲

《多媒体技术及应用》教学大纲一、课程基本信息课程名称：多媒体技术及应用课程类别：专业必修课学分：＿____学时：＿____先修课程：计算机基础、编程语言二、课程目标本课程旨在让学生全面了解多媒体技术的基本概念、原理和应用，培养学生的多媒体创作和处理能力，为学生在多媒体领域的进一步学习和工作打下坚实的基础。

通过本课程的学习，学生应达到以下目标：1、掌握多媒体技术的基本概念、原理和关键技术，包括图像、音频、视频等多媒体元素的处理和编码。

2、熟练掌握至少一种多媒体创作工具，能够独立完成多媒体作品的设计与制作。

3、具备分析和解决多媒体技术应用中常见问题的能力，能够对多媒体系统进行简单的维护和管理。

4、培养创新意识和团队合作精神，能够在多媒体项目中发挥积极作用。

三、课程内容（一）多媒体技术概述1、多媒体的概念、特点和应用领域。

2、多媒体技术的发展历程和趋势。

（二）多媒体数据压缩1、数据压缩的基本原理和方法。

2、图像压缩标准（如 JPEG、PNG 等）。

3、音频压缩标准（如 MP3、WMA 等）。

4、视频压缩标准（如 H264、MPEG 等）。

（三）多媒体硬件设备1、多媒体计算机系统的组成。

2、图像采集设备（如扫描仪、数码相机等）。

3、音频采集设备（如麦克风、录音笔等）。

4、视频采集设备（如摄像机、摄像头等）。

5、输出设备（如显示器、打印机、投影仪等）。

（四）图像处理技术1、图像的基本概念和表示方法。

2、图像的获取、编辑和处理（如裁剪、旋转、调色等）。

3、图像特效的制作（如模糊、锐化、浮雕等）。

4、图像的合成与融合。

（五）音频处理技术1、音频的基本概念和数字化。

2、音频的录制、编辑和特效处理（如降噪、均衡、混响等）。

3、 MIDI 音乐的制作与编辑。

（六）视频处理技术1、视频的基本概念和数字化。

2、视频的剪辑、合成和特效处理（如过渡效果、字幕添加、调色等）。

3、视频的编码与解码。

（七）多媒体创作工具1、常用多媒体创作工具的介绍（如 Adobe Premiere Pro、After Effects、Audition 等）。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

则可由 x(nT) 完全确定 x(t)。当 fN = 1/(2T) 时，称 fN 为奈奎斯特频率
常用音频采样率：8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的，为把 x(nT) 存入计算机，就必须将采样值离散化，即量化成一个有限个幅度值的集合 x(nT)
采样方法语设音连信续号信频号谱x在(t)高的频频处谱迅为速x下(f)降，，以但采非样限间带隔。T应采用样时得只到对离一散定信频号率x范(nT围) 内如的果信满号足感：兴当趣|，f |就≥ 可fc (以fc对是经信滤号波高限端带截的止音频频率信)号时采，样有。这样，在采样前，用一个锐截止模拟低通T滤≤波1/器(2f对c) 音或频fc信≤ 号1/(进2T行) 滤波。
音频数据大小
数字化文件数据量(字节/秒) = 采样频率(Hz)(量化位数(bit) / 8 )声道数
影响数据因素
数据的采样频率及量化位数。采样频率越高，量化位数越多，数据越大
2.2.3 数字音频音质与数据量
音质与数字音频参数的对应关系
采样频率 kHz 8.000 8.000 11.025 11.025 22.050 22.050 44.100 44,100
2.2.4 数字音频文件格式
MID ● MIDI 音频文件
● 定义：一种计算机数字音乐接口生成的数字描述音频文件，文件中包含音符、定时和多达 16 个通道的乐器定义。
● 特点：文件不记载声音本身波形数据，用数字形式记录声音特征，演奏 MIDI 乐器或重放时，将数字描述与声音对位处理；数据量小。
● 应用：适合应用在对资源占用要求苛刻的场合，比如多媒体光盘、游戏制作、背景音乐等。主要用于计算机声音的重放和处理。
采样过程
按固定间隔采样声音波形
采样声音波形之后的结果
2.2.2 数字音频获取
● 采样
采样定理奈奎离斯散特信号( Nxy(qnuTs)t是) 从采连样续定信理号：只x(t要) 上采取样出频的率一大部于分或值者，等那于么信用号x中(n所T)包能够含惟的一最地高恢频复率出的x两(t)倍吗；即当信号是最高频率时，每个周期至少采样两个点，则理论上就可以完全恢复原来的信号。
2.2.4 数字音频文件格式
VOC ● 波形音频文件
● 定义：一种 Creative 公司研制的波形音频文件格式，也是声霸卡(Sound Blaster) 使用的音频文件格式。
● 特点：由文件头块和音频数据块组成。文件头包含一个标识、版本号和一个指向数据块起始的指针；数据块分成各种类型的子块。
● 应用：利用声霸卡提供的软件可实现 VOC 和 WAV 转换：VOC2WAV 转换 VOC 到 WAV；WAV2VOC 转换 WAV 到 VOC。
扩展名为 RMI 的文件是 Microsoft 公司的 MIDI 文件格式，可包括图片、标记和文本
2.2.4 数字音频文件格式
MP3 ● 压缩音频文件
● 定义：采用 MPEG 标准音频数据压缩编码中层 Ⅲ 技术压缩之后的数字音频文件。
● 特点：压缩比高、数据量小、音质好，压缩比例有 10 : 1、17 : 1，甚至 70 : 1；数据率可以是 64kbps，也可以是 320kbps。
实时
音频是多媒体的重要媒体之一
语音言语
清音/浊音爆破音
音频Audio
非语音声音
乐音杂音（音响）
认识声音
空气、液体、固体
声音是机械振动在弹性介质中传播的机械波，称为声波。
声音转换为电信号时，声音的电信号在时间和幅度上都是连续的模拟信号。
● 声音特性
振幅
● 振幅 — 波的高低幅度，表示声音的强弱 ● 周期 — 两个相邻波之间的时间长度 ● 频率 — 每秒钟波振动的次数，单位是 Hz
音频数据大小
数字化文件数据量(字节/秒) = 采样频率(Hz)(量化位数(bit) / 8 )声道数
举例
如果采样频率为44.1kHz，分辨率为16位，立体声，录音时间为10s，符合CD音质的声音文件的大小是多少？
计算数字音频文件大小
44100Hz×(16/8)×2 ×10s =1764KByte
多媒体技术及应用第二章音频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
实时性声音具有实时性。对处理声音的计算机硬件和软件提出很高要求
2.2 数字化音频
转换
模拟信号
数字信号
音频数字化需要考虑的问题
采样、量化、编码
音频信号处理过程流程
结束开始
音频信号频率
采样频率
采样
量化
保存为声音文件
2.2.2 数字音频获取
● 采样
采样概念
声波是连续信号，或称连续时间函数 x(t)。用计算机处理这些信号时应先离散化，即按一定的时间间隔 (T) 取值，得到 x(nT) ( n为整数 )，T 称采样周期，1/T 称采样频率 ( 每秒钟采样次数 )，x(nT) 称采样值 ( 或离散信号 )
影响音质因素
数据的采样频率及量化位数。采样频率越低，量化位数越少，音质越差
采样频率、采样精度和声道数对声音的音质和占用的存储空间起着决定性作用，如下表所示：
采样频率、采样精度、声道数与存储容量关系
声音质量
电话音质 AM音质 FM音质 CD音质 DAT音质
采样频率 (KHZ) 8
11.025
22.05
44.1
48
采样精度 (bit) 8
8
16
16
16
单双声声道道/ 1 1 2 2 2
存储容量（Mb/min）
0.46 0.63 5.05 10.09
10.99
2.2.3 数字音频音质与数据量
音质基本概念
音质是指声音的质量，与频率的范围成正比；频率范围越宽，音质越好
影响音质因素
数据的采样频率及量化位数。采样频率越低，量化位数越少，音质越差
2.2.4 数字音频文件格式
WAV ● 波形音频文件
● 定义：一种最直接的表达声音波形的数字音频文件，主要用于自然声音的保存与重放。
● 特点：声音层次丰富、还原性好、表现力强；如果采样率高，其音质极佳；但数据量大，与采样频率、量化位数、声道数成正比。
● 应用：电子幻灯片 PowerPoint 软件、各种算法语言及多媒体平台软件可直接使用，适合多媒体系统、音乐光盘制作等。
声音的特色，主要影响因素是复音；复音指具有不同频率和不同振幅的混合声音，其中最低频率是 “基音”，是声音的基调钢，琴其他频吉率他的声音小为号“谐音小(泛提音琴)”
声音的主要性质
连续性声音具有连续性。在时间轴上是连续信号，具有连续性和过程性
相关性声音具有相关性。构成声音的数据，前后之间具有强烈的相关性
● 应用：可以在个人计算机、MP3 半导体播放机和 MP3 激光播放机上进行播放；适合用在国际互联网和各个领域。
MP3播放器Winamp MP3是Internet上流行的音乐格式
2.2.4 数字音频文件格式
WMA ● 流式音频文件
● 定义：Microsoft 研制的一种压缩离散文件或流式文件，它提供了一个 MP3 之外的选择机会。
声音的频率范围
次声波 < 20 Hz
人耳可听域 20 ~ 20,000 Hz
超声波 > 20,000 Hz
男性语音
100 Hz ~ 9,000 Hz
女性语音声
源
电话语音
150 Hz ~ 10,000 Hz 频
200 Hz ~ 3,400 Hz
带
种
调幅广播(AM)
50 Hz ~ 7,000 Hz
宽
2.2.4 数字音频文件格式
文件格式 WAV VOC MP3 MIDI WMA RA PCM
常见的声音文件格式
说明 Windows采用的波形声音文件存储格式
Creative公司波形音频文件格式 MPEG Layer III最常见的音乐压缩文件
Windows 的MIDI文件存储格式流式音频文件
RealNetworks公司的流式声音文件格式数字音频文件
● 声音从声源发出后，经过多次反射到达人类听觉器官的声音是 “反射声”
●声音的三要素
● 音调 —— (高低)
● 音强 —— (强弱) ● 音色 —— (特质)
代表声音的高低，与频率有关；使用音频处理软件对声音的频率进行调整时，(低其) 音调也会随之发(高生)变化
声音的强度 (响度或音量)，与声波振幅成正比；唱盘、CD 盘等声音载体中的音强不变，通过播放设备的音量控制可改变聆听时强(度弱)；音频处理(强软)件可提高声(停源) 音强
● 特点：相对于 MP3 具有较高压缩率和良好音质。当小于 128kbps 时最为出色且编码后音频文件很小；当大于 128kbps 时音质损失过大。
2.2.2 数字音频获取
● 编码
编码概念音频模拟信号经过采样与量化之后，为把数字化音频存入计算机，需对其编码，即用二进制数表示每个采样的量化值，完成整个模数转换过程
PCM 编码一种最方便简单的编码方法是脉冲编码调制，常称为 PCM (Pulse Code Modulation) 编码。它是一种未经压缩的数字音频信号，常作为一种参考信号，以便其他编码方法与之比较，或在此基础上作进一步压缩编码