第二章模拟音频和数字音频

合集下载

《音频技术基础》课件

虚拟现实
音频技术可以提供沉浸式的音频体验，增强虚拟现实的真实感。
总结和讲解领域之前的关系
1
音频技术的重要性
音频技术在各个领域中的应用日益广泛，对于传媒、娱乐和通信等行业具有重要意义。
2
与其他技术的关系
音频技术与电子技术、计算机技术和网络技术等密切相关，相互促进发展。
3
未来发展趋势
随着科技的不断进步，音频技术将不断创新和发展，给我们带来更多惊喜。
音频处理
音频处理是对音频信号进行编辑、混音、均衡和滤波等处理，以改善音频的质量。
音频效果
音频效果是添加到音频信号中的特殊效果，如回声、混响和合唱。
音频应用与创新
音乐制作
音频技术在音乐制作中起着重要作用，可以实现录音、混音和后期处理。
语音识别
音频技术在语音识别领域有广泛应用，可以实现声纹识别和语音转文字。
数字音频和模拟音频
模拟音频
模拟音频是连续的信号，它可以无限细化，但容易受到干扰。
数字音频
数字音频是离散的信号，它经过采样和量化处理，具有较强的抗干扰性。
音频采样与量化
1 采样
采样是指将连续的音频信号转换为离散的数据点。
2 量化
量化是指对采样的音频数据点进行数字编码。
3 采样率和位深度
采样率决定了音频信号的频率范围，位深度则决定了音频信号的动态范围。
《音频技术基础》PPT课件
本课件将介绍音频技术基础，包括音频信号与声波、数字音频和模拟音频、音频采样与量化、音频编码和压缩、音频处理与效果、音频应用与创新，以及总结和讲解领域之前的关系。
音频信号与声波
什么是音频信号？
音频信号是指随时间变化的声音波动，以电信号的形式传输。

音频处理软件

“静音”
5.1.2. 音频的基本操作
3. 音频文件管理
⑴打开文件：选择 “文件/打开” 命令，出现“打开”对话框。
5.1.2. 音频的基本操作
选择 “文件/打开作为” 命令，可以打开文件并转换成新的波形格式。选择“文件/打开添加” 命令，可以将打开的文件添加到正在编辑的音频文件末尾。
⑵关闭文件的方法：选择“文件/关闭”命令，可以关闭当前波形显示区的文件。或选择“文件/关闭全部”命令，关闭所有打开的文件和新建的波形文件。
5.1.2. 音频的基本操作
(7)混合粘贴利用Adobe Audition的编辑功能，可将当前剪贴
板中的声音与窗口中的声音混合。执行“编辑/混合粘贴” 命令，选择需要的混合方式，如“插入”、“重叠”、“替换”、 “调制”。混合前应先调整好插入点位置（黄线）。
5.1.2. 音频的基本操作
(8)静音选中一段波形，单击右键，在弹出的菜单中选择
回顾
第二章 ➢ 模拟音频和数字音频 ➢ 声音的特点（衡量指标） ➢ 声音的数字化过程 ➢ 数字音频的质量和数据量的衡量 ➢ 常见数字音频文件格式 ➢ 数字合成音乐（MIDI）
第五章音频处理软件
Adobe于2003年5月收购了久负盛名的专业级音频后期处理软件Cool Edit Pro 2，更名后推出了Audition 1.0。在2004年推出1.5版本。
➢ CD Audio－－CD-ROM模拟录音音量控制单独录制CD-ROM播放的音乐。
➢ Line In －－线路输入录音音量控制记录外部模拟设备的音乐。
5.1.2. 音频的基本操作
录音操作过程： ①选择“文件/新建”命令，出现“新建波形”对话框，选择适当的采样频率、录音声道和解析度。如下图。用于CD音质，可选择44100Hz、立体声、16位。 ②单击声音播放工具中的红色按钮“录音”，开始录音。 ③拿起话筒或播放CD。 ④完成录音后，单击“停止”按钮

模拟音频和数字音频

数字音频技术
把表示声音强弱的模拟电压用数字表示。
数字音频:
通过采样量化, 把模拟量表示的音频信号转换成许多二进制数 1 和 0 组成数字音频文件
数字音频特点
失真小噪音低
音域定位准，动态范围大
保真度好, 如配合功放、
音箱等设备可真正地带来高保真立体声享受。
音波形
频
率
1．频率次声 0一20 Hz 人耳能听见的声音 20 Hz一20 kHz 超声 20 kHz—l GHz 特超声 l GHz—l0 THz 人耳所能听见的声音称为音频(audio)，将这个范围内的声波称为声学信号(acoustic signal)。
振
2．振幅
幅
振幅的主观感觉是声音的大Байду номын сангаас。
2.1.1 模拟音频和数字音频
声音是由物体的振动产生的，这种振动引起了周围空气压强的振荡，我们称这种振荡的函数表现形式为波形
模拟音频技术
声音是机械波, 话筒把机械振动转换成电信号以模拟电压的幅度表示声音的强弱
模拟声音的录制: 将代表声音波形的电信号转换到
适当的媒体上,如磁带或唱片
模拟声音的播放: 将记录在媒体上的信号还原为声

第二章数字音频编辑与处理

定俗成的整个电脑音乐的统称。
● 特点：文件不记载声音本身波形数据，可以理解为一个乐队的“总谱”
：上边记录的是有哪些乐器、每种乐器的音高、节奏、强弱等；通过声卡将
这个乐谱识出来，并用已经存放在声卡或者软件中的音色库把对应的声音播放出来。 ● 应用：适合应用在对资源占用要求苛刻的场合，比如多媒体光盘、游戏制作、背景音乐等。主要用于计算机声音的重放和处理。
● 声音的三要素
代表声音的快慢，与频率有关；使
● 音调 — (快慢)
用音频处理软件对声音的频率进行
调整时，其音调也会随之发生变化 (慢) (快) 声音的强度 (响度或音量)，与声波振幅成
● 音强 — (强弱)
正比；唱盘、CD 盘等声音载体中的音强
不变，通过播放设备的音量控制可改变聆 (弱) (强) (停) 听时强度；音频处理软件可提高声源音强声音的特色，主要影响因素是复音；复
主讲：韩立华
信息学院基础教研室
目标
• • • • • • 掌握声音的概念、特点和三个要素；理解模拟音频转换为数字音频的过程；掌握常见的音频文件格式及其特点；了解音量调整、声音录制等基本知识；掌握音频处理软件CoolEdit的基本用法。会用CoolEdit制作自己的音频作品。
数字音频编辑处理
数字音频编辑处理
（1）采样
采样是采集声音模拟信号的样本，然后再转换成数字信号。
数字音频编辑处理
（1）采样
采样是采集声音模拟信号的样本，然后再转换成数字信号。
采样用两个参数来衡量：
采样频率采样分辨率
又称：采样位数、采样精度、量化位数、量化精度
单位时间内采样的数量
记录每次采样值大小的数值的位数

多媒体技术及应用数字音频技术02

特点：在低速的广域网上实时传输音频
4. WMA文件
WMA(Windows Media Audio)是 Windows Media格式中的一个子集(音频格式)。
特点：压缩到MP3一半
多媒体技术及应用数字音频技术02
2-11
2.1 数字音频基础
5. MIDI和RMI文件 MIDI(乐器数字接口)是由一组音乐、乐谱或乐器符号的数字集合。特点：播放效果与硬件相关，数据量很小，音质不高、音色单调等 6.VOC文件创新公司开发的声音文件格式，由文件头块和音频数据块组成。
音乐是符号化的声音。
多媒体技术及应用数字音频技术02
2.1 数字音频基础
二、声音的数字化 1.声音信号的类型模拟信号(自然界、物理) 数字信号(计算机) 2.声音数字化过程
模拟信号
采样
量化
编码
数字信号
模拟信号
A/D ADC D/A DAC
数字信号
多媒体技术及应用数字音频技术02
2.1 数字音频基础
霍夫曼编码、算术编码、行程编码 ②有损压缩
波形编码--PCM、DPCM、ADPCM 子带编码、矢量量化
参数编码--LPC 混合编码--MPLPC、CELP
多媒体技术及应用数字音频技术02
2.2 数字音频压缩标准
二、音频压缩技术标准
分类
电话语音质量
调幅广播质量高保真立体声
标准 G.711 G.721 G.723 G.728
多媒体技术及应用数字音频技术02
2020/11/14
多媒体技术及应用数字音频技术02
第二章数字音频技术
2.1 数字音频基础 2.2 数字音频压缩标准 2.3 声卡与电声设备 2.4 MIDI与音乐合成 2.5 音频编辑软件 2.6 语音识别技术本章小结

模拟音频与数字音频

模拟音频和数字音频* 声音是机械振动。

振动越强，声音越大，话筒把机械振动转换成电信号，模拟音频技术中以模拟电压的幅度表示声音强弱。

* 模拟声音在时间上是连续的，而数字音频是一个数据序列，在时间上是断续的。

数字音频是通过采样和量化，把模拟量表示的音频信号转换成由许多二进制数1和0组成的数字音频信号。

计算机内的基本数制是二进制，为此我们也要把声音数据写成计算机的数据格式，这称之为编码音频数字化，计算机内的音频必须是数字形式的，因此必须把模拟音频信号转换成有限个数字表示的离散序列，即实现音频数字化。

在这一处理技术中，涉及到音频的抽样、量化和编码。

模拟音频如何转换为数字音频？首先，我们要了解怎样被记录的？模拟音频的记录就是通过唱片（LP）表面的起伏跌宕（当然细小到你很难看见）或者是磁带上的磁粉引起的磁场强度来表示音箱上振膜的即时位置，比如说，当唱片表面在某一时刻比前一时刻的纹路呈下降趋势时，音箱上的振膜就会向里收缩；如果呈上升趋势，音箱上的振膜就会向外舒张。

他们两个在理想情况下呈比例关系。

而实际上所谓的双声道，单声道就是指需要记录几个信号，你可以理解为，如果是双声道的磁带，那么在记录同一时刻（磁带上的同一个位置）会有两个轨道，一个负责记录左边耳机振膜的位置，一个负责记录右边耳机振膜的位置。

以此推类，多声道的模拟信号也可以这样实现。

那么模拟音频转化为数字音频的过程是怎样的？实际上模拟音频与数字音频的区别就是连续信号与离散信号的区别。

连续信号的特点是连续，比如唱片，比如磁带，磁带在播放时磁带的移动是连续水平移动的，唱机的唱针在唱片上运动时是连续变化的。

这意味着信号不会失真，但是保存这样的介质就会非常困难，比如说唱片会磨损，磁带也会老化。

那么有没有一种方法可以将这些模拟音频的信号保存起来呢？目前人们所使用的方法就是用数字来记录下这些信息。

这些模拟信息一旦被数字保存当然就方便多了，比如说，数字可以被永久的保存，圆周率的数字再过多少年也不会改变，不会磨损；比如说，数字可以被传输，可以方便大家交流。

第二章数字音频处理

◆
为了把采样得到的离散序列信号存入计算机，必须将采样值量化成有限个幅度值的集合，采样值用二进制数字表示的过程称为量化编码。
左图为采样率2000Hz，量化等级为20的采样量化过程右图为采样率4000Hz，量化等级为40的采样量化过程
当采样率和量化等级提高一倍，从图中可以看出，当采样率和量化等级提高一倍，从图中可以看出，当用D/A转换器重构原来信号时（图中的轮廓线）， D/A转换器重构原来信号时），信当用D/A转换器重构原来信号时（图中的轮廓线），信号的失真明显减少，信号质量得到了提高。 பைடு நூலகம்的失真明显减少，信号质量得到了提高。
2.1.2 声音的三要素
声音的三要素是音调、音色和音强。声音的三要素是音调、音色和音强。音调音调---代表了声音的高低。 1.音调---代表了声音的高低 1.音调---代表了声音的高低。音调与频率有关，频率越高，音调越高，反之亦音调与频率有关，频率越高，音调越高，如果改变某种声源的音调，然。如果改变某种声源的音调，则声音会发生质的转变，使人们无法辨别声源本来的面目。的转变，使人们无法辨别声源本来的面目。
fs ≥2f 或者 Ts ≤T/2 其中f为被采样信号的最高频率 fs 为采样频率
2.2.3 影响数字音频质量的技术参数对模拟音频信号进行采样量化编码后，得到数字音频。数字音频的质量取决于采样频率、量化位数和声道数三个因素。 1) 采样频率采样频率是指一秒钟时间内采样的次数。在计算机多媒体音频处理中，采样频率通常采用三种：11.025KHz(语音效果)、22.05KHz(音乐效果)、44.1KHz(高保真效果)。常见的CD唱盘的采样频率即为44.1KHz。
2.1 多媒体计算机的组成与结构 2.2 多媒体音频 2.3 多媒体视频 2.4 多媒体光存储器 2.5 多媒体输入输出设备

第二章数字声音及MIDI-资料

5. 音频数据率
未经压缩的数字音频数据率（bit/s）＝采样频率（Hz）×量化位数（bit）×声道数
音频数据存储量（Byte）＝数据率（bit/s）×持续时间（s） / 8
存储量=采样频率×量化位数/8×声道数×时间
例：采样率11.025KHz、量化位8位，采集1分钟，则：音频数据率＝11.025（KHz）×8（bit）＝ 88.2 (Kbit/s) 音频数据量＝11.025（KHz）×8（bit） ×60（s）/8＝ 0.66 (MByte)
振幅
周期
基线
•基线是测量模拟信号的基准点。 •声波的振幅表示声音信号的强弱程度。 •声波的频率反映出声音的音调，声音细尖表示频率高，声音粗低表示频率低。
•振幅和频率不变的声音信号，称为单音。单音一般只能由专用电子设备产生。
•在日常生活中，我们听到的自然界的声音一般都属于复音，其声音信号由不同的振
幅与频率合成而得到。
模拟声音信号：可分解成一系列正弦波的线性叠加。
最低频的音波称为基音，频率为基频其余的为泛音，频率是基频的整数倍。
声音三要素：音高、音色、音强
音高：由基频决定，基频取对数后与人的音高感觉成线性关系。
音色：有混入基音中的泛音决定。
音强：幅度，听觉与声音信号强度不成线性关系，因而用20log幅度（分贝）表示
声音的质量与数据率
根据声音的频带，把声音的质量分为5个等级
质量
采样频率分辨率（KHz） (b/s)
单声道/ 数据率频率范围
例如，8位量化位数表示每个采样值可以用 28即256个不同的量化值之一来表示，而16 位量化位数表示每个采样值可以用216即 65536个不同的量化值之一来表示。常用的量化位数为8位、12位、16位。

音频信息处理

温度
15 10 5 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
时间
图 2-1
气温变化曲线
(2). 影响数字音频质量的技术参数对模拟音频信号进行采样量化编码后，得到数字音频。数字音频的质量取决于采样频率、量化位数和声道数三个因素。 1). 采样频率采样频率是指一秒钟时间内采样的次数。在计算机多媒体音频处理中，采样频率通常采用三种：11.025KHz(语音效果)、22.05KHz(音乐效果)、44.1KHz(高保真效果)。常见的CD唱盘的采样频率即为44.1KHz。
返回
音频是指人类听觉神经所能感知范围内的声音频率，也称声频。人耳能听到的频率范围是 20Hz~20KHz，低于20Hz的音频称为次声波，高于 20KHz的音频称为超声波，两者间的音频为可听声波，即属于多媒体音频信息范畴。但人类最敏感的声音频率范围是3KHz~5KHz，我们说话时产生的声波频率大约在300Hz~3KHz，音乐的频率可达到10-20KHZ。对于高于18~20kHz和低于16~20Hz的声音信号，无论音强如何，一般人都会听不到。在处理声音素材时，可通过调节不同频率的音强来优化声音的质量，如低于200Hz的低频信号可用来增强语音的自然度和谈话风度。
(4). 数字音频信号的编码一般情况下，声音的制作是使用麦克风或录音机来产生，再由声卡上的WAVE合成器的 (模/数转换器)对模拟音频采样后，量化编码为一定字长的二进制序列，并在计算机内传输和存储。在数字音频回放时，再由数字到模拟的转化器(数/模转换器)解码可将二进制编码恢复成原始的声音信号，通过音响设备输出。如下图所示。模拟音频信号输入播放解码采样/量化编码传输/存储

模拟音频与数字音频

现在我们来进行一个计算，看看一个数字音频文件的数据量到底有多大。
假设我们采样，
即采样成标准的CD音质（也称作红皮书音频）。一秒钟的数字音频数据量
相当于多少个汉字？分析：一秒钟内采样44.1千次，每次的数据量是16×2＝32bit，一秒钟内的数据量便是44.1k×32bit 一个字节（Byte）含有8个位（Bit），一个汉字在电脑里占用两个字节，那么44.1k×32bit的空间可以存储（44.1k×32bit） /（2×8）=88200个汉字，也就是说一秒钟的数字音频数据量与近九万个汉字（一部中篇小说）的数
据量相当。
常见音频文件类型 • APE格式：是一种无损压缩音频格式 • CD Audio 目前CD唱片所采用的格式，又叫“红皮书”格式，记录的多是波形流。但缺点是无法编辑，文件长度太大。 • WAV 微软的标准声音格式。Windows本身存放数字声音的标准格式，目前也成为通用性的数字声音文件格式。 WAVE文件是以声音的波形来表示声音的，这种音频格式基本上不经过什么压缩，所以体积较大。 • Ra/Rm/RMX RealNetworks公司开发的主要适用于网络实时数字音频流技术的文件格式，它将音频文件大大压缩，所以在高保真方面远不如MP3，不过体积小，适合实时收听是最大的优势。 • WMA 是微软公司针对Real公司（冤家路窄）开发的新一代网上流式数字音频压缩技术。这种压缩技术的特点是以减少数据流量但保持音质的方法来达到更高的压缩率目的，同时兼顾了保真度和网络传输需求，所以具有一定的先进性，其压缩率一般可以达到1:18。甚至慢慢开始侵蚀MP3的地盘了（相同音质，Wma文件是Mp3文件大小的一半）此外，WMA还可以通过DRM(Digital Rights Management)方案加入防止拷贝，或者加入限制播放时间和播放次数，甚至是限制播放的机器，可有力地防止盗版。

第二讲音频处理技术

第二章、音频处理技术声音是多媒体信息的一个重要组成部分。

也是表达思想和情感的一种必不可少的媒体，随着多媒体信息处理技术的发展，音频处理技术得到了广泛的应用。

如：视频图像的配音、配乐；静态图像的解说、背景音乐；可视电话、电视会议中的话音；游戏中的音响效果：虚拟现实中的声音模拟；电子读物的有声输出等。

声音的合理使用可以使多媒体系统变得更加丰富多彩。

一、声音信号的形式和特征任何声音都是物体振动产生的现象，物体受到敲打或激发就能产生振动，通过一定介质(如空气、水等)传播形成的连续波，在物理学中称为声波。

这种波就像在平静的池塘中投入石子，涟漪从中心向四面扩散，当它到达人的耳膜是，耳膜就会感觉到这种压力的变化，或者感觉到振动，这就是声音。

声波有各种不同的强度和频率，许多声波混合在一起可能构成交响乐，也可能是一片噪音。

在物理上，声音可以用一条连续的曲线来表示，它是随时间连续变化的模拟量。

声波信号有两个重要的参数：频率和幅度。

声波幅度大小体现声音的强弱，声音的频率体现音调的高低。

信号的幅度是从信号的基线到当前波峰的距离。

幅度决定了信号音量的强弱程度。

幅度越大，声音越强。

对音频信号．它的强度用分贝(dB)表示。

分贝的幅度就是音量。

一个声源每秒钟可产生成百上千个波峰，把每秒钟波峰所发生的数目称之为信号的频率，用赫兹(HZ比)或千赫兹(kHZ)表示。

例如一个声波信号在一秒钟内有5000个波峰，则可将它的频率表示为5000hz或5khz。

人们在日常说话时的语音信号频率范围在300hz—3000hz之间，人所能辨别的频率范围在20hz—20khz之间，频率小于20hz的信号成为次声波（subsonic），频率高于20khz的称为超声波。

音箱和耳机的频响范围所谓频响范围，指的是频率响应范围。

在音箱、耳机等音频回放设备中一般会有标注20Hz-20KHz类似这样的一个数字范围的指标，此即是指该设备可以回放的有效频率范围。

当然，与之相对应的是，人耳理论上可听到的声波范围也是20Hz-20KHz。

第4讲—第二章数字音频处理技术(1)

1mV
● 确定合适的采样频率。采样频率确定合适的采样频率。插头: 插头 φ3.5mm/stereo 越高，录制质量越好，越高，录制质量越好，但数据量就大。就大。
(2) 单击 [录音按钮，开始录音录音]按钮录音按钮， (录音时间为秒) 录音时间为60秒录音时间为
14
● 录音失败的处理 ●[操作步骤] [操作步骤] (1) 鼠标左键双击任务栏右侧检查“波形” (2) 检Байду номын сангаас“波形”是否被选择 — [√] (3) 选择“选项／属性” 选择“选项／属性” 选择“录音” (4) 选择“录音”选项检查: (5) 检查: 录音控制线路输入麦克风应有 [√] 确定] (6) 单击 [确定]按钮
11011100 11001101
把数字化声音转换成模拟量，把数字化声音转换成模拟量，经过音响单元重放出来 11011100
●设备和软件
声音重放
(1) 声音适配器 (声卡 8bit、16bit、… 128bit ￥80.00～800.00 声卡) 、声卡、～ (2) 声卡驱动软件以及各种声音处理软件
12
采集CD音轨并转换格式采集音轨并转换格式
Windows Media Player界面界面 Windows自带的媒体播放器将曲目从 CD 复制到计算机中非常简便。 Windows自带的媒体播放器将曲目从复制到计算机中非常简便。 (1) 插入音乐盘，随后自动列出音轨清单插入CD音乐盘随后自动列出CD音轨清单音乐盘， (2) 在CD音轨清单中选择采样的音轨 CD音轨清单中选择采样的音轨音轨清单中选择采样的
（对应书中第九章）对应书中第九章）
思考题
数字音频处理技术

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第二章模拟音频和数字音频人耳是声音的主要感觉器官，人们从自然界中获得的声音信号和通过传声器得到的声音电信号等在时间和幅度上都是连续变化的，时间上连续、而且幅度随时间连续变化的信号称为模拟信号(例如声波就是模拟信号，音响系统中传输的电流、电压信号也是模拟信号)，记录和重放信号的音源就是模拟音源，例如磁带／录音座、L P／L P电唱机等；时间和幅度上不连续或是离散的，只有0和l两种变化的信号称为数字信号，记录和重放数字信号的音源叫做数字音源，例如C D／C D机、D V D／D V D播放机等。

究竟模拟音频与数字音频有什么不同呢?数字音频究竟有些什么优点呢?这些都是下面要介绍的。

模拟音频信号记录录音泛指把声能转变为其他形式的能量而加以存储，录音时采用的存储媒介主要是磁性材料，如磁带、磁盘等，也可以是感光材料，如光盘等。

由此录音技术也可分为磁记录和光记录两种。

另外，近年来半导体内存件发展很快，成为一种新型的记录和存储设备。

在本节中将重点介绍磁带录音技术。

一、磁带录音装置的基本结构磁带录音装置一般由磁头、机械传动(称为“机芯”)机构和电路三部分组成。

二、模拟录音载体---磁带三、录音和放音的基本原理1．消音原理磁带在录音前，必须将原有的声音信号(剩磁)抹去，称之为消音或消磁。

2．录音与录音偏磁原理录音是将声音电信号以剩磁的形式保存在磁带上。

3.放音原理放音是将磁带上保存的剩磁信号还原成相应的声音电信号.第二节数字音频基础传统的信号都是以模拟手段进行处理的，称为模拟信号处理。

所谓模拟音频是指用电信号(电压、电流)来模仿声音物理量的变化。

因为声音是在时间和幅度上都连续变化的信号，所以模拟电信号在时间和幅度上也是连续变化的，故称之为模拟音频信号。

模拟音频信号处理有很多弊端，如抗干扰能力差，容易受机械振动、模拟电路的影响产生失真，远距离传输受环境影响较大等。

数字信号是以数字化形式对模拟信号进行处理，它在时间和幅度上都是离散的。

随着大规模集成电路以及计算机技术的飞速发展，加之数字信号处理理论和技术的成熟和完善，数字信号处理已逐渐取代了模拟信号处理。

因为数字音频信号抗干扰性强，无噪声积累可做到多代复制和长距离传输无失真!数字音频信号的优点主要有以下几个方面：①精度高：模拟信号处理的精度主要由元器件决定，很难达到0.001。

而数字信号处理的精度主要决定于字长，14位字长就可达到0.0001的精度。

②灵活性高：数字信号处理系统的性能主要决定于乘法器的系数，而系数存放于内存中，因而只需改变存储的系数就可得到不同的系统，比改变模拟系统方便得多。

③可靠性强：因为数字系统只有“o”和“1”两种信号，因而受周围环境的温度及噪声的影响较小。

而模拟系统的各元器件都有一定的温度系数，且电平是连续变化的，易受温度、噪声、电感效应等的影响。

④易于大规模集成：由于数字化部件具有高度规范性，便于大规模集成、大规模生产，而对电路参数要求不如模拟装置苛刻，故产品成品率高。

⑤可实现时分复用：可利用数字信号处理器同时处理几个信道的信号。

⑥便于处理、存储和交换，实现二维甚至多维信号的处理，包括二维或多维滤波、频谱分析等。

把模拟的电信号变为数字电信号这一过程称为模拟信号数字化，即模／数转换(A／D)。

A／D转换通常采用P C M(脉冲编码调制)技术来实现。

A／D转换过程包括三个阶段，即取样、量化、编码。

下面分别介绍。

一、取样取样也叫采样，是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本，把连续的模拟量用一个个离散的点来表示，使其成为时间上离散的脉冲序列。

显然，取样点需要足够密集，才能很好地表达原始模拟信号的特征。

每秒钟取样的次数称为取样频率或取样率，比如：C D的取样率为44．1k H z，表示每秒钟取样44100次。

某一数字取样系统的取样频率为44k H z，假定有一个36k H z(>22k H z)的频率进入取样器，则依据上式，在得到的样品中就会包括有36k H z、8k H z的两个频率信号，取样输出电路中有一个过滤22k H：以上频率的滤波器进行滤波，结果36k H z的信号被滤掉，而8k H z的信号保留了下来，成为干扰信号，这就是信号混叠现象.大家可以发现，上下波形之所以不吻合，是因为取样点不够多，或严谨一点说，是取样频率不够高。

这种情况，我们称之为低频失真。

一个常见的低频失真的例子如电影上车辆行驶时车轮转动的情况(一个典型的“马车轮效应的例子)，飞速转动的车轮有时看起来似乎是静止不动甚至会向反方向转动(类似的情况也发生在直升飞机的翼片和螺旋桨上面)。

二、量化所谓量化，就是度量采样后离散信号幅度的过程，度量结果用二进制数来表示。

量化精度就是度量时分级的多少。

模拟信号通过取样已变成一个时间上离散的脉冲样品序列，但在电平幅度上仍会在其动态范围内有连续变化，即可能出现任意幅值。

1．量化比特数量化等级通常用二进制的位数咒表示，称为量化比特数。

以位的二进制数字可以有2n个量化级数，比如8位(8b i t)，并不是把纵坐标分成8份，而是分成28—256份；同理16位是把纵坐标分成216—65536份；而24位则分成224=16777 216份。

C D的量化精度为16b i t(16位二进制数)，换算为十进制，分级数等于65536(216)。

也就是说，以C D的标准，可以分辨出1／65536级的幅度变化。

但如果信号的幅度变化比1／65536级还小呢?答案很简单：量不出结果，就像用精细到1m m的尺子去量一根头发的直径一样。

量不出结果就没有资料，将来还原成模拟信号时就会形成背景噪声，专业术语叫量化噪声。

量化噪声是数字音源信噪比提高的主要限制，对于C D规格，假设最强信号为一个单位，噪声大小就是1／65536个单位，因此，它的信噪比为65536(216)，即96d B。

1．为什么要压缩标准的C D音质处理，也就是说1秒钟内取样44．1千次，每次的资料量16×2=32b i t(因为立体声是两个声道)。

而一个字节(B y t e)含有8位(b i t)，那么1秒钟内的资料量则为44．1k×．32b i t／(8b i t B y t e)=176．4k B。

一个汉字在计算机中占用两个字节，那么176.4k B的空间可以存储176．4k／2—88200个汉字，也就是说1秒钟的数字音频资料量与近九万个汉字(一部中篇小说)的资料量相当。

由此可见，数字音频文件的资料量是十分庞大的。

数字信号的数码率——比特率数码率又称比特率，是单位时间内传送的二进制序列的比特数，通常用k b p s作为单位。

数码率与取样频率和量化比特数之间的关系为：数码率=取样频率×量化比特数,例如声音信号的取样频率48k H z，量化比特数为16b i t，则每声道的数码率为:48×103×16=768k b p s对于双声道立体声数字信号，其总数据率为:2×768k b p s=1536k b p s=1．536M b p s第三节数字音频信号的压缩编码在对数字音频信号进行存储和传输时，通常要对其进行压缩编码和纠错编码。

压缩编码的目的是降低数字音频信号的资料量和数码率，以提高存储和传输的有效性；纠错编码的目的是为信号提供纠错、检错的能力，以提高存储和传输的可靠性。

1．为什么要压缩立体声C D音质信号，它每秒的码流是44．1K×16×2≈1．4M b p s。

这样高的码流，对于数字音频的存储、处理和传输提出了很高的要求。

对音频的压缩理论，是从研究人耳的听感系统开始的，首先第一个特点是人耳对各频率信号的灵敏度是不同的，在2k～4k频段，很低的电平就能被人耳听到，其他频段时，相对要高一点的电平才能听到，这就是说在听觉阈值以下的电平可以去掉，相当于压缩了资料。

第二个特点就是频率之间的掩蔽效应，其实就是指人耳接收信号时，不同频率之间的相互干扰。

当电平高的频率点和相对来说电平较低的不同频率点同时出现时，电平低的频率点的声音将听不到。

因为人耳的灵敏度不一样，所以不同频率点的掩蔽程度是不一样的。

低于掩蔽阈值的信号将不编码，高于掩蔽阈值的信号将重新分配量化比特值，实施压缩，这是M P E G能得到较高的压缩比，又能保证音质的重要原因。

第三个特点是指短暂掩蔽效应，指在一个强信号之前或之后的弱信号，也会被遮蔽掉。

这样可以利用人耳的感觉特性，对数据流本身进行压缩，做到既能降低码流，又能通过科学的压缩方法提高码流的效率，而又不影响音质本身。

一、数字音频记录设备的工作原理数字音频记录设备实际上就是一套数字信号处理系统。

从自然界获得的声音通常为模拟音频信号，当用数字信号处理系统对其进行处理时，需要首先将模拟信号转换为数字信号，即A／D转换。

经处理(取样、量化编码、存储)之后的数字信号通常也需要再转换为模拟信号才能最终还原播出，即D／A转换。

因此，一般的数字信号处理系统主要包括前置低通抗混叠滤波器、模／数(A／D)转换器、数／模(D／A)转换器、模拟低通滤波器等部分，1．前置低通滤波器前置低通滤波器主要将输入信号中高于某一频率(即取样频率的一半)的频谱分量滤除，以保证取样后不发生频谱重叠。

2．A／D转换器A／D转换器对滤波之后的模拟信号进行取样、量化和编码，将模拟信号转换为数字信号。

在数字音频技术中，根据需求不同，通常使用以下几种取样频率：32k H z(用于数字卫星广播)；44．1k H z(用于C D)；48k H z(用于演播室)。

量化比特数有16b i t、20b i t和24b i t等几种。

编码方式一般为P C M码。

3．数字信号处理器数字信号处理器：对数字信号按预定要求进行各种处理，包括滤波、变换、检测、谱分析、估计、压缩、识别等，以便获得人们所希望的信号，达到提取信息、便于利用的目的。

数字信号处理器可以是数字计算机或微处理器，通过软件编程对输入信号进行预期的处理，即软件实现方法。

另外，数字信号处理器也可以是由数字硬件组成的专用处理器，或者是专用或通用的数字信号处理芯片(D S P芯片)，即硬件实现方法。

4．D／A转换器D／A转换器将处理之后的数字信号转换成模拟信号。

5．模拟低通滤波器模拟低通滤波器滤除信号中不需要的高频分量成分，平滑成所需的模拟输出信号。

第五节数字音频技术在广播电视中的应用一、广播电视行业数字音频技术的现状数字音频技术主要包括数字音频信号的采集、信源编码、信道编码、传输、压缩编码、存储、播出等环节及主要技术。

针对于广播电视行业来说，这些技术的实现与采用哪种音频制式是紧密相关的，其中音频编码技术则是关键因素。

在全世界范围内，电视节目传送系统由模拟向数字过渡的过程中，使用哪一种音频编码技术，一直是各国专家不断提出的问题，而抉择的焦点是两种主要的音频编码系统——M P E G一2音频编解码系统和A C一3音频编解码系统。

第二章 模拟音频和数字音频

《音频技术基础》课件

音频处理软件

模拟音频和数字音频

第二章 数字音频编辑与处理

多媒体技术及应用数字音频技术02

模拟音频与数字音频

第二章 数字音频处理

第二章数字声音及MIDI-资料

音频信息处理

模拟音频与数字音频

第二讲 音频处理技术

第4讲—第二章 数字音频处理技术(1)

第二章模拟音频和数字音频

第二章数字音频编辑与处理

第二章数字音频处理

第二讲音频处理技术

第4讲—第二章数字音频处理技术(1)