音频处理技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第4章 多媒体音频处理技术
▪ 4.1 音频信号及其概念 ▪ 4.2 模拟音频的数字化过程 ▪ 4.3 声卡的组成和功能 ▪ 4.4 音频文件的格式与处理软件 ▪ 4.5 乐器数字接口-MIDI ▪ 4.6 数字音频的应用
▪ 4.1.1 声音处理技术历史回顾
记录:19世纪,爱迪生,留声机。
电声技术:研究可听声频率范围内声音的产 生、传播、存储、重放和接收的技术。依靠电来 记录并播放声音,通过电压产生模拟声波变化的 电流信号是模拟信号。
压缩算法通常应能满足下列需求:
压缩倍数高,压缩后的数据率低; 解码后的信号失真小,质量高; 算法简单,执行速度快,延迟时间短; 编码器、解码器的成本低。
▪ 压缩方法(compression method)
▪ 有损压缩 ▪ 无损压缩
▪ 编码选择( code selection )
▪ PC机常用的声卡上有自适应差分脉冲码调制方 案,μ律/a 律等,
AC-3不同的压缩技术将环绕音效储存至DVD. 播放时必须 采用具有dts译码能力的系统. DTS跟Dolby Digital 5.1最 大的差别在于两者使用不同的”算法”
4.3.3 声卡的主要功能
▪ 录制与播放声音 通过接在声卡上的话筒录制声 音,并以文件形式保存在计算机中,随时可打开 声音文件进行播放。声音文件的格式可因使用不 同的软件而不同。 ▪ 音乐合成 利用声卡上的合成器将存储在计算机 内存中的MIDI文件合成为音乐乐曲。通过混合器 混合和处理多个不同音频源的声音,控制和调节 音量大小,最后送至音箱或耳机播放。
▪ 4.3.1 声卡的工作原理
游戏接口
控制总线
P
C
地址总线 总线接口

和控制器
线
数据总线
MIDI接口
数字声音 处理器
音乐 合成器
混合信号 处理器
MIC 放大器
功率 放大器
麦克风输入
Line输入 CD输入 扬声器输出
采用大规模 集成电路设 计,将音频 技术范围的 各类电路以 专用芯片的 形式集成在 声卡上,并 可直接插入 计算机的扩 展槽中使用。
图4-11 经过D/A转换器得到的信号波形(直线段的波形)有较大的失真
图4-12 采样率为2000Hz,量化等级为20的采样量化过程
图4-13 采样率为4000Hz,量化等级为40的采样量化过程
▪ 4.2.4 压缩编码
依据:声音信息中存在着多种冗余
听觉器官的不敏感性 采样的标本中存在着相关性
8kHz*8bit*10*60=
例4
以cd激光盘音质(44.1kHz的采样频率,16位立体声形式)记 录一首5分钟的乐曲所需的存储容量为:
44 100(Hz)×(16/8)(B)×2×5×60=51600kb
▪ 4.2.3 声音采样与量化过程示例
图4-10 采样频率为1000Hz,10个量化等级的波形
输出
输入
均匀量化
输出
输入
非均匀量化
数字音频等级
信号类型
频率范围Hz
电话语音 宽带音频 调频广播 CD-DA SACD DVD-AUDIO HDTA …
200~3400 50~7000 20~15k 20~22k 2-100k 100k
采样频率KHz 量化精度(位)
8
8
16
16
37.8
百度文库16
44.1
16
2822.4
1(信息流)
96~192
24
48,96,384 24,32
数据量=采样频率×(量化位数/8)×声道数×声音持续时间
例1
对于调频广播级立体声,采样频率为44.1kHz,量化等级为16 位(即2字节)声道形式为双声道,则转换后每秒以千字节为
单位的数据量为:
44 100(Hz)×(16/8)(B)×2=176 400B/s≈172kB/s
HDTA
▪ 可变结构高解析度音频(Hi-Definition
Transformable Audio)是一种结合了互动性和 高解析度音频的新一代音频格式。
▪ HDTA按照不同的标准,主要分为以下几种:
TA(只支持16Bit/44.1KHz传统音频) HDTA立体声(只支持高解析度的双声道) HDTA环绕声(支持6,8,16个声道的环绕声)
▪压缩和解压缩音频文件 目前,大多数声卡上都固化 了不同标准的音频压缩和解压缩软件,常用的压缩编 码 方 法 有 ADPCM( 自 适 应 差 分 脉 冲 编 码 调 制 ) 和 ACM(微软音频压缩管理器)等,压缩比大约为2:1~5:l。 ▪与MIDI设备和CD驱动器的连接 通过声卡上的MIDI 接口,计算机可以同外界的MIDI设备相连接,如连接 电子琴、电吉他等,使MPC具有创作电脑乐曲和播放 MIDI文件的功能。游戏杆也可通过MIDI接口与计算机 相连接,使游戏玩起来得心应手。
借助于A/D或D/A转换器,模拟信号和数字信号可以互相转换
▪ 4.2.1采样
为实现A/D转换,需要把模拟音频信号波形进行分 割(每隔一定的时间间隔测一次模拟音频的值(如电压) ),
以转变成数字信号,这种方法称为采样(Sampling)。每 秒钟采样的次数称为采样率。
数字音频是离散的,而模拟音频是连续的,数字音频 质量的好坏与采样率密切相关。数字音频信息可以被计算 机存储、处理和播放。
频率:体现音调的高低,单位Hz 幅度:体现声音的强弱,单位dB 语音信号频率范围:300Hz~3000Hz 可听频率带宽(音频): 20Hz~20kHz
周期
振幅
频率 图4-6 声波的频率、周期与振幅
▪ 声音质量分级与带宽
CD-DA 调频广播 调幅广播
电话
10 20 50 200
3.4K 7K
图4-8 四级声音质量的频率范围
第4章 多媒体音频处理技术
▪ 4.1 音频信号及其概念 ▪ 4.2 模拟音频的数字化过程 ▪ 4.3 声卡的组成和功能 ▪ 4.4 音频文件的格式与处理软件 ▪ 4.5 乐器数字接口-MIDI ▪ 4.6 数字音频的应用
▪ 4.4.1 数字音频的文件格式
图4-21 常用音频格式
▪ 1.WAV文件——.wav ▪ 2. MP3——.mp3
▪ 4.1 音频信号及其概念 ▪ 4.2 模拟音频的数字化过程 ▪ 4.3 声卡的组成和功能 ▪ 4.4 音频文件的格式与处理软件 ▪ 4.5 乐器数字接口-MIDI ▪ 4.6 数字音频的应用
例2
用44.1kHz的采样频率对声波进行采样,每个采样点的量化位 数选用16位,则录制3分钟的立体声节目,其波形文件所需的
存储容量为:
44 100(Hz)×(16/8)(B)×2×3×60=31 752 000B/s
≈31 007.8kB/s
≈30.28MB/s
教学进程
例3
一般播音员的播音频率是4kHz,采用8bit的采用精度进行采 样的时候,计算该播音员播音10分钟的数据量为:
图4-16 声卡工作原理框图
▪ 1.主芯片-数字信号处理器 声音信息处理、特殊音效过滤与处理、语音识别、
实施压缩等等任务。 ▪ 2.混音芯片-CODEC
负责调节各声音来源的音量、混音与调整录放音 的音量大小
图4-18 Sound Blaster PCI64声卡的混音器设置界面
▪ 3.合成器 负责 MIDI乐曲的合成可以及时创造各种音乐 MIDI合成器有两种:频率调制合成器(FM合成器)、
▪ 4.1.2 声音信号的形式
语音信号:语言的物质载体,具有复杂的语 法和语义,难于识别。
非语音信号:音乐,自然界的声音,信息量 低,识别简单。
图4-4 在自然界,声波与水波一样都是一种振动波
图4-5 用声音录制软件记录的英文单词”Hello”语音的实际波形
▪ 4.1.3 模拟音频信号的物理特征
波形表(Wave table合成器)。
▪ 4.总线接口和控制器 总线接口和控制器由数据总线双向驱动器、总线接口
控制逻辑、总线中断逻辑和DMA控制逻辑组成。
▪ 5.外部输入输出口 声卡外部输入输出口均为3.5mm规格插口
(MIDI/Joystick除外)
▪ 4.3.2 声卡的性能指标
▪ 1.音频技术指标 ▪ 2.MIDI音频 ▪ 3.声道数(Dolby AC-3等)
输 入 信 号 编 码 器
传 输 /存 储
解 码 器 输 出 信 号
图4-14 音频信号处理过程
第4章 多媒体音频处理技术
▪ 4.1 音频信号及其概念 ▪ 4.2 模拟音频的数字化过程 ▪ 4.3 声卡的组成和功能 ▪ 4.4 音频文件的格式与处理软件 ▪ 4.5 乐器数字接口-MIDI ▪ 4.6 数字音频的应用
▪ 新一代的HDTA格式音乐,是彻头彻尾的数字格
式。它不以任何光盘为载体,而是作为一种计算 机数据格式存在
▪ 4.4.2 音频制作与处理软件
▪ 1.CoolEdit
图4-25 CoolEditPro 的界面
▪ 2.Sound Forge
图4-26 Sound Forge音频处理软件
第4章 多媒体音频处理技术
Nyquist采样定理:只有采样频率高于声音信号最高 频率的两倍时,才能把数字信号表示的声音还原为原来的 声音。
图4-9 声音的采样和量化示意图
▪ 4.2.2 量化
用某种数字化的方法来反映某一瞬间声波幅度的电
压值的大小称为量化。
采样后的信号按照整个声波的幅度(幅度轴 )划分 称有限个区段的集合,把落入某个区段内的样值归为一 类,并赋予形同的量化值。采用二进制,以16位或256 位等的方式来进行。
▪ format (structure)
音频信息的压缩技术
有损压缩
无损 压缩
波形编 码
参数编 码
混合编 码
Huffman编码 行程编码 全频带编码:PCM; DPCM; ADPCM 子带编码 : 自适应变换编A码TC;心理学模型 矢量量化编码
线性预测LPC
矢量和激励线性预V测SELP 多脉冲线性预测MP-LPC 码本激励线性预测CELP
▪ 7.Dolby digital 7.1~11.1等等
杜比与DTS
▪ PCM 高音质数字音效: DVD利用PCM格式储存未经压缩
的双声道讯号,由于DVD具有庞大的 空间与速度优势, 可以大胆使用更高的取样率与解析度, 因 此可以提供远高于传统CD的表现
▪ DTS 数字环绕音效: 属于5.1声道的环绕效果, DTS采用与
15K
频率(Hz)
▪ 声音的质量与声音的频率范围有关。 ▪ 一般说来,频率范围越宽声音的质量就越高。 ▪ 对语音而言,常用可懂度、清晰度、自然度来衡
量;而对音乐来说,保真度、空间感、音响效果 都是重要的指标
第4章 多媒体音频处理技术
▪ 4.1 音频信号及其概念 ▪ 4.2 模拟音频的数字化过程 ▪ 4.3 声卡的组成和功能 ▪ 4.4 音频文件的格式与处理软件 ▪ 4.5 乐器数字接口-MIDI ▪ 4.6 数字音频的应用
图4-22 MP3是Internet上流行的音乐格式
▪ 3.MP4——.mp4 ▪ 4.RealAudio文件—.ra/.rm/.ram
▪ 5.APE文件——.ape
▪ 6. MIDI文件——.midi ▪ 7. CD文件——.cda ▪ 8.AAC文件——.m4a .mp4等 ▪ 9. PCM文件——.pcm ▪ 10.WMA文件——.wma ▪ 11. VOC文件——.voc ▪ 12.AIFF文件——.aif/.aiff ▪ 13.HDTA文件——.hdta
3. Dobly Digital Surround: 杜比数字环绕音效 4. Dolby Digital 4.0: 杜比数字环绕音效4.0 5. Dolby Digital 5.0: 杜比数字环绕音效5.0 6. Dolby Digital 5.1: 杜比数字环绕音效5.1 以Dolby Digital来表示Dolby Digital 5.1, 也就是5.1声道的 Dolby Digital或AC-3.
图4-19 5.1声道系统的布局图
▪ 4.多音频流输出 ▪ 5.I/O设备接口 ▪ 6.声卡软件 ▪ 7.总线结构
图4-20 支持5.1声道系统的声卡接口
杜比与DTS
1. Dolby Digital Mono: 杜比数字单声道音效 只有单声道的效果, 并不足以构成立体声,
2. Dolby Digital Stereo: 杜比数字双声道音效 将双声道的立体讯号储存为AC-3格式,
随着计算机技术和存储设备的发展,数字化 音频处理技术也得到了发展。
图4-2用磁带记录声音的录音机
▪ 4.1.2 声音信号的形式
任何声音都是物体振动产生的现象,其在介 质中的传播称为声波。声源所引起的空气压力变 化,被耳朵的耳膜所检测,然后产生电信号刺激 大脑的听觉神经,从而使人们能感觉到声音的存 在。
相关文档
最新文档