音频处理详细讲解
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
声音文件的大小
S=R*D*(r/8)*2 R: 采样频率(Hz) D:录音时间(S) r: 量化位数
3 声音的文件格式
常见的音频文件格式
• *.wav文件 • *.mid文件 还有采用压缩技术将声音文件的大小压
缩10倍以上的声音文件格式如: • *.mp3 • *.rm • *.wma 等
WAVE文件
研究表明,一般的声音是由许多不同频率的正 弦信号组合成的。
声音的三个要素是音调、音强和音色。
基频与音调
频率是指信号每秒钟变化的次数。 人对声音频率的感觉表现为音调的高低,在音乐中称为音高。
音调是由频率ω所决定的。 音乐中音阶的划分是在频率的对数坐标(20×log)上取等分
而得的。
谐波与音色
Microsoft和IBM共同开发,PC标准声音格式 没有采用压缩算法,不会失真,处理速度快 扩展名wav 特点:
声音层次丰富,还原性好,表现力强 采用足够高的采样频率,音质极佳
不足:
数据量大,与采样频率、量化位数和声道数成正比
MIDI文件
不是真正的数字化声音,而是一组声音或乐器 符号的集合
象记录乐谱一样记录下演奏的符号,所以体积 是所有音频格式中最小的
播放效果与硬件关系很大 应用于手机铃声等对音质要求不高且对空间有
严格限制的场合 扩展名mid 音色比较单调,层次感稍差,表现力不够
MP3文件
是一种有损压缩,通过记录音频的音高、音色 和音量信息
压缩比约为11:1 一张CD可存储15首普通歌曲,采用mp3格式,
编码的过程
首先用一组脉冲采样时钟信号与输入的模拟音频信 号相乘,相乘的结果即输入信号在时间轴上的数字 化。
然后对采样以后的信号幅值进行量化。最简单的量化方
法是均衡量化,这个量化的过程由量化器来完成。对经 量化器A/D变换后的信号再进行编码,即把量化的信号 电平转换成二进制码组,就得到了离散的二进制输出数 据序列x ( n ),n表示量化的时间序列,x ( n )的值就是 n时刻量化后的幅值,以二进制的形式表示和记录。
为什么要数字化?
由于音频信号是一种连续变化的模拟信号 计算机只能处理和记录二进制的数字信号
因此,由自然音源而得的音频信号必须经过一 定的变化和处理,变成二进制数据后才能送到 计算机进行再编辑和存贮。
把模拟信号转换成数字信号的过程称为模/数 转换(A/D转换) ;反过来,把数字信号转 换为模拟信号的过程称为数/模转换(D/A转 换)。
由于计算机按字节运算,一般的量化位数为8 位和16位。
量化位越高,信号的动态范围越大,数字化后 的音频信号就越可能接近原始信号,但所需要 的存贮空间也越大。
(3) 声道数:有单声道和双声道之分。双声 道又称为立体声,在硬件中要占两条线路,音 质、音色好,但立体声数字化后所占空间比单 声道多一倍。
则可存储160首CD音质的歌曲 扩展名mp3 理想播放器是winamp
WMA文件
Window Media Audio的缩写 可以保证在只有MP3文件一半大小的前提下,
保持相同的音质 大多数MP3播放器都支持WMA文件
4 音频素材的获取
音频素材的获取
用软件创作; 通过计算机中的声卡录制声音; 通过计算机中声卡的MIDI接口获取声音; 从CD或VCD中直接捕获(抓轨); 利用已有光盘中的音频素材; 从网络资源管理系统中搜索声音素材
带宽约为20k Hz。
音频信号的指标
(1)频带宽度:音频信号的频带越宽,所包含的音 频信号分量越丰富,音质越好。
(2)动态范围:动态范围越大,信号强度的相对变化 范围越大,音响效果越好。
(3)信噪比:信噪比SNR(Signal to Noise Ratio) 是有用信号与噪声之比的简称。 噪音可分为环境噪
话音
信道
A/D
编码
编码
信道
话音
信道
D/A
译码
译码
脉冲编码调制(PCM)
模/数转换主要包括: 采样:在时间轴上对信号数字化; 量化:在幅度轴上对信号数字化; 编码:按一定格式记录采样和量化后的数
字数据。
脉冲编码调制PCM(Pulse Code Modulation)是一种模数转换的最基本编码 方法。CD--DA采用的就是这种编码方式。
北京师范大学教育技术学院 http://ksei.bnu.edu.cn
音和设备噪音。信噪比越大,声音质量越好。
(4)主观度量法:人的感觉机理对声音的度 量最有决定意义。感觉上的、主观上的测试是 评价声音质量不可缺少的部分。当然,可靠的 主观度量值是较难获得的。
2 声音的数字化
声音的数字化
1. 为什么要数字化? 2. 脉冲编码调制(PCM) 3. 数字音频的技术指标
(4)编码算法:编码的作用其一是采用一定 的格式来记录数字数据,其二是采用一定的算 法来压缩数字数据以减少存贮空间和提高传输 效率。
压缩算法包括有损压缩和无损压缩;有损压缩指
解压后数据不能完全复原,要丢失一部分信息。压缩
编码的基本指标之一就是压缩比,它通常小于1。压
缩越多,信息丢失越多、信号还原后失真越大。
1 声音基础知识
声音基本常识
声音是由于空气振动引起耳 膜的振动,由人耳所感知。 从本质上说,空气的振动就 产生了声波 。
人耳能感受到的声音范围是 20-20kHz
人的语音范围是300-3kHz
空气的振动 空气振动形成声波
声音三要素
正弦波有三个重要参数:频率 ω0、幅度An 和相位ψn 。
数字音频的技术指标
(1) 采样频率:采样频率是指一秒钟内采样的 次数。
采样频率的选择应该遵循奈奎斯特(Harry Nyquist)采样理论:如果对某一模拟信号进 行采样,则采样后可还原的最高信号频率只有 采样频率的一半,或者说只要采样频率高于输 入信号最高频率的两倍,就能从采样信号系列 重构原始信号。
n×ωO 称为ωO 的高次谐波分量,也称为泛音。 音色是由混入基音的泛音所决定的,高次谐波
越丰富,音色就越有明亮感和穿透力。 不同的谐波具有不同的幅值An 和相位偏移
ψn ,由此产生各种音色效果。
幅度与音强
人耳对于声音细节的分辨只有在强度适中时才最灵敏。 人的听觉响应与强度成对数关系。一般的人只能察觉 出3 分贝的音强变化,再细分则没有太多意义。
5 声音的处理
几种常见的音频处理软件
一般音频处理
GoldWave SoundForge CoolEdit
MIDI音乐制作
Cakewalk Cubase VST Logic Audio
GoldWave声音处理
录音 格式转换 裁剪 调整音调 混音 去除人声
ቤተ መጻሕፍቲ ባይዱ
5音频处理
赵国庆 博士 guoqingzh@163.com
5音频处理
学习目标
一. 掌握声音基本常识 二. 理解声音的数字化的数字化过程 三. 了解常见的音频文件格式 四. 理解音频素材的获取方式 五. 会用Windows自带的录音机 六. 知道几种常见的音频处理软件,会用一种以
上处理声音
内容提要
一. 声音基本常识 二. 声音的数字化 三. 常见的音频文件格式 四. 音频素材的获取 五. Windows自带的录音机介绍 六. 几种常见的音频处理软件
根据该采样理论
CD 激光唱盘采样频率为44.1KHz,可记录的 最高音频为22.05KHz,这样的音质与原始声 音相差无几,也就是我们常说的超级高保真音 质。
常用的声音采样频率有44.lKHz(达到CD音 质),22.05KHz(达到调频广播音质)及 11.025KHz(达到电话语音音质)。
(2)量化位数:量化位数是对模拟音频信号的 幅度轴进行数字化,它决定了模拟信号数字化 以后的动态范围。
我们常用音量来描述音强,以分贝(dB=20log)为 单位。
在处理音频信号时,绝对强度可以放大,但其相对强 度更有意义,一般用动态范围定义:
动态范围=20 log(信号的最大强度 / 信号的最小强 度) (dB)
音宽与频带
频带宽度或称为带宽,它是描述组成复合信号 的频率范围。
例如,普通电话容许语音信号通过,带宽约为 3.2k Hz(200-3400Hz);高保真度(Hi-Fi, high-fidelity)声音的频率范围为10~20000Hz,