数字音频基础知识
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一般来说,无损压缩比率在源文件的50–60%左右,而有损压缩可以达到原文件的5–20%。
3.6常见的数字音频文件格式
常见的数字音频文件格式有很多,每种格式都有自己的优点、缺点及适用范围。
CD格式——天籁之音
CD音轨文件的后缀名为:cda
标准CD格式是44.1K的采样频率,速率88K/秒,16位量化位数,近似无损的。
数字音频基础知识
转换(A/D)技术将模拟音频转化为二进制数,这样模拟音频就转化为数字音频了。所谓模数转换就是将模拟信号转化为数字信号,模数转换的过程包括采样、量化和编码三个步骤。模拟音频向数字音频的转换是在计算机的声卡中完成的。
3.2采样
采样是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点表示出来,使其成为时间上离散的脉冲序列。
特点:音质好,压缩比比较高,被大量软件和硬件支持,应用广泛。
适用于:适合用于一般的以及比较高要求的音乐欣赏。
MIDI——作曲家的最爱
MIDI(Musical Instrument Digital Interface)乐器数字接口。
MIDI数据不是数字的音频波形,而是音乐代码或称电子乐谱。
MIDI文件每存1分钟的音乐只用大约5~10KB。
采样频率、采样精度和声道数对声音的音质和占用的存储空间起着决定性作用。
我们希望音质越高越好,磁盘存储空间越少越好,这本身就是一个矛盾。必须在音质和磁盘存储空间之间取得平衡。数据量与上述三要素之间的关系可用下述公式表示:
3.4编码
采样和量化后的信号还不是数字信号,需要把它转换成数字编码脉冲,这一过程称为编码。最简单的编码方式是二进制编码,即将已经量化的信号幅值用二进制数表示,计算机内采用的就是这种编码方式。
3.5音频压缩
音频压缩属于数据压缩的一种,是减小数字音频信号文件大小(数据比率)的过程。
一般数据的压缩方法对于音频数据不利,很少能将源文件压缩到87%以下。
音频压缩算法:无损压缩算法和有损压缩算法
无损压缩是对未压缩音频进行没有任何信息/质量损失的压缩机制。
有损压缩是尽可能多得从原文件删除没有多大影响的数据,有目的地制成比原文件小多的但音质却基本一样。
特点:音质非常好,被大量软件所支持。
适用于:多媒体开发、保存音乐和原始音效素材。
MP3格式——流行的风尚
全称Moving Picture Experts Group Audio Layer III),是当今较流行的一种数字音频编码和有损压缩格式。
是ISO标准MPEG1和MPEG2第三层(Layer 3),采样率16-48kHz,编码速率8K-1.5Mbps。
每秒钟采样的次数称为采样频率,用f表示;样本之间的时间间隔称为取样周期,用T表示,T=1/f。例如:CD的采样频率为44.1kHz,表示每秒钟采样44100次。
常用的采样频率有8kHz、11.025Hz、22.05kHz、15kHz、44.1kHz、48kHz等。
在对模拟音频进行采样时,取样频率越高,音质越有保证;若取样频率不够高,声音就会产生低频失真。
MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。
普通的声音文件,如wav文件,是计算机直接把声音信号的模拟信号经过取样——量化处理,不经压缩处理,变成与声音波形对应的数字信号。
而MIDI文件则不是直接记录乐器的发音,而是记录了演奏乐器的各种信息或指令,如用哪一种乐器,什么时候按某个键,力度怎么样等等,至于播放时发出的声音,那是通过播放软件或者音源的转换而成的。因此MIDI文件通常比声音文件小得多,一首乐曲,只有十几K或几十K,只有声音文件的千分之一左右,便于储存和携带。
那么怎样才能避免低频失真呢?
著名的采样定理(Nyquist定理)中给出有明确的答案:要想不产生低频失真,采样频率至少应为所要录制的音频的最高频率的2倍。例如,电话话音的信号频率约为3.4 kHz,采样频率就应该≥6.8 kHz,考虑到信号的衰减等因素,一般取为8kHz。
3.3量化
量化是将采样后离散信号的幅度用二进制数表示出来的过程。
每个采样点所能表示的二进制位数称为量化精度,或量化位数。
量化精度反映了度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65536的范围里,它的精度就是输入信号的1/65536。
常用的采样精度为8bit/s、12 bit/s、16bit/s、20bit/s、24bit/s等。
WMA格式在录制时可以对音质进行调节。同一格式,音质好的可与CD媲美,压缩率较高的可用于网络广播。
Ra格式——流动的旋律
RealAudio主要适用于在网络上的在线音乐欣赏,现在大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。
模拟音频经过采样、量化和编码后所形成的二进制序列就是数字音频信号,我们可以将其以文件的形式保存在计算机的存储设备中,这样的文件通常称之为数字音频文件。
PCM编码
PCM(Pulse Code Modulation),即脉冲编码调制,指模拟音频信号只经过采样、模数转换直接形成的二进制序列,未经过任何编码和压缩处理。PCM编码的最大的优点就是音质好,最大的缺点就是体积大。在计算机应用中,能够达到最高保真水平的就是PCM编码,常见的WAV文件中就有应用。
WMA格式——最具实力的敌人
WMA (Windows Media Audio)由微软开发。
音质要强于MP3格式,更远胜于RA格式,它以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右。
内置了版权保护技术,可以限制播放时间和播放次数甚至于播放的机器等等。
CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只ห้องสมุดไป่ตู้一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。
WAV格式——无损的音乐
WAV为微软公司开发的一种声音文件格式。
标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化位数,声音文件质量和CD相差无几!
3.6常见的数字音频文件格式
常见的数字音频文件格式有很多,每种格式都有自己的优点、缺点及适用范围。
CD格式——天籁之音
CD音轨文件的后缀名为:cda
标准CD格式是44.1K的采样频率,速率88K/秒,16位量化位数,近似无损的。
数字音频基础知识
转换(A/D)技术将模拟音频转化为二进制数,这样模拟音频就转化为数字音频了。所谓模数转换就是将模拟信号转化为数字信号,模数转换的过程包括采样、量化和编码三个步骤。模拟音频向数字音频的转换是在计算机的声卡中完成的。
3.2采样
采样是指将时间轴上连续的信号每隔一定的时间间隔抽取出一个信号的幅度样本,把连续的模拟量用一个个离散的点表示出来,使其成为时间上离散的脉冲序列。
特点:音质好,压缩比比较高,被大量软件和硬件支持,应用广泛。
适用于:适合用于一般的以及比较高要求的音乐欣赏。
MIDI——作曲家的最爱
MIDI(Musical Instrument Digital Interface)乐器数字接口。
MIDI数据不是数字的音频波形,而是音乐代码或称电子乐谱。
MIDI文件每存1分钟的音乐只用大约5~10KB。
采样频率、采样精度和声道数对声音的音质和占用的存储空间起着决定性作用。
我们希望音质越高越好,磁盘存储空间越少越好,这本身就是一个矛盾。必须在音质和磁盘存储空间之间取得平衡。数据量与上述三要素之间的关系可用下述公式表示:
3.4编码
采样和量化后的信号还不是数字信号,需要把它转换成数字编码脉冲,这一过程称为编码。最简单的编码方式是二进制编码,即将已经量化的信号幅值用二进制数表示,计算机内采用的就是这种编码方式。
3.5音频压缩
音频压缩属于数据压缩的一种,是减小数字音频信号文件大小(数据比率)的过程。
一般数据的压缩方法对于音频数据不利,很少能将源文件压缩到87%以下。
音频压缩算法:无损压缩算法和有损压缩算法
无损压缩是对未压缩音频进行没有任何信息/质量损失的压缩机制。
有损压缩是尽可能多得从原文件删除没有多大影响的数据,有目的地制成比原文件小多的但音质却基本一样。
特点:音质非常好,被大量软件所支持。
适用于:多媒体开发、保存音乐和原始音效素材。
MP3格式——流行的风尚
全称Moving Picture Experts Group Audio Layer III),是当今较流行的一种数字音频编码和有损压缩格式。
是ISO标准MPEG1和MPEG2第三层(Layer 3),采样率16-48kHz,编码速率8K-1.5Mbps。
每秒钟采样的次数称为采样频率,用f表示;样本之间的时间间隔称为取样周期,用T表示,T=1/f。例如:CD的采样频率为44.1kHz,表示每秒钟采样44100次。
常用的采样频率有8kHz、11.025Hz、22.05kHz、15kHz、44.1kHz、48kHz等。
在对模拟音频进行采样时,取样频率越高,音质越有保证;若取样频率不够高,声音就会产生低频失真。
MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。
普通的声音文件,如wav文件,是计算机直接把声音信号的模拟信号经过取样——量化处理,不经压缩处理,变成与声音波形对应的数字信号。
而MIDI文件则不是直接记录乐器的发音,而是记录了演奏乐器的各种信息或指令,如用哪一种乐器,什么时候按某个键,力度怎么样等等,至于播放时发出的声音,那是通过播放软件或者音源的转换而成的。因此MIDI文件通常比声音文件小得多,一首乐曲,只有十几K或几十K,只有声音文件的千分之一左右,便于储存和携带。
那么怎样才能避免低频失真呢?
著名的采样定理(Nyquist定理)中给出有明确的答案:要想不产生低频失真,采样频率至少应为所要录制的音频的最高频率的2倍。例如,电话话音的信号频率约为3.4 kHz,采样频率就应该≥6.8 kHz,考虑到信号的衰减等因素,一般取为8kHz。
3.3量化
量化是将采样后离散信号的幅度用二进制数表示出来的过程。
每个采样点所能表示的二进制位数称为量化精度,或量化位数。
量化精度反映了度量声音波形幅度的精度。例如,每个声音样本用16位(2字节)表示,测得的声音样本值是在0~65536的范围里,它的精度就是输入信号的1/65536。
常用的采样精度为8bit/s、12 bit/s、16bit/s、20bit/s、24bit/s等。
WMA格式在录制时可以对音质进行调节。同一格式,音质好的可与CD媲美,压缩率较高的可用于网络广播。
Ra格式——流动的旋律
RealAudio主要适用于在网络上的在线音乐欣赏,现在大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。
模拟音频经过采样、量化和编码后所形成的二进制序列就是数字音频信号,我们可以将其以文件的形式保存在计算机的存储设备中,这样的文件通常称之为数字音频文件。
PCM编码
PCM(Pulse Code Modulation),即脉冲编码调制,指模拟音频信号只经过采样、模数转换直接形成的二进制序列,未经过任何编码和压缩处理。PCM编码的最大的优点就是音质好,最大的缺点就是体积大。在计算机应用中,能够达到最高保真水平的就是PCM编码,常见的WAV文件中就有应用。
WMA格式——最具实力的敌人
WMA (Windows Media Audio)由微软开发。
音质要强于MP3格式,更远胜于RA格式,它以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右。
内置了版权保护技术,可以限制播放时间和播放次数甚至于播放的机器等等。
CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只ห้องสมุดไป่ตู้一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。
WAV格式——无损的音乐
WAV为微软公司开发的一种声音文件格式。
标准格式化的WAV文件和CD格式一样,也是44.1K的取样频率,16位量化位数,声音文件质量和CD相差无几!