数字音频-Wing
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
最新DVD-Audio也是使用PCM编码,其指标相当高,采样率最高可达192KHz, 量化级为24bit。
早期数字音频格式
(2)WAVE格式──庞大的日不落帝国
WAV:由微软开发的,现在它已经成为了事实上的通用音频格式。WAVE文件 作为最经典的Windows多媒体音频格式。 使用三个参数来表示声音:采样位数、采样频率和声道数。声道有单声道 和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和 44100Hz(44kHz)三种。WAVE文件所占容量=(采样频率×采样位数×声 道)×时间/8(1字节=8bit)。 WAV格式是非常灵活的,它对音频流的编码没有硬性规定,除了PCM之外, 几乎所有支持ACM(Audio Compression Manager)规范的编码都可以为 WAV的音频流进行编码。 基于PCM编码的WAV还常常被当作一种中介格式,用于不同编码的相互转换 当中,如将MP3转换成Ogg格式。
新型数字音频格式
(6)MusePack(MPC)──低调的优质音乐 MusePaCk(.mpc)(.mp+),是由德国人Andree Buschmann开发的一种 完全免费的高品质音频格式。 160Kbps码率以上的MPC表现好过任何其他的有损压缩格式,不仅仅是音 质,MPC还有编码速度快的优点。 250kbps左右MPC表现非常的出众,很难分辨它和原始信号有多少区别。 但作为个人研发的音频格式,MPC缺乏软硬件支持和市场推广,知名度 较低。无法编码48KHz采样率的曲子。
数字音频基础介绍
3、有损压缩与无损压缩
存储1分钟采样率为44.1KHz,量化级为16bit,双声道的PCM编码的音频信号, 需要10.34MB的空间。在所有的数字音频编码中,PCM编码代表了最高的保真 水平,因此,被约定俗成为无损编码。我们而通常上讲的有损音频编码,只 是相对于PCM编码而言的。 有损压缩:是指使用压缩后的数据进行重构,重构后的数据与原来的数据有 所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构 信号不一定非要和原始信号完全相同的场合。
Ogg Vorbis是高质量的音频编码方案,在相对较低的数据速率下实现比 MP3更好的音质! Ogg Vorbis是一种灵活开放的音频编码,能够在编码方案已经固定下来 后还能对音质进行明显的调节和新算法的改良。 压缩技术上,Ogg Vorbis的最主要特点是使用了VBR(可变比特率)和 ABR(平均比特率)方式进行编码。 Ogg Vorbis这种编码可以支持多声道,这意味着Ogg Vorbis在抓轨软件 (目前这种软件还没有)的支持下,可以对所有的声道进行编码,尤其 在欣赏交响时,会带来更多临场感。
新型数字音频格式
(2)mp3Pro──技术先进的尴尬 汤姆森多媒体公司(Thomson Multimedia SA)与佛朗赫弗协会 (Fraunhofer Institute)发布了一种新的音乐格式mp3PRO,mp3PRO其实 是一种mp3信号流和SBR信号流的混合数据流编码。它能在64kbps码率下 提供近似于CD的音质(mp3是128kbps)。 mp3PRO采用了新的SBR(Spectral Band Replication 频段复制)音频 编码增强算法,SBR最大的优势就是在低数据速率下实现非常高效的编 码。
PCM:脉冲编码调制(pulse code modulation,)是概念上最简单 、理论上最完善的编码系统,是最早研制成功、使用最为广泛 的编码系统,但也是数据量最大的编码系统。
数字音频基础介绍
1、PCM:脉冲编码调制 由于模拟声音信号非常复杂,PCM需要通过采样、量化、编码三个步骤将连 续变化的模拟信号转换为数字编码。
早期数字音频格式
(3)AIFF/AU格式──割据一方的诸侯
AIFF是苹果电脑中的标准音频格式,属于QuickTime技术的一部分。它和 WAV非常类似,实际上WAV格式就是由它克隆而来。不过AIFF远不如WAV盛 行,但由于苹果电脑在多媒体领域里的领导地位,所以,大部的音频编 辑软件和播放软件都对它提供了支持,可以说只要有Apple还存在一天, AIFF就不会消亡
数字音频
Prepared By Wing.Lei Date: Dec.16.2005
数 字 音 频
基础介绍 早期数字音频 新型数字音频 流媒体 常见视频伴音
数字音频基础介绍
早期用模拟方式来记录音频,但它存在着复制失真和因介质磨 损而失效的问题,为避免这些问题,数字音频出现了!将模拟 声音数字化最早采用PCM (pulse code modulation)编码,即是 脉冲编码调制,它几乎是所有数字音频格式的始祖。
数字音频基础介绍
4、压缩率和码率
压缩率:通常指音乐文件压缩前和压缩后大小的比值 .用来简单描述数字声 音的压缩效率。 码率:也称比特率,也是一种表示数字音乐压缩效率的重要指标,它表示记 录音频数据每秒钟所需要的比特值(bit),通常用Kbps(即每秒1024bit) 作为单位。CD中的数字音乐码率为1411.2Kbps,而MP3音频的码率为 112Kbps~128Kbps。
AU则是Unix平台下一种常用的音频格式,起源于Sun 公司的Solaris系统。 AU格式本身也支持多种压缩方式,但文件结构的灵活性就比不上AIFF和 WAV。
早期数字音频格式
(4)MIDI──通向音乐创作的桥梁
MIDI文件本身只是一堆数字信号而已,不包含任何声音信息,它记录的是在音乐 的什么时间用什么音色发多长的音等等。 由于MIDI记录的并不是真正的声音,所以不同的声卡,不同软波表,不同硬件音 源的音色是不相同的,相同的MIDI文件在不同的设备上播放会有不同的效果。普 通的MIDI文件许多播放器都支持,但要达到好的效果就必须安装软波表。 Microsoft已经在DirectX里面增加了软波表,使之成为Windows系统的标准配置 了。
早期数字音频格式
(1)PCM 编码──老而弥坚的始祖
PCM 即Pulse Code Modulation(脉冲代码调制编码)的缩写,它可以算 做数字音频的鼻祖。 它的最大的优点就是保真度高,缺点就是体积庞大。
常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音 乐信息。
新型数字音频格式
(4)FLAC── (PCM)一切为了音质 和Ogg Vorbis一样,FLAC也属于OGG计划的一部分,它的全称是Free Lossless Audio Codec.FLAC是世界上第一个完全开放和免费的无损音 频压缩格式 FLAC支持大多数的操作系统, Windows, "unix" (Linux, *BSD, Solaris, OS X, IRIX), BeOS, OS/2, 和Amiga。 FLAC其压缩率接近2:1. FLAC更看重解码的速度。解码只需要整数运算,并且相对于大多数编码 方式而言,对计算速度要求很低。在很普通的硬件上就可以轻松实现实 时解码。 播放时占用系统的资源较少,在文件有点损坏的情况下依然能够正常播 放。
新型数字音频格式
(9)Windows Media Audio(WMA)──微软野心的代表 音频方面采用的是微软自己开发的 Windows Media Audio技术 Windows Media 的关键核心是MMS协议和ASF数据格式,MMS用于网络传输 控制,ASF则用于媒体内容和编码方案的打包。
据微软声称,在只有64kbps的码率情况下,WMA可以达到接近CD的音质, Windows Media Audio的压缩技术中还拥有可变码率(VBR)、无损压缩技 术,并支持多声道编码。
新型数字音频格式
常见视频伴音格式
音频格式主要是作为电影伴音而存在的,它们很少单独存在, 但我们和它们接触的机会并不会比以上两大类少 (1)Dolby Digital AC3──DVD伴音之王
数字音频基础介绍
2、采样率和量化级 声音数字化有两个步骤: 第一步是采样,就是每隔一段时间间隔读一次声音的幅度。 第二步是量化,就是把采样得到的声音信号幅度转换成数字值。 人耳的听觉要求,需要至少40K/s次采样,用40kHz来表示,这个40kHz就是 采样率。
数字音频基础介绍
正弦线代表原始音频;黄色的方 格代表采样后得到的结果,二者 越吻合说明采样结果越好。横坐 标表示采样率;纵坐标是量化级。 格子从左到右,逐渐加密,可见 采样率越大则音质越有保证;同 样,当纵坐标的单位越小则越有 利于音质的提高,即采样量化级 越大越好
新型数字音频格式
(5)Monkey‘s Audio(APE)──音乐迷的新欢 Monkey‘s Audio也是一种无损压缩音频编码,它出现得比FLAC早,支持 它的音频软件要超过FLAC。 APE(Monkey‘s Audio文件的扩展名),因为它既可无损的保持WAV文件 的音质,而大小仅有WAV的一半。压缩之后的APE音频文件是可以直接被 播放的。
新型数字音频格式
“频带重现 Spectral Band Replication”,简称SBR。SBR是一种 非 常有效的生成声音中高频率成分的方法。
新型数字音频格式
(3)Ogg Vorbis(OGG)──自由与开放的声音 OGG的信念就是:OPEN!FREE OGG是一个庞大的多媒体开发计划的项目名称,将涉及视频音频等方面的编 码开发。OGG计划的目的就是向任何人提供完全免费多媒体编码方案! Ogg Vorbis只是Ogg计划的一部分.
新型数字音频格式
(7)AAC──媒体巨头的新宠 AAC是高级音频编码(Advanced Audio Coding)的缩写,它属于MPEG-2 国际标准Biblioteka Baidu一部分。 AAC是高压缩比的音频压缩算法,压缩比可达20:1,远远超过了AC-3、MP3 等音频压缩算法。96Kbps码率的表现超过了128Kbps的MP3音频。 AAC另一个引人注目的地方就是它的多声道特性,它支持1~48个全音域音轨 和15个低频音轨。 AAC支持96KHz的采样率,其解析能力足可以和DVD-Audio的PCM编码相提并 论,成为了下一代DVD的标准音频编码。 另一方面,低码率下的高音质则使它也适合移动通讯、网络电话、在线广 播等领域。 苹果、AT&T和RealNetworks等已经开始提供收费的AAC编码服务。
新型数字音频格式
(8)Real Audio──流式音频的代表 它是流媒体行业中的霸主RealNetworks的产品, RealMedia 音频部分采用的 是Real Audio,该编码在低带宽环境下的传输性能非常突出。 Scalable Video Technology可伸缩视频技术可以根据用户电脑速度和连 接质量而自动调整媒体的播放质素。 Two-Pass Encoding两次编码技术通过对媒体内容进行预扫描,再根据扫 描的结果来编码从而提高编码质量。 SureStream自适应流技术,可通过一个编码流提供自动适合不同带宽用户 的流播放。 RealMedia 音频部分采用的是Real Audio,该编码在低带宽环境下的传输 性能非常突出。RealMedia通过基于 SMIL并结合自己的RealPix和 RealText技术来达到一定的交互能力和媒体控制能力。
早期数字音频格式
新型数字音频格式
(1)MP3──当今的江湖老大 MP3是MPEG-1/MPEG-2 Audio Layer 3的简称,属于MPEG-1/2的派生音频 方案。
MP3采用的是一种有损压缩方式,第一个实用的有损音频压缩方案,MP3 可以实现12:1的压缩比。
MP3使用的是知觉音频编码技术,它利用了人耳的特性,削减音频中人 耳听不到的成分,同时尽可能地维持原来的声音质量,这是它实现高压 缩比,保持较高音质的一个关键。
早期数字音频格式
(2)WAVE格式──庞大的日不落帝国
WAV:由微软开发的,现在它已经成为了事实上的通用音频格式。WAVE文件 作为最经典的Windows多媒体音频格式。 使用三个参数来表示声音:采样位数、采样频率和声道数。声道有单声道 和立体声之分,采样频率一般有11025Hz(11kHz)、22050Hz(22kHz)和 44100Hz(44kHz)三种。WAVE文件所占容量=(采样频率×采样位数×声 道)×时间/8(1字节=8bit)。 WAV格式是非常灵活的,它对音频流的编码没有硬性规定,除了PCM之外, 几乎所有支持ACM(Audio Compression Manager)规范的编码都可以为 WAV的音频流进行编码。 基于PCM编码的WAV还常常被当作一种中介格式,用于不同编码的相互转换 当中,如将MP3转换成Ogg格式。
新型数字音频格式
(6)MusePack(MPC)──低调的优质音乐 MusePaCk(.mpc)(.mp+),是由德国人Andree Buschmann开发的一种 完全免费的高品质音频格式。 160Kbps码率以上的MPC表现好过任何其他的有损压缩格式,不仅仅是音 质,MPC还有编码速度快的优点。 250kbps左右MPC表现非常的出众,很难分辨它和原始信号有多少区别。 但作为个人研发的音频格式,MPC缺乏软硬件支持和市场推广,知名度 较低。无法编码48KHz采样率的曲子。
数字音频基础介绍
3、有损压缩与无损压缩
存储1分钟采样率为44.1KHz,量化级为16bit,双声道的PCM编码的音频信号, 需要10.34MB的空间。在所有的数字音频编码中,PCM编码代表了最高的保真 水平,因此,被约定俗成为无损编码。我们而通常上讲的有损音频编码,只 是相对于PCM编码而言的。 有损压缩:是指使用压缩后的数据进行重构,重构后的数据与原来的数据有 所不同,但不影响人对原始资料表达的信息造成误解。有损压缩适用于重构 信号不一定非要和原始信号完全相同的场合。
Ogg Vorbis是高质量的音频编码方案,在相对较低的数据速率下实现比 MP3更好的音质! Ogg Vorbis是一种灵活开放的音频编码,能够在编码方案已经固定下来 后还能对音质进行明显的调节和新算法的改良。 压缩技术上,Ogg Vorbis的最主要特点是使用了VBR(可变比特率)和 ABR(平均比特率)方式进行编码。 Ogg Vorbis这种编码可以支持多声道,这意味着Ogg Vorbis在抓轨软件 (目前这种软件还没有)的支持下,可以对所有的声道进行编码,尤其 在欣赏交响时,会带来更多临场感。
新型数字音频格式
(2)mp3Pro──技术先进的尴尬 汤姆森多媒体公司(Thomson Multimedia SA)与佛朗赫弗协会 (Fraunhofer Institute)发布了一种新的音乐格式mp3PRO,mp3PRO其实 是一种mp3信号流和SBR信号流的混合数据流编码。它能在64kbps码率下 提供近似于CD的音质(mp3是128kbps)。 mp3PRO采用了新的SBR(Spectral Band Replication 频段复制)音频 编码增强算法,SBR最大的优势就是在低数据速率下实现非常高效的编 码。
PCM:脉冲编码调制(pulse code modulation,)是概念上最简单 、理论上最完善的编码系统,是最早研制成功、使用最为广泛 的编码系统,但也是数据量最大的编码系统。
数字音频基础介绍
1、PCM:脉冲编码调制 由于模拟声音信号非常复杂,PCM需要通过采样、量化、编码三个步骤将连 续变化的模拟信号转换为数字编码。
早期数字音频格式
(3)AIFF/AU格式──割据一方的诸侯
AIFF是苹果电脑中的标准音频格式,属于QuickTime技术的一部分。它和 WAV非常类似,实际上WAV格式就是由它克隆而来。不过AIFF远不如WAV盛 行,但由于苹果电脑在多媒体领域里的领导地位,所以,大部的音频编 辑软件和播放软件都对它提供了支持,可以说只要有Apple还存在一天, AIFF就不会消亡
数字音频
Prepared By Wing.Lei Date: Dec.16.2005
数 字 音 频
基础介绍 早期数字音频 新型数字音频 流媒体 常见视频伴音
数字音频基础介绍
早期用模拟方式来记录音频,但它存在着复制失真和因介质磨 损而失效的问题,为避免这些问题,数字音频出现了!将模拟 声音数字化最早采用PCM (pulse code modulation)编码,即是 脉冲编码调制,它几乎是所有数字音频格式的始祖。
数字音频基础介绍
4、压缩率和码率
压缩率:通常指音乐文件压缩前和压缩后大小的比值 .用来简单描述数字声 音的压缩效率。 码率:也称比特率,也是一种表示数字音乐压缩效率的重要指标,它表示记 录音频数据每秒钟所需要的比特值(bit),通常用Kbps(即每秒1024bit) 作为单位。CD中的数字音乐码率为1411.2Kbps,而MP3音频的码率为 112Kbps~128Kbps。
AU则是Unix平台下一种常用的音频格式,起源于Sun 公司的Solaris系统。 AU格式本身也支持多种压缩方式,但文件结构的灵活性就比不上AIFF和 WAV。
早期数字音频格式
(4)MIDI──通向音乐创作的桥梁
MIDI文件本身只是一堆数字信号而已,不包含任何声音信息,它记录的是在音乐 的什么时间用什么音色发多长的音等等。 由于MIDI记录的并不是真正的声音,所以不同的声卡,不同软波表,不同硬件音 源的音色是不相同的,相同的MIDI文件在不同的设备上播放会有不同的效果。普 通的MIDI文件许多播放器都支持,但要达到好的效果就必须安装软波表。 Microsoft已经在DirectX里面增加了软波表,使之成为Windows系统的标准配置 了。
早期数字音频格式
(1)PCM 编码──老而弥坚的始祖
PCM 即Pulse Code Modulation(脉冲代码调制编码)的缩写,它可以算 做数字音频的鼻祖。 它的最大的优点就是保真度高,缺点就是体积庞大。
常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音 乐信息。
新型数字音频格式
(4)FLAC── (PCM)一切为了音质 和Ogg Vorbis一样,FLAC也属于OGG计划的一部分,它的全称是Free Lossless Audio Codec.FLAC是世界上第一个完全开放和免费的无损音 频压缩格式 FLAC支持大多数的操作系统, Windows, "unix" (Linux, *BSD, Solaris, OS X, IRIX), BeOS, OS/2, 和Amiga。 FLAC其压缩率接近2:1. FLAC更看重解码的速度。解码只需要整数运算,并且相对于大多数编码 方式而言,对计算速度要求很低。在很普通的硬件上就可以轻松实现实 时解码。 播放时占用系统的资源较少,在文件有点损坏的情况下依然能够正常播 放。
新型数字音频格式
(9)Windows Media Audio(WMA)──微软野心的代表 音频方面采用的是微软自己开发的 Windows Media Audio技术 Windows Media 的关键核心是MMS协议和ASF数据格式,MMS用于网络传输 控制,ASF则用于媒体内容和编码方案的打包。
据微软声称,在只有64kbps的码率情况下,WMA可以达到接近CD的音质, Windows Media Audio的压缩技术中还拥有可变码率(VBR)、无损压缩技 术,并支持多声道编码。
新型数字音频格式
常见视频伴音格式
音频格式主要是作为电影伴音而存在的,它们很少单独存在, 但我们和它们接触的机会并不会比以上两大类少 (1)Dolby Digital AC3──DVD伴音之王
数字音频基础介绍
2、采样率和量化级 声音数字化有两个步骤: 第一步是采样,就是每隔一段时间间隔读一次声音的幅度。 第二步是量化,就是把采样得到的声音信号幅度转换成数字值。 人耳的听觉要求,需要至少40K/s次采样,用40kHz来表示,这个40kHz就是 采样率。
数字音频基础介绍
正弦线代表原始音频;黄色的方 格代表采样后得到的结果,二者 越吻合说明采样结果越好。横坐 标表示采样率;纵坐标是量化级。 格子从左到右,逐渐加密,可见 采样率越大则音质越有保证;同 样,当纵坐标的单位越小则越有 利于音质的提高,即采样量化级 越大越好
新型数字音频格式
(5)Monkey‘s Audio(APE)──音乐迷的新欢 Monkey‘s Audio也是一种无损压缩音频编码,它出现得比FLAC早,支持 它的音频软件要超过FLAC。 APE(Monkey‘s Audio文件的扩展名),因为它既可无损的保持WAV文件 的音质,而大小仅有WAV的一半。压缩之后的APE音频文件是可以直接被 播放的。
新型数字音频格式
“频带重现 Spectral Band Replication”,简称SBR。SBR是一种 非 常有效的生成声音中高频率成分的方法。
新型数字音频格式
(3)Ogg Vorbis(OGG)──自由与开放的声音 OGG的信念就是:OPEN!FREE OGG是一个庞大的多媒体开发计划的项目名称,将涉及视频音频等方面的编 码开发。OGG计划的目的就是向任何人提供完全免费多媒体编码方案! Ogg Vorbis只是Ogg计划的一部分.
新型数字音频格式
(7)AAC──媒体巨头的新宠 AAC是高级音频编码(Advanced Audio Coding)的缩写,它属于MPEG-2 国际标准Biblioteka Baidu一部分。 AAC是高压缩比的音频压缩算法,压缩比可达20:1,远远超过了AC-3、MP3 等音频压缩算法。96Kbps码率的表现超过了128Kbps的MP3音频。 AAC另一个引人注目的地方就是它的多声道特性,它支持1~48个全音域音轨 和15个低频音轨。 AAC支持96KHz的采样率,其解析能力足可以和DVD-Audio的PCM编码相提并 论,成为了下一代DVD的标准音频编码。 另一方面,低码率下的高音质则使它也适合移动通讯、网络电话、在线广 播等领域。 苹果、AT&T和RealNetworks等已经开始提供收费的AAC编码服务。
新型数字音频格式
(8)Real Audio──流式音频的代表 它是流媒体行业中的霸主RealNetworks的产品, RealMedia 音频部分采用的 是Real Audio,该编码在低带宽环境下的传输性能非常突出。 Scalable Video Technology可伸缩视频技术可以根据用户电脑速度和连 接质量而自动调整媒体的播放质素。 Two-Pass Encoding两次编码技术通过对媒体内容进行预扫描,再根据扫 描的结果来编码从而提高编码质量。 SureStream自适应流技术,可通过一个编码流提供自动适合不同带宽用户 的流播放。 RealMedia 音频部分采用的是Real Audio,该编码在低带宽环境下的传输 性能非常突出。RealMedia通过基于 SMIL并结合自己的RealPix和 RealText技术来达到一定的交互能力和媒体控制能力。
早期数字音频格式
新型数字音频格式
(1)MP3──当今的江湖老大 MP3是MPEG-1/MPEG-2 Audio Layer 3的简称,属于MPEG-1/2的派生音频 方案。
MP3采用的是一种有损压缩方式,第一个实用的有损音频压缩方案,MP3 可以实现12:1的压缩比。
MP3使用的是知觉音频编码技术,它利用了人耳的特性,削减音频中人 耳听不到的成分,同时尽可能地维持原来的声音质量,这是它实现高压 缩比,保持较高音质的一个关键。