多媒体音频处理技术(ppt52张)

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

4.1.2 数字音频的采样、量化和编码
1．采样
模拟音频信号实际上是连续信号，或称连续时间函数x（t）。数字化时，必须先对连续信号采样，即按一定的时间间隔（T）取值, 得到x（nT）（n为整数）。T称采样周期，1/T称为采样频率， x（nT）是离散信号。虽然数字音频信号可以克服模拟音频的缺点，但是在播放声音的时候，数字音频必须重新还原为模拟音频，为了保证还原的音频信号不失真，数字化时采样频率必须满足采样定理的要求。采样定理：在进行模拟/数字信号的转换过程中，为保证还原后的信号不出现失真，采样频率至少是信号最高频率的2倍；采样定理又称奈奎斯特定理。常用的音频采样率有：8kHz、11.025kHz、22.05kHz、16kHz、 37.8kHz、44.1kHz、48kHz。
4.1.3 数字音频文wk.baidu.com格式
3．WMA文件
WMA就是Windows Media Audio编码后的文件格式，由微软开发， ASF和WMA都是微软公司为了和Real Networks公司竞争而开发的网上流式数字音频压缩技术,可以一边下载一边播放，因此WMA可以很轻松的实现在线广播。这种压缩技术同时兼顾了保真度和网络传输的需求 , 微软声称，在只有64kbps的码率情况下，WMA可以达到接近CD的音质。 WMA支持防复制功能，通过Windows Media Rights Manager 加入保护，可以限制播放时间和播放次数甚至于播放的机器等等。由于是微软的杰作，因此，微软在Windows中加入了对WMA的支持，WMA有着优秀的技术特征，在微软的大力推广下，这种格式被越来越多的人所接受。
第4章多媒体音频处理技术
4.1 4.2 4.3
音频技术简介音频编码技术音频素材的获取 4.4 音频素材的编辑
4.1 音频技术简介
4.1.1 数字音频基础
4.1.2
数字音频的采样、量化和编码
4.1.3
数字音频文件格式
4.1.1 数字音频基础
1．声音
声音是一种由机械振动产生的波，叫声波。声音的强弱体现在声波振动的幅度大小上，音调的高低体现在声波振动的频率上，人们可以使用麦克风（话筒）把声波转换成电信号，即音频信号。音频信号是一种频率范围为20Hz ～20KHz的波形信号，它有两个基本的参数：频率和幅度。电压的幅度表示声音的强弱，频率表示声音的音调，它是一种在时间和幅度上都是连续的模拟信号。
4.1.1 数字音频基础
2．数字音频
模拟音频信号主要有下述几点缺点：
一、抗干扰能力差
二、噪声会累积三、无法使用计算机进行存储，不能在计算机网络中传输
4.1.1 数字音频基础
由于模拟音频信号存在上述难以克服的缺点，为了使人们能够获得更好的声音质量，更加便捷的处理方式，随着数字电子技术的发展，数字音频技术逐渐出现在音频应用的各个领域，并成为多媒体技术及应用的核心。音频是连续变化的模拟信号，而数字音频是一个数据序列，在时间上是断续的。把模拟音频信号通过采样和量化转换成用由许多“0”、“1”表示的数字信号，这个过程就是音频的数字化。在这一处理技术中，涉及到音频的采样、量化和编码。
4.1.3 数字音频文件格式
2．AIF或AIFF文件
AIF是音频交换文件格式（Audio Interchange File Format）的英文缩写，是Apple公司开发的一种声音文件格式，被Macintosh平台及其应用程序所支持，Netscape Navigator浏览器中的LiveAudio也支持 AIFF格式，SGI平台及其他专业音频软件包也同样支持这种格式。 Windows的Convert工具可以把AIF格式的文件转换成Microsoft的WAV格式的文件。
4.1.2 数字音频的采样、量化和编码
3．编码
编码是根据一定的协议或格式把模拟信息转换成二进制比特流的过程。多媒体信息数字化的过程中，最简单的编码方式就是直接用量化后的二进制数作为输出的数字信号，这种编码方式也就是PCM（脉冲代码调制）编码。多媒体信息的一个特点是存在各种冗余信息，具有很大的压缩潜力。因为在多媒体数据中，存在着空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余统计冗余等，它们为数据压缩技术的应用提供了可能的条件。因此，在多媒体系统中可以采用数据压缩技术对数字信号进行压缩，在保证人的主观感受不变的前提下，使得存储的数据量大大下降。采用不同的压缩技术，也即采用了不同的编码技术。
4.1.2 数字音频的采样、量化和编码
2．量化
采样后的信号x(nT)，其幅值仍然是连续变化的数值，为了便于在计算机中处理，必须将取样值量化成一个有限个幅度值的集合x(nT)。量化的过程如下：量化器先将整个幅度划分成为有限个小幅度(量化间隔)的集合，把落入某个间隔内的样值归为一类，并赋予相同的量化值。量化间隔的数目，称为量化级。量化过程存在量化误差，在还原信号的D/A转换后，这种误差作为噪声再生，称为量化噪声。量化级数越多，量化误差就越小，质量就越好。增加量化级数能够把噪声降低到无法察觉的程度，但随着信号幅度的降低，量化噪声与信号之间的相关性变得更加明显。
4.1.3 数字音频文件格式
WAV文件 PCM文件 MPl、MP2、MP3文件
AIF或AIFF文件
MIDI文件
WMA文件 CD-DA文件 RA文件 MP4
4.1.3 数字音频文件格式
1．WAV文件
WAV文件也叫作波形文件，是Microsoft公司开发的一种声音文件格式，存储文件扩展名为“.wav”。WAV格式文件的数据是直接来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点，以不同的量化位数（8～64bit）把这些采样点的值转换成二进制数，然后存入磁盘，这就产生了声音的 WAV文件，WAV文件所需要的存储容量很大，如果对声音质量要求不高的话，可以通过降低采样频率、采用较低的量化位数或利用单声道来录制WAV文件，此时的WAV文件大小可以大大减小。 WAV文件数据没有经过压缩，数据量大，但音质最好。大多数压缩格式的声音都是在它的基础上经过数据的重新编码来实现的，这些压缩格式的声音信号在压缩前和回放时都要使用WAV格式。
4.1.2 数字音频的采样、量化和编码
4．数字音频文件的存储量
以字节为单位，模拟波形声音被数字化后未被压缩的音频文件的存储量为：存储量=采样频率×量化位数/8×声道数×时间其中，声道是指处理的声音是单声道还是立体声。单声道在声音处理过程中只有一个数据流，而立体声则需要左右声道两个数据流。