了解采样频率量化位数

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

声音的波形图
声音的三个基本要素
音调
声音的高亢与低沉,与声波的频率有关。
音强
声音的大小,与声波的振幅成正比。
音色
音色是由混入基音中的泛音决定的。
声音的周期性和非周期性
凡是振动波形是周期性的、在频 谱上是分列的线性谱、听起来有 一定音调的,就叫做“乐音”。 凡是其振动的波形成非周期性的、 在频谱上是连续的、听起来没有 一定音调,但饱满生动,则叫做 “噪声”。
声音信号的对比
模拟信号:是一种随时间变化的连 续性的信号,传输和复制时易发生 失真现象。不能被计算机处理。 数字信号:是一种离散的、非连续 性的信号。在传输和复制过程中不 失真,声音精度高、质量好、可用 计算机方便的进行播放、存储和编 辑。
5.2.1.2 采样和量化
模拟的音频信号要转换成离散的数 字信号,必须对声音信号在时间和 幅度两个方面进行离散化。 在横向的时间轴上,每隔一个固定 的时间间隔,在声音波形曲线上抽 取一个点。然后对采样点纵轴上的 电压幅度用有限的数字来表示。
5.2.2.2音频压缩编码的基本方法
音频信号的压缩方法有多种。由 于它们采用的算法复杂,音频的质 量、数据的压缩比以及编解码延时 等方面都有很大的不同,所以它们 的具体应用也要根据使用的场合来 确定。
1、波形编码
脉冲编码调制(PCM) 差分脉冲编码调制(DPCM) 自适应差分脉冲编码调制(ADPCM)
3、效果声
效果声简称为音效,是一种模拟 自然声响的专用声音文件。它能够 表达语言和音乐无法表达的信息, 塑造环境氛围,起到模拟提示的作 用。效果声包括各种各样的自然声 响和特殊音响,它可以是自然声响, 也可以是非自然的虚幻模拟声响。
鸡鸣 风铃 蛙叫 激光
5.1.2常见声音文件格式及特点 存储声音信息的文件格式有很 多种,不同的文件格式具有不同 的特性,在实际应用中应该了解 常见的音频文件格式特点,才能 在具体的应用中会做到心中有数, 会有效的选择合适的文件格式。
VOC 文件是新加坡著名的多 媒 体 公 司 Creative LABS 开 发 的声音文件格式,多用于保存 Creative sound blaster 系列 声卡所采集的声音数据,被 Windows 系统和 Dos 系统所支持。
7、AU文件
是SUN公司开发的一种音频文件格 式, Unix 操作系统和 Java 系统下的 标准文件格式。
5.2.3.2 MIDI音乐的合成
MIDI 是 1983 年由 Yamaha 、 Roland 等公司联 合制定的一种国际标准。 MIDI 软件可以创作和编辑处理 MIDI 文件, 它可以利用有 MIDI 接口的电子琴或软件的 虚拟钢琴及五线谱的曲目,就可以创作或 合成MIDI音乐文件。 常 用 的 MIDI 制 作 软 件 有 CakeWalk Pro Audio 、 Jammer (作曲大师)和 Midi Sacn (乐谱识别)软件等。
计算机、声卡、录音软件。 将输出端子插到声卡的信号输入插孔 中(mic in或Line in)。 选择录音属性、设置参数和调节录音 音量的大小。 打开音源,启动录音软件、开始录音、 保存声音文件。
常用的声音录制软件
Windows系统自带的“录音机” Adobe Audition Sound Forge Wave Edit Gold Wave Sound Edit Pro
2、量化位数
量化位数(Sampling Data)也称 为“量化精度”,它是描述每个采样 值的二进制数据的位数。也可以说量 化就是把采样所得的值加以数字化, 用计算机中的若干二进制的位数来表 示的过程。
量化位数越高 质量越好 数据量越大
3、声道数
声音通道的个数称为声道数(Channels), 是指一次采样所记录产生的声音波形个数。
8、AIF文件
是 Apple 公司开发的一种音频文 件格式,被Macintosh 系统及其应用 程序所支持。
5.2数字音频的获取
复杂的声波由许许多多具有不同 振幅和频率的正弦波组成。用计算 机获取音频的过程就是声音信号数 字化的过程,经过数字化处理后的 数字音频信息能够像文本文件和其 它数字信息一样进行存储、检索、 编辑和使用。
5.1数字音频基础
在计算机中,所处理的声音信号 是经过离散化了的数字信号,是由 一系列的数字来表示的,称为数字 音频。数字音频的特点是保真度好、 易于存储和分发、也易于编辑处理。 数字音频信息在计算机里面以文件 的形式进行保存。
5.1.1数字音频分类
数字音频从声音的组成和音响效 果中可分为语音、音乐和效果声三 种类型,这些数字音频在多媒体应 用过程中都具有不同的特性和作用, 在不同的应用环境中应该选用不同 的数字音频文件。
5.2.3.3 数字音频库的应用
主要以CD音乐光盘、音效素材光盘、 MIDI音乐光盘、MP3光盘、VCD和 DVD光盘上以及网络数字音乐库的 形式存在。 素材库中的数字音频,主要以音乐、 歌曲和音响效果这三种形式存在 。
5.2.4 利用“录音机”采集声音文件的应用实 例
利用话筒、声卡和 Windows 系统自带的“录音机”程序, 录制一分钟以内的一段声音文 件,文件命名为“解说”,文 件为WAV格式。
2、参数编码
把音频信号表示成某种模型的输出, 利用特征提取的方法抽取必要的模型 参数和激励信号的信息。对这些信息 编码,最后在输出端合成原始信号。 其目的是重建音频,保持原始音频的 特性。参数编码的压缩率很大,但算 法复杂、计算量大、保真度不高,适 合于语音信号的编码。如线性预测编 码(LPC)。
采样频率 量化位数
声道数
1、采样频率
采样频率(Sampling Rate)是指一秒种内采 样的次数,采样频率的单位用kHz(千赫兹)表示。
采样频率越高
质量越好
数据量越大
奈奎斯特(Harry Nyquist)采样定理
采样时所采用的频率必须是模拟 信号最高频率的 2 倍,这样才能保证 采样获得的声音信号在重放时不失真, 才能完全恢复原始信号的波形和质量。 如一段频率为 22 kHz 的声音,在 采样时必须用22kHz×2=44 kHz的频 率去采样。
3、MP3文件
MP3是MPEG Audio Layer3音频文 件的缩写。它是一种声音文件的压缩 方法,具有音质好、压缩比高等特点。 虽然它采用了有损压缩方式,但它以 极小的声音失真换取了较高的压缩比, 使得MP3能在Internet上广泛传播。
4、RA文件
RA的全称为RealAudio,是由Real Networks 公司开发的一种流媒体文件 格式,最大的特点就是可以在网络上 实时传输音频信息,主要适用于网络 在线播放。文件数据量小、音质好, 压缩比可达到1:96。
采样量化示意图
基本概念:
把模拟声音信号转化为数字音频时,需要 在声音波形上按一定的时间间隔,获取一 系列的采样点,这个过程称之为采样 。 把某一幅度范围内的电压用一个数字表示 的这个过程称之为量化。 将声音数据写成计算机能处理的数据形式, 以适应存储和传输的过程,称之为编码。
影响数字音频质量的因素
1、语音
语音不仅是声音的载体,而且还是 一种带有情感的信息媒体。只有将真实 自然的解说声,通过计算机的声卡采集 压缩后生成的波形声音文件才能播放出 语音解说声,而利用其它软件和硬件却 不能合成具有丰富感情色彩的语音解说 词。因此语音信号是数字音频中一种具 有特殊功能和作用的声音文件。
单击小喇叭,可以播放声音。
=2646000(B)
2646000
1024×1024
2.52 MB
答:不压缩声音文件的数据量为2.52 MB
5.2.2数字音频的压缩与编码
声音频率的范围
常见声音的采样频率和量化位数及声道数
CD音质
44.1kHz,16位,立体声,172KB/秒。
收音质量
22.05kHz,8位,单声道,21KB/秒。
学习数字音频的基础知识和对数字音频进 行编辑操作的基本技能。 了解采样频率、量化位数、声道数等基本 参数对声音质量的影响。 了解数字音频文件压缩的必要性和可能性。 学习声音编辑软件Adobe Audition 1.0。 了解MIDI作曲软件CakeWalk 9.03。
声音是极其重要的信息媒体。在 多媒体应用系统中使用声音是多媒 体应用最基本、最常用的手段。通 过声音的应用,可以直接表达信息、 制造音响效果和渲染气氛、演奏音 乐以及配音解说等。
5、WMA文件
WMA的全称是Windows Media Audio, 是微软公司开发的网上流式数字音频 压缩技术。 WMA 文件压缩比高、音质 好,更加有利于网络传输。此外,还 可以通过数字防伪管理方案加入防拷 贝技术,或者加入限制播放时间和播 放次数,甚至是播放机器的限制,可 有力地防止盗版。
6、VOC文件
1、MIDI文件
MIDI文件并不记录任何声音, 只是记录电子乐器的弹奏信息,是 乐谱的一种数字式描述方式。由于 它不包含具体的声音数据,所以文 件较小,便于存储和传输。一般来 说,MIDI文件只适合于记录乐曲, 而不能记录歌曲声音信息。
2、WAV文件
是目前一种通用的数字音频文件格式。 它记录的是真实声音的波形文件。被 Windows系统及其应用程序广泛支持。WAV 文件支持多种音频文件格式,可以有不同 的采样频率、量化位数和声道数。声音质 量真实自然、音响效果好、能记录各种声 音信息。不足之处是文件的数据量大,不 便于存储和传输。
5.2.1数字音频的采集与量化
数字音频的采集和量化是计 算机获取外部模拟声音信号的重 要过程,也是在实际应用中能获 得合适的数字音频文件的基本方 法。
5.2.1.1声音的物理特性
声音的本质是物体的机械振动,通 常把振动的物体称之为“声源”。声 源的振动通过传播介质如空气、水进 行传播,便形成了声波。人耳接受到 声波后耳膜就会跟着振动,通过听觉 神经末梢的传递,就可以听到声音了。
电话质量
11.025kHz,8位,单声道,10KB/秒。 采用过高和过低的采样频率,都会增加冗余的数 据量或降低声音的质量,不利于数字化声音的处理和 应用。
5.2.2.1音频压缩的必要性与可能性
必要性:数字化后的声音文件的数 据量会非常之大,如果不进行压缩 处理,一般的计算机无法对音频信 号进行存储和交换。 可能性:通过除去信号中存在的大 量冗余数据,和利用人的听觉特性 来降低编码率。便能够达到压缩编 码率的目的。
声道数越多
声音真实感越强
数据量越大
4、数字音频的数据量
数字音频的数据量与采样频率、量化位数和 声道数成正比关系。 未经压缩的数字音频的数据量可由以下公式进行计算
例 题 : 录 制 30 秒 的 单 声 道 声 音 , 采 样 频 率 为 44.1KHz,量化位数用16位时,所采集的不 压缩的波形文件的数据量是多少兆字节。 解: 44.1×1000×16×1×30/8
3、混合编码
介于波形编码和参数编码之间, 利用了这两种压缩方法的优点,以 求在压缩比、压缩效率及保真度之 间取得最佳折衷。如矢量和激励线 性预测编码(VSELP),多子带感知 编码(MPEG)等。
5.2.2.3高保真立体声音频压缩标准
MPEG音频是目前国际上比较成熟 的高保真立体声音频压缩标准。MPEG 音频标准提供三个独立的压缩层次, 使用户可在复杂性和压缩质量之间权 衡选择,即Layer1、Layer2、Layer3。
MP3采用的是MPEG标准中的第三层次的音 频压缩模式。
5.2.3数字音频的获取方法
获取数字音频文件是多媒体技术 的基本技能和采集获取数字信息媒 体的主要方法之一。目前,常用的 数字音频的获取方法主要有数字音 频的采集、 MIDI 音乐的合成及数字 音乐库的应用这三种方法。
5.2.3.1数字音频的采集
2、音乐
音乐是数字音频中使用最广泛、作用也 较大的一种信息媒体。它具有渲染环境气 氛、增强作品感染力、烘托主体的作用。ห้องสมุดไป่ตู้在应用过程中,可以单独使用、也可以配 合其它媒体一同使用。在音乐文件中, MIDI 音乐文件是一种单纯的音乐文件格式, 也就是说 MIDI 文件中只有音乐声而没有唱 词声。
单击小喇叭,可以播放声音。
相关文档
最新文档