数字媒体基础-4
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
4.3 声波的叠加
简单的正弦波代表了一种简 单的单调音——单频率的。 当两个或更多的声波相遇时, 它们的振幅会增大,并得到 一个更复杂的波形(如图4-3 所示)。我们每天感受到的 声音很少是单调音。比如语 音、音乐、噪声的波形都是 很复杂的,因为它总是由多 个不同频率的声波叠加在一 起的结果。
4.1.1.8 AIF文件
是Apple公司开发的一种音频文 件格式,被Macintosh系统及其应用 程序所支持。
4.2 声波的本质
声音是物体在一种媒介(如空气)中振动而产生 的波。 振动的物体可以是人的声带、吉他的弦或者音 叉。 空气分子的这些运动会从弦的位置开始引发并 逐渐向外传播、辐射下去,引起了气压的周期 性变化——这就形成了声波。 当这个压力波到达人的耳膜时,也同样引起耳 膜的来回振动,耳膜的振动产生了一个信号并 传递到人的大脑,最终,大脑将气压变化的信 号识别为声音。
声音信号的对比
模拟信号:是一种随时间变化的连 续性的信号,传输和复制时易发生 失真现象。不能被计算机处理。 数字信号:是一种离散的、非连续 性的信号。在传输和复制过程中不 失真,声音精度高、质量好、可用 计算机方便的进行播放、存储和编 辑。
4.4.2
采样和量化
模拟的音频信号要转换成离散的数 字信号,必须对声音信号在时间和 幅度两个方面进行离散化。 在横向的时间轴上,每隔一个固定 的时间间隔,在声音波形曲线上抽 取一个点。然后对采样点纵轴上的 电压幅度用有限的数字来表示。
数字媒体基础教程
授课:孙清伟
第4章 数字音频基础
关键概念: · 声波 · 频率和音调 · 声音的数字化 · 数字音频的取样率和位深度 · 奈奎斯特理论 · 动态范围 · 音频文件尺寸的优化
学习目标
学习完本章后,应该能够掌握:
· 有关音频的常用术语的概念。 · 数字音频文件的常见类型。 · 声波的属性。 · 数字化的主要步骤:数字音频的取样和量化。 · 数字音频的取样率和位深度。 · 数字音频记录方式和MIDI格式的区别。 · 数字音频中的“分贝”的概念。 · 数字音频的量化的基本步骤。 · 缩减数字音频文件大小的主要技术手段。
4.1.1.6 VOC文件
VOC文件是新加坡著名的多 媒 体 公 司 Creative LABS 开 发 的声音文件格式,多用于保存 Creative sound blaster系列 声卡所采集的声音数据,被 Windows系统和Dos系统所支持。
4.1.1.7 AU文件
是SUN公司开发的一种音频文件格 式,Unix操作系统和Java系统下的 标准文件格式。
音量与声强
音量的大小是听者的一种主观感受,但是声强 是一种客观的度量。因此,音量和声强并不是 完全相同的属性。 声强则可以完全不需要听众的存在,而仅仅用 听觉仪器进行客观的测量。 听众的年龄是一个会影响对声音音量的主观判 断的因素。声音的频率也是一个影响因素,因 为人对不同频率声音的敏感度不同。
4.2.2声强和音量
声强(sound intensity)是和直接感受到的声音的 音量(loudness)相关联的,虽然这二者并不完 全等同。声强通常用分贝(decibel,dB)作为单 位。 听觉范围的上限大概是120dB,它表示的声音 强度大约是0dB所表示声强的1 000 000 000 000(即1012)倍
4.4 数字音频的采集与量化
数字音频的采集和量化是计 算机获取外部模拟声音信号的重 要过程,也是在实际应用中能获 得合适的数字音频文件的基本方 法。
4.4.1 声音的物理特性
声音的本质是物体的机械振动,通 常把振动的物体称之为“声源”。声 源的振动通过传播介质如空气、水进 行传播,便形成了声波。人耳接受到 声波后耳膜就会跟着振动,通过听觉 神经末梢的传递,就可以听到声音了。
4.1.1.3 MP3文件
MP3是MPEG Audio Layer3音频文 件的缩写。它是一种声音文件的压缩 方法,具有音质好、压缩比高等特点。 虽然它采用了有损压缩方式,但它以 极小的声音失真换取了较高的压缩比, 使得MP3能在Internet上广泛传播。
4.1.1.4 RA文件
RA的全称为RealAudio,是由Real Networks公司开发的一种流媒体文件 格式,最大的特点就是可以在网络上 实时传输音频信息,主要适用于网络 在线播放。文件数据量小、音质好, 压缩比可达到1:9Байду номын сангаас。
声音是一种机械波
因为声波在一种介质中的传播依赖于介质颗粒 相互作用的机制,所以声波被当作一种机械波 来定义其特性。这个特点还意味着声波不能在 真空中传播。 在一股声波中,介质颗粒的运动是平行于波的 传播方向的。这种波被定义为纵波。注意:这 里的颗粒运动指的是介质颗粒在传播中的振动, 而不是每个颗粒本来自身的运动。
4.1.3.2 音乐
音乐是数字音频中使用最广泛、作用也 较大的一种信息媒体。它具有渲染环境气 氛、增强作品感染力、烘托主体的作用。 在应用过程中,可以单独使用、也可以配 合其它媒体一同使用。在音乐文件中, MIDI音乐文件是一种单纯的音乐文件格式, 也就是说MIDI文件中只有音乐声而没有唱 词声。
声道数越多
声音真实感越强
数据量越大
4.4.2.4 数字音频的数据量
数字音频的数据量与采样频率、量化位数和 声道数成正比关系。 未经压缩的数字音频的数据量可由以下公式进行计算
例 题 : 录 制 30 秒 的 单 声 道 声 音 , 采 样 频 率 为 44.1KHz,量化位数用16位时,所采集的不 压缩的波形文件的数据量是多少兆字节。 解: 44.1×1000×16×1×30/8
声音的波形图
声音的三个基本要素 音调
声音的高亢与低沉,与声波的频率有关。
音强
声音的大小,与声波的振幅成正比。
音色
音色是由混入基音中的泛音决定的。
声音的周期性和非周期性
凡是振动波形是周期性的、在频 谱上是分列的线性谱、听起来有 一定音调的,就叫做“乐音”。 凡是其振动的波形成非周期性的、 在频谱上是连续的、听起来没有 一定音调,但饱满生动,则叫做 “噪声”。
采样频率 量化位数
声道数
4.4.2.1 采样频率
采样频率(Sampling Rate)是指一秒种内采 样的次数,采样频率的单位用kHz(千赫兹)表示。
采样频率越高
质量越好
数据量越大
奈奎斯特(Harry Nyquist)采样定理
采样时所采用的频率必须是模拟 信号最高频率的2倍,这样才能保证 采样获得的声音信号在重放时不失真, 才能完全恢复原始信号的波形和质量。 如一段频率为22 kHz的声音,在 采样时必须用22kHz×2=44 kHz的频 率去采样。
=2646000(B)
2646000
1024×1024
2.52 MB
答:不压缩声音文件的数据量为2.52 MB
4.4.2.6 数字音频的压缩与编码
声音频率的范围
常见声音的采样频率和量化位数及声道数
CD音质
44.1kHz,16位,立体声,172KB/秒。
收音质量
22.05kHz,8位,单声道,21KB/秒。
4.1.3.1 语音
语音不仅是声音的载体,而且还是 一种带有情感的信息媒体。只有将真实 自然的解说声,通过计算机的声卡采集 压缩后生成的波形声音文件才能播放出 语音解说声,而利用其它软件和硬件却 不能合成具有丰富感情色彩的语音解说 词。因此语音信号是数字音频中一种具 有特殊功能和作用的声音文件。
单击小喇叭,可以播放声音。
4.1.1.1 MIDI文件
MIDI文件并不记录任何声音, 只是记录电子乐器的弹奏信息,是 乐谱的一种数字式描述方式。由于 它不包含具体的声音数据,所以文 件较小,便于存储和传输。一般来 说,MIDI文件只适合于记录乐曲, 而不能记录歌曲声音信息。
4.1.1.2 WAV文件
是目前一种通用的数字音频文件格式。 它记录的是真实声音的波形文件。被 Windows系统及其应用程序广泛支持。WAV 文件支持多种音频文件格式,可以有不同 的采样频率、量化位数和声道数。声音质 量真实自然、音响效果好、能记录各种声 音信息。不足之处是文件的数据量大,不 便于存储和传输。
4.2.1 频率和音调
声波是物体在一种媒介(比如空气)中振动而产 生的。无论振动的物体是什么,它总是以一个 固定的频率来回振动(移动),这引发物体周围 的空气分子也以同样的频率振动,因而发出了 声音压力波。 波的频率(frequency)指的是单位时间内介质颗 粒振动一个完整来回的次数。频率通常使用的 单位是赫兹(Hz,Hertz),所用的相应时间单 位是1秒。
电话质量
11.025kHz,8位,单声道,10KB/秒。 采用过高和过低的采样频率,都会增加冗余的数 据量或降低声音的质量,不利于数字化声音的处理和 应用。
4.4.2.6 音频压缩的必要性与可能性
必要性:数字化后的声音文件的数 据量会非常之大,如果不进行压缩 处理,一般的计算机无法对音频信 号进行存储和交换。 可能性:通过除去信号中存在的大 量冗余数据,和利用人的听觉特性 来降低编码率。便能够达到压缩编 码率的目的。
4.1.2 数字音频基础
在计算机中,所处理的声音信号 是经过离散化了的数字信号,是由 一系列的数字来表示的,称为数字 音频。数字音频的特点是保真度好、 易于存储和分发、也易于编辑处理。 数字音频信息在计算机里面以文件 的形式进行保存。
4.1.3 数字音频分类
数字音频从声音的组成和音响效 果中可分为语音、音乐和效果声三 种类型,这些数字音频在多媒体应 用过程中都具有不同的特性和作用, 在不同的应用环境中应该选用不同 的数字音频文件。
4.1.1.5 WMA文件
WMA的全称是Windows Media Audio, 是微软公司开发的网上流式数字音频 压缩技术。WMA文件压缩比高、音质 好,更加有利于网络传输。此外,还 可以通过数字防伪管理方案加入防拷 贝技术,或者加入限制播放时间和播 放次数,甚至是播放机器的限制,可 有力地防止盗版。
4.4.2.2 量化位数
量化位数(Sampling Data)也称 为“量化精度”,它是描述每个采样 值的二进制数据的位数。也可以说量 化就是把采样所得的值加以数字化, 用计算机中的若干二进制的位数来表 示的过程。
量化位数越高 质量越好 数据量越大
4.4.2.3 声道数
声音通道的个数称为声道数(Channels), 是指一次采样所记录产生的声音波形个数。
4.1简介
声音是我们日常生活中感官体验 的必不可少的一部分。声音也是一种 模拟类型信息的自然现象。声音的最 基本的本质其实是“声波”——声音 的物理学定义。
4.1.1 声音的作用
声音是极其重要的信息媒体。在 多媒体应用系统中使用声音是多媒 体应用最基本、最常用的手段。通 过声音的应用,可以直接表达信息、 制造音响效果和渲染气氛、演奏音 乐以及配音解说等。
单击小喇叭,可以播放声音。
4.1.3.3 效果声
效果声简称为音效,是一种模拟 自然声响的专用声音文件。它能够 表达语言和音乐无法表达的信息, 塑造环境氛围,起到模拟提示的作 用。效果声包括各种各样的自然声 响和特殊音响,它可以是自然声响, 也可以是非自然的虚幻模拟声响。
鸡鸣 风铃 蛙叫 激光
4.1.4 常见声音文件格式及特点 存储声音信息的文件格式有很 多种,不同的文件格式具有不同 的特性,在实际应用中应该了解 常见的音频文件格式特点,才能 在具体的应用中会做到心中有数, 会有效的选择合适的文件格式。
4.5 动态范围
在量化步骤中,一个振幅值的离散等级范围用 来对样本点进行映射。这个等级提供的范围( 也就是从最低的到最高的量化后数值)定义了 数字音频的动态范围(dynamic range)。 如果动态范围比声波的全振幅范围小一些,有 些数据就会丢失。因为数字化后的声波会被较 窄的振幅范围“裁剪”。
采样量化示意图
基本概念:
把模拟声音信号转化为数字音频时,需要 在声音波形上按一定的时间间隔,获取一 系列的采样点,这个过程称之为采样 。 把某一幅度范围内的电压用一个数字表示 的这个过程称之为量化。 将声音数据写成计算机能处理的数据形式, 以适应存储和传输的过程,称之为编码。
影响数字音频质量的因素