第3章 音频处理技术(2课时)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用声音录制软件记录的英文单词“Hello”的 语音实际波形
3.1.1 声音基本特点
1.声音的传播与可听域 2.声音的方向 3.声音的三要素 4.声音的频谱 5.声音的质量 6.声音的连续时基性 7.数字化声音
1.声音的传播与可听域
• 声音依靠介质的振动进行传播。声源实际上是一 个振动源,它使周围的介质(空气、液体、固体) 产生振动,并以波的形式进行传播,人耳如果感 觉到这种传播过来的振动,再反映到大脑,就意 味着听到了声音。 • 人耳听到的声音是有限的,频率低于20Hz和高于 20kHz的声音人类听不到,换言之,人耳的可听 域在20~20kHz之间。频率低于20Hz的声音叫做 “次声”,高于20kHz的声音是“超声”。 • 频率范围又叫“频域”或“频带”,不同种类的 声源其频带也不同,表3.l列出了部分常见声源的 频带宽度。
使用“录音机”录音(续)
• 把话筒插入声卡的话筒插座后,在 Windows的桌面上,单击【开始】按钮, 然后选用菜单【程序】|【附件】|【娱乐】 |【录音机】命令,打开录音机应用程序, 鼠标单击录音机上的录音按钮,开始录音。 一分钟后,录音自动停止。注意,录音机 录制的声音只能采用“.wav”格式。
3.2.2 CD音乐采样
• 所谓CD音乐采样,是指使用专用软件对 CD盘上的音乐、语言以及其他形式的声 音进行数字转换,生成多种格式的数字 音频信号。 • 用于转换的专用软件很多,本节以Easy CD-DA Extractor软件为例介绍CD音乐的 采样方法(自学)
3.2.3 自然声采样
• 自然声不同于光盘音乐,获得自然声的途 径只能是直接录音。 • 在录音过程中,实时地完成采样,形成数 字音频信号。 • 具备录音和采样功能的软件非常多,最常 见的软件是Windows中的“录音机”应用 软件。但该软件对录音时间有限制,一次 录音最长不能超过1min。若想录制大于 1min的声音,只能使用其他软件。
6.声音的连续时基性
声音在时间轴上是连续信号,具有连续性 和过程性,属于连续时基性媒体形式。
源自文库
7.数字化声音
• 为了用计算机表示和处理声音,必须将 声音进行数字化,即用数字表示声波。 • 数字化了的声音叫做“数字音频信号”, 它除了包含有自然界中所有的声音之外, 还具有经过计算机处理的独特的音色和 特质
第3章 音频处理技术
3.1 基本概念 3.2 音频数据采样与简单处理 3.3 数字音频处理软件GoldWave
3.1 基本概念
• 声音是振动的波,是随时间连续变化的物理 量。 • 声音有三个重要指标: • 振幅(Amplitude)——波的高低幅度,表 示声音的强弱; • 周期(Period)——两个相邻波之问的时间 长度; • 频率(Frequency)——每秒钟振动的次数, 以Hz为单位。
2.采样频率
• 在一定的时间间隔内采集的样本数叫做“采样 频率”。采样频率越高,在一定的时间间隔内 采集的样本数越多,音质就越好。当然,采集 的样本数量越多,数字化声音的数据量也越大。 如果为了减少数据量而过分降低采样频率,音 频信号增加了失真,音质就会变得很差。 • 音频数据的采样频率与声音还原频率还原的关 系如下:
2.MIDI文件
• MIDI是Musical Instrument Digital Interface (乐 器数字接口)的缩写,MIDI文件的扩展名为MID。 • 与波形文件不同,MIDI文件不对音乐进行采样, 而是对音乐的每个音符记录为一个数字,所以与 波形文件相比要小得多,可以满足长时间音乐的 需要。 • MIDI标准规定了各种音调的混合及发音,通过输 出装置可以将这些数字重新合成为音乐。
• 其他格式文件还包括VOC文件、AU文件和CIF 等。 • VOC文件是随声霸卡一起诞生的常用的声音文件, 主要用于DOS程序(特别是游戏)中,VOC文件 和波形文件可互相转换。 • AU文件是UNIX操作系下的数字声音文件,由于 早 期 在 Internet 上 的 Web 服 务 器 主 要 是 基 于 UNIXR的,所以这种文件成为WWW上使用的标 准声音文件。 • MOD文件最初产生于Commodore公司的AMIGA 计算机。
3.1.3 数字音频的音质与数据量
• 数字音频主要指wav格式的波形音频文件。 • 数字音频的声音质量好坏,取决于采样频率的高低、 表示声音的基本数据位数和声道形式。 • 音频的数据量由下式算出: v fbs / 8 • 式中,V代表数据量;f是采样频率;b是数据位数;s 是 声 道 数 。 例 如 CD 质 量 的 参 数 为 , f=43.1kHz, b=16bit,s=2,则每秒钟的数据量为: • v=(44100Hz×16bit×2)÷8=176400B(约合172KB) • 如果以CD激光盘音质(44100kHz的采样频率、16位 立体声形式)记录一首5min(300秒)的乐曲,参照 表3.2,计算的数据量是: • 172KB/s×300s=51600KB(合50.39MB)
4.声音的频谱
• 声音的频谱有线性频谱和连续频谱之分。 • 线性频谱是具有周期性的单一频率声波; • 连续频谱是具有非周期性的带有一定频 带所有频率分量的声波。
5.声音的质量
• 声音的质量简称“音质”,音质的好坏与音色和 频率范围有关。悦耳的音色、宽广的频率范围, 能够获得非常好的音质。影响音质的因素还有很 多,常见的有: (1)对于数字音频信号,音质的好坏与数据采样频 率和数据位数有关。采样频率越低,位数越少, 音质越差。 (2)音质与声音还原设备有关,音响放大器和扬声 器的质量能够直接影响重放的音质。 (3)音质与信号噪声比有关。在录制声音时,音频 信号幅度与噪声幅度的比值越大越好,否则声音 被噪声干扰,会影响音质。
3.光盘数字音频文件(CD-DA)
• 其采样频率为43.1KHz,每个采样使用16 位存储信息。 • 它不仅为开发者提供了高质量的音源, 还无需硬盘存储声音文件,声音直接通 过光盘由CD-ROM驱动器中特定芯片处 理后发出。
4. 压缩音频文件
• 在数字音频领域,mp3格式的压缩数字音频文件很 流行。由于该格式文件采用MPEG数据压缩技术, 压缩比高 • 目前已经有一些多媒体平台软件和算法语言支持该 格式的音频文件,为制作多媒体产品提供了非常有 效的文件格式。mp3格式的音频文件具有如下特点:
录音的技术问题(续)
• 话筒是录制自然声所必需的。 • 话筒主要有动圈话筒和电容话筒等类型。 • 动圈话筒的音质好,动态范围宽,适于录制 音乐; • 电容话筒灵敏度高,频率范围窄,适于录制 语音。 • 由于话筒的输出信号非常微弱,因此话筒的 输出信号线不宜过长。如果使用无线话筒, 则话筒与接收装置的距离不宜太远。
2.声音的方向
声音以振动波的形式从声源向四周传播, 人类在辨别声源位置时,首先依靠声音 到达左、右两耳的微小时间差和强度差 异进行辨别,然后经过大脑综合分析而 判断出声音来自何方。
3.声音的三要素
声音的三要素是音调、音色和音强。就听觉特性而言, 声音质量的高低主要取决于该三要素。 (1)音调——代表了声音的高低。音调与频率有关, 频率越高,音调越高,反之亦然。 (2)音色——具有特色的声音。
3.2 音频数据采样与简单处理
3.2.1 采样基本原理 3.2.2 CD音乐采样 3.2.3 自然声采样
3.2.1 采样基本原理
• 声音采样的作用是:把自然界中的模拟 量声音转换成计算机能够处理的数字化 声音,该过程称为“A/D转换(模/数转 换)”。
1.数字采样
• 声音采样的基本原理是:首先输入模拟声音信 号,然后按照固定的时间间隔截取该信号的振 幅值,每个波形周期内截取两次,以取得正、 负向的振幅值。该振幅值采用若干位二进制数 表示,从而将模拟声音信号变成数字音频信号。 模拟声音信号是连续变化的振动波,而数字音 频信号则是阶跃变化的离散信号。 • 截取模拟声音信号振幅值的过程叫做“采样”, 得到的振幅值叫做“采样值”,采样值用二进 制数的形式表示,该表示形式叫做“量化编 码”。
– · 数据源取自波形音频文件,可获得非常好的音质。 – · 数据压缩比非常高,数据量较小。 – · 通过专用软件,可以很方便地在个人计算机上制作和播放 mp3格式的音频文件。 – · 播放设备多样化,目前市售的微型mp3播放机和mp3激光 盘播放机都可以播放mp3格式的音频文件。
5.其他文件格式
2.使用“录音机”录音
• 在使用计算机进行录音时,话筒的插头应插入声卡 的MIC(话筒)输入插座内。 • 质量较好的声卡有两个输入插座,一个用于话筒, 一个用于线路输入。用于话筒的插座灵敏度高,一 般为0.5~3mv,适于输入微弱的信号;用于线路输 入的插座灵敏度低,主要与音响设备的线路输出端 连接,适于输入强度较大的信号 ,一般为 500 ~ 1000mv。上述两个插座不要混淆。如果把话筒插在 线路输入插座内,将录不到声音。
1.录音的技术问题
• 录制自然声,一般需要专业的录音设备,以便保证 良好的信噪比。 • 采用计算机进行录音,应配备质量较好的声卡和话 筒。 • 如果到野外录音的话,一般采用便携式录音设备录 制前期声,然后在室内进行后期加工和处理。 • 在录音时,应注意调整输入信号的强度,使其不超 过录音设备的动态范围,否则将产生削顶失真,音 感阻塞,严重时无法辨别声音的内容。信号强度过 低,也不能获得满意的声音,原因是信号与噪声的 比值小,噪声相对比较明显,影响了音质。
3.录音失败的处理
• 如果录音失败,应检查以下几个方面: (1)话筒的开关是否打开,很多话筒带有开关。 (2)话筒是否正确地连接在声卡的MIC输入端。 (3)双击屏幕右下角的音量图标(小喇叭),在随 后显示出来的音量控制画面中,选择菜单【选项】 |【属性】,显示【属性】对话框。在【属性】对 话框中,单击【录音】选项,在音量控制清单中, 检查“录音控制”、“线路输入”和“麦克风” 三项均应有“√”,如果没有,单击该项。最后单 击“确定”按钮。
• 从上式中看出,音频数据的采样频率是还原模 拟声音频率的两倍。例如,要求还原的声音频 率为22.05kHz,则采样频率应取43.1kHz。
3. 声道数
• 声道数是声音通道的个数,指一次采样 的声音波形个数。 • 单声道一次采样一个声音波形,双声道 则被人们称为“立体声”,一次采样两 个声音波形。双声道比单声道多一倍的 数据量,多声道的数据量更大。
– 声音分纯音和复音两种类型。所谓纯音,是指振幅和周期 均为常数的声音;复音则是具有不同频率和不同振幅的混 合声音,大自然中的声音大部分是复音。在复音中,最低 频率的声音是“基音”,它是声音的基调。其他频率的声 音称为“谐音”,也叫泛音。基音和谐音是构成声音音色 的重要因素。 – 各种声源都具有自己独特的音色,例如各种乐器的声音、 每个人的声音、各种生物的声音等,人们就是依据音色来 辨别声源种类的。
3.声音的三要素(续)
(3)音强——声音的强度,也被称为声音 的响度,常说的“音量”也是指音强。 音强与声波的振幅成正比,振幅越大, 强度越大。唱盘、CD激光盘以及其他形 式声音载体中的声音强度是一定的,通 过播放设备的音量控制,可改变聆听时 的响度。如果要改变原始声音的音强, 在把声音数字化以后,使用音频处理软 件提高音强。
3.1.2 数字音频文件的种类
1.WAV文件 2.MIDI文件 3.光盘数字音频文件(CD-DA) 4. 压缩音频文件 5.其他文件格式
1.WAV文件
• WAV文件也称为波形文件,是Windows所使用的 标准数字音频,文件的扩展名是WAV。 • 它是对实际声音进行采样所得到的数据。 • 使用波形文件最大的缺点是文件太大,不适合长时 间记录声音,例如,同样半小时的立体声音乐, MIDI文件只有200KB左右,而WAV文件则要差不 多300MB。 • 波形音频文件占存储空间很大,每秒钟音频文件的 字节数可用如下公式计算: • (采样频率×采样精度)/8
• 由计算结果看出,音频文件的数据量问 题不容忽视。为了节省存储空间,通常 在保证基本音质的前提下,可以采用稍 低一些的采样频率。 • 一般而言,在要求不高的场合,人的语 音采用11.025kHz的采样频率、8bit、单 声道已经足够;如果是乐曲,22.05kHz 的采样频率、8bit、立体声形式已能满足 一般播放场合的需要。