4.2声音基础(2)
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
GoldWave可从 http://www.goldwave.com下载。
1、GoldWave软件的操作
1) 打开一个已有的声音文件 • 使用“文件”/“打开”命令打开一个声 音文件。打开波形文件之后会看到,窗 口中显示出了波形文件的声音的波形。 如果是立体声,会分别显示两个声道的 波形,绿色部分代表左声道,红色部分 代表右声道。而此时设备控制面板上的 按钮也变得可以使用了(即由黑白变为 彩色)。
G.711
• 采用的是非均匀量化的方法,其中,采样输入信号幅 度和量化输出数据之间定义了两种对应关系:
– μ律压扩算法 主要在美国、日本、加拿大等国采用 – A 律压扩算法 主要用在欧洲和中国大陆等地区的数字电话通信中 • 采样率:8kHz • 信息量:64kbps/channel
• 理论延迟:0.125ms
注意的是:
• 裁剪波形段类似于删除波形段,不同之处是, 删除波形段是把选中的波形删除,而裁剪波 形段是把未选中的波形删除,两者的作用可 以说是相反的。裁剪以后,GoldWave会自动 把剩下的波形放大显示。 • 当拷贝或剪切后进行粘贴时,有三种粘贴方 式,分别为: “粘贴”( 将复制或剪切的部分波形,由选定 插入点插入,等于加入一段波形); “粘新”( 将复制或剪切的部分波形,粘贴到 一个新文件中,等于保存到新文件); “混音”( 将复制或剪切的部分波形,与当前 文件进行混音)。
2)声音客观质量的度量
声音客观质量的度量主要用信噪比SNR(signal to niose ratio)来度量。它指音源产生最大不失真声音信号强度与同时 发出噪音强度之间的比率,通常以S/N表示。一般用分贝(dB) 为单位,信噪比越高表示音频质量越好。 信噪比(SNR)用下式计算:
2 Vsignal 2 Vnoise
量度量比使用客观质量度量更加恰当,更有意义。可是一
般来说,可靠的主观度量值也是比较难获得的,所获得的 值也是一个相对值。 对声音主观质量度量比较通用的标准是平均评价分 (Mean Opinion Score,MOS得分)。
平均评价分(MOS)
• MOS得分为五级评分标准,如下表所示,多人收听完测 试语音后打分,求出平均值,为MOS分。由于主、客观 方面的原因,每次所测得的MOS分有波动,为减小波动 方差,要求参加实验的人数足够多,所测语音材料也 要足够丰富,尽量保持相同的测试条件。MOS分满分为 5分,相当于调幅广播级质量;4.0分~4.5分为长途电 话网质量;3.5分为通信质量,这时已明显感觉音质下 降,但不妨碍通信;3.0分以下常称为合成语音质量, 指一些声码器的合成语音质量,具有足够的可懂度, 但音质较差。
1)以声音的带宽衡量声音的质量
目前,业界公认的声音质量标准分为4级: • 数字激光唱盘CD-DA质量,其信号带宽为10Hz~22kHz; • 调频广播FM质量,其信号带宽为20Hz~15kHz; • 调幅广播AM质量,其信号带宽为50Hz~7kHz; • 电话的话音质量,其信号带宽为200Hz~3400Hz。
SNR 10 log 20 log
Vsignal Vnoise
其中,Vsignal表示信号电压,Vnoise表示噪声电压。
3)声音主观质量的度量
与用SNR客观质量度量相比较,应该可以说人的感觉
(如听觉、视觉等)更具有决定意义,感觉上的、主观上的
测试应该成为评价声音质量和图像质量不可缺少的部分。 而有的学者则认为,在语音和图像信号编码中使用主观质
• 品质:MOS值4.10
A律编码
Linear input code Compressed Code s0000000wxyza s000wxyz s0000001wxyza s001wxyz s000001wxyzab s010wxyz s00001wxyzabc s011wxyz s0001wxyzabcd s100wxyz s001wxyzabcde s101wxyz s01wxyzabcdef s110wxyz s1wxyzabcdefg s111wxyz
Cakewalk Pro Audio的 一些特色功能
1. Cakewalk的调音台可以自动混音,可以一边播放乐曲, 一边记录控制键(滑键)的调整动作,而且多个控制键 可以编组控制,这为制作渐强减弱效果提供了最为简单 的操作手段。 2.对于所有连续变化的数据,例如弯音、调制、控制器、 键速和速度等,Cakewalk都提供了手工划线的编辑方式, 用鼠标划一条斜线或曲线便可随意改变数值。因此,对 于像弯音轮的细微变化过程、速度的自由变化等之类较 难处理的数据,在Cakewalk中都变得异常简单。 3.Cakewalk可以将其所有菜单操作命令赋予MIDI键盘,也 就是说,可以用合成器的键盘来控制软件的各种操作, 其功能是所有音序软件中最全面的。 4. Cakewalk可以将音符的位置、控制器的变化等MIDI信息 图形化地显示出来,因此看起来更加接近总谱。
2、 Gold Wave
GoldWave的窗口界面如图下图所示。
GoldWave是一款相当不错的声音编辑 软件,它集音频录制和编辑于一体,它能 将编辑好的文件存为WAV、MP3、SND、RAW 和AFC等格式,而且它可以不经由声卡直接 抽取CD ROM中的音乐来录制编辑。还可以 很方便地制作背景音乐、音效、录制CD等, 而且还具有各种复杂的音乐编辑和特效处 理功能。
3、 CakeWalk(音乐大师)
作为一种图形化的音乐编辑软件,CakeWalk 的主要工作界面就是各种工作窗口,我们对 MIDI事件和音频事件的所有编辑和操作都是在 工作窗口中完成的。如下图所示,音轨窗既是 CakeWalk主界面的主要组成部分,也是重要的工 作窗口。类似的还有钢琴窗帘、事件列表窗、调 音台窗等,每个窗口各有所长,分别适用于不同 的编辑对象和编辑特征。
第4章
1.声音基础 2.模拟声音信号的重要参数 3. 声音的三要素 4.声音的频谱 5.声音的数字化(A/D转换)
声音
学习目标
6.数字音频的文件格式
7.声音质量的评价
7、声音质量的评价
目前有三种方法可以衡量声音的质量。 •第一种是用声音信号的带宽来衡量声音的质量。 •第二种是客观质量度量。 •第三种是主观质量度量。 评价语音质量时,有时同时采取两种方法评估,有时 以主观质量度量为主。
5、压缩器、扩展器:就是把高音“压缩下去” 把低音“扩展上来”,对声音的力度起到均衡的 作用。其中一个重要参数是阀值(是指需要使用 “压缩器、扩展器”来压缩和扩展的临界点,超 出这个值的部分就被压缩)。另一个是增量的大 小(可以自己尝试调整,规则是,数字越大声音 过渡越自然,听上去感觉也越模糊;反之,数字 越小声音越生硬,但越清晰)。 6、音频的合成:将两个或两个以上的音频素 材合成在一起就是音频的合成。在合成之前,一 般要对素材进行处理,如调整声音的时间长度、 调整音量水平、Fra Baidu bibliotek一采样频率、统一声道模式等。
2、增加混响:即调整混响时间,混响时间的 长短能部分改变音色。混响时间短,声音干涩, 混响时间长声音圆润。 3、淡入和淡出:是指声音渐强和渐弱,通常 用于两个声音素材的交替切换,需要产生渐近 渐远的音响效果的场合。
4、频率均衡控制:用于对声音素材的低音区、 中音区和高音区各个频段进行提升和衰减等控 制,使声音的层次和频段分布更符合要求。
(2)波形文件的存储:存储的文件格式为波形(.wav)文件。
(3)声音的编辑:复制、粘贴、插入、删除等操作。 (4)音频变换与特殊效果:更改声音的大小、速度、回音等。 2、利用软件来进行采集和制作
三、常用音频处理软件简介
1、Cool Edit Pro CoolEdit Pro是著名的 Syntrillium公司开发的 数字音频处理软件,其 运行环境为Windows启动 后其界面如右图所示。
MOS分 5 4 3 2
质量级别 优 良 中 差 不觉察 刚有觉察
失真级别
有觉察且稍觉可厌 明显觉察且可厌但可忍受
1
坏
不可忍受
音频编码技术
• • • • • • G.711, (A/μ)律PCM编码标准,码率64 kb/s G.721,自适应差分脉冲编码(ADPCM),32 kb/s G.722,64 kb/s G.726,16 kb/s G.727,16~40 kb/s G.728, LD-CELP(低延时码激励线性预测),延时小 于2ms,16kb/s • G.729, 共轭结构的代数码激励线性预测(CSACELP), 8kb/s • G.723.1, 6.3 kb/s, 5.3kb/s • GSM, (数字蜂窝电话通信)协议 13.2 kb/s
5)波形文件的特效处理 利用GoldWave工具栏可以对波形文 件进行偏移、改变播放时间、增加回声、 声音渐弱、交换声音等各种特效处理。 • 1、改变播放时间:在制作多媒体作品 时,有时为了和画面保持同步,需要改 变声音的长度。声音时间长度的改变将 影响声音的频率,时间长度缩短将使频 率升高,反之则降低。如果为了在改变 时间的同时,频率不发生变化,选择 “FFT”选项的值应大于等于10,重叠量 的值应大于等于88。
讨论题
1.声音按其特性分为哪几类?举例说明。
分为规则和不规则两类。不规则指不含任何信息的噪音;规则 声音分为语音、音乐和音效。语音是指具有语言内涵和人类约 定俗成的特殊媒体,音乐是规范的、符号化的声音,音效是指 人类熟悉的其他声音,如雨声、雷声、机器轰鸣声。
2)保存
• 点击“文件”/“另存为”命令,即 可打开“保存”对话框,在其中选 择保存路径以及保存文件的格式, 点击“保存”即可。 • 注意:如果你要将文件保存为MP3 格式,需要安装有较高版本的 Media Player(媒体播放机)来支持 把文件直接保存为MP3的格式。
3)波形的选择及编辑
首先,在波形图上用鼠标左键确定 所选波形的开始;然后在波形图上用鼠 标右键确定波形的结尾,这样就选择了 一段波形。选中的波形以较亮的颜色并 配以蓝色底色显示,未选中的波形以较 淡的颜色并配以黑色底色显示。 接下来就可以对所选中的波形进行 拷贝、剪切、删除、裁剪等处理。
二、波形音频文件的采集与制作
1、利用“录音机”生成和编辑波形文件
Windows录音机的主要功能是录音和放音,使用“录音 机”可以录制、混合、播放和编辑声音,也可以将声音链接 或插入到另一文档中。其主要功能操作如下所述: (1)波形文件的录制:确保音频输入设备已经连接到计算机。 录音机常用的输入设备是麦克风和CD-ROM播放机。
•点击设备控制面板上的Play按钮,就 会播放这个波形文件。 •播放波形文件的时候,在窗口中会看 到一条白色的指示线,指示线的位置 表示正在播放的波形。与此同时,在 设备控制面板上会看到音量显示以及 各个频率段的声音的音量大小。在播 放波形文件的过程中可以随时暂停、 停止、倒放、快放播放进度,使用方 法与普通的录音机一样。
CoolEdit Pro的主要特色有: (1).支持的音频格式十分丰富,多达十余种,还提供了 对5种不同类型WAV文件的支持。 (2).提供丰富的特殊效果。包括3D混响、降噪、滤波、 音频缩/放、合声、延迟、变形、反转、静音等。 (3).提供了强大的DSP(数字信号处理)能力。能够同时 处理64条音轨。支持录音、回放、混音、音频编辑。借 助它,能够方便地制作出自己想要的任何特殊音效,并 添加到各种类型的多媒体作品中去。 (4).操作界面设计简捷方便。在工具栏中,提供了56个 图形化按钮。几乎所有的编辑操作都能够方便地进行操 作。
4)录制音频
选择“文件”/“新建”命令 将打开“新建声音”对话框, 如下图所示: • 在对话框中设置声道数、选 择采样频率和录音时间。采 样频率的选择一般是歌曲选 择44100,录音时间是以秒 为单位的。点击“确定”按 钮确定设置.
点击“设备控制”面板上的“声音录制” 按钮,即可开始录音。此时录制按钮变成 了停止录音按钮,录音完毕之后,点击该 停止录音按钮即可停止录音。 点击设备控制面板上的属性按钮,就会弹 出设备控制属性窗口。在设备控制窗口中 可以调整播放属性、录音属性、音量、显 示图的内容以及声卡设备。