数字音频设计2

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 自由空间影响因素包括:声级大小、频谱状况、个人经 验因素 • 室内:反射声、混响声和直达声的比例成为判断深度的 重要依据
听觉效应-双耳听闻效应应用
立体声系统 由于单耳听闻不易辨别声音的方位,而传声 器相当于是“单耳听闻”,所以:
• 音乐录音室的混响时间应低于同体积的音乐厅的 混响时间 • 对白录音室的混响时间应低于同体积的报告厅的 混响时间 • 录音建筑中的噪声应低于同类型的大厅
• 由于输出音量不可能大于I0,因此L<0,也就是说, L的取值范围是-∞---0
练习:
View/waveform display查看纵轴
• 右键选取decibels,推测I0取的是什么 • 查看其它几个右键选项,看看都有哪些音量表示 方法 • 查看levels面板,看标尺的取值范围
声音与听觉-响度
声音与听觉-哈斯效应
哈斯效应反应了人耳对于回声感觉的规律
• 声源直接传来的声音和一次反射的声音相继到达 人耳:
延迟小于30ms,人耳一般无法区分 时差超过50ms,相当于17m距离,人耳能够区分这两 个不同方向的声音 来自反射的后到的声音就有可能成为回声 高频比低频反射量多
练习:
Generate/tones产生100Hz与1000Hz相同大 小的声音各一,测试音量大小
声音与听觉-听阈与痛阈
听阈
• 声音弱到人的耳朵刚刚可以听见时,称此时的声音强度 为“听阈”
例如,1 kHz纯音的声强达到10-16w/cm2(定义成零dB声强级)时, 人耳刚能听到,此时的主观响度级定为零方
方 等 响 曲 线
人耳对不同频率的敏感程度差别很大
对2 kHz~4 kHz范围的信号最为敏感 在低频区和高频区,能被人耳听到的信号幅度要高得多
问题:
声音的方位感如何产生?其原理有什么应用 价值?
听觉效应-双耳听闻效应
到达双耳的声音有微小的时间差、强度差和 相位差,使得人可以辨别声音的方向,确定 声源的位置,我们称为双耳听闻效应
• 水平方向该效应明显,可辨别5-15度的变动 • 垂直方向该效应较弱,有时变动大于60度才能察 觉 • 声音方位感使人能在嘈杂环境中辨别某一方向的 特殊声音
提问:
为什么录音听起来比现场要难度要大一些? 会议录音用单声道还是立体声好,为什么?
听觉效应-双耳听闻效应
双耳间的时间差和相位差是低频声音水平定位的主 要因素,为什么? 随着频率的提高,声级差和音色差就成了水平定位 的主要因素,为什么? 高度感借助于耳廓的对高频(4000Hz以上)声波到 达时的折射实现,进入外耳道的声波通过干涉具有 离散谱的性质 深度感定位:
声音与听觉-掩蔽效应与噪声
演播现场的噪声会掩蔽演播,这种干扰必须考虑 人耳具有在噪声环境下有选择地分出感兴趣信号的 能力,这种能力目前精密仪器还无法做到
• 和注意力有关 • 和噪声强度有关
有选择地分出和放大对听者来说感兴趣的信号是助 听器研究的一个重要内容
问题
回声对听觉的影响是什么?有什么应用价值?
声音与听觉-掩蔽效应之时域掩蔽
在时间上相邻的声音之间 也有掩蔽现象,并且称为 时域掩蔽 时域掩蔽又分为:
• 超前掩蔽(pre-masking) • 滞后掩蔽(post-masking)
产生时域掩蔽的主要原因 是人的大脑处理信息需要 花费一定的时间 超前掩蔽很短,只有大约 5~20 ms,而滞后掩蔽 可以持续50~200 ms
掩蔽可分成:
• 频域掩蔽 • 时域掩蔽
声音与听觉-掩蔽效应之频域掩蔽
一个强纯音会掩蔽在其附近同时发声的弱纯音,这种特性称为频域掩蔽,也称 同时掩蔽(simultaneous masking) 弱纯音离强纯音越近就越容易被掩蔽 如图所示:
• • • 一个声强为60 dB、频率为1000 Hz的纯音掩蔽1100 Hz的42dB纯音 1000 Hz的纯音和一个声强比它低18 dB的2000 Hz的纯音,那么我们的耳朵将会同 时听到这两个声音 要想让2000 Hz的纯音也听不到,则需要把它降到比1000 Hz的纯音低45 dB
声音与听觉-主观音高/调测量
测量:
• • • • 听两个声强级为40 dB的纯音 固定其中一个的频率 调节另一个的频率 直到他感到后者的音高为前者 的两倍 • 这两个声音的音高差为两倍
结果:
• 音高与频率之间也不是线性关 系
问ቤተ መጻሕፍቲ ባይዱ:
复合音频信号对音高会产生什么影响? 为什么感觉上同样音高的声音听起来如此不 同?
• 对不同的频率进行测量,可以得到“听阈—频率”曲线
痛阈
• 声音强到使人耳感到疼痛,称此时的声音强度为“痛阈”
频率为1 kHz的纯音的声强级达到120 dB左右时,人的耳朵就感 到疼痛,这个阈值称为“痛阈”
• 对不同的频率进行测量,可以得到“痛阈—频率”曲线
声音与听觉-听阈痛阈频率曲线
0-120
声音与听觉-音调
音调:声音的频率这一物理量给人的主观感觉
• 声音频率越高,音调越高 • 单一频率的声音,我们称为纯音 • 和纯音相对的是复音,由若干不同频率的声音构成
复音中最低频率的称为基音 比基音音调高的成分称为范音 如果某个泛音是基音频率的整数倍,我们称为谐音 • 二次谐音是基频的两倍,依次类推 • 谐频每递增一次,其功率和强度都比前一次少
• 原先定義為贝:β=log(I/I0),其中I0是人耳最小可感覺的聲 音強度(sound intensity),其值為10-16W/m 2, • 使用原始定義,則可聽的最大聲音為14B,此範圍太狹窄, 使用上不方便,故取其十分之一為實用單位,即分貝 (deci-Bell,簡寫為dB)。因此,定義音量位準為: • L =10 log(I/I0)
• View/waveform display查看动态平面 • View/spectral frequency display查看旋律平面 • View/spectral phrase display查看相位平面
设置相位phrase非零,产生纯音的在查看
查看自然声音的三个视图,分析大小、频率、 相位的一般规律 garden5.wma 查看话音的三个视图,分析大小、频率、相 位的一般规律 self introduction.mp3
练习
测试播放一个声强为60 dB、频率为1000 Hz 的纯音掩蔽1100 Hz的42dB纯音
声音与听觉掩蔽效应之不同纯音的掩蔽效应曲线
①在250 Hz、1 kHz、4 kHz和8 kHz纯音附近, 对其他纯音的掩蔽效果最明显 ②低频纯音可以有效地掩蔽高频纯音,但高频 纯音对低频纯音的掩蔽作用则不明显
不同的人或乐器有不同的泛音,这构成了乐器的特 有音质,我们称为音色
练习:
查看garden5钢琴音乐的基音与泛音 试着留下基音和泛音,听音色的不同
声音与听觉-音色与频谱
就录音工作而言, 音色的研究非常重 要的
• 音色与频谱有着非常 密切的关系 • 实际工作中可以通过 改变频谱创造音色 • 下图为基频为262Hz 的三种波形,它们均 为C调Do音,但音色 不同(a)音叉 (b) 提琴 (c)人声
吸音墙 音乐厅的声音折射玻璃板
问题:
声音信号如何分析?如何表示?
声波的性质
在通常情况下,我们听到的声音是一种复合 信号
• 单一频率的信号称为分量信号(纯音) • 若干不同频率的分量信号叠加而成的信号为复合 信号(通常情况下的声音) • 我们把一个声音所覆盖的频率范围称为带宽 • 声音信号的两个最重要的参数是频率和幅度
问题:
如何表示声音的高低?人的听觉如何反应声 音的高低?
声音与听觉-音高/调的感知
物理上:用频率来表示声音的音高,其单位 是Hz 主观上:音高单位则是“美(Mel)”
人耳可以听到的最低频率约20 Hz,最高频率 约18000 Hz 在测量音高时则以40 dB声强为基准,并且同 样由主观感觉来确定
0分贝:刚刚听到 10分贝:最小可听声音强度的10倍 20分贝:最小可听声音强度的100倍 30分贝:最小可听声音强度的1000倍
声音与听觉-声强的再分辨
L =10 log(I/I0)
• 若取I0为最小可听音量,则可听范围为0-140dB
由于播放系统有可承载的最大音量,我们在 衡量播放系统的播放音量时,通常希望知道 当前音量是播放系统的最大可输出音量的多 少,在这种情况下I0代表系统最大音量
问题:
声音的带宽和听觉有什么关系?
声音的频率
根据声音频率的不同,我们把声波分为:
• • • • 次声波 infrasonic <20Hz 20Hz< 音频audio <20000Hz (20KHz) 20000Hz <超声波ultrasonic 其中在音频范围(20-20KHz)内,人说话的频 率范围通常在300-3400Hz,我们称为话音信 speech • 人耳的听力因年龄和个体而有差异
数字音频设计
Digital Audio Design
问题:
声音的本质是什么?有什么样的性质?
声音的运动及传播
声音是空气粒子受到物体的一系列震动而引起的波动
• 空气粒子的震动表现为空间上的空气粒子压缩区与稀疏区 • 声波的传播是四面八方的,随着传播距离的增加,能量不断被耗散, 声音逐渐减弱 • 声音在空气中传播速度为340.4m/s,这么慢的速度使我们左右耳听 到的同一声音有微小差别,从而产生声音的方位感 • 液体和固体也能传播声音,一般密度越大,传播速度越快 • 声音具有波固有的反射、折射和衍射的性质,这些性质在音频处理 时需要考虑,例如:
响度:声音强度这一个物理量给人的主观感觉
• 声强越大(分贝数越高),感觉声音响度越大 • 由于人的耳朵对不同频率的声音敏感程度不同,因此, 响度感觉也和声音的频率有关
例子: • 40dB 1000Hz的纯音听起来比40dB 100Hz的纯音听起来要大得多
• 动态范围:声源所发出的声音最大音量与最小音量之间 的音量范围,通常用dB表示 • 为了度量主观声音大小,即响度的大小,我们使用方 (phon)这个单位
练习:
在audition中建立如下文件并录音听效果:
• 一个单声道文件 • 一个立体声(双声道文件)
问题:
声音在听觉上会相互掩盖么?为什么?有什 么应用价值?
声音与听觉-掩蔽效应概念
一种频率的声音阻碍听觉系统感受另一种频 率的声音的现象称为掩蔽效应
• 掩蔽声音(masking tone) • 被掩蔽声音(masked tone)
声音的叠加
纯音的三维表示法
设有一稳定的正弦波纯音,频率为500Hz,强度为50分贝, 时程为5秒,增长时间为1秒,稳定延续为2秒,衰减时间为2 秒,可用下图表示:
纯音的三维表示法
上页的图可分 解为下面3个 图: 动态平面 频谱平面 旋律平面
练习:
Generate/tones 产生纯音
声音与听觉-音色与频谱
复合信号可以通过富里叶变换分解为一系列的谐振 动叠加,并画出其个频率的及其相应强度的频谱图
问题:
声音的大小如何表示? 人的听觉对声音大小如何反应?
声音与听觉-声强
声强物理量的量測大都以儀器量得音壓量或音壓为 準(sound pressure level,簡寫為SPL) 声强單位為分貝(deci-Bell, dB),此單位是紀念電話 的發明人貝爾(Bell)
振幅决定了我们对声音强弱的感觉 频率决定了我们对声音高低的感觉
声音的属性

Amplitude (振幅/音量) Cycle (周期) Frequency (频率) Phase (相位) Measured in 360 degrees, indicates the position of a waveform in a cycle. Zero degrees is the start point,followed by 90ºat high pressure, 180ºat the halfway point, 270ºat low pressure, and 360ºat the end point. Wavelength (波长)
相关文档
最新文档