数字音频知识点
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、音频信号来源:携带声音信息的机械波;通过机器合成、模拟的自然声
2、声音的两属性:
音调:频率高、音调高
响度:响度大、声音大
人耳频率20HZ~20kHZ
语音由声带振动 男声带长厚、频率低 150HZ 女 230HZ
3、人耳听觉特性:人耳判断响度,与声压级和频率有关
4、与音质有关的 听觉特效
双耳效应:双耳距离20cm,因此有时间差、强度差、相位差,能分辨位置方向(立体声)
掩蔽效应:噪音对语言的妨碍程度
低音调对高音调遮掩明显
高音调对低音调遮掩甚微
遮掩与被遮掩声,频率接近。遮掩效果越好
哈斯效应:回声的感觉规律
直达、反射声延迟超过100ms。都能感觉到回声
直达、反射声延迟超过70ms。一半人感觉到回声
直达、反射声延迟超过50ms。都能分辨出两个方向声音
直达、反射声延迟超过30ms。一般人区分不出来
直达比反射强度高10dB以上。没人感受到回声
1、数字化相比模拟化的优越性
高效编码、低存储空间
抗干扰强、便中继传输
差错控制、传输可靠性
便于加密、保密及版权
便于计算机管理
易于集成化和大规模生产
与其他系统配合使用,控制系统功能
2、PCM是 数字化 基本技术: 步骤:取样、量化、编码。
3、数字音频存储技术类别
磁存储:数字磁带录音机、硬盘录音机
光盘存储:LD、CD、DVD
半导体存储:RAM、Flash
4、数字音频传输技术:带宽要求和传播形式
带宽要求:
普通语音:频率带宽<=3.4KHZ,8KHZ取样,8bit量化,数据率64kb/s
高质量语音:频率带宽50HZ~7KHZ。压缩数据率48~64kb/s
CD-DA双声道立体声:频率带宽20KHZ,22.1KHZ取样,16bit量化,压缩数据率192kb/s
AC-3 5.1声道环绕立体声:频率带宽3KHZ~20KHZ,48KHZ取样,22bit量化,压缩数据率320kb/s
传输延时要求:网络延迟>24ms时,应消除可听见回声干扰
延时抖动要求:CD质量音频,网络延迟抖动不应超过100ms
电话质量语音,网络延迟抖动不应超过400ms
虚拟现实语音,网络延迟抖动不应超过20ms~30ms
流媒体:流式传输的媒体称为流媒体或流式媒体
流式传输方法:
顺序流式传输:顺序下载,在线观看。放在HTTP和FTP服务器上
实时流式传输:实时传送,现场直播。需要专用流媒体服务器
流媒体传输形式:点播和广播(广播分为单播和多播)
三大主流流媒体技术解决方案:RealNetworks公司的RealMedia
Microsoft公司的WindowsMedia
Apple公司的QuickTime
三、前期音频材质器材
话筒: 话筒既传声器,将机械波信号转为电信号的换能器件
录音:采用电容式和电圈式。音乐拾音:多采用电容式
音频
信号传输方式:有线话筒(平衡型-专业、三线型和非平衡型-消费、二线型)无线话筒
幻象供电:提供调音台设备的前置放大器电源的工作电压、电容电压的设备
话筒性能指标:频响特性、灵敏度、输出阻抗、最大输入声压级、指向性(全向、双向、心型、强心型、超指向)
人声拾音话筒:
演播室访谈:频响范围40KHZ~15000KHZ、心型或强心型、电容式或动圈式
室外、音乐会、体育馆:强心型或超指向型、最大输入声压级>100dB
录音棚:高音质语音拾取,大面积振动膜片话筒。
交响乐:全指向话筒
数字录音器材:磁带录音机、光盘录音机、硬盘录音机、闪存录音机、光盘录音机:CD、DVD、MD
四、数字音频制作器材
调音台功能作用:
多路输入声 电平调整
输入声 频率均衡
各路声音 混音处理
监听效果 监听系统
信号输出到不同端口 输出分配
数字音频工作站:将软硬件实现的后期音频制作功能模块,通过计算机集中控制,形成系统化、模块化,可在计算机中进行专业编辑、处理、混合、录音的系统
五、计算机音频制作系统组成
硬件:计算机、音频接口卡、话筒、数字音频录放设备、数字调音台和监听设备。
软件:音频设备驱动程序、操作系统、数字音频工具软件、数字音频应用软件
音频接口卡/盒:用于计算机系统与各种模/数音频设备、MIDI设备、监听设备传输信号用的功能模块
MIDI设备三模块:合成模块
编辑模块
输入模块
常用音频文件格式:
Wav:Microsoft与IBM开发的波形音频格式
Wma/asf/asx/wax格式:Microsoft网上流式数字音频格式
MP3:德国Fraunhofer Institut fur Integrierte Schaltungen协会开发
Rm/Ra/Rmx:英国realnetworks公司新型流式音频格式
MIDI格式:多家电子乐器公司共同开发
Wrk:Cakewalk Pro软件采用的MID存储格式
第二章
一、声音素材的拾取与数字化采制系统
1、音频采制系统组成形式
ENG方式:电子新闻采集,针对声音信息,被采访者的谈话内容,注意防风、防噪。
EFP方式:电子现场制作,受画面要求的制约,录音源也是拍摄主体
后期配音方式:对声要求较高的作品、节目后期配音
2、后期配音方式与EFP方式区别
后期配音不受拍摄画面现场条件影响。EFP受录音画面制约
后期配音对音频处理要求高
3、同步信号包括:时间码、MIDI实时信息、字时钟
4、数字音频接口标准:模拟接口(平衡式和非平衡式) 数字接口
AES/EBU:美国与欧洲录音协会定制 高级专业 数字音频接口格式
S/P DIF:索尼与飞利浦定制的民用级音频数据接口
IEEE1394:苹果的高速串行总线接口标
准。又称火线
ADAT:美国Alesis公司开发的数字音频接口
5、对音频系统的接地:
保护接地:防止触电,分为接零和接地两种
过压保护地:防雷
屏蔽地:防止电子设备的 交流和高频 产生的干扰
信号地:基准电位。同设备的信号输出、输入地不能互连,前级输出地必须和后级输入地相连。
二、录音场所
1、对室内声学组成:直达声、反射声、混响声
混响时间:混响时间仅与房室容积、内表面吸声量有关,与声源、位置无关。
适度混响时间:饱满洪亮圆润
过短混响时间:干涩无力
过长混响时间:清晰度下降,音乐缺乏节奏、力度
2、对录音场所分类:普通现场、专用录音现场
音乐录音室:自然混响音乐录音室;
可调混响音乐录音室;
自然混响加入人工混响型音乐录音室;
短混响音乐录音室;
活跃端?——寂静端型音乐录音室。
混合录音室
对白录音室特点:体积小、混响短、吸引处理均匀分散
频率与混响时间关系:低频音(125hz~250hz):0.35s
中频音(500hz~1000hz):0.4s
高频段(2000hz以上):0.45s
低频嗡声(声染色现象):房室声学看,是低频混响声叠加到直达声照成
电声角度看,器材的振荡频率叠加到音频信号。声道窜声照成
减轻声染色现象方法:增大房间吸声系数
改变声源与话筒的相对位置
降低混响时间
对自然混响音乐录音室特点:
房间容积比较大(500m3左右)
房间结果不规则
背景噪音低
声场扩散性良好
自然混响录音室使用注意问题:
混响时间及频率特性:低频(500hz以下)混响时间适当加长,中高音频保持平直
避免声饱和:增加室内声吸收
确保录音室声扩散:室内结构不规则或比例合适。吸音面、反色面布置得当
一个话筒拾取乐队声音:根据混响半径选择拾音点
短混响录音室(寂静录音室、强吸音录音室)
适应 音乐录音采用主辅话筒技术 到 多话筒技术的拾音方式变化
适应 近代录音设备,使得音质处理设备更好的创造多样化的音色
三、拾音技术
1、立体声:由于双耳效应,通过对声音的方向感、深度感、高度感还原出最佳的声场
2、如何选择话筒
选择话筒 以 性能、功能 来选择
首先,频率响应特性,电容 比 动圈话筒 带宽更宽。以声源的高低频来选择话筒
其次,灵敏度,电容 比 动圈 灵敏度高。根据环境噪音选择话筒
再次,指向性,单一指向 和 可变指向两类,动圈都是单一指向。可变指向适应性强
又次,输入声压级
,动圈 比 电容更能承受 最大输入声压级,专业话筒比一般话筒更能承受最大输入声压级。演讲、朗诵应选用最大输入声压级高的话筒
最后,输出阻抗,高阻抗 与 低阻抗两种,输出阻抗高产生静电干扰,输出阻抗低产生电磁干扰。
选择话筒 以 内部结构、功能特点 来选择
首选,声电转换 模块主要由膜版构成,面积与数量决定性能
大面积膜片:低频好、灵敏度与最大输入声压级较高——舞台拾音
小面积膜片:高频好、灵敏度与最大输入声压级较低
其次,阻抗变换器 来看,采用电子管比效应管音色更好。但体积大
再次,传输方式 来看,有线话筒移动不便,传输质量高。无线话筒移动方便,传输质量低。
最后,其他特性 ,如指向性、有无输入限幅衰减等
选择话筒 以 厂家型号 来选择
爱科技(AKG) 奥地利
拜亚动力(Beyer Dynamic) 德国
铁三角(Audiio-Technica) 日本
舒尔(Shure) 美国
3、话筒使用注意问题
离轴染色效应和近区效应
避免过载(输入、输出)
阻抗匹配
音频信号通路中的相位
传输线缆的屏蔽
防振、防风
4、对单话筒拾音、双声道立体声拾音 以及 多话筒拾音
单话筒拾音:
话筒放置位置应考虑:
话筒与声源位置,分为近、中、远距离拾音;两者相对高度,相对方位
近、中、远距离的拾音方式:
近距离拾音:1~5cm,低语调主持人和通俗唱法
中距离拾音:5~10cm,中音主持人和名族唱法
远距离拾音:10~20cm,美声唱法
录音场所声学特性
声源的声学特性和活动情况
双声道立体声拾音:
假头制立体声拾音技术(双耳效应)
AB制式立体声拾音技术
XY制式立体声拾音技术
MS制式立体声拾音技术
多话筒拾音:
主辅话筒录音技术:主话筒决定了作品的音质,辅话筒弥补主话筒不足
适用:声源总体的音色、声场都良好的实时录音
多话筒拾音技术:采用多话筒,不分主次独立设置,一般采用近距离拾音
四、调音技术
调音:拾音、录音设备间的功能模块,用于信号的 输入、放大和混合
电平控制(音量控制):输入分量电平控制、混音后总电平控制、监测电平控制
频响控制:控制音频信号的频率响应。分 粗调 和 细调
不同拾音方式的频响控制方法:
近距离拾音:音色纯净、清晰,具真实感和亲切感。
对100Hz频段:衰减3dB~6dB
200Hz~300Hz频段:提升3dB~6dB 这是语音的基本音域。
1kHz~2KHz频段:提升3dB~6dB 增加音色透明度、清晰度。
8kHz以上频段:衰减3dB 减少高频噪音。
中距离
拾音:声音轻松、活泼、开朗、爽快;发声清晰、明亮、纯净。
对100Hz频段:不提升也不衰减 因为没有近讲效应
256Hz~300Hz频段:提升3dB~6dB 增加基本音的力度。
1kHz~2KHz频段:提升3dB 使音色清透、明亮。
10kHz以上频段:提升3dB 增加音色的表现力,提高音的解析力
远距离拾音:
对低频段:提升3dB 增加音色的丰满度和浑厚度。
256Hz~315Hz频段:提升3dB~6dB 增加基本音力度。
1kHz~2KHz频段:提升3dB~6dB 使音色明亮度。
10kHz以上频段:提升3dB~6dB 增加音色的高频泛音表现力,提高音色的解析力。
语音频响控制方法:
频谱曲线:音色各泛音 幅度 顶点 的连线
调音台的四段均衡器的频率特性:
6KHZ~16KHZ的高频段,决定音色的表现力、解析力
600HZ~6KHZ的中高频段,决定音色的明亮度、清晰度
200HZ~6KHZ的中低频段,决定音色的力度和结实度
20HZ~200HZ的低频段,决定音色的混厚度和丰满度
语音的四段均衡器频率特性
高频: 低,韵味失落。 强,噪音
中高频:低,暗淡朦胧。 强,呆板
中低频:低,空虚无力。 强,生硬
低频: 低,苍白单薄。 强,浑浊
歌声频响控制方法:
对男音色频率调节:基音频率64Hz~523Hz左右
64Hz~100Hz 作小提升 增加浑厚感
250Hz~330Hz 作大提升 提升男基音力度
1kHz左右 作小提升 保证泛音表现,增加声音明亮度
严重鼻音处理
64hz~100hz 大衰减,消除严重鼻音频带
100hz~200hz 衰减,消除鼻音哼声
250hz~330hz 略提升,增强语音力度
3.3khz左右 大提升,增强明亮度、清晰度
10khz 小提升,增加高频泛音表现
对女音色频率调节:基音频率在160Hz~1.2kHz左右
160Hz以上 不作提升 频率低于女声音域
250Hz~523Hz 不作提升 女声主音域
1kHz~3kHz 提升 保证泛音表现,增加声音明亮度
10kHz 小提升 保证音色表现力
窄音域歌手处理:高音很窄,声音单薄、刺耳、缺乏深度
250Hz~330Hz 较大提升 提升基音,增加音色浑厚度
1kHz 不提升 减少音色刺耳的中高频成分
4kHz 较大衰减 消除尖噪声的高频噪声
10kHz 最大衰减 消除声带产生不纯的高频噪音
五、录音技术
录音技术概况
录制方式:ENG录音(电子新闻采集)、EFP录音(电子现场制作)、后期录音
存储媒体:磁带、光盘、硬盘、闪存
录音轨道:单轨、多轨
ENG录音:用机带话筒 将声音 记录在录像带 是最常用的ENG录音
EFP录音:基于 多轨录音机、音频工作站 的EFP录音系统
EFP录音注意:系统技术 可靠性和技术质量
现场音响反馈声控制
听觉激励器 提高EFP音质
避免“漏录”“少录”
各声部均衡
修饰缺陷声源
六、监听时注意的技术问题
监听扬声器要真实
为了效果,一般监听声级开较高,所以监听功放和扬声器的功率较大
为了监听各声部细节,监听扬声器的瞬态特性应十分优越
第三章
一、SoundForge(声音熔炉)
1、界面、功能
界面:标题框、主菜单条、工作区、标准工具条
播放条:录音、整体播放、暂停、停止、开始位置、向前、向后、终点位置
概观条:无论波形多长,光标始终显示播放时间状态
选择的波形所对应的概观条区域会变成深色区,也可在概观条内直接选择
概观条任意右击,则从该处开始播放
2、编辑操作
录音:注意不要溢出,也不可太小。峰值越接近0越好
选择波形、复制、移动、删除、静音(Mute)、混合(Mixing)、插入空白段(Insert Silence)、音量编辑、音量的连续编辑
3、效果器使用:
频率均衡处理方式:Graphic EQ、Paragraphic EQ、Parametric EQ
混响(Reverb):模拟各种空间效果。
合唱(Chorus):声音丰满,改善音效。
动态:压缩(Compressor)、限制(Limiter)和扩展(Expander)、门(Gate)、话筒(Multi-band dynas)
升降调(Pitch-Shift)
反转(Reverse):反相
时间压缩/扩展(Time Compress/Expand):进行声音与画面时值长度的调整。
直流消除噪声(DC Offset)
频谱分析(spectrum Analysis):
二、Samplitude——多轨录音/混音/母盘处理
1、录音:
录制单一音轨:
点击工具栏录音按钮
选择44.1kHz,16位,设置存放路径
激活“Monitor”观察电平
激活录音音轨
按Record键录音
录完按保存
录制多轨:用一台ADAT的8音轨 通过 光纤一次录入
点击每条音轨“?”
设置录音端口、存放位置、格式
按OK键:设置好8音轨,激活录音
按下工具栏上的多轨录音
同步录音:将声音一轨一轨录成音频
按G键
选择MIDI Clock或MTC同步格式和主从,通常硬件作主
设置好SMPTE类型,通常30Frames/s nd格式,否则无法同步
2、Samplitude调音台使用:全实时效果
功能按钮:Aux(Aux的发送值)、Delay(延迟)、Dyn(压缩器)、三段能数EQ、Pan(声像)、Mute(静音)、Solo(独奏)、Auto(自动混音)
优点:在编辑时,不必担心更改源文件
虚拟编辑速度快
编辑时,调整实时进行
三、Cool Edit Pro
CE可管理64音轨,但只同时录入2音轨
1、音频特效处理
振幅处理(Amplify):改变被选波形的振幅大、小
合唱效果、回声效果、三维回声效果、镶边效果、完全混响、前期反
射、
多重延时:相当于延时、回声、滤波、和混响的集合。
变化的相位、FFT滤波器、快速滤波器、科学记数法的滤波器、
图形均衡器:10段图示均衡器,每个相邻频段音高相差一个8度音。
降低噪声、消波修复、消除咝声、降噪、特殊处理。
2、消除背景噪音
导入音频,选一段纯噪音波形
运行菜单“噪音消除”-“降噪器”选项,点击“噪声取样”,关闭
全选波形,“噪音消除”-“降噪器”用取样噪音去噪,调整后确定退出
3、消除短暂杂音(爆音、噼啪音)
菜单“噪音消除”-“杂音选项”
设置“灵敏度”“鉴别率”
点击“自动查找所有电平”
4、消除人声中的喷音和气声
CE自带6个均衡器,菜单转换处理的滤波器的6个菜单,每项对应一个,其中就有消除喷声
5、音量与淡出、淡入
6、变调和调速
普及型音频采集、处理软件
1、Windows录音机
双击Windows音量图标,打开录音控制台
Windows录音控制台也可切换为音量控制台
话筒输入:灵敏度高,一点噪声都可察觉
Line In输入:用于接受模拟信号(电视、录音机、收音机)
2、对GOLDWAVE软件:
开启播放按钮有两类:普通播放按钮和自定义播放按钮
插入指定时间点:粘贴到
界面:菜单栏、工具栏、波形窗口、信息栏
第四章
一、MIDI制作基础
1、乐音概念
声音由发声体振动而成,规矩振动规律,可分为 乐音和噪音
音的四性质: 音高:声波 基频,振动频率决定——音符号
音值:发声时间长短,发声体振动 持续时间 决定
音色:由频谱决定,各谐波 比例 不同,随时间 衰减程度不同,音色就不同——不用乐器,程序变换
音强:振幅大小决定——力度
MIDI信息包括: 音符号:1表示1个半音
力度、时值
2、乐器分为原生乐器:钢琴、单簧管、传统乐器
电声乐器:电子琴、电钢琴、电吉他
3、MIDI文件:包括 音符、定时、16个通道、256个音轨
每个通道的音符信息:键、通道号、音长、音量和力度
通道MIDI可为16个通道提供数据,每个通道访问独立逻辑合成器
MIDI事件:发声在 所在 时间段、音轨
颗粒刻:MIDI设备取样“等分”表示音质
PPQ:每四分音符包含颗粒刻数量叫做PPQ或TPQN
音轨:用通道把MIDI数据分单独组、并行组
4、MIDI标准:一种程序交换标准,规定了交换值与音色序号对应关系,音色需要与声音名称对饮关系等
常用MIDI标准:GM、XG
5、MIDI音乐设备:
首先了解所需乐器功能、作用,根据需要和能力,合理配置设备
设备包括:合成器、音源、舞曲编辑机、音序器、硬盘录音机、
信号处理器、采样器、数字音频工作站、调音台、MIDI控制器、数字音乐演奏中心
音序器:也称编曲机,把MIDI键盘的MIDI信号分轨记录,供作曲者编辑
二、Cakewalk
1、Cakewalk9.0中最多256音轨,最多16通道。
2、音色(Patch):GM标准音色库,128种音色。
3、平衡(Pan):也叫“声像”,表示声音的左右方向,缺省参“64”即中间位置(0—127)。
5、M/S/R:MUTE(静音)、SOLO(独奏)、ARM(录音)
6、转调(Key+):实时改变音调,取值范围(-127~+127)。1为一个半音
7、力度(Vel+):改变音符的基础力度。(-127~+127)
8、通道(Chn):可以合不同的音轨设置不同的通道,要改变音色就必须改变通道(1~16)。
9、端口(Port):可以选择播放该音轨时所使用的输出设备。
10、源(Source):选择录音时的输入设备。
11、效果(Effects):为当前操作的音轨实时添加各种不同的效果。
12、时间(Time+):使音轨提前或延迟发声。
13、音色库(Bank):对MIDI表现起着非常重要的作用。
14、大小(Size):指MIDI或音频事件的总数。
CAKEWALK制作MIDI过程:
主旋律声部的输入与编辑:新建MIDI文件,设置拍号和调号,乐曲速度,第一音轨为主旋律音轨,并定为铁道1,同时进行该音轨的其他参数设定,最后主旋律的录入与修改。
和弦声部的输入与编辑。将第二音轨设为和声音轨,定为通道2,进行音轨参数设定,进行和弦声部的录入与编辑,方法同主旋律的声部。
低音声部的输入与编辑。将第三音轨设为低音声部,定为通道3,设定好低音声部的音轨及其参数,进行低音声部的录入与编辑。
打击声部的输入与编辑。将第四音轨设为打击声部,定为通道10,设定音轨参数并进行打击声部输入与编辑,输入完毕应对其力度进行修饰,编辑与修改在钢琴卷帘窗进行。
乐曲的整体调整。包括对各音轨调整音量、调整平衡、添加效果和调整乐曲速度。
存盘退出。
三、 Soner
通过软件合成器音色库,可把MIDI转成WAV文件。
第五章 数字音频素材运用
一、音频运用的艺术原理
1、媒体:表示和传递信息的载体或工具
2、媒体分类:感觉、表示、显示、存储、传输
3、计算机多媒体:计算机技术为基础的数字化多媒体,具有 集成性、交互性和控制性
4、多媒体基本构成:文本、静图、动画、声音、视频
5、三种音频素材:音乐、音响和有声语言
6、数字音频促进影视声艺术发展
1、音序软件促进影视制作人员提高音乐素养:
有效提高音乐欣赏水平
学习音乐基础知识、技能的工具
有助提高音乐创作能力
2、数字音频技术促进影视声音
艺术发展:
利于影视前期音乐创作
利于影视后期声音制作
3、数字音频工作站可进行 多轨目视编辑,其 图形化编辑和混音界面 方便编辑人员
4、数字音频工作站实现声音 无损复制,特效处理
7、多媒体软件常见 信息组织结构:线形结构、树状结构、网状结构、复合机构
8、数字音频信息在多媒体软件中运用的 功能形式:引人注意式、背景陪衬式、教学内容式、音频协作式、反馈式
二、素材运用技术问题
1、Premiere:不支持MIDI
2、PowerPoint导入音频方式:链接和嵌入。支持MIDI
3、Authorware音频导入、编辑方法:一般音频格式、MIDI音频格式
4、Dreamweaver音频导入、编辑方法:嵌入、链接、使用“行为编辑器”
5、Flash支持wav、ma3
Flash支持的两种音频类型:事件音频:下载后播放
流式音频:边下边播
三、格式转换
1、CDA转WAV、MP3:用抓轨软件(EAC、超级解霸)
2、WAV转MIDI:AmazingMidi
3、MIDI转WAV:Samplitude、Cakewalk
4、WAV转MP3:CoolEdit、Sound Forge、Samplitude
5、WAV、MP3转WMA:CoolEdit、Sound Forge