音频基础知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多媒体技术-音频基础 7
2018年10月15日星期一
声音要素(一)

响度(音响)loudness



到达人耳的声扰动振幅所产生的听觉的大小 声振动能量是物理特性,可用声强(sound pressure)定义,单位:帕斯卡 (Pa) 实用上通常都以对数方式的声压级 (sound pressure level)表示,单位:分贝(db) 响度是主观量,不能用任何仪器正确地测量 声音响度使用了以两个声强之比的对数为基 础的相对标度,单位:宋(sone)


Passive viewing (e.g. film, video, etc.) Video conferencing
多媒体技术-音频基础 2
2018年10月15日星期一
声音的概念


声音是一种机械振动状态的传播现象, 它表现为一种机械被即声波。 产生声波的条件

有作机械振动的物体:声源 有能传播机械振功的弹性介质

声波在介质中传播有一定速度,称之为 声波的传播速度(声速)
多媒体技术-音频基础 3
2018年10月15日星期一
声波示意(L. A. Rowe ) 压缩
稀薄 正弦波 幅度
时间
2018年10月15日星期一
多媒体技术-音频基础
4
声波频率

声压变化可以是周期性的和非周期性 频率概念


循环(cycle)- 压缩/稀薄过程 频率(frequency):每秒cycle数,单位
乐音与噪音




一般乐音指具有确定的基频以及与该基频有较 小整数倍关系的各阶谐频(harmonic tone) 频率比基音高的所有分音统称泛音(over tone), 泛音的频率不必与基音成整数倍关系 在主观上把令人不愉快或不需要的声音定义为 噪音 噪音的频谱较为复杂, 具有无规则的振幅和波 形的连续频谱
多媒体技术-音频基础 16
2018年10月15日星期一
存储格式(一)
用.wav为扩展名的文件格源自文库称为波形文件格式 (WAVE File Format)
RIFF:Resource Interchange File Format IBM和微软公司于1991年8月联合开发 支持存储各种采样频率和样本精度的声音数据,并 支持一定的声音数据的压缩 主要用于PC
多媒体技术-音频基础 8
2018年10月15日星期一
声音要素(二)



音调(音高)pitch或tone 人对声音刺激频率的主观判断与估量,称之为 音调 (Pitch),单位:美(Mel) Frequency是物理量,而音调是人的感觉 听觉经验

一般女生的声音比男生高 较大物体振动的音调较低
本章内容

音频的声学基础 声音的数字化 声音的存储格式 MIDI音乐 语音信号、非语音信号
2018年10月15日星期一
多媒体技术-音频基础
1
音频媒体

音频(audio)或声音(sound) 携带信息的极其重要的媒体 多媒体技术研究中的一个重要内容 与视觉媒体相比具有特殊性 不同场合下的重要性不同
类似格式
http://www.wavecn.com/_articles/AudioFormatIntro.html
2018年10月15日星期一 多媒体技术-音频基础 17
au(SUN),aiff(Apple),snd(SGI)
精品课件!
精品课件!
存储格式(二)



2018年10月15日星期一
多媒体技术-音频基础
14
声音质量等级
质量 电话 AM FM CD DAT 采样频率 (kHz) 8 11.025 22.050 44.1 48 样本精度 (bit/s) 8 8 16 16 16 单道声/立体声 单道声 单道声 立体声 立体声 立体声 数据率(未压缩) (kb/s) 64 88.2 705.6 1411.2 1536.0 频率范围 200~3400 Hz 20~15000Hz 50~7000Hz 20~20000 Hz 20~20000 Hz

人发音器官发声频率约是80~3400Hz,但人说话 的信号频率约为300~3000Hz,即话音(speech)信 号

高于20kHz的信号称为超声波 (ultrasonic) 超声波及次声波一般不能引起人听觉器官的感 觉,但可借助一些仪器设备进行观察和测量
多媒体技术-音频基础 6
2018年10月15日星期一
2018年10月15日星期一
多媒体技术-音频基础
9
声音要素(三)

音色(音质)timber 由其频谱决定

不同乐器发出同一音高的乐音,仍然可以分辨


可以把音色描述为音的瞬时横截面,即用谐音 (泛音)的数目、强度、分布和相位来描述。 泛音的强度可使音色发生变化,音色的主观特 性比响度或音调的主观特性复杂得多。
2018年10月15日星期一
多媒体技术-音频基础
10
模拟信号与数字信号



在时间和幅度上连续的信号为模拟(analog) 信号。 巴时间和幅度都用离散的数字表示的信号就称 为数字(digital)信号 采样(sampling)-时间 量化(quantization)-幅度 数字化实际上就是采样和量化
2018年10月15日星期一
多媒体技术-音频基础
15
声音质量的度量
声音质量的评价目前仍然是一个很困难 的问题,需要继续研究 声音质量的度量有两种基本的方法
客观质量度量:主要用信噪比(signal to niose ratio,SNR) 主观质量度量:主观平均判分法 对于图象等其它媒体数据的处理同样存在两 种质量度量 主客观结合?
2018年10月15日星期一
多媒体技术-音频基础
11
声音的采样和量化
两个关键参数:采样频率与量化精度
2018年10月15日星期一 多媒体技术-音频基础 12
采样频率


每秒钟需要采集多少个声音样本 根据奈奎斯特理论(Nyquist theory)和声 音信号本身的最高频率决定的

fs >= 2f 或者 Ts <= T/2

如果一个信号中的最高频率为fmax,采 样频率最低要选择2fmax
2018年10月15日星期一
多媒体技术-音频基础
13
量化精度
反映度量声音波形幅度的精度,一般用 每个声音样本的位数(bit per sample, bps)表示 常见的量化精度有:8与16 声音的质量越高,需要的存储空间越多
hertz (Hz) 周期 – cycle的持续时间 (1/frequency)


声音信号一般由许多频率不同的信号组 成,称为复合信号;而单一频率的信号 称为分量信号
多媒体技术-音频基础 5
2018年10月15日星期一
频率范围

频率小于20Hz 一般称为次声波(subsonic) 人的听觉器官能感知的声音频率范围约为 20Hz~20kHz的信号称为音频(Audio)信号
mp3/mp3 pro RealAudio(ra)/RealMedia(rm) Ogg Vorbis WMA QuickTime/QDesign Music MIDI VQF MOD
多媒体技术-音频基础 20
2018年10月15日星期一
相关文档
最新文档