音频信息的获取和处理优秀课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
音色:与波形相关,取决于声波的频谱,即由混入基音中的泛 音决定,一个声波上的谐波越丰富,音色越好。
音强:即声音的响亮程度,与声音信号的幅度成正比。 用声音信号的幅度取对数后再乘20所得值来描述声强,以 分贝(dB)为单位,此时称为音量,振幅高时音强强,振
幅低时音强弱。
2.1声音与听觉(6)
2.1声音与听觉(7)
Sampling, Quantization, Coding 采样频率与量化精度
2.2声音信号数字化(5)
数字声音波形质量的主要技术参数
采样频率
等于波形被等分的份数,份数越多,质量越好
▪ 11.025KHZ、 22.05KHZ、44.1KHZ
采样精度
每次采样信息量
▪ 8位、16位
声道数
声音分类
语音:人的说话声虽是一种特殊的媒体,但也是一种 波形,所以和波形声音的文件格式相同。
音乐:规范的符号化了的声音,乐谱可转变为符号媒 体形式。
音效:指人类熟悉的其他声音,如动物发声、机器产 生的声音、自然界的风雨雷电等。
2.1声音与听觉(3)
带宽与听觉
音频是指人类听觉所感知范围内的频率,也称声 频。
2.1声音与听觉(9)
3、相位 声音的加强与抵消(同相和反相)
从声音的波形来看,声音的起点和方向也要反映 声音的特性,这就是声音的相位。
当两个声音相同相位完全相反时,它们将相互抵 消;当两个声音相同而且相位也相同时,声音就会得到 加强。
声音的波形相位对于多声道系统的设计非常重要, 应用于回声的消除、会议系统的声音设计等。
T为抽样周期,1/T抽样频率 此过程成为声音信号的采样
数字信号:把抽样序列x(nT)量化成一个有限个幅 度的集合X(nT),此过程为模拟信号的量化过程。 将量化后的离散信号的进行二进制编码,即以二进 制编码来表示离散值的幅度,这种二进制编码信号 叫做数字信号,
幅度
2.2声音信号数字化(2)
1010 1001 1000 0111 0110 0101 0100 0011 0010 0001
根据该定理,只要采样频率高于信号中最高频率的两倍,就可 以从采样中完全恢复原始信号的波形。因为人耳所能听到的频率 范围为20Hz到20KHz,所以实际的采样过程中,为了达到好的效 果,就采用44.1KHz作为高质量声音的采样频率。如果达不到这么 高的频率,声音恢复的效果就会差一些,例如电话声音的质量等。 一般来说,声音恢复和采样频率、信道带宽都有关。
意义:多媒体系统的声音再现
2.1声音与听觉(8)
2、掩蔽
声音的响度同时也受到其他同时出现的声音的影 响,各种声音可能相互掩蔽。如:开会场景。
各种声音可以互相掩蔽,也就是说一种声音的出 现可能使得另一种声音难于听清。例如,本来是多种 频率的声音的复合,但听众以为是另一种声音。 声音的掩蔽效果可以欺骗人的听觉,可用于声音的压 缩。
00000 1 2 3 4 5 6 7 8 9 1011121314151617
时间
图 模拟信号、离散信号及数字信号
1、用连续变化的曲线表示模拟信号; 2、用圆点表示以相等时间间隔取值而得到的离散信号; 3、纵坐标上标的是幅度的二进制编码值。
2.2声音信号数字化(3)
2.2声音信号数字化(4)
2. 声音数字化:
2.2声音信号数字化(7)
采样频率与声音的质量关系最为紧密。采样频率越高, 声音质量越接近原始声音,所需的存储量便越多。标准 的采样频率有三个:44.1KHz,22.05kHz,和11.025kHz。
2.1声音与听觉(10)
声音的心理模拟 通过人工真实的方法,可以对视觉空间的景物进行再
造或虚构,同样也可以对听觉空间的声音进行心理的模拟, 这就是所谓的可听化(audiolization)。用声音可以表达出 一些声音的效果。
2.2声音信号数字化(1)
1.从模拟信号到数字信号
模拟信号:在时间与幅度上都连续,记为x(t). 离散信号:按一定的时间间隔T采样,得到的x(nT).
ห้องสมุดไป่ตู้频带
10 20 50
CD-DA FM广播 AM广播
电话
200
3.4k
7k 15k 20k
f(Hz)
2.1声音与听觉(5)
模拟声音信号:可分解成一系列正弦波的线性叠加。
最低频的音波称为基音,频率为基频 其余的为泛音(或称谐音),频率是基频的整数倍
声音三要素:音高、音色、音强
音调:由基频决定,基频取对数后与人的音调感觉成线形关系, 基频的频率高则音调高,频率低则音调低。音调高时声音尖锐, 俗称高音;音调低时声音沉闷,俗称低音。
数据量计算: (采样频率×采样精度×通道数 ×时间 )/8 字节
声音产生的波形数,如多种语言音频混存时,需要多声
道
单声道、立体声道、5.1声道
2.2声音信号数字化(6)
3.采样频率
奈奎斯特理论(Nyquist)定理(1928年提出原理,仙侬形成 定理并应用,1933年卡切尼科夫用公式表述): 采样频率≥2f 这里f为被采样信号的最高频率。
音频信息的获取和处理
2.1声音与听觉(1)
声音:通过空气传播的一种连续的波,又称声波。由空 气振动引起耳膜的振动,由人耳所感知。
声音的度量:频率与幅度(声波压力的大小)
频率用音高表示,幅度用声强表示 与看得见的水波类似
2.1声音与听觉(2)
声音被分为无规则的噪音和有规则的音频信号;有规则音 频信号是一种连续变化、周期性的模拟信号,可用一条连 续的曲线来表示,称为声波。
次声波(subsonic):频率低于20Hz的信号。 超声波(ultrasonic):频率高于20KHz的信号。 音频(Audio) :频率范围是20Hz~20KHz的声
音信号。是人耳能听到的声音信号,次声波和 超声波之间的音。 音频为可听声波,即属于多媒体音频信息范畴。
2.1声音与听觉(4)
强度
听觉特性
1、等响曲线
频率
响度与频率和强度有关,同一响度的声音可以在频率上和强度 上有很大的差别。
先设一个音为标准音,给予固定的频率、强度和持续时间,例 如1000Hz、40分贝、持续0.5秒;再给一个音也持续0.5秒,但 频率不同,通过调整使其响度听起来一样,得到的这样一组曲线称 之为等响曲线。
音强:即声音的响亮程度,与声音信号的幅度成正比。 用声音信号的幅度取对数后再乘20所得值来描述声强,以 分贝(dB)为单位,此时称为音量,振幅高时音强强,振
幅低时音强弱。
2.1声音与听觉(6)
2.1声音与听觉(7)
Sampling, Quantization, Coding 采样频率与量化精度
2.2声音信号数字化(5)
数字声音波形质量的主要技术参数
采样频率
等于波形被等分的份数,份数越多,质量越好
▪ 11.025KHZ、 22.05KHZ、44.1KHZ
采样精度
每次采样信息量
▪ 8位、16位
声道数
声音分类
语音:人的说话声虽是一种特殊的媒体,但也是一种 波形,所以和波形声音的文件格式相同。
音乐:规范的符号化了的声音,乐谱可转变为符号媒 体形式。
音效:指人类熟悉的其他声音,如动物发声、机器产 生的声音、自然界的风雨雷电等。
2.1声音与听觉(3)
带宽与听觉
音频是指人类听觉所感知范围内的频率,也称声 频。
2.1声音与听觉(9)
3、相位 声音的加强与抵消(同相和反相)
从声音的波形来看,声音的起点和方向也要反映 声音的特性,这就是声音的相位。
当两个声音相同相位完全相反时,它们将相互抵 消;当两个声音相同而且相位也相同时,声音就会得到 加强。
声音的波形相位对于多声道系统的设计非常重要, 应用于回声的消除、会议系统的声音设计等。
T为抽样周期,1/T抽样频率 此过程成为声音信号的采样
数字信号:把抽样序列x(nT)量化成一个有限个幅 度的集合X(nT),此过程为模拟信号的量化过程。 将量化后的离散信号的进行二进制编码,即以二进 制编码来表示离散值的幅度,这种二进制编码信号 叫做数字信号,
幅度
2.2声音信号数字化(2)
1010 1001 1000 0111 0110 0101 0100 0011 0010 0001
根据该定理,只要采样频率高于信号中最高频率的两倍,就可 以从采样中完全恢复原始信号的波形。因为人耳所能听到的频率 范围为20Hz到20KHz,所以实际的采样过程中,为了达到好的效 果,就采用44.1KHz作为高质量声音的采样频率。如果达不到这么 高的频率,声音恢复的效果就会差一些,例如电话声音的质量等。 一般来说,声音恢复和采样频率、信道带宽都有关。
意义:多媒体系统的声音再现
2.1声音与听觉(8)
2、掩蔽
声音的响度同时也受到其他同时出现的声音的影 响,各种声音可能相互掩蔽。如:开会场景。
各种声音可以互相掩蔽,也就是说一种声音的出 现可能使得另一种声音难于听清。例如,本来是多种 频率的声音的复合,但听众以为是另一种声音。 声音的掩蔽效果可以欺骗人的听觉,可用于声音的压 缩。
00000 1 2 3 4 5 6 7 8 9 1011121314151617
时间
图 模拟信号、离散信号及数字信号
1、用连续变化的曲线表示模拟信号; 2、用圆点表示以相等时间间隔取值而得到的离散信号; 3、纵坐标上标的是幅度的二进制编码值。
2.2声音信号数字化(3)
2.2声音信号数字化(4)
2. 声音数字化:
2.2声音信号数字化(7)
采样频率与声音的质量关系最为紧密。采样频率越高, 声音质量越接近原始声音,所需的存储量便越多。标准 的采样频率有三个:44.1KHz,22.05kHz,和11.025kHz。
2.1声音与听觉(10)
声音的心理模拟 通过人工真实的方法,可以对视觉空间的景物进行再
造或虚构,同样也可以对听觉空间的声音进行心理的模拟, 这就是所谓的可听化(audiolization)。用声音可以表达出 一些声音的效果。
2.2声音信号数字化(1)
1.从模拟信号到数字信号
模拟信号:在时间与幅度上都连续,记为x(t). 离散信号:按一定的时间间隔T采样,得到的x(nT).
ห้องสมุดไป่ตู้频带
10 20 50
CD-DA FM广播 AM广播
电话
200
3.4k
7k 15k 20k
f(Hz)
2.1声音与听觉(5)
模拟声音信号:可分解成一系列正弦波的线性叠加。
最低频的音波称为基音,频率为基频 其余的为泛音(或称谐音),频率是基频的整数倍
声音三要素:音高、音色、音强
音调:由基频决定,基频取对数后与人的音调感觉成线形关系, 基频的频率高则音调高,频率低则音调低。音调高时声音尖锐, 俗称高音;音调低时声音沉闷,俗称低音。
数据量计算: (采样频率×采样精度×通道数 ×时间 )/8 字节
声音产生的波形数,如多种语言音频混存时,需要多声
道
单声道、立体声道、5.1声道
2.2声音信号数字化(6)
3.采样频率
奈奎斯特理论(Nyquist)定理(1928年提出原理,仙侬形成 定理并应用,1933年卡切尼科夫用公式表述): 采样频率≥2f 这里f为被采样信号的最高频率。
音频信息的获取和处理
2.1声音与听觉(1)
声音:通过空气传播的一种连续的波,又称声波。由空 气振动引起耳膜的振动,由人耳所感知。
声音的度量:频率与幅度(声波压力的大小)
频率用音高表示,幅度用声强表示 与看得见的水波类似
2.1声音与听觉(2)
声音被分为无规则的噪音和有规则的音频信号;有规则音 频信号是一种连续变化、周期性的模拟信号,可用一条连 续的曲线来表示,称为声波。
次声波(subsonic):频率低于20Hz的信号。 超声波(ultrasonic):频率高于20KHz的信号。 音频(Audio) :频率范围是20Hz~20KHz的声
音信号。是人耳能听到的声音信号,次声波和 超声波之间的音。 音频为可听声波,即属于多媒体音频信息范畴。
2.1声音与听觉(4)
强度
听觉特性
1、等响曲线
频率
响度与频率和强度有关,同一响度的声音可以在频率上和强度 上有很大的差别。
先设一个音为标准音,给予固定的频率、强度和持续时间,例 如1000Hz、40分贝、持续0.5秒;再给一个音也持续0.5秒,但 频率不同,通过调整使其响度听起来一样,得到的这样一组曲线称 之为等响曲线。