音频信息处理 ppt课件
合集下载
第三章多媒体音频信息处理
一、音频信号的分类
音频信号可分为两类:
❖ 语音信号:语音是语言的物质载体,它包含了 丰富的语言内涵,是人类进行信息交流所特有 的形式。
❖ 非语音信号:主要包括音乐和自然界存在的其他 声音形式。非语音信号的特点是不含复杂的语义 和语法信息,其信息量低,识别简单。
二、音频信号的形式
声音可用一条连续的曲线来表示。这条连 续的曲线无论多么复杂,都可分解成一系列正 炫波的线性叠加,称为声波。因声波是在时间 上和幅度上都连续变化的量,因此称之为模拟 量。模拟信号有两个重要参数:频率和幅度。
1996.3 1992.9 1996.3
音频编码标准和算法
编码 类型
波形 编码
参数 编码
混合
算法
PCM
μ(A)
APCM DPCM
ADPCM
SBADPCM
LPC
CELPC VSELP RPECELP
名称 均匀量化
μ(A) 自适应量化 差值量化 自适应差值量化
子带一自适应差值量化
线性预测编码 码激励LPC
①高压缩比,存储空间小。 ②适合网络播放。 ③音质不是很好。 ④专用播放器Realplayer、
超级解霸2001以上的版本等
➢ AIFF格式文件
AIF是音频交换文件格式(Audio Interchange File Format)的英文缩写,是苹果计算机公司开发的一 种声音文件格式。
七、声卡
虽然PC声卡是在20世纪90年代才得以普及,但 它的问世却是在1984年。英国的ADLIB公司是目前公 认的“声卡之父”,虽然他们最初开发的产品只能提供 简单的声音效果,并且无法处理音频信号,但在当时 无疑已经是一个很大的突破。由于技术不够成熟,成 本又非常昂贵,因此这类带有试验品性质的早期ADLIB 音乐卡,因在当时计算机的运算速度还不足以应付大 规模的多媒体处理,所以未能普及。
多媒体技术之音频信息的获取与处理PPT课件( 75张)
则可由 x(nT) 完全确定 x(t)。 当 fN = 1/(2T) 时,称 fN 为奈奎斯特频率
常用音频采样率:8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的,为把 x(nT) 存入计 算机,就必须将采样值离散化,即量化成一个有限个幅度值的集合 x(nT)
多媒体技术及其应用
第二章 音频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
实时性 声音具有实时性。对处理声音的计算机硬件和软件提出很高要求
2.2 数字化音频
转换
模拟信号
数字信号
音频数字化需要考虑的问题
采样、量化、编码
模 拟 信 号 的 数 字 化 过 程
100101100011101
音频信号处理过程流程
音
频采
开信 样
始
号 频
频 率
率
采 样
量 化
保 存 为 声 音 文 件
周期
用声音录制软件记录的英文单词“Hello”的语音 实际波形
2.1.2 声音特点
● 声音的传播方式
声音是依靠介质 ( 比如:空气、液体、固体 ) 的振动进行传播的 声源是一个振荡源,它使周围介质产生振动,并以波的形式传播 人耳感觉到这种传播过来的振动,反映到大脑,就意味听到声音 声音在不同的介质中传播,其传播速度和衰减速率都是不一样的
常用音频采样率:8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的,为把 x(nT) 存入计 算机,就必须将采样值离散化,即量化成一个有限个幅度值的集合 x(nT)
多媒体技术及其应用
第二章 音频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
实时性 声音具有实时性。对处理声音的计算机硬件和软件提出很高要求
2.2 数字化音频
转换
模拟信号
数字信号
音频数字化需要考虑的问题
采样、量化、编码
模 拟 信 号 的 数 字 化 过 程
100101100011101
音频信号处理过程流程
音
频采
开信 样
始
号 频
频 率
率
采 样
量 化
保 存 为 声 音 文 件
周期
用声音录制软件记录的英文单词“Hello”的语音 实际波形
2.1.2 声音特点
● 声音的传播方式
声音是依靠介质 ( 比如:空气、液体、固体 ) 的振动进行传播的 声源是一个振荡源,它使周围介质产生振动,并以波的形式传播 人耳感觉到这种传播过来的振动,反映到大脑,就意味听到声音 声音在不同的介质中传播,其传播速度和衰减速率都是不一样的
多媒体技术数字音频基础PPT课件
– 音调(在音乐上音调叫音高)人耳对声音调子高 低的主观感觉取决于声音频率,频率越高,音调 也越高,音调与频率成对数关系,频率增加一倍, 增加一个倍频程,音乐上叫提高了八度
– 音色 由声音的波形或它的频谱结构决定,它是个 复杂感觉,无法定量表示
6
信号的获取
话 筒 放 大
滤 波
采 样 保 持 A /D
接 口 微 机
采 样 脉 冲
• 获取法:利用声音获取硬件得到声源发生的声 音
• 合成法:通过一种专门定义的语音去驱动一台
预制的语音或音乐合成器。
• 多媒体计算机中三类声音:
①语音②音乐③效果声(sound effects)如刮风、下雨
等
7
音频信号的处理
A/D转换后进行数据压缩
存储或传输
硬件(DSP)
采样与混叠
思考题:设音频信号的高频截至频率为7KHz, 抽样频率为6KHz,
问:0.5KHz信号中混有哪些频率的信号?
0 1 2 3 4 5 6 7 KHz 21
抽样与混叠
思考题:设音频信号的高频截至频率为7KHz, 抽样频率为6KHz,
问:0.5KHz信号中混有哪些频率的信号?
0 1 2 3 4 5 6 7 KHz 22
称之为抽样。该时间间隔称为抽样周期(其倒数
称为采样频率)。
13
音频数字化
14
2.1 数字音频基础
1、数字化音频的获取与处理基本概念 2、模拟音频与数字音频的区别 3、数字音频采样和量化的基本原理 4、数字音频的文件格式 5、音频信号的特点。
采样
采样——将连续的声波信号x(t)按一定的 时间间隔(T)取值,得到离散的信号序 列x(nT)
T——采样周期 1/T——采样频率 x(nT)——离散信号序列
– 音色 由声音的波形或它的频谱结构决定,它是个 复杂感觉,无法定量表示
6
信号的获取
话 筒 放 大
滤 波
采 样 保 持 A /D
接 口 微 机
采 样 脉 冲
• 获取法:利用声音获取硬件得到声源发生的声 音
• 合成法:通过一种专门定义的语音去驱动一台
预制的语音或音乐合成器。
• 多媒体计算机中三类声音:
①语音②音乐③效果声(sound effects)如刮风、下雨
等
7
音频信号的处理
A/D转换后进行数据压缩
存储或传输
硬件(DSP)
采样与混叠
思考题:设音频信号的高频截至频率为7KHz, 抽样频率为6KHz,
问:0.5KHz信号中混有哪些频率的信号?
0 1 2 3 4 5 6 7 KHz 21
抽样与混叠
思考题:设音频信号的高频截至频率为7KHz, 抽样频率为6KHz,
问:0.5KHz信号中混有哪些频率的信号?
0 1 2 3 4 5 6 7 KHz 22
称之为抽样。该时间间隔称为抽样周期(其倒数
称为采样频率)。
13
音频数字化
14
2.1 数字音频基础
1、数字化音频的获取与处理基本概念 2、模拟音频与数字音频的区别 3、数字音频采样和量化的基本原理 4、数字音频的文件格式 5、音频信号的特点。
采样
采样——将连续的声波信号x(t)按一定的 时间间隔(T)取值,得到离散的信号序 列x(nT)
T——采样周期 1/T——采样频率 x(nT)——离散信号序列
声音处理精品PPT课件
要求
采样频率
数据长度
11,025 Hz
8 bit
22,050 Hz
8 bit
11,025 Hz
8 bit
11,025 Hz
8 bit
22,050 Hz
8 bit
44,100 Hz
16 bit
教学进程
3.3.1 数字音频处理软件GoldWave
● GoldWave —— 免费共享软件,配有汉化补丁
● GoldWave的主要功能
教学进程
● 声音的声道
单声道 立体声
8.1.2 声音的音质、数据量与文件
● 音质——声音的质量。与频率范围成正比,频率范围越宽音质越好
● 数据量与文件 采样频率 Hz 11,025 22,050 44,100 11,025 22,050 44,100
数据长度 bit 8 8 8 16 16 16
● MP3 (MPEG音频压缩标准)压缩音频文件 .mp3
必须经过解压缩,数据量小
教学进程
3.2 怎样得到数字化声音
● 声音采样 —— 把声音按照固定的时间间隔,转换成由有限个数字 表示的离散序列
声音采样
11011100 11001101
● 采样频率 —— 在一定的时间间隔内采集的样本数量 (采样频率越高,音质越好,数据量也越大)
新开始
(10) 选择“文件/另存为”菜单,保存文件
教学进程
3.3 声音处理初步
● 声音处理主要手段
剪裁声音片段、合成多段声音、连接声音、 生成淡入淡出效果、响度控制、调整音频特性等
● 声音应用领域
应用场合
国际互联网 (语音、简单乐曲) 游戏 (效果音、效果音乐) 多媒体自学读物 (提示音) 电子教案 (语音、效果音) 多媒体宝典、大全 (乐曲、语音) 多媒体音乐鉴赏 (音乐、解说)
第3章 音频信息处理技术
即将量化后的数字,按一定的数据格式进行(压缩) 表示,这个过程称作编码。编码的作用。
第3章
音频信息处理技术
经过上述过程就可以得到一个用来表示声音强弱的数据 序列(如下图所示)。这个数据序列就是声音信号的数字化文
件。重新播放这个数字化文件,就可以听到原来的声音信号。
图3-6 声音信号的数字化序列
第3章
产生波形,然后通过声音发生器送往扬声器播放出来。 下面简单介绍Cakewalk的使用(安装Cakewalk,并演示)
第3章
音频信息处理技术
二、MIDI音乐合成
由上可知,计算机要想播放MIDI音乐文件,必须使用
合成器。合成MIDI乐音的方法很多,最主要的是FM合成法
和波表合成法。
1、FM合成法(调频合成法)
注:此“录音机”只能录制1分钟以内的声音,若要录制长度超过1 分钟的声音,就需要选择功能更强大的音频处理软件,如Cool Edit或随 卡赠送的录音软件等。
第3章
音频信息处理技术
用Cool Edit软件录制声音的方法如下:
(1) 将麦克风插入声卡的MIC
(2) 启动“Cool Edit”软件(假定Cool Edit已安装好) (3) 在“Cool Edit”窗口中选择“文件/新建”选项 (4) 单击“ (5) 单击“ ”按钮,开始录音 ”按钮,停止录音
第3章
音频信息处理技术
用Windows中提供的“录音机”录制声音的步骤如下: (1) 将麦克风插入声卡的MIC
(2) 启动“录音机”软件
(3) 在“录音机”窗口中选择“文件/新建”选项 (4) 单击“ (5) 单击“ ”按钮,开始录音 ”按钮,停止录音
(6)选择“文件/另存为”选项,将刚录制的声音存储成 一个数字声音文件。
音频处理技术ppt课件
15
上海建桥学院信息技术系
16
上海建桥学院信息技术系
借助于A/D或D/A转换器,模拟信号和数字信号可以互相转换
17
上海建桥学院信息技术系
18
上海建桥学院信息技术系
▪ 4.2.1采样
为实现A/D转换,需要把模拟音频信号波形进行分 割(每隔一定的时间间隔测一次模拟音频的值(如电压) ),
以转变成数字信号,这种方法称为采样(Sampling)。每 秒钟采样的次数称为采样率。
22
输出
输入
非均匀量化
上海建桥学院信息技术系
数字音频等级
信号类型
频率范围Hz
电话语音 宽带音频 调频广播 CD-DA SACD DVD-AUDIO HDTA …
200~3400 50~7000 20~15k 20~22k 2-100k 100k
23
采样频率KHz 量化精度(位)
8
8
16
16
37.8
44 100(Hz)×(16/8)(B)×2×5×60=51600kb
26
上海建桥学院信息技术系
▪ 4.2.3 声音采样与量化过程示例
27
上海建桥学院信息技术系
图4-10 采样频率为1000Hz,10个量化等级的波形
28
上海建桥学院信息技术系
图4-11 经过D/A转换器得到的信号波形(直线段的波形)有较大的失真
非语音信号:音乐,自然界的声音,信息量 低,识别简单。
6
上海建桥学院信息技术系
图4-4 在自然界,声波与水波一样都是一种振动波
7
上海建桥学院信息技术系
图4-5 用声音录制软件记录的英文单词”Hello”语音的实际波形
音频信息处理
温度
15 10 5 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
时间
图 2-1
气温变化曲线
(2). 影响数字音频质量的技术参数 对模拟音频信号进行采样量化编码后,得 到数字音频。数字音频的质量取决于采样频率、 量化位数和声道数三个因素。 1). 采样频率 采样频率是指一秒钟时间内采样的次数。 在计算机多媒体音频处理中,采样频率通常采 用三种:11.025KHz(语音效果)、22.05KHz(音 乐效果)、44.1KHz(高保真效果)。常见的CD唱 盘的采样频率即为44.1KHz。
返回
音频是指人类听觉神经所能感知范围内的 声音频率,也称声频。人耳能听到的频率范围是 20Hz~20KHz,低于20Hz的音频称为次声波,高于 20KHz的音频称为超声波,两者间的音频为可听 声波,即属于多媒体音频信息范畴。但人类最敏 感的声音频率范围是3KHz~5KHz,我们说话时产生 的声波频率大约在300Hz~3KHz,音乐的频率可达 到10-20KHZ。对于高于18~20kHz和低于16~20Hz的 声音信号,无论音强如何,一般人都会听不到。 在处理声音素材时,可通过调节不同频率的音强来 优化声音的质量,如低于200Hz的低频信号可用来 增强语音的自然度和谈话风度。
(4). 数字音频信号的编码 一般情况下,声音的制作是使用麦克风或 录音机来产生,再由声卡上的WAVE合成器的 (模/数转换器)对模拟音频采样后,量化编码为 一定字长的二进制序列,并在计算机内传输和 存储。在数字音频回放时,再由数字到模拟的 转化器(数/模转换器)解码可将二进制编码恢复 成原始的声音信号,通过音响设备输出。如下 图所示。 模拟音频信号输入 播放 解码 采样/量化编码 传输/存储
音频处理 ppt课件
(ultrasonic)。 ppt课件
1
ppt课件
2
ppt课件
3
声音的频率范围
ppt课件
4
计算机音频处理涉及的内容包括:
• 音频传播媒体特征,也即声波的物理特性。
• 音频的记录和产生方式,包括模/数、数/ 模转换;数据压缩和声音合成。
• 音频数据的编辑处理。
1) 对音频信号的处理方法大致可分为三类: 波形编译码器,音源编译码器,混合编译 码器。
➢(2) VOC声音文件格式:VOC文件是用于 DOS操作系统下的一种波形文件。
➢(3) AU声音文件格式:用于UNIX操作系 统下的一种波形文件。
➢(4) MID文件格式:MID文件是一种记录
数字化音乐的MIDI文件。
ppt课件
16
四.音频信号的指标
1. 频带宽度:音频信号的频带越宽,所包 含的音频信号分量越丰富,音质越好。
ppt课件
14
➢3.声道数:有单声道、双声道、多声道 之分。
ppt课件
15
三、常见声音文件的格式
常见的声音文件为:WAV文件、VOC文 件、AU文件和MID文件。
➢(1) WAV声音文件格式:WAV文件是从 模拟声波采样后得到的一种波形文件,使 用于Windows操作系统,其格式是由文 件首部与文件数据块组成。
ppt课件
19
➢2.波形编码 :波形编码的特点是在高码率的条件 下获得高质量的音频信号,适用于高保真度语音和
音乐信号的压缩技术。 (脉冲编码调制(PCM), 实际为直接对声音信号作A/D转换。只要采
样频率足够高,量化位数足够多,就能使解
码后恢复的声音信号有很高的质量。差分脉
冲编码调制(DPCM),即只传输声音预测值和
《音频信号的处理》课件
音频信号的处理
预处理
使用滤波、去噪和压缩等技术 对音频信号进行预处理。
特征提取
通过转换域分析、统计分析和 模型分析等方法提取音景噪声削弱 等技术提升音频信号的质量。
音频信号的复原
1 语音恢复
使用信号复原技术对受损语音进行恢复和改善。
2 音乐修复
应用音频修复技术修复老旧音乐录音和失真音频。
音频信号的处理
随着音频娱乐的兴起,音频信号的处理变得越来越重要。本课件将介绍音频 信号的特性、处理方法和应用领域。
音频信号的采集
1
音频信号的采样
了解音频信号的采样原理和采样率对信号质量的影响。
2
音频信号的量化
探索音频信号的量化方法,如线性量化和非线性量化。
3
音频信号的编码
介绍不同的音频信号编码算法,如PCM和压缩编码。
音频信号的应用
语音识别
音频信号处理在语音识别技术中发挥着重要作用。
声纹识别
通过声纹识别技术分析音频信号的特征进行身份认证。
其他应用
音频信号处理还可以应用于音乐分析、声音处理和音频特效等领域。
总结
音频信号的处理在音频娱乐中扮演着至关重要的角色,发展趋势不断推动着 技术的创新和应用的扩展。
《音频技术》课件
未来音频技术的挑战与机遇:随着音 频技术的不断发展,将面临更多的挑 战和机遇,需要不断创新和进步。
添加标题
添加标题
添加标题
添加标题
音频技术在各领域的应用前景:音频 技术将在教育、娱乐、医疗、军事等 领域发挥更大的作用,为人们的生活 带来更多的便利和乐趣。
未来音频技术的展望:未来音频技术 将更加注重用户体验和个性化需求, 同时将不断拓展新的应用领域和市场。
单击此处输入你的项正文,文字是您思想的提炼。
音频技术未来发展方向
单击此处输入你的项正文,文字是您思想的提炼。
音频技术未来应用前景
单击此处输入你的项正文,文字是您思想的提炼。
展望未来音频技术的发展方向和应用前景
音频技术发展趋势:随着科技的不 断发展,音频技术将朝着更高质量、 更智能化、更便捷化的方向发展。
虚拟现实音频技术:在虚拟现实游戏中,使用音频技术提供更加真实的听觉感受
总结与展望
总结音频技术的特点和发展趋势
音频技术定义与分类
单击此处输入你的项正文,文字是您思想的提炼。
音频技术特点
单击此处输入你的项正文,文字是您思想的提炼。
音频技术应用领域 展望音频技术的发展趋势 展望音频技术的发展趋势
音频技术发展趋势
虚拟现实与增强现实技术 智能家居与物联网 医疗保健与健康监测
音频信号处理
音频信号的采集和传输
音频信号采集:通 过麦克风等设备将 声音转换为电信号
音频信号传输:通 过线路或无线方式 将音频信号传输到 目的地
音频信号处理:对 采集到的音频信号 进行加工处理,以 满足特定需求
音频信号的应用: 在通信、娱乐、医 疗等领域中广泛应 用
音频处理技术的发展趋势
音频信号处理技术
输入电平
输出电平
K=1无压缩
K<1压缩
K>1扩张
当压限器的压缩比超过10:1,就可看作限幅器。
限幅器特点:
大多数限幅器都有10∶1或20∶1的比率,有的比率甚至可高达100∶1。
大都用在录音系统,以避免信号的瞬间峰值达到的满振幅
4.3 电子分频器
4.3.1 电子分频器的功能 将中高音频和低音频进行分离放大和传输,用不同的功率放大器分别带动纯低音和中高音扬声器系统,增强声音的清晰度、分离度和层次感,增加音色表现力。
如果在5kHz左右提升4dB,则会使混合声的能量好像增加了3dB。
(5)4~4kHz之间:
提高音质、改善音色
(6)4~14kHz频段:
声音的明亮度、宏亮度和清晰度 提升过量,会使语言产生齿音、s音,使声音产生“毛刺”。
(7) 提升14kHz以上频段:
容易出现声反馈而产生啸叫。
提高音质、改善音色
选择各频率点要有针对性和目的性;
基本原理: 多频段均衡器是由许多个中心频率不同的选频电路组成的,对相应频率点的信号电平既可以提升也可以衰减,即幅度可调。
多频段图示均衡器的基本原理
什么是图示均衡器?
由于多频段均衡器普遍都使用推拉式电位器作为每个中心频率的提升和衰减调节器,推键排成位置正好组成与均衡器的频率响应相对应的图形,称为图示均衡器。
04
提高音质、改善音色
提高音质、改善音色
(3)250Hz~2kHz: 包含大多数乐器的低次谐波, 提升过高,会导致音乐像在电话中听到的那种音质,失掉或掩盖了富有特色的高频泛音。 提升500Hz~1kHz频段时,会使乐器的声音变成喇叭似的声音; 提升1~2kHz频段时,则会出现像铁皮发出的声音。这段频率输出过量时,还会造成人的听觉疲劳。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
ppt课件
2
1. 声波
(1)声波:由各种机械振动或气流扰动引起周围的弹性媒质发生波动。 (2)声源:产生声波的物体,如人的声带和乐器等。 (3)声音:人的听觉系统所能感知到的声波。
音频的频率范围:20 Hz ~ 20000 Hz 语音的频率范围:300 Hz ~ 3000 Hz 次声波的频率范围: < 20 Hz 超声波的频率范围: > 20 kHz
1)Layer 1:编码器简单,输出数据率为384 kb/s,主要用于小型数字盒式磁带。
2)Layer 2:编码器较复杂,输出数据率为256 kb/s~192kb/s,主要应用于数字广播声
音、数字音乐、CD-I和ห้องสมุดไป่ตู้CD等。
3)Layer 3:编码器复杂,输出数据率为64kb/s,主要用于ISDN(综合业务数字网,一种
常pp见t课声件音的分贝量级
4
(2)声音信号的心理学特征
人们感知到的声音特征称为心理学特征 音调:由发声物体的振动频率决定,振动越快(即频率越大),音调越
高,振动越慢,音调越低。
音色:这是一个主观评价声音的量,声音的音色取决于声音的频谱结构,
一般高次谐波越丰富,音色越明亮并具有穿透力。
响度:人耳对声音强弱的感觉程度,主要取决于振幅和声压。通常振幅
越大声音越响,其次人耳距离声源越远,声音越小。
ppt课件
5
(3)声音质量的评价
声音质量与带宽有关,频率范围越宽,声音质量越高。
1)声音质量分级:按照声音信号的频率范围将声音质量分为5级。
2)信噪比(SNR):即有用信号与噪音信号的强度之比,单位是分贝。
3) 声音质量的主观度量:主观度量就是大多数人对声音质量的感觉。
3.MP3文件:是MPEG音频第3层的简称,有损压缩,压缩比达12:1。MP3利用人耳的掩蔽特 性,削减音频中人耳听不到的成分,同时尽可能地维持原来的声音质量。
第2章 音频信息处理
2.1 音频处理基础
本节要点
声音的基本特征 音频的数字化 数字音频文件格式 数字音频处理技术
ppt课件
1
问题
模拟声音与数字声音的区别是什么? 声音的质量由什么来决定? 声音的音调与音色分别由什么来决定? 常见的声音格式有哪些?各自有什么特点? 单声道与立体声的区别是什么?如何互相转换?
数字电话网的国际标准)上的声音p传pt课输件。
12
3. 数字音频文件的格式
1.WAV文件:波形文件,微软开发,需要的存储量大,多用于存储简短的声音片段和旁白。
2.MIDI文件:记录的是生成音乐的指令,MIDI文件短小。由于MIDI记录的并不是真正的 声音,所以不同的声卡,不同软波表,不同硬件音源的音色是不相同的,相同的MIDI 文件在不同的设备上播放也会有不同的效果。MIDI文件适合作为背景音乐来播放。
ppt课件
6
3.音频信号的表示
(1)音频信号:通过麦克风等设备转换成的电信号。
规则音频信号:带有语音、音乐和音效的有规律的音频信号,承载了一 定的信息。
语音:语言的载体,有丰富的语言内涵,是人类交流的信息载体。
音乐:是一种规范的符号化的声音。
音效:自然界中各种声音效果,如掌声、雷鸣声,爆破声等。
声音信号的频率分布曲线。复杂的声音是由振幅和频率不同的正弦声波叠 加而成的,这些正弦波的幅值按频率排列的图形就叫做频谱。
男声的基频较低,低频分量更加丰富,因此听起来会更加低沉、浑厚。
ppt课件
8
2.1.2 音频信号的数字化
1. 音频信号数字化
声音信号在时间上是连续的,在幅度上也是连续的,属于模拟信号。
不规则音频信号:不包含任何信息的声音,比如噪声。
(2)音频信号的表示
1)音频信号的数学表示
f(t) Ans inn(0tn)
ω0: 声音的基音,决定了音调的高低
n0
nω0: 声音的泛音,决定了声音的音色
An : 声波的振幅,表示声pp音t课的件强弱
7
2)音频信号的波形表示
3)音频信号的频谱表示
(1)采样
声音信号在时间上的离散化,即每隔一段时间抽取一个信号样本。 采样频率:每秒采样的次数。 奈奎斯特理论(Nyquist theory):采样频率不低于声音信号最高频率
的两倍,这样就能把数字声音还原成原来的声音,称为无损数字化。 f s >= 2 f max
电话话音信号的最高频率约为3.4kHz,所以采样频率取为8kHz。
ppt课件
9
(2) 量化
声音信号在幅度上的离散化
也就是采样过程中对每一个采样点的幅度值用数字量来表示。如果 幅度的划分是等间隔的,称为线性量化,否则为非线性量化。 采样精度:即量化的位数,位数越多量化等级数也越多,所能表
示的声波幅度的动态范围也越大,当然需要的存储空间也越大。
ppt课件
10
(3) 编码
就是用一组二进制码组来表示每一个有固定电平的量化值,或者说将 量化值转换成二进制码组。
典型的音频编码方法:脉冲编码调制法(PCM)。
(4)数字音频的数据量
数据量 = 采样频率* 采样精度* 采样时间* 声道数 / 8 单声道:一次只产生一组声波数据 立体声:一次产生两组声波数据
(字节数)
例2.1 计算一分钟未压缩的高保真立体声数字声音数据的大小。 60 * ( 44100 * 16 * 2 ) / 8 = 10.09 MB
(4)声强:对于一定频率的声音,要能引起听觉,其声强也有一定的范围。
下限:是恰能引起人听觉的最小声强,叫做该频率的可闻阈; 上限:是指人耳能听闻的最大声强,高于上限的声强,人耳感觉疼痛, 所以叫做该频率的疼痛阈。
ppt课件
3
2.声音的基本特征
(1)声波信号的物理特征
周期(T):声波的两个波峰或波谷之间的相对时间。 频率(f):周期的倒数(f=1/T),即每秒波峰或波谷出现的次数。 幅度:从声波信号的基线到波峰的距离,幅度越大声波的强度也越大。通常 也用声压、声强或声功率来表示声音的强弱。
一首未经压缩的4分钟的歌曲文件的大小约为40MB,那么一个容量为4GB的
MP3播放器可存放100首这样的歌曲。
ppt课件
11
2. 数字音频压缩标准
(1)电话质量的语音压缩标准
(2)调幅广播语音压缩标准 G.722
(3)宽带音频压缩标准
MPEG音频:第一个高保真立体声音频压缩的国际标准
MPEG音频压缩标准提供三个独立的压缩层次: