第二章 多媒体音频技术

合集下载

多媒体网络与通信 2-音频处理技术

多媒体网络与通信 2-音频处理技术

可听阈值
痛阈值
2×10-5
0.5
200 P(Pa)
在声学工程中,常用声压的相对大小表示声压的强弱, 称为声压级(Sound Pressure Level,SPL),单位是分 贝(decibel,dB)
Lp = 20 lgP/P0 式中,基准声压P0为2×10-5Pa,规定为0dB。
2021/4/19
y111AllnnxlnA AAsxgnsg(xn)(,x)0, 1A x1A x1
式中, x为输入信号幅度,规格化为-1≤x ≤1 ,sgn(x)为 x的符号,A为确定压缩量的参数,一般取87.56。
2021/4/19
音频处理技术
第28页
2.2.1 声音的数字化
对于采样频率为8kHz,样本精度为13位、14位或者16位 的输入信号,使用μ律压扩编码或者使用A律压扩编码, 经过PCM编码器之后每个样本需8位二进制存储,输出 的数据率为64 kb/s。这个数据就是CCITT推荐的G.711 标准:话音频率脉冲编码调制 。
2021/4/19
音频处理技术
频域掩蔽
第15页
掩蔽效应(2)
时域掩蔽:在强音信号之前或之后的弱音被掩蔽。分为前掩蔽和后 掩蔽。
利用掩蔽效应可以用有用信号去掩蔽无用的声信号,只需要把无用 声音的声压级降低到掩蔽阈以下即可。
在数字音频处理中,还可以利用掩蔽效应去掉人耳听不到的那部分 信号进行声音数据的压缩。
回声与余声的感觉可使听者感受出房间体积大小、房间 高低及内表面结构上的差异,这便是空间感。
2021/4/19
音频处理技术
第18页
2.1.3 音频信号的质量指标
(1) 频带宽度 音频信号所包含的谐波分量越丰富,音色越好。在广播通信和 数字音响系统中,以声音信号所包含的谐波分量的频率范围来 衡量声音的质量,即带宽。

多媒体技术及应用第2章 多媒体音频技术

多媒体技术及应用第2章 多媒体音频技术
多媒体技术及应用
多媒体概论 多媒体音频处理技术 图像处理技术 计算机动画技术 多媒体视频技术
第2章 多媒体音频处理技术



声音的基本特性 数字音频 Audio工作界面与基础应用 声音的编辑处理 声音的效果处理
2.1 声音的基本特征

音频信号的特征

声音的物理特征 声音的心理学特性 频带宽度 动态范围 信噪比
● 分贝——在声学中表示声压和声强的变化程度。
7
声音的心理学特性
● 音调
—— (高低) —— (强弱)
(弱 )
(低 )
(高 )
● 音强
(强 )
(停 )
● 音色
—— (特质)
钢琴 吉他 小号 小提琴
● 声音的连续性
● 声音在时间轴上是连续信号,具有连续性和过程性 ● 构成声音的数据前后之间具有强烈的相关性
19
● 音质——声音的质量。与频率范围成正比,频率范围 越宽音质越好 ● 数据量与文件
采样频率 Hz 11,025 22,050 44,100 11,025 22,050 44,100 数据长度 bit 8 8 8 16 16 16 数据量/分钟 0.66 MB 1.32 MB 2.64 MB 1.32 MB 2.64 MB 5.29 MB 音质评价

音频数据传输率 数据传输率是指每秒钟传输的数据位数 ,记为bit/s。 未经压缩的数字音频数据传输率(bit/s)= 采样频率(Hz)×量化位数(bit)×声道数

其中,声道数是指一次采样所记录产生的声音 波形个数,单声道就是一个声音波形,双声道 录放音有立体感,叫双声道立体声。
18



《多媒体制作技术及应用》-ch2 数字音频处理技术精品资料

《多媒体制作技术及应用》-ch2 数字音频处理技术精品资料
第2章 数字音频处理技术
第2章 数字音频处理技术
2.1数字音频基础
2.1.1音频信号 人们之所以能听到各种声音,是因为不同频率的声波
通过空气产生振动,对人耳刺激的结果。规则音频是一种 连续变化的模拟信号,可用一条连续的曲线来表示,称为 声波。因声波是在时间和幅度上都连续变化的量,所以称 为模拟量。
因为音频信号一般不会发生突然变化,相邻的语音采样值之间存 在很大的相关性,从一个采样值到相邻的另一个采样值的差值要比样值 本身小得多。利用预测编码方法建立预测模型,通过预测器对未来的样 本进行预测,然后对样本值与预测器得到的预测值之差进行量化和传输。 由于这个差值的幅度远远小于样本值本身,需要较少的比特数来表示, 这样可以降低数据的编码率,从而使编码数据得到压缩。
第2章 数字音频处理技术
2.1数字音频基础
2.1.2 模拟音频的数字化过程 3.编码
(2)DPCM (Differential Pulse Code Modulation)差分脉冲编 码调制
DPCM编码是利用音频信号的相关性,通过只传输声音的预测值 和样本值的差值来降低音频数据的编码率的一种方法。它采用预测编码 技术,实现音频数据的压缩编码。
采样频率是指计算机每秒钟采集多少个声音样本。采样频率越高, 即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就 越多,对声音波形的表示也越精确。
采样频率的选择与声音信号本身的频率之间有关,根据奈奎斯特 (Nyquist)理论,只有采样频率高于声音信号最高频率的两倍时,才 能把数字信号表示的声音较好地还原为原来的声音。
(1)配置好录音设备,选择输入声源。
ADPCM压缩方案压缩倍率可达2~5倍,信噪比高,性能优越,因 此,多媒体计算机所获得的数字化的声音信息大都采用此压缩方法。 MPC的音频卡也提供有ADPCM算法,如将16位的采样值压缩成4位, 将8位的采样值压缩成4位、3位或2位。

chap2-多媒体音频处理技术

chap2-多媒体音频处理技术
Chap2 多媒体音频处理技术
声音信息的处理
声音的采集: 波形声音数字化 电子乐器(MIDI) 话音(语音识别)
声音的表示 与存储
声音的处理: 压缩和编码
Chap2 多媒体音频处理技术 本章内容: • 2.1 声音信号概述 • 2.2 声音信号数字化 • 2.3 声音文件的存储格式 • 2.4 声音处理软件 • 2.5 声音质量的度量 • 2.6 MIDI系统 • 2.7 语音处理技术
(3). 音序器
用于记录、编辑、播放MIDI的声音文件,音序器有以硬 件形式提供的,目前大多为软件音序器。音序器可捕捉MIDI 消息,将其存入MIDI文件,MIDI文件扩展名为 .MID。音序 器还可编辑MIDI文件。
(4). 合成器 MIDI文件的播放是通过MIDI合成器,合 成器解释MIDI文件中的指令符号,生成所需 要的声音波形,经放大后由扬声器输出,声音 的效果比较丰富。 MIDI合成方式主要有调频合成(FM)和乐 音样本合成两种方式。
晰可辨的音调,我们称之为噪音。
2.2 声音信号数字化 • 声音信号数字化的过程
模拟 信号 采样 量化
编码
数字 信号
• 采样:在某些特定时刻对模拟信号进行测量,即使音频信 号在时间轴上离散化。 • 量化:对采样后的离散音频信号幅值样本进行离散化处理, 即将每一个样本归入预先编排的量化级上。 • 编码:对量化级以二进制数码按一定数据格式表示的过程。
(2). MIDI端口
一台MID设备可以有一至三个MIDI端口,分别 称为MIDI In、MIDI Out、MIDI Thru。它们的作用 是: MIDI In:接收来自其它MIDI设备的MIDI信息。 MIDI Out:发送本设备生成的MIDI信息到其 它设备。 MIDI Thru:将从MIDI In端口传来的信息转发 到相连的另一台MIDI设备上。

第二章 多媒体音频信息处理

第二章  多媒体音频信息处理

当D/A转换器从图2-2得到的数值中重构原 来信号时,得到图2-3中蓝色(直线段)线段 所示的波形。从图中可以看出,蓝色线与 原波形(红色线)相比,其波形的细节部分 丢失了很多。这意味着重构后的信号波形 有较大的失真。
失真在采样过程中是不可避免的,如何减 少失真呢?可以直观地看出,我们可以把 图2-2中的波形划分成更为细小的区间,即 采用更高的采样频率。同时,增加量化精 度,以得到更高的量化等级,即可减少失 真的程度。在图2-5中,采样率和量化等级 再提高了一倍,分别达到4000次/秒和40个 量化等级。从图中可以看出,当用D/A转 换器重构原来信号时(图中的轮廓线), 信号的失真明显减少,信号质量得到了提 高。
2.2.2 量化
采样只解决了音频波形信号在时间坐 标(即横轴)上把一个波形切成若干个 等分的数字化问题,但是每一等分的 长方形的高是多少呢? 即需要用某种 数字化的方法来反映某一瞬间声波幅 度的电压值的大小。该值的大小影响 音量的高低。我们把对声波波形幅度 的数字化表示称之为“量化”。
量化的过程是先将采样后的信号按 整个声波的幅度划分成有限个区段的集 合,把落入某个区段内的样值归为一类, 并赋于相同的量化值。如何分割采样信 号的幅度呢?
用声音录制软件记录的英文单词 “Hello”的语音实际波形
2.1.3 模拟音频信号的物理特征
模拟音频信号有两个重要参数:频率 和幅度。声音的频率体现音调的高低, 声波幅度的大小体现声音的强弱。
一个声源每秒钟可产生成百上千个波, 我们把每秒钟波峰所发生的数目称之 为信号的频率,单位用赫兹(Hz)或千 赫兹(kHz)表示。例如一个声波信号在 一秒钟内有5000个波峰,则可将它的 频率表示为5000Hz或5kHz。
周期
幅 度 限

多媒体技术及应用PPT(第二章)

多媒体技术及应用PPT(第二章)

列,每个命令包括命令号、通道号、音色号和音速等。
第二章 多媒体音频处理技术
2.4.2 常用术语



音乐合成器 复调 多音色



MIDI电子乐器 MIDI消息或指令 MIDI接口 MIDI通道 音序器
第二章 多媒体音频处理技术
2.4.3 MIDI音乐的制作 MIDI系统分处理设备、输入设备和输出设备三大 部分,中枢就是音序器。现在流行使用的就是 CAKEWALK系列的各版本软件。输入设备有计算机键盘、 鼠标、合成器主键盘等,输出设备就是声卡、音源、 采样器等。 计算机合成音乐需要使用MIDI语言。MIDI语言利用 字节传送来告知相应的设备能够做什么和不能做什么。 MIDI字节通知乐器、声卡和其他MIDI设备什么时候开始 和什么时候结束演奏音符。
即采样。采样的过程是每隔一个时间间隔在模拟声音的波形 上取一个幅度值,把时间上的连续信号变成时间上的离散信 号。该时间间隔称为采样周期,其倒数为采样频率,采样频 率是指计算机每秒钟采集多少个声音样本。
第二章 多媒体音频处理技术
量化的过程是先将采样后的信号按整个声波的幅度 划分成有限个区段的集合,把某个区段内的值归为一类, 并赋于相同的量化值。
第二章 多媒体音频处理技术
2.3.4 声音的效果处理 1.调整音量
第二章 多媒体音频处理技术
2.降噪 为了去除录制中的微小噪声和电源的嗡嗡声等杂音,
可以单击效果栏中的“降噪”按钮,在弹出的对话框中
选择合适的数据对录音进行降噪。由于软件是根据用户 指定的数值认定噪声的,所以降噪会对原来的声音文件 造成损失。
大不失真声音信号强度与同时发出噪音强度的比率,
通常以S/N表示,以分贝(dB)为单位,信噪比越高表 示声音的质量越好。

多媒体技术音频处理技术-精品

多媒体技术音频处理技术-精品

思考题
请计算对于5分钟双声道、16位采样位 数、44.1kHz采样频率声音的不压缩数据量 是多少?
解: 根据公式: 数据量=(采样频率×采样位数 ×声道数×时间)/8 得,数据量 =[44.1×1000×16×2×(5×60)] / (8×1024×1024) =50.47MB 因此,声音的不 压缩数据量约为50.47MB。
2.1.2 模拟音频的数字化过程
对模拟音频数字化过程涉及到音频的采样、量化和编码。 采样和量化的过程可由A/D转换器实现。A/D转换器以固定 的频率去采样,即每个周期测量和量化信号一次。经采样 和量化后声音信号经编码后就成为数字音频信号,可以将 其以文件形式保存在计算机的存储介质中。
模 拟 信 号 的 数 字 化 过 程
模拟声音:模拟方式存储,如磁带 数字声音:用0、1表示的声音数据
3、音频
20HZ~20KHz范围内的声波,也是人的耳朵 可以听到的声音。
4、声音质量的评价标准(信噪比、频带宽度) 按照声音频率的变化幅度可以分为:
电话话音质量:200~3400Hz 调幅广播音质:50~7000Hz ,简称AM音质 调频广播音质:20~15000HZ,简称FM音质 激光唱盘音质:10~20000HZ,简称CD音质
4. RealAudio文件——.RA/.RM/.RAM
RealAudio文件是RealNetworks公司开发的一种 新型流式音频(Streaming Audio)文件格式;它包含 在RealNetworks所制定的音频、视频压缩规范 RealMedia中,主要用于在低速率的广域网上实时传 输音频信息;网络连接速率不同,客户端所获得的 声音质量也不尽相同:对于28.8kb/s的连接,可以 达到广播级的声音质量;如果拥有ISDN或更快的线

《多媒体应用基础》第2章 数字音频处理

《多媒体应用基础》第2章 数字音频处理
12
频率(对数 48.3 )
2.1.2 音色与谐波

音色与谐波
人感受到的声音的明亮感、穿透力,就是音
色。

音色是由混入基音的泛音决定。
泛音,也称为谐波。

基音基波,频率为:ωo
13

泛音谐波,频率为:n×ωo
2.1.2 音色与谐波

一秒钟的波形图如下所示,基波和谐波对应哪 些曲线,其频率分别是多少?
fscanf: 格式化读取,按照指定的格式串进行读取数据,
(3)信噪比
信噪比是有用信号与噪声之比的简称,定义为:

有用信号的平均功率 信噪比 信噪比越大,声音质量越好。 噪声的平均功率
19

功率的单位:瓦特W
2.1概述

练习:现在有一类音频信号,
其最大强度为100dB,最小强度为10dB;
其有用信号的平均功率为10W,噪音的平均功
率为2W;

(2)医学超声波检查。 (3)
“声呐”原理:通过记录与处理反射回声,
6
估计出探测物的距离、形态及其动态改变。探测 潜艇的位置等。
2.1概述

聆听歌曲: “Don‘t cry for me Argentina” 你会选择如下的哪些词汇,来形容这首歌曲呢?

尖锐、低沉 是否明亮、有穿透力 声音音量强、弱 音响效果好、坏 音质好、坏 噪声大、小
难点:音频压缩编码方法的分类和主要机制
3
2.1概述
人类从外部世界获取的信息中,10%通过听觉获
得。
声音是如何产生的呢?

声音是由物体振动产生的,这种振动引起周围
空气压强的振荡。

多媒体技术及应用 数字音频技术02

多媒体技术及应用 数字音频技术02
音色Piano编号
00
60
8分音符编号
音符C3编号
2-35
多媒体 音频技术
2.4 MIDI与音乐合成
二、MIDI合成方式 1.调频合成法--FM 原理:MIDI合成器接收到MIDI音乐信息 后,利用傅立叶级数原理将其分解为若干个 不同频率的正弦波,然后生成MIDI音乐信息 中指定乐器的各个正弦波分量,最后将这些 分量合成起来送至扬声器播放。 特点:①系统开销小,声音清脆 ②声音音色少,音质较差
2.3 声卡与音箱
4.声卡的外部接口
2-22
多媒体 音频技术
2.3 声卡与音箱
用来连接外部音频设备以便进行录音,如 录音机、CD唱机和音响等 用来连接话筒,直接输入现场的声音信号 用来连接外部音频设备的输入口,也可连 接大功率有源音响等 用来连接扬声器,从声卡的内置功率放大 器向扬声器输出声音 用来连接游戏杆或MIDI设备。 用来连接CD-ROM驱动器,可以直接播放CD 音乐,而不占用CPU时间
压缩编码技术是指用某种方法使 数字化信息的编码率降低的技术
音频信号能压缩的基本依据: ① 声音信号中存在大量的冗余度; ② 人的听觉具有强音抑制弱音的现象; ③ 低频段敏感、高频段不敏感。
2-14
多媒体 音频技术
2.2 数字音频压缩标准
音频信号压缩编码的分类: ①无损压缩(熵编码) 霍夫曼编码、算术编码、行程编码 ②有损压缩 波形编码--PCM、DPCM、ADPCM 子带编码、矢量量化 参数编码--LPC 混合编码--MPLPC、CELP
多媒体 音频技术
2.3 声卡与音箱
(3)驻极体式传声器,利用驻极体材料 制作的电容传声器。 优点:简单、体积小、耐振动、价格低 (4)无线传声器,声音信号转变为电信 号,形成超高频信号。 无线传声器不是指传声器的结构原理,而 是指信号的传输方法。 优点:可随身携带、无需电缆 缺点:时远时近,影响拾音效果

梁倩多媒体技术-第2章多媒体音频技术

梁倩多媒体技术-第2章多媒体音频技术

多媒体技术
一、数字采样
声音采样的基本原理是:首先输入模拟声音信号,然后按照固 定的时间间隔截取该信号的振幅值,每个波形周期内截取两次,以取 得正、负向的振幅值。该振幅值采用若干位二进制数表示,从而将模 拟声音信号变成数字音频信号。模拟声音信号是连续变化的振动波, 而数字音频信号是阶跃变化的离散信号。
1.WAV文件
波形文件格式:一种直接的表达声波的数字形式,用.wav为扩展 名的文件格式称为波形文件格式(wave file format)。
Wav文件是由采样数据组成的,所以它所需要的存储容量很大。 用下列公式可以简单地推算出wav文件所需的存储空间的大小。 Wav文件的字节数/每秒=采样频率(Hz)×量化位数(位)×声道数 /8 例如:用44.1kHz的采样频率对声波进行采样,每个采样点的量化位数 选用16位,则录制1秒的立体声节目,其波形文件所需的存储容量为:
可以对数字运算部件进行编程。
二、模拟信号与数字信号 把在时间和幅度上都是连续的信号称为模拟信号。 把在时间和幅度上都用离散的数字表示的信号称为数字信号。
多媒体技术
三、声音信号数字化
1、什么是数字音频
声音是机械振动,振动越强,声音越大。话筒把机械振动转换成 电信号,模拟音频技术中以模拟电压的幅度表示声音强弱。
(1)方位感: (2) 响度感 (3)音调感
记忆力 分辨力 音色感 (4)聚焦效应
多媒体技术
多媒体技术
4、声音三要素:
音调 音强 音色
5、声音的连续性
声音是一种弹性波,声音信号可以分成周期信号与非周 期信号两类。
周期信号是单一频率音调的信号,其频率是线性谱; 非周期信号包含一定频带的所有频率分量,其频谱是连 续谱。

多媒体技术与应用_第2章_声音媒体

多媒体技术与应用_第2章_声音媒体

西南交通大学
数据长度 8 bit 8 bit 8 bit 8 bit 8 bit 16 bit
● 应根据使用场合和要求转换适当的声音采样频率 ● 采样频率的转换须使用相应的软件进行
录音
● 设备间的信号连接 机箱后背
西南交通大学 ● 使用“录音机”获取声音
(1) 选择“程序/附件/娱乐/ 录音机”菜单,启动录音机
5.1 STEREO
● ¥400~800元
2.7 音频处理软件
应用场合 国际互联网 (语音、简单乐曲) 游戏 (效果音、效果音乐) 多媒体自学读物 (提示音) 电子教案 (语音、效果音) 多媒体宝典、大全 (乐曲、语音) 多媒体音乐鉴赏 (音乐、解说) 要求 采样频率 11,025 Hz 22,050 Hz 11,025 Hz 11,025 Hz 22,050 Hz 44,100 Hz

动态范围
声音的动态范围是指音频信号的最大强度和最小强度之比。 动态范围越大,音响效果越好。

信噪比
信噪比是有用信号与噪声之比的简称,信噪比越大,声音质 量越好
声音质量的度量
主观度量法

西南交通大学
人的感觉机理对声音的度量具有决定意义。感觉上的、 主观上的测试是评价声音质量不可缺少的部分,当然, 可靠的主观度量值是较难获得的。
.mp3
面向实时网上传播,在低保真的网络传播方面无人能及
● MIDI (Musical Instrument Digital Interface)乐器接口文件
.mid
用于合成、游戏,记录音符时值、频率、音色特征,数据量小
2.6 音频卡
主板 主机箱 声音适配器
音频信号 音箱
西南交通大学
数字信号

梁倩《多媒体技术》第2章多媒体音频技术-PPT精品文档

梁倩《多媒体技术》第2章多媒体音频技术-PPT精品文档

采样频率越高,在一定的时间间隔内采集的样本数越
多,音质就越好,同时数字化声音的数据量也越大。
多媒体技术
奈奎斯特理论: 采样频率不应低于声音信号最高频率的两倍,这样就 能把以数字表达的声音还成原来的声音,这叫做无损数字 化(lossless digitization)。 采样定律用公式表示为: 其中f为被采样信号的最高频率。
(1)波形声音
包含了所有的声音形式,它可以把任何声音都进行采样量化,并恰 当地恢复出来。 (2)语音 构成人类语言信号的各种声音。人的说话声虽是一种特殊的媒体, 但也是一种波形,所以和波形声音的文件格式相同。 (3)音乐 可以用符号来表示,可看作符号化的声音媒体,比较规范的是 MIDI。
多媒体技术
图2-1声音是一种连续的波
多媒体技术
2、声音信号的两个基本参数 声音信号的两个基本参数是频率和振幅。


振幅:波的高低幅度,表示声音的大小。 频率:每秒钟振动的次数,以Hz为单位,表示音调的高低。
注:

周期:两个相邻波之间的时间长度,为频率的倒数。
多媒体技术
多媒体技术
多媒体技术
多媒体技术
多媒体技术

模拟声音在时间上是连续的,而以数字表示的声音是一个数据系列。 模拟电压幅度、量化、编码的关系如表2-2
多媒体技术
2、音频数字化
计算机内的音频必须是数字形式的,因此必须把 模拟音频信号转换成有限个数字表示的离散序列,即 实现音频数字化。在这一处理技术中,涉及到音频的 采样、量化和编码。
‣声音与听觉特性
主 要 学 习 内 容 :
‣声音信号数字化 ‣采样定理 ‣数字音频的文件格式 ‣音频信号的特点
‣电子乐器数字接口(MIDI)

多媒体技术04_音频

多媒体技术04_音频

数字音频基础
数字音频 按采样的频率间隔,不断获取幅度的量值, 使连续的声音转变为离散的数字量
采样 量化
数字音频基础
数字音频的质量取决于: 采样频率 指一秒钟内采样的次数 频率越高,质量越好,但所需要的存 贮空间也越大。 采样的三个标准频率分别为:44.1KHz, 22.05KHz和11.025KHz
声音合成设备-声卡
声卡 是一种安装在计算机中的最基本的声 音合成设备,是实现声波/数字信号 相互转换的硬件 可把来自话筒、磁带、光盘的原始声 音信号加以转换,输出到耳机、扬声 器、扩音机、录音机等声响设备,完 成对声音信息进行录制与回放 。
声音合成设备-声卡
声卡的功能 录制与播放 编辑与合成 MIDI接口和音乐合成 文-语转换和语音识别 与其他设备的接口
音频处理技术
语音识别
音频处理技术
目前语音识别系统仍需进一步解决的问题 对外界噪音的免疫力 针对非特定人的语音识别 方言
音频处理技术
语音合成技术 把计算机内的文体转换成连续自然的 语音流。 按其实现的功能分为两个档次 有限词汇的计算机语音输出 采用录音/重放技术,或针对有 限词汇采用某种合成技术,对语 言理解没有要求。 例如114查询、火车报站等。
数字音频基础
音频数据率 未经压缩的数字音频数据率(bit/s)= 采样频率(Hz)×量化位数 (bit)×声道数 音频数据量(Byte)= 数据率(bit/s)×持续时间(s) / 8 例:采样率11.025KHz、量化位8位,立体声,采集 1分钟, 则:音频数据率=11.025(KHz)×8(bit) ×2 = 176.4 (Kbit/s) 音频数据量=11.025KHz×8bit ×2 ×60s/8 = 10.584 (Mbit) /8= 1.323(MB)

多媒体技术课后答案

多媒体技术课后答案

多媒体技术课后答案《多媒体技术及应⽤》习题参考答案第1章多媒体技术概论1.什么是多媒体?答:使⽤计算机交互式综合技术和数字通信⽹络技术处理多种表⽰媒体——⽂本、图形、图像和声⾳,使多种信息建⽴逻辑连接,集成为⼀个交互式系统。

2.多媒体技术中的主要多媒体元素有哪些?答:图形、图像、⽂本、动画、⾳频、视频等。

3.什么是多媒体技术?什么是多媒体计算机?简述多媒体技术的主要特点。

答:多媒体技术可以定义为:计算机综合处理⽂本、图形、图像、⾳频与视频等多种媒体信息,使多种信息建⽴逻辑连接,集成为⼀个系统并且具有交互性。

多媒体计算机是指具有多媒体处理功能的计算机。

多媒体技术的主要特点有:集成性、实时性、交互性、媒体的多样性等。

4.多媒体计算机标准的意义是什么?答:对于技术开发⼈员⽽⾔是⽤来指导多媒体个⼈计算机及其软件的设计规范;对于⽤户⽽⾔,是把现有PC机升为MPC的指导原则;对于经销商⽽⾔,可作为多媒体的性能及兼容性的尺度。

5.简述多媒体系统的组成。

答:⼀般多媒体系统由多媒体硬件系统、多媒体软件系统两个部分组成。

硬件是多媒体系统的物质基础,是软件的载体,软件是多媒体系统的核⼼,两者相辅相成,缺⼀不可。

6.试从实例出发,谈谈多媒体技术的应⽤对⼈类社会的影响。

略7.谈谈你如何看待多媒体技术的发展前景。

略8.选择题。

(1)⾳频卡是按()分类的。

(A)采样频率(B)声道数(C)采样量化位数(D)压缩⽅式(2)⼀个⽤途⼴泛的⾳频卡应能够⽀持多种声源输⼊,下列()是⾳频卡⽀持的声源。

①话筒②线输⼊③CD Audio ④MIDI(A)仅①(B)①②(C)①②③(D)全部(3)()是MPC 对视频处理能⼒的基本要求。

①播放已压缩好的较低质量的视频图象②实时采集视频图象③实时压缩视频图象④播放已压缩好的⾼质量分辨率的视频图象(A)仅①(B)①②(C)①②③(D)全部(4)()是MMX 技术的特点。

①打包的数据类型②与IA 结构安全兼容③64 位的MMX 寄存储器组④增强的指令系统(A)①③④(B)②③④(C)①②③(D)全部(5)下列关于触摸屏的叙述()是正确的。

多媒体技术及应用 第二章 音频信息的获取与处理

多媒体技术及应用 第二章 音频信息的获取与处理
声音的特色,主要影响因素是复音;复 音指具有不同频率和不同振幅的混合声 音,其中最低频率是 “基音”,是声音的 基调钢,琴其他频吉率他的声音小为号“谐音小(提泛琴音)”
声音的主要性质
连续性 声音具有连续性。在时间轴上是连续信号,具有连续性和过程性
相关性 声音具有相关性。构成声音的数据,前后之间具有强烈的相关性
多媒体技术及其应用
第二章 音频信息的获取与处理
● 主要知识点
2.1声音概述 2.2数字化音频 2.3音乐合成与 MIDI 2.4音频卡 2.5数字音频压缩标准
2.1.1 声音定义 ● 声音概念 ● 声音特性
2.1.2 声音基本特点 ● 声音传播 ● 声音频率 ● 声音传播方向 ● 声音三要素 ● 声音连续、相关及
则可由 x(nT) 完全确定 x(t)。 当 fN = 1/(2T) 时,称 fN 为奈奎斯特频率
常用音频采样率:8kHz、11.025kHz、16kHz、22.05kHz、44.1kHz 及 48kHz
2.2.2 数字音频获取
● 量化
量化概念
通过采样得到的表示声音强弱的函数 x(nT) 是连续的,为把 x(nT) 存入计 算机,就必须将采样值离散化,即量化成一个有限个幅度值的集合 x(nT)
调频广播(FM)
20 Hz ~ 15,000 Hz
宽带音响放大器
10 Hz ~ 40,000 Hz
声音的传播方向
● 声音以振动波的形式从声源向四周传播
人类在辨别声源的位置 时,首先依靠声音到达 左、右两耳的微小时间 差和强度差异进行辨别, 然后经过大脑综合分析 而判断出声音来自何方
● 从声源直接到达人类听觉器官的声音是 “直达声”
● 采样
采样概念
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
多媒体 音频技术
2.1 数字音频基础
一、声音的基本概念 声音是通过一定介质传播的连续的波。 声音是通过一定介质传播的连续的波。 声波 A 周期
振幅
t
重要 振幅:音量的大小 振幅: 指标 周期:重复出现的时间间隔 周期: 频率: 频率:指信号每秒钟变化的次数
2-2
多媒体 音频技术
2.1 数字音频基础
2-22
多媒体 音频技术
2.3 声卡与音箱
3.音箱的性能指标 3.音箱的性能指标 输出功率:额定功能、最大峰值功率。 输出功率:额定功能、最大峰值功率。 频率范围: 频率范围:指音箱最低有效回放频率和 最高有效回放频率之间的范围。 最高有效回放频率之间的范围。 信噪比: 信噪比:指音箱回放的有效信号与噪声 信号的比值。信噪比较低时,噪声严重。 信号的比值。信噪比较低时,噪声严重。 信噪比=70-80dB→普通音箱 信噪比=70-80dB→普通音箱 信噪比=80-90dB→高档音箱 信噪比=80-90dB→高档音箱 信噪比> 信噪比>95dB →专业音箱
2-12
多媒体 音频技术
2.2 数字音频压缩标准
标准 说明 采样8kHz,量化8bit,码率64kbps G.711 采样8kHz,量化8bit,码率64kbps 64 采用ADPCM编码,码率32 ADPCM编码 32kbps G.721 采用ADPCM编码,码率32kbps 采用ADPCM有损压缩,码率24 ADPCM有损压缩 24kbps G.723 采用ADPCM有损压缩,码率24kbps 采用LD CELP压缩技术 码率16 LD压缩技术, 16kbps G.728 采用LD-CELP压缩技术,码率16kbps 采样16kHz,量化14bit, 16kHz 14bit 采样16kHz,量化14bit,码率 G.722 224(64)kbps 224(64)kbps 采样44.1kHz,量化16bit, 44.1kHz 16bit 采样44.1kHz,量化16bit,码率 MPEG 705kbps (MPEG三个压缩层次 384三个压缩层次, 705kbps (MPEG三个压缩层次,384音频 64kbps) 64kbps)
2-8
多媒体 音频技术
2.1 数字音频基础
三、音频的文件格式 1.WAV WAV文件 1.WAV文件 WAV是Microsoft/IBM共同开发的PC波形 共同开发的PC WAV是Microsoft/IBM共同开发的PC波形 文件。因未经压缩,文件数据量很大。 文件。因未经压缩,文件数据量很大。 特点:声音层次丰富, 特点:声音层次丰富,还原音质好 2.MP3文件 2.MP3文件 MP3 layer3)是一种按 是一种按MPEG MP3(MPEG Audio layer3)是一种按MPEG 标准的音频压缩技术制作的音频文件。 标准的音频压缩技术制作的音频文件。 特点:高压缩比(11:1) (11:1), 特点:高压缩比(11:1),优美音质
f(Hz)
2声音的传播携带了信息, 声音的传播携带了信息,它是人类传播 信息的一种主要媒体。 信息的一种主要媒体。 声音的三种类型: 声音的三种类型: 波形声音: 波形声音:包含了所有声音形式 语音:不仅是波形声音, 语音:不仅是波形声音,而且还有丰富 的语言内涵(抽象→提取特征→意义理解) 的语言内涵(抽象→提取特征→意义理解) 音乐:与语音相比,形式更规范。 音乐:与语音相比,形式更规范。 音乐是符号化的声音。 音乐是符号化的声音。
声音按频率分类: 声音按频率分类:
次声波
20Hz
可听声波
20kHz
超声波 f(Hz)
语音信号频率范围:300Hz语音信号频率范围:300Hz-3kHz Hz 声音质量的频率范围: 声音质量的频率范围:
CD-DA
频带
10 20 50 200
FM广播 广播 AM广播 广播 电话 3.4k 7k 15k 20k
2-10
多媒体 音频技术
2.2 数字音频压缩标准
编码器 传输/ 传输/存储 解码器
输出音频信号
一、音频压缩方法概述
输入音频信号
压缩编码技术是指用某种方法使 数字化信息的编码率降低的技术 音频信号能压缩的基本依据: 音频信号能压缩的基本依据: 声音信号中存在大量的冗余度; ①声音信号中存在大量的冗余度; ②人的听觉具有强音能抑制同时存在的 弱音现象。 弱音现象。
2-13
二、音频压缩技术标准
分类 电话语 音质量 调幅广 播质量 高保真 立体声
多媒体 音频技术
2.2 数字音频压缩标准
三、音频压缩工具 MP3压缩工具 音频编辑软件CoolEdit 压缩工具: MP3压缩工具:音频编辑软件CoolEdit 豪杰超级解霸3000 豪杰超级解霸3000
2-14
多媒体 音频技术
2-17
多媒体 音频技术
2.3 声卡与音箱
⑵芯片类型 CODEC芯片 依赖CPU 价格便宜) 芯片( CPU, CODEC芯片(依赖CPU,价格便宜) 数字信号处理器DSP(不依赖CPU) DSP(不依赖 数字信号处理器DSP(不依赖CPU) ⑶总线类型 ISA总线 PCI总线 USB接口 总线、 总线、 ISA总线、PCI总线、USB接口 ⑷输出声道数 声道(立体声) 2.1/4.1/5.1声道 2声道(立体声)、2.1/4.1/5.1声道 多通道声卡(营造杜比环绕立体声) 多通道声卡(营造杜比环绕立体声)
2-18
多媒体 音频技术
2.3 声卡与音箱
4.声卡的外部接口 4.声卡的外部接口
2-19
多媒体 音频技术
2.3 声卡与音箱
用来连接外部音频设备以便进行录音, 用来连接外部音频设备以便进行录音,如 录音机、CD唱机和音响等 录音机、CD唱机和音响等 用来连接话筒, 用来连接话筒,直接输入现场的声音信号 用来连接外部音频设备的输入口, 用来连接外部音频设备的输入口,也可连 接大功率有源音响等 用来连接扬声器, 用来连接扬声器,从声卡的内置功率放大 器向扬声器输出声音 用来连接游戏杆或MIDI设备。 MIDI设备 用来连接游戏杆或MIDI设备。 用来连接CD-ROM驱动器,可以直接播放CD 用来连接CD-ROM驱动器,可以直接播放CD CD 驱动器 音乐,而不占用CPU CPU时间 音乐,而不占用CPU时间
2-4
多媒体 音频技术
2.1 数字音频基础
二、声音的数字化 1.声音信号的类型 1.声音信号的类型 模拟信号(自然界、物理) 模拟信号(自然界、物理) 数字信号(计算机) 数字信号(计算机) 2.声音数字化过程 2.声音数字化过程
模拟信号
采样
量化
A/D ADC D/A DAC
编码
数字信号
模拟信号
数字信号
2-21
多媒体 音频技术
2.3 声卡与音箱
2.音箱的分类 2.音箱的分类 功放:有源音箱、 功放:有源音箱、无源音箱 声道:2.0→双声道立体声 声道:2.0→双声道立体声 2.1→双声道 双声道+ 2.1→双声道+超重低音声道 4.1/5.1/7.1 5.1→五声道+超重低音声道 5.1→五声道+ 五声道
2-5
多媒体 音频技术
2.1 数字音频基础
3.声音数字化过程 3.声音数字化过程
连续的模拟声音信号 声音信号的采样
示意
离散的音频信号
2-6
多媒体 音频技术
2.1 数字音频基础
4.声音数字化三要素 4.声音数字化三要素
采样频率 每秒钟抽取声 波幅度样本的 次数 采样频率越高 声音质量越好 数据量也越大 11.025kHz 11.025kHz 22.05 kHz 44.1 kHz 量化位数 每个采样点用 多少二进制位 表示数据范围 量化位数越多 音质越好 数据量也越大 8位=256 16位 16位=65536 声道数 使用声音通道的 个数 立体声比单声道 的表现力丰富, 的表现力丰富, 但数据量翻倍 单声道 立体声
2-20
线性输入接口 Line In 话筒输入接口 Mic In 线性输出接口 Line Out 扬声器输入接 口/Spk Out 游戏杆 MIDI接口 MIDI接口 CD音频连接器 CD音频连接器
多媒体 音频技术
2.3 声卡与音箱
二、音箱 1.音箱的工作原理 1.音箱的工作原理 音箱是一种电声转换的发音设备。 音箱是一种电声转换的发音设备。 发音过程:声卡输出模拟信号→ 发音过程:声卡输出模拟信号→功率放 大器→电流经音箱中金属线圈产生磁场→ 大器→电流经音箱中金属线圈产生磁场→与 永久磁铁相互作用产生吸 引和排斥→带动线圈和簿 引和排斥→ 膜振动→声波。 膜振动→声波。
2.3 声卡与音箱
声卡(声音卡、音频卡) 一、声卡(声音卡、音频卡) 1.声卡的主要功能 1.声卡的主要功能 声卡是负责录音、 声卡是负责录音、播音和声音合成的一 种多媒体板卡。其功能包括: 种多媒体板卡。其功能包括:
①录制、编辑和回放数字音频文件 录制、 ②控制和混合各声源的音量 ③记录和回放时进行压缩和解压缩 语音合成技术(朗读文本) ④语音合成技术(朗读文本) 具有MIDI接口(乐器数字接口) MIDI接口 ⑤具有MIDI接口(乐器数字接口)
2-23
多媒体 音频技术
2.3 声卡与音箱
杜比环绕 立体声技术
2-24
多媒体 音频技术
2.4 音频处理软件
专业音乐软件
1.01.0Cakewalk 1.0-9.0→Sonar 1.0-4.x 音乐编曲软件 Cubase VSI 5.x→Cubase SX 2.1 音序器) (音序器) Audio(PC版 Apple版 合成器软件 Logic Audio(PC版、Apple版) (MIDI/音频 合成器一体化) 音频/ (MIDI/音频/合成器一体化) CoolEdit (Syntrillium) 录音、混音、 录音、混音、 Audition (Adobe) 音频编辑软件 GoldWare (GoldWare Inc.) 效果器软件 效果器插件 Bundle(20以上 以上) Waves Native Gold Bundle(20以上) TC Native Bundle(4) Ultrafunk Sonltus fx(7)
相关文档
最新文档