《数字声音及》PPT课件
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
a
19
2. 声音数字化:
Sampling, Quantization, Coding 采样频率与量化精度
3.采样频率
奈奎斯特(Nyquist)定理(1928年提出原理, 仙侬(Shannon)形成定理并应用,1933年卡 切尼科夫用公式表述):
采样频率2f
这里f为被采样信号的最高频率。
a
20
例如,8位量化位数表示每个采样值可以用 28即256个不同的量化值之一来表示,而16 位量化位数表示每个采样值可以用216即 65536个不同的量化值之一来表示。常用的 量化位数为8位、12位、16位。
a
18
声道数
声音通道的个数称为声道数,是指一次 采样所记录产生的声音波形个数。
记录声音时,如果每次生成一个声波数据, 称为单声道;每次生成两个声波数据,称 为双声道(立体声)。随着声道数的增加, 所占用的存储容量也成倍增加。
系,因而用20log幅度(分贝)表示
a
11
简谱
频率
20log频率
1
261
48.3
2
293
49.3
3
330
50.3
4
349
50.8
5
392
51.8
6
440
52.8
7
494
53.8
a
12
(1). 采样和量化 数字化音频的过程如下图所示。
(a) 模c) 采样信号的量化
人的声音不仅是一种波形,而且还有内在的语言、 语音学的内涵,可以利用特殊的方法进行抽取, 通常将语音也作为一种媒体。
a
4
音乐
音乐是符号化了的声音。这种符号就是乐曲,乐 谱是转化为符号媒体的声音。电子乐器数字接口 (musical instrument digital interface, MIDI ) 是十分规范的一种形式。
4. 量化精度
量化: 取样值(-,+)有限个数(量化 值近似)
若量化值有J个,若用二进制表示,需要 R=log2(J) 位
量化误差:用有限的离散值表示无限多的连 续值,必然存在误差. 该误差又称为量化噪 声(与一般的噪声不同)。
采样精度可以用信噪比表示: R为编码位数
SN1Rl0g(量 信化 号误 的 )差 1 方 l0的 g(差 sn 2 2i方 o gn i)sa el6差 R
振 幅
周期
a
基线
8
•基线是测量模拟信号的基准点。 •声波的振幅表示声音信号的强弱程度。 •声波的频率反映出声音的音调,声音细尖 表示频率高,声音粗低表示频率低。 •振幅和频率不变的声音信号,称为单音。 单音一般只能由专用电子设备产生。 •在日常生活中,我们听到的自然界的声音 一般都属于复音,其声音信号由不同的振 幅与频率合成而得到。
第二章 数字声音及MIDI
信息:数、文、形、音、图 音频:麦克风、扬声器 多媒体计算机:
声音的输入、存储、处理、输出
声音:消息、意向、情感
表示方式 汉字内码 点阵 声音
数据量
表达信息
2-4字节
编码
32—数百字节 汉字形、体
几千字节
声学、意向、情感
a
1
2.1 声音与听觉
声音:通过空气传播的一种连续的波, 又称声波。
声音信号:
有许多不同频率的信号组成,又称复合信号。
带宽:组成复合信号的频率范围。
纯音:单一频率的声音。
a
7
声音是由空气中分子的振动而产生的。自
然界的声音是一个随时间而变化的连续信号, 可近似地看成是一种周期性的函数。通常用模 拟的连续波形描述声波的形状,单一频率的声 波可用一条正弦波表示,如下图所示。
a
22
声音的质量与数据率
根据声音的频带,把声音的质量分为5个 等级
质量 电话 AM
•采样频率 •量化位数 •声道数
a
16
采样频率
采样频率是指一秒钟时间内采样的次数。 在计算机多媒体音频处理中,采样频率通
常采用三种:11.025KHz(语音效果)、 22.05KHz(音乐效果)、44.1KHz(高保真效 果)。常见的CD唱盘的采样频率即为 44.1KHz。
a
17
量化位数
量化位数也称“量化精度”,是描述每个 采样点样值的二进制位数。
声音的度量:频率与幅度(声波压力的 大小)
频率用音高表示,幅度用声强表示 与看得见的水波类似
a
2
波形声音
波形声音,实际上包含了所有的声音形式。任何 声音信号,包括麦克风、磁带录音、无线电和电 视广播、光盘等各种声源所产生的声音,都要首 先对其进行模数转换,然后再恢复出来。
a
3
语音(speech)
a
5
带宽与听觉
次声带
音 频 ( Audio) 带 宽
超声带
语 音 ( Speech) 带 宽
20 300 f(Hz)
3K
20K
18k
Hertz,Amplitude, Frequency infra-sound, ultrasound, hypersound
a
6
感知声音的幅度:用dyne(达因)/平方厘米 表示,常转换成0—120dB(decibel),但对不 同的频率,同样的声强,感觉不同。
a
9
模拟声音信号:可分解成一系列正弦波的 线性叠加。
最低频的音波称为基音,频率为基频 其余的为泛音,频率是基频的整数倍。
a
10
声音三要素:音高、音色、音强
音高:由基频决定,基频取对数后与人的音高 感觉成线性关系。
音色:有混入基音中的泛音决定。 音强:幅度,听觉与声音信号强度不成线性关
a
13
2.2 声音信号数字化
1. 从模拟信号到数字信号
模拟信号:在时间与幅度上都连续,连续
记为x(t). 离散信号:按一定的时间间隔T,得到的
x(nT).
T为抽样周期,1/T抽样频率
量化:把抽样序列x(nT)量化成一个有限个幅 度之的集合x’(nT).
a
14
a
15
对模拟音频信号进行采样量 化编码后,得到数字音频。数字 音频的质量取决于
a
21
5. 音频数据率
未经压缩的数字音频数据率(bit/s)= 采样频率(Hz)×量化位数 (bit)×声道数
音频数据存储量(Byte)= 数据率(bit/s)×持续时间(s) / 8
存储量=采样频率×量化位数/8×声道数×时间
例:采样率11.025KHz、量化位8位,采集1分钟, 则:音频数据率=11.025(KHz)×8(bit) = 88.2 (Kbit/s) 音频数据量=11.025(KHz)×8(bit) ×60(s)/8= 0.66 (MByte)