第二章数字声音及MIDI-资料

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

幅与频率合成而得到。
模拟声音信号：可分解成一系列正弦波的线性叠加。
最低频的音波称为基音，频率为基频其余的为泛音，频率是基频的整数倍。
声音三要素：音高、音色、音强
音高：由基频决定，基频取对数后与人的音高感觉成线性关系。
音色：有混入基音中的泛音决定。
音强：幅度，听觉与声音信号强度不成线性关系，因而用20log幅度（分贝）表示
1. 从模拟信号到数字信号
模拟信号：在时间与幅度上都连续，连续记为x(t).
离散信号：按一定的时间间隔T，得到的 x(nT).
T为抽样周期，1/T抽样频率
量化：把抽样序列x(nT)量化成一个有限个幅度之的集合x’(nT).
对模拟音频信号进行采样量化编码后，得到数字音频。数字音频的质量取决于
声音信号：
有许多不同频率的信号组成，又称复合信号。
带宽：组成复合信号的频率范围。
纯音：单一频率的声音。
声音是由空气中分子的振动而产生的。自然界的声音是一个随时间而变化的连续信号，可近似地看成是一种周期性的函数。通常用模拟的连续波形描述声波的形状，单一频率的声波可用一条正弦波表示，如下图所示。
•采样频率 •量化位数 •声道数
采样频率
采样频率是指一秒钟时间内采样的次数。在计算机多媒体音频处理中，采样频率通
常采用三种：11.025KHz(语音效果)、 22.05KHz(音乐效果)、44.1KHz(高保真效果)。常见的CD唱盘的采样频率即为 44.1KHz。
量化位数
量化位数也称“量化精度”，是描述每个采样点样值的二进制位数。
语音（speech）
人的声音不仅是一种波形，而且还有内在的语言、语音学的内涵，可以利用特殊的方法进行抽取，通常将语音也作为一种媒体。
音乐
音乐是符号化了的声音。这种符号就是乐曲，乐谱是转化为符号媒体的声音。电子乐器数字接口（musical instrument digital interface, MIDI ）是十分规范的一种形式。
振幅
周期
基线
•基线是测量模拟信号的基准点。 •声波的振幅表示声音信号的强弱程度。 •声波的频率反映出声音的音调，声音细尖表示频率高，声音粗低表示频率低。
•振幅和频率不变的声音信号，称为单音。单音一般只能由专用电子设备产生。
•在日常生活中，我们听到的自然界的声音一般都属于复音，其声音信号由不同的振
简谱 1 2 3 4 5 6 7
频率 261 293 330 349 392 440 494
20log频率 48.3 49.3 50.3 50.8 51.8 52.8 53.8
(1). 采样和量化数字化音频的过程如下图所示。
(a) 模拟音频信号
(b) 音频信号的采样
(c) 采样信号的量化
2.2 声音信号数字化
声音的质量与数据率
根据声音的频带，把声音的质量分为5个等级
质量
采样频率分辨率（KHz） (b/s)
单声道/ 数据率频率范围
带宽与听觉
次声带
音频（ Audio）带宽
超声带
语音（ Speech）带宽
20 300 f(Hz)
3K
20K
18k
Hertz，Amplitude, Frequency infra-sound, ultrasound, hypersound
感知声音的幅度：用dyne(达因）/平方厘米表示，常转换成0—120dB(decibel),但对不同的频率，同样的声强，感觉不同。
声音：通过空气传播的一种连续的波，又称声波。
声音的度量：频率与幅度（声波压力的大小）
频率用音高表示，幅度用声强表示与看得见的水波类似
波形声音
波形声音，实际上包含了所有的声音形式。任何声音信号，包括麦克风、磁带录音、无线电和电视广播、光盘等各种声源所产生的声音，都要首先对其进行模数转换，然后再恢复出来。
2. 声音数字化：
Sampling, Quantization, Coding 采样频率与量化精度
3.采样频率
奈奎斯特(Nyquist)定理（1928年提出原理，仙侬(Shannon)形成定理并应用，1933年卡切尼科夫用公式表述）：
采样频率2f
这里f为被采样信号的最高频率。
4. 量化精度
第二章数字声音及MIDI-资料
第二章数字声音及MIDI
信息：数、文、形、音、图音频：麦克风、扬声器多媒体计算机：
声音的输入、存储、处理、输出
声音：消息、意向、情感
表示方式汉字内码点阵声音
Fra Baidu bibliotek
数据量
表达信息
2-4字节
编码
32—数百字节汉字形、体
几千字节
声学、意向、情感
2.1 声音与听觉
量化：取样值（-,+）有限个数（量化值近似）
若量化值有J个，若用二进制表示，需要 R=log2(J) 位
量化误差：用有限的离散值表示无限多的连续值，必然存在误差. 该误差又称为量化噪声（与一般的噪声不同）。
采样精度可以用信噪比表示: R为编码位数
SN1Rl0g(量信化号误的 )差 1 方 l0的 g(差 sn 2 2i方 o gin)sa el6差 R
5. 音频数据率
未经压缩的数字音频数据率（bit/s）＝采样频率（Hz）×量化位数（bit）×声道数
音频数据存储量（Byte）＝数据率（bit/s）×持续时间（s） / 8
存储量=采样频率×量化位数/8×声道数×时间
例：采样率11.025KHz、量化位8位，采集1分钟，则：音频数据率＝11.025（KHz）×8（bit）＝ 88.2 (Kbit/s) 音频数据量＝11.025（KHz）×8（bit） ×60（s）/8＝ 0.66 (MByte)
例如，8位量化位数表示每个采样值可以用 28即256个不同的量化值之一来表示，而16 位量化位数表示每个采样值可以用216即 65536个不同的量化值之一来表示。常用的量化位数为8位、12位、16位。
声道数
声音通道的个数称为声道数，是指一次采样所记录产生的声音波形个数。
记录声音时，如果每次生成一个声波数据，称为单声道；每次生成两个声波数据，称为双声道（立体声）。随着声道数的增加，所占用的存储容量也成倍增加。