第二章数字声音及MIDI-资料

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
幅与频率合成而得到。
模拟声音信号:可分解成一系列正弦波的 线性叠加。
最低频的音波称为基音,频率为基频 其余的为泛音,频率是基频的整数倍。
声音三要素:音高、音色、音强
音高:由基频决定,基频取对数后与人的音高 感觉成线性关系。
音色:有混入基音中的泛音决定。
音强:幅度,听觉与声音信号强度不成线性关 系,因而用20log幅度(分贝)表示
1. 从模拟信号到数字信号
模拟信号:在时间与幅度上都连续,连续 记为x(t).
离散信号:按一定的时间间隔T,得到的 x(nT).
T为抽样周期,1/T抽样频率
量化:把抽样序列x(nT)量化成一个有限个幅 度之的集合x’(nT).
对模拟音频信号进行采样量 化编码后,得到数字音频。数字 音频的质量取决于
声音信号:
有许多不同频率的信号组成,又称复合信号。
带宽:组成复合信号的频率范围。
纯音:单一频率的声音。
声音是由空气中分子的振动而产生的。自 然界的声音是一个随时间而变化的连续信号, 可近似地看成是一种周期性的函数。通常用模 拟的连续波形描述声波的形状,单一频率的声 波可用一条正弦波表示,如下图所示。
•采样频率 •量化位数 •声道数
采样频率
采样频率是指一秒钟时间内采样的次数。 在计算机多媒体音频处理中,采样频率通
常采用三种:11.025KHz(语音效果)、 22.05KHz(音乐效果)、44.1KHz(高保真效 果)。常见的CD唱盘的采样频率即为 44.1KHz。
量化位数
量化位数也称“量化精度”,是描述每个 采样点样值的二进制位数。
语音(speech)
人的声音不仅是一种波形,而且还有内在的语言、 语音学的内涵,可以利用特殊的方法进行抽取, 通常将语音也作为一种媒体。
音乐
音乐是符号化了的声音。这种符号就是乐曲,乐 谱是转化为符号媒体的声音。电子乐器数字接口 (musical instrument digital interface, MIDI ) 是十分规范的一种形式。
振 幅
周期
基线
•基线是测量模拟信号的基准点。 •声波的振幅表示声音信号的强弱程度。 •声波的频率反映出声音的音调,声音细尖 表示频率高,声音粗低表示频率低。
•振幅和频率不变的声音信号,称为单音。 单音一般只能由专用电子设备产生。
•在日常生活中,我们听到的自然界的声音 一般都属于复音,其声音信号由不同的振
简谱 1 2 3 4 5 6 7
频率 261 293 330 349 392 440 494
20log频率 48.3 49.3 50.3 50.8 51.8 52.8 53.8
(1). 采样和量化 数字化音频的过程如下图所示。
(a) 模拟音频信号
(b) 音频信号的采样
(c) 采样信号的量化
2.2 声音信号数字化
声音的质量与数据率
根据声音的频带,把声音的质量分为5个 等级
质量
采样频率 分辨率 (KHz) (b/s)
单声道/ 数据率 频率范围
带宽与听觉
次声带
音 频 ( Audio) 带 宽
超声带
语 音 ( Speech) 带 宽
20 300 f(Hz)
3K
20K
18k
Hertz,Amplitude, Frequency infra-sound, ultrasound, hypersound
感知声音的幅度:用dyne(达因)/平方厘米 表示,常转换成0—120dB(decibel),但对不 同的频率,同样的声强,感觉不同。
声音:通过空气传播的一种连续的波, 又称声波。
声音的度量:频率与幅度(声波压力的 大小)
频率用音高表示,幅度用声强表示 与看得见的水波类似
波形声音
波形声音,实际上包含了所有的声音形式。任何 声音信号,包括麦克风、磁带录音、无线电和电 视广播、光盘等各种声源所产生的声音,都要首 先对其进行模数转换,然后再恢复出来。
2. 声音数字化:
Sampling, Quantization, Coding 采样频率与量化精度
3.采样频率
奈奎斯特(Nyquist)定理(1928年提出原理, 仙侬(Shannon)形成定理并应用,1933年卡 切尼科夫用公式表述):
采样频率2f
这里f为被采样信号的最高频率。
4. 量化精度
第二章数字声音及MIDI-资料
第二章 数字声音及MIDI
信息:数、文、形、音、图 音频:麦克风、扬声器 多媒体计算机:
声音的输入、存储、处理、输出
声音:消息、意向、情感
表示方式 汉字内码 点阵 声音
Fra Baidu bibliotek
数据量
表达信息
2-4字节
编码
32—数百字节 汉字形、体
几千字节
声学、意向、情感
2.1 声音与听觉
量化: 取样值(-,+)有限个数(量化 值近似)
若量化值有J个,若用二进制表示,需要 R=log2(J) 位
量化误差:用有限的离散值表示无限多的连 续值,必然存在误差. 该误差又称为量化噪 声(与一般的噪声不同)。
采样精度可以用信噪比表示: R为编码位数
SN1Rl0g(量 信化 号误 的 )差 1 方 l0的 g(差 sn 2 2i方 o gin)sa el6差 R
5. 音频数据率
未经压缩的数字音频数据率(bit/s)= 采样频率(Hz)×量化位数 (bit)×声道数
音频数据存储量(Byte)= 数据率(bit/s)×持续时间(s) / 8
存储量=采样频率×量化位数/8×声道数×时间
例:采样率11.025KHz、量化位8位,采集1分钟, 则:音频数据率=11.025(KHz)×8(bit) = 88.2 (Kbit/s) 音频数据量=11.025(KHz)×8(bit) ×60(s)/8= 0.66 (MByte)
例如,8位量化位数表示每个采样值可以用 28即256个不同的量化值之一来表示,而16 位量化位数表示每个采样值可以用216即 65536个不同的量化值之一来表示。常用的 量化位数为8位、12位、16位。
声道数
声音通道的个数称为声道数,是指一次 采样所记录产生的声音波形个数。
记录声音时,如果每次生成一个声波数据, 称为单声道;每次生成两个声波数据,称 为双声道(立体声)。随着声道数的增加, 所占用的存储容量也成倍增加。
相关文档
最新文档