声音的合成
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0011 0010 0001 0000 1001
1010 1011
常用声音信号与采样频率
声音信号 采样频率
CD音乐
44.1K
Biblioteka Baidu
数字电话 16K
数字电话 8K
信号带宽
20K 7K 3.4K
声音采样
11011100 11001101
采样频率 Hz 11,025 22,050 44,100 11,025 22,050 44,100
3.录音编辑声音合成的分析
(1)以录音编辑的方式进行声音合成,需要 大容量的存储设备
(2)为了让一定容量的存储设备能存储更多 的声音信息,需要对声音信息的数据量进 行压缩
(3)通过编码的方式,减少声音信息中的冗 余性是实现声音信息压缩的基本方法。
三、脉冲代码调制PCM
脉冲代码调制 PCM(pulse code modulation) 是一种对模拟信号的编辑 声音信号是一种模拟信号,经PCM编码后,变
数据长度 bit 8 8 8 16 16 16
数据量/分钟 0.66 MB 1.32 MB 2.64 MB 1.32 MB 2.64 MB 5.29 MB
音质评价 低
一般 良好
中 良好 优秀
• 4 .音频文件的种类及特点
• (1)MIDI文件(电子乐器数字接口)
• 是用于在音乐合成器、电子乐器、 音序器和计算机之间交换音乐信息 的一种标准协议。
2.基于音节的编辑合成方式
在任何语言中,音节的数量比单词的数量少 很多;
基于音节的编辑方式在合成时的检索、控制 变得十分方便;
基于音节的合成方式的音质较差,很难表现 人们在讲话时的各种情感和声调的变化;
根据发音耦合的原理和要求,人们对单词的 发音制定了一定的规则,基于这种规则进 行声音合成,可以得到较好的声音效果。
第二章 声音的合成
一、音频信号
• 1 .声音是一种波
• 声波可以在空气中传播,也可以在液体及 固体中传播。
• 声音三要素 • (1) 音调 — (高低) • (2) 音强 — (强弱) • (3) 音色 — (特质)
• 2 .音质
音质与频率范围成正比,频率范围 越宽音质越好 • 3 .声音采样 • 把声音信号按固定的时间间隔,转 换成有限个数字表示的离散序列。
寸小,音质好
声音文件
● WAV —— Wave,波形音频文件 (.wav) ● MIDI —— Musical Instrument Digital Interface,
乐器数字化接口文件 (.mid)
WAV文件
MIDI文件
特点: [1] 真实记录自然声波形 [2] 基本无数据压缩 [3] 数据量大
• 与Mp3、Wav等音频格式不同的是MIDI的播 放质量很大程度上取决于硬件或软件的音 源环境,也就是说同样的MIDI文件在不同 的电脑上可能有非常明显的效果差别,究 其原因是因为它们调用的波表音色库不一 样
声音文件:24.9K
声音文件:16K
• (2) WAVE (Waveform Audio)波形音频文件
成数字信号 通常所说的PCM录音就是一种数字录音。
1.基本原理
PCM编码过程: (1)对模拟声音信号进行采样
采样信号
振
采样周期
幅
t
(2)将各个采样点的声音信号值通过模∕数 变换(A ∕ D转换)变换成由0和1组成的 脉冲变换序列
码字序列
正值
0011 0010 0001 0000 1111 1110 1101
STOP
特点: [1] 纪录音符、时值、通道 [2] 使用电子键盘乐器 [3] 数据量小
STOP
教学进程
二、录音编辑
1.基于句子和单词的录音编辑方式
可以预先将句子、单词作为录音的单位, 对录音、讲话所涉及的有关句子或单词逐个 进行录音并保存
为了实现这种录音编辑方式,应事先存 入大量的有关单词、句子(即需要大量的存 储空间),声音合成时还需要快速地检出和 呈现(需要高速的检索和控制)。
负值
模拟信号
(3)在PCM(脉冲代码调制)中所分配码字 的首位为符号位,
信号为正时,首位为0
信号为负时,首位为1
(4)对声音采样的频率称为采样频率:f
经采样后对每一个采样点分配的码字为a位,
用于存储1秒钟的声音信号所需的存储容量为 f·a ,它也表示了传递声音信号所需的速率。
例:
设声音信号的采样频率为10KHz,PCM编码所 分配码字长度为8bit,传送该声音信号所 需的传递速率应不低于
• MPEG音频文件的压缩是一种有损压缩, MPEG3高压缩率,基本保持低音频部分不 失真,但是牺牲了声音文件中12KHz到 16KHz高音频这部分的质量来换取文件的尺 寸
• 相同长度的音乐文件, 用*.mp3格式来储存, 一般只有*.wav文件 的1/10,而音质要次 于CD格式或WAV格式
的声音文件。文件尺
10×103×8=8×104 bit∕s
(5)PCM录音及其声音合成系统
话筒
A∕D 变换器
录音
大容量 存储器
D∕A 变换器
扬声器
2.采样与量化
(1)在PCM调制中,采样频率应是声音信号 中最高频率的两倍以上
• 多媒体系统、音乐光盘制作,记录物理波形,数 据量大
• WAVE格式文件是以RIFF为标准的
• 在Windows中,把声音文件存储到硬盘上的扩展名 为WAV。WAV记录的是声音的本身,所以它占 的硬盘空间大的很。例如:16位的44.1KHZ的立体 声声音一分钟要占用大约10MB的容量,和MIDI相 比就差的很远。
• 标准格式的WAV文件和CD格式一样,也是 44.1K的采样频率,速率88K/秒,16位量化 位数
• WAV格式的声音文件质量和CD相差无几
• MP3也就是指的是MPEG标准中的音频部分, 也就是MPEG音频层。根据压缩质量和编码 处理的不同分为 3层,分别对应 “*.mp1”/“*.mp2”/“*.mp3”这3种声 音文件。
• MIDI实质上是由MIDI控制器(或MIDI文件) 产生的指示电子音乐合成器要做什么、怎 么做(如演奏某个音符、加大音量、生成 音响效果)的一套标准指令。MIDI不是声 音信号,在MIDI电缆上传送的不是声音, 而是动作指令。
• 由于MIDI只是记录音乐信息的数字代码, 所以生成的文件比较小,便于传播,也便 于编辑修改