数字声音简介

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

录制音频文件；在音频文件中进行剪切、粘贴、合并、重叠声音操作；提供有多种特效如放大、降低噪音压缩、扩展、回声、延迟、失真、调整音调等。可以生成噪音、低音、静音、电话信号等声音；其他功能有自动静音检测和删除，自动节拍查找等；另外，它还可以在多种文件格式之间进行转换。
2. Cool Edit 2000 应用程序界面
采样频率与声音的质量关系最为紧密。采样频率越高，声音质量越接近原始声音，所需的存储量便越多。标准的采样频率有： 44.1KHz，22.05kHz，11.025kHz，8KHz等。
标准采样频率
采样频率 8KHz
11.025KHz
采样次数/s 8000
11025
声音质量电话音质
AM音质
22.05KHz
3. 音乐形式更加规范，符号化了的声音，乐谱可转变为符号媒体形式。
其它几个基本概念 • 纯音：振幅和周期均为常数的声音。 • 复音：由不同频率和不同振幅的声波组合起来的声音。
语音、乐声、自然界中的大部分声音都不是纯音。
• 基音：复音中频率最低的声波。
是决定声音音调的基本因素，通常为常数。
4. 数据量的计算
声道数：指一次采样所记录产生的声音波形个数
（立体声：要求声道数至少是2个）
数据量（字节/秒）=采样频率 * 采样字长 * 声道数）/8
数字声音相关的参数
质量采样频率（kHz） 8 11.025 样本精度 8 8 单道声/ 数据率立体声（kb/s）单道声单道声 64 88 频率范围（kHz） 200～3400 50～7000
fs >= 2f
举例说明：
电话音质：电话话音的信号最高频率约为3.4kHz，采样频率就应大于6.8kHz。选择一个标准采样频率： 8kHz。
CD音质：人耳听觉的上限为20kHz，因此要获得较佳的听觉效果，采样频率要达到40kHz以上。选择一个标准采样频率：44.1kHz。
3.量化
为了把采样序列存入计算机，必须将样值量化为一个有限个幅度值的集合。通常用二进制数字表示量化后的样值。量化的过程：先将整个幅度划分为有限个小幅度（量化阶距）的集合，把落入某个阶距内的样值归为一类，并赋予相同的量化值。
量化噪声：量化误差，量化后的样本值和原始值的差，随量化间隔变大而增加。 - (Δ/2) <= e(n) <= (Δ/2) 量化位数/采样字长：表示采样值的二进制位数（比特数），决定了采样值的精度。
电话 AM
FM
CD DAT
22.050
44.1 48
16
16 16
立体声
立体声立体声
705.6
1411.2 1536
20～15000
20～20000 20～20000
计算：
一张CD唱盘容量为640MB，问最多能存储多长时间的CD音质，采样字长为16bit 的双声道立体声歌曲？
每秒：(44.1K*16*2/8) = 176400 Byte (640*1024*1024)/176400 = 3804 s = 1h 3min 24s

四、音频的存储格式
如同存储文本文件一样，存储声音数据也需要有存储格式。 .wav格式主要用在PC上， .au主要用在Unix工作站上， .aiff和snd主要用在苹果机和美国视算科技有限公司的工作站上。 MIDI格式 CD.DA格式 MP3格式 MP3采用MPEG Layer 3标准对WAVE音频文件进行压缩而成，以达到CD唱盘的音质。 RM格式RM采用音频/视频流和同步回放技术来实现在互联网上提供优质的多媒体信息。
(2). 录制声音利用Windows 提供的“录音机”程序可分别录制来自麦克风、外接音频信号等的声音。根据需要把声卡的MIC IN插孔与话筒相连，或者把 LINE IN与其它声音输入设备(例如录放机、CD唱机等)的线性输出端相连。录制一个声音文件的操作步骤如下：步骤1 执行【文件】|【新建】命令。步骤2 单击“录音”按钮。步骤3 打开麦克风开关并对着麦克风说话或者打开其它的信号输入开关。步骤4 结束录音时，单击“停止”按钮。步骤5 执行【文件】|【保存】。
44.1KHz 48KHz
22050
44100 48000
FM音质
CD音质 DAT音质
说明：DAT指数字录音带格式（Digital audio type）
2. 采样定理
奈奎斯特理论（Nyquist Theory）认为数字采样频率的大小由声音信号本身的最高频率决定。指出：进行无损的数字化转换，采样频率至少是所采信号所含最高频率的2 倍。
三、音频信号数字化
声音是连续信号，以连续波的形式传播。而计算机只能处理数字信号，为使计算机能处理音频信号，必须对音频信号数字化。
声源声波传声器从模拟到数字模拟电信号数字声音
模拟信号数字化的步骤：采样、量化、编码 1. 采样
采样：连续信号离散化，即按一定的时间间隔取值。 ADC (Analogue Digital Converter) 采样频率：每秒钟的采样次数
• 谐音：复音中其他频率的声波，或称泛音。
基音和谐音组合起来，决定了特色声音的音色（音质）。
声音质量的度量
声音的质量与声音的带宽有关，一般来说频率范围越宽，声音质量也就越高。
声音类型带宽
电话语音
调幅广播调频广播 CD
200Hz－3.4kHz
50Hz－7kHz 20Hz－15kHz 20Hz－20kHz
例如：
bit，可以表示65536个不同量化值，精度（阶距）1/ 65536。量化位数8 bit，可以表示256个不同量化值，精度（阶距）1/ 256。
量化位数16
整个过程描述：
采样值电压范围量化(dec) 编码(bin)
0.5 ~ 0.7 0.3 ~ 0.5 0.1 ~ 0.3 -0.1 ~ 0.1 -0.3 ~ -0.1 -0.5 ~ -0.3 -0.7 ~ -0.5 -0.9 ~ -0.7 3 2 1 0 -1 -2 -3 -4 011 010 001 000 111 110 101 100
数字声音
第一节数字声音
声音的本质
• • • • • 声音是携带信息的极其重要的媒体（20％）声音是通过空气传播的一种连续的波，叫声波，也具有反射、折射和衍射现象。声音信号是由许多频率不同的分量信号组成的复合信号。复合信号的频率范围称为带宽。带宽为20Hz－20kHz的信号称为音频（audio）信号，可以被人的耳朵感知。声音是时基类媒体。
(7). 混合粘贴：执行Edit|Mix Paste命令可以在当前插入点混合剪贴板中音频数据或其它音频文件数据。
5. 音频的基本编辑
在Cool Edit 2000中，不管进行什么操作，都要首先选择需要处理的区域，如果不选，Cool Edit 2000则认为要对整个音频文件进行操作。 (1). 删除：好要操作的选区，执行Edit|Delete Selection命令或直接按DEL键就可删除当前被选择的音频片段，这时后面的波形自动前移。 (2). 剪切：执行Edit|Cut命令将当前被选择的片段从音频中移去并放置到内部剪贴板上。
(4). Transform菜单 Transform菜单提供多种音频特效改变命令. 如改变音量、静音、反转、降低噪音、延迟效果. 失真处理、调整音调等。 (5). Generate菜单 Generate菜单提供生成噪音、低音、静音、电话信号等声音的命令。 (6). Analyze菜单 Analyze菜单提供文件或选择区域的频率分析命令。 (7). Options菜单 Options菜单包含特征或用户定制选项命令.
MIDI音频（MIDI audio）:电子合成器合成的声音，文件格式 *.mid。 CD唱盘数字音频（CD audio）: 数字采样技术制作的，把数字位1和0通过激光刻写在盘片上（形式为微小的长短不等的凹坑），重放时用激光读出数据，再通过D/A转换成模拟信号。
第二节声音工具
1. 音频的获取途径
一、基本概念
声音：人耳所感觉到的空气分子的震动，由振动的声波组成。声音主要有以下类型：
1.
波形声音从声音是振动波的角度而言，包含所有的声音形式。
2. 语音人的说话声虽是一种特殊的媒体，也是一种波形声音，更重要的是它包含有丰富的语言内涵，可以经过抽象，提取特定成分，理解其意义。(80Hz－3400Hz)
音频数据的获取方法主要有以下几种： (1). 使用声卡录制、采集声音信息，并以文件的形式存储在计算机中。 (2). 使用声卡及MIDI设备在计算机上创作乐曲。 (3). 从互联网下载或购买音频光盘。
利用Windows提供的“录音机”程序可以录制、播放、编辑数字波形声音文件。 (1). 录音机操作界面录音机的操作界面如下图所示：
二、声音的三要素
声音的三要素是指音调、音强和音色。
音调：与声音的频率有关，频率快则声音高，频率慢则声音低。次声可听声<20HZ—20kHZ> 超声音强：又称响度，取决于声音的振幅，也即振幅的大小和强弱。音色：由混入基音的谐音决定。每个基音都有其固定频率和不同音强的谐音，使得每个声音具有特殊的音色效果。
(3). 拷贝：执行Edit|Copy命令将拷贝选区到内部剪贴板上。 (4). 粘贴：执行Edit|Pastet命令将内部剪贴板上的数据插入到当前插入点位置。 (5). 粘贴到新文件：执行Edit|Paste to new命令可插入剪贴板中的波形数据创建一个新文件。 (6). 拷贝到新文件：执行Edit|Copy to new命令创建一个新文件插入被选择的波形数据。
4. 音频的录制
安装好声卡，将麦克风与声卡的MIC IN连接或将线性输入设备如录音机、CD唱机等输出端与声卡的LINE IN接口正确连接。然后运行 Cool Edit 2000 程序，执行 File|New命令，弹出对话框。在对话框中选择采样频率、量化位数、声道数后单击“确定”。然后单击功能键中的录音按钮，开始录音，录制完毕单击停止按钮停止录音。最后执行 File|Save命令保存声音文件。
3. 音频数据的编辑
音频数据的编辑包括声音的剪辑(删除片段. 插入声音、混入声音)、特殊效果的添加等操作。除了Window 自带的“录音机”程序可进行音频的制作编辑外，目前广泛使用的音频处理软件还有 Sound Forge、Wave Edit、Cool Edit等。
Cool Edit Pro 2.0
波形文件格式*.wav：数字方式表示声波，存储对波形采样后得到的数字化信息。波形文件格式支持存储各种采样频率和样本精度的声音数据，并支持声音数据的压缩。波形文件有许多不同类型的文件构造块组成，其中最主要的两个文件构造块是Format Chunk(格式块)和Sound Data Chunk(声音数据块)。格式块包含有描述波形的重要参数，例如采样频率和样本精度等，声音数据块则包含有实际的波形声音数据。RIFF中的其他文件块是可选择的。
一款非常出色的音频录制、编辑、处理、混缩软件。
音频编辑软件Cool Edit 2000 简介
1. Cool Edit 2000 的功能 2. Cool Edit 2000 应用程序界面 3. Cool Edit 2000 菜单结构
4. 音频的录制
5. 音频的基本编辑 6. 音频特殊效果编辑
1. Cool Edit 2000 的功能
Cool Edit 2000 应用程序界面主要由标题栏、菜单栏、工具条、状态栏、编辑区等组成。
3. Cool Edit 2000 菜结构
(1). File菜单 File菜单主要包括Cool Edit 2000的文档操作命令。 (2). Edit菜单 Edit菜单提供基本的音频编辑命令。如剪切、粘贴、混合粘贴(插入、合并、重叠声音)操作、删除、全选、自动静音检测和自动节拍查找等命令。 (3). View菜单 View菜单包含用于改变显示的有关命令。