多媒体音频技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
音频信号的采样 采样信号的量化
33
在相同的采样频率下,量化位数越高, 声音还原的层次越丰富,表现力越强,声 音效果越好,但数据量也越大。 。
34
采样与量化过程示例
对图1中的原始模拟波形(红线)进行采样 和量化。采样频率:1000次/秒,量化位数: 0-9共10个量化等级,并将采样的幅度值用最 接近0-9中的一个数来表示,采样效果如图所 示,图中每个长方形表示一次采样。
27
声音数字化过程示意图
连续的模拟声音信号
声音信号的采样
顺序
离散的音频信号
28
何谓采样? 对模拟音频信号的连续波形进行分割使之 变成离散数字信号的方法,称为采样。 采样的过程是每隔一个时间间隔在模拟音 频的波形上取一个幅度值,把时间上连续的 模拟信号变成时间上离散的数字信号。该时 间间隔称为采样周期,其倒数为采样频率。
14
1857年,法国发明家斯科特(Scott)发明 了声波振记器,这是最早的原始录音机,是留 声机的鼻祖。
1877年,爱迪生发明了一种录音装置,可 以将声波变换成金属针的震动,然后将波形刻 录在圆筒形腊管的锡箔上。当针沿着刻录的轨 迹行进时,便可以重新发出留下的声音。这个 装置录下了爱迪生朗读的《玛丽有只小羊》的 歌词:“玛丽抱着羊羔,羊羔的毛象雪一样 白”,共8秒钟的声音成为世界录音史的第一声。
43.07 86.13
8
43.07
86.13
44.1
16
86.13
172.27
21
电声技术把声信号转换成电信号,经 扩音系统直接进行扩音;或者将其信号利 用磁带、CD或其他存储形式,使声音可超 越时间和空间,通过重放系统将信号放大, 由扬声器或耳机转换成声信号,进入最后 的终端---人耳,以实现任何时间和地点的 声音重现。
电声转换、音频信号的存储、重放技 术、加工处理技术以及数字化音频信号的 编码、压缩、传输、存取、纠错等技术, 是音频技术的主要研究对象。
多媒体音频技术
2021/7/11
2.1 数字音频基础
2.1.1 声音的基本概念 2.1.2 声音的数字化 2.1.3 数字音频的文件格式
2
2.1.1 声音的基本概念
日常生活中的音频信号分为三类:自 然声、音乐和语音。其中,自然声和音 乐不具有复杂的语义和语法信息,信息 量低、识别简单。语音是语言的物质载 体,包含了丰富的语言内涵,是人类进 行信息交流所特有的形式。
3
音频信号 音频信号的分类
分类
注释
不规则声音
一般指不携带信息的噪音
视听效果
语音 规则声音 音乐
是指具有语言内涵和人类约 定俗成的特殊媒体
规范的符号化了的声音
音效
指人类熟悉的其它声音, 如动物发声、机器产生的声 音、自然界的风雨雷电等。
4
声音
我们之所以能听到日常生活中的各种声 音,实质是不同频率的声波通过空气产生 震动,刺激人耳的结果。
42
声音数字化计算公式 数据量=采样频率(Hz)×量化位数(b)×声道数/8(字节/秒)
采样频率、量化位数、声道数、与声音数据量的关系
采样频率 量化位数
(kHz)
(bit)
数据量(KB/s)
单声道
立体声
8 11.025
16
10.77 21.53
21.53 43.07
8 22.05
16
21.53 43.07
电声技术是研究可听声波频率范围内声音 的产生、传播、存储、重放和接收的技术。
20
顾名思义,电声技术是依靠“电”来记录并 播放声音的,基本原理是通过电压产生模拟声 波变化的电流信号,并记录下来,这种电流信 号便被称之为“模拟信号”。传统的声音记录 方式就是将模拟信号直接记录下来,例如磁带 和唱片,磁带上磁极的变化和唱片音槽内的纹 路起伏变化都是与声音信号的变化相对应、成 正比的。唱片、盒式磁带等是记录储存这种模 拟声音信号的载体,而能够播放和记录这些载 体的信号处理设备,诸如电唱机、磁带录音机 等,则称为模拟音响设备。
CD-DA(激光唱盘)
FM广播
频带
AM广播 电话
10 20 50 200
3.4k 7k 15k 20k
f(Hz)
12
音频测音频试测试仪仪((AUADIUO TDEISOT) TEST)
13
声音处理技术的回顾
语言、音乐和各种自然声是以声波为载 体传递信息的基本形式。人类很早就开始 研究声音,并利用当时已掌握了的声音的 某些规律来制造乐器、进行传声装置设计, 使发出的声音传得更远。可是几千年来, 人类只能凭耳朵来辨别声音的高低、强弱, 而不能把声音记录和储存起来。所以与其 他研究领域相比,对声音的研究相对滞后。
22
随着计算机技术的发展,海量存储设备和大 容量内存的出现,声音的数字化处理成为可能 。数字化处理的核心是对音频信息的采样,通 过对采集到的样本进行加工,生成各种效果。
音频信息在多媒体中的应用极为广泛,当计 算机配有声卡和音箱后,就能发出各种悦耳的 声音;图像配以解说和背景音乐,可使图像充 满生气;立体声音乐可增加空间感,使人身临 其境;此外,多媒体通信、语音电子邮件、可 视电话、电视会议等环境都离不开数字化音频 处理技术。
39
影响数字音频质量的技术参数:量化位数
量化位数也称“量化等级”,是描述每个 采样点样值的二进制位数。经常采用的有8位、 12位和16位。量化位数越高,声音质量越好。
40
影响数字音频质量的技术参数:声道数
声道数是指声音通道的个数,即一次采样 所记录产生的声音波形个数。若每次生成一 个声波数据,称为单声道;每次生成两个声 波数据,பைடு நூலகம்为双声道(立体声)。很显然, 立体声要比单音效果好,但所占用的存储空 间也成倍增加。
15
1878年,爱迪生成立制造留声机的公司,生 产商业性的锡箔唱筒。这是世界第一代声音载体 和第一台商品留声机(gramophone) 。之后, 其他录音形式的留声机相继出现。到1912年,圆 筒式录音被淘汰。
1924年,贝尔实验室成功进行了电气录音, 录音技术得到很大提高。1925年,世界上第一 台电唱机诞生。
37
图3
从图中的 轮廓线可以 看出,信号 的失真明显 减少,信号 质量得到了 提高。
图4
采样率:2000次/秒 量化等级:20
采样率:4000次/秒 量化等级:40
38
影响数字音频质量的技术参数
影响模拟音频数字化质量的主要参数有: 采样频率、量化位数和声道数
采样频率是指计算机每秒钟采集多少个 声音样本。采样频率通常采用三种: 11.025KHz(语音效果)、22.05KHz(音乐效果)、 44.1KHz(高保真效果)。常见的CD唱盘的采 样频率即为44.1KHz。
(a) 模拟音频信(号b) 音频信号的采样 29
采样频率越高,即采样的间隔时间越 短,在单位时间内得到的声音样本数据就 越多,经过离散数字化的声波越接近于起 源时的波形,也就意味着声音的保真度越 高,声音的质量越好。
(a) 模拟音频信号(b) 音频信号的采样 30
为什么要进行量化?
采样只是在时间坐标轴上把音频波形信 号分成若干个等分的数字化过程,但是每 一等分的长方形的高是多少呢? 即需要用某 种数字化的方法来反映某一瞬间声波幅度 的电压值的大小。该值的大小影响音量的 高低。
图1
35
当以图1中得到的数值重构原来信号时, 得到图2中蓝色直线段所示的波形。从图中可 以看出,蓝色线与红色线(原波形)相比,波 形的细节部分丢失了很多。这意味着重构后 的信号波形有较大的失真。
图2
36
失真在采样过程中是不可避免的,如何 减少失真呢?从图1中不难看出,如果采 用更高的采样频率,即把图1中的波形划 分成更为细小的区间,同时,选取更高的 量化等级,即增加量化精度,就可以减少 失真的程度。
41
数字音频文件的存储量
通过对影响声音数字化质量的三个因素的 分析,可以得出模拟声音数字化后音频文件 的存储量(假定未经压缩)为:
存储量=采样频率×量化位数×声道数×采样时间/8
例如,数字激光唱盘的标准采样频率为 44.1 kHz,量化位数为16位,立体声,录 制一分钟所需的存储量为
44.1k×16×2×60÷8 = 10335 KB
声音是粒子运动的结果,是通过一定介 质传播的连续的波,在物理学上可用一条 连续的曲线来表示,称为声波曲线。
5
下图是用声音录制软件记录的英文单词 “Hello”的语音实际波形。
无论声波曲线多复杂,都可分解成一系列 正弦波的线性叠加。
6
声波
声波是时间和幅度上都连续变化的模拟 量,单一频率的声波可用一条正弦波曲线 表示(如图),声波有三个重要的参数:振 幅、周期和频率。
周期


t
9
振幅和频率不变的声音信号,称为单音。 单音一般只能由专用电子设备产生。在日常生活 中,我们听到的自然界的声音一般都属于复音, 其声音信号由不同的振幅与频率合成而得到。复 音中的最低频率称为复音的基频(基音),是决 定声调的基本要素,它通常是个常数。复音中还 存在一些其它频率,是复音中的次要成分,通常 称为谐音。基频和谐音合成复音,决定了特定的 声音音质和音色。
1935年,德国柏林的通用电气公司研制成功 了使用塑料磁带的磁带录音机。1963年,荷兰 生产了音频盒式磁带,唱片的黄金年代渐渐流逝。
16
手提手摇式留声机
胶木留声机
17
文革时期留声机
大喇叭留声机
18
电唱机
19
留声机是采用机械的方法把各种声音记录 在唱片上。可是声音、机械振动不容易传递, 也不容易放大,机械方法很不方便。随着电 学、电子学的发展,人们开始尝试用电来记 录下这些真实的声音,利用把声的振动转换 成电信号的原理,使声音的记录成为可能。 最终电声技术获得了迅速发展。
23
数字化声音
● 声音采样、量化和编码 —— 声音数字化 (模/数转换)
把声音(模拟量)按照固定时间间隔,转换成有限个数字表示的离散序列
声音采样
11011100 11001101
● 声音重放 —— 声音模拟化 (数/模转换)
把数字化声音转换成模拟量,经过音响单元重放出来
11011100
声音重放
● 设备和软件
周期


t
7
振幅:通常是指音量,是声波波形的高 低幅度,表示声音信号的强弱程度,用 分贝(dB)表示。
周期:是指两个相邻声波之间的时间长
度,即重复出现的时间间隔,以秒(s)为
单位。
振 幅
周期
t
8
频率:是指每秒钟波峰出现的次数,即周期 的倒数,以赫兹(Hz)为单位。表示声音音调 的高低,频率越高声音越细尖。
音频信号的采样 采样信号的量化 31
何谓量化?对声波波形幅度的数字化表示称 为量化。
量化过程:将采样后的信号按整个声波的幅 度划分成有限个位段的集合,把落入某个位段 内的样值归为一类,并赋于相同的量化值。
音频信号的采样 采样信号的量化
32
量化方法:采取二进制的方式,以8位或 16位的方式来划分纵轴。若以8位来划分,纵 轴将被分为28 (256)个量化等级,即每个采样 值可以用256个不同的量化值之一来表示;若 以16位为量化位数,纵轴将被分为216 (65536) 个量化等级。
(1) 声音适配器 (声卡) 8bit、16bit、… 128bit ¥ 80.00~3800.00 (2) 声卡驱动软件以及各种声音处理软件
24
2.1.2 声音的数字化
为使计算机能处理音频,必须把模拟声音 信号转变为数字声音信号,这个过程称为声 音的数字化。音频信号数字化后,就变为由 0、1代码组成的bit信号, 就可以在计算机上 存储、编辑和处理了。
10
频率:是指每秒钟波峰出现的次数,即周期 的倒数,以赫兹(Hz)为单位。表示声音音调 的高低,频率越高声音越细尖。
声波按频率分为三类:次声波、可听声波和 超声波。
次声波 可听声波 超声波 f(Hz)
20Hz
20000Hz
人说话的语音频率:300Hz-3kHz。
11
声音的质量
所谓声音的质量,简称音质。是指经传输、 处理后音频信号的保真度。声音的质量用声 音信号的频率范围(频带)来表示,不同种 类的声源其频带也不同。一般而言,声源的 频带越宽,表现力越好,层次越丰富,声音 的效果越好。声音质量分为四级:
采样和量化
影响数字音频质量的技术参数
数字音频文件的存储量
25
A/D转换器
模拟信号
数字信号
D/A转换器
借助于A/D或D/A转换器,模拟信号 和数字信号可以互相转换
8 位可编程 A/D 转换芯片
26
采样和量化
模拟音频信号的数字化过程是通过对 音频信号的采样、量化和编码来实现的, 如下图所示:
100101100011101
相关文档
最新文档