数字音频基础知识

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数字音频专业知识
3.6 常见的数字音频文件格式 常见的数字音频文件格式有很多,每种格式都有自己的优 点、缺点及适用范围。 CD格式——天籁之音 CD音轨文件的后缀名为:cda 标准CD格式是44.1K的采样频率,速率88K/秒,16位量 化 位数,近似无损的。 CD光盘可以在CD唱机中播放,也能用电脑里的各种播放 软件来重放。一个CD音频文件是一个*.cda文件,这只是一 个索引信息,并不是真正的包含声音信息,所以不论CD音乐 的长短,在电脑上看到的―*.cda文件都是44字节长。
声音基础知识
1.5
声道
声道(sound channel / track)是分开录音然后结合起来以便同 时听到的一段声音。 ①单声道 早期的声音重放(playback/ reproduction )技术落后,只有单 一声道(mono / monophony ),只能简单地发出声音(如留声机、 调幅AM 广播); ②立体声(双声道) 双声道的立体声(stereo )技术(如立体声唱机、调频FM 立体声广播、 立体声盒式录音带、激光唱盘CD-DA ),利用人耳的双耳效应,感受到 声音的纵深和宽度,具有立体感。
数字音频专业知识
3.7 音频格式的转换 声音的来源十分广泛,我们收集到的各种声音文件的格式 也常常多种多样。由于播放环境等因素的影响,并不是所有音 频格式都能被很好支持的,这就需要对音频文件格式进行转 换。 能够实现音频格式转换的工具很多,如 Audio Converter、千千静听、Gold Wave等,每种软件 都有自己的特点,操作方法也略有不同。
数字音频专业知识
3.4 编 码 采样和量化后的信号还不是数字信号,需要把它转换成数字编 码脉冲,这一过程称为编码。最简单的编码方式是二进制编码, 即将已经量化的信号幅值用二进制数表示,计算机内采用的就是 这种编码方式。 模拟音频经过采样、量化和编码后所形成的二进制序列就是数 字音频信号,我们可以将其以文件的形式保存在计算机的存储设 备中,这样的文件通常称之为数字音频文件。 PCM编码 PCM(Pulse Code Modulation),即脉冲编码调制,指 模拟音频信号只经过采样、模数转换直接形成的二进制序列,未 经过任何编码和压缩处理。PCM编码的最大的优点就是音质好, 最大的缺点就是体积大。在计算机应用中,能够达到最高保真水 平的就是PCM编码,常见的WAV文件中就有应用。
数字音频专业知识
3.1 模拟音频的数字化 对于计算机来说,处理和存储的只可以是二进制数,所以 在使用计算机处理和存储声音信号之前,我们必须使用模数转 换(A/D)技术将模拟音频转化为二进制数,这样模拟音频就 转化为数字音频了。所谓模数转换就是将模拟信号转化为数字 信号,模数转换的过程包括采样、量化和编码三个步骤。模拟 音频向数字音频的转换是在计算机的声卡中完成的。
低音:音色深沉浑厚,擅于表现庄严雄伟和苍劲沉着的感情。(鼓 声)
声音基础知识
响度(loudness ) 响度:又称音量、音强,指人主观上感觉声音的 大小,由―振幅(amplitude)和人离声源的距离 决定,振幅越大响度越大,人和声源的距离越小, 响度越大。(单位:分贝dB)
声音基础知识
音色(music quality) 音色:又称音品,由发声物体本身材料、结构决定。 每个人讲话的声音以及钢琴、提琴、笛子等各种乐器 所发出的不同声音,都是由音色不同造成的。
声音基础知识
1.4
声音的三要素

音调 响度(音量/音强) 音色
人们就是根据声音的三要素来区分声音。
声音基础知识
音调(pitch ) 音调:声音的高低(高音、低音), 由―频率‖ (frequency)决定,频率越高音调越高。 声音的频率是指每秒中声音信号变化的次数,用Hz 表示。例 如,20Hz 表示声音信号在1 秒钟内周期性地变化20 次。 高音:音色强劲有力,富于英雄气概。擅于表现强烈的感情。
数字音频专业知识
3.5 音频压缩 音频压缩属于数据压缩的一种,是减小数字音频信号文件 大小(数据比率)的过程。 一般数据的压缩方法对于音频数据 不利,很少能将源文件压缩到87%以下。音频压缩算法:无 损压缩算法和有损压缩算法 无损压缩是对未压缩音频进行没有任何信息/ 质量损失的 压缩机制。 有损压缩是尽可能多得从原文件删除没有多大影响的数据, 有目的地制成比原文件小多的但音质却基本一样。 一般来说, 无损压缩比率在源文件的50–60% 左右,而有损压缩可以达 到原文件的5–20% 。
数字音频专业知识
WMA格式——最具实力的敌人
WMA (Windows Media Audio) 由微软开发。音质 要强于MP3格式,更远胜于RA格式,它以减少数据流量但保 持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩 率一般都可以达到1:18左右。 内置了版权保护技术,可以限制播放时间和播放次数甚至 于播放的机器等等 。 WMA格式在录制时可以对音质进行调节。同一格式,音 质好的可与CD媲美,压缩率较高的可用于网络广播。
声音基础知识
1.2
声音的传播
声音靠介质传播,真空不能传声。 介质:能够传播声音的物质。 声音在所有介质中都以声波形式传播。 音速 声音在每秒内传播的距离叫音速。 声音在固体、液体中比在气体中传播得快。15º C 时空气中的 声速为340m/s 。
声音基础知识
1.3 声音的感知 外界传来的声音引起鼓膜振动经听小骨及其他组织传给听觉神经, 听觉神经再把信号传给大脑,这样人就听到了声音。 双耳效应的应用:立体声 人耳能感受到(听觉)的频率范围约为20Hz~ 20kHz,称此 频率范围内的声音为可听声(audible sound)或音频(audio), 频率<20Hz声音为次声,频率>20kHz声音为超声。 人的发音器官发出的声音(人声)的频率大约是80Hz~ 3400Hz。人说话的声音(话音voice / 语音speech)的频率 通常为300Hz~3000 Hz(带宽约3kHz)。 传统乐器的发声范围为16Hz (C2)~7kHz(a5),如钢琴的 为27.5Hz (A2)~4186Hz(c5)。
认识数字音频
2.2 数字信号
在某些特定的时刻对这种模拟信号进行测量叫做采样(sampling),在 有限个特定时刻采样得到的信号称为离散时间信号。采样得到的幅值是无穷 多个实数值中的一个,因此幅度还是连续的。把幅度取值的数目限定为有限 个的信号就称为离散幅度信号。 我们把时间和幅度都用离散的数字表示的信号就称为数字信号 (digital signal)。 从模拟信号到数字信号的转换为模数转换,记为A/D(Analog-toDigital);从数字信号到模拟信号的转换为数模转换,记为D/A(Digitalto-Analog)。
数字音频专业知识
数字音频专业知识
人们日常生活听到的各种声音信息是典型的连续信号,它 不仅在时间上连续,而且在幅度上也连续,我们称之为模拟音 频。在数字音频技术产生之前,我们只能用磁带或胶木唱片来 存储模拟音频,随着技术的发展,声音信号逐渐过渡到了数字 化存储阶段,可以用计算机等设备将它们存储起来。
LOGO
数字音频基础知识
数字音频基础知识
1
2 3
声音基础知识 认识数字音频
数字音频专业知识
声音基础知识
声音基础知识
1.1 声音的产生
声音是由振动产生的。物体振动停止,发声也停止。当振动波传到人 耳时,人便听到了声音。 人能听到的声音,包括语音、音乐和其它声音(环境声、音效声、自 然声等),可以分为乐音和噪音。 乐音 是由规则的振动产生的,只包含有限的某些特定频率,具有确定 的波形。 噪音 是由不规则的振动产生的,它包含有一定范围内的各种音频的声 振动,没有确定的波形。
数字音频专业知识
Ra格式——流Biblioteka Baidu的旋律 RealAudio主要适用于在网络上的在线音乐欣赏,现在大 多数的用户仍然在使用56Kbps或更低速率的Modem,所以 典型的回放并非最好的音质。 有的下载站点会提示你根据你的Modem速率选择最佳的 Real文件。
数字音频专业知识
APE格式 一种新兴的无损音频编码,可以提供50-70%的压缩比, APE的文件大小大概为CD的一半,APE可以节约大量的资源。 APE可以做到真正的无损,而不是听起来无损,压缩比也 要比类似的无损格式要好。 特点:音质非常好。 适用于:最高品质的音乐欣赏及收藏
Moving Picture Experts Group Audio Layer III), 是当今较流行的一种数字音频编码和有损压缩格式。是ISO标 准MPEG1和MPEG2第三层(Layer 3),采样率16-48kHz, 编码速率8K-1.5Mbps。 特点:音质好,压缩比比较高,被大量软件和硬件支持, 应用广泛。 适用于:适合用于一般的以及比较高要求的音乐欣赏。
数字音频专业知识
WAV格式——无损的音乐 WAV为微软公司开发的一种声音文件格式。 标准格式化的WAV文件和CD格式一样,也是44.1K的取 样频率,16位量化位数,声音文件质量和CD相差无几! 特点:音质非常好,被大量软件所支持。 适用于:多媒体开发、保存音乐和原始音效素材。
数字音频专业知识
MP3格式——流行的风尚
数字音频专业知识
MIDI——作曲家的最爱 MIDI(Musical Instrument Digital Interface) 乐器数字接口 MIDI数据不是数字的音频波形,而是音乐代码 或称电子乐谱。MIDI文件每存1分钟的音乐只用大约5~ 10KB。 MID文件主要用于原始乐器作品,流行歌曲的业余表演, 游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声 卡的档次。
数字音频专业知识
3.2 采 样 采样是指将时间轴上连续的信号每隔一定的时间间隔抽取出 一个信号的幅度样本,把连续的模拟量用一个个离散的点表示 出来,使其成为时间上离散的脉冲序列。 每秒钟采样的次数称为采样频率,用f表示;样本之间的时 间间隔称为取样周期,用T表示,T=1/f。例如:CD的采样 频率为44.1kHz,表示每秒钟采样44100次。 常用的采样频率有8kHz、11.025Hz、22.05kHz、 15kHz、44.1kHz、48kHz等。
数字音频专业知识
3.3 量 化 量化是将采样后离散信号的幅度用二进制数表示出来的过 程。 每个采样点所能表示的二进制位数称为量化精度,或量化 位数。 量化精度反映了度量声音波形幅度的精度。例如,每个声 音样本用16位(2字节)表示,测得的声音样本值是在0~ 65536的范围里,它的精度就是输入信号的1/65536。 常用的采样精度为8bit/s、12 bit/s、16bit/s、 20bit/s、24bit/s等。
认识数字音频
认识数字音频
2.1 模拟信号
音频信号是典型的连续信号,不仅在时间上是连续的,而且在 幅度上也是连续的。在时间上―连续,是指在任何一个指定的时 间范围里声音信号都有无穷多个幅值;在幅度上―连续‖是指幅 度的数值为实数。 我们把在时间(或空间)和幅度上都是连续 的信号称为模拟信号(analog signal)。
声音基础知识
③环绕声(多声道) 多声道的环绕声(surround sound)重放方式(如4.1、5.1、6.1、 7.1声道),将多只喇叭(扬声器speaker)分布在听者的四周,建立 起环绕聆听者周围的声学空间,使听者感受到自己被声音包围起来,具 有强烈的现场感(如电影院、家庭影院、DVD-Audio、SACD、 DTS-CD、HDTV)。
数字音频专业知识
在对模拟音频进行采样时,取样频率越高,音质越有保证; 若取样频率不够高,声音就会产生低频失真。那么怎样才能避 免低频失真呢? 著名的采样定理(Nyquist 定理)中给出有明确的答案: 要想不产生低频失真,采样频率至少应为所要录制的音频的最 高频率的2 倍。例如,电话话音的信号频率约为3.4 kHz , 采样频率就应该≥6.8 kHz ,考虑到信号的衰减等因素,一般 取为8kHz 。
相关文档
最新文档