多媒体信息编码
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
● midi音频 ● wav音频 ● mp3压缩音频
音频数字信号、压缩音频信号
● 视频对象
文字 图形 图像 动画 音频 视频
END
音频 + 视频 Audio Vedio Information 视频数字信号AVI、压缩视频信号MPG
一、音频信息
1.基本概念
声波:声源体发生振动会引起四周空气 振荡,振荡方式就是声波。 复杂的声波由许许多具有不同振幅
示1分钟,则需要: 1280×1024×3×30×60 ≈ 6.6 GB
2.图像的数字化
• 采样 用多少个像素点的“列数×行数”表示,分辨率越高,图像 越清晰,存储量也越大。
• 量化 量化是在图像离散化后,将表示图像色彩浓淡的连续变化值离 化为整数值的过程。 把量化时所确定的整数值取值个数称为 量化级数,也称为颜色深度.
二、数字图像及处理
1.基本概念
• 图形和图像 图形:由点、线等组成的有边界画面,文件中存放描述图形的指令。 图像:由图像设备输入的无边界画面,数字化后以位图形式存储。
• 图形与图像的数字化 分辨率(行、列)和颜色深度 真彩色每个像素点占3个字节,224=16777216 种颜色。 计算存储一秒图像公式: 列数×行数×像素的颜色深度/8 ×帧/秒=字节数 例:1280×1024分辨率的“真彩色”电视图像, 按每秒30帧计算,显
图像
采样
量化
数字图像
颜色深度
①黑白图 图像的颜色深度为1,则用一个二进制位1和0表示纯白、 纯黑两种情况;
②灰度图 图像的颜色深度为8,占一个字节,灰度级别为256级。通 过调整黑白两色的程度(称颜色灰度)来有效地显示单色图像;
③RGB 24位真彩色 彩色图像显示时,由红、绿、蓝三基色通过不 同的强度混合而成,当强度分成256级(值为0~255),占24位, 就构成了224=16777216种颜色的“真彩色”图像。
模拟信号
采样
量化
编码
数字信号
模拟信号
采样
采样 每隔一定时间间隔对模拟 波形上取一个幅度值。
量化 将每个采样点得到的幅度值 以数字存储。
量化
振幅
0111000111000 编码成数字信号
T
采样点
T 振幅
频率 1/T
编码 将采样和量化后的数字数据
以一定的格式记录下来
1/T
3.数字音频的技术指标
采样频率、量化位数和声道数
•WMF格式文件 位图与矢量图的混合体, Windows中许多剪贴画图像 是以该格式存储的。广泛应用于桌面出版印刷领域。
• RA格式文件(.ra) RA(Real Audio)是Real Network公司制定的音频压缩规
范,有较高的压缩比,采用流媒体的方式在网上实时播放。
5.声音的录制与播放
“录音机”是用于声音文件的录制与播放,还可以对 声音进行编辑和特殊效果处理。
• 录制声音 • 编辑声音
删除声音 当前位置之前或之后 插入声音 移动声音 删除和插入间接完成
● 位图图像对象
文字 图形 图像
用像素点描述的自然影像
● 动画对象
文字 图形 图像 动画
单画面矢量动画 多画面帧动画
FRAME 01 FRAME 02 FRAME 03 FRAME 04 FRAME 05 FRAME 06 FRAME 07
单画面矢量动画和多画面帧动画
● 音频对象
文字 图形 图像 动画 音频
采样频率: 每秒钟的采样次数
量化位数(采样精度) :存放采样点振幅值的二进制位数。通常
量化位数有8位、16位,分别表示有28、216个等级。
声道数 :声音通道的个数 ,立体声 为双声道。
每秒钟存储声音容量的公式为:
采样频率×采样精度×声道数/8=字节数
例如,用44.10 kHz的采样频率,16位的精度存储,则录制1秒钟的 立体声节目,其WAV文件所需的存储量为: 44 100×16×2/8=176 400(字节)
2.常用图像文件格式
•BMP和DIB格式文件 与设备无关的位图格式文件,Windows环境中经常使用.
•GIF格式文件 Internet上的重要文件格式之一,最大不超过64 KB, 256色以内,压缩比较高,与设备无关。
•JPEG格式文件(.JPG) 利用JPEG方法压缩, Internet上重要文件格式之一, 适用于处理256色以上、大幅面图像。
灰度图
彩色图
图像的分辨率和像素位的颜色深度决定了图像文件的大小, 计算公式为: 列数×行数×颜色深度÷8=图像字节数
例8.2 当要表示一个分辨率为640×480的“24位真彩色”图 像,则需要: 640×480×24÷8≈1MB
由此可见,数字化后的图像数据量十分巨大,必须采用编码 技术来压缩信息。它是图像传输与存储的关键。
第四章 数制和信息编码 多媒体信息编码
多媒体分类
通常,人们将文本、音频、视频、图形、图像、 动画的综合体笼统称为“多媒体”。由此可见,多 媒体信息包括以下5种:
文本 图形、图像 动画 声音 视频影像
文字和符号
多媒体 多媒体 多媒体
各类文字和符号
● 矢量图形对象
文字 图形
通过计算而描述的矢量图形
和频率的正弦波组成。 周期T:重复出现的时间间隔;
A
振幅A:波形相对基线的最大位移, 表示音量的大小;
频率f:信号每秒钟变化的次数,即1/T 以赫兹(Hz)为单位。
周期
T
振幅 A
f
声音按频率分类
次声波
可听声波
超声波
f(HZ)
20HZ
20kHZ
20kHZ
正常人所能听到的声音频率范围
超声波
为20 Hz~20 kH把z调。制信号从低频搬移到了高频,以便利用电
声音质量的频率范围:
离层传播,
CD 如随身听 FM次:调声波频 AM:调幅
可听声波
调频声音的高低变为频C率D-的DA变化的电信号, 调幅就是用声音的高低变FM为广幅播度的变化的电信
号A.M 广播
电话
10 20 50 200 3.4k 7k 15k 20k
f(HZ) 20kHZ
2.模拟音频的数字化
用计算机对音频信息处理,就要将模拟信号(如语音、音乐 等)转换成维数字信号。
采样频Βιβλιοθήκη Baidu和量化参数比较
4.数字音频的文件格式
• Wave格式文件(. Wav) 记录了真实声音的二进制采样数据,通常文件较大。
• MIDI格式文件(.MID) 数字音乐的国际标准. 记录的是音符数字,文件小。
• MPEG音频文件(.MP1/.MP2/.MP3) 采用MPEG音频压缩标准进行压缩的文件。