多媒体信息处理
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
32
6.3.2 数字图像的属性参数和表示方 法
1.图像的属性参数 (1)图像分辨率
对图像采样后得到的像素数目称为图像分辨率,用 “每列点数×行数”表示 例如,640×480表示图像有480行,每行有640个像素
33
(2) 扫描分辨率
7
6.1.3 多媒体技术的特点
1.交互性
从单向的被动接收到双向有选择的交互方式转变
2.多样性
处理对象从文字扩展到声音、图像、动画等多种形式
3.集成性
多种媒体信息有机的组织在一起,共同表达一个完整 的多媒体信息,成为一体化系统。
4.实时性
要求系统有较高的传输速率。
8
8.1.4 多媒体技术的应用
1.商业领域 2.教育和培训 3.远程医疗 4.视听会议 5.文化娱乐 6.电子商务
计算机中分别将三种颜色(红绿蓝)按深浅程度分为 256个级别,取值范围0~255 255级是纯红、纯绿或纯蓝 三种颜色值的不同比例表示不同颜色
31
2. 像素点编码使用的颜色模型
(2)HSB模型
使用颜色的三个特性来区分颜色,即色调、饱和度和 明度
(3)CMY模型
任何一种颜色可以用青色、品红和黄色三种基本颜色 按一定的比例混合得到
9
6.1.5 流媒体技术简介
流媒体
一边下载,一边播放,实现了连续、实时地传送。
优点
应用在现场直播、突发事件报道等对实时性传输要求 较高的场合
缺点
网络速率较低或拥塞时,会造成播放的时断时续。
流媒体格式的文件:.asf、.rm、.ra、.mpg、.flv等
10
6.2 声音处理
计算机处理声音的硬件要求
安装声卡 麦克风连接到声卡的MIC插孔 音箱连接到声卡的SPEAKER插孔
处理过程:
数字化、保存和处理、还原
11
6.2.1 声音的数字化
数字化
将模拟的声音信号转变为数字音频的过程
三个阶段
采样、量化和编码
模拟信号
采样
量化
编码
数字音频
12
(1)采样
采样
每隔一段时间间隔读取一次声音波形的幅度值
采样频率
16
2. 声频卡的主要技术指标
(1)采样频率
11.025kHz、22.05kHz和44.1kHz或更高
(2)编码位数
保存每个采样值使用的二进制编码位数,当前声卡中 常用的有8位、16位和32位
(3) 声道数
产生声音的波形个数,一般为1个(单声道)或2个 (立体声)。
17
3. 存储容量和数据传输率
1
6.1 多媒体技术和多媒体计算机
(1)媒体(Medium)
指信息的表现形式,如数字、文字、声音、图形、图 像和动画。
(2)多媒体(Multimedia)
是指以上提到的信息中多种表现形式有机的结合。
(3)多媒体技术
用计算机交互式地综合处理多种媒体信息,使多种信 息集成为一个具有人机交互功能系统的技术。
2
6.1.1多媒体系统中使用的技术
1.具有多媒体功能的芯片
支持多媒体功能的CPU(MMX)和专门用于音频、视 频处理的芯片
2.光盘存储
– – – – CD盘片容量650MB左右 单面单层的DVD存储容量4.7GB 单面双层DVD的容量8.5GB DVD盘片17GB
3
3.输入输出技术
媒体信息的数字化 媒体的识别与理解 数字化处理后的再现
4
6.1.2多媒体计算机系统的组成
1. 硬件设备 (1)外部输入设备
包括光驱、麦克风、MIDI合成器、扫描仪、录音机、VCD/DVD、 数码照相机、摄像机等。
(2)外部输出设备
包括音箱、立体声耳机、投影仪、刻录机、声卡、打印机等
(3)功能卡
作用:连接各种外部设备,完成音频、视频信息的数字化输入、 编辑和输出 种类:声卡、视频输出卡、VGA/TV转换卡等
16×44.1kHz×2×1/8=176400Byte= 172.265625KB
而存储1分钟这样的声音所需的存储空间为:
176.4KB×60秒= 10335.9375KB=10.09MB
19
20
3. 声音数据的压缩
压缩的原因
声音经数字化后的编码数据量较大,为保存这些数据 就需要较大的空间 为实现实时处理,需要及时传输这些数据,这又要求 有较高的传输率
(1)存储容量计算公式
存储容量(字节) = 采样精度×采样频率×声道数×时间/8
(2)数据传输率
数字化1秒钟的声音或还原1秒钟的声音所需传输的数 据位数
计算公式:
数据传输率(b/s)=采样精度×采样频率×声道数
18
例题
计算1秒钟声音的数据量和1分钟声音所需的存储 空间,已知采样频率为 44.1kHz、采样精度16位、 立体声双声道。 根据公式,1秒钟声音的数据量为:
离散值的个数与采用的编码的二进制位数有关
14
(3)编码
将量化后的幅度值用二进制编码进行表示 采样精度
是指用来表示量化级别的二进制数据的位数,也叫样 本位数、位深度,常用的有8位和16位。 例如:采样精度为8位,可以表示28即256种幅值;采样 精度为16位,可以表示65536种不同的幅值。 采样精度越高,声音质量越高,需要存储空间越大
5
2. 软件设备
支持多媒体处理的软件包括音频处理软件、图像 处理软件、视频处理软件、通信软件、VCD制作 与光盘刻录软件等。
6
3. 多媒体计算机的标准MPC4
(1)CUP要求Pentium133或200 (2)内存16MB以上。 (3)外存1.6GB以上的硬盘、3.5英寸1.44MB软驱 (4)声卡:16位立体声、带波表44.1 kHz /48kHz (5)图形:辨率为1280×1024/1600 × 1200/1900 ×1200,24/32位真彩色 ……
26
6.2.5 WindowsXP中音量的控制
执行“程序”|“附件”|“娱乐”|“音量控制”命令, 打开“音量控制”窗口。
27
6.3 图形图像处理
6.3.1 图像的数字化 (1)采样
将连续图像在二维空间上进行离散化处理
采样方式:
逐行顺序进行,假设在水平、垂直两个方向上分别取 M和N个相等的间隔,那么就可以得到M×N个点,每 个点称为一个图像元素,简称像素(Pixel)或像元
4.数据压缩技术
大的存储空间和较高的传输速率的需要
5.多媒体操作系统
Windows2000、WindowsNT、WindowsXP、Windows Vista 等。
第6章 多媒体信息处理
本章目标
了解多媒体技术的特点和应用领域 掌握声音和图像的数字化原理 了解多媒体文件的格式 掌握声音、图像、视频的基本处理方法
将量化后的每个点的灰度级别或颜色用不同的二 进制编码表示,用这种编码表示的图像就称为 数字图像。 像素深度(位深度)
为每个像素点的颜色或灰度进行编码所使用的二进制 数的位数。 像素深度的值越大表示的颜色数越多,色彩也越丰富 逼真,占用的存储空间越大。
30
2. 像素点编码使用的颜色模型
(1)RGB模型
21
6.2.3 常用的声音文件
1. WAV文件
– – – – Microsoft为Windows提供标准音频格式 文件扩展名为.WAV 事实上的通用音频标准格式 WAV文件主要由采样数据组成,文件的大小与采样 频率、编码位数和声道数有关 – 主要缺点:文件占用的空间较大
22
2. MP3文件
MP3文件可以实现12:1的压缩比例 音质接近CD、制作容易,目前网上使用最多的音频文 件格式 几乎所有的音频编辑工具都支持MP3文件
15
6.2.2 声Biblioteka 卡简介1. 声频卡的关键技术
(1)数字音频:要求必须具有大于44.1kHz的采样频率 和16位的编码位数。 (2)音乐合成:主要有FM合成和波形表合成。 (3)MIDI 乐器数字接口: 规定不同厂家的电子乐器和 计算机连接的方案和设备之间数据传输的标准。 (4)音效: 在硬件上实现回声、混响等各种效果
4. CD-DA格式
光盘数字音频文件,俗称CD音乐,音质较好的音乐
24
6.2.4 声音的录制与播放
Windows中的录音机程序功能
录音、播放、混合声音、添加回音、加速、减速和反 向等简单的音频处理。
启动:
执行“程序”|“附件”|“娱乐”|“录音机”命令
25
主要操作
1.录制声音 2.以不同的格式保存声音文件 3.删除声音文件中的一部分 4.在当前文件中插入另一个声音文件
28
(2)量化
对采样后每个像素点的处理:
单色图像:将每个点量化为两个级别,分别是0和1 黑白图像:将每个点的灰度进行离散化,划分纯白色 和纯黑色和介于这两者之间的不同程度的灰色 彩色图像:要将每个点的颜色的值进行离散化,也就 是使用不同的颜色模型进行颜色编码
量化的等级和像素的颜色编码位数有关
29
(3)编码
23
3. MIDI文件
MIDI是Musical Instrument Digital Interface的缩写,即乐器 数字化接口 规定了电子乐器和计算机之间进行联接的硬件及数据 通信协议 采用数字方式对乐器演奏出来的声音进行记录,在播 放时对这些记录进行合成 文件扩展名是.MID,占用存储空间比音波文件小得多
单位时间内进行采样的次数,通常用赫兹(Hz)表示。 采样频率越高,经过离散的波形越接近原始波形,声音还原质 量也越好,相应地,保存这些信息所需的存储空间也越大
奈奎斯特采样定理
当采样频率高于输入信号中最高频率的两倍时,可以从采样信 号中无失真地重构原始信号。
13
(2)量化
量化
对采样后得到的幅度的值连续信号将其幅度取值数量 加以限定