1.3多媒体技术简介
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
点位图像
矢量图像(图形)——使用计算机合成或
制作的图像
动态图像(视频)
矢量图形
矢量图:用一 些指令表示一 幅图。 例: ➢画1条100像 素长的红色直 线 ➢画1个半径为 50像素的圆
——多幅(帧)静态图像以每秒≥25幅的 速度播放时,利用视觉暂留现象就成为连续 图像,一般伴随声音。(获取设备:摄像 头、摄像机等)
Midi文件记录的是乐曲演奏的内容,而不是实际的声音; 数据量极小,易于编辑、处理 缺点:播放的声音效果依赖于播放MIDI的硬件质量,只能合成音乐,不能合成歌
曲和语言; 产生MIDI音乐的方法:FM 合成法、波表合成法。
Mp3 文件格式
采用MPEG-1层3(Layer 3)标准对WAV音频压缩而成
彩色图像的像素通常由3个彩色分量组成
假设3个分量分别用8个二进位表示,则可表示224=16,777,412 种 不同的颜色
静止图像压缩编码的国际标准
JPEG标准(文件扩展名是 .jpg)
是第一个静止图像压缩的国际标准 制定了二种压缩编码的方案:
离散余弦变换为基础的有损压缩编码方案 以预测技术为基础的无损压缩编码方案
Internet,MP3音乐
算法复杂度中等,用于数字音频广播(DAB)和VCD等
编码较复杂,用于互联网高质量声音的传输,如MP3音乐(压缩 10倍, 1张CD光盘可存100首MP3歌曲)
有线电话通信系统(国际电信联盟ITU)
G.711:PCM编码,码率:64kb/s G.721:ADPCM编码,码率:32kb/s
多媒体的特性
信息媒体的多样性。 交互性。用户可主动地编辑、处理各种信息,
具有人机交互功能。
电视不是多媒体系统,能传播但不能编辑、处理 多媒体信息
集成性。多媒体技术中集成了许多单一的技术, 如图像处理、声音处理技术等。
对用户而言,它们是集成一体的,包括信息的统 一获取、存储和组织
实时性。用户可实时地控制多媒体信息
取样视频
计算机合成视频
(2).数字图像的获取
1)画面划分成M×N阵列网格,每个网格为一个取样点(像素)
2)将每个取样点的颜色分解成R、G、B三基色(灰度,黑白则不分色)
模 拟 图 像
扫描
3)测量每个取样 点的分量的亮度 值
4)对取样点的每个分量的亮度值 进行A/D转换,用8~12位二进制 正整数表示
图例1分0色像:24数一×据幅76量180RG×=242像×取取4÷素7样样68总8==的数2223×3400量量位4图4化化×K真像B1≈彩深0222245图度.4542B5像÷M的8B数 字 图容量为:
容量与分辨率、图像深度有关
像
B 取样
量化 154
(3).图像的表示与压缩编码
图像深度:一个像素的所有颜色分量的二进位数目之和
采样、量化
模 拟
麦克风
声 (microphone)
音
声音卡
数 字
(sound card) 声
音
输出设备 输
音响等
出
声音的数字化
A/D转换器——模拟/数字转换器
D/A转换器——数字/模拟转换器
采样 模拟声音信号
量化
0110001100 1数···字声音
输 出
目的:把时间上连续的信号 把每个样本从模拟量转换 编码:将所有样
比特率/码率:指每秒钟的数据量
计算公式:(数字声音未压缩前) 波形声音的码率=取样频率×量化位数×声道数 (b/秒)
例:某 PC 机的声卡在处理单声道声音信息时,采样频率 为 44kHz,A/D转换精度为16位。若连续采集2分钟的声 音信息,则在不进行压缩编码的情况下保存这段声音,需 要的存储空间
其它文件格式
.voc ——声霸卡中使用 .au ——UNIX工作站中使用 .aif ——苹果机中使用
媒体的数字化及 数据压缩
(1)图像分类
静态图像
点位图:用
取样图像(点阵图像、位图图像)——从
2、图像
M(列)×N(行) 个像素表示图
现实世界中通过数码相机或扫描仪等设备 获取的图像。
像
JPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数 码相机中已得到广泛应用。
最新版本:JPEG 2000
(4).常用的数字图像格式
.bmp——是Windows采用的图像文件存储格式; .gif——供联机图形交换使用,目前在网络中广泛使用; .jpg(jpeg)——是第一个静止图像压缩的国际标准 .tiff——广泛应用于桌面出版系统、图形系统、广告制作
转换成时间上离散的信号 成(8位或16位)数字量
本的二进制代码
采样频率:每秒钟采样的次 ➢位数越大,样本精度越高,组织在一起,并
数。
同时需要的存储空间也越 进行数据压缩
➢一般取声音频率的2倍
多
➢采样频率越高(44KHz),
声音还原越好
(2). 数字声音的压缩编码
波形声音的主要参数
取样频率、量化位数、声道数目、使用的压缩编码方法、比特率
44K×16×(60×2)÷ 8 ≈ 11MB
全频带声音压缩编码标准
编码简单,用于数字盒式录音磁带
名称
MPEG-1层1 MPEG-1层2
MPEG-1层3
压缩后的码率(每个声道) 声道数目
192kbps(压缩4倍)
2
128kbps(压缩6倍)
2
64kbps(压缩12倍)
2
主要应用
数字盒式录音带 DAB,VCD
第1章 计算机基础知识
1.3 多媒体技术简介
多媒体的概念与 特点
媒体(又称:媒介/媒质/载体)
指文字、声音、图象、动画和视频等内容 多媒体:以上两个或以上对象的组合
多媒体技术
利用计算机技术对多媒体进行采集、操作、编 辑、存储等综合处理的技术。
多媒体计算机( MPC):具有多媒体处理 能力的ຫໍສະໝຸດ Baidu算机
移动通信和IP电话:由于带宽较窄,必须常用更有效的语 音压缩编码
(3)常用的数字声音格式
.wav 文件格式
Windows采用的波形文件存储格式,数据量大;
.midi 文件格式(其他扩展名: .mid 、 .r mi)
规定了乐器、计算机、音乐合成器以及其他电子设备之间交换音乐信息的一组标 准。
媒体的数字化及 数据压缩
1、数字声音
声波转换为电信号
(1)波形声音的获取与播放
声音由振动产生,通过空气进行传播的 连续的波(声波),它由许多不同频率 的谐波组成。
带宽:谐波的频率范围
多媒体处理的声音主要是人耳可听到的 声音(audio)
全声道:20Hz~20kHz 语音(人的说话声音): 300~3400 Hz
矢量图像(图形)——使用计算机合成或
制作的图像
动态图像(视频)
矢量图形
矢量图:用一 些指令表示一 幅图。 例: ➢画1条100像 素长的红色直 线 ➢画1个半径为 50像素的圆
——多幅(帧)静态图像以每秒≥25幅的 速度播放时,利用视觉暂留现象就成为连续 图像,一般伴随声音。(获取设备:摄像 头、摄像机等)
Midi文件记录的是乐曲演奏的内容,而不是实际的声音; 数据量极小,易于编辑、处理 缺点:播放的声音效果依赖于播放MIDI的硬件质量,只能合成音乐,不能合成歌
曲和语言; 产生MIDI音乐的方法:FM 合成法、波表合成法。
Mp3 文件格式
采用MPEG-1层3(Layer 3)标准对WAV音频压缩而成
彩色图像的像素通常由3个彩色分量组成
假设3个分量分别用8个二进位表示,则可表示224=16,777,412 种 不同的颜色
静止图像压缩编码的国际标准
JPEG标准(文件扩展名是 .jpg)
是第一个静止图像压缩的国际标准 制定了二种压缩编码的方案:
离散余弦变换为基础的有损压缩编码方案 以预测技术为基础的无损压缩编码方案
Internet,MP3音乐
算法复杂度中等,用于数字音频广播(DAB)和VCD等
编码较复杂,用于互联网高质量声音的传输,如MP3音乐(压缩 10倍, 1张CD光盘可存100首MP3歌曲)
有线电话通信系统(国际电信联盟ITU)
G.711:PCM编码,码率:64kb/s G.721:ADPCM编码,码率:32kb/s
多媒体的特性
信息媒体的多样性。 交互性。用户可主动地编辑、处理各种信息,
具有人机交互功能。
电视不是多媒体系统,能传播但不能编辑、处理 多媒体信息
集成性。多媒体技术中集成了许多单一的技术, 如图像处理、声音处理技术等。
对用户而言,它们是集成一体的,包括信息的统 一获取、存储和组织
实时性。用户可实时地控制多媒体信息
取样视频
计算机合成视频
(2).数字图像的获取
1)画面划分成M×N阵列网格,每个网格为一个取样点(像素)
2)将每个取样点的颜色分解成R、G、B三基色(灰度,黑白则不分色)
模 拟 图 像
扫描
3)测量每个取样 点的分量的亮度 值
4)对取样点的每个分量的亮度值 进行A/D转换,用8~12位二进制 正整数表示
图例1分0色像:24数一×据幅76量180RG×=242像×取取4÷素7样样68总8==的数2223×3400量量位4图4化化×K真像B1≈彩深0222245图度.4542B5像÷M的8B数 字 图容量为:
容量与分辨率、图像深度有关
像
B 取样
量化 154
(3).图像的表示与压缩编码
图像深度:一个像素的所有颜色分量的二进位数目之和
采样、量化
模 拟
麦克风
声 (microphone)
音
声音卡
数 字
(sound card) 声
音
输出设备 输
音响等
出
声音的数字化
A/D转换器——模拟/数字转换器
D/A转换器——数字/模拟转换器
采样 模拟声音信号
量化
0110001100 1数···字声音
输 出
目的:把时间上连续的信号 把每个样本从模拟量转换 编码:将所有样
比特率/码率:指每秒钟的数据量
计算公式:(数字声音未压缩前) 波形声音的码率=取样频率×量化位数×声道数 (b/秒)
例:某 PC 机的声卡在处理单声道声音信息时,采样频率 为 44kHz,A/D转换精度为16位。若连续采集2分钟的声 音信息,则在不进行压缩编码的情况下保存这段声音,需 要的存储空间
其它文件格式
.voc ——声霸卡中使用 .au ——UNIX工作站中使用 .aif ——苹果机中使用
媒体的数字化及 数据压缩
(1)图像分类
静态图像
点位图:用
取样图像(点阵图像、位图图像)——从
2、图像
M(列)×N(行) 个像素表示图
现实世界中通过数码相机或扫描仪等设备 获取的图像。
像
JPEG特别适合各种连续色调的彩色或灰度图像,在计算机和数 码相机中已得到广泛应用。
最新版本:JPEG 2000
(4).常用的数字图像格式
.bmp——是Windows采用的图像文件存储格式; .gif——供联机图形交换使用,目前在网络中广泛使用; .jpg(jpeg)——是第一个静止图像压缩的国际标准 .tiff——广泛应用于桌面出版系统、图形系统、广告制作
转换成时间上离散的信号 成(8位或16位)数字量
本的二进制代码
采样频率:每秒钟采样的次 ➢位数越大,样本精度越高,组织在一起,并
数。
同时需要的存储空间也越 进行数据压缩
➢一般取声音频率的2倍
多
➢采样频率越高(44KHz),
声音还原越好
(2). 数字声音的压缩编码
波形声音的主要参数
取样频率、量化位数、声道数目、使用的压缩编码方法、比特率
44K×16×(60×2)÷ 8 ≈ 11MB
全频带声音压缩编码标准
编码简单,用于数字盒式录音磁带
名称
MPEG-1层1 MPEG-1层2
MPEG-1层3
压缩后的码率(每个声道) 声道数目
192kbps(压缩4倍)
2
128kbps(压缩6倍)
2
64kbps(压缩12倍)
2
主要应用
数字盒式录音带 DAB,VCD
第1章 计算机基础知识
1.3 多媒体技术简介
多媒体的概念与 特点
媒体(又称:媒介/媒质/载体)
指文字、声音、图象、动画和视频等内容 多媒体:以上两个或以上对象的组合
多媒体技术
利用计算机技术对多媒体进行采集、操作、编 辑、存储等综合处理的技术。
多媒体计算机( MPC):具有多媒体处理 能力的ຫໍສະໝຸດ Baidu算机
移动通信和IP电话:由于带宽较窄,必须常用更有效的语 音压缩编码
(3)常用的数字声音格式
.wav 文件格式
Windows采用的波形文件存储格式,数据量大;
.midi 文件格式(其他扩展名: .mid 、 .r mi)
规定了乐器、计算机、音乐合成器以及其他电子设备之间交换音乐信息的一组标 准。
媒体的数字化及 数据压缩
1、数字声音
声波转换为电信号
(1)波形声音的获取与播放
声音由振动产生,通过空气进行传播的 连续的波(声波),它由许多不同频率 的谐波组成。
带宽:谐波的频率范围
多媒体处理的声音主要是人耳可听到的 声音(audio)
全声道:20Hz~20kHz 语音(人的说话声音): 300~3400 Hz