大学计算机基础第3版参考课件-第10讲--图像视频及压缩

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

多媒体技术基础
这些媒体在计算机里都是如何表示的？
声音图像视频
数字图像处理技术
❑颜色的实质
◆是一种光波，视觉系统对可见光的感知结果。

被观察
对象吸收或反射不同波长的光波形成。

❑可见光波长
◆380 nm～780 nm之间的电磁波。

眼睛看到的光常为
多种不同波长的光组合成。

当各种不同的光信号一起
进入眼睛某点时，视觉器官将其混合，作为一种颜色
接收。

❑自然界中的任何一种颜色都可以由红、绿、蓝(R，G，B)这3种颜色的混合来确定
代表波长
700
颜色模型
❑颜色模型是描述颜色的量化方法，也可以称为颜色空间。

❑有源物体：能发出光波的物体
◆RGB模型
◆计算机显示器
❑无源物体：不发出光波的物体
◆CMY模型
◆彩色打印机和彩色印刷系统
RGB颜色模型（有源物体）
国际照明委员会(CIE)规定以700nm(红)、
546.1nm(绿)、435.8nm(蓝)三个色光为三基色。

又称为物理三基色。

自然界的所有颜色都可以通过这
三基色按不同比例混合而成。

相加混色
CMY颜色模型（无源物体）❑任何一种颜色都可以用青色
（Cyan）、品红
（Magenta）和黄色
（Yellow）三种基本颜料按
一定比例混合得到，通常写
成CMY，称为CMY模型。

❑相减混色
CMYK颜色模型
由于彩色墨水和颜料的化学特性，用等量的三种基本颜色得到的黑色不是真正的黑色，因此在印刷术中常加一种真正的黑色（Black ink），所以CMY又写成CMYK 。

RGB模型：越画越亮
CMY模型：越描越黑
❑图像与声音
◆都可以看作是连续信号
声音图像
幅值
RGB值
时间
X
Y
图像：二维连续函数f (x ,y )
声音：一维连续函数f (x )
t
u (t )
x
y
r
g b
按一定的空间间隔自左到右、自上而下提取画面
信息，并按一定的精度进行量化的过程。

像素(pixel)
图像采样量化编码数字图像
X Y
1
、采样
◆对函数f (x ,y )，沿x,y 方向分别以等间隔采样，采样后得到的各个点，称为像素。

◆每个像素用一个颜色值表示
图像采样：空间离散化声音采样：时间离散化
2、量化
采样后的每个像素的取值仍然是连续的，要对颜色的取值进行离散化处理
RGB值
Y
?
声音量化：
幅值离散化
2、量化
方法：将近似的颜色划分为同一种颜色，将颜色取值限定在有限个取值范围内
RGB值
Y
图像颜色量化：颜色聚类
3、编码
将量化后每个像素的颜色用不同的二进制编码表示，于是就得到M×N的数值矩阵
例：单色图：用“1”表示黑色，“0”表示白色
RGB颜色模型（有源物体）
将三原色的强度分为256个级别(0
－255)
每种颜色分量用一个字节表示
3种颜色的不同强度的组合可表示：256×256×256＝16777216种
颜色
RGB 颜色模型
R:200
G:50
B:120
黄(255,255,0)
黑(0,0,0)
绿(0,255,0)青(0,255,255)
蓝(0,0,255)
品红(255,0,255)
白(255,255,255)红(255,0,0)X
Y
CMY 颜色模型（无源物体）
C:55M:205Y:135黄(0,0,255)黑(255,255,255)
绿(255,0,255)
青(255,0,0)
蓝(255,255,0)
品红(0,255,0)
白(0,0,0)
红(0,255,255)
R:200
G:50
B:120
同一幅图像不同采样分辨率的结果
15×10
30×20
60×40
120×80
同一幅图像不同量化等级数的结果
24816
3264128256
数字图像的属性
❑图像分辨率：是指图像采样的点数，用点的“行
数×列数”。

❑像素深度或位深度：数字图像中表示每个像素的
颜色所使用的二进制位数就称为像素深度，它决
定了彩色图像中可以出现的最多颜色数，或者黑
白图像中的最大灰度等级数。

❑扫描分辨率：用每英寸多少点（Dot Per Inch，缩写为DPI）表示。

例子：数字图像的存储空间
例1：计算存储一幅352×288的静态真彩色图像所需的存储空间。

解：每个像素点的颜色RGB用3个字节表示，即
像素深度为24位，则所需存储空间为：
352×288×3B ＝304128B＝297KB
图像的数字化
图像分辨率为1024×768，请指出其对
应的显示器分辨率是多少？
A. 800×6001024×768 1280×1024
B. 1280×1024 1024×768 800×600
C. 1024×7681280×1024800×600
显示器1024×768显示器
1280×1024
显示器800×600
声音图像时间离散化幅值离散化
对每个幅值
二进制编码空间离散化
→像素矩阵
颜色聚类
→有限种颜色
对每个颜色
二进制编码
2018/10/824
这些媒体在计算机里都是如何表示的？
声音图像视频
视频和动画
❑视觉暂留现象（Persistence of vision）
◆在观察景物时，当看到的影像消失后，人眼
仍能继续保留其影像0.1~0.4s的时间
实例：幻盘（thaumatrope）
❑将一幅幅独立的图像按照一定的速率连续播放，在眼前就形成了连续运动的画面
◆每一幅图像称为一帧（frame）
◆播放速率
帧率（frame rate, frame frequency）：每秒钟显示帧的数量（单位：FPS，Hz）
不同帧率的动态图像
动态图像分类：视频与动画
◆动态影像视频（视频）
每一帧图像是实时获取的自然景物图像
◆动画
每一帧图像是由人工或计算机产生的图像
常用软件
❑视频编辑
◆iMovie
◆Movie Maker
◆Adobe Premiere
❑二维动画
◆Flash
◆Animator Pro
❑三维动画
◆3D Max
◆Maya
计算存储1分钟视频所需的存储空间。

每帧分辨率为352×288，每秒25帧，CD音质，6声道。

解：一帧所需存储空间为
352×288×3B ＝304128B＝297KB
25帧/秒，1分钟视频图像容量：
297KB×25×60 = 445500KB ≈ 435MB
1分钟音频容量：
44100×2B×6×60 ≈ 31007.8 KB ≈ 30.3 MB 1分钟视频总容量：
435MB + 30.3 MB = 465.3MB A. 约25 MB
B. 约100 MB
C. 约500 MB
一帧640 480分辨率的真彩色图像，按每秒播放30帧计算，一张容量为650MB 的光盘，能播放多长时间？
A. 10.7 秒
B. 24.7 秒
C. 60.3 秒
D. 125.6 秒
解：真彩色图像，则像素深度为24位。

一帧图
像所需存储空间为：
（640*480*24）/8 = 921600B = 900KB
650MB光盘可播放：
650MB / (900KB*30) ≈ 24.7 秒
多媒体数据压缩
❑数据压缩的必要性
◆数字化后的多媒体信息的数据量是惊人的
需要大容量存储器
网络传输时需要很高带宽
❑目的：便于存储和传输
❑数据压缩的可能性
◆信息冗余
数据量不等于它所包含的信息量
在静态图像中存在的空间冗余
在动态视频中存在的时间冗余
多媒体信息中的数据冗余示例：图像
多媒体信息中的数据冗余示例：视频
多媒体数据压缩
❑数据压缩的方法
◆无损压缩
又称可逆压缩，是指被压缩的数据经过解压缩
（又称还原）后得到的数据与原始数据完全相同 RLE编码(行程编码)、哈夫曼编码、算术编码等
◆有损压缩
有损压缩又称不可逆压缩，是指被压缩后的数据经过解压缩后得到的数据与原始数据不完全相同预测编码、变化编码、混合编码
无损压缩示例
RLE编码(Run-length Encode，行程编码) WWWWWWWWWWWWBWWWWWWWW WWWWBBBWWWWWWWWWWWWWWW WWWWWWWWWBWWWWWWWWWWW
WWW
12W1B12W3B24W1B14W 67个字符18个字符
所需存储空间为：
50×3B＋2×3B＋1×3B＋9×3B＋72×3B = 402B RLE 编码(Run-length Encode ，行程编码)无损压缩示例
RLE编码后得到的代码为：50 (200,30,100) 2 (255,255,255)
1 (0,5,5) 9 (0,0,0) 7
2 (200,30,100)
现所需存储空间为：
(2B+3B)+(2B+3B)+(2B+3B)+(2B+3B)+(2B+3B)= 25B RLE 编码(Run-length Encode ，行程编码)原所需存储空间为：50×3B＋2×3B＋1×3B＋9×3B＋72×3B = 402B 压缩比为：402B/25B＝16:1
39
无损压缩示例
实际问题来了
❑假如你要在网上通过电子邮件发送一幅图
片（thinkpad.bmp，文件大小为5.49MB），但是邮件系统限制可上传图片大小不得
超过500KB
❑此时应该如何处理？
解决方案1：使用WinRAR 进行无损压缩
解决方案2：使用Windows画图“另存为”，进行有损压缩
❑解决方案2：使用Windows画图板“另存为”，进行有损压缩
❑问题解决！
数字图像处理技术体验❑几何处理
◆缩放、裁剪、旋转、
拼接、变形、投影❑算术处理◆加减乘除，如反色、改变对比度、透明度❑高级处理
◆图像增强、复原、分
割、重建、识别
PIL（Python Image Library）Python内置的图像处理库
from PIL import Image
from PIL import ImageChops
from PIL import ImageEnhance ……特效处理（自己去发掘，参加多媒体比赛）
测试用例。