第7-1章 数据压缩技术-作业06

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

霍夫曼编码— Case Study 1 (续4)
5个符号的代码 个符号的代码
符号 B A C D E 合计 出现的次数 10 8 3 4 5 30 分配的代码 11 10 010 011 00 需要的位数 20 16 9 12 10 67
30个字符组成的字符串需要67位 原先:3*30=90
多媒体数据压缩与编码
• rar、jpeg图像的压缩是??? • 两种类型的数据压缩
– 无损压缩 经过压缩和解压缩后的数据与压缩前的 无损压缩: 原始数据完全一样的数据压缩技术。文本、 原始数据完全一样的数据压缩技术。文本、代码和 数字数据文件必须用无损压缩方法压缩。 数字数据文件必须用无损压缩方法压缩。可把普通 文件大小压缩到原来的25~50%; 文件大小压缩到原来的25~50%;常用的无损压缩 算法包括哈夫曼编码和LZW等算法。 等算法。 算法包括哈夫曼编码和 等算法 – 有损压缩:经过压缩和解压缩后的数据与压缩前的 有损压缩: 原数据不完全一样, 原数据不完全一样,但但不影响人对原始资料表达 的信息造成误解的数据压缩技术。 的信息造成误解的数据压缩技术。电视和声音文件 经常包括多于呈现给观众和听众的信息, 经常包括多于呈现给观众和听众的信息,因此可用 有损压缩方法去掉这些信息, 有损压缩方法去掉这些信息,使压缩后的数据减少 到原来的5% 到原来的
多媒体数据压缩技术
多媒体数据压缩编码技术是多媒体 技术中最为关键的核心技术 核心技术。 技术中最为关键的核心技术。 1. 为什么压缩很重要??? 为什么压缩很重要???
1
DVD
• 目前中国碟机企业每生产一台DVD就要 缴纳22.3~22.5美元 专利费 美元的专利费 美元 专利费,在中国电 子音响工业协会的统一谈判下,每台缴 纳在15美元 美元左右。但是其副秘书长金正 美元 龙告诉记者,目前中国出口DVD每台的 美元左右,这样专利费 专利费其 平均价格在32美元 美元 专利费 实已经占到价格的一半左右。 • AVS
以一幅彩色静态图像(RGB)为例 : 设分辨率为512×512 每一种颜色用8bit表示 即R用8bit 256级别表示 G用8bit 256级别表示 B用8bit 256级别表示 则一幅彩色静态图像的数据量为??? PAL制25帧/秒为例,视频每秒钟的数据量?? ?
3
以一幅彩色静态图像(RGB)为例 : 设分辨率为512×512 每一种颜色用8bit表示 即R用8bit 256级别表示 G用8bit 256级别表示 B用8bit 256级别表示 则一幅彩色静态图像的数据量为 512 ×512×3 ×8 bit PAL 制式 25帧/ 秒 NTSC 制式 30帧/ 秒 以PAL制25帧/秒为例,视频每秒钟的数据量?
5
为什么要压缩
• 为什么要压缩
– 降低多媒体数据对存储器容量的要求 降低多媒体数据对存储器容量 存储器容量的要求 – 降低多媒体数据对传输带宽的要求 降低多媒体数据对传输带宽的要求 传输带宽
多媒体数据压缩技术
• 信息为什么能压缩? • 信息的多种表达方式 方式1,方式2,方式3.。。。。。。
2. 信息的多种表达
霍夫曼编码— 霍夫曼编码 Case Study 1
• 霍夫曼编码举例1
– 现有一个由5个不同符号组成的30个符号的 字符串:
BABACACADADABBCBABEBEDDABEEEBB
– 计算
(1) 该字符串的霍夫曼码 (2) 该字符串的平均码长 (3) 编码前后的压缩比
霍夫曼编码— 霍夫曼编码 Case Study 1 (续1)
多媒体数据压缩与编码
国际莫尔斯电码符号
Symbol
A B C D E F G H I J K L M
Code
.-… -.-. -.. . ..-. ..--. --. …. .. .---..-.. --
Symbol
N O P Q R S T U V W X Y Z
Code
-. --.--. --. --.--. .-. … ....….--....-.---.. --..
Symbol
0 1 2 3 4 5 6 7 8 9
Code
----.---..--..--…-….….….. -…. --... --... ---.. ---.. ----. ----.
Symbol
. , ? : ; / “
Code
.-.-.--..---..-..--.. ..--.. ---… ---… -.-.-. -…-..-. ...-..-. ..-
00000000 111 888 • • • • • • 888 1111 00000000 8个0 3个1 9个8 4个1 8个0
RLE编码
图2-5 RLE编码概念
实例:把一幅两维图像划分成许多8 实例:把一幅两维图像划分成许多8×8子块时, 子块时, 每个子块B(i,j)便含有64个像元之间的灰度值分布情况; 每个子块B(i,j)便含有64个像元之间的灰度值分布情况; B(i,j)便含有64个像元之间的灰度值分布情况 水平扫描后得到的行程为
霍夫曼编码— Case Study 1 (续3)
符号
1 0 0 1 0 1
P1 (7)
1
P3 (18)
B (10) A (8) E (5) D (4) C (3)
0
P2 (12)
P4 (30)
代码 B(11) A(10) E(00) D(011) C(010)
此处:大概率为1 小概率为0 此处:大概率为1,小概率为0
F L A S H
BADHAIRCUT.swf
多媒体数据压缩技术
• 信息为什么能压缩? • 信息的多种表达方式 方式1,方式2,方式3.。。。。。。 哪种表达编码方式的数据量最少?
多媒体数据压缩与编码
• 种类型的数据压缩
– 无损压缩 经过压缩和解压缩后的数据与压缩前的 无损压缩: 原始数据完全一样的数据压缩技术。文本、 原始数据完全一样的数据压缩技术。文本、代码和 数字数据文件必须用无损压缩方法压缩。 数字数据文件必须用无损压缩方法压缩。可把普通 文件大小压缩到原来的25~ 文件大小压缩到原来的 ~50%;常用的无损压缩 ; 算法包括哈夫曼编码和LZW等算法。 等算法。 算法包括哈夫曼编码和 等算法 信息表达方式 =信息表达方式 表达方式1 信息表达方式2 – 有损压缩:经过压缩和解压缩后的数据与压缩前的 有损压缩: 原数据不完全一样, 原数据不完全一样,但但不影响人对原始资料表达 的信息造成误解的数据压缩技术。 的信息造成误解的数据压缩技术。电视和声音文件 经常包括多于呈现给观众和听众的信息, 经常包括多于呈现给观众和听众的信息,因此可用 有损压缩方法去掉这些信息, 有损压缩方法去掉这些信息,使压缩后的数据减少 到原来的5% 到原来的 信息表达方式1≈信息表达方式 信息表达方式2
多媒体数据压缩与编码
• 三种类型的编码
– 熵编码:不考虑数据源的无损数据压缩技术。其核 熵编码:不考虑数据源的无损数据压缩技术。 心思想是按照符号出现的概率大小给符号分配长度 合适的代码,对常用的符号给它分配长度较短(即位 合适的代码,对常用的符号给它分配长度较短 即位 数较少)的代码 的代码, 数较少 的代码,对不常用的符号给它分配长度较长 (即位数较多 的代码。最常见的熵编码技术是霍夫 即位数较多)的代码 即位数较多 的代码。最常见的熵编码技术是霍夫 曼编码和算术编码 – 源编码:考虑数据源特性的数据压缩技术。编码时 源编码:考虑数据源特性的数据压缩技术。 考虑信号源的特性和信号的内容,因此也称“ 考虑信号源的特性和信号的内容,因此也称“基于 语义的编码(semantic-based coding)”。例如,图像 语义的编码 。例如, 编码考虑相邻像素的值可能完全相同或相近 考虑相邻像素的值可能完全相同或相近, 编码考虑相邻像素的值可能完全相同或相近,视像 相邻帧之间的变化不大,也可能完全相同。 相邻帧之间的变化不大,也可能完全相同。为获得 比较大的压缩比,通常采用有损数据编码技术。 比较大的压缩比,通常采用有损数据编码技术。 – 混合编码:组合源编码和熵编码的数据有损压缩技 混合编码: 影视、 术。影视、图像和声音媒体几乎都采用这种编码方 式,如JPEG,MPEG-Video和MPEG-Audio。 , 和 。
原始图象 (512×512×8) × × (262KBytes)
压缩 21:1 (12KBytes)
压缩 51:1 (5KBytes)
Color Image Compression 图像压缩
Using JPEG2000, The compression is 230:1
用JPEG2000 进行压缩, 进行压缩,压 缩比230:1 缩比 :
4Biblioteka Baidu
以一幅彩色静态图像(RGB)为例: 设分辨率为512×512 每一种颜色用8bit表示 即R用8bit 256级别表示 G用8bit 256级别表示 B用8bit 256级别表示 则一幅彩色静态图像的数据量为 512 ×512×3 ×8 bit PAL 制式 25帧/ 秒 NTSC 制式 30帧/ 秒 以PAL制25帧/秒为例,视频每秒钟的数据量 512 ×512×3×8×25=150Mbit 过去计算机的总线为ISA,ISA总线的数据传输率为 150KB/s,变成bit为150×8=1.2Mbps,我们可以想象到,把 180Mbps的视频流经过传输率为1.2Mbps (150KB/ s) 的ISA 总线送出计算机的硬盘 送出计算机的硬盘几乎是不可能的。差不多要压缩近似 送出计算机的硬盘 200倍才行。
霍夫曼编码
• 霍夫曼编码(Huffman coding)
– 霍夫曼(D.A. Huffman)在1952年提出和描述的 “从下到上”的熵编码方法 –根据给定数据集中各元素所出现的频率来压 缩数据的一种统计压缩编码方法。这些元素 (如字母)出现的次数越多,其编码的位数就 越少 –广泛用在JPEG, MPEG, H.26X等各种信息编 码标准中
• 行程长度编码 行程长度编码(Run-Length Coding)
–一种无损压缩数据编码技术,它利用重复的数据单 元有相同的数值这一特点对数据进行压缩。对相同 的数值只编码一次,同时计算出相同值重复出现的 次数。在JPEG,MPEG,H.261和H.263等压缩方法中, RLE用来对图像数据变换和量化后的系数进行编码 – 例: 假设有一幅灰度图像第n行的像素值如图2-5所示。 用RLE编码方法得到的代码为:8031984180
符号出现的概率
符号 B A C D E 合计 出现的次数分配的代码 需要的位数 出现的次数 分配的代码需要的位数 分配的代码 10 8 3 4 5 30 ? ? ? ? ?
霍夫曼编码— Case Study 1 (续2)
(1) 计算该字符串的霍夫曼码
步骤①:按照符号出现概率大小的顺序对符号进行排序 步骤②:把概率最小的两个符号组成一个节点P1(合并) 步骤③:重复步骤②,得到节点P2,P3,P4,……, PN,形成一棵树,其中的PN称为根节点(重复) 步骤④:从根节点PN开始到每个符号的树叶,从上到下 标上0(上枝)和1(下枝),至于哪个为1哪个为0则 无关紧要,但通常把概率大的标成1,概率小的 标成0(标识) 步骤⑤:从根节点PN开始顺着树枝到每个叶子分别写出 每个符号的代码(反向编码)
烽火台 稀有语种
少数民族文字
女书
女书
女书的字来自部份简 单的汉字, 单的汉字,而且做了 许多简化和改造。 许多简化和改造。笔 画简化成点、直线和 画简化成点、 弧线3 弧线3种。
点 击 图 片 播 放 视 频
某个图形或物品也可以作为一种信息的表达。
个人信息的表达
虹膜与指纹。
一种发型可以代表一种个人信息。
8×8 × 图像块
编码结果: 13对 N,L)数值取代了64个像元的灰度值 编码结果:用13对(N,L)数值取代了64个像元的灰度值 64 以少代多思想:编码后,只要存储或传输两个数值(N,L) 以少代多思想:编码后,只要存储或传输两个数值(N,L), 就可取代L个像元的相同灰度值N 就可取代L个像元的相同灰度值N;从而代替大量邻域冗余
相关文档
最新文档