多媒体信息的编码技术

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Page 8
当需要对信源传输率进行较大程度压缩时,基于人类语音生成模型的参 数编码算法比波形编码更为合适。 对于人耳(20~20000Hz)的听觉对发声时频率位置、各频率分量的大 小比较敏感,但对信号在各频率点上的相位却不敏感,因此没有必要保持语 音信号的波形完全一致。参数编码的基本思想是利用具有12~16参数的语音 生成模型进行编码传输,接收方用这些参数合成出具有与原始语音接近的声 音。参数编码的缺点是激励部分参数估计的误差导致合成出的声音质量较 低,且伴有噪声。 混合编码结合波形编码的优点,既利用语音生成模型,通过对模型参量 进行编码,减小波形编码中被编码对象的动态范围或数目;又使编码产生接 近原始语音波形的合成语音,以保留说话人的各种自然特征,提高了合成语 音质量。 混合编码的典型算法主要有码激励线性预测编码,以及基于它的各种改 进算法。
Page 4
视频数据压缩技术
空间冗余,时间冗余
称统计冗余。
是主要的数据冗余。
他们是将图像信号看做随机信号时所反映出的统计特性,因此也
根据信息论的原理,可以找到最佳多媒体数据压缩编码方法,数 据压缩的理论极限是信息熵。
信息熵编码和变换编码是多媒体通信中两种主要信源
编码方法
Page 5
霍夫曼编码广泛应用于各种数据压缩技术中,是信息熵编码中的最佳 编码方法之一。 变换编码广泛应用于各种图像数据压缩,它选择一种最佳变换,将初 始数据从初始空间或时间域变换到一个更适于压缩的抽象域中,然后用反 变换恢复原始数据。经过变换后,信息中最重要的部分易于识别并可能成 组出现。
Page 10
JPEG压缩编码及解压缩算法原理图
JPEG压缩编码算法的主要计算过程如下。 (1)正向离散余弦变换。对每个单独的彩色图像分量,把整个分量图像分成 8*8的图像块,并作为二维离散余弦变换DCT的输入。通过DCT变换,把能 量集中在少数几个系数上。 DCT变换及其逆变换计算如下
7 7 1 (2i + 1)uπ (2 j + 1)vπ F (u, v) = C (u )C (v) = ∑∑f (i, j ) cos cos 4 16 16 i =0 j =0
Page 6
图像的变换编译码原理如图所示。 在发送端将原始图像分割成1~n个子图像块,每个子图像块送入正交变 换器作正交变换,变换器输出变换系数经滤波、量化、编码后经信道传输 到接收端,接收端完成解码、逆变换、综合拼接,恢复出空域图像。主要 的正交变换包括傅立叶变换
Page 7
语音信号压缩技术
多媒体通信中的编译码技术
多媒体
文本
音频
视频
图形
动画
Page 2
图像
巨大的多媒体数据量 多媒体的压缩技术
决定了
数据压缩成为多媒体发展的关键技术
模型编码、矢量量化、子带编码 有损编码 变换编码、小波编码 无损编码 霍夫曼编码、费诺-香农编码、 算术编码、流程编码、LempelZev 编码
根据 信号质量有无损失
如果想了解为什么混合编 码比之前两种更好,那么 请先了解此算法
Page 9
多媒体的数据压缩标准JPEG及JPEG2000
JPEG利用视觉特性,使用量化和无损压缩编码相结合来去除冗余, 是一种有损压缩算法。JPEG算法原理如图所示,编码时首先利用正向离散 余弦变换(DCT)将图像由空间域变换到频率域;然后使用加权函数对DCT 系统进行量化,此加权函数对于人的视觉系统是最佳的;最后利用霍夫曼变 长编码对量化系数进行熵编码。 译码或者解压缩过程是压缩编码过程的逆过程。
与多媒体通信有关的压缩编码的国际标准主要有 JPEG
H.261
H.263
MPEG
G系列
静态图像
视频
动态图像
音频
Page 3
无损压缩
无损压缩又称冗余压缩,主要用于文本数据压缩。 算法的基本原理:去除或减小数据中的冗余,压缩过程中不能破坏数据中 包含的信息,解码后的数据必须和原来的一样
有损压缩
有损压缩又称熵压缩,适用于图像和声音的压缩。 有损编码在压缩过程中减少了数据中包含的数据量,产生了一定的失真, 因而译码后的数据与原来不一样。正是由于减少了数据量,有失真的压缩 才能获得较高的压缩比
典型的多媒体会议系统由终端设备、通信链路、多点控制单元及相应 的软件部分组成。终端设备完成数据处理、多媒体通信协议处理及音视频 信号的接收、存储与播放,并记录和检索大量与会议相关的数据与文件: 多点控制单元是一个数字处理单元,通常设在网络节点处,用于处理多个 地点同时进行通信部分:软件包括协议、会议服务、音频与视频信号处理 等;通信链路可以是公共电话交换网、局域网、广域网、ISDN等。
Page 15
多媒体会议系统中的信道编码技术
多媒体会议系统是一种将声音、图像、文本等多种信息从一个地方传 送到另一个地方的通信系统,涉及的关键技术包括多媒体数据处理技术, 特别是高效的信息压缩与解压缩技术:网络技术,包括提供更可靠的通信 链路,为实时多媒体交互提供可能性;分布处理技术,特别是计算机支持 的协同工作,以及支持更多媒体处理的终端技术。
7 7 1 (2i + 1)uπ (2 j + 1)vπ f (i, j ) = C (u )C (v) = ∑ F (u, v) cos cos ∑ 4 16 16 i =0 j =0
(2)量化。量化是对经FDCT变换后的频率系数进行量化,目的是减小非“0” 系数的幅度并增加“0”值系数的数量。量化是引起图像质量下降的最主要 的原因。 (3)Z形编“0” 系数的数目,即“0”游程长度。编排的方法是按图所示的方法进行Z字形 排列。编排的结果是将一个8*8的矩阵变成一个1*64的矢量,频率较低的系 Page 11 数放在矢量的顶部。
Page 13
(7)形成比特数据流。最后,JPEG编码把编码后的图像数据组成一帧一帧的 数据,形成JPEG比特数据流。
JPEG算法的更为详细的知识可以参阅JPEG标准ISO/IEC 10918。
Page 14
JPEG2000 优点:对存储器的要求较低 便于抽取部分图像
缺点:图像质量有所下降
它可先传输低分辨率的图像或图像轮廓,然后逐步传输其他数据,不断 提高图像质量,以满足用户的要求。此特性在多媒体网络应用中有重要 意义: 当下载一幅图像时,可以较快地看到图像的概况,然后根据对图像 质量的要求和可用的网络带宽控制下载图像的数据量。
支持兴趣区的编码,这是它的一个另一个重要特性。用户利用此比特可 以指定感兴趣的区域,在压缩时对这些区域指定特定的压缩质量,或在 恢复时指定特定的解压缩要求: 当图像中只有一部分区域对用户有用时,对这些区域采用低压缩比, 而对其他区域采用高压缩比,可以在保证不丢失重要信息的同时有效地 压缩数据量。
多媒体语音信号的数字编码分为波形编码、参数编码和混合编码 波形编码是指编码系统直接对语音时频或时频波形样值进行编码。 波形编码系统的译码质量一般较高,因为它保留了信号原始样值的细节 变化,从而保留了信号的各种过渡特征。但是波形编码的传输率较高, 压缩比也不大。 典型的波形编码算法有脉冲编码调制、差分脉冲编码调制、自适应 差分脉冲编码调制、子带编码等。 波形编码具有编码质量好、能保持原始语音波形等特点,因而在有 线通信等一些要求比较高的场合得到广泛应用。
多媒体会议系统的图像纠错编码原理
Page 17
THANK YOU
Page 18
量化DCT系数的编排
Page 12
(4)直流系数的编码。8*8图像块经DCT变换后得到的直流系数有两个特点, 一是系数的数值比较大;二是相邻8*8图像块的DC系数值变化不大。根据 这两个特点,JPEG算法使用了差分脉冲调制编码技术,对相邻图像块之间 量化DC系数的差值δ进行编码 δ=DC(0,0)k-DC(0,0)k-1 (5)交流系数的编码。量化后的交流系数是1*64矢量中包含许多“0”系数, 并且许多“0”是连续的,因此使用简单直观的游程长度编码对其进行编码。 JPEG使用1字节的高4比特位来表示连续“0”的数目,低4比特位表示编 码下一个非“0”系数,跟在其后的是量化AC系数的数值。 (6)熵编码。采用熵编码对DPCM编码后的直流系数和PLE编码后的交流系 数作进一步的压缩。在JPEG有损压缩算法中,采用霍夫曼编码来减少熵, 因为它可以使用很简单的查表方法进行编码。压缩数据码元时,霍夫曼编 码对出现频率比较高的码元分配较短的代码,而对出现频度较低的码元分 配较长的代码。这种可变长度的霍夫曼码表可预先定义。
Page 16
多媒体会议系统的图像纠错编码原理如图所示。当进行纠错编码时, 图像数据被划分为493比特的数据分组,然后送入BCH纠错编码单元, 按照BCH(511,493)算法算出18比特的校验位。延时单元的作用是 补偿BCH编码所用的时间,使经编码输出的校验比特和相应的数据分 组对齐,然后两者复合起来送入多路利用单元。
相关文档
最新文档