DSP技术与应用
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
课程结业论文
TM1300 DSP系统以太网通信接口的
设计
课程名称:DSP原理及应用
任课教师:许善祥
所在学院:信息技术学院
专业:电气工程及其自动化
班级:电气(2)班
学生姓名:
学号:
中国·大庆2015 年 5 月
DSP技术在计算机工程中的应用
基于DSP的MPEG4视频编码技术研究与实现
摘要
视频编码是多媒体通信中的核心技术,它不但关系到通信带宽,也关系到通信过程中的图像质量。随着多媒体技术在网络的广泛应用,视频编码技术更加显得重要。与之相适应,各种多媒体数据压缩编码标准也在不断地发展和完善。MPEG.4是现在最重要最有影响的多媒体数据编码国际标准之一。基于对象的编码思想使其具有高压缩比、可扩展性、可交互性等许多特点。ADI公司的Blacfin系列的DSP在图像处理方面有其出色的表现和较低的价格而获得关注。本文基于ADSP.BF561 DSP的特点,探讨了MPEG.4在BF561上的视频数据的实时编码的实现。本论文首先系统介绍了MPEG.4编码的特点以及选用BF561的原因,接着分析了MPEG.4的主要技术,并介绍了MPEG.4简单编码框架编码器的软件实现方案,给出了方案流程图,在VC++环境下用C语言实现了MPEG.4简单框架的视频压缩功能。其次,研究了核心算法DCT变换和运动估计的优化算法,通过分析运动向量的分布相关性,结合提前中止准则,提出了基于起点预测的改进菱形运动估计算法。另外根据BF561双核的特点,设计了一种基于宏块层并行算法。最后,本文从硬件平台特征出发,在存储器设置、DMA控制和代码等方面对编码方案进行优化。经本方案优化后,编码器的编码效果得到很大的提高,能够在BF561处理器上实现CIF格式30帧
/秒的码率,达到预期的目标。
第一章绪论
1.1课题提出
21世纪的人类社会将是信息化社会,数字化后的信息,尤其是数字化后的视频信息具有海量数据性,它给信息的存储和传输造成很大的困难,己成为人类有效地获取和使用信息的瓶颈问题之一。1895年电影的诞生第一次将视频信号带给了人类社会,随着电视的发明和普及,视频信号走进了千家万户。数字技术的广泛应用,对视频信号的存储和传输带来了一次革命,但是从模拟转换到数字的原始视频信号的数据量是惊人的,单纯地靠提高存储容量或信道传输速率的做法是不切实际的,以传输未经处理的标准清晰度电视(SDTV,Standard Definition Television)的图像格式为例,704像素(水平)*480像素(垂直),帧频60HZ/隔行扫描,其每秒的数据量是:704*480*30*1.5(4:2:0)=15206400Bytes。更不用说,现在流行的高清电视(HDTV,Hign Definition Television),其数据量是标清的5倍多,这显然远远超出了目前Intemet通信信道的能
力,而且直接把未经处理的视频数据发送到通信信道上,也是对通信带宽的极大浪费。因此,研究有效的视频压缩编码方法具有很重要的现实意义。视频压缩编码技术是多媒体应用的核心技术,对视频编码的研究已成为信息技术领域的研究重点,并制定了一系列的视频标准。其中MPEG-4利用很窄的带宽【l】,使用帧重建技术,压缩数据,以最少的代价获得最佳的图像质量。因此,其广泛应用于实时、高效、适合网络传输等特点的领域,如数字监控、可视电话和手机视频等。本课题设计了实时MPEG.4视频编码系统,能够实现CIF格式(352*288)数据每秒30帧的处理能力,结合该系统功耗低、体积小、性价比突出的特点,在进一步改进的基础上,具有广阔的工程应用前景。
1.2数字视频编码发展历程
第一代编码方法。1948年Oliver提出了第一个编码理论~脉冲编码调制(PCM,Pulse Coding Modulation)。同年Shannon的经典论文《通信的数学原理》中首次提出并建立了信息率失真函数概念;1959年Shannon进一步确立了码率失真理谢21。以上工作奠定了经典信息编码的理论基础,在此基础上视频编码理论和技术取得了长足的发展,其主要的编码方法有:预测编码、变换编码和统计编码,也称为三大经典编码方法。其中预测编码的基本思想是:根据数据的统计特性得到预测值,然后传输图像像素与其预测值的残值信号,使传输的码率降低,达到压缩的目的。变换编码的基本思想是:由于数字图像像素间存在高度相关性,因此可以进行某种变换来消除这种相关性。变换编码不直接对空域图像像素编码,而是先将它变换到频域,得到一组变换系数。虽然变换并不对数据进行压缩,但经过变换后,能量相对集中,通过后续的量化、编码就能达到压缩的目的。变换编码方法中的离散余弦变换(DCT,Discrete CosineTransform)和小波变换在视频/图像压缩中得到了广泛应用。统计编码的基本思想是:根据信息码字出现概率的分布特征而进行压缩编码,寻找概率与码字长度间的最优匹配。统计编码主要针对无记忆信源,它又可分为定长码和变长码(VLC,Variable Length Coding)。Hufman编码和算术编码是两种常见的变长码字编码方法。第一代编码技术【3】只是以信息论和数字信号处理技术为理论基础,旨在去除图像数据中的线性相关性,其压缩比不是很高,对于视频图像来讲一般在40:1左右。为了克服第一代视频编码技术的局限性,Kunt等人于1985年提出了第二代视频编码技术。而第二代编码技术不再局限于信息论的框架,从更为底层的基础上探索视频图像信息的表述机制,充分利用人的视觉生理心理特性和图像信源的各种特征,实现从“波形’’编码到“模型”编码的转变,以期获得更高压缩比。第二代编码方法主要有:基于分形的编码方法、基于模型的编码方法、基于区域分割的编码方法和基于神经网络的编码方法等。分形编码是一种不对称的编码技术,适于自相似性较强的自然景物图像。基于模型或知识的方法,是把计算机视觉和计算机图形学中的方法应用到视频编码,在编码端通过各种分析手段,提取所建模型的特征与状态参数,在解码端通过这些参数通过模型及相关知识生成所建模的信源。基于区域分割与合并的视频编码方法,是根据图像的空域特征将图像分成纹理和轮廓两部分,然后分别对它们进行预处理、编码。预处理将图像分割成纹理和轮廓两部分,对纹理可采用预测编码和变换编码,对轮廓则采用链码方法进行编码,较好地保存了对人眼十分重要的边缘轮廓信息,因此,在压缩比很高时解码图像质量仍然很好。神经网络法是模仿人脑处理问题的方法,通过各种人工神经元网络模型对数据进行非线性压缩,目前还处在探索阶段。第二代基于内容和语义的编码方法为视频压缩编码开拓了广阔的前景,但同时也大大增加了分析的难度和实现的复杂度,要得到充分应用还有赖于进一步深入研究以及相关辅助学科的同步发展。