DSP芯片在实时图像处理系统中的应用(精)

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

爵霆鱼稔疆
PostgraduateForum
DSP芯片在实时图像处理系统中的应用
柯丽-,:黄廉卿-
(1.中国科学院长春光学精密机械与物理研究所,吉林长春130033;
2.中国科学院研究生院,北京100039)
【摘要】在通用计算机上用软件实现图像处理,要占用CPU几乎全部的处理能力,且速度相对较慢。

数字信
号处理器fDSP)的可编程性和强大的处理能力使其可用于快速实现各种数字信号处理算法,在图像处理领域。

尤其在实时图像处理系统中得到了广泛应用和发展。

本文介绍了DSP芯片及其在实时图像处理系统中的开发、应用及发展方向。

关键词:DSP芯片:图像处理系统;实时处理中图分类号:TP391.41
DSPchipanditsapplicationinreal-timeimageprocessingsystem
KELil・2
HUANGLian-qin91
(1.Changehun
InstituteofOptics,FineMechanicsandPhysics,Chinese
AcademyofSciences,Changchun130033,China;
2.GraduateSchoolofChineseAcademyof
Sciences,Beijing100039,China)
Abstract:AlloperationcapacityofCPUwillbetakenupifimageisprocessedsutingslowprocessingspeed.Digitalsignal
on
generalcomputerbysoftware,re—
process(DSP)can
beusedtoimplementallkindsofalgorithmsofdigital
signalprocessingwithitspowerfulprocessingcapacity.DSPchipisappliedanddevelopedwidelyinthefieldofim—ageprocessing,especiallyinreal-timeimageprocessing.ThepaperintroducesDSPchip,itsdevelopmentandappli・cationinreal-timeimageprocessingsystem.
Keywords:DSPchip;imageprocessingsystem;real-timeprocessing

引言
压缩。

图像处理技术尤其是实时处理,现已成为一热门的研究课题。

实现图像处理的主要方式有:
f1)在通用计算机上用软件实现图像处理;f2)在通用计算机系统中加入专用的加速处理模块;
随着计算机及通信技术的发展,图像和视频的应用愈加J1泛。

大部分图像数据在实际应用前皆需进行有针对性的处理.如根据图像数据特点和应用领域对图像进行增强、除噪、锐化和识别等。

此外.为了有效实时地传输信息,还必须对图像进行
』!J鲨an塑u碘arHyllll2仉00c0591。

_l!三
万方数据
l——————————
f3)利用通用单片机:f4)利用专用DSP芯片;f5)利用通用可编程DSP芯片。

在众多图像处理方式巾,最常用的是第1种,但此种方式要占用CPU几乎全部的处理能力,速度相对较慢,不适于实时处理,需要对其加以改进;而其他几种方式各有不足,如第2种方式不适于嵌入式应用,专业性较强,应用受到限制;第3种方式适于数字控制等不太复杂的数字信号处理,不适合计算较大的图像数据处理;第4种方式洲为采用的是专用DSP芯片,故其廊用范围受限,系统不够灵活,无法进行算法的升级与更新;第5种方式必须要用能充分考虑DSP内部并行性的_7r:编语0…进行编制DSP程序,具有一定困难。

但是,TI公司为了解决这个问题.推出了一个开放、具有强大集成能力的开发环境(CCS)罔。

它采用了由先进的开发_:_[具组成的直观系统,使用CCS提供的工具.开发者
可以非常方便地对DSP软件进行设计、编码、编译、调试、跟踪和实时性分析,可有效减少DSP编程时问。

综上所述,利用通用可编程DSP芯片[[-21实现图像处理较之其他方式具有一定的优越性,而且DSP芯片的可编程性和强大的处理能力.使其可用
DSP芯片采用不同于普通单片机的体系结构,具有---・些显著特点。

2.1
哈佛结构”I
传统计算机采用传统的冯・诺伊曼(Von
Neumannl结构,其程序和数据共用一个存储空间和单一的地址及数据总线,处理器要执行任何指令时,都要先从储存器巾取出指令解码,再取操作数执行运算,即使单条指令也要耗费几个甚至几十个周期.在高速运算时。

在传输通道上会出现瓶颈敛应。

所有的DSP芯片均采用哈佛(Harvard)结构。

哈佛结构是~种并行体系结构,它的主要特点是将程序和数据存储在不同的存储空问中.即程序存储器和数据存储器是两个相瓦独立的存储器,每个存储器独立编址、独立访问。

与两个存储器相对应的是系统中的4套总线:程序的数据总线与地址总线,数据的数据总线与地址总线。

这种分离的程序总线和数据总线可允许在一个机器周期内同时获取指令字f来自程序存储器)和操作数(来自数据存储器),从而提高了执行速度,使数据的吞吐率提高了1倍。

又由f程序和数据存储器在两个分开的空间巾,闪此取指和执行能完全重叠。

图1给出了冯・诺伊曼结构和哈佛结构的比较。

地址总线
于陕速地实现各种数字信号处理算法,成为目前图
像处理系统的最佳选择。


DSP芯片
数据总线
(a)冯-诺伊曼结构f单存储器)
线
、‟
数字信号处理器fDSP)f1。

21是一类具有专门为数字信号处理任务而优化设计的体系结构和指令系统的通用处理器件.具有处理速度快和有复合功能的单周期指令等特点,在高速图像处理中得到了越来越多的应用。

DSP芯片内部采用程序和数据分开存储和传输的哈佛结构.具有专门硬件乘法器,广泛采用流水线操作.提供特殊的DSP指令.可用来快速地实现各种数字信号处理算法,加之集成电路的优化设计,使其处理速度比最快的CPU还快lO一50倍。

DM地址总线
线DM数据总线
(b)哈佛结构(双存储器)
图1冯・诺伊曼结构与哈佛结构的比较
2_2流水线技术[1】
与哈佛结构相似,DSP芯片广泛采用流水线以减少指令执行时间.从而增强J‟处理器的处理能
!曼噶急
万方数据
力。

流水线处理器是由一系列处理电路组成.这些
处理电路称为片断或部分。

操作数流经每个片断,即每个片断对操作数进行部分处理,操作数经过所有片断后才能得到最后结果。

流水线操作即把一条指令分成一系列步骤来完成,不同步骤完成不同的任务,一条指令只有经过所有步骤才能得到结果.。

这些步骤可以独立进行,这样就可以实现多条指令在不同步骤上的重复运行,从而加快运行速度。

流水线分为指令流水线和算术流水线。

指令流水线是指取指令和执行指令的不同阶段在流水线上进行:算术流水线是指算术操作的不同阶段在流水线上进行.DSP芯片一般采用指令流水线方法。

由丁采用了流水线技术,DSP芯片可以单周期完成乘法累加运算。

大幅提高了运算速度,减少了指令执行的时间,从而增强r处理器的处理能力。

处理器可以并行处理2~4条指令。

每条指令处于流水线的不同阶段。

2.3特殊的硬件结构【1-2】
数字信号处理中最重要的基本运算足乘法和累加运算,它们占用了大量运算时间,是最主要和最耗时的运算。

DSP中设置了硬件乘法器和乘法并累加(MAC),这些操作往往可以在单周期内完成,大幅提高了DSP作乘法和累加的速度。

因此,单周期的硬件乘法器和MAC是DSP芯片实现快速运算的保证。

现代高性能的DSP芯片甚至具有两个以上的硬件乘法器以提高运算速度。

数据宽度也从16位增加到32位。

数学运算消耗的时问往往少于存储器的操作。

DSP芯片在片内集成了大容量的ROM和RAM来分别存放程序和数据,程序在片内执行的效率远远高于相同规格的通用微处理器,这样既降低了产品的体积和成本.又加快了处理速度。

在数字
信号处理中要遇到大量的地址运算,在某些情况下.地址运算量甚至超过了数据的运算

方数据量。

DSP中设计有一个特殊的硬件算术单元——地
址产生器。

地址计算由这个专门的硬件来负责.不需要耗费额外的时间。

现在的某些微处理器中也有独立的地址产生单元,对于一些特殊的地址运算不需要耗费额外的CPU时问。

但是DSP的地址运算单元更强大,支持如比特翻转寻址和循环寻址,可极大加快运算速度,而对于非哈佛结构的处理器可能需要更多的处理周期。

2.5并行处理结构[21
图像处理中的运算量巨大,单个处理器无法满足实时处理的需求,需要多处理器并行处理。

DSP内部一般都集成多个处理单元。

如硬件乘法器(MUL)、累加器(ACC)、算术逻辑单元(AIJU)、辅助算术单元(ARAU)以及DMA控制器等。

它们都可以并行地在同一个周期内执行不同的任务,例如辅助算术雎元能为卜一次的运算做好准备.适于完成连续的乘加运算。

芯片内部还包括其他总线,如DMA总线等.可实现数据的后台传输而几乎不影响主CPU的性能。

为了提高并行处理能力,现代DSP芯片通常采用单指令多数据流结构(SIMD)、超长指令字结构fⅥ.IW)、超标星体系结构、多DSP核体系结构和DSP/MCU混合结构,这些并行处理机制碌著提高了DSP芯片的性能。


DSP的发展历程和方向
3.1
DSP发展历程
DSP发展历程Ⅲ大致分3个阶段:20世纪70年代埠论先行.20世纪80年代产品普及,20世纪90年代突飞猛进。

在DSP出现之前,数字信号处理只能依靠微处理器(MPU)来完成,但MPU的低处理速度无法满足高速实时的要求,因此直到20世纪70年代.才有人提出了DSP的理论和算法基础。

那时的DSP仅停留在教科书上,即便是研制出来的DSP系统也是由分立元件组成的,其应用领域仅局限于军事、航空航天部门。

塑Ja型nua型r翱!皇y
2005
■——二————————一
2.4特殊的寻址方式[1l
麝黧壁镳錾
PostgraduateFOrum
随着大规模集成电路技术的发展,1982年,世界上诞生了首枚DSP芯片。

这种DSP器件采用微米工艺NMOS技术制作.虽功耗和尺寸稍大,但运算速度却比MPU快了几十倍,尤其在语音合成和编码解码器中得到了广泛应用。

DSP芯片的问世足个里程碑.它标志着DSP应用系统由大型系统向小型化迈进了一大步。

到20世纪80年代中期,随着CMOS技术的进步与发展,第2代基于CMOS工艺的DSP芯片应运而生.其存储容量和运算速度都得到成倍提高,成为语音处理和图像硬件处理技术的基础。

20世纪80年代后期,第3代DSP芯片问世,运算速度进一步提高,其应用范围逐步扩大到通信和计算机领域。

20世纪90年代,DSP发展最快,相继出现了第4代和第5代DSP器件。

现在的DSP属于第5代产品,与第4代相比,其系统集成度更高,并将DSP芯核及外罔元件综合集成在单一芯片上。

这种集成度极高的DSP芯片不仅在通信和计算机领域发挥重要作用.而且逐渐渗透到人们日常的消费领域。

3,2
DSP发展方向[11
现在DSP产品的应用已扩大到人们的学习、
工作和生恬的各个方面,并逐渐成为电子产品更新换代的决定因素:而半导体技术和超大规模集成电路的发展为DSP的推陈出新提供了物理基础,用户的需求又为DSP的发展指出了方向。

总体而言,DSP技术将向以下几个方面发展:
(1)系统级集成。

缩小DSP芯片尺寸始终是DSP的技术发展方向。

当前的DSP多数基于精简指令集计算(RISC)结构,这种结构的优点是尺寸小、功耗低和性能高。

各DSP厂商纷纷采用新工艺,改进DSP芯核,并将几个DSP芯核、MPU芯核、专用处理单元、外围电路单元和存储单元集成在一个芯片上,成为DSP系统级集成电路。

f2)更高的运算速度。

目前一般的DSP运算速度为100MIPS,即每秒钟可运算1亿条指令,但由
兰Q崃器一

方数据于电子设备的个人化和客户化趋势,DSP必须追求更高更快的运算速度,才能跟上电子没备的更新步伐。

DSP运算速度的提高主要依靠新j二艺改进芯片结构。

目前,Ⅱ的TM320C6X芯片由于采用超长指令字(VLlw)结构设计,其处理速度已高达2000MIPS。

当前的DSP器件大都采用0.5
—0.351xmCMOS工艺,按照CMOS的发展趋势,DSP的运算速度完全可能再提高100倍(达到1600CIPS)。

(3)可编程性。

可编程DSP给生产厂商提供了很大的灵活性。

生产厂商可在同一个DSP平台上开发出各种不同型号的系列产品,以满足不同用户的需求。

同时,可编程DSP也为广大用户提供了易于升级的良好途径。

人们已经发现,许多微控制器能做的事情,使用可编程DSP能做得更好更便宜,例如冰箱、洗衣机这些原来装有微控制器的家电如今皆已换成可编程DSP来进行大功率电机控制。

f4)支持高级编程语言的DSP开发软件。

使用高级语言进行DSP软件开发可缩短软件开发的周期.加快DSP产业的发展。

(51并行处理结构。

并行结构所带来的好处是显而易见的,各DSP厂家纷纷在器件中引入并行机制,主要分为片内并行和片间并行。

(6)功耗低。

4图像处理系统中DSP芯片的选择
对图像处理技术而言,由于要处理的数据量大,计算复杂,计算中间结果精度要求高,因此需要选择合适的DsP芯片。

DSP。

墨片的选择应根据实际的应用系统需要而确定。

一般来说,选择DSP芯片时应考虑如下诸多因素:
(1)确定选择定点或浮点DSPt”。

数字信号处理算法的数据格式有定点和浮点之分,而数字信号处理系统采用的数据格式决定了它所处理信号的处理精度、动态范围和信噪比.且不同数据格式的易用性和开发难度也不一样。

选择定点或浮点DSP,白…
露鳃鳖镳龌
PostgraduateForum
先要看模数转换时需要的比特数.如果图像的每个像素小于16bit,则用16bit定点DSP即可:如果大于16bit,则需要用浮点DSP来捕捉更大的动态范围。

其次考虑算法的复杂度和经济问题。

一般说来,浮点DSP芯片的运算精度高,动态范围大,寻址空问大,指令运算能力较强,但功耗大、成本高、体积较大。

定点DSP芯片的运算精度与浮点DSP芯片相同(数据位数和浮点芯片相同的情况下),而功耗、成本、体积与浮点DSP芯片相比较小,且易于实现,稳定性好。

(2)根据DSP芯片运算速度选择具体芯片【”。

运算速度是DSP芯片的-个最重要的性能指标.也是选择DSP芯片时所需考虑的一个主要因素。

DSP芯片的运算速度一般采用DSP的指令周期、单周期的乘加次数或采用数字信号处理中的基准程
序,如用F丌和数字滤波等的执行时间来测评DSP
芯片的速度性能。

f31其他考虑因素[。

在硬件方面还应考虑芯片的外部总线结构、片上存储器结构、DMA功能、串行通信lYI和芯片间通信能力等因素,在软件方面主要足开发软件的功能性和时间要求等因素。

目前。

应用最为广泛的是TIfTexasInstrumentsl公司TMs320c6000[1-3I系列的数字信号处理器。

美国德州TI公-J自1982年推出第l代数字信号处理器以来,现已相继推出了多代数字信号处理器.成
为世界上最大的DSP芯片供应商√rMS320C6000
系列是.I‟I公司于1997年推出的高端系列的DSP。

该系列的DSP在芯片没计上,最初主要是针对多通道无线通信和有线通信的应用领域,但由于其优异的高速处理性能和出色的对外接口能力,使它也很适用于图像处理领域。

TMS320C6000是基于超长指令字(VLIW)结构的通用DSP系列,具有超长指令字处理能力。

其内部有8个并行处理单元,8条指令组成一个指令包,
・个指令包的总字长为256位。

它可在一个
时钟周期内并行执行8条指令。

这种高速高性能数

方数据字信号处理器的工作频率可达200MHz,每秒可完成1.6G次操作。

该结构包括定点的C62x、浮点的C67x和新的C64x。

C64x和C62x代码兼容.但结构有显著的加强,其初期的工作频率可达750MHz。

,C67x在C62x8个功能块中的6个上增加了浮点功能,因此其指令集是不同的。

将TMS320C6000系列的数字信号处理器用于图像处理系统开发中。

势必使技术水平得到进一步的提高。

5基于DSP的图像处理软件开发
TI公司针对TMS320C6000系列芯片推出了一种CCS集成开发软件。

CCS(Code
Composer
Studio)t1I
是一个开放、具有强大集成能力的开发环境,它采用了ftl先进的开发T具组成的直观系统,可大幅减小DSP编程时问,并能在极短的时间内消除实时工作中的间歇。

CCS包括TMS320C6200代码生成工具、集成开发环境IDE、DSP/B10s插件和应用程序接几实时数据交换(AP[、RTDS)插件和主机接口等部分。

使用CCS提供的工具,开发者可以非常方便地对DSP软
件进行设计、编码、编译、调试、跟踪和实时性分析。

DSP软件开发11]流程图如图2所示。

DSP软件开发包括3个阶段:
(1)第l阶段是指图2中“C代码优化”之前的部分。

在第l阶段丰要是在CCS环境下用C6000的代码产生工具,编译产生在C6000内运行的代码,证明其功能正确,然后再用CCS调试工具,分析确定代码中可能存在的影响性能的低效率段,进入第2阶段。

(2)图2巾从“C代码优化”开始至“线性汇编”之前为第2阶段。

这一阶段主要是利用优化方(3)其余部分为第3阶段。

在这一阶段从C语
竺J堕an型uar2005
■二
法改进C语言代码,主要使用内联函数、数据打包处理、软件流水线技术以及展开循环结构代码等优化手段,然后反复检查C代码性能,优化C代码,如果仍不能达到所期望的效率,进入第3阶段。

褥纛鸯罐蕊PostgraduateForumC代码的编写用,可使代码效率高达95%以上。

6基于DSP的图像处理系统代码编译基于DSP的图像处理系统"1的主要思想是利用C6000这样具有强大运算能力的DSP来满足图像处理技术中运算速度和处理的实时性要求。

以DSP为核心部什的图像处理系统具有以下特点:(1)接El方便。

DSP系统与其他以现代数字技术为基础的系统或设备均相互兼容,同这样的系统接El来实现某种功能要比模拟系统与这样的系统接口要容易的多;(2)编程方便。

DSP系统中的可编程DSP芯片可使设计人员在开发过程中灵活方便地对软件进行修改和升级;(3)稳定性好。

DSP系统以数字处理为基础,受环境温度及噪声的影响较小.可靠性高;(4)精度高。

16位数字系统的精度可达10~;(5)可重复性好。

模拟系统的性能受元器件参数性能变化的影响较大。

而数字系统基本上不受影
响,因此数字系统便于测试、调试和大规模生产;(6)集成方便。

DSP系统中的数字部件有高度的规范性,便于大规模集成。

图像处理系统一般由图像采集模块、图像处理模块和数据通讯模块三部分组成(如图3所示)。

待处理图像网一网一降L—jL—JL——JI模块模块I模块1<◇罔2iY网3冈像处理系统组成图3中的图像处理模块接收来自采集模块的数宁图像数据,刘其进行相应处理,是系统的丰体部分.其核心是用来实现处理算法的DSP芯片,如r兀公司TMS320C6000系列芯片。

图像处理计算量大且实时性要求高,虽然DSPDSP软件开发流程图言程序中抽出对性能影响很大的程序段,使用线性汇编语言重新编写.井使,}=}j汇编优化器优化该段代码。

最后可用EVM板或其他开发硬件.根据实时性的要求反复优化C程序和线性汇编程序,直到系统符合实时性和代码长度的要求。

在这种CCS集成开发软件的环境下,C编译器的效率可达80%,若将新的线性『L编语言和C6000i_厂:编优化器配合使芯片对提高处理速度有一定的优越性.但对如遥感图像等大型且重要的图像数据却常常不能达到实时处理。

因此需要采用多个DSP并行处理方式14“j,进一步提高算法的运行速度,达到真正的实时处理。

日前比较常用的是双DSP结构㈣。

两片DSP芯片交丝—裟笋繁万方数据
褥窕鳖锤辘PostgraduateFOrum替进行采集和处理工作,可以实现数据采集和图像压缩的并行操作.降低处理时间:而在一片DSP内,也可将数据缓冲区分为两部分.同时进行数据读取和编码,实现片内并行操作,进一步节省时间。

7DSP将是未来集成电路中发展最快的电子产品,并将成为电子产品更新换代的决定因素。

将DSP芯片川于图像处理系统可大幅提高图像的处婵速度,满足实时性需求,而且DSP系统具有接几方便、易于编程、稳定性好、精度高、可重复性好和集成结论方便等特点.因此可以说基于DSP的图像处理系统是图像处理领域的发展方向。

(No.7)在当今数字化时代的背景下.DSP已成为通信、计算机、消费类电子产品等领域的基础器件。

参考文献:[1】刘党辉,沈兰荪.DSP芯片及其在图像技术中的应用….测控技术,2001,20(5):16—23.[2]赵训威.基于TMS320C6200系列DSP芯片的应用与开发【MJ,北京:人民邮电出版社,200
2.[3】徐盛,陈健.TMS320C6201数字信号处理器在图像处理中的应用…,电if-&术应用,1999,(1):70—72.【4】WangYH,ZhangTX,YahT.x.Modularizednmhi—DSPreal-timeimageprocessingsystem『J]SPIE,4552:12—15.Oil【5]HaskellBG.Imageandvideocoding-eme晒ngstandardsandbeyond[J].IEEETransyi如oTeehn01.,1998,8(7):814—837.Circui如andSystems扣r[6]朱伯春,国澄明,土兆华,舣片TMS320C40并行实时图像处理系统[J].通信学报,1998,19(1):39—44.快速粮食成份光电分析仪由长春光枧所应用光学国家覆点塞验窒薅僦的壤遴搬黉戚髂糍电努析仪是-种髓够快速、准确地定最分析农产品(包括谷物、油料、饲料等)威份的仪器,是根据粮食在近红外光谱长波段吸收信息丰富,结合化学计量学及统计数学等手段可在极短的时间内同时获得样晶的多种成份含量的原理而研制豹。

该仪器鑫分析样品时茏需样晶进弦冗繁的化学预处理,样品制各简单快捷、无污染,在不超过五分钟的时间内即可完成粮食样品多种成努C如蛋白质、脂肪、淀粉、纤维、水分等)的同劳测量,被称为是绿色的分析仪器。

,该类仪器已强国辨粮食深加工生产的质量控制、粮油黟晶的嚣质监测、种子发放时的成分检测等蠹面得到较为广泛的使用。

快速粮食成份光电藏褥彼霸蕊制,充分考虑到了国内近红辨分析仪用癌的使用要求,3t:菇在软件设计上完全符合巾镧瓣现窦魉季终蠢藏翱使用习惯0谶嫂器在蠢拣镶农辩虢巍囊瓣≯番林德大有限公司油脂厂和羲毒滚威寨豢麓发蠹穰鏊霹灌,黪煮地瘴麓蠢藏荔j繁獯蓼,撩簿黪德嫦效果。

浚仪器的研制成功将使豢期簿雾藜零霉藜藜鬻磐鬻鬻纛簟戆鬻》峨壤矮矧麟鬻。

旦J竺anu塑ar堕!生堕也——y万方数据2005[二——。

相关文档
最新文档