DSP在语音识别中的应用.
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
哈尔滨工业大学数字信号处理报告题目:DSP在语音识别中的应用
院(系)电子与信息工程学院
学科信息与通信工程(51)
学生
学号
提交报告日期2013年9月16日
DSP在语音识别中的应用
摘要
近年来,数字信号处理成为一个不断更新和飞速发展的领域,DSP芯片的出现以及广泛应用为人们的生产和生活提供了很大的方便。
语音识别是一个比较活跃的研究领域,使用语音作为人机交互的途径,对于使用者来说是一种很方便、很自然的方式,同时设备的小型化也要求省略以节省体积。
基于DSP的语音识别系统正逐步成为语音识别的一个重要发展方向。
本文详细介绍了数字信号处理技术以及DSP芯片的发展,然后讨论了语音识别的优点和难点,明确了DSP应用于语音识别的优势,最后对语音识别系统中DSP的应用前景做了分析。
关键词:数字信号处理器语音识别
Abstract
In recent years, digital signal processing has become a constantly updated and rapidly developing field. The DSP chip is widely used and provides people with a lot of convenience. Speech recognition is a relatively active area of research. The use of voice as a means of human-computer interaction for users is a very convenient and natural way, at the same time the small device also omitted in order to reduce the volume. A speech recognition system based on DSP is gradually becoming an important developing direction of speech recognition.
In this paper, we introduce the digital signal processing technology and the development of DSP chip, and then discuss the advantages and difficulties of speech recognition. We made clear the advantage of DSP used in speech recognition, finally perform an analysis about prospect of DSP application in the speech recognition system.
Keywords:Digital Signal Processor (DSP); Speech Recognition
1 DSP简介
1.1 DSP技术
信号处理包含数字信号处理与模拟信号处理。
数字信号处理(Digital Signal Processing,DSP)是将信号以数字方式表示并处理的理论和技术。
随着计算机、信息技术和大规模集成电路的飞速发展,数字信号处理技术己形成一门独立的学科系统,并且在理论和实现技术两个方面都获得了高速的发展。
数字信号处理是对模拟信号进行采样,将其转换为数字序列,通过计算机或通用(专用)信号处理设备,用数字的数值计算方法处理(滤波、变换、增强、估计、识别等),达到提取有用信息便于应用的目的。
事实上,凡是利用数字计
算机或专用数字硬件、对数字信号所进行的一切变换或按预定规则所进行的一切加工处理运算都可以称为数字信号处理。
而数字信号处理器则是一种用于数字信号处理的可编程微处理器,它的诞生与快速发展,使各种数字信号处理算法得以实时实现,为数字信号处理的研究和应用打开了新局面,提供了低成本的实际工作环境和应用平台,推动了新的理论和应用领域的发展。
在实际讨论中,DSP的狭义理解可为Digital Signal Processor,即为数字信号处理器(DSP芯片),广义理解可为Digital Signal Processing,即为数字信号处理技术。
目前,DSP技术在通信、航空、航天、雷达、工业控制、医疗、网络及家用电器等各个领域都得到了广泛应用。
本文主要讨论DSP芯片在语音识别中的应用。
1.2DSP芯片
DSP芯片是一种特别适合于进行数字信号处理运算的微处理器,主要用于快速实现各种数字信号处理的算法,并进行实时处理得到相应的处理结果。
在20 世纪80年代以前,由于受实现方法的限制,数字信号处理的理论还不能得到广泛的应用。
直到20世纪80年代初,世界上第一块弹片可编程DSP芯片的诞生,才使理论研究成果广泛应用到实际的系统中,并且推动了新的理论和应用领域的发展。
可以毫不夸张地讲,DSP芯片的诞生及发展对30多年来通信、计算机、控制等领域的技术发展起到了十分重要的作用。
由于DSP芯片是针对数字信号设计和开发的,所以在进行数字信号分析和处理的过程中,其比通用性CPU芯片的处理速度更快、效率更高、稳定性更强,更重要的是,它使得数字信号处理算法得以实时实现。
1.3DSP的发展
DSP芯片诞生于20世纪70年代,至今已经得到了突飞猛进的发展,并经历了以下三个阶段。
第一阶段,1980年前后(雏形阶段)。
在DSP 芯片出现之前,数字信号处理只能依靠通用微处理器(MPU)来完成。
由于MPU处理速度较低,难以满足告诉实时处理的要求。
1965年库利(Cooley)和图基(Tukey)发表了著名的快速傅里叶变换FFT(Fast Fourier Transform),极大地降低了傅里叶变换的计算量,从而为数字信号的实时处理奠定了算法的基础。
与此同时,伴随着集成电路技术的发展,各大集成电路厂商都为生产通用DSP芯片做了大量的工作,其中就包含著名的TI公司。
第二阶段,1990年前后(成熟阶段)。
这个时期,许多国际上著名集成电路厂家都相继推出自己的DSP产品。
如:TI公司的TMS320C20、30、40、50 系列,Motorola公司的DSP5600、9600 系列,AT&T 公司的DSP32等。
伴随着运算速度的提高,DSP的应用范围扩大到通信、计算机领域。
第三阶段,2000以后(完善阶段)。
DSP 制造商不仅使信号处理能力更加完善,而且使系统开发更加方便、程序编辑调试更加灵活、功耗进一步降低、成本不断下降,大大提高了数字信号处理能力。
目前,DSP的应用领域更加广泛,逐步扩展到人们的日常消费领域。
尽管近些年来,DSP技术及DSP芯片的相关研究取得了长足的进步,但是远远不能达到需求的性能。
过去及现在的DSP芯片多是单核芯片,这种配置已经在许多复杂情况下的信号分析和处理中显得力不从心,未来的DSP芯片的发
展趋势是由单核向多核发展,与此同时,芯片的内部结构也将发生很大的变化,特大指令字组、单指令多重数据以及多通道结构都将在未来的DSP芯片内和结构中占据主导地位,总之,多核DSP芯片可以带来更高的处理速度和更强大的综合处理能力。
另外,DSP和高级CPU、SOC以及FPGA的融合也是DSP芯片未来的一个重要的发展趋势。
目前,我国的DSP产品主要来自于海外。
1983年TI公司的第一代产品TMS32010最早先进入中国市场,以后TI公司通过提供DSP培训课程,使该公司DSP产品的市场份额不断扩大。
现在TI公司的DSP产品约占国内市场的90%。
相对国外DSP应用开发的情况,我国还存在着相当大差距。
但是让人高兴的是,近年来国内许多高校相继建立了DSP实验室,开设了相关的课程,这对DSP在我国的发展起到了关键的促进性作用。
我国的DSP产业正在蓬勃发展,应用领域不断拓宽。
语音识别是DSP芯片的应用领域之一,国内外许多的学者都对语音识别做过相关的研究,取得了一系列的进展,但是缺少实质性的突破,利用DSP实现语音的完美识别依旧是研究热点。
2 语音识别
2.1为什么要语音识别
随着现代科学和计算机技术的发展,人们在与机器的信息交流中,需要一种更加方便、自然的方式。
而人的直观感觉可以给人最直接的印象,获取信息速度也就最快。
虽然,嗅觉、触觉也是人类固有的感觉,人们可以从中得到某些外界信息,但最重要、最精细的信息源只有图像和语言两种。
而且,语言是人类最重要的、最有效的、最常用的和最方便的通信形式。
这就很容易让人想到能否用自然语言代替传统的人机交流方式如键盘、鼠标等。
一般来讲, 人与机器的语言通信大致分为两种情况:第一种情况就是机器讲话, 人听话。
这就是“人工嘴巴”,即语音的人工合成;第二种情况就是人讲话,机器听话。
这即是“人工耳朵”,即语音的人工识别和理解。
语音识别将语言信息转换成机器可读的输入,较语音合成而言技术上要复杂,但现阶段在通信、控制等行业,该技术得到了广泛的应用。
语音识别(Speech Recognition)的最大优势在于使得人机用户界面更加自然和容易使用。
语音识别的发展目的是语音控制,语音控制可以大大降低对操作人员专业水平的要求。
为了让智能机器人最终具有人的智能,人机将的直接语言通信是必不可少的。
可以预见,在不久的将来,该技术将成为重要的人机交互手段。
研究语音识别的最终目标是是极其具有听觉功能,直接接受和处理语音指令,并根据该指令完成相应的动作。
语音识别技术是二十一世纪电子信息领域的主要技术之一,其正逐步成为电子信息领域里完成人机交互功能的关键技术。
我国语音识别研究工作一直紧跟国际水平,受到国家重视,大词汇量语音识别的研究早已列入“863”计划,由中科院声学所、自动化所及北京大学等单位研究开发,取得了高水平的科研成果,如中科院自动化所研制的非特定人、连续语音听写系统和汉语语音人机对话系统,其字准确率或系统响应率可达90%以上。
鉴于中国未来庞大的市场,国外也非常重视汉语语音识别的研究。
美国、新加坡等地聚集了一批来自大陆、台湾、香港等地的学者,研究成果已达到相当高水平。
2.2 语音识别的流程及技术
语音识别系统的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域。
语音识别系统的基本过程包括:采样、确定输入信号的起始点,由数字滤波器直接地或模拟滤波器间接地计算语音谱、音调轮廓图估价、分解输入信号、单词识别和对输入信号做出响应。
语音识别属于模式识别的一个分支,模式识别系统都有一个特征那就是需要训练一个模板库,在完成识别时根据采集数据的特征在模板库里进行模式匹配。
语音识别系统则首先需要采集语音样本,提取这些样本的特征,然后对这些特征参数进行相关运算处理形成参考模板库。
完成参考模板库的建立后,识别时采集语音在提取其特征参数后对模板库进行模式匹配,经过识别决策后得到识别结果。
语音识别的基本流程框图如下。
图1,语音识别的基本流程框图
2.3 语音识别的难点
尽管近些年来,随着科学技术的发展,语音识别发展很快,但是依旧有一些技术难题制约着语音识别的发展,成为其取得突破的瓶颈。
首先,语音信号是非平稳随机信号,不但不同发音者发音之间存在重大差异,即使同一人在不同时间、地点、不同生理状态情况下发音也存在很大差异。
再者,语音识别基元的选择也是困难的。
如何根据存贮空间和搜索速度的要求,选择合适的识别单元,如词、音节、音素。
一般来讲,要识别的词汇量越多,所用的基元应越小越好。
另外,由于环境噪声广泛存在,具体的语音识别工作环境千差万别,容易造成训练与测试环境不匹配致使系统性能严重下降,因此提高语音识别系统的鲁棒性是关系这项技术能否走向实用阶段的关键。
现有的语音识别系统只能工作在安静环境下。
在噪声环境下工作,受噪声的干扰,讲话人产生情绪或心理的变化,导致发音失真、发音速度和音调改变,即发生Lombard效应或Loud 效应。
从90年代初期到现在,抗噪声语音识别技术已经成为语音识别领域的一个重要研究课题。
不得不提的是,因为汉语自身的特点,使得汉语的语言信息处理比西方语言更为困难和复杂。
主要表现在:汉语的大字符集影响了汉字的快速输入;汉语的字词不分使得词的切分成为汉语语言理解与处理独有和首要的问题;大量的同音字、词给语音识别带来困难等等。
3DSP应用于语音识别的优势
通常在语音识别系统中,编程软件基本使用C语言和汇编语言相结合的编程方法,硬件电路则会根据系统的具体性能要求、实现功能、投入成本的不同会采取不同的方案来实现。
一般来说,基于单片机的语音识别系统价格便宜,但是这意味着算法的复杂度要受到限制,导致功能性不强,实用性不高;嵌入式系统对体积有严格的要求,这就需要一个高度集成的硬件平台,并且大力提高系统的可靠性,可是基于PC的语音识别系统体积过大,使用不方便;而DSP作为一种具有特殊结构的微处理器,内部采用程序区和数据区分开的哈佛结构,具有专门的硬件乘法器,广泛采用流水线操作,提供特殊的DSP指令,可以快速的实现各种数字信号处理算法。
综上可知,实用性强、稳定性高、片内资源丰富、易于移植,这些优点使得基于DSP的语音识别系统是一种比较理想的实现语音识别的硬件平台。
嵌入式系统中处理器的处理能力,决定了系统的性能,而处理器的功耗与成本,很大程度上决定了整个系统的功耗与成本。
为了达到高性能、低功耗、低成本的目标,DSP无疑是最好的选择。
这些年随着嵌入式技术的飞速发展,基于DSP的语音识别系统正逐步成为语音识别的一个重要发展方向。
4 DSP技术应用于语音识别的前景
DSP 作为数字信号处理专用芯片,有着其独特的优势。
TI 公司的C5000 系列DSP主要应用在语音信号处理领域,为语音信号处理带来极大的方便。
嵌入式语音识别系统硬件平台中,最主要的部分包括:处理器与语音芯片。
基于DSP 的语音识别系统可以有效地提高人机交互效率,提升操控智能设备的能力,因此具有广阔的发展的应用前景。
比如,TI 公司的TMS320VC5509A 就是一款在性能与功耗方面都非常出色的处理器,非常适合作嵌入式语音识别系统的处理器。
DSP应用于语音识别领域,将会大有用武之地。
Motorola公司等厂商的设计人员都特别重视DSP在语音识别中的应用。
市场调查公司Forward Concepts认为,语音识别就是实时完成你想要做的事情。
换句话说,就是你要求该设备能即时识别你所讲的话。
当然,你也能处理传送中的文字。
一段相当长的程序,只有靠DSP才能完成。
语音识别技术获得许多DSP供应商的支持。
Motorola公司已经推出了PC媒介开发套件。
这是一种适合软、硬件开发人员应用的开发平台,方便他们建立语音识别、语音合成引擎、扬声器等设备。
IBM公司曾经在ThinkPad 755系列笔记本电脑里装上自己生产的Mwave DSP,使ThinkPad成为世界上第一台有DSP的多媒体笔记本电脑。
意大利计算机厂商Olivetti也早已将DSP装入笔记本电脑内。
将来每台PC主机板上都会有一个DSP。
由于具备音频和压缩能力,语音应用将会有较大的发展。
不得不提的是,DSP应用于语音识别的另一个重要场合就是智能手机。
随着DSP技术的进步,计算能力更强、功耗更低和体积更小的DSP已经出现,使智能手机上植入更精确更复杂的自动语音识别功能成为可能。
由于系统要实时对语音进行处理和取样,因此语音识别系统需要具有巨大的计算能力。
DSP的速度决定了语音识别系统的复杂性和性能。
目前,一些高端的智能手机已经具备了部分语音识别性能,但效果不是很好,依旧不能很好的克服语音识别的难点,还需要进一步的研究。
语音识别作为人机交互的新途径,其研究意义重大,DSP技术的快速发展,为语音识别提供了有力支撑,将DSP应用于语音识别有着广阔的发展前景和市场价值。
但是在继续探索的道路上,需要研究人员更多的创新和努力。
参考文献
1李记昌. 基于DSP 的语音处理及识别算法研究. 武汉理工大学硕士学位论文, 2010.
2苏昊. 基于DSP 的语音识别技术的研究. 西安建筑科技大学硕士学位论文, 2011.
3Oppenheim A V, Schafer R W, Buck J R. 离散时间信号处理. 2001.
4苏明武. 基于DSP 的语音识别技术研究及实现. 哈尔滨工程大学硕士学位论文, 2005. 5朱春琴, 吴秀云. DSP发展史和未来发展趋势分析. 产业与科技论坛. 2013, 12卷11期. 6张宝峰. 基于DSP 的语音识别算法研究与实现. 兰州理工大学硕士学位论文, 2011.
7何湘智. 语音识别的研究与发展. 计算机与现代化, 2002, 3(3): 6.
8周远彬. 基于DSP和DHMM的嵌入式语音识别系统研究与实现. 电子科技大学硕士学位论文. 2012.
9唐尧. 基于DSP 平台的语音识别算法的研究与实现. 南京航空航天大学硕士学位论文, 2007.
书中横卧着整个过去的灵魂——卡莱尔
人的影响短暂而微弱,书的影响则广泛而深远——普希金
人离开了书,如同离开空气一样不能生活——科洛廖夫
书不仅是生活,而且是现在、过去和未来文化生活的源泉——库法耶夫
书籍把我们引入最美好的社会,使我们认识各个时代的伟大智者———史美尔斯
书籍便是这种改造灵魂的工具。
人类所需要的,是富有启发性的养料。
而阅读,则正是这种养料———雨果。