基于语音控制的显示器的设计开题报告
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
毕业设计(论文)材料之二(2)
本科毕业设计(论文)开题报告题目:基于语音控制的显示器的设计
课题类型:设计□√实验研究□论文□
学生姓名:xxxxxx
学号: xxxxxxxxxxxx
专业班级: xxxxx
学院:电气工程学院
指导教师: xxxxx
开题时间:2016.3.12
2016年 3月12 日
一、本课题的研究意义、研究现状和发展趋势(文献综述)
1.1选题目的背景及意义
人与人之间的交流手段中,语音是最高效的手段之一,如果能让人与计算机的交流也能达到这样的简单高效,那将会带来极大地便利。现有的显示器调节方案主要是采用手动调节的方式,通过手动按键输入各种命令,使显示器能按照终端用户的要求进行开关机,信号选择,亮度色彩等调节。而手动调节的方式在很大程度上浪费用户的时间。
本课题拟采用语音识别处理器和通信模块设计一种语音控制的显示器,能够简捷、快速、有效地对显示器进行调节,解放用户双手,使产品更加人性化、智能化的同时也节约了用户的时间。
语音处理技术是一门新兴的技术,它不仅包括语音的录制和播放,还涉及语音的压缩编码和解码,语音的识别等各种处理技术。以往做这方面的设计,一般有两个途径:一种方案是单片机扩展设计,另一种就是借助于专门的语音处理芯片。普通的单片机往往不能实现这么复杂的过程和算法,即使勉强实现也要加很多的外围器件。专门的语音处理芯片也比较多,像ISD 系列、PM50 系列等,但是专门的语音处理芯片功能比较单一,想在语音之外的其他方面应用基本是不可能的。
SPCE061A 是凌阳科技推出的一款16 位μ'nSP 结构的微控制器。该芯片带有硬件乘法器,能够实现乘法运算、内积运算等复杂的运算。它不仅运算能力强,而且处理速度快,单周期最高可以达到49MHz。SPCE061A 内嵌32K 字的FLASH 程序存储器以及2K 的SRAM。同时该SOC 芯片具有ADC 和DAC 功能,其MIC_ADC 通道带有AGC 自动增益环节,能够很轻松的将语音信号采集到芯片内部,两路10 位的电流输出型DAC,只要外接一个功放就可以完成声音的播放。以上介绍的这些硬件资源使得该SPCE061A 能够单芯片实现语音处理功能。
1.2国内外研究现状及发展趋势
1.2.1国内语音识别的发展状况
20世纪50年代我国就有人尝试用电子管电路进行元音识别,到70年代才由中科院声学所开始进行计算机语音识别的研究.80年代开始,很多学者和单位参与到语音识别的研究中来,也开展了从最初的特定人、小词汇量孤立词识别,到非特定人、大词汇量连续语音识别的研究工作.80年代末,以汉语全音节识别作为主攻方向的研究已经取得了相当大的进展,一些汉语语音输入系统已经向实用化迈进。90年代j四达技术开发中心和哈尔滨工业大学合作推出了具有自然语言理解能力的新产品.在国家“863”计划的支持下,清华大学和中科院自动化所等单位在汉语听写机原理样机的研制方面开展了卓有成效的研究.经过60多年的发展,语音识别技术已经得到了很大发展,对于语音识别的研究也达到了相当高的水平,并在实验室环境下能达到很好的识别效果。但是,在实际应用中,噪声以及各种因素的影响,使语音识别系统的性能大幅度下降,很难达到让人满意的效果。因此,对噪声环境下的语音识别的研究有着异常重要的理论价值和现实意义。
1.2.2国外语音识别的发展状况
国外的语音识别是从1952年贝尔实验室的Davis等人研制的特定说话人孤立数字识别系统开始的。
20世纪60年代,日本的很多研究者开发了相关的特殊硬件来进行语音识别RCA实验室的Martin等人为解决语音信号时间尺度不统一的问题,开发了一系列的时问归正方法,明显地改善了识别性能。与此同时,苏联的Vmtsyuk提出了采用动态规划方法解决两个语音的时闻对准问题,这是动态时间弯折算法DTW(dymmic time warping)的基础,也是其连续词识别算法的初级版。
20世纪70年代,人工智能技术走入语音识别的研究中来.人们对语音识别的研究也取得了突破性进展.线性预测编码技术也被扩展应用到语音识别中,DTw也基本成熟。
20世纪80年代,语音识别研究的一个重要进展,就是识别算法从模式匹配技术转向基于统计模型的技术,更多地追求从整体统计的角度来建立最佳的语音识别系统。隐马尔可夫模型(hidden Markov model,删)技术就是其中一个典型技术。删的研究使大词汇量连续语音识别系统的开发成为可能。
20世纪90年代,人工神经网络(artificial neural network,ANN)也被应用到语音识别的研究中,并使相应的研究工作在模型的细化、参数的提取和优化以及系统的自适应技术等方面取得了一些关键性的进展,此时,语音识别技术进一步成熟,并走向实用。许多发达国家,如美国、日本、韩国,已经IBM、Microsoft、Apple、AT&T、Nrr等著名公司都为语音识别系统的实用化开发研究投以巨资。
当今,基于HMM和ANN相结合的方法得到了广泛的重视。而一些模式识别、机器学习方面的新技术也被应用到语音识别过程中,如支持向量机(support vector machine,SVM)技术、进化算法(evolutionary computation)技术等。
1.2.3国外语音识别的发展趋势
目前,全球语音技术市场规模超过30亿美元,近年来年增长率保持在25%以上,未来语音识别市场被看好,其中电信行业(V oIP等),移动应用领域(手机、学习机、平板电脑、车载系统等移动设备),都会呈现出爆发式增长。下面列举几个电信及移动应用领域成功的语音产品/软件。
1、电信行业:电话银行系统
电话银行系统(Telephon Barver Server)是近年来国外日益兴起的一种高新技术,它是实现银行现代化经营与管理的基础,它通过电话这种现代化的通信工具把用户与银行紧密相连,使用户不必去银行,无论何时何地,只要通过拨通电话银行的电话号码,就能够得到电话银行提供的其它服务(往来交易查询、申请技术、利率查询等),当银行安装这种系统以后,可使银行提高服务质量,增加客户,为银行带来更好的经济效益。
2、移动应用领域:Siri
Siri是苹果公司在其产品iphone 4S上应用的一项语音控制功能。Siri可以令iPhone4S变身为一台智能化机器人,Siri可实现:手机读短信、手机介绍餐厅、用手机询问天气、语音设置闹钟等功能。
Siri支持自然语言输入,并能调用系统自带的天气预报、日程安排、搜索资料等应用,还能够不断学习新的声音和语调,提供对话式的应答。
3、生活领域:手机“导游”
这是由思必驰设计师独特构思的一款产品,该产品旨在为您的手机里藏一位“导游”。每到一个景区,这位“导游”会先到售票处“报到”,然后只要您告诉他景点名称,他就能为您“滔滔不绝地讲述”景点背后的故事。