基于人工智能深度学习的语音识别方法分析

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

血I「技术昌应用〕信息记录材料2019年9月第20卷第9期_______________________________________________基于人工智能深度学习的语音识别方法分析

崔娟,吴磊

(潍坊职业学院山东潍坊262737)

【摘要】随着新一代信息技术的发展,语音识别在各个领域的应用越来越广泛,我们可以在日常生活中更加普遍地接触到各类语音识别产品,如手机中的智能语音助手、车栽语音导航、天猫精灵等.语音识别技术已经在很多应用领域取得重大进展,但是在语音特征提取准确性、识别稳定性、语言建模等方面仍需亟待改进,而深度学习技术的可以很好的解决这些问题。因此,本文针对人工智能深度学习在语音识别领域方面的应用进行分析,做出了简要的阐述。

【关键词】人工智能;语音识别;方法分析

【中图分类号】TP24【文献标识码】A【文章编号】1009-5624(2019)09-0168-02

1引言

随着大数据、物联网、云计算等信息技术的发展,以深度学习为代表的人工智能技术的飞速发展,大幅度跨越了科学研究与实际应用之间的鸿沟,人工智能技术实现了语音识别系统从“不能用”到"可以用”的跨越式突破,迎来了迅猛发展的新高潮切。目前,在当前的市场上,虽然很多语音识别系统都初步实现了人与机器的沟通,但是仍有一些语音识别技术不是很完善。因此在针对语音识别技术改进方面,我们可以充分利用人工智能的深度学习,加强语音识别系统对语音、语义识别的准确性和实时性。而且在研究的过程中,研究人员也要深刻意识到研究结果和实际运用会出现的差异和问题,以及研究结果是否可以满足人们对人工系统的语音识别需求。深度学习的加入就是为了加强语音识别系统的运用,满足人们对语音识别系统提出的更高要求。

2语音识别技术的简介

语言识别技术其实就是让机器通过识别人的发音或者是声线去进行理解,然后将语音信号转变为一种相应的文本,其过程可以简单总结为:语音信号预处理—

—语音信号特征提取—

—在语音模型库中找到相应的模式进行匹配—

—在语言模型库中对语言进行处理—

—完成识别。

人们对语音识别准确性、实用型的需求促进了语音识别系统应用的快速发展,使得语音识别技术取得了一定的研究成果,语音识别系统也逐渐从实验室走向了人们的生活和市场。随着智能时代的到来,语音识别技术不仅在生活上对人们起到帮助,而且在工业发展、通信技术、甚至医疗区域都慢慢体现出了自己的价值⑵。尤其在2000年到2010年这一期间,是信息技术迅速发展的黄金时期,语音识别技术也是在这一时期得到更好的研究和探索,研究人员并将语音识别系统自身所能涉及的领域又进行了新的扩大。其中就包括对噪音信号的处理、信息的识别、以及对声线的识别和智能语音合成等等。总的来说,人类能够与机器进行畅通交流一直都是我们极力研究和期待的事情,语言识别技术很好的满足了人们这一想象和需求。

3目前传统语音识别系统存在的问题

3.1语音识别技术无法进行更好的提升

虽然时代在慢慢进步,但是在研究语音识别系统方面,我们的研究者也遇到了研究事业的“瓶颈期”。虽然现在有很多的设备都安装了语音识别系统,也做到了人与机器之间进行沟通,但是机器始终是机器,就算能够识别语音但是也只能识别一些基础的简单语言回。相对于专业的术语还很难做到识别和理解。研究者在通过各个方面的改造和创新,最终使得语音识别系统在知识理解方面加强了一些对外语以及方言的理解。但是对于噪声处理、系统鲁棒性、语音复杂模型等方面仍然是需要克服的问题,有待进一步提升。

3.2语音识别系统无法进行准确的数据特征提取

近年来互联网技术突飞猛进,很多设备也与互联网接轨,在当下信息技术发达的时代背景下,智能系统就成为了现在的社会主流。而语音识别就是这种主流中最重要的

这些命令调整自身运行参数。

4结论

10kV以下配电网无功电压优化与智能控制设计的目的是降低系统无谓损耗,保证供电电压平稳,提升配电网运行的经济效益。随着我国1ORV以下配电网性能及运行压力的变化,其产生的无功电压也会随之改变。因此无功补偿应作为10kV以下配电网维护管理中的重点工作之一,结合行业发展对配电网运行效率的新要求,积极引进现代化技术,做好低压配电网无功补偿工作。

【參考文献】

[1]张世伟,连鸿波.配电网无功电压混成自动控制研究[J].华东电力,2018(09).

[2]张文琼,戈狄,赵兴华.许昌地区无功电压合格率偏低的原因及对策[J].农村电工,2018(06).

[3]陈章潮,林桂钱.地区电网的无功电压规划和运行的优化方法研究[J].中国电力,2019(03).

⑷何志桥.略谈电网无功电压与几种调压措施[JL华东电力,2018(02).

[5]吴启富,王井钢,陈汝侧,林忠敏.川南电力系统电压无功综合分析[J].四川电力技术,2018(06).

作者简介:范晓帅(1987-),男,山东省高密县人,开滦唐山矿业分公司机电科,工程师,从事矿井机电方向的研究.

168

信息记录材料2019年9月第20卷第9期〔信息:技术焉应用

研究成果。在人们对语音识别进行研究的时候,会通过各种方式去收集语音数据,从而对语音识别进行更为仔细的研究和分析,但是这种语音数据靠传统的方法无法让语音识别系统进行更为准确的数据特征提取分析。简单来说,传统的语音识别中,是依靠人工进行特征提取,进而进行模型训练,这种方法很大程度上受人为因素影响,显然是耗费人力又非常不稳定。深度神经网络可以进行自动特征提取,而且深度学习算法被广泛应用于大数据处理场景,所以利用深度学习进行特征准确提取,进而真正实现真正的人机交互成为语音识别技术的一项新挑战。

4人工智能深度学习的语音识别方法

4.1提高语音系统对特征的识别

语音信号特征的提取是语音识别系统中至关重要的第一步,主要目的是将语音信号携带的大量信息进性量化,得到能够代表语音信号本省的特征,进性后续声学模型分析和处理。深度学习最先在图像识别中取得了优异的效果,随后在语音识别中也表现出了远远超过其他传统方法的强大优势。它特殊的训练方式可以给神经网络提供优秀的初始权值和偏重,从而让神经网络模型在训练中不至于陷入局部最优解,而是收敛于合理的极值点。深度神经网络可以学习到描绘原始音素的数据的本质特征,从而提高数据的可区分性,提升语音识别系统的性能。同时,深度神经网络学习到的深度特征,可以在降维后保证原有信息不受损坏,保持较高的音素识别率。利用深度神经网络对数据的层层映射表达,可以提取到更能表征原始数据的深度本质特征,进而提升传统语音识别系统的性能。

4.2加深语音识别模拟训练

深度神经网络使用语音预处理好的数据进行模型训练,由于网络鯉层数较深,网络结构较为复杂,训练过程中需要调整大量的参数,可以釆用自编码器模型,降低陷入局部最优和过拟合现象。对语音识别进行模拟训练主要是为了更好的让识别系统对所需要识别的语音特征值进行更好的掌握叫输入大量的数据多次循环训练能够更好的加深识别效果。除了要在语音识别系统中加入模拟训练的模板,还应该将模板库中的文字进行判别,多加入一些相似程度大的字可以更好的提高语音识别效率,避免出现比较低级的错误。将语音识别模式进行扩大和增加,可以很好地从根本上提高语音识别的匹配度,从而做到对语音识别的性能提高,再加上本身语音识别系统就需要做到对各类语言进行分析和掌握,所以增加语音模板是对语音识别系统训练的较好方法之一。

4.3融入运动学和声学特征提高语音情感识别

随着人工智能技术的快速发展,人们对人机交互也有了更高的期待,希望在进行沟通交流的时候可以带有感情,那么语音情感识别也逐渐被加入到语音识别系统中。分析语音中的情感信息并将其中的特征提取出来是非常复杂的过程,只是通过语音来识别说话人的情感本身就有自己的局限性,所以融入面部表情、发音器官运动数据,融入运动学和声学进行语音情感识别具有重要作用。由于发音器官的运动学数据采集难度系数较高,传统的语音情感识别只是基于声学和统计学,但是随着科技的迅猛发展,面部表情运动数据、发生器官运动数据、声学数据等更多大量特征被釆集后逐渐融入到情感语音识别的行列中来。深度学习模型对数据的需求量大,加入发音器官运动学和声学特征可以很好的扩充样本数据量,进而优化情感语音识别模型。我们开展了大量的研究来提取和分析情感特征,可以帮助智能产品更好地识别人类情感状态,进而提高人机交互水平。未来的语音识别系统通过深度学习让人机交流真正带有情感,不仅需要做到对情感的识别,就是对于不同的年龄段、性别、以及发音习惯的情感声音能够做到更好的识别和分析。

5基于人工智能深度学习语音识别系统的直要性基于人工智能的深度学习语音识别系统在很多方面做出了巨大贡献,但是还有很多缺陷,需要进一步的不断发展和完善。比如深度学习语音识别系统模型训练所需要的大量数据的采集系统也不够完善,不同年龄、性别的人语音提取、发音器官运动数据采集、声学数据的采集等等。不管怎样,这种深度学习的模式为了更好对语音识别系统进行提示和改造的方向,会在音识别系统在以后的运用中做出更好的贡献。

语音识别系统已经逐渐走进千家万户,语音智能导航、智能音箱、智能声控,陪护机器人等越来越多,这足以证明了语音识别技术飞速发展对人们日常生活的影响。因此,加强语音识别系统的深度学习可以更好地让语音识别系统在人类的生活中达到更好的服务水准,在解决人们存在的生活问题的同时,还能娱乐人们的精神生活。总之,对于现代社会的发展,语音识别系统还是做出了一定程度的贡献。

6结语

语音识别技术是人类发展和社会进步的智慧结晶,我们需要融入更多元素,进行更多尝试,才能进行更好更深层次的提升语音识别技术。在高科技时代的发展背景下,目前语音识别系统已经达到了很好的服务水准,不论是在日常生活还是工作中,都起到了至关重要的作用,帮助人们解决了很多不必要的麻烦和问题。未来,基于人工智能的深度学习对语音识别系统将不断完善提升,冲破发展瓶颈,发展空间十分广阔。

【参考文献】

⑴赵涛,张羿,王永和,等.基于深度学习的人机语音交互平台[J].信息系统工程,2019,301(01):104-106.

[2]马树文.深度学习在语音情感识别中的应用与分析[J].科技传播,2019,11(4):147-148,155.

⑶刘立辉,杨毅,王旭阳,等.机载任务系统语音交互技术应用研究[J].电子科技,2017,30(12):125-129.

⑷孙可,刘忠武,吴雨洽,等.基于Python的深度学习语音识别[N].沈阳师范大学学报(自然科学版),2019, 37(3):274-277.

[5]周海兵,胡方哲.语音识别控制系统[J].科技风,2019,

(14):92.

⑹林圣晔.语音识别技术[J].数码设计(下),2019,

(4)

:182-183.

169

相关文档
最新文档