手机智能语音助手的发展与未来
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2019年4月手机智能语音助手的发展与未来
许连骐(北京市第九中学,100041)
【摘要】自从iPhone引入了Siri的功能之后,人们发现了智能语音助手带来的全新操控方式。如今,智能语音助手已经有了新的突破与发展。本文回顾了语音助手的发展过程,并预测了未来语音助手的新载体。
【关键词】语音助手;智能手机;技术应用
【中图分类号】TN929.53【文献标识码】A【文章编号】1006-4222(2019)04-0262-02
1介绍
自从2011年搭载Siri的iPhone4s出现,智能语音助手步入了人们的视线。如今,智能语音助手已经成为智能手机的标配,人们也越来越多地习惯于用语音助手完成打电话、发短信等功能。2018年5月9日,谷歌发布了升级版的数字助理Google Assistant。谷歌介绍称,它的“持续性对话”功能可以让对话更加自然,而“多重行动”功能可以让使用者同时提出几个问题。谷歌的语音助手可以伪装成真人去打电话订餐厅的位置,在演示的过程中,餐厅的服务员并没有意识到给她打电话的是语音助手,而不是真人。
日常生活中我也会经常用到手机上搭载的语音助手,例如在骑车时利用语音助手打电话,为自己节省了大量时间。目前国内手机搭载的语音助手也可以实现高度识别,大幅改善了使用体验。
这篇论文首先探讨了语音助手的基本情况;其次探讨了智能语音助手在未来的应用;然后反思了智能语音助手可能面临的问题;最后给出了结论。
2语音助手概述
智能语音助手的定义是以人类的自然语言为主要交互方式,从语言中能够充分理解出用户意图,并能够直接给出对应信息或者持续交互的系统。智能语音助手打破了传统设备中屏幕的作用,可以调动用户的听觉和语言来控制智能设备,开辟了新方式。其中的技术现在也在不断改善。
在这几年国内迅速兴起的语音助手就是科大讯飞了。它的识别准确度已经达到了95%,在国内处于领先地位。我们经常使用的功能就是语音转文字的功能,帮助很多用户完成了速记的任务。在国外,2018年亚马逊推出了具有交互效果的智能音箱,真正地将软件和家居联系在了一起,形成了深入的产业链,占据了巨大市场。亚马逊的智能音箱可以获得成功,归功于其真正地实现交互效果,真正地和一个人去对话。由此可见,语音识别与多轮对话已经成为关键所在。
语音助手中用到的技术主要包括:
(1)语音识别技术:自从1958年AT&T贝尔实验室开发的名叫Audrey的语音识别系统以来,语音识别这项技术已经走过60年的历史。2017年IBM通过长短时记忆、WaveNet语言模型和三个强声学模型的组合,将语音识别错误率降低到了5.5%,几乎与人类速记员无差别,已经极为达到人类水平。
(2)智能化技术:分为自然语言理解、多轮会话管理等多种技术。
自然语言理解暂时处于浅层含义的理解,也就是说还不能够理解语句背后的含义,机器对句子的理解还停留在表层。所以,想要真正实现自然交互,就需要让机器拥有深度理解的功能,我们的技术还需要进步。
多轮会话管理建立在自然语言理解技术之上,去完成进一步的多轮交流。这不仅需要机器可以准确理解每一句话,并且要将它们之间建立联系,从而形成完整的对话。这就需要智能语音厂商们去建立庞大的语言库,增强机器联系上文的能力。3未来展望
3.1智能家居
未来的智能电器,如智能音箱、智能电视等,均可以实现语音控制与交互。我们可以通过智能音箱来开关电器,可以直接与智能电视对话以找到喜欢的频道。同时这些智能设备可以与手机相连,让你在室外就可以控制家中的家具,可以在下班回家前就提前打开家里的灯。开辟了新的控制方式,让语音助手真正融入我们的生活。
3.2智能汽车
结合现在的热点话题“自动驾驶”,也许二者可以结合。直接用语音控制汽车的行驶,解放双手,通过语音控制目的地或打开车中的某些设备。当技术成熟后,也可以有效地减少交通事故的发生,更加合理地选择行驶的路线,为我们提供便利。
3.3智能办公室
语音助手也可以进入办公场景,取代传统秘书的一些工作,例如制定会议流程、预定会议室等。在一些在线会议的过程中,语音助手可以作为会议记录员或者实时翻译员,帮助参会的人员更加高效地进行讨论。
3.4可穿戴设备
可穿戴设备由于屏幕较小,不适合进行触屏操作,而语音助手正好可以弥补这个不足,作为各种可穿戴设备的控制和操作方式。同时,很多可穿戴设备平时处于待机状态,使用语音指令进行唤醒也显得十分自然。
3.5智慧医疗
我们可以通过大量医疗知识的积累,训练语音助手发挥寻医问诊的功能,一方面可以帮助病人询问医疗卫生方面的问题,另一方面也可以在医生进行手术等过程中,直接通过语音命令调取病人的病历等资料。语音助手还帮助大家足不出户,完成远程问诊,并且及时准确地记录下病人的状况,在必要的时候还可以自动联系医生给病人及时的救治。
4语音助手面临的问题
4.1技术的不确定性
如今智能语音助手的普及率很低,对普通家庭来讲不存在使用的必要。其次语音助手的技术还不够成熟,目前,大多数语音助手可以达到高百分比的识别率,可以清晰地识别你说的话。但是识别不代表理解,在人看起来很简单的问题,在语音助手中就转变为了复杂的数据。大多数语音助手都是一问一答,如果你的问句里只有一个简单而明确的问题例如“现在几点了?”,它可以回答你。但如果你像平常和别人聊天一样一句话中连续提出了两个问题或隐藏了一个问题(没有用疑
论述262
2019年4月
问语气),语音助手就会很难识别。大多数情况下你很难得到答复。面临着重复问题又得不到回答的情形,很多人放弃了使用语音助手。
4.2可控制的范围过于单一
智能语音助手的用途狭隘,仅能控制手机程序中自带程序。例如我们打开一个第三方音乐软件,在使用这个APP的过程中,命令语音助手“播放”“暂停”在其中起不到任何作用,他们仅能控制很少部分的软件,无法和第三方程序很好地结合。可我们反观引起问题的原因,是语音助手难以做到我们给出的指令吗?显然不是,真正的问题在于第三方程序没有和语音助手结合的路线,它们的功能中不包含受不同语音助手控制。4.3用户的使用习惯有待培养
在微信变得流行之前,大家并不习惯发语音消息,这个习惯后来才慢慢培养起来。在一些场景中,我们已经有遥控器、开关等等传统的控制方式,看上去并不需要语音助手来帮我们进行控制和操作。换句话说,培养大家对于语音助手的使用习惯还需要一段时间。
5结论
如今智能语音助手还未成为我们日常生活中的一部分,多数人只对它有一个模糊的印象,语音助手几乎不会对他们的生活产生影响。我询问了周围使用智能手机的同学,他们使用最多的功能就是和语音助手聊天,而他们统一反应语音助手并不能让他们脱离寂寞,对话显得生硬死板。显然,识别语言不等于理解语言,让语音助手真正可以与人类对话势必是一场持久战。人们对于新事物的认识往往需要一个过程,我们要做好充足的思想准备,克服前进道路上的困难,我对智能语音助手的未来充满希望。
参考文献
[1]闻立群,刘珊,董明芳.智能语音助手将成为新的用户入口[J].现代
电信科技,2017(1).
[2]甘玉珏,苏军根,林健,等.智能语音产品现状及展望[J].广东通信技
术,2017(12):66-68.
[3]Google Now的替代者们[J].电脑爱好者,2015(21):9-11.
收稿日期:2019-3-11
浅析手机中的模式识别原理
杨舜元(内蒙古师范大学附属中学,内蒙古自治区呼和浩特市010020)
【摘要】近年来,科技的飞速发展尤其是AI技术的崛起,带动了智能手机的迅速升级,人们对新事物的追求与探索使得手机中的模式识别方式也日渐丰富。有些已经与用户的日常使用紧密结合,比如人脸识别、语音识别等,它们在给用户的生活带来极大便利感的同时,也平添了几分科技感与趣味性。本文简略介绍了智能手机中的模式识别系统,着重介绍人脸识别和语音识别的主要分类和基础实现原理。
【关键词】模式识别;人脸识别;语音识别;机器学习
【中图分类号】TP391.4【文献标识码】A【文章编号】1006-4222(2019)04-0263-02
1引言
在21世纪信息时代,各种模式识别已经大量融入我们的生活,智能手机作为个人终端,其蕴含的模式识别也较为丰富,这些模式识别不仅方便用户的日常应用,而且为用户的生活增加了不少趣味性和科技性。所谓手机模式识别,就是智能手机通过硬件传感器,采集前端物体表征或表现信息,经过软件系统聚合、分析、处理、做出反馈,从而达到高效完成目标任务的目的。最近,华为Mate20Pro推出了一项功能,手机可以通过结构光扫描物体信息进行重建,迅速完成AI建模,并通过算法将用户喜爱的玩偶模型扫描到手机里。
2手机模式识别系统简介
2.1手机模式识别分类
在智能手机中,模式识别的方式有人脸识别、语音识别、图像识别、指纹识别等,可以分为安全性识别和实用性识别两大类。其中安全性模式识别包括人脸识别和指纹识别等;实用性模式识别包括语音识别、图像识别等。
2.2硬件和软件分析
作为一台智能终端,智能手机模式识别需要软硬件的支持。硬件即接受前端信号的传感器,由于电子设备只能读取电信号,因此需要传感器将环境或生物产生的其它形式的信号转化为电信号,它们可以作为智能手机接收外界环境信息的“眼睛”和“耳朵”。模式识别的后端处理由手机软件来执行,不同于硬件,软件负责具体应用的处理,可以利用人工智能中的一些方法,先给系统提供大量的环境数据,让其进行模拟、归纳、综合、推理,不断完善知识库,找到不同环境中的最佳处理算法。软件是智能手机的“灵魂”和“智能源泉”,有了软件,智能手机才能准确高效地处理使用过程中纷繁错杂的信息。3人脸识别分类及实现原理
3.1人脸识别实现分类
智能手机中的人脸识别可以采集人脸2D信息或者3D 信息,当前以采集3D信息为基础的人脸识别已占到主流。基于2D信息的普通人脸识别,其采集方法是基于系统启动前置摄像头,采集用户的面部2D信息,且红外相机保证了在光线不足的环境中也可以准确采集。基于3D成像技术的人脸识别主要有三种:基于结构光,基于TOF原理以及双目测距原理,具体示意图如图1所示。
智能手机上采用的大多是结构光方案,用户点亮屏幕时,会触发相应的人脸采集装置,若判断是人脸,则启动点阵
投影
图1三种3D成像技术图示
论述263