一种基于语音识别的智能人机交互模式构想
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一种基尹吾Bi羯啲
智能人机交互模式构想
□文/杨婷、李靖、黄成琳
近年来,随着人工智能技术的快速发展,语音识别技术越来越成熟,语音交互模式正逐渐发展成为一种简单、可依赖的智能人机交互模式。在以智能语音为主要交互方式的智能时代中,人们的双手和双眼将得以解放,人们的生活将更加便利和美好。
计算机行业变革的原动力及前智能时代面临的问题
科技改变生活、改变世界,计算机技术的兴起与发展历程真切有力地证实了这一点。
20世纪末期,微软、苹果用鼠标点开了PC时代的大门,让个人电脑走进千家万户,使得信息的传播摆脱了时空的束缚。21世纪初,苹果、谷歌在触屏上划开了移动时代的帷幕,让智能手机风靡全球,使得社交和娱乐无处不在。作为计算机领域最具典型性的两种不同形态的产品,个人电脑和智能手机均以独有的方式得到了千千万万的人们的普遍认可和接受,从而引发了时代的变革。
早期电脑依赖于键盘和字符屏幕的交互体验模式将多数人拒之于计算机的门外,而依赖于鼠标点击的图形用户界面交互模式的发明,无疑极大地降低了普通民众使用和理解个人电脑的门槛,使得PC时代的步伐悄
然而至,进而深刻地影响了人们的生活。传
统手机依赖于实体键盘或笔触交互的体验模
式,让手机的使用总显得不那么便捷,而依
赖于多点触控的交互体验模式让人们对手机
的操作更加得心应手、方便快捷,使得移动
时代的浪潮汹涌而至,从而改变人们日常生
活的方方面面。
事实表明,引发计算机时代变革的真正
动力,源于技术,却并非纯粹的技术。确切
的说,那是一种建立在计算机技术上的最友
好便捷的人机交互体验模式。这是一个用户
体验至上的年代,计算机的使命是为人们创
造出一个简单、可依赖,却又不乏趣味的多
彩世界,只有最大限度地降低人们的学习和
使用成本,才能创造出最具普适性的大众产
品。
紧随移动时代的步伐,我们即将迎来一
2019年第5期21
个全新的计算机时代一一智能时代。在这个时代,一切设备都将被纳入到计算机互联网组成的体系中接受支配和调动。那将是一个随心所欲的时代,一切设备的控制和调动都将变得轻而易举和不费吹灰之力。为了迎接美好智能时代的到来,人们仍在不断地努力和尝试。然而,何谓智能时代,智能时代用户的真正诉求和痛点何在,究竟什么才是真正的智能,这些问题目前似乎尚未形成普遍的共识或意识。
在我们目前所处的这个前智能时代,探索者们通常的做法是用智能手机触屏方式来控制我们的设备以求达到便捷控制的目的。那么既然如此,我们为什么不直接制造岀一个智能的万能遥控器来实现这种控制?手机的使命不是应该定位于娱乐和社交才更加合理吗?设备的控制是否该另请高明,智能时代是否一定需要与智能手机以及它的那一套触屏操作模式捆绑在一起?这是真正的智能吗?
值得注意的是,智能时代应该是一个不同于PC时代和移动时代的全新计算机时代。设备与人的距离已经超出了人手的势力范围,设备的反馈模式也脱离了屏幕的限制,依赖于双手和双眼的触屏交互模式对于用户而言显然已经有些力不从心和差强人意。或许,智能时代亟须寻求一种不同于PC和手机的全新的用户交互模式来引发计算机领域的再一次革新,使得智能的理念深入人心。
一种语音智能控制模式的构想及其可行性
不妨做如下一个构想,在你的家居系统中,存在很多不同类型的设备,包括电视、冰箱、空调、洗衣机、电灯、空气净化器等。这些设备与传统的设备在核心功能上没有本质区别,甚至更加专一和简单,但是它们都具有一个共同的神奇特点—
—那就是听主人的口令行事。作为主人的你,首先需要为每一个设备取一个个性化的名字,比如电灯叫做亮亮,空调叫做大个头,电视叫做小明。然后就会出现这样一种交互场景:
杨婷中国软件评测中心工控与人工智能业务
发展部主任
李靖杭州微帧信息科技有限公司工程师
黄成琳北京尊冠科技有限公司工程师
22机器人产业|ROBOT
INDUSTRY
你说:亮亮,
电灯回应:亮亮得令,亮亮已开灯。
你说:大个头,启动空调!
空调回应:大个头得令,大个头已启动空调!
你说:大个头,播报温度!
空调回应:大个头得令,当前20摄氏度!
你说:亮亮,关灯!
电灯回应:亮亮得令,亮亮已关灯!
你说:小明,湖南卫视!
电视回应:小明得令,小明已跳到湖南卫视!
你说:小明,关机!
电视回应:小明得令,小明已关机!
这将是一个美妙的场景,在这个场景中一切设备都被拟人化了,成为了听你口令调遣的仆人,语音成为你们之间最便捷的沟通方式,而你的双手和双眼也因此得到了解放,再也不用望着狭小的触屏点来点去了。不知道这样一种构想是否会让人有些小小的激动和期待。
在我们所构想的那个美妙场景中,有以下几点要素需要明确和强调:
1.每个设备都具有至少一个由“主人”
录入(或系统默认指定)的个性化的语音名
称,这个语音名称将被系统用来确定“主人”
命令下达的对象,因此不同设备其名称不能
相同;
2.每个设备具有有限的语音指令集,每
条指令均可个性化定制或者由系统默认指定,
这个语音指令也是系统决定使用何种指令的
根本依据;
3.设备指令执行的结果全部由预设的系
统语音播报,播报效果友好(音色甜美柔、
富有感染力)且语义明晰。
总之,一切的要旨都是追求语音交互的
极致体验,让人与设备的交流畅通无阻、亲
切自然,让语音的这种交互模式成为另一种
全新的简单可依赖的人机交互模式。
从已有的技术现状来看,实现这样一个
拟人化的家居系统似乎并非遥不可及,甚至
可以说技术条件已然具备。其中,最关键的
问题在于语音指令的识别。
现如今,语音识别技术在软件互联网科
技行业已经并不新鲜,甚至趋于成熟。或许
识别准确率的问题仍然是这项技术的一个现
2019年第5期
23