【CN110085223A】一种云端互动的语音交互方法【专利】

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 (43)申请公布日 (21)申请号 201910262068.X

(22)申请日 2019.04.02

(71)申请人北京云知声信息技术有限公司

地址 100000 北京市海淀区花园路2号牡丹

科技楼五层A503

(72)发明人李霄寒　

(74)专利代理机构北京冠和权律师事务所

11399

代理人朱健　张国香

(51)Int.Cl.

G10L 15/22(2006.01)

G10L 15/30(2013.01)

G10L 15/34(2013.01)

G10L 15/08(2006.01)

G10L 21/02(2013.01)

(54)发明名称

一种云端互动的语音交互方法

(57)摘要

本发明提供了一种云端互动的语音交互方

法，该语音交互方法是基于将机器终端设备与云

端设备进行通信连接，以此利用云端设备自身强

大的计算能力和完善的算法模型设计，通过该云

端设备对该机器终端设备接收到的语音信号执

行自动回声消除处理和关于预设唤醒词的检测

识别处理，该语音交互方法能够更加全面和高效

地消除其中的回声信号、以及更加精确和快速地

检测识别语音信号中的预设唤醒词，从而有效地

避免机器终端设备由于回声信号消除不彻底而

导致误唤醒或者自激唤醒情况的发生。权利要求书2页说明书6页附图1页CN 110085223 A 2019.08.02

C N 110085223

权　利　要　求　书1/2页CN 110085223 A

1.一种云端互动的语音交互方法，其特征在于，所述云端互动的语音交互方法包括如下步骤：

步骤(1)，终端设备对接收到的语音信号进行第一回声消除处理和第一语音唤醒识别处理，以此得到第一唤醒识别结果；

步骤(2)，云端设备对所述第一回声消除处理对应的多通道录音数据进行第二回声消除处理和第二语音唤醒识别处理，以此得到第二唤醒识别结果；

步骤(3)，所述终端设备基于所述第一唤醒识别结果和/或所述第二唤醒识别结果，进行适应性的工作模式切换。

2.如权利要求1所述的云端互动的语音交互方法，其特征在于：在步骤(1)中，所述终端设备对接收到的语音信号进行所述第一回声消除处理具体包括，所述终端设备获取自身声音播放模块发出的声音信息作为参考录音信息、以及获取自身声音接收模块采集的声音信息作为原始录音信息，并根据所述原始录音信息和所述参考录音信息进行所述第一回声消除处理。

3.如权利要求1所述的云端互动的语音交互方法，其特征在于：在步骤(1)中，所述终端设备进行所述第一语音唤醒识别处理具体包括，对经过所述第一回声消除处理后得到的第一回声消除语音信号，执行第一唤醒词识别处理，并根据所述第一唤醒词识别处理的结果生成所述第一唤醒识别结果。

4.如权利要求1所述的云端互动的语音交互方法，其特征在于：在步骤(1)中还包括，所述终端设备根据所述第一唤醒识别结果进行视觉免干扰提示操作；其中，所述视觉免干扰提示操作具体为所述终端设备针对自身是否处于被唤醒状态执行关于光线变化形式和/或界面显示形式的提示操作，同时所述终端设备维持自身声音播放模块的工作状态不变。

5.如权利要求1所述的云端互动的语音交互方法，其特征在于：在步骤(2)中，所述云端设备进行所述第二回声消除处理具体包括，所述云端设备将从所述终端设备获取所述第一回声消除处理对应的所述多通道录音数据，并对所述多通道录音信息进行所述第二回声消除处理；其中，所述多通道录音数据包括参考录音信息和原始录音信息，所述参考录音信息为所述第一回声消除处理对应处理的所述终端设备自身声音播放模块发出的声音信息，所述原始录音信息为所述第一回声消除处理对应处理的所述终端设备自身声音接收模块采集的声音信息。

6.如权利要求5所述的云端互动的语音交互方法，其特征在于：在步骤(2)中，所述云端设备获取所述多通道录音数据还包括获取所述终端设备在被唤醒前对应的预设时间段内和在被唤醒后对应的预设时间段内，其自身声音接收模块对应采集的唤醒前声音采集信息和唤醒后声音采集信息；所述云端设备在获取所述多通道录音数据后，根据所述原始录音信息、所述参考录音信息、所述唤醒前声音采集信息和所述唤醒后声音采集信息执行所述第二回声消除处理。

7.如权利要求1和5-6中任一项所述的云端互动的语音交互方法，其特征在于：在步骤(2)中，所述云端设备进行所述第二语音唤醒识别处理具体包括，所述云端设备基于所述多通道录音数据关于所述第二回声消除处理的处理结果，对所述处理对应的声音数据信息进行所述第二唤醒识别处理，以确定所述声音数据信息中是否存在预设唤醒词，从而得到所述第二唤醒识别结果。