实时信息抽取方法及设备的制作流程

合集下载

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

图片简介:

本技术介绍了一种实时信息抽取方法，包括：将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理；将当前意图和当前实体的名称和属性值同时输入至表格填充服务中；输出当前的目标实体。可以为口语对话场景的信息抽取任务特殊定制，迎合了提问者和回答者一问一答的文本输入模式，能将前一轮提问者的问题意图保存至数据库，用户回答时可以取出数据库里的问题意图，再将问题意图和候选实体进行匹配和消歧，并将每一轮用户回答的实体信息实时的输出，使得提问者可以实时的查看目标实体的结果，且无需手动录入干预，省时省力。

技术要求

1.一种实时信息抽取方法，包括：

将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理，其中，所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图，所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值；

将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中，其中，所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体，其中，所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格；

输出当前的目标实体。

2.根据权利要求1所述的方法，其中，所述将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中还包括：

判断是否存在多个与所述当前意图相关的所述预定义的目标实体；

若不存在多个与所述当前意图相关的所述预定义的目标实体，则将所述当前意图直接与所述当前实体的名称和属性值进行关联处理得到最终的目标实体；

若存在多个与所述当前意图相关的所述预定义的目标实体，则将所述当前意图转换成具体化意图；

将所述具体化意图与所述当前实体的名称和属性值进行关联处理得到最终的目标实体。

3.根据权利要求2所述的方法，其中，所述若存在多个与所述当前意图相关的所述预定义的目标实体，则将所述当前意图转换成具体化意图包括：

获取上一轮的提问者的口语文本对应的意图；

将所述当前意图基于上一轮的提问者的口语文本对应的意图转换成具体化意图。

4.根据权利要求1所述的方法，其中，在所述将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理之前，所述方法还包括：

判断所述实时接收的提问者的口语文本和回答者的口语文本中是否存在结束信号；

若所述实时接收的提问者的口语文本和回答者的口语文本中不存在结束信号，将所述实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理；

若所述实时接收的提问者的口语文本和回答者的口语文本中存在结束信号，直接输出最终的目标实体。

5.根据权利要求1所述的方法，其中，在将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中之后，还包括：

对所述提问者的口语文本对应的当前意图以及所述当前实体的名称和属性值进行存储。

6.根据权利要求5所述的方法，其中，所述对所述提问者的口语文本对应的当前意图以及所述当前实体的名称和属性值进行存储包括：

获取所述当前意图和/或所述当前实体的名称和属性值；

对上一轮的所述当前意图和/或所述当前实体的名称和属性值进行替换更新。

7.一种实时信息抽取装置，包括：

意图理解模块以及实体解析模块，配置为将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理，其中，所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图，所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值；

表格填充模块，配置为将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中，其中，所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体，其中，所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格；

输出模块，配置为输出当前的目标实体。

8.根据权利要求1所述的方法，其中，所述表格填充模块进一步配置为：

判断是否存在多个与所述当前意图相关的所述预定义的目标实体；

若存在多个与所述当前意图相关的所述预定义的目标实体，则将所述当前意图转换成具体化意图；

将所述具体化意图与所述当前实体的名称和属性值进行关联处理得到最终的目标实体。

9.一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至6任一项所述方法的步骤。

10.一种存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。

技术说明书

一种实时信息抽取方法及装置

技术领域

本技术属于信息抽取技术领域，尤其涉及一种实时信息抽取方法及装置。

背景技术

在口语对话场景下，如，在用户信息录入时，客服人员需针对所要录入的信息对用户进行提问，用户回答后，客服人员再将信息录入到系统。

传统的基于段落、篇章文本的实体信息抽取系统，必须等到客服人员与用户问答交互完成后，一次性将段落文本或篇章文本作为系统的输入，系统从中抽取用户所需的目标实体信息，最后以格式化的形式输出出来。

此时，若中间某个实体抽取错误或某个实体信息缺失，客服人员是无法及时修改和填补实体结果的。技术内容

本技术实施例提供一种实时信息抽取方法及装置，用于至少解决上述技术问题之一。

第一方面，本技术实施例提供一种实时信息抽取方法，包括：将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理，其中，所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图，所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值；将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中，其中，所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体，其中，所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格；输出当前的目标实体。

第二方面，本技术实施例提供一种实时信息抽取装置，包括：意图理解模块以及实体解析模块，配置为将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理，其中，所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图，所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值；表格填充模块，配置为将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中，其中，所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体，其中，所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格；输出模块，配置为输出当前的目标实体。

第三方面，提供一种电子设备，其包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行本技术任一实施例的多意图识别训练或使用方法的步骤。

第四方面，本技术实施例还提供一种计算机程序产品，所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行本技术任一实施例的多意图识别训练或使用方法的步骤。