【CN109977398A】一种特定领域的语音识别文本纠错方法【专利】

合集下载

一种特定领域的语音识别文本纠错方法[发明专利]

专利名称：一种特定领域的语音识别文本纠错方法专利类型：发明专利
发明人：刘继明,金宁,洪爱金,孟亚磊,陈浮
申请号：CN202010113318.6
申请日：20200224
公开号：CN111369996A
公开日：
20200703
专利内容由知识产权出版社提供
摘要：本发明涉及一种特定领域的语音识别文本纠错方法，首先，使用正确的领域语料统计得到字、词级别语言模型和拼音语言模型；然后，接收待纠错的文本序列，超过一句的进行分句处理；再使用字、词、拼音语言模型确定疑似错误的字词；继而根据语言模型词汇表与易错音字典确定疑似错误字词的候选词清单；最后将候选词代入原文本序列，结合宏观与微观评分选择最合理的句子输出。

选用字、词、拼音、声韵母等不同粒度和维度的基本单元构建语言模型，降低错字导致的分词错误干扰；采用字词语言模型处理孤立的文字错乱，采用拼音语言模型辨别发音偏差导致的连续识别错误；对错误字词替换后候选句子采用宏观与微观评分综合评价，衡量替换后句子通顺程度。

申请人：网经科技(苏州)有限公司
地址：215021 江苏省苏州市工业园区金鸡湖大道1355号国际科技园一期
国籍：CN
代理机构：江苏圣典律师事务所
代理人：王玉国
更多信息请下载全文后查看。

一种语音识别结果纠错方法[发明专利]

专利名称：一种语音识别结果纠错方法专利类型：发明专利
发明人：叶伟
申请号：CN201710994082.X
申请日：20171023
公开号：CN107729321A
公开日：
20180223
专利内容由知识产权出版社提供
摘要：一种语音识别结果纠错方法，包括对语音识别结果进行预处理；找出语音识别结果中容易出错的词句，或对文本语义解析重要的待纠正词、字；对待纠正词、字进行注音，包括全拼和各拼音首字母两种拼音方式，得到待纠正语音识别结果对应的拼音，对应的拼音是指无音调；根据所述拼音全拼方式，利用编辑距离确算法，确定最优候选文本及次优候选文本；根据所述拼音首字母，利用编辑距离算法，确定最优候选文本及次优候选文本；将所有最优候选文本及次优候选文本合并，重复的候选项只保留一个；分别将准候选文本替换待纠错文本，利用n‑grama语言模型分别计算出各替换后的各自语句概率，选取概率最高的作为最终所述待纠正的语音识别结果。

申请人：上海百芝龙网络科技有限公司
地址：200050 上海市长宁区延安西路1326号4楼
国籍：CN
代理机构：上海伯瑞杰知识产权代理有限公司
代理人：孟旭彤
更多信息请下载全文后查看。

一种基于领域的带反馈语音识别后文本纠错方法及系统[发明专利]

专利名称：一种基于领域的带反馈语音识别后文本纠错方法及系统
专利类型：发明专利
发明人：钟将,崔磊,时待吾,何隆
申请号：CN201610200575.7
申请日：20160331
公开号：CN105869634A
公开日：
20160817
专利内容由知识产权出版社提供
摘要：本发明公开了一种基于领域的带反馈语音识别后文本纠错方法，属于语音识别领域；该方法基于汉语句子结构的语音停顿错误来分析语音识别后文本句，检测句子分隔符前后是否符合汉语的句式规则，找到停顿错误，基于音素串相似度计算来划分句子并转换成拼音，并将拼音根据音素表转换成音素串，找到语料库中与该串相似的音素串对应的句子，基于本体的受控词查询模块通过该领域的受控词表建立本体，通过本体纠正识别后文本句中的领域相关词的错误，反馈模块将匹配的结果输出，并将用户选择正确的识别结果和原始的音素串添加进语料库中。

通过本发明，语音识别的原始结果如果正确也不会收到影响，而且通过本体和反馈机制可以更好的确定语音识别的准确性。

申请人：重庆大学
地址：400044 重庆市沙坪坝区沙正街174号
国籍：CN
代理机构：北京汇泽知识产权代理有限公司
代理人：武君
更多信息请下载全文后查看。

语音识别文本的纠错方法[发明专利]

专利名称：语音识别文本的纠错方法
专利类型：发明专利
发明人：沈来信,穆瑞斌,贾师惠,孙明东,董军华申请号：CN202110357882.7
申请日：20210401
公开号：CN113205813B
公开日：
20220311
专利内容由知识产权出版社提供
摘要：本申请公开了一种语音识别文本的纠错方法。

所述方法，包括：获取语音解码输出的待处理文本；调用检错模型处理所述待处理文本，得到出错目标字和出错目标字对应的置信度TopK候选字集；根据所述出错目标字和所述置信度TopK候选字集，对所述待处理文本进行纠错，得到第一纠错结果；根据名词处理模型和所述第一纠错结果，得到出错目标词、目标词类别和名词集合数据；根据所述出错目标词、所述目标词类别和所述名词集合数据，处理所述第一纠错结果，得到第二纠错结果；输出所述第二纠错结果，得到纠错后的最终文本；其中，K为正整数。

通过用语言模型对语音解码输出的待处理文本进行处理，能够更好实现对语音识别文本的纠错。

申请人：北京华宇信息技术有限公司
地址：100084 北京市海淀区中关村东路1号院8号楼21层C2301、C2302
国籍：CN
代理机构：北京中索知识产权代理有限公司
代理人：胡大成
更多信息请下载全文后查看。

【CN109977415A】一种文本纠错方法及装置【专利】

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 201910261329.6(22)申请日 2019.04.02(71)申请人北京奇艺世纪科技有限公司地址 100080 北京市海淀区海淀北一街2号鸿城拓展大厦10、11层(72)发明人黄腾玉　(74)专利代理机构北京柏杉松知识产权代理事务所(普通合伙) 11413代理人丁芸　项京(51)Int.Cl.G06F 17/27(2006.01)G06N 3/04(2006.01)G06N 3/08(2006.01)(54)发明名称一种文本纠错方法及装置(57)摘要本发明实施例提供了一种文本纠错方法及装置。

该方法中，将待纠错长文本分割为多个片段，确定每一片段分别对应的至少一个候选纠错片段；基于所确定的各个候选纠错片段，确定待纠错长文本对应的至少一个候选长文本；针对至少一个候选长文本和待纠错长文本中的每一长文本，依次预测该长文本中，每一字符位的至少一个候选字符，以及每一字符位的至少一个候选字符的候选概率，并基于预测得到的候选概率，计算该长文本的评估分数；基于至少一个候选长文本的评估分数和待纠错长文本的评估分数，确定待纠错长文本的纠错结果。

本发明实施例提供的文本纠错方法，可以提高长文本的纠错结果的准确率。

权利要求书4页说明书15页附图3页CN 109977415 A 2019.07.05C N 109977415A权　利　要　求　书1/4页CN 109977415 A1.一种文本纠错方法，其特征在于，包括：将待纠错长文本分割为多个片段，确定每一片段分别对应的至少一个候选纠错片段；基于所确定的各个候选纠错片段，确定所述待纠错长文本对应的至少一个候选长文本；针对所述至少一个候选长文本和所述待纠错长文本中的每一长文本，依次预测该长文本中，每一字符位的至少一个候选字符，以及每一字符位的至少一个候选字符的候选概率，并基于预测得到的候选概率，计算该长文本的评估分数；其中，每一字符位的至少一个候选字符，为基于所在长文本中该字符位以外的其他字符位上的字符所预测的字符；基于所述至少一个候选长文本的评估分数和所述待纠错长文本的评估分数，确定所述待纠错长文本的纠错结果。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201910130170.4
(22)申请日 2019.02.21
(71)申请人江苏苏宁银行股份有限公司
地址 210000 江苏省南京市建邺区45号地
块金融城4号楼707室
(72)发明人李加庆　沈春泽　谭子豪　周张泉　
(74)专利代理机构南京先科专利代理事务所
(普通合伙) 32285
代理人缪友菊
(51)Int.Cl.
G06F 17/27(2006.01)
G06F 16/33(2019.01)
G06F 16/36(2019.01)
G10L 15/20(2006.01)
(54)发明名称
一种特定领域的语音识别文本纠错方法
(57)摘要
本发明公开了一种特定领域的语音识别文
本纠错方法，包括标准词及变种词字典生成、基
于词的N -Gram上下文短语字典生成、基于上下文
短语最大匹配保护的变种词替换纠错三个部分。

本发明尤其适用于特定领域，比如可用在智能客
服机器人或者智能催收机器人等应用场景中，可
以对机器人对话过程中语音识别文本的质量进
行提升，质量提升后的文本可以提高特定领域应
用中机器人意图识别的准确性，进而提升对话过
程的流畅性，
提升对话机器人的业务价值。

权利要求书2页说明书7页附图3页CN 109977398 A 2019.07.05
C N 109977398
A
权　利　要　求　书1/2页CN 109977398 A
1.一种特定领域的语音识别文本纠错方法，其特征在于，包括以下步骤：
（1）提供正语料库和负语料库，所述正语料库包含无需纠错的文本语料，负语料库包含未经纠错的文本语料；利用正语料库生成标准词表，利用负语料库查找与标准词对应的变种词，组成标准词及变种词字典；
（2）对正语料库进行中文分词，按照词频大小构成正语料的词项组合表，将同一个词项组合中的字符串合并，得到短语，计算短语的字符串长度，将字符串长度相同的短语放在一个集合中，组成上下文短语字典；
（3）输入待纠错文本，做文本滑窗，从左到右滑动文本滑窗，获取滑窗文本，判断滑窗文本是否存在于上下文字典中，并将出现在上下文短语字典中的滑窗文本中的每个字在文本中的索引列出，建立索引集合；对于索引集合，进一步采用文本滑窗，判断滑窗文本是否存在于标准词及变种词字典中，并将出现在标准词及变种词字典中的变种词用对应的标准词进行替换，输出纠错后文本。

2.根据权利要求1所述的特定领域的语音识别文本纠错方法，其特征在于，所述步骤（1）还包括降噪处理：删除正语料库和负语料库中的英文字母、数字及多余标点。

3.根据权利要求1所述的特定领域的语音识别文本纠错方法，其特征在于，所述步骤（1）的标准词表的生成方法为：
（1a）采用文本滑窗的方式，对正语料库进行字层面的词频分析，得到不同字符个数的词频字典，词频字典包括词项及词频；
（1b）对词频字典中的词项进行拼音转换，得到中间文件，中间文件包括拼音、词项及词频；
（1c）基于词频对中间文件进行降序排列，设定第一词频阈值，保留词频高于第一词频阈值的数据，保持排序不变，得到标准词表。

4.根据权利要求3所述的特定领域的语音识别文本纠错方法，其特征在于，所述步骤（1）的变种词的查找方法为：
（1d）采用文本滑窗的方式，对负语料库进行字层面的词频分析，得到不同字符个数的词频字典，词频字典包括词项及词频；
（1e）对词频字典中的词项进行拼音转换，得到中间文件，中间文件包括拼音、词项及词频；
（1f）基于词项拼音对中间文件进行多层次排序；
（1g）遍历所述标准词表，分别在多层次排序结果中逐项通过标准词的拼音匹配到第一个具有相同拼音的词项所在的行，连同该行上下若干行的数据组成集合，在该集合中对每个词项的拼音字符串与标准词的拼音字符串进行编辑距离计算和字符串长度计算，取编辑距离不大于1且字符串长度不大于标准词的拼音字符串的词作为该标准词的变种词。

5.根据权利要求4所述的特定领域的语音识别文本纠错方法，其特征在于，所述步骤（1）的标准词及变种词字典中，每个标准词对应一组相应的变种词。

6.根据权利要求4所述的特定领域的语音识别文本纠错方法，其特征在于，所述步骤（1f）中的多层次排序包括两个字符层排序及三个字符层排序，两个字符层排序包括：首字拼音、末字拼音、词频；末字拼音、首字拼音、词频；三个字符排序包括：首字拼音、次字拼音、末字拼音、词频；末字拼音、次字拼音、首字拼音、词频；首字拼音、末字拼音、次字拼音、词
2。