基于语音分析的智能质检关键词提取方法设计
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 174
•
基于语音分析的智能质检关键词提取方法设计
深圳供电局有限公司信息中心 王旭勇
随着我国经济发展水平的不断提高,智能质检系统的研究日趋深入,使之不断进步与发展,语言质检深入研究之下,大大将呼叫中心质检抽样准确率提高了,工作效率也大幅度提高。纵向分析智能质检系统当前备受关注,人们开始普遍对智能质检自动关键词发现功能开展研究,系统整合后可以快速将预设好的关键词提取到,将语音转换为文本后,提取录音文本关键词,还可以通过TextRank 对文本录音中关键词提取,匹配、融合与预设的质检关键词库,最终将文本录音中出现频率最高的目标关键词提取出来。本文将具体对智能质检关键词基于语音分析的提取方法的设计进行论述。
基于语音分析的智能质检关键词提取意义有以下几方面:语音文本表述口语化更严重并且存在一些不规范表述,关键词提取可准确锁定有价值信息,有效去除冗余;质检人员要对检测重点信息有所了解,并获取信息权重值,关键词提取可将重点质检问题及时发现并处理好。还有就是快速识别关键词并提取,可以帮助质检人员对语音信息全面了解。
1.研究背景
为了更好的应对新一轮电力改革带来的巨大挑战,增强供电企业与用户间的交流,进一步将服务质量与效率提高,就必须对语音服务质量相关智能质检系统当前得到广泛关注,更深层次的研究及应用语音分析技术,转换为文本的语音信息,为进一步检测语音服务质量创造了条件。在实际检测中,固有主题的检测仍是语音文本信息检测的重点,为帮助质检人员获取更多有价值信息,就必须快速将关键词检索出来,精炼文本信息,将关键的、能够反映原文主旨思想的词语反映出来。已经具备非常强的实用性对于关键词提取来说,同时也称为信息处理基本工作之一。为此,对于提升质检工作质量及效率来说,高效、准确提取关键词非常有必要,也是智能化质检系统核心内容。自然语言处理(NLP )是指用自然语言对录音文本处理,并抽取文本关键词的方法,作为人工智能的重要研究领域,该方法中体现语音识别、文本分类、文本校对等基本功能,还可
以体现机器翻译、自动分词等智能化功能。信息抽取(IE ),可快速提取关键信息。
2.设计总体方案
语音质检系统与原有电销管理系统之间是相互关联的,输入语音分析系统将录音管理中的语音,借助语音识别功能,可以将文本转换完成,随后就可以检索关键词,并进行建模等。基于语音质检系统,首先进行信息转化,即将录音信息转变为文本信息,然后使用TextRank 算法将文本录音中关键词自动提取出来,做详细匹配与预设好的质检关键词,并实现两者融合,最终将实际文本录音中出现次数最多的目标关键词提取出来。整个设计方案流程见图1
:
图1 基于语音分析的智能质检关键词提取方案
3.使用TextRank算法提取关键词
3.1 TextRank算法
由Page Rank 算法衍生出来的一种算法,TextRank 基于排序算法原理使用,不单单依靠局部某点信息进行节点排序,而是依据全局信息递归计算,对文本分割,由分割出的若干个单元组建出一个完整的图像模型,排序对文本中重要成分,提取算法针对单一文档中关键词。可用一个有向权图G=(V ,E )表示TextRank 模型,词语构成权图中的V ,V ×V 的子集就是E 。任意两点v i 由W ji 表示,图中指向该点的其他集合表示为In (V i )入度,vi 指向其他点集合,称为出度,表示为Out (v i ),Vi
得分计算公式为:
图中表示某一点都有1-d 的概率指向其他任意点为d ,即阻尼系数,d ∈[0,1],0.85为d 的默认系数。每个点进行打分时,应用Tex-tRank 算法,每个点必须为指定任意的初值,计算采用迭代计算方式并收敛。鉴于图有着一定连贯性,收敛需经过较少次数迭代实现。3.2 TextRank算法下关键词提取
从一段文本中将众多有价值的语句提取出来就是TextRank 算法下关键词提取的基本方法。利用一定窗口内的词汇间关系排序后续关键词,关键词从文本中直接抽取出来,也就是指在图中随机游走的过程,关键词的选择最终依据投票得分高低而定。具体方法为:
获取到录音集合文本T ,通过接口,对完整的语句进行分割。各个分割的片段表示为[S 1、S 2、S 3、S 4.....,S n ]。先分词、确定词性对每个文本,然后进行词性标注,并集中处理,最终将与主题无关或者冗余的文字去除,比如“的”、“而且”、“但是”,剩下的定性词作为备选关键词,这些备选词表示为[t i,1,、t i,2、t i,r ,.....t i,n ]。构建出备选关键词图,即G=(V ,E ),依据指定共现窗口K 大小进行构造,任意两点间的边由共同关系构造出来。然后依据特定公式进行计算,最终将迭代传播计算各节点权重得分值计算
出,直到将收敛完成。对各节点权重进行排列,按照倒序排列方式,关键词提取的结果为得到的最重要的T 个单词。
4.自定义词库关键词提取
4.1 将关键词库建立起来
因属于一种无监督的提取方法,Tex-tRank 算法对文本整体结构综合考虑后进行提取,受业务规范流程影响,会出现关键词提取数目过大的情况,在使用TextRank 算法提取关键词时,并且有较多的礼貌用语,包括“您好”、“谢谢”等,会影响到目标关键词的提取效果。
为将语音质检关键词日趋的针对性增强并提高准确性,就必须总结过去呼叫中心语音质检关键词提取相关经验,将语音出现频率最高的关键词提取出来,同时提取出出现次数最多的专业词语。对重点关键词构建自定义词库,依据语音质检工作实际要求及标
• 175
•
准,这样才能保证关键词更为规范、具备更强的表达性,同时,还要给予一个权重值对于自定义词库中每一个关键词。关于自定义词库关键词提取方法,具体做如下介绍。4.2 自定义词库关键词提取
可以直接将语音质检中与关键词相关程度高的样本筛选出来,从众多的筛选出的样本中提取出关键词。具体方法如下:
(1)将录音集合文本T 获取到以后通过接口方式,中分分词对文本内容,仍表示为[S 1、S 2、S 3、S 4.....,S n ]。
(2)对每个词语在文本中出现的频率进行统计,这里主要指自定义词库。
其中,关键词在文本中出现频率表示为count (Si ),文本中总分词数表示为count (T )。
(3)经过两次抽取以后的语音文本,将关键词结果集最终得到,结果集带有两组关键词。此时,按照1:1的比例数量设置关键词显示数,最终将关键词结果集提取出来。具体过程详见图2。
比如,关键词总共有10个,需要从结果集中提取出5个关键词,这5个关键词一定要是分数最高的,并作为备选,去重处理对这5个备选关键词,提取出其他关键词从词库中,补充备选关
键词,将最终的关键词结果集得到。
图2 基于语音分析的智能质检关键词融合过程
5.结束语
本文主要介绍了基于语音分析技术,将语音转换为文本进行关键词智能提取的方法,设计了基于TextRank 算法的智能质检关键词提取方法,基于这种算法可以对单一文本文件关键词进行提取,将关键词提取的准确性与针对性增强。同时,参照呼叫中心语音质检相关经验成果,将自定义词库引进,给予不同权重,最终将目标文本的关键词提取出来。同时,在提取后,对两组关键词集进行融合与匹配,将出现频率最高的目标关键词结果输出,这种关键词日趋方式有效保证了关键词质量与准确性,可进一步将呼叫中心质检问题录音监测概率提高,对于将语音质检工作质量提高有着非常重要的意义。在今后,仍需要不断改进自定义词库并对其优化,这样才能对质检工作出现的变化更好的适应,将关键词提取问题解决,将客户服务质量提升。参考文献
[1]关浩华.基于语音分析的智能质检关键词提取方法设计[J].自动化与仪器仪表,2017(07):106-108.
[2]李如雄.基于语音分析的智能质检系统设计[J].自动化与仪器仪表,2017(06):114-116. [3]赵晶,BERNHARDT May.非线性语音分析在普通话语音发育障碍评估中的应用[J].教育生物学杂志,2014,2(02):82-93.
[4]林可希.智能语音技术在热线服务质检中的应用探讨[J].无线互联科技,2015(12):142-144. [5]王大伟.基于语音分析技术的电力客户服务质量检测与分析探究[J].电子测试,2014(05):100-101. [6]蔡武.浅谈PRAAT 语音分析软件在菲律宾华校汉语语音教学中的应用[J].现代语文(学术综合版),2015(01):148-149.
[7]张磊,韩纪庆,王承发.声道的调频-调幅模型及其在语音分析中的应用[J].计算机研究与发展,2015(06):689-695.
(上接第173页)
调整其之间的间距使其符合安全间隙要求;清除油中金属颗粒、杂质、异物、油泥、水分,有必要的话干燥处理变压器油。
9、接头过热
高低压接头是变压器与电网连接的必经之路,若连接不良必将引起过热甚至熔断,严重影响电网正常运行。所以,接头过热现象尽量避免,一旦发现要尽快解决。
普通连接时的平面接头对接面应加工成平面,剔除其杂质并均匀涂抹导电膏,确保接触电阻最小。铜铝连接时,不能直接将铝导体与铜端子连接。原因是铝与铜之间浸入潮气和盐分,会发生电解反应使铝与铜都可能被腐蚀,以致接触电阻加大发热加剧。所以,应采用特殊过渡触头。油浸式套管过热时,可以在将军帽与定位套之间垫一个薄垫片,垫片与定位套厚度、大小均一致,确保装配好之后接触良好减小发热量。
三、电力变压器日常维护
1、日常维护内容
要坚持实时监测运转状况,尤其是过负荷运转,更要增加监测频次。用仪器仪表定期监
测电流、电压、油温、压力等参数,并检查外部各部分是否异常。日常维护内容有:保持绝缘子、磁套管清洁防止闪络故障产生;要确保冷却装置进出油管之间的蝶阀翻转正常,散热器流畅通风,入口洁净无杂质;冷却风扇、循环油泵有否异响及振动,分路电源开关开合是否灵敏,干燥器有无渗油;分接开关也不可忽视,其紧固性、灵活性、接触良好性都要定期检查;对变压器的高低压线圈、铁芯、套管、避雷装置的接地电阻要定期监测,要低于规定标准(4Ω);变压器室内,要有符合规定的消防设备。
2、出现异常时的维护
工作人员可以对变压器的外观、声音、油面、温度、气味等外表现象初步判别故障类型。由于,变压器内部出现事故不一定是单一原因,可能有多重因素综合表象,甚至会干扰检修人员。所以,解决问题时,需要结合样品油品分析、电气试验数据及设备运转检修记录等方面综合处理,既节约时间,也避免误判。
四、结语
保障变压器安全运行是供电系统正常工
作的必备条件,电力变压器的故障分析及处理是电力运行人员的基础性工作。电力变压器的日常维护既有技术性要求,又有耐心、细致、简单、重复的日常巡查内容。提高检测、维修技术水平固然重要,对加强工作责任心、敬业爱岗教育也不容忽视。(作者单位:商丘市实验中学)参考文献
[1]陈曾田.电力变压器保护(第二版)[M].北京:中国电力出版社,1989.5.
[2]苏文成.工厂供电[M].北京:机械工业出版社,1997.8.
[3]张雷霆.通信电源[M].北京:人民邮电出版社,2009.11.
[4]王有元.廖瑞金.孙才新.变压器油中溶解气体浓度灰色预测模型的改进[J].高电压技术,2003.4.作者简介:胡海燕(1977—),汉族,男,河南商丘人,供职于商丘市实验中学。河南科技学院数学专业毕业,本科学历,电工专业技术工二级(技师),长期从事电工作业及机电技术研究开发工作。