语音质检方案

合集下载

相关主题

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

广东xx语音系统项目建设方案
xxxx股份有限公司
2016年1月14日
目录
1 语音质检分析系统需求概述 (3)
2 主要技术功能 (3)
2.1语音转写 (3)
2.2建立索引 (4)
2.3语音检索 (5)
2.4场景分割 (6)
2.5集群服务 (7)
3 主要业务功能 (7)
3.1语音质检与管理 (7)
3.1.1 样本筛选 (7)
3.1.2 智能质检 (9)
3.2语音挖掘与分析 (13)
3.2.1 来电原因分析 (14)
3.2.2 变化趋势分析 (14)
3.2.3 专题分析 (16)
3.2.4 多维交叉分析 (19)
3.3与第三方系统的配合 (21)
4 总体建设方案 (21)
4.1系统网络拓扑图 (21)
4.2系统架构 (22)
4.3系统接口方案 (23)
4.3.1 接口原则 (23)
4.3.2 系统接口方案 (23)
5 系统硬件配置方案 (24)
5.1服务器配置清单 (25)
5.2标准软件配置清单 (25)
1语音质检分析系统需求概述
广东广电95956热线每天约处理数万个通话，而质检人员对这些通话录音只能通过人工测听的方式进行抽检，测听抽检比率低，质检工作量大、效率低且覆盖率低，难以有效评价整体服务质量。

客服中心虽然有专门的质检团队，负责整个热线的座席员工服务质量检查和各类专项质检分析，但工作内容主要是对通话录音进行抽样复听、统计问题、形成报告并进行后续监督管控。

当前客服质检工作存在的主要问题包括质检被动、效率不足、主观性强和以点代面等。

与此同时，目前的经营分析系统缺乏对客服热线录音数据的处理和分析，而录音数据能直接反映客服热线的效率和质量以及客户的满意度和忠诚度。

所以当前的经营分析系统中，客服质量分析难以实现有效监控客户服务的效率和质量，无法为经营决策提供最直接的、最有效的参考依据。

构建全新的语音分析系统，针对广东广电95956客服热线每天产生的大量录音进行处理和分析，从质检和运营分析两方面挖掘录音的潜在价值，实现如下目标：
1、监控广东广电客服热线的服务效率和质量。

对客户服务质量进行有效的监督和管理，增强客服质检的深度、广度和力度，进一步提高客户服务水平和客户满意度。

2、加强客户服务内容的分析和管理。

实现对广东广电客服热线系统的服务内容的分析，及时、准确的发现和掌握客户的关注热点；跟踪分析特定客户群体的行为，完善业务监控客户投诉内容及原因，为客户的服务和维系提供支撑。

3、挖掘广东广电客户服务的业务价值和运营价值。

挖掘客户服务质量与各类业务指标之间潜在的关系，完善客户服务的经营分析体系；挖掘广东广电客服热线中的竞争性情报，了解市场竞争的关注热点和各业务优劣差异，为进一步完善市场经营策略和产品业务规划提供参考。

2主要技术功能
2.1语音转写
智能语音客服系统采用国际领先的语音识别引擎，根据电信行业的语言模型和声学模型将语音识别形成最终对应的文本内容。

语音转写是语音分析中最重要的步骤，是建立文本索引，将非结构化的语音文件转换为
结构化的文本信息的核心功能。

语音分析系统首先将分离后的语音通过声学模型转换为对应的汉语音标符号，音标信息再通过超大词汇网络的语言模型识别出最终对应的文本内容。

这个过程中，需结合广东广电中涉及的各地、各区域地方口音适配，来优化声学模型使其能够广泛覆盖中国地方口音，还需要结合电信业务知识和热线服务范围，进行语言模型优化以提升语音转写准确率。

语音分析原理图
语音识别引擎支持普通话、湖南话适配，结合业务知识和热线服务范围，进行语言模型优化以提升语音转写准确率。

2.2建立索引
索引创建如下图所示：
索引创建图
语音分析系统可以检测和分析出整个电话录音中通话内容、声道、平均语速以及某段录音中语速的变化；检测出录音文件中用户及热线服务人员都没有说话的静音时间等，这些信息最终生成标准XML格式的索引文件，索引文件的内容通常包括：
用户语音和话务员语音的文字转写结果；
如果是双声道语音，需要给出声道信息（关键词位于哪个声道）；
语速检测：支持检测和分析出整个电话录音中平均语速以及某段录音中语速的变化，主要包括：某个通话中，用户和话务员各自的每次说话的起止时间、语速（字/秒）；某个通话中，用户和话务员各自的平均语速（字/秒）。

静音检测：支持检测出录音文件中用户及热线服务人员都没有说话的静音时间。

2.3语音检索
智能语音识别系统可以提供语音检索功能，包括普通检索和高级检索两类应用。

主要针对95956系统中需要分析和检测的关键词信息、长时静音信息，从所有的索引文件中进行快速筛选，并返回所关注的语音，由系统对关注的信息进行自动的统计，从而返回出海量录音文件中包含的统计信息。

系统可以实现关键词检出功能，对指定的关键词列表，得到包含该关键词列表中任意一个或多个关键词的数据列表，以及关键词在对应录音数据中的出现位置（时间起止点）。

系统可以实现长时静音检出功能，得到有长时间静音的数据列表，给出对应的起止时间，用户可预先设置门限。

系统也可实现以上功能的逻辑组合检索，如包含A关键词不包含B关键词的所有语音信息。

不同的查询要求都可以通过分解成以上核心功能进行查找。

语音检索效果图
如上图所示，语音分析系统可自动处理录音文件，检测出指定的关键词，同时返回该关键词在整条语音中的位置。

系统支持同时检索多个关键词，并支持关键词的逻辑组合功能，如查找：包含“手机上网”，同时包含“开通”关键词的语音。

2.4场景分割
场景分割如下图所示：
场景分割
在目前的95956热线平台录音中，记录了客服人员和用户的全部对话，并按照录音流水进行存储，同一个录音中同事包含了用户和客服的录音。

智能语音识别系统利用声纹识别技术及聚类技术对通话录音中客服人员、用户通话内容进行分离，进而针对性的对客服人员服务质量进行监控，以提升热线整体服务水平；对用户语音内容进行热点问题分析、主要意见/建议、知识挖掘等应用。

2.5集群服务
广东广电95956热线每天将产生大量录音数据，单台服务器无法对海量语音进行及时处理，为了满足应用需求，系统采用多层、组件化、松耦合设计系统架构，支持集群服务。

当呼叫量增加时，通过添加引擎服务器即可实现整体服务能力的提升，可以实现平行扩展。

索引建立服务器支持多条语音同时建索引，即多线程并发，索引文件通过分布式的方式进行存储，提供统一的索引访问接口，而检索服务器通过分段检索索引的方式快速的查找。

从而实现整个系统的集群服务。

支持灾备功能，通过负载均衡的方式防止某台服务器出现故障而导致整个服务中断，从而保证语音分析系统可以提供7*24小时不间断服务能力。

3主要业务功能
语音质检分析系统可以对目标录音做质检分析，通过系统定位客户不满意原因，改善座席座席服务质量和优化产品流程。

3.1语音质检与管理
基于语音分析技术，智能语音质检和分析系统提供自动化质检功能，倾听用户心声，挖据语音价值。

通过设置质检策略和规则，对录音数据进行自动筛选，发现服务质量问题，提供给质检人员进行审核确认，以自动化的预质检有效提升质检覆盖率和工作效率。

根据预设的质检项，设置系统质检筛选策略，并利用过滤筛选器，把不符合质检规范的录音找出来，实现质检的自动化筛选，提升质检的效率，系统建设初期需要质检人员对结果进行复检，业务模型较完善后可取消人工复检，并可根据要求对质检项可增、减，在web 界面可配置、可修改。

整个自动质检分析流程存在交互的主要系统包括：录音平台、数据提取系统、数据转译系统、数据分析系统、分析数据存储系统、质检系统、友邻系统。

其中数据提取系统、数据转译系统、数据分析系统为分析系统主要组成组件。

录音平台和ITS系统通过FTP方式（或WebService、或开放数据库等）提供原始数据给分析系统，分析系统以基于HTTP的网络服务的方式向友邻系统提供语音测听支持服务。

3.1.1样本筛选
智能语音质检和分析系统支持违规样本筛选功能，辅助质检员，快速缩小质检范围，定位违规问题，提出改进建议，进而提高工作效率和服务质量。

系统提供质检样本筛选工具：我的筛选器和质检模型两个工具，其中质检模型在智能质
检中详细介绍。

我的筛选器，对于当前的筛选结果，点击导航栏上方的“保存筛选器”，可将当前的筛选规则保存为新的筛选器；同时可以根据通话内容和通话属性，如通话时长大于120秒等，建立筛选器。

我的筛选器界面
1)新建：点击“新建筛选器” 按钮后，输入筛选条件，如通话内容、通话
时长、座席工号等，可以多个条件组合使用，点击保存即可。

2)保存：点击“保存筛选器”按钮后，输入筛选器名，保存当前规则到“我
的筛选器”；
3)应用：点击“我的筛选器”框刚保存的筛选器名，筛选成功，并会马上
显示筛选器筛选后的通话信息。

系统可以设置“静音超长且未关怀”质检模型，进行违规语音样本筛选。

需求：将静音时长超过15秒且未进行客户关怀的语音检出，如果同一条录音话务员出现多次静音超时需分开定位指出。

设置方法：设置对象1为静音，大小为大于15秒，绝对位置为大于10秒；对象2为关键词，列表等于感谢您的耐心等待等，次数等于0。

系统设置界面如下：
系统设置界面截图
同时系统供静音时长上限设置功能（静音时长上限会调整，现在为15秒）、关怀用语可配置功能、静音位置可以配置。

系统可以设置“无声电话处理违规”质检模型，进行违规语音样本筛选。

需求：将单通无声电话处理不符合规范的语音检出。

该类处理违规录音需同时满足如下条件：（1）通话时长大于10秒；（2）只有话务员的声音但客户完全无声，或有背景杂音但无客户的声音。

提供通话时长下限可配置功能（现在为10秒，可能随时调整）。

设置方法：设置筛选器通话时长大于10秒，语速比（座席语速/客户语速）大于100。

系统可以设置“语速过快”质检模型，进行违规语音样本筛选。

将话务员语速过快，影响客户聆听的语音全部检出。

正常语速标准为130字/分钟,但考虑到地市差异，系统提供不同用户语速参数标准可配置的功能。

系统可以设置“抢话”质检模型，进行违规语音样本筛选。

将话务员通话过程中出现抢话、插话或打断客户说话的语音全部检出。

如同一条语音中，多次出现，系统将分开定位指出。

系统可以设置“未及时响应客户需求”质检模型，进行违规语音样本筛选。

将客户说话后，超过3秒，话务员仍没有给予客户回应的录音全部检出。

系统可以设置“服务忌语”质检模型，进行违规语音样本筛选。

系统可以将包含服务忌语的语音全部检出。

系统提供服务忌语库配置功能。

系统可以设置“开头/结束语不规范”质检模型，进行违规语音样本筛选。

系统将未能按照规范要求正确使用开头/结束语的语音检出。

开头/结束语库在系统中均可以自由配置。

通过设置下发短信质检模型可以将话务员承诺向客户下发短信的录音全部检出。

通过设置问题登记质检模型可以将话务员承诺为用户进行问题登记的录音全部检出。

同时系统支持关键词建模筛选的功能，业务人员给出关键词，系统自动筛选出出现该关键词的录音或者未出现该关键词的录音。

3.1.2智能质检
智能质检主要通过系统质检模型实现，在模型管理功能模块进行新建质检模型和质检模型管理，质检模型属于模型的一种，建立和管理方法与普通模型一致。

通过导入质检规范：对已有的呼叫中心质检规范，系统可以自动导入，在后台生成相关的质检策略。

新建模型
新建模型页面，主要用户新建业务模型，包含词联想、联想词展示、高级添加、模型编辑、模型预览保存模型等功能。

新建模型截图
词联想
在联想词输入框中，输入业务相关的词语，或者模型相关词语，点击联想按钮，联想词显示框中会根据匹配度的大小取top10，在页面区域的右侧会以树形显示联想词结果，便于用户查看。

词联想截图
添加（高级）
点击添加（高级）按钮，在输入框中输入要添加的业务模型，点击添加，直接添加到模型编辑栏中，方便用户直接书写符合逻辑的业务模型。

添加截图
模型编辑
在模型编辑框中的模型，可以通过点击选中后，对模型进行增删改操作。

模型编辑截图
静音规则
点击静音规则下的添加对象，可以选择添加静音或者关键词；
静音规则截图1
选择静音后，有多种属性可供选择，包括次数、大小、相对位置、之前声道、之后声道、绝对位置。

静音规则截图2
选择对应的属性后，会有另外的下拉框来详细选择属性的值；
静音规则截图3
另外也可选择添加关键词，同样有多种的属性可供选择。

静音规则截图4
模型预览
书写好业务模型后，选择筛选条件、使用角色，点击模型预览，在页面的下方弹出通话列表。

模型管理
模型管理页面包含两大功能：模型组管理、模型管理。

1）模型组管理
可以根据需求，新建模型组，删除修改模型组。

新建模型组
编辑模型组
2）模型管理
此页面显示用户的业务模型，同时可以对模型进行编辑管理。

模型管理中包含：新建模型、模型编辑、模型上线/下线。

点击新建模型后，页面跳转到新建模型页面，模型编辑只针对已下线模型，包含模型的删除（未使用的模型可以删除）、编辑修改，点击编辑后，页面跳转到建立模型页面，修改后保存即可。

模型管理界面
通过导入质检规范：对已有的呼叫中心质检规范，系统可以自动导入，在后台生成相关的质检策略。

系统依据质检策略，对全部的录音进行自动筛查，给出筛查出的问题录音列表，并指出问题项所在的位置。

自动筛查的结果可以按照客服工号、业务品牌、服务类型、录音流水号、录音时长等不同策略显示，方便质检人员进行各类专项质检。

对于已筛查出的问题
录音，质检员进行审核确认，人工审核的过程也会对问题的进一步确认和梳理的过程。

基于系统筛查和质检员审核结果，自动生成各类统计分析报告。

统计分析可以从业务品牌、服务类型两个一次维度，业务类型（1X/EVDO、手机报、彩铃等）、服务类型（开通、取消、查询、投诉、举报等）不同的次级维度等多方向交叉分析。

也可以自设维度，从座席、班组、接触时间、通话时长等多种维度分析。

同时系统支持数据表、百分比、同比/环比等多种查看方，可直接导出为EXCEL等格式报表。

同时需要考虑将质检、分析与前台实时通话的结合，做一定的实时质检和座席辅助的尝试。

智能识别系统可以支持的自动质检策略包括：
抢插话用户，自动检测CSR抢插话用户的情况。

使用标准结束语，满足两个条件，1、先计算时间录音总时长 - N 之后；2、找是否包含标准结束语关键词（其中之一）。

使用标准欢迎语，满足以下两个条件，1、系统设置常用的欢迎语，包括节日特殊欢迎语，包含其中任意一个即可；2、欢迎语出现的位置起始时间在 N 秒之内。

短通话专项检查在短通话中，座席需在挂机前的2秒前说出短通话的规范用语（如：对不起，听不见您的说话，请稍后来电）。

使用禁用语，通话中出现禁用语（所有的单个关键字，应用系统直接过滤，不做检测）。

适当的回应，自动检测以下条件的通话：1、座席持续静音时长大于N 秒，N秒静音之后未检测到；“系统比较慢，请稍等”，“正在帮您查询,请稍等”等关键字；2、用户说过话之后，出现3次大于三秒静音算一次违规。

语音语速适中，满足以下任意条件：1、客服/用户的语速比率不在适中范围（大于等于0.5小于等于1.5）内；2、客服语速不在2-8内算违规
其他问题，双方根据广东广电的实际质检业务需要，结合关键词、静音等因素，设计符合要求的其他质检策略。

3.2语音挖掘与分析
智能语音分析系统将发挥语音分析的指南针作用，通过对客户投诉录音的来电原因分析、重复来电分析、通话时长分析、满意度分析，及时把握客户需求热点变化趋势，发现服务过程存在问题或服务风险，迅速采取有效应对措施，为推动服务和营销提升提供有力支撑。

基于广东广电业务定制的语音分析模型，并提供简便的规则模型设计器，可以进行关联、
与、或、并、非等操作，主要分为用户新建业务模型，包含词联想、联想词展示、高级添加、模型编辑、模型预览保存模型等功能，业务模型的建立和管理方法与质检模型相近。

3.2.1来电原因分析
语音分析系统根据预先建立的业务模型，自动进行客户投诉来电原因的分类及分析，从而让我们了解到当前客户投诉的热点以及热点业务的访问趋势变化，以便及时预警趋势中的异常，并对发生异常的原因进行分析。

3.2.2变化趋势分析
语音分析系统满足变化趋势分析需求。

基于业务模型，语音分析系统自动展现客户投诉业务及话务热点的趋势变化，便于管理人员从宏观角度把握归类业务、热点业务发展趋势。

系统可以依据设定的分析周期自动给出变化趋势。

系统可以展现业务数量占比，通过统计排序，将各中归类业务及热点业务按照占比例展示出来，每条业务包括业务类别、业务占比、业务占比变化等信息。

系统可以进行自定义周期的展示和趋势追踪，并在首页展示，周期可以包含年、月、周。

系统可以在业务分类条目，可以显示最近10天该业务的通话量走势曲线，可以定义并调整业务趋势统计分析的频度，选择之后，业务趋势数据会实时更新。

语音分析系统变化趋势分析页面主要分为四个区块：业务趋势分析，热点趋势分析，通话数量展示，曲线管理。

变化趋势界面图
（1）业务趋势分析
该区块展示最近（日、月、周、季度、半年、一年）内，业务数量占比，通过统计排序，将各中归类业务及热点业务按照占比例展示出来，每条业务包括业务类别、业务占比、业务
占比变化等信息。

业务趋势分析图
时间周期支持按天统计、按周统计、按月统计、按季度统计、按半年统计、按一年统计等。

单击业务分类条目，可以查看最近10（可选择）天该业务的通话量走势曲线。

单击时间周期中的下拉列表，可以调整业务趋势统计分析的频度，目前支持天、周、月、季度、半年、一年，选择之后，业务趋势数据会实时更新。

（2）热点趋势分析
该区块展示的结果为在无事先定义关键字变化趋势跟踪：系统自动给出的无自定义关键字的变化趋势，周期分为年、月、周、日，默认为日跟踪展示。

热点趋势分析中关键词的占比以及变化比例，通过统计排序，将业务按照占比例展示出来，每条包括关键词、占比、变化三部分。

支持过滤器功能，可以进行非语音词汇的排除。

热点趋势分析图
（3）业务通话量走势曲线
该区块用于展示已处理语音量走势曲线和业务通话量走势曲线，初始时显示当前系统已处理的语音通话量，可以通过在业务趋势分析中点击业务的方式来添加显示指定业务的曲线。

通话数量展示图
（4）业务曲线管理
该区域用于管理已添加的业务趋势走势曲线，支持删除曲线、显示/禁用曲线、查看业务详情等功能。

曲线管理
单击按钮删除该曲线，通话量走势曲线展示页面会同步更新。

单击按钮以查看该业务详细信息，执行该操作之后，会自动跳转到通话分析页面展示最近的业务通话分析详情。

单击可以暂时禁止显示该曲线。

3.2.3专题分析
利用语音分析系统，可以在各分析模型基础上在通过模型之间的组合，自定义出专题分析，针对需要定期及一定周期分析的专题进行专项追踪分析。

专题就是一个分析方向的框架,该功能可对语音数据分类进行挖掘分析，查看业务分布情况，查看具体语音信息，方便用户层层深入分析。

专题的模型之间可以为定制的树形结构，并支持模型之间并列和层次结构。

语音分析系统专题模块支持定制和修改专题规则时模型拖拽功能，只需将模型拖拽到相应位置即可，方便专题模型配置和管理。

支持专题管理功能，不仅以列表展示了所有已保存的专题信息，包括专题名称和备注信息。

列表有新建和编辑按钮。

同时可以对专题进行编辑管理，包含新建、编辑功能。

（1）新建专题
将不同的模型规则进行组合，即可构成一个专题。

新建专题页面可以将已上线的模型，用树形结构有层级的进行组合，形成专题。

页面主要分为模型规则、备选模型列表（已上线模型）和两个功能按钮。

新建专题界面截图
专题
该区域主要展示的是该专题规则定制的树形结构，可支持并列和层次结构，目前最多可支持10层上下关系。

定制和修改规则时只需将右边的模型拖拽到相应位置即可，每个模型只可使用一次。

专题界面截图
规则列表
该列表展示的为规则模型，已上线的模型显示，未上线模型不显示。

本专题已使用模型会灰显，未使用模型黑显。

规则列表界面截图
保存专题
点击后，滑出保存页面，需输入专题名，保存之后专题构建成功，业务分析页面和专题管理页面会展示此专题。

保存专题截图
清空专题。