面向中国移动客户服务分析的认知图谱系统研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2021年1月面向中国移动客户服务分析的认知
图谱系统研究
赵东明1,徐晨兴2
(1.中国移动通信集团天津有限公司,天津300020;2.亚信科技控股有限公司,北京584625)
【摘要】为了更精准地匹配客户场景,让传统的知识图谱模型更好地认知用户需求,中国移动在传统大数据分析基础上加入语义理解能力,打造一种新的运营商服务分析知识图谱,构建一个以用户需求节点为中心的概念图谱,链接用户文本语义、大数据标签、运营策略、客户和原因概念,可以提升传统知识图谱的认知推理能力,进一步链接多模态数据提高推荐准确率,并且提供可解释能力,已在资费、家宽、无线领域的满意度预测场景落地,取得优异的效果。
【关键词】认知概念网络;知识图谱;语义理解;客户服务分析
【中图分类号】TP391.1【文献标识码】A【文章编号】1006-4222(2021)01-0168-03
0引言
“计算—感知—认知”的人工智能技术发展路径,已经成为大多人工智能研究和应用专家的共识[1]。
面对“客户需求多元化、客户体验个性化、行业特征高度适配化”的数字化运营阶段,目前的中国移动知识图谱依然还称不上“智能”,在业务推理、运营分析、服务测评、大数据挖掘等场景中,预测结果缺乏可读性、解释能力弱、运营效果不佳导致效率降低等问题也经常被人诟病[2],这是因为当前的知识图谱系统更多的是从用户历史大数据标签、感知数据、画像数据出发,通过机器学习算法进行回归、分类,而不是真正从场景和用户需求出发。
在中国移动当前各个业务系统中,各类分析场景如产品推荐、用户维系、宏观数据分析等都极度依赖于人工,或采用机器学习、深度学习等模型进行黑盒分析,不透明也不可解释,但是在实际运营场景中,如果不能回答“为什么”问题,并解释这些系统如何产生特定的结果,就无法为后续业务操作提供有效帮助,限制各类AI能力的价值体现。
中国移动大数据标签库共有6000多个标签,彼此有从属、衍生关系,其中有海量的关系语义待挖掘,巨大的数据价值没有得到体现,有必要建立认知图谱网络,在存量运营、客服服务、运营分析等领域体现价值[3]。
1认知图谱系统架构
认知图谱作为认知智能的重要落地方向,作为各类业务的辅助决策中心,通过各层业务要素的构建,辅助认知推理及逻辑表达。
认知图谱的核心是将中国移动业务类数据(大数据标签、家宽探测感知等)与海量常识类概念进行语义网络构建,业务数据本身具备将客户链接的能力,再通过常识类概念中的语义信息与业务类数据映射,从而实现推理过程从业务数据到常识概念的认知,对业务指标的变化(如不满意、降档降费)给予语义层面的预测及解析。
1.1技术框架
中国移动认知图谱系统的技术架构,共分为数据层、图谱构建层、图谱存储层、图谱计算层、应用层,如图1所示。
1.1.1数据层
认知图谱中的知识来源于结构化、半结构化和非结构化的信息资源,通过各类数据抽取工具从各类业务系统抽取到图谱系统中,包括服务工单数据、用户标签数据、订购数据、DPI数据、家庭好友关系以及运维日志等基础数据。
在满意
度
图1认知图谱系统技术架构
专题综述168
2021年1月
预测这个场景,数据层主要是客户画像、属性、标签、无线特征、家宽特征,从而实现“客户号码—原子”的链接。
1.1.2图谱构建层
图谱构建层提供图谱结构配置、构建模型标注、构建模型训练、三元组生成、三元组审核、三元组发布等页面工具;并且,图谱构建层将预置多个智能分析模型,实现文本分类、实体识别、机器阅读理解、文本聚类、词法/句法分析等自然语言能力;最后,图谱构建层遵循“模式设计→数据清洗→实体识别→关系识别→知识融合”的流程将数据层的非结构化数据转化为领域场景需要的图谱实体及关系,生成三元组。
1.1.3图谱存储层
图谱存储层使用图数据库将构建层生成的三元组进行图关系存储,不同类别的图谱将分别单独存储。
1.1.4图谱计算层
知识计算是基于已构建的知识图谱进行能力输出的过程,是知识图谱能力输出的主要方式。
主要包括知识统计与图挖掘、知识推理两大部分内容,知识统计与图挖掘重点在于图查询、图特征统计、关联分析、异常检测、预测推理等能力;知识推理重点研究的是基于图谱的逻辑推理能力,主要包括知识搜索、知识推荐、智能补充、多跳推荐等能力。
1.1.5应用层
知识图谱使能各类业务系统,包括服务评测分析、智能问答机器人、智能知识库、智能工单、智能运维等系统。
1.2功能框架
AICoCo的功能框架重点体现语义信息和图谱链路的推理关系,系统包含:现象层(客户语义信息)、面向运营场景的原因概念层(概念标签)、面向原子层的基本概念层(组合标签及分层)、原子层(原子标签、大数据、特征、画像、属性)、分层理论库(基于原子属性分层链接实体)、运营策略库(面向场景的维系、推荐、服务策略),进而最终提供面向“客户需求”提供可理解、可解释的运营策略,如图2所示。
1.2.1运营场景匹配
存量运营的具体场景对应认知图谱的原因概念层。
以存量运营重点关注的场景(客户离网、价值提升、机套匹配、客户不满意预测等)入手,基于前期分析经验积累建立场景对应的原因概念标签,原因概念层和基本概念层以监督方式建立映射关系,再基于概念与原子的对应关系(现象生成算法),实现面向场景的系统智能分析,基于认知图谱,实现用户实现用户群挖掘、最近策略匹配,辅助运营人员进行存量维系、客户感知分析、客户维系和业务推荐。
1.2.2原子标签
原子层纳入现有大数据标签库全量6400余个标签,实现全量客户*全量标签的超大宽表的网状连接,现有客户均属于不同标签客户群,即自动链接到原子,且不同客户肯定被同一原子连接,从而构建“客户—原子”“客户—客户”的对应关系。
基于种子用户及标签的链路,可以实现链路预测。
1.2.3认知网络链接
随着概念标签库的完善,通过原子标签与概念标签的链接,实现基于种子用户的链路预测,辅助业务部门实现权益、5G换机等推荐。
1.2.4策略匹配
与运营场景、全量客户看管体系相结合,对异动群体或各概念标签对应群体给出策略建议。
1.2.5分层理论
借助原子标签的属性值,结合专家经验提出的分层归类方法论,实现全量客户基于原子层的链接,并实现现象与原因对应关系的自动判断。
2系统应用
2.1服务评测分析
客户服务评测及感知分析,是中国移动客户服务重要的课题,通过人工智能技术进行客户潜在不满意的精准预测,并针对性维系、安抚,能极大地提升客户体验。
认知图谱不仅能根据服务评测为“不满意”的客户号码,对其他全量用户的潜在不满意做推理预测,也能输出最重要的不满意原因,帮助服务运营人员精准施测。
例如资费不满意输出原因概念:流量超套、语音超套、叠加包高、套外占比高等,并结合具体的次数、费用、流量进行精准分类;家宽不满意输出原因概念:ONU弱光、Wi-Fi弱覆盖、持续多天异常掉线、持续多天电视卡顿;无线网络不满意输出原因概念:VoLTE5S切片丢包次数高,TCP 三次握手时延大于300ms次数高,视频下载低速率次数高,本周高倒流出现频次高,用户级NPS质差占比高。
2.2情感挖掘
情感分析的应用领域非常广阔,包括文本分类、对话系统、问答系统、文本生成等,根据任务的不同,可以区分为情感抽取、情感分类、情感摘要;根据所处理的粒度不同,可以区分为属性(或对象)级、句子级、篇章级等。
一般在面向用户与智能问答时,通过分析用户情感,判断是否需要人工客服介入,提升用户体验。
基于认知图谱技术,面向客户情感修补和情感看护,分析其潜在离网倾向,可以显著增强存量运营收入。
3结束语
本文开发了一套面向电信运营商客户服务分析的认知图谱系统,将传统的机器学习知识图谱构建与推理,改进为纳入语义分析能力的认知推理,在各个业务推荐、存量运营、
服务图2认知图谱的功能架构和运营场景
(下转第172页)
专题综述169
2021年1月
感知分析领域体现“可解释”的优势。
目前,已纳入全量900万用户的73个大数据标签、32个家宽探测特征和9个无线网络特征建立原子网络,并以“监督+自动生成”方式产生29个原因概念和50余个基础概念,并在天津的服务满意度预测中提高查准率3pp ,为预测结果提供明确的解释理由,为运营人员提供有力支撑。
未来,系统将在半自动化图谱结构生成、联合区块链+联邦学习的通用知识图谱平台建设、大规模海量图数据分布式存储及容灾方案的研究、图谱跨领域迁移、图谱安全管理等方面不断优化提升。
参考文献
[1]吴玺煜,
陈启买,刘海,等.基于知识图谱表示学习的协同过滤推荐算法[J].计算机工程,2018,44(2):226-232.
[2]王军平,
张文生,王勇飞,等.面向大数据领域的事理认知图谱构建与推断分析[J].中国科学:信息科学,2020,12(7):192-197.[3]LUO X H,LIU L X,YANG Y H,et al.SIGMOD 2020:International
Conference on Management of Data [J/OL]./
cfp/servlet/event.showcfp?eventid=90510.
收稿日期:2020-12-10
作者简介:赵东明
(1984—),男,汉族,河北廊坊人,高级工程师,博士研究生,研究方向为知识图谱、计算机视觉算法与应用。
徐晨兴(1986—),男,汉族,安徽阜阳人,学士学位,研究方向为自然语言理解、知识图谱、联邦学习。
辆在行驶高速公路通过ETC 专道交费时便产生了偷逃费行为。
建立稽查模型,对人工收费降低车型行为进行分析,主要包括有些车辆(客车、货车)在办理ETC 卡时记录的车型为正确车型,但是这些车辆下高速时不走ETC 专道而是走混合车道人工收费,按照低的车型(相对于真实车型)去缴纳通行费。
建立稽查模型,对车辆有入口无出口数据、入口重复领卡、一车多标签、倒换通行卡、恶意U/J 形行驶、拖挂车甩挂、利用优免政策等逃费行为进行分析。
2.5大数据在科学养护方面的应用
通过对路段车流量分析,可以获取路段通过的车辆车型
信息,并且根据收费数据库中查询的车辆信息,获取车辆的超限超载信息。
根据车辆行驶速度,判断道路的通行能力,从侧面判断道路路面质量,以量化的指标指导路面养护施工,对路段的交通事故按时间点、事故类型等不同维度进行分析,也能从侧面评价道路路面的质量,各路段上传路面结构方面和技术标准方面的数据,制定全寿命周期的路面、桥梁、隧道灯的养护周期计划。
建设ETC 门架及车道控制器运行监测平台,实现高速公路运营单位所有ETC 门架、收费车道实时监测全覆盖,包括设备状态、运行环境、软件系统等各类数据,满足向部路网中心上报的要求。
整合高速公路具备设备监测功能的各个应用系统,实现高速公路监控设备和隧道机电设备在线状态监测、设备故障预警和各类统计分析,消除各类应用系统的信息孤岛,统一设备监测上传接口及标准。
2.6大数据公众出行方面应用
对特种车辆(物流车辆)提供精准服务,将路况信息、流量
信息、气象信息以微信公众号为媒介向公众提供服务。
建立车
主会员制,采用积分制,可在旅游、服务区消费享受优惠政策,同时也吸引了车流,实现双赢机制。
通过采集出行者的出行体验,向精准客户进行推送,共享出行服务。
在服务区进出口安装上视频车辆识别系统,可以准确掌握每辆车在服务区的停留时间,也可以对服务区的车流量进行统计。
管理单位可以根据车流量基本信息掌握服务区运行状况,为服务区管理、运营决策提供数据依据。
3结束语
在当前时代背景下,大数据在高速公路运营管理中的应
用已经愈发重要。
实现高速公路运营单位各类数据资源的归集、整理和存储,并利用大数据相关技术及数据分析挖掘工具,建立数据应用模型,为高速公路运营单位的运营管理、决策支持、流程优化以及风险管控等提供数据支撑和数据服务,有效挖掘数据价值,实现交通数据资源的“共享、共用、共赢”。
参考文献
[1]王树兴,
孙凌峰.山东高速公路运营管理中大数据应用探究[J].中国交通信息化,2020(8):97-100.
[2]李洋.大数据分析在高速公路收费管理中的应用[J].交通世界,2019(13):134-135.
[3]孙雷,
杨卫国,朱珺辰.大数据在智慧高速中的创新应用[J].信息技术与标准化,2018(增刊1):20-23.
[4]徐红海.智慧高速交通大数据应用探讨[J].中国交通信息化,2016(3):80-84.收稿日期:2020-11-26
作者简介:陈峰
(1983—),男,汉族,河北故城人,高级工程师,本科,研究方向为智能交通。
(上接第169页)专题综述
172。