中国电信客户投诉分析平台结题汇报

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
去除干扰,放大 非典型特征
宁夏 易通卡 欠费 漫游 余额 赔偿
16、关联分析与聚类分析 —重热点事件内聚性很高,特征关联性强
申诉内容1 我购买了张重庆电信易通卡,当时承诺,此卡业务功能是 全国范围内绑定一个电信的号码在国内漫游状态下打这号 码不收费,而且当时也说只要我们不取消业务是长期一直 都有效的,这都再三得到电信确认核实我才购买的!但是 上段时间我发现此卡的业务被取消了,根本就办理不了业 务了,重庆电信公司,非本人同意下,擅自取消或更改本 人号码资费.
✓ 数据结构化调整 ✓ 数据查询 ✓ 每日走势图、每日预警、分类汇总
即时挖掘重热点问题
✓ 即时挖掘出重点热点问题 ✓ 挖掘结果人性化展现
封装好的分词工具
✓ 支持海量数据分析 ✓ 便于进行多文本横向比较
专题 其他支撑工作
3、项目总体情况(3/4)—不断增强灵活性,为未来需求 提供准备和快速反应
•去除文本关键词 中的噪声词汇
•放大具备群体性 事件词汇的比重
•根据特殊算法, 找出动态词集
•业务人员判断、 筛选动态词集并
•总结申诉数据中 出现的群体性事件
•包含业务名称, 出现地点,申诉条

•建立索引
•群体性事件内聚 重新查找群体性 数,问题描述等内

性很高,进行聚类 事件

14、建立索引
将投诉数据上传到本地(支持批量导入),对其进行编号, 建立索引视图,且为系统其他模块功能提供视图数据。
3、分词工具使用示例---附图
2020/11/10
4、原因打标小工具
•配合集团原因定责准确性专项排查工作,基于VB技术开发的excel宏工 具--原因分类打标工具,大大提高打标效率。
5、专题分析
部分成果被 集团采纳
专题一 专题二
易通卡专题
部分“易通卡”套餐设计存在缺陷,发现网间结算异 常后,电信单方面停机或更改套餐
中国电信客户投诉分析研究结题汇报
Contents
1 项目总体情况 2 客户投诉分析平台 3 其它工作
项目总体情况
3
1、项目总体情况—项目需求、目标和内容
挑战
内部面对庞杂的数据 外部需要快速,及时 的响应
平台建设 专题分析
项目内容
需求
2010年开始投诉数据总量
可存储、可查询 即时性、便捷性
校园营销中有多种问题出现,其中“宽带强制捆绑手 机”是主要的投诉,目前,用户在办理电信宽带业务 时,按照电信公司要求,必须捆绑受理相应的电信”天 翼”手机业务;
办理电信的增值业务,如订阅消息,彩铃等,存在受 理容易,取消困难的情况
专题六
账单专题
•没有向用户提供个性化的账单选择; •用户取消电子账单的手续复杂; •对用户反映较多的问题,没有相应的短信解释。
预警图 ✓高于9件标为红色 ✓6-8件标为橙色 ✓3-5件标为黄色
业务分类图 ✓规则政策类 ✓固网宽带业务 ✓移动语音业务 现象分类 ✓修障问题 ✓终端问题 ✓。。。。
11、数据分析——定性分析结果
2020/11/10
12、数据分析—定性分析
电信投诉重点热点问题具有地域性、突发性和概率小的特征,按照规定的 筛选条件(同一日期、同一地区、发生3件以上),结合分词工具、关联分析算 法、文本摘要技术,对申诉内容进行深度挖掘,即时发现重点热点问题。
在线客服专题 对QQ和网页在线客户系统的界面、接入速度、服务 质量等方面的用户体验,分地区、时段进行调查
主要观点 以集团通报 形式下发 各省预警
专题三 专题四 专题五
3G服务问题专题
•建立3G专属服务体系 •进一步优化实体和电子渠道服务管理 •完善天翼空间等3G应用服务
校园营销预警专 题
增值业务投诉专 题

—人工分析15分钟
• 准确度—70%
• 人工辅助工作量—30%
分析 结论
• 针对学生投诉的主要问题,在宽带套餐设计上缺乏下列问题:(1)30元的套餐,上 网流量只要20K;(2)每月80元,享受1M的宽带,学生认为不合理,因为每天晚上 12点以后是要断电的。(3)强制性购买天翼手机,并且月最低消费59元,首先须支 付650元预存话费和250元购机费,预存话费分20个月返还,折算下来,上网的话首 年必须交1281元,这对学生来说也是不能够接受的。
13、数据分析—定性分析
建立索引
聚类分析
动态词集
生成简报
从纷繁复杂的词汇 建立常用动态词库 形成直观、可读
目 标
建立索引视图, 缩减查询时间
中找出关键词,使 其能表述群体事件 的主要性质
便于业务人员能准 确、快捷地使用关 键词以定义群体事
性强、准确的数 据日报,便于业 务人员分析

任 务 与
•输入被索引的文 件存放路径 •输入索引的文件 存放路径
分词工具主要功能:
➢ 分词—将非结构的文本数据拆分为词; ➢ 去噪---滤除那些出现频率高,但对分析问题无关的词;
分词工具的两大优势:
➢多文本横向比较—按所有文本词频合计出现次数的降序排列,并且按各个 文本出现词的次数横向展现; ➢支持海量数据分析—对文本的字数没有限制,支持批量导入任意大小的文 件进行分词-去噪.
处理单位 三级现象分 类
四级现象分 类
一级原因分 类
四级原因分 类
二级原因分 类
三级原因分 类
。。。。
。。。。
办结时间 首次回复历 时 首次审核历 时
受理类型
9、数据分析—定量分析
数据中心
按时间 按省份 按业务 按现象
当月投诉量 ✓ 前一个月每日投诉量 ✓ 当月截至当日每日投诉量 ✓ 前一个月日均量 ✓ 当月日均量 ✓ 目标控制线 ✓ 警戒线
2、分词工具使用示例---通过应用分词工具,大大提高了分析效率
案例模拟 2011年3月,广东某商学院对广东电信套餐设计不合理问题进行了大量集中式
的投诉。 我们分别采用人工和分词工具对调研数据进行分析:
人工分析
• 历时—5-8小时 • 准确度—95% • 人工辅助工作量—100%
分词工具分析
• 历时—机器运行10秒
数据管理模块
数据分析模块
报表管理模块
标准化、模块化、集成化、简易化
平台功能 数据
管理
结构化调整 数据录入 数据展现 数据查询
数据整合 数据来源
数据 分析
定量分析 定性分析
工信部申诉
集团网厅
4008热线
2、用户管理
3、权限管理
用户注册
查看投诉数据
管理个人信息 普通用户
管理个人信息 普通管理员
管理普通用户
应用拓展性:
•目前支持Excel格式 •Word、网页等其他文本格式
分析互动性:
•动态词集的调整 •支持度、置信度的调整
独立商业化:
•封装的分词工具能够独 立使用
•新业务评估 •省公司预警
客户投诉 分析平台
1、平台总体架构—业务逻辑与工具高度契合
将快速响应、人机互动的基因植入平台架构中
应用呈现 用户管理模块
编辑报表 生成报表 查询报表 报表下载
对今日概 要进行编 辑和修改, 再点击提 交
其他工作
1、分词工具——功能与优势
❖ 基于非结构文本分析技术,目前在国内的数据分析领域尚属于前沿应用, 有着非常广泛的应用前景。本工具将文本数据分词后,滤去大量无用词, 再按照特征词出现的频率降序排列,提高人工工作效率。
突破与创新;
• 智能化解决方案 • 数据源拓展解决方案 • 信息共享解决方案 • 集成支持解决方案 • 快速响应化解决方案
动态、智能化
2011
2012
4、项目总体情况(4/4)—项目价值 应用价值与商业价值完美体现
价值点= 技术原创性 +分析互动性 + 应用拓展性 + 独立商业化
技术原创性:
•文本分词技术 •聚类分析算法 •关联分析算法 •文本摘要技术
特征
突发 噪声
量大 非结构 不规范
即时 同义
方法
▪ 分词 - 分词好坏决定分析效果
▪ 聚类分析 - 重热点问题内聚性强
▪ 关联分析 ▪ - 设定阀值,优化分析结果 ▪ 文本摘要 ▪ - 形成简报内容
功能
▪ 生成简报 - 按业务种类、地区、
时间等内容生成当日简报 ▪ 可调整
- 调整、删除特征词 - 及时优化结果 ▪ 可编辑 - 随时编辑简报内容 - 描述更加准确 ▪ 可反馈 ▪ - 同义词匹配 ▪ - 业务词越多,诊断越快
数据查询
✓ 操作简单 ✓ 分类完善 ✓ 准确率高
数据展现
✓ Web界面 ✓ 多渠道数据 ✓ 易操作
7、数据来源与整合—提取出关键数据项
通过整合数据,为下一步数据分析做好准备
申诉数据
颗粒度越细越好 集团数据
电子邮件
联系电话
工单编号
派发时间
工作单位 邮编
认定员
用户姓名
投诉内容 一级现象
分类 二级现象分 类
采用Oracle,管理海量数据
结构化调整
数据录入
结构化 调整
数据录入
数据展现
起始时间
多 维 查
结束时间 现象分类 原因分类 客户群体
询 投诉来源
投诉对象
✓ 数据量大 ✓ 操作简单 ✓ 批处理
✓ 速度快 ✓ 操作简单
数据下载
数据查询 数据下载
模 投诉内容 糊 回复内容 查 处理备注 询
➢运算效率:
(1)数据量大相比数据量小,运算时间长。 (2)文本相似度高,分布及其密集,容易快速找到特征词组,运算时间短。
注:准确率=系统计算热点事件件数/实际热点事件发生件数*100% 运算效率=数据量/运行时间 单位件/秒
18、数据管理—报表管理
19、数据管理—报表查询
20、数据分析——报表界面
省公司投诉量 ✓ 集团当月累计 ✓ 集团当月每日投诉量 ✓ 省公司当月累计 ✓ 省公司当月每日投诉量
业务分类 ✓ 规则政策类 ✓ 固网宽带业务 ✓ 移动语音业务 ✓ 。。。。 现象分类 ✓ 修障问题 ✓ 终端问题 ✓ 。。。。
10、数据分析—定量分析—节省掉人工定量分析工作
走势图 ✓对投诉量为空的情况,进行平均处理 ✓目标控制线设为35 ✓警戒线设为60 ✓上月日均线 ✓当月日均线
100000 90000
显著增加
投诉总量
88299
77564
80000
分享性、快速性
70000
60000
50000 39099 40000
30000
可导入、可查询、可调整、 20000
封装与扩展、可上线
10000
0
项目目标
Mapping:项目实施路线图
2、项目总体情况—项目实现的主要功能
Excel形式转化为Oracle的平台管理
申诉内容2 我购买了张宁夏电信易通卡,这业务介绍的功能是全国范 围内绑定一个电信的号码,拨打这号码不收任何费用,无 论漫游不漫游状态下都是一样!今天突然收到通知,说无 论开通与没有开通的家庭包,都只限在宁夏本地拨打绑定 的号码不收费!这不是公然违规吗?我当时都是电信正规 途径办理了该套餐,并且一直也使用着!现突然收到这消 息,现严重影响我的使用,并且严重侵害我的利益!
易通卡、 绑定、漫 游、取消、 擅自
易通卡、 绑定、费 用、套餐、 利益
判定属于 同一类问题
17、系统试运营效果:平均准确率达70%,运算效率19件/秒
经多次测试,投诉数据在准确率和运算效率上有如下特征:
➢准确率:
(1)数据量小,非标准描述少,噪声小,对准确率影响小;数据量大,非标准描述多(需要动态词 匹配),噪声大,相比精确度低。 (2)文本相似度高,散点分布极其密集,得到结果精确度高;文本相似度低,散点分堆明显(堆间 有重叠),影响结果的判断。
15、去噪与获取词集过程
宁夏=29 用户=28 消费者=26 5月=26 购买=25 办理=25 套餐=21 服务=21 易通卡=21 开通=21 欠费=20 费用=20 客户=19 恢复=19 营业厅=18 话费=17 资费=17 打电话=17 卡的=16 检测=16 严重=16 宽带=15 功能=15 拨打=15 短信=14 查询=14 固原=13 有效=13 咨询=13 家庭=13 侵犯=13 漫游=13 余额=12 理由=12 部门=12 4月=12 工作=12 赔偿=12 每月=12 信息=12
高级查询 数据库维护
高级查询 数据库维护
超级管理员 管理普通管理 员
高级查询
日报使用
• 查看功能 • 下载功能
日报管理
• 生成/编辑功能 • 上传/下载功能
日报管理
• 生成/编辑功能 • 上传/下载功能
4、数据来源与整合—提取出关键数据项
5、数据管理—数据录入与展现
6、数据管理—数据查询
7、数据管理—基于Oracle的数据中心充分满足企业需求 —安全、稳定、处理能力强
随 机
获 得
应竞
变 ,
争 优


前主

瞻动 性应
灵 的变


见 应
• 基础数据整理—打标、 分类
性变被Leabharlann • 数据透视与数据分析 • 数据挖掘—挖掘用户需

求和产品/服务缺陷


人工化
• 基础数据整理—打标、 分类
• 数据透视与数据分析 • 数据挖掘—挖掘用户需
求和产品/服务缺陷
人工化
2008
2009
2010
相关文档
最新文档