度小满智能语音机器人解决方案
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
说
语音合成 (TTS)
深度学习算法 +GPU计算集群 + 催收场景海量逾期样本、语料数据
智能分案+决策引擎
姓名、手机、身份证 逾期天数、 逾期金额 …
*注:为获得用户有效授权的机构提供服务
Input
智能分案 决策引擎
Output
分数:1~100
覆盖全国绝大多数网民用户 已合作机构覆盖率在90%以上
A: -可以。 -不能。 -我的手机号登录总是失败。 -我的工程款到了就可以还。 -我在医院做手术呢。 -你们为啥不能自动扣款 -………
智能催收管理 — 用户实时自动画像及标签生成
智能催收管理 — 对话录音、文本浏览及标注
产品输出架构与合作模式 — 云端模式
云端系统: 客户通过账号、密码登录使用 云端基础功能: 语音外呼大盘、外呼任务提交、外呼语音文本记录查看及下载 任务提交方式: 支持excel模板批量上传及下载、 支持API接口提交及下载
外部标注语料样本
✓ 数万小时外购专业语料标注数据 ✓ 25个外场噪音背景数据
训练语料样本自动生成
✓ 基于深度卷积生成对抗网络的语音生成
声学模型
✓ Wavenet 语音深度学习模型算法 ✓ 支持增量训练、迁移学习 ✓ 小规模音频梅尔频谱多样扩充
语言模型
✓ Transformer, bert 自然语言理解模型框架 ✓ BLSTM+Attention 语义完整性判断模型 ✓ Multi-Attention 文本纠错模型 ✓ 多音字识别转换模型
客户端调用SDK
✓ 客户端语音流预处理,噪音过滤等
逻辑处理及解码器
✓ 接收解析语音流,任务调度及控制 ✓ 响应时间低于500ms ✓ RNN-T与WarpCTC,提升识别速度与准确率
核心技术 — NLU 人机对话决策图
度小满智能语音催收机器人决策图 (机器人主导对话)
Q: -您的欠款今天能否还清?
度小满内部数据画像
社会属性 资产情况 负债情况 收入情况
……
还款意愿
回款率 (7天)
评估催收方式
高(>=80)
75%
标准版机器人 +短信
中(80>分数 >60)
50%
施压版机器人+人 工催收
低(<=60) 30%
人工催收
智能分案+决策引擎
回款
高风险
催收
用户
逾 期
决策 引擎
客 户
还款 风险
预测
模型
回款
训练集&测试集: 我/ 最近/ 没有时间 LOAN_BUSYNOW 不是/ LOAN_UNCOMMITTED 我/ 还不了/ 钱 LOAN_REPAY_DENIED ……
在线识别
待识别语句
预处理
噪声清除 标签过滤 分词等
特征向量化
向量模型
分类模型服务
分类模型文件
核心技术 — 基于深度学习的语音合成方案
4
5
历史催收电话响应
2
4
征信数据特征
2
1
用户画像-消费
1
1
学历特征数据
1
0
通讯录子模型
1
1
核心技术 — ASR 语音识别服务
催收和客服线上业务覆盖全国用户,语音识别整体准确率: 90+%
训练语料样本
声学模型+语言模型
实时在线服务
自有催收电销语料
✓ 数千小时的催收电销场景用户语料; ✓ 100+人,专职外包团队标注
未还用户分布 0.06% 0.11% 0.19% 0.32% 0.53% 0.77% 1.07% 1.51% 2.26% 4.00% 10.82%
版本
难催用户筛选
X
后26% 人群
极限参考 后11% 人群
M1 坏账金额占比 72% 100%
分类
分期产品
循环产品
历史借款还款行为
10
5
多头行为特征
9
13
搜索浏览消极内容
Tacotron + Griffin-Lim
TTS
语 音 合 成 框 架
Encoder 我是度小满金融的客服
文本矩阵化
• pre-net(NN):两个全连接层 • CHBG(CNN):CNN + Highway
Nets + Bi-GRU
Decoder
文本矩阵转向量,产生输出:80维 mel频谱图
Attention RNN 2 GRUs layes with residual Drop满金融安全专业团队,100人,最充分的数据安全审计措施和技术保护手段
API 使用 HTTPS加密传输,对每个访问请求进行身份验证,采用HTTPS双向认证回调。敏感信息 支持AES、RSA、SHA256等加密方式
原始素材
预处理分词
噪声清除 标签过滤 分词等
语料库 训练集 测试集
自动扩充
预处理文本
词频tfidf word2vec CCA transE知识 库 ……
向量模型
特征向量化
分类模型训 练评估
随机森林 朴素贝叶斯 支持向量机 深度学习
我最近没有时间 不是 噢噢噢噢 我还不了钱 ……
语料库: 我/ 最近/ 没有时间 不是/ 我/ 还不了/ 钱 ……
Attention
Attention is applied to all decoder steps
Decoder RNN
Attention RNN
Pre-net
Decoder RNN
Attention RNN
Pre-netຫໍສະໝຸດ Decoder RNNAttention RNN
Pre-net
Griffin-Lim
小满语音机器人在金融场景的应用 (催收)
M1 T+3人群 还款率,纯机器人贡献占比 56%
(大盘去掉自然还款部分)
人工 15%
机器人 37%
自然 34%
机器人+人工 14%
机器人 机器人+人工 自然 人工
小满机器人整体解决方案
听
语音识别 (ASR)
决策 智能分案+决策引擎
理解 意图理解 (NLU)
度小满智能客服解决方案
小满语音机器人在金融场景的应用 (电销)
客户生命周期
申请过程中脱落
在贷
已结清
召回方式 机器人优势
问题解答+主动营销
营销激励
• 降低运营成本
• 辅助提升申请和用信率
营销激励
应用效果
人机多轮对话准确率达到 90% (5轮及以上) 申请脱落召回效果,与人工持平;
小满语音机器人在金融场景的应用 (电销)
低风险
用户
智能语 音机器 人差异 化催收
用户体验与回款率之间的完美平衡 语音: 标准女声 Vs 严肃男声 话术: 提醒为主 Vs 施压为主 施压指数: 实时动态配置多级别施压指数 机器人全方位模仿对象: 一线高级催收业务员
高低分 差异化 催收 效果
45%
高分和低分的回款率差异达到45%,智能 决策引擎的效果非常显著
Conv1D bank + stacking
Conv1D projections
Conv1D layers
Bidirectional RNN
Highway layers
Residual connection
Max-pool along time(stride=1)
CBHG
Seq2seq target with r=3
基于mel频谱生成语音
Griffin-Lim 算法
产品输出架构与合作 — 云端+本地化模式
度小满云端环境
机器人管理系统
(机器人任务调度分配、 机器人训 练、配置、监控)
机器人任务匹配决策 (还款预测模型等)
机器人A
听说:语音识别与合成 理解:自然语音理解NLU 决策:场景交互决策图 角色:系统配置化
智能分案+决策引擎
内部M1, 催收还款预测模型 KS 48, PSI 0.02
score 10 9 8 7 6 5 4 3 2 1 avg
人数比例 10.72% 11.19% 11.23% 10.76% 10.43% 10.07% 9.77% 9.07% 8.75% 8.02% 100.00%
还款率 99.48% 99.00% 98.27% 97.05% 94.92% 92.39% 89.00% 83.34% 74.15% 50.15% 89.18%
申请脱落人群,机器人能力与人工持平;
(征信及补录环节脱落,相同样本,人工与机器人的有效申请率)
小满语音机器人在金融场景的应用 (催收)
逾期账龄
T-3
T+3
T+3以上
催收方式
机器人提醒
机器人催收
机器人催收+人工催收
机器人优势
• 降低运营成本
• 辅助提升回款率
• 安全合规
应用效果
人机多轮对话准确率达到 92% (5轮及以上) 人机结合模式, 人效提升一倍以上,M1回款率绝对值提升5%以上
任务上传:文件形式
任务上传:API接口形式
核心技术 — TTS 催收场景真人语料合成
度小满机器人声音,用户无感率达到99%
催收场景及电销场景的特殊性, 不能被用户感知到机器人,才能保证业务效果
✓ 度小满自有催收和电销场景, 一线客服作业语料丰富; ✓ 支持姓氏、逾期金额、逾期天数、账单日等变量实时合成; ✓ 机器人声音语速支持客户自定义调整; ✓ 方言语料丰富,可按照客户籍贯和常驻地进行定制 ✓ 根据催收模型分数,实时动态调整机器人音色、语气、施压话术
机器人…N
听说:语音识别与合成 理解:自然语言理解NLU 决策:场景交互决策图 角色:系统配置化
语音软交换 服务器
专线/公网, 语音指令交互
客户本地网络环境
本地部署语音网关 语音呼叫任务管理系统
用户会话意图样本库
通用会话意图样本 场景会话意图样本 自动生成会话意图样本
客户专线及号码
PSTN
金融业务数据安全保障
催收-严肃男声
催收-标准女声
客服-用户申请脱落 催收-重庆方言
核心技术 — 用户意图理解模型服务
模型管理
训练优化
意图管理 样本标注 模型训练 模型部署
分词管理 样本管理 模型测试 效果监控
关键技术方案 1、预处理分词
jieba中文分词器 场景高频预料人工分词库 2、样本自动扩充 中文近义词工具包 3、向量模型(词语转向量) google word控制列表ACL和对象限时访问相结合的权限控制方 式,为用户提供安全可靠的数据保护
对每一笔接通的电话进60 天,留存期内可以通过接口 API 随时调取。
Thanks