呼叫中心人工座席预测模型和分析
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1
动态回归模型( ARIMAX 模型)
为了在符合一定服务质量和客户满意度的前提下, 达到控
制人工座席数即人工成本的目的, 我们就对接通率、 人工座席 数、 人工来电总量三个序列进行了分析, 并以人工来电总量和接 以人工座席数为因变量建立动态回归模型, 分 通率作为自变量, 析了接通率和人工来电总量变化情况下, 需要人工服务座席即 排班数变化值。
Abstract
The manual service agents and the connection rate are all the important indexes the call centre concerns. In this paper,we
probe the relationship between the number of manual service agents,the call connection rate and the incoming calls total by mining and analysing the history data of a certain largescale call centre. We use ARIMAX model of multivariate time series to give the dynamic regression model of the estimation. Test results show that the forecast data of the model has a high degree in fit with the actual data. Keywords Call centre ARIMAX model Forecasting 资源不匹配造成的, 即人力资源配置的问题 。 在本文中为了考
( 5)
2
2. 1
实证分析
数据预处理
本文采用的是某大型电话咨询中心从 2011 年 9 月 1 日至 2011 年 9 月 30 日的人工服务变量数据, 主要包括接听总量、 来 8 电总量和在线座席, 每天数据采集的时间点从早上 点钟到晚 上 8 点钟, 时间间隔是 1 个小时, 总共采样点数为 360 。分析过 程中采用的软件主要是 EViews 5. 0 版本。 N 为采样时间点个数, 设 t 为采样时间点, 本例中 N = 360 。 { x1 t } , { x2t } 分别表示在线座席、 接通率和来电总 用变量{ y t } , 量, 接通率是接听总量与来电总量的比值, 因为这几个变量数据 是时间序列, 所以考虑利用时间序列分析方法来建立合理的模 型来预测在线座席。 图 1 和图 2 给出了接听总量、 在线座席和来电总量从 2011 年 9 月 1 日至 2011 年 9 月 30 日的时序图, 发现这三个变量基 本上是平稳序列, 同时它们有基本相同的变化趋势, 可进一步探 索用动态回归模型( ARIMAX 模型) 分析三个变量之间的长期 的均衡关系。
1. 2
ARIMAX 模型的建立步骤
( 1 ) 首先对响应序列 { y t } 和输入变量序列 { x1t } , { x2 t } ,
…, { x kt } 做平稳性检验; ( 2 ) 构建响应序列和输入变量序列的回归模型:
k
yt = μ +
∑ Φ ( B) B
i =1 i
Θ i ( B)
li
x it + ε t
Baidu Nhomakorabea
FORECASTING MODEL FOR MANUAL SERVICE OF CALL CENTRE AND ITS ANALYSIS
Du Shouguo1
1 2
Li Guangya2
( Information Center, Shanghai Municipal Labor and Social Security Bureau, Shanghai 200051 , China) ( Wonders Information Co. ,Ltd. , Shanghai 201112 , China)
第 29 卷第 7 期 2012 年 7 月
计算机应用与软件 Computer Applications and Software
Vol. 29 No. 7 Jul. 2012
呼叫中心人工座席预测模型和分析
杜守国
1 2
1
李光亚
2 上海 200051 )
( 上海市人力资源和社会保障信息中心 ( 万达信息股份有限公司
( 4)
图和偏自相关图, 经过多次尝试之后, 初步确定对残差序列拟合 ARMA 模型, 得到的拟合模型参数估计见表 1 所示。
第7 期
表1 Variable AR( 1 ) AR( 2 ) AR( 9 ) AR( 12 ) MA( 1 ) MA( 9 ) MA( 12 ) Rsquared Adjusted Rsquared S. E. of regression Sum squared resid Log likelihood Inverted AR Roots
[3 ]
:
k
yt = μ +
∑ Φ ( B) B
i =1 i
Θ i ( B)
li
x it + ε t
( 1)
图1 接听总量、 在线座席和来电电话号码总量
式中, Φ i ( B) 为第 i 个输入变量的自回归系数多项式; Θ i ( B) 为 第 i 个输入变量的移动平均系数多项式; l i 为第 i 个输入变量的 延迟阶数; { ε t } 为回归残差序列。 { x2 t } , …, { x kt } 都是平稳序列, 因为 { y t } 和{ x1t } , 且平稳序 所以残差序列{ ε t } 是平稳序列: 列的线性组合仍然是平稳的, εt = yt - Θ ( B) B x ) (μ + ∑Φ ( B)
上海 201112 )
摘
要
人工座席、 接通率都是呼叫中心关注的重要内容, 通过某大型呼叫中心的历史数据进行挖掘和分析, 探索人工座席数、 接
通率和来电总量三者之间的关系, 并利用多元时间序列的 ARIMAX 模型给出估计的动态回归模型 。 检验结果表明模型预测数据和 实际数据有较高的拟合度 。 关键词 中图分类号 电话咨询中心 TP391 ARIMAX 模型 文献标识码 预测 A
k i li it i =1 i
( 2)
使用 ARMA 模型继续提取残差序列 { ε t } 中的相关信息, 最终得到的模型为:
{
k
yt = μ +
∑ Φ ( B) B
i =1 i
Θ i ( B)
li
x it + ε t ( 3)
图2
在线座席
2. 2
动态回归模型参数估计
{ x1 t } , { x2t } 分别表示在线座席、 用变量 { y t } , 接通率和人
。“十一五 ” 收稿日期: 2012 - 03 - 01 国家科技支撑计划重点项目 ( 2008BAH32B02 ) ; 上海市教委科研创新项目( 11YS205 , 08ZS94 ) ; 上海 “085 工程” 。杜守国, 市高校 高工, 主研领域: 软件工程和数据挖掘 。 李 光亚, 教授级高工。
0
引
言
虑问题, 我们定义接通率为人工接通率即人工座席的接通量与 需人工接听的来电总量的百分比 。 除了很多小型的呼叫中心可以采用手工或者借助 EXCEL 进行日常排班外, 大部分呼叫中心采用基于排队论的 Erlang 的 公式进行排班
[4 ]
呼叫中心利用计算机技术和通信技术的有机结合( CTI ) 提 供从咨询到业务办理的完整服务链的模式 。大多数呼叫中心都 关注两个问题, 一是基础资源配置和信息系统的承载能力问题, 即需要多少中继线路来承载用户的随机呼入, 特别是繁忙时段 的来电量, 并将中继资源在人工座席 、 自动服务、 呼出等服务之 间进行合理分配; 二是人力资源配置问题, 即每个时间段需要安 排多少座席人员才能达到承诺的服务水平 。这两个问题都和来 1, 2, 5]利用不同的方式建立的来电量预测 电总量有关, 文献[ 模型。人力资源配置即人工座席安排的问题, 也是呼叫中心日 常运营管理的核心问题, 其中呼叫中心接通率是服务水平的一 个重要指标。 呼入型呼叫中心的接通率定义: 对于具有 IVR 和 ACD 的呼 入型呼叫中心, 接通率是 IVR 终级服务单元的接通量与人工座 席的接通量之和与进入呼叫中心的呼叫总量之间的百分比 。 我 们认为呼叫中心的接通率既不能太低, 造成客户抱怨, 影响呼叫 中心的价值, 也不应一味追求高接通率, 造成系统和人力资源的 成本过高。影响呼叫中心接通率主要有两种原因, 其一是呼叫 中心的信息系统问题, 因信息系统造成丢失呼叫信息, 如当排队 队列超过最大队列设置时, 系统主动中断呼入电话等, 造成呼叫 不能到达 IVR 或者人工座席; 其二是相对呼入总量与在线座席
1. 1
ARIMAX 模型的结构
1976 年, Cox 和 Jenkins 采用带输入变量的 ARIMA 模型, 为 平稳多元序列建模, 即 ARIMAX 模型。ARIMAX 模型的构造思 想是, 假设响应序列 { y t } 和输入变量序列( 即自变量序列) 。 { x1 t } , { x2 t } , …, { x kt } 均平稳, 首先构建响应序列和输入变 量序列的回归模型
38
计算机应用与软件
( 3 ) 考察残差序列 { ε t } , 并对其拟合模型: Θ( B) a εt = Φ( B ) t { a t } 为零均值白噪声序列。
2012 年
ACD 路由等各类影响因素, 话务员能力不一致、 主动弃电、 且这 些影响因素在今后也将影响呼叫中心的人工座席和接通率的 关系。 本文根据某行业呼叫中心的历史数据, 将接通率和人工座 席和人工来电总量三个时间序列综合在一起考虑 。分析了每个 时间段的来电量、 在线座席数、 接通率三者之间的统计关系, 根 ARIMAX 利用 模型给出一个以在线座 据三个时间序列的特点, 席为因变量, 接通率和来电总量为自变量的关系模型, 并进行了 拟合效果良好。根据这个模型呼叫中心管理者可以同时 拟合, 兼顾考虑作为服务质量目标的接通率和作为成本控制目标的人 工坐席数之间的辩证关系, 在客户满意度和成本方面寻找一定 的平衡, 进而向系统的扩容和员工的培训等方面提供一定依据, 为呼叫中心定量管理提供一种新的方法 。
Θ( B) a εt = Φ( B ) t
上述模型被称为动态回归模型, 简记为 ARIMAX 模型。 式 中, Φ( B) 为残差序列的自回归系数多项式; Θ( B) 为残差序列 的移动平均系数多项式; { a t } 为零均值白噪声序列。
Perron 检验序列 工服务来电总量, 采用单位根检验中的 Phillips{ yt } , { x1 t } , { x2t } 的平稳性, 结论是该三个序列都是平稳序列, 可以利 用 平 稳 多 元 序 列 的 建 模 方 法 ( ARIMAX ) 来 建 立 预 测 模型。 首先构建响应序列和输入变量序列 的 回 归 模 型, 得到式 ( 6) : y t = - 24 . 5752 + 160 . 7707 x1t + 0 . 0234 x2t + ε t ( 6) 再考察回归残差序列 { ε t } 的性质, 利用残差序列的自相关
, Erlang( Erlang B 和 Erlang C) 模型可以用于计
算满足服务水平目标, 如接通率, 所需要的人工数量和中继线数 量, 但是 Erlang 模型存在的主要缺陷是: ① 公式假设服务人员 具备一致的能力, 如处理问题、 工作效率、 知识和工作态度等方 面的能力; ② 公式假设当来电者遇到座席忙需要等待时会一直 这两假设在实际情况中无法成立; ③ 公式未考虑队列 等下去, ACD 路由分配等因素, 中放弃、 重播、 忙音、 导致当呼叫中心服 务水平出现波动, 且放弃率很高的情况下, 计算精确度也就随之 不稳定。 时间序列分析, 正是根据客观事物发展的连续规律性, 运用 过去的历史数据, 通过统计分析的方法寻找和描述序列值之间 并拟合出适当的数学模型来描述这种规律, 进一步 的统计规律, 推测未来的发展趋势, 而历史数据产生过程本身已经包含诸如