电信客户流失预测模型研究
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3 2 2 数 据 挖 掘 过 程 ..
建 立模 型 ( dl g、模 型 评 估 ( v l t n 、结 果 发 布 Mo ei ) n E a ai ) u o
( e t met。 D po y n)
本 文 以此 模 型 为 参 考 , 择 S S 选 P S公 司 的 Ce nie工 l me t n
个 月 作 为观 察 的 时 间 窗 口。
3 2 1 变 量 选 择 和 设 计 ..
2 客 户 流 失 预 测 模 型 . 二十 世纪末 , 些 软件供 应商和 用户 成立 了行业 协会 , 一 包 括 NC S s ms nier g C pn ae (丹 麦 ) R yt E gn e n o e hgn e i 、 D i e- ezAO( 国 )S S / tma S lt n t( 国) aml B n 德 r 、P SI e l oui s d 英 n o L 和 O A ezkr g ne akG e V ( 兰 ) 这 个 组 织 建 HR V re e n e nB n rpB. 荷 i , 立 了 数 据 挖 掘 的 过 程 模 型 C IP — D f rs. d s y RS M C os n ut I r Sa dr rcs Da nn ) , R S D 方 法 把 数 据 挖 t adPo es t Miig Ⅲ C P. M n — a I 掘 看 作 一 个 商 业 过 程 ,将 一 个 数 据 挖 掘 项 目 的生 存 周 期 定 义 为 六 个 过 程 , 别 为 :商 业 理 解 ( uies n es n ig 、 分 B s s U drt d ) n a n 数 据 理 解 ( t Un es n i ) 数 据 准 备 ( t P eaa o ) Da d r adn 、 a t g Da rp rt n 、 a i
一
方 面 投 入 大 量 时 间 、 力 、 力 去 发 展 新 客 户 , 一 方 面Βιβλιοθήκη Baidu 人 财 另 因客 户 流 失 管 理 的 不 完 善 导 致 现 有 客 户 流 失 。 如 何 保 留 住
将其转换成 数据模 型所 需的格式—— 数据 挖掘 目标 表, 阶 此 段称 为数据预处理 阶段或数据准 备阶段 。 此项 目采用某地 市
根 据 电信 客户流失 的业 务特 征 , 电信客户流 失的数据挖
掘 目标 表 通 常 需 要 如 下 变 量 : 户 流 失 的 状 态 变 量 Y; 体 客 个 鉴 别 变 量 X1人 口统 计 变 量 X ; 户 行 为 变 量 X 。将 这 些 ; 2客 3
行为变 量加 以整 理可归 纳为 以下 几类来 描述[( 2 本地 通话 的 1
数据抽 样后 , 样本数 据分成 训练 数据 集( ri D t S t 把 T a a e) n a 和
3 1 商 业 理 解 和 环 境 评 估 .
电信行业 的客户 流 失可分 为两种 :客 户被动 流失 与客
研 究
51 06; 00 51 00 0 6;
利用 S S 公 司的数据挖掘 工具 C e n n , 用 PS l t e运 me i
客 户采取 更有 效的营销策略提供一些建议 。
了减 少 客 户 流 失 , 需整 合 用 户 信 息 , 用 户 进 行 合 理 的 分 类 和 对
具进行 数据预测 模型 的建立 ,数据处 理采用 了 S bs yae公司
的 I 数据 仓库 。 O
3 数 据 挖 掘 模 型 应 用 .
进 行 知 识 挖 掘 时 _ 先 从 原 始 数 据 集 合 r 里 指 数 据 挖 掘 3 J , 这
目标表 1 中取 出一 个与探 索 的 问题 相关 的样本 数据 集 , 经过
行 为 变 量 ; 内 、 内 漫 游 通 话 的 行 为 变 量 ; 澳 台 、 它 国 省 国 港 其 家 漫 游 通 话 及 国 际 、 澳 台长 途 的 行 为 变 量 : 转 及 呼 叫 。 港 呼 反
映客户 呼转 到不同 电信运 营商的情况 , 客户 呼叫不 同电信运
营 商 的 情 况 ; 据 业 务 的 使 用 情 况 ; 话 号 码 数 : 户 的总 体 数 通 客 主 被 叫 行 为 等 ) 进 一 步 的衍 生 变 量 X4 建 模 的 目的 就 是 要 ; 。 分析 、确 定这 些 向量变量 与客 户流 失状态 变 量 Y 的关 系 , 即 : Fx1X2 X3 X ) Y= f , , , 4 。
电信 企 业 6个 月 的数 据 作 为 训 练 数 据 。
既有 客户 , 及如 何从这 些客 户获得 最大 的收益 , 成为 国 内 将 电信 企业重要 的课题 。本 文结合 电信业务规 则, 基于数据 对 挖掘 的流失 预测模 型进 行 了合 理 的分析和 应用 ,使企 业对
流 失 客 户 能 够 采 取 更 有 效 的营 销 策 略 。
针对 被动流 失客户( 即欠 费销户) 建立 模型 , 一般客 户 对
而 言 , 因欠 费停 机 , 且 在 3个 月 内 没 有 还 款 , 后 会 被 欠 若 并 最
费销户 。对 于这类欠 费销户的客户 , 了能考察到他们 的行 为 为变化 , 定 了在 欠费销户 月份之前 的倒数 第 4 9个 月这 6 选  ̄
1 引 言 .
识 别 。本 次 客 户 流 失 预 测 主 要 是 针 对 电信 行 业 的 流 失 客户 。 3 2 数 据 理 解 和 准 备 . 为 了建 立 客 户 流 失 模 型 ,必 须 收 集 所 有 的 原 始 数 据 , 并
目前 在 全 球 电 信 业 发 展 处 于 低 迷 的情 况 下 , 我 国 不 断 深 化 改 革 电信 行 业 , 电 信 运 营 企业 进 行 重 组 。各 电信 企 业 对
建 立模 型 ( dl g、模 型 评 估 ( v l t n 、结 果 发 布 Mo ei ) n E a ai ) u o
( e t met。 D po y n)
本 文 以此 模 型 为 参 考 , 择 S S 选 P S公 司 的 Ce nie工 l me t n
个 月 作 为观 察 的 时 间 窗 口。
3 2 1 变 量 选 择 和 设 计 ..
2 客 户 流 失 预 测 模 型 . 二十 世纪末 , 些 软件供 应商和 用户 成立 了行业 协会 , 一 包 括 NC S s ms nier g C pn ae (丹 麦 ) R yt E gn e n o e hgn e i 、 D i e- ezAO( 国 )S S / tma S lt n t( 国) aml B n 德 r 、P SI e l oui s d 英 n o L 和 O A ezkr g ne akG e V ( 兰 ) 这 个 组 织 建 HR V re e n e nB n rpB. 荷 i , 立 了 数 据 挖 掘 的 过 程 模 型 C IP — D f rs. d s y RS M C os n ut I r Sa dr rcs Da nn ) , R S D 方 法 把 数 据 挖 t adPo es t Miig Ⅲ C P. M n — a I 掘 看 作 一 个 商 业 过 程 ,将 一 个 数 据 挖 掘 项 目 的生 存 周 期 定 义 为 六 个 过 程 , 别 为 :商 业 理 解 ( uies n es n ig 、 分 B s s U drt d ) n a n 数 据 理 解 ( t Un es n i ) 数 据 准 备 ( t P eaa o ) Da d r adn 、 a t g Da rp rt n 、 a i
一
方 面 投 入 大 量 时 间 、 力 、 力 去 发 展 新 客 户 , 一 方 面Βιβλιοθήκη Baidu 人 财 另 因客 户 流 失 管 理 的 不 完 善 导 致 现 有 客 户 流 失 。 如 何 保 留 住
将其转换成 数据模 型所 需的格式—— 数据 挖掘 目标 表, 阶 此 段称 为数据预处理 阶段或数据准 备阶段 。 此项 目采用某地 市
根 据 电信 客户流失 的业 务特 征 , 电信客户流 失的数据挖
掘 目标 表 通 常 需 要 如 下 变 量 : 户 流 失 的 状 态 变 量 Y; 体 客 个 鉴 别 变 量 X1人 口统 计 变 量 X ; 户 行 为 变 量 X 。将 这 些 ; 2客 3
行为变 量加 以整 理可归 纳为 以下 几类来 描述[( 2 本地 通话 的 1
数据抽 样后 , 样本数 据分成 训练 数据 集( ri D t S t 把 T a a e) n a 和
3 1 商 业 理 解 和 环 境 评 估 .
电信行业 的客户 流 失可分 为两种 :客 户被动 流失 与客
研 究
51 06; 00 51 00 0 6;
利用 S S 公 司的数据挖掘 工具 C e n n , 用 PS l t e运 me i
客 户采取 更有 效的营销策略提供一些建议 。
了减 少 客 户 流 失 , 需整 合 用 户 信 息 , 用 户 进 行 合 理 的 分 类 和 对
具进行 数据预测 模型 的建立 ,数据处 理采用 了 S bs yae公司
的 I 数据 仓库 。 O
3 数 据 挖 掘 模 型 应 用 .
进 行 知 识 挖 掘 时 _ 先 从 原 始 数 据 集 合 r 里 指 数 据 挖 掘 3 J , 这
目标表 1 中取 出一 个与探 索 的 问题 相关 的样本 数据 集 , 经过
行 为 变 量 ; 内 、 内 漫 游 通 话 的 行 为 变 量 ; 澳 台 、 它 国 省 国 港 其 家 漫 游 通 话 及 国 际 、 澳 台长 途 的 行 为 变 量 : 转 及 呼 叫 。 港 呼 反
映客户 呼转 到不同 电信运 营商的情况 , 客户 呼叫不 同电信运
营 商 的 情 况 ; 据 业 务 的 使 用 情 况 ; 话 号 码 数 : 户 的总 体 数 通 客 主 被 叫 行 为 等 ) 进 一 步 的衍 生 变 量 X4 建 模 的 目的 就 是 要 ; 。 分析 、确 定这 些 向量变量 与客 户流 失状态 变 量 Y 的关 系 , 即 : Fx1X2 X3 X ) Y= f , , , 4 。
电信 企 业 6个 月 的数 据 作 为 训 练 数 据 。
既有 客户 , 及如 何从这 些客 户获得 最大 的收益 , 成为 国 内 将 电信 企业重要 的课题 。本 文结合 电信业务规 则, 基于数据 对 挖掘 的流失 预测模 型进 行 了合 理 的分析和 应用 ,使企 业对
流 失 客 户 能 够 采 取 更 有 效 的营 销 策 略 。
针对 被动流 失客户( 即欠 费销户) 建立 模型 , 一般客 户 对
而 言 , 因欠 费停 机 , 且 在 3个 月 内 没 有 还 款 , 后 会 被 欠 若 并 最
费销户 。对 于这类欠 费销户的客户 , 了能考察到他们 的行 为 为变化 , 定 了在 欠费销户 月份之前 的倒数 第 4 9个 月这 6 选  ̄
1 引 言 .
识 别 。本 次 客 户 流 失 预 测 主 要 是 针 对 电信 行 业 的 流 失 客户 。 3 2 数 据 理 解 和 准 备 . 为 了建 立 客 户 流 失 模 型 ,必 须 收 集 所 有 的 原 始 数 据 , 并
目前 在 全 球 电 信 业 发 展 处 于 低 迷 的情 况 下 , 我 国 不 断 深 化 改 革 电信 行 业 , 电 信 运 营 企业 进 行 重 组 。各 电信 企 业 对