家庭关联关系识别模型
合集下载
相关主题
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
描述 平均主叫次数 平均被叫次数 总呼叫次数 平均主叫时长 平均被叫时长 总呼叫时长 90秒以内通话次数 90秒以上通话次数 平均最短一次通话时长 平均最长一次通话时长 家庭关系标志
字段名称 WEEK_AM_CALLINGTIMES WEEK_AM_CALLEDTIMES WEEK_AM_CALLTIMES WEEK_PM_CALLINGTIMES WEEK_PM_CALLEDTIMES WEEK_PM_CALLTIMES WEEKED_CALLINGTIMES WEEKED_CALLEDTIMES WEEKED_CALLTIMES AVG_DURATION
➢ 宽表设计:分析正样本中号码对的通信行为特征,设计宽表; ➢ 模型建立:使用挖掘工具clementine建立挖掘模型; ➢ 模型验证:根据技术指标以及抽样验证,对模型进行调优。
-8
样本选取
样本选取
宽表设计
模型建立
模型验证
正样本
已经办理e6或e9套 餐的【固话,手机】 号码对
负样本
有通话但客户账户证件 均不同且非e家的【固 话,手机】号码对
3G用户数
固定宽带用户数
其中:集团客户 宽带用户数
集团IDC用户数
675万 5346万
551万
274万
如何利用已有的固网和宽带客户 资源约6优00势万实现移动客户的38增55长万?
约1700万家(ADSL/LAN /各种光纤、专线)
约2.2万家(专线用户)
约900万家(ADSL/LAN /各种光纤、专线)
最终选取符合上述规则的正样本1653号码对,负样本9152号码对,构成模型的样本集。
-9
宽表设计 – 基础字段
样本选取
宽表设计
模型建立
模型验证
设计字段原则:在该字段中,家庭用户和非家庭用户存在较显著的统计差异。
字段名称 CALLING_TIMES CALLED_TIMES CALL_TIMES CALLING_DURATION CALLED_DURATION CALL_DURATION SHORT_TIMES LONG_TIMES MIN_DURATION MAX_DURATION FLAG2
家庭关联关系识别模型
深圳市高新技术产业园区南区南七道T3大厦B三层 ADD:3/F,T3 Building,Nanqi Road,South Area Shenzhen Hi-Tech Industrial Park,Shenzhen, P.R.C 电话(TEL):+86-755-26745688 传真(FAX):+86-755-26745666 邮编(P.C.):518057 ---
目录
现状背景 模型目标 建模步骤 模型解读 应用价值
-2
行业背景
行业竞争日趋激烈 中国的通信行业走过了“引入竞争”和“市场尝试”两个过渡阶段,已经开始逐 步进入“充分竞争”的阶段,行业竞争日趋激烈。
固定电话用户数 1.89亿
约2500万
1.03亿
移动电话用户数
5609万
5.22亿
1.45亿
描述 平均周中17-19:00主叫次数 平均周中17-19:00被叫次数 平均周中17-19:00总呼叫次数 平均周中11-13:00主叫次数 平均周中11-13:00被叫次数 平均周中11-13:00总呼叫次数 平均周末主叫次数 平均周末被叫次数 周末呼叫次数 平均通话时长
- 10
宽表设计 – 标准化字段
移动、联通、电信 手机客户群
家 庭 关 系
电信固话 客户群
异网集团网用户
异网个人用户
Βιβλιοθήκη Baidu
电信个人用户
-4
电信家庭固话
目录
现状背景 模型目标 建模步骤 模型解读 应用价值
-5
建模目标
家庭关联关系识别模型的主要目标:
通过移动电话与固定电话之间的通话频率、通话时长、通话时段、通话周期和交际圈相 似度等变量,进行分类预测建模,从而准确地识别出手机号码与固定电话之间的家庭关 联关系;
样本选取
宽表设计
模型建立
模型验证
设计字段原则:不同的家庭用户在通信行为上存在较大差异,单纯用绝对值作为预测变量导致
模型存在偏差,需要将其标准化,得出相对值。
字段名称
CALLING_TIMES_R CALLED_TIMES_R CALL_TIMES_R CALLING_DURATION_R CALLED_DURATION_R CALL_DURATION_R SHORT_TIMES_R LONG_TIMES_R MIN_DURATION_R MAX_DURATION_R
描述
平均主叫次数比 平均被叫次数比 总呼叫次数比 平均主叫时长比 平均被叫时长比 总呼叫时长比 90秒以内通话次数比 90秒以上通话次数比 平均最短一次通话时长比 平均最长一次通话时长比
正样本需剔除以下几类情况:
1. 资料不符:剔除客户编码、账户、身份证号码三者中有不相同项的号码对; 2. 互通异常:剔除两个月中有一月无互通行为的号码对; 3. 证件异常:剔除机主身份证号码不合理、年龄大于70岁或小于18岁的号码对; 4. 状态异常:剔除非在用状态、新增、公免的号码对; 5. 匹配多元:剔除固话与手机为一对多关系的号码对;
● 假设条件:家庭用户与非家庭用户,在通话行为上存在显著差异, 并且一个有固话的家庭至少存在一个家庭手机用户.
● 基本思想: 根据固定电话的个性化特征,得到与之关联手机号码的 家庭关系评分,最高分即为家庭关系(最高分须不小于0.5)。
● 基本流程:
➢ 样本选取:找出本网属于家庭关系的号码对作为正样本,并找出不属于家庭关系 的号码对作为负样本;
约3万家
约3200家
约2万家
截止2009年底,三大运营商用户分布情况
注:上述数据来源于赛立信通信竞争情报月刊2010年4月 -3
业务背景
传统本网融合/异网策反方法不足
✓无法提供有效的策反政策 ✓营销手段模糊化 ✓营销效率低下 ✓已有客户资源的闲置
基于家庭关联关系的精确营销优点
✓能提供适配用户的资费政策 ✓外呼用户信息明确,指导性强 ✓名单准确率高,效率大大提高 ✓充分利用了固网、宽带客户资源
根据模型预测结果,对于本网手机进行融合套餐营销,对于异网手机进行策反活动。 通过营销活动,实现两个提升:提升市场份额、提升品牌力度
电信单固话
符合家庭特征
C网手机
电信单固话
符合家庭特征
G网手机
融合套餐营销 异网客户策反
-6
目录
现状背景 模型目标 建模步骤 模型解读 应用价值
-7
分析思路