电信客户流失和七项经济指标聚类题
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、电信公司为分析客户流失状况,为客户是否流失提供参考依据,随机选取了600名客户进行研究,得到了如附表所示一系列数据,收集到的数据包含下列字段:在网月数截止数据收集时间为止的在网月数
年龄客户实际年龄
婚姻状况客户婚姻状况,0代表未婚,1代表已婚
现地址居住时间现在地址的居住月份
教育程度1:专科以下;2:本科;3:硕士;4:研究生;5:
博士
工作状态0:待业;1:在职
性别0:女;1:男
租设备0:不租;1:租
IP电话0:无;1:有
无线电话0:有;1:无
本月话费话费具体金额
语音信箱0:无;1:有
网络0:无;1:有
来电显示0:无;1:有
呼叫等待0:无;1:有
呼叫转移0:无;1:有
流失状态0:未流失;1:流失
根据这些客户数据,进行数据预处理,之后分别用逻辑回归和SVM算法进行分析,对比两种算法的拟合优度,从而选择两者中更加适合的算法模型。写出分析思路和过程,并为电信公司提供客户运营的相关建议。
数据分析应用1电信客户流失数据.xlsx
2、选取7项经济指标作为决定经济类型的影响因素,对全国31个省、直辖市、自治区(浙江、湖南、甘肃除外)进行聚类分析(各项数据均来自2010年国家统计年鉴)。
数据分析应用2省市分类.xlsx
对数据进行预处理(创建新的变量等),比较说明聚成几类时聚类效果最好,写出分析思路和过程,并分析每一类的实际意义。