数学建模 通信数据分析
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
通信数据分析
摘要
随着社会的发展与进步,通信技术不断发展,电话作为主要的通信工具已逐渐走进了千家万户。巨大的通信网络对当前的通信设备和业务提出了更高的要求,如何运用已知的通话记录数据改善通信设施和促进通信业务是通信公司面临的重大难题。
本文通过对300个用户连续10天的通话数据进行分析和处理,运用模糊聚类分析的基本知识,结合通话过程中实际状况,并使用MATLAB编程,建立了有效的数学模型,得到了合理的分类结果,并给出了对通信设施的具体改进建议。
针对问题1,模型一:只考虑每个用户10天总的通话时长,把用户分为高端,中端,低端3类。模型二:按照通话时长把用户分为较长,中等,较短用户,然后根据主叫多还是被叫多即主叫被叫的比值再分类,最终把用户分为6类。
针对问题2,假设公司推出的新业务是在一次通话中通话时长超过w分钟以后,降低收费为原来的b%。根据对三百个用户平均每次通话时间的分析,发现在某个时段的人数最为集中。占了总人数的71%,根据通信用户通信习惯及消费者行为分析,培养目标客户,提高客户的忠诚度,依赖度,进而实现通信公司的利润最大化
针对问题3,首先进行数据分类汇总,得到30个基站的使用率,同时综合考虑每个基站的地理位置和对基站使用的条件要求,对基站的合理性进行判断,对基站设施进行调整,去掉一些使用率低的基站,同时在使用率过高的基站附近增加新的基站,这样可以确保每一个基站都能被充分的利用,减少资源的闲置,又保证了通话质量。
关键词:聚类分析,通话时长,基站使用率
问题重述
通信技术的不断发展拉近了人与人之间的距离。电话作为主要的通信工具之一悄无声息地将我们联系在一起,形成一个巨大的社交网络。这个巨大的社交网络对当前的通信设备和业务提出了更高的要求。
如何利用现有的通话记录数据进行概括分析,以便做出合理的决策,进而改善通信设施。拓展新的通信业务,依然是许多通信公司面临的难题。
附件给出了一家通信公司公布的2009年6月份某地300个用户10天内的通话记录,试回答下列问题。
1. 请根据这些通话记录信息建立数学模型以对用户分类,并说明运用此模
型对300个用户的分类结果。
2. 如果需要推出一款新的通信业务,如何合理选择部分用户作为首选推广
人群。说明你的理由,并撰写一份不超过两页的给公司经理的建议。
3 该地现有的通信设施(如基站等)建设情况是否合理。如需改进,请给出合理的建议。
问题的分析
对于问题1,目的是对通信用户进行合理的分类,首先就要确定分类指标和分类的明确界线,通话时长是判断用户消费量的有效指标,通话时间越长则话费越高,通信公司获利越多。建立两种模型,模型一,对数据进行处理后得到每个用户10天的总通话时长,并用Excel对数据进行排序和整合,做出图表和频数直方图,然后按照10天的总通话时长分为高端用户,中端用户,低端用户。模型二,主叫被叫的多少反映了用户的通话消费习惯,按照主叫被叫比与通话总时长综合考虑,用户可分为6类。
对于问题二,假设推出的新业务是通话时间超过W分钟后,每分钟话费为原来的b%,我们通过对数据处理分析得到每个用户平均每次通话时长,观察总体通话情况,发现总体平均通话时长附近恰是用户最集中的时段,故我们确定面向中端用户的推广方案。在方案实施中,我们以利润最大化为目标,采用所有用户都可参与且愿意享受优惠的标准,先得到通话时间在x分钟内占总人数的概率函数,再对函数积分分别计算原来和推广方案实施后的话费总收入。
对于问题3,对基站的合理性进行分析,并得出具体的改进措施。
对基站进行资源优化,首先分析每个基站的使用次数和通话总时长,使用率过高的基站处要增加新的基站,分担该基站的工作量,不是该基站过于繁忙,保证通话质量。同时对于那些基站比较多并且每个基站的使用次数少通话总时长短的区域,减少适当的基站仍能满足通话需求,过多的基站反而是资源的一种浪费。所以可以根据基站工作量和基站的地理位置综合考虑,具体分析,对基站进行合理的规划。
基站的工作量反映在通话时长,根据数据可知1个用户的总通话时长与总次数成正相关关系,并且总次数代表使用频繁度,所以用总通话次数代表基站的使用效率。
四、模型的假设与符号说明
模型的假设:
(1)假设6月1号—10号是平常的10天,没有特殊日子。
(2)假设主叫之间是相互独立的,被叫之间也是相互独立的
(3)不考虑漫游费的影响。
(4)假定对被叫不收取电话费。
(5)基站的信号可以覆盖邻近的区域
(6)假设每个基站所能容纳的通话个数为W,并且在基站附近的主叫人数大于W时,若不增加基站就会影响通话质量
符号说明:
(1) i表示记录的用户者的编号
(2) k
i
表示用户i在10天内的总共的通话时长
(3) y表示基站的编号,y=1,2,3, (30)
(4) m
i
表示10天内的主叫为i的总次数
(5) n
i
表示10天内的被叫为i的总次数
(6) a为主叫比被叫的值
(7) 为主叫每分钟通话话费
(8) R为用户总人数
五、模型的建立及结果
5.1,问题1模型的建立及结果
模型一:以主叫用户10天的通话总时长k
i
为标准分3类。(其数据见附表1)对300个客户10天内通话时长进行分类,统计,求和,得到如下的处理结果:
由上表可知:时长k
i >=5000 有53人,此类为高端用户;时长3000<=k
i
<5000
有167人,此类为中端用户;时长k
i
<3000有80人,为低端用户。人数在通话时长上概率基本服从正态分布。
通话时长在每个分段上的频率直方图如下: