基于大数据的移动用户行为分析研究
合集下载
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
收稿日期:2019-05-06
话到达的分布情况,以每一分钟为间隔统计到达次数,假设 这一天内通话到达是满足泊松分布的,泊松分布的参数 λ 表 示意义为单位时间内(每分钟)用户到达次数,则在假设的 前提下,计算得到 λ=1.2167,实际分布和泊松分布如图 1 所示,可以看出二者相差比较大,即假设不成立,不满足泊 松分布。
Abstract:Based on mobile big data,this paper studies the call arrival condition (times) of users. Due to the time regularity of people’s living habits,the homogeneous poisson process is not completely suitable for the call arrival rule of the base station. Therefore,this paper introduces the non-homogeneous poisson process to solve the deficiency of the homogeneous poisson process to some extent. According to the arrival condition of the user’s call,the non-homogeneous compound poisson process is proposed to estimate the total time of a base station’s call in a certain period of time,so as to provide a basis for the reasonable scheduling and resource allocation of the base station according to the call flow.
1 泊松过程
1.1 齐次泊松过程 CDR(Call Detail Record)数据集来自北京移动,采 集 10000 个活跃用户(每月通话时间大于 100 分钟),共 2453238 条记录,时间跨度为 2017 年 11 月 1 日~ 2017 年 11 月 30 日,每条记录有 6 个属性。考虑一天内某一基站通
λ 值。如图 2 所示为四个时间段(09:00 ~ 09:59、10:
00 ~ 10:59、11:00 ~ 11:59、12:00 ~ 12:59) 的 通
话到达情况,发现它们基本服从泊松分布,且通话平均到达
Keywords:user behavior;call arrival;nonhomogeneous poisson process;compound poisson process
0引言
移动流量数据最近几年呈井喷之状。据统计,过去 10 年增长了 4000 倍,在 2017 年底,平均每月全球移动流量达 到了 9.9EB[1]。移动运营商收集的这些流量数据对于了解人 们生活习惯是一笔宝贵的信息资源,关于对它的分析可以涉 及许多领域,如都市生活、交通运输和社会网络 [2] 等方面。 本文对大量移动用户的通话到达过程进行研究。早在 1909 年 Arlang[3] 把泊松分布成功应用到了通话到达模型中,齐 次泊松过程在移动通信网络中也被广泛采用 。 [4,5] 例如, Merve[6] 采用了齐次泊松过程,没有考虑时间变化性,而实 际上,白天和晚上的通话到达数量是完全不一样的。因此, 对一天内的用户流量分析,采用齐次泊松过程已不科学。本 文提出采用非齐次泊松过程及其相对应的混合泊松过程来解 决现实问题。
摘 要:基于移动大数据,本文对用户通话到达情况(次数)进行了研究。由于人们生活习惯具有时间规律性,齐次的泊
松过程不能完全适合基站的通话到达规律,因此本文引入非齐次泊松过程,在一定程度上解决了齐次泊松过程的不足。根据用户
通话到达情况,提出采用非齐次复合泊松过程来估算一段时间某一基站通话总共的时间,从而根据通话流量为基站的合理调度、
分配资源提供依据。
关键词:用户行为;通话到达;非齐次泊松过程;复合泊松过程
中图分类号:TP274
文献标识码:A
文章编号:2096-4706(2019)12-0058-03
Research on Mobile User Behavior Analysis Based on Big Data
WANG Changhui1,MA Qingli2 (1.Unit 31431,Shenyang 110000,China;2.University of Science and Technology of China,Hefei 230026,China)
0.7
0.6
0.5
0.4
概率
0.3
0.2
来自百度文库0.1
0 0 1 2 34 5 67 8 9
每分钟用户到达数(时间 00:00-23:59)/ 小时
实际用户到达分布
泊松分布(λ=1.2167)
图 1 某基站一天中每分钟用户通话到达次数分布 这是不难理解的,因为泊松分布潜在的含义是:在固定 时间 t 的平均到达人数为 λt,而实际的事实是,在凌晨通话
2019 年 6 月 25 日 第 3 卷 第 12 期
现代信息科技 Modern Information Technology
Jun.2019 Vol.3 No.12
基于大数据的移动用户行为分析研究
王长会 1,马庆利 2
(1.31431 部队,辽宁 沈阳 110000;2. 中国科学技术大学,安徽 合肥 230026)
58 2019.6
王长会,等:基于大数据的移动用户行为分析研究
第 12 期
到达人数和上午是完全不一样的。因此可以考虑短时(1 小
时)通话行为分布。
进行短时间内通话到达行为分析,采取 1 小时的样本进
行分析,统计在此期间的每分钟内通话到达次数,假设一小
时内通话到达是满足泊松分布的,则在假设前提下可计算出
话到达的分布情况,以每一分钟为间隔统计到达次数,假设 这一天内通话到达是满足泊松分布的,泊松分布的参数 λ 表 示意义为单位时间内(每分钟)用户到达次数,则在假设的 前提下,计算得到 λ=1.2167,实际分布和泊松分布如图 1 所示,可以看出二者相差比较大,即假设不成立,不满足泊 松分布。
Abstract:Based on mobile big data,this paper studies the call arrival condition (times) of users. Due to the time regularity of people’s living habits,the homogeneous poisson process is not completely suitable for the call arrival rule of the base station. Therefore,this paper introduces the non-homogeneous poisson process to solve the deficiency of the homogeneous poisson process to some extent. According to the arrival condition of the user’s call,the non-homogeneous compound poisson process is proposed to estimate the total time of a base station’s call in a certain period of time,so as to provide a basis for the reasonable scheduling and resource allocation of the base station according to the call flow.
1 泊松过程
1.1 齐次泊松过程 CDR(Call Detail Record)数据集来自北京移动,采 集 10000 个活跃用户(每月通话时间大于 100 分钟),共 2453238 条记录,时间跨度为 2017 年 11 月 1 日~ 2017 年 11 月 30 日,每条记录有 6 个属性。考虑一天内某一基站通
λ 值。如图 2 所示为四个时间段(09:00 ~ 09:59、10:
00 ~ 10:59、11:00 ~ 11:59、12:00 ~ 12:59) 的 通
话到达情况,发现它们基本服从泊松分布,且通话平均到达
Keywords:user behavior;call arrival;nonhomogeneous poisson process;compound poisson process
0引言
移动流量数据最近几年呈井喷之状。据统计,过去 10 年增长了 4000 倍,在 2017 年底,平均每月全球移动流量达 到了 9.9EB[1]。移动运营商收集的这些流量数据对于了解人 们生活习惯是一笔宝贵的信息资源,关于对它的分析可以涉 及许多领域,如都市生活、交通运输和社会网络 [2] 等方面。 本文对大量移动用户的通话到达过程进行研究。早在 1909 年 Arlang[3] 把泊松分布成功应用到了通话到达模型中,齐 次泊松过程在移动通信网络中也被广泛采用 。 [4,5] 例如, Merve[6] 采用了齐次泊松过程,没有考虑时间变化性,而实 际上,白天和晚上的通话到达数量是完全不一样的。因此, 对一天内的用户流量分析,采用齐次泊松过程已不科学。本 文提出采用非齐次泊松过程及其相对应的混合泊松过程来解 决现实问题。
摘 要:基于移动大数据,本文对用户通话到达情况(次数)进行了研究。由于人们生活习惯具有时间规律性,齐次的泊
松过程不能完全适合基站的通话到达规律,因此本文引入非齐次泊松过程,在一定程度上解决了齐次泊松过程的不足。根据用户
通话到达情况,提出采用非齐次复合泊松过程来估算一段时间某一基站通话总共的时间,从而根据通话流量为基站的合理调度、
分配资源提供依据。
关键词:用户行为;通话到达;非齐次泊松过程;复合泊松过程
中图分类号:TP274
文献标识码:A
文章编号:2096-4706(2019)12-0058-03
Research on Mobile User Behavior Analysis Based on Big Data
WANG Changhui1,MA Qingli2 (1.Unit 31431,Shenyang 110000,China;2.University of Science and Technology of China,Hefei 230026,China)
0.7
0.6
0.5
0.4
概率
0.3
0.2
来自百度文库0.1
0 0 1 2 34 5 67 8 9
每分钟用户到达数(时间 00:00-23:59)/ 小时
实际用户到达分布
泊松分布(λ=1.2167)
图 1 某基站一天中每分钟用户通话到达次数分布 这是不难理解的,因为泊松分布潜在的含义是:在固定 时间 t 的平均到达人数为 λt,而实际的事实是,在凌晨通话
2019 年 6 月 25 日 第 3 卷 第 12 期
现代信息科技 Modern Information Technology
Jun.2019 Vol.3 No.12
基于大数据的移动用户行为分析研究
王长会 1,马庆利 2
(1.31431 部队,辽宁 沈阳 110000;2. 中国科学技术大学,安徽 合肥 230026)
58 2019.6
王长会,等:基于大数据的移动用户行为分析研究
第 12 期
到达人数和上午是完全不一样的。因此可以考虑短时(1 小
时)通话行为分布。
进行短时间内通话到达行为分析,采取 1 小时的样本进
行分析,统计在此期间的每分钟内通话到达次数,假设一小
时内通话到达是满足泊松分布的,则在假设前提下可计算出