一种基于时序统计分段的云计算网络流量预测方法及装置[发明专利]

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201711286862.5
(22)申请日 2017.12.07
(71)申请人 上海仪电(集团)有限公司中央研究

地址 200233 上海市徐汇区虹漕路39号4号
楼6层
(72)发明人 张鹏飞 
(74)专利代理机构 上海科盛知识产权代理有限
公司 31225
代理人 赵继明
(51)Int.Cl.
H04L 12/24(2006.01)
H04L 12/26(2006.01)
(54)发明名称
一种基于时序统计分段的云计算网络流量
预测方法及装置
(57)摘要
本发明涉及一种基于时序统计分段的云计
算网络流量预测方法,对云计算网络中的虚拟机
进行分时段的资源占用量统计,根据统计结果建
立马尔科夫状态模型,根据模型进行下一时段的
网络流量预测。

与现有技术相比,本发明对于非
周期性的网络行为,通过对网络边界带宽监控的
结果进行时序数据分析和预测,识别出网络中不
同业务的流量特性以及时序趋势,进而判断出未
来一段时间内的网络“相邻流量干扰”隐患的可
能性,从而优化资源调整策略,避免过于频繁的
调度和调整。

权利要求书1页 说明书3页 附图2页CN 109905255 A 2019.06.18
C N 109905255
A
1.一种基于时序统计分段的云计算网络流量预测方法,其特征在于,对云计算网络中的虚拟机进行分时段的资源占用量统计,根据统计结果建立马尔科夫状态模型,根据模型进行下一时段的网络流量预测。

2.根据权利要求1所述的一种基于时序统计分段的云计算网络流量预测方法,其特征在于,所述的资源占用量包括流量和/或带宽占用率。

3.根据权利要求1所述的一种基于时序统计分段的云计算网络流量预测方法,其特征在于,包括以下流程:
流量统计,统计服务器节点中虚拟机的流量随时间的变化,得到流量-时间序列;
序列分段,对于流量-时间序列,采用滑动窗口机制,将窗口内未分段的序列进行分段,使每段的资源占用量统计特性差异不小于设定阈值,然后窗口滑动至当前时间点,继续对未分段的序列进行分段;
序列统计,对已分段的序列,进行基于分段的网络带宽占用率特征统计,得到每个虚拟机在其相应时间段内的不同网络带宽区间的占用时间比率;
分段预测,根据时间段内的统计特征,描绘每个用户、每个虚拟机的状态转移特性,构建状态转移的隐藏马尔科夫模型,根据建立好的模型,进行下一个时段的预测,预测内容包括时长和资源占用量。

4.根据权利要求3所述的一种基于时序统计分段的云计算网络流量预测方法,其特征在于,所述的序列分段中,采用自顶向下的序列分段法,具体为:先将序列分为两段,使两段之间的统计特性差异最大,然后对每段进行递归分段,直到两段之间的统计特性差异达到设定范围。

5.一种基于时序统计分段的云计算网络流量预测装置,其特征在于,包括:
流量统计模块,统计服务器节点中虚拟机的流量随时间的变化,得到流量-时间序列;序列分段模块,对于流量-时间序列,采用滑动窗口机制,将窗口内未分段的序列进行分段,使每段的资源占用量统计特性差异不小于设定阈值,然后窗口滑动至当前时间点,继续对未分段的序列进行分段;
序列统计模块,对已分段的序列,进行基于分段的网络带宽占用率特征统计,得到每个虚拟机在其相应时间段内的不同网络带宽区间的占用时间比率;
分段预测模块,根据时间段内的统计特征,描绘每个用户、每个虚拟机的状态转移特性,构建状态转移的隐藏马尔科夫模型,根据建立好的模型,进行下一个时段的预测,预测内容包括时长和资源占用量。

6.根据权利要求5所述的一种基于时序统计分段的云计算网络流量预测装置,其特征在于,还包括置信区间检测模块,对预测结果进行实时的统计检验,所得比对结果反馈输入至分段预测模块中。

权 利 要 求 书1/1页CN 109905255 A
一种基于时序统计分段的云计算网络流量预测方法及装置
技术领域
[0001]本发明涉及一种网络流量预测方法,尤其是涉及一种基于时序统计分段的云计算网络流量预测方法及装置。

背景技术
[0002]由于云计算环境中承载的业务和应用种类繁多,且不同应用对于网络资源的需求各不相同,特别的,在如今多应用共存的云计算环境中,一个突出的问题是“相邻流量干扰”(Noisy Neigbour)问题,即在共享资源的同时,由于资源的隔离和调度不够完善,导致有些应用在产生大量资源需求或生成大量网络流量的时候会对相邻和相关的其他应用产生干扰,影响其他应用的性能稳定性。

[0003]为了解决相邻流量干扰在网络资源上对其他用户的影响,目前的应对方法主要有虚机调度、网络调度、资源隔离等方式,但这些都有一定的时间开销,即不能做到对网络变化的实时响应,同时也可能对网络性能本身产生一定的影响,例如虚拟机迁移本身会需要一定的网络带宽,因此不能频繁进行调整。

[0004]因此,在实际运营中希望能够对未来一定时间之内的网络流量和干扰流量情况进行一定的预测,从而优化资源调整策略,避免过于频繁的调度和调整。

发明内容
[0005]本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于时序统计分段的云计算网络流量预测方法及装置。

[0006]本发明的目的可以通过以下技术方案来实现:
[0007]一种基于时序统计分段的云计算网络流量预测方法,对云计算网络中的虚拟机进行分时段的资源占用量统计,根据统计结果建立马尔科夫状态模型,根据模型进行下一时段的网络流量预测。

[0008]所述的资源占用量包括流量和/或带宽占用率。

[0009]进一步的,所述的方法包括以下流程:
[0010]流量统计,统计服务器节点中虚拟机的流量随时间的变化,得到流量-时间序列;[0011]序列分段,对于流量-时间序列,采用滑动窗口机制,将窗口内未分段的序列进行分段,使每段的资源占用量统计特性差异不小于设定阈值,然后窗口滑动至当前时间点,继续对未分段的序列进行分段;
[0012]序列统计,对已分段的序列,进行基于分段的网络带宽占用率特征统计,得到每个虚拟机在其相应时间段内的不同网络带宽区间的占用时间比率;
[0013]分段预测,根据时间段内的统计特征,描绘每个用户、每个虚拟机的状态转移特性,构建状态转移的隐藏马尔科夫模型,根据建立好的模型,进行下一个时段的预测,预测内容包括时长和资源占用量。

[0014]所述的序列分段中,采用自顶向下的序列分段法,具体为:先将序列分为两段,使
两段之间的统计特性差异最大,然后对每段进行递归分段,直到两段之间的统计特性差异达到设定范围。

[0015]一种基于时序统计分段的云计算网络流量预测装置,包括:
[0016]流量统计模块,统计服务器节点中虚拟机的流量随时间的变化,得到流量-时间序列;
[0017]序列分段模块,对于流量-时间序列,采用滑动窗口机制,将窗口内未分段的序列进行分段,使每段的资源占用量统计特性差异不小于设定阈值,然后窗口滑动至当前时间点,继续对未分段的序列进行分段;
[0018]序列统计模块,对已分段的序列,进行基于分段的网络带宽占用率特征统计,得到每个虚拟机在其相应时间段内的不同网络带宽区间的占用时间比率;
[0019]分段预测模块,根据时间段内的统计特征,描绘每个用户、每个虚拟机的状态转移特性,构建状态转移的隐藏马尔科夫模型,根据建立好的模型,进行下一个时段的预测,预测内容包括时长和资源占用量。

[0020]所述的装置还包括置信区间检测模块,对预测结果进行实时的统计检验,所得比对结果反馈输入至分段预测模块中。

[0021]与现有技术相比,本发明对于非周期性的网络行为,通过对网络边界带宽监控的结果进行时序数据分析和预测,识别出网络中不同业务的流量特性以及时序趋势,进而判断出未来一段时间内的网络“相邻流量干扰”隐患的可能性,从而优化资源调整策略,避免过于频繁的调度和调整。

[0022]对于流量-时间序列,采用滑动窗口机制和自顶向下的序列切分法,实现了动态的模型建立过程,获得了相互之间差异较大的状态变量,能够精准的找到实际租户行为对网络流量的影响阶段和关键时间点,提高模型预测的准确性。

附图说明
[0023]图1为本实施例预测装置的结构原理图;
[0024]图2为本实施例时间序列处理算法流程。

具体实施方式
[0025]下面结合附图和具体实施例对本发明进行详细说明。

本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

[0026]实施例
[0027]如图1所示,一种基于时序统计分段的云计算网络流量预测装置,包括:[0028]流量统计模块1,部署在云计算各服务器节点内,统计服务器节点中每个虚拟机的收发流量随时间的变化,得到每个虚拟机网络带宽占用量随时间的精准变化时间序列;[0029]序列分段模块2,对于流量-时间序列,采用滑动窗口机制,将窗口内未分段的序列进行分段,使每段的资源占用量统计特性差异不小于设定阈值,然后窗口滑动至当前时间点,继续对未分段的序列进行分段;
[0030]序列统计模块3,基于学习到的时间分段结果,对于时间序列进行基于分段的网络
带宽占用率特征统计,得到每个虚拟机在其相应时间片内的不同网络带宽区间的占用时间比率;
[0031]分段预测模块4,根据时间片内的网络流量统计特征,描绘每个租户、每个虚拟机的状态转移特性,构建其应用使用情况状态转移的隐藏马尔科夫模型,并依据此模型预测下一个时间分段的时长、状态标签以及对应的网络流量统计概率分布;
[0032]置信区间检测模块5,对预测结果进行实时的统计检验,所得比对结果反馈输入至分段预测模块4中,同时,对于目前的预测结果给出基于现有模型的置信区间评估。

[0033]一种基于时序统计分段的云计算网络流量预测方法,包括以下流程:
[0034]流量统计,统计服务器节点中虚拟机的流量随时间的变化,得到流量-时间序列;[0035]序列分段,对于流量-时间序列,采用滑动窗口机制,将窗口内未分段的序列进行分段,使每段的资源占用量统计特性差异不小于设定阈值,然后窗口滑动至当前时间点,继续对未分段的序列进行分段;具体的,采用自顶向下的序列分段法,具体为:先将序列分为两段,使两段之间的统计特性差异最大,然后对每段进行递归分段,直到两段之间的统计特性差异达到设定范围,这样可将持续变化的时间序列实时划分为带宽占用统计特征差别明显的不同阶段,能够精准的找到实际租户行为对网络流量的影响阶段和关键时间点;[0036]序列统计,对已分段的序列,进行基于分段的网络带宽占用率特征统计,得到每个虚拟机在其相应时间段内的不同网络带宽区间的占用时间比率;
[0037]分段预测,根据时间段内的统计特征,描绘每个用户、每个虚拟机的状态转移特性,构建状态转移的隐藏马尔科夫模型,根据建立好的模型,进行下一个时段的预测,预测内容包括时长和资源占用量。

[0038]如图2所示,本实施例所提供的时间序列处理流程与方法主要包括如下步骤:[0039] 1.对于输入的时间序列,采用滑动窗口机制,将滑动窗口内已分段的序列部分从窗口中剔除,将窗口向前滑动读入时序数据;
[0040] 2.对于某个时刻的特定滑动窗口,采用自顶向下的窗口切分算法,将窗口切分为两段,使得两段之间的流量统计特性差异最大。

切分后对每段进行递归切分,直到两段之间流量差异特性小于给定阈值为止
[0041] 3.切分完成后,除最后一段时间序列以外,前面所有分段时间序列归档进入统计信息存储;时间窗口滑动至当前时间序列点,重新进行步骤2.
[0042] 4.对于已经归档的时间片统计信息,建立时间片状态转移模型,以方便长期预测。

图1
图2。

相关文档
最新文档