Pareto分布模拟自相似流量的仿真研究
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Pareto分布模拟自相似流量的仿真研究
作者:付钰田野刘立士池云
来源:《科技资讯》2017年第22期
DOI:10.16661/ki.1672-3791.2017.22.004
摘要:大量研究表明,计算机和通信系统都会出现重尾特性。
Pareto分布是最具有代表性的重尾分布。
许多服从Pareto分布的ON/OFF源叠加以后可以模拟以太网通信量,重尾分布可以用来反映以太网ON/OFF源的真实情况。
该文在许多相关研究的基础之上,进一步探讨了关于Pareto分布的一些性质,根据ON/OFF源发包服从Pareto分布的特性,利用Matlab对自相似流量的产生进行了仿真。
关键词:Pareto分布自相似流 Matlab仿真
中图分类号:TP391 文献标识码:A 文章编号:1672-3791(2017)08(a)-0004-02
互联网业务流量具有长相关、突发性、自相似性、包长度和包地址分布不均匀性等主要特性。
传统网络流量大部分使用自回归模型、泊松过程来产生业务流量模型,在这些基础上产生的网络流量,通常在时间轴上只呈现出短相关特性,当时间尺度增大到一定的程度时,网络业务流量呈现出稳定趋势,Pareto分布由于其良好的性质受到了研究者的重视。
另外,建立一种参数可调的具有自相似特性的业务模型来进行仿真研究是很有必要的,所以,该文采用了一种参数可调的模型利用Matlab对网络流量的产生进行了仿真,对以后的研究具有一定的积极意义。
1 自相似过程
自相似过程是一种随机过程,是指时间或空间特性的改变不影响其统计特性的改变。
通常可以有以下几种定义[1]:严格自相似过程、二阶自相似过程、广义的二阶平稳自相似过程和渐进二阶自相似过程。
自相似具有伸缩对称性的特性,即线性或非线性变换下的不变性。
对分形对象进行放缩或者剪切等操作时,只能改变其外部的表现形式,而表征自相似特性的参数即分形维度是不会发生任何改变的。
自相似作为分形的基本特征,指的是复杂系统的整体与部分,一部分与其他部分之间在性质上或者精细结构上所具有的自相似性。
自相似过程主要有以下几个特点[2]。
1.1 长相关性
对于自相似过程,其当前的时间序列与之前的时间序列值有着不可忽视的相关性,即该时间序列是具有长相关特性的。
1.2 聚集方差衰减缓慢
自相似过程的聚集过程方差衰减速度比m-1小,而对于短相关过程,其聚集过程的方差衰减速度与m-1相同。
1.3 赫斯特效应
对于长相关时间序列来说,其自相关性可以使用赫斯特指数来描述。
赫斯特指数表示时间序列的平均、回归或聚集的相关趋势。
若赫斯特指数,则,表示在样本中出现极端值的时间较长,也就是所谓的持续性。
如果网络流量的突发性可以用这种极端值的持续时间长短来表述,那么就可以用赫斯特指数来描述网络流量的突发性强度。
并且这种突发性不会因为聚集而被平滑掉。
1.4 幂指数特性的谱密度
将自相似过程放在频域上考虑,因为其具有持续性,所以在低频处的谱密度较大,在频率为0的位置附近,其功率谱密度函数服从幂指数函数。
2 Pareto分布的定义与性质
若随机变量T 的密度函数为:
,(x≥y)(1)
那么将T 称为是具有Pareto分布特性的随机变量,记为。
其中β代表形状参数或叫做Pareto指数,代表尺度性能参数或叫做门限参数。
Pareto分布的概率分布函数为[3]:
(2)
其中,α为分布的形状参数,β称为分布的位置参数。
当时α≤1,服从Pareto分布的随机变量具有无限均值;当α≤2时,服从Pareto分布的随机变量具有无限方差;当时,服从Pareto 分布的随机变量具有有限均值以及无穷方差。
Will linger等人的研究表明:许多服从Pareto分布的随机变量叠加起来的结果就是自相似过程。
3 源包模型
在自相似业务流的物理模型中,使用最多的是流叠加法[4]。
ON/OFF模型就是模拟大量用户数据源的叠加来产生自相似业务流的过程。
原理为:ON/OFF模型具有严格交替的ON周期和OFF周期,并且认为连续的ON周期和OFF周期独立同分布,并且互不相关。
当处于ON 周期时,数据源以恒定的速率发送数据包;当处于OFF周期时,不发送任何数据包,那么链路实际传输的数据包总数就是M个独立同分布的数据源相叠加而得到的。
4 仿真系统模型建立
该文利用Matlab对通过ON/OFF自相似业务流量模型产生的网络流量进行了仿真。
仿真模型框图如图1所示。
Matlab编程思路如下:首先假设有Nn个信源,然后设置仿真实验中涉及到的一些参数,接下来是信源的发包过程,处于ON状态发包,发包速率为R,发包持续时间服从Pareto分布,处于OFF状态不发包,所以到达的数据包个数就为处于ON状态的信源数与发包速率和每个信源发包持续时间之积。
仿真参数设置如下:信源数Nn=500,平均包到达率λ为0.5,其指数分布参数μ=1/λ,Pareto分布函数的参数设置如下:X=0.2,K=1.5,
σ=θ=1,发包速率R=10。
到达的数据包个数仿真图如图2所示。
从图2中可以看出,通过Pareto分布模拟出的网络业务流量具有突发性,并且具有长相关特性,而传统的泊松分布只呈现出短相关特性。
其次,我们是通过设置参数来进行仿真的,所以我们可以通过改变参数来观察网络流量的变化。
5 结语
该文介绍了Pareto分布的性质以及源包到达模型的建立过程,并采用了基于Pareto分布的ON/OFF源,通过Matlab仿真,模拟了网络流量的生成过程。
其次,该文是建立了一个参数可调的模型来进行仿真,可以通过改变参数来进行仿真实验,对以后这方面的仿真研究具有一定的积极意义。
参考文献
[1] 王晓婷,王忆文,李平.一种自相似网络流量生成器的设计与实现[J].微电子学与计算机,2016(8):54-58.
[2] 褚立文,陈俊亮.一个新的自相似业务流在线生成算法[J].北京邮电大学学报,1999,22(1):43-47.
[3] 程红霞.自相似业务流的预测研究[D].电子科技大学,2006.
[4] 陈凯.自相似网络流量仿真与性能分析[D].北京交通大学,2009.。