自相似网络流量生成算法研究

合集下载
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

hancing the ability against intrusion.Network simulation is the most useful way of studying network under the large—scale condition.
So it is important to generate network traffic correctly.Recent network traffic studies demonstrate that network traffic is self-similar.
(1)计算N个点的咄)值 (2)将‰置为一个从正态分布N(O,vo)中选择的值。 (3)置No==0 (4)置Do=J
f51让k循环k:l…N (6)M=,(豇)一∑m¨r(k一,)
(7)皿=q一。一^甍,/皿一。 (8)①。=M,皿 (9)让j循环,-,=1,.,k一1 (10)m々=中¨。』一m廿m女-1,t一, (11)mk=艺①H墨.J
为:,c豇,=;:;导;::端,其中d=H一。.s; 其中‰是{x。J的相关系数的第j部分,而‰是线性回归系
数的一部分。为了产生流量,必须知道自相关函数r(k),定义
z;2{zJ if 0</≤%
l乏一,/f"/2<I,<”
其中。表示的是‰的共轭复数。 列(t}。
参见图1-c。
从自相关函数为rfk)的自相似的高斯过程产生一个长为n 的序列{X0,五,…,Xn一,)算法如下
万方数据
mg控lll邮局订阅号:82—946 360元,年一219一
Байду номын сангаас
软件时空
中文核心期刊《微计算机信息》(管控一体化)2008年第24卷第2-3期
来产生这些人工合成的自相似流量。本文选取了三种典型的算 法利用matlab仿真实现,比较其优缺点,并选择一种最优算法 应用在NS2流量产生器中。它们分别是生成F—ARIMA的 hosking算法,生成分形布朗运动(FBM)的RMD算法,生成分形 高斯噪声(FGN)的快速傅立叶变换方法(FFT)。它们的做法都 是生成一个满足自相似规律的标准序列,然后再赋予实际的网 络参数,通过不改变自相似结构的线性变换,来生成具有实际 意义的自相似流量。
z[(口+6)/2]=l/2(zH+z[b1)+rkG.假设这是第k次迭代,
是第n次计算中点的值。其中
唯=砉~’ro=,/1_2”。
3.3 FFT算法
,..、
(1)构造一个序列{五,..。呦,这里乃=于(等;H),对应于
一个FGN过程的功率谱从2叱一直到竹的部分。
(2)对每个{{:}乘以一个均值为1的独立的指数随机变量,使
3.1 hosking算法 hosking算法主要思想是从一个自相似的高斯过程产生合 成流量。让x来表示一个高斯过程,均值m=0。那么给定x。,X卜 知x协…,Xo的条件下,x。的均值和方差为:
mI=E(五l hmxkⅢ…,xo)=∑m灯h.,
u=var(G l‘一;,t一,..,%)=d2H(t-G)
3自相似流量的生成算法研究
目前已经发展的具有自相似性的数学模型有小波模型和 分形和多重分形模型。其中分形理论包括如下模型:1.分形高斯 噪声FGN(fractional Gaussian noise):2.分形布朗运动FBM (fractional Brownian motion),它是分形高斯噪声的增量和过程; 3.分形自回归滑动平均过程F—ARIMA(Fractional AutoRegres. sive Integrated Moving—Average).它是一种满足渐进自相似过程 的模型。但是很难直接从它们生成流量,因此发展了很多算法
f121 y^=(1一。磊儿一l
(13)从Ⅳ(%,Vt)中选择xk
3.2 RMD算法
RMD(随机中点位移)算法:生成分形布朗运动(FBM),
RMD算法的基本思想就是不停的向内二等分.迭代的分割区
间[0,即,每一次分割时,通过区间的端点的值来计算中点的值。
例如把区间[a’b】分割成两个区间a,(a+b)/2】,【(a+b)/2,b1,并计算中 点(a+b)/2的值:
I lM 32768 0 2030
65536 4jll00
1 4M 65536 Oj900
l-a运行时间图
软件时空
量和Otcl中的变量进行了绑定,上面提到的成员变量在Otcl
中都有对应的同名变量。init()中将文件中的FGN序列读到数
组idft_sequence中.读入序列后,将之转化为有实际意义的序 列.这样的变换不改变序列的自相关结构.变换后的序列
2 自相似性简介
从直观图形上,自相似性指的就是一个事物的局部放大后 和整体相同或者相似。这是一种无限细致的结构,常见的满足 自相似性质的事物有雪花,海岸线等。它也有严格的数学定义, 以及相应的检验方法。 梁智涛:硕士研究生 基金项目:面向高速网络的流量建模研究[60573134) 国家自然科学基金
2.1自相似性的数学定义 自相似性是从序列在不同时间尺度上的统计特性来定义 的。即对序列在不同时间尺度上堆叠,得到的统计参数相同。对 于随机过程x(f),自相关函数定义为:
idft~sequence[i]可能不是整数,需要四舍五入,实验表明,不影
响结果。stop()i函数和父类中的stopO函数的区别就在于它多了
一条语句,用来释放存放FGN序列的数组。command()i蜀数直 接调用其父类的command()函数。
4.3实验结果
选择参数n=10000,mean_=5000,peakedness_=800。计算 得均值、标准差如下:mean=5000,std=800。这是由于该FGN序
摘要:大规模汇聚流量的研究在当前的网络环境下起着越来越重要的作用.无论在改善网络性能还是在提高网络入侵的防
御能力方面。在大流量的限制条件下,网络模拟成为研究网络的主要手段.准确生成网络流量变得重要。当前网络研究表明
流量满足自相似特征.但目前还没有直接产生自相似流量的流量产生器。本文通过从多种自相似生成的数学手段入手,通
由于其高效性和方便性,网络模拟始终是一个进行网络研 究的一个重要手段。当前最出色的网络模拟工具NS2并不直接 提供产生自相似流量产生器,很多关于自相似流量的性质研究 都采用合成多个ON/OFF模型的方法来产生自相似流量,此方 法开销相当大。缺少合适的流量产生器使得网络模拟变得不够 真实和方便。本文通过研究比较产生自相似流量的几种模型和 算法,分析每种方法的优劣,从而选择一种效率最高,效果最好 的一种算法。进而在NS2上实现该流量产生器,使得今后的网 络模拟中可以直接调用高效的自相似流量产生器。
2.2自相似性的判定 Humt参数H是衡量自相似性的唯一参数,H的取值范围 是0.5<H<=1,H越大表示自相似程度越高。判断自相似性有两 种常用方法:方差时间曲线图和R/S统计图。实验表明,方差时 间曲线图的效率要远高于R/S统计图。本文主要采用该方法进 行后文的比较。对自相似过程的聚集时间序列x(m)当m很大 时,方差满足:var()【呻~Var(X)/mB其中:B=2。(1一H),两边取对数 可得:log[Va“x呻】~log[Vat(X)]一13log(m)。将Var()【呻作为m的函 数在对数一对数图上唇出来,将得到一条斜率为一13的直线,若 0<13<1则意味着此序列具有自相似性。由直线可得到大致斜 率.进而可估计H的近似值。
之“模糊”,得到序列{Z}。
(3)构造复数序列{z1,.-·欲},Iz,|_√Z,zi的相位为0到2叮r
的均匀分布。


(4)构造扩大版的l毛…‘欲j为{《,...曩t}:
O(n2)。RMD算法的空间复杂性为0(n),需要一个n维数组来存
4 NS中自相似流量产生器的实现
4.1生成FGN序列 本文使用前面介绍的FFT算法在linux下产生FGN序列. 这里需要使用标准科学库gsl来实现一些数学功能,比如说
Hurst参数不变。next_interval0是最重要的一个函数,它用来计 算发下一个包的时间。由于每个时间间隔是能测量到最小时
间间隔,所以其内部的序列如何分布,不影响外部的测量结
果,因此在每个单位时间间隔内,发包时间是平均分配的。在
第i个时间单位中匀速发出idft_sequence[i】i个数据包,这里
But there is no simple tool for generating self-similar traffic.This paper compares several math methods generating self"similar traf-
tic,and concludes that Fast Fourier Transform is the best after the experiment comparison.Finally we implement a self-similar traffic
过实验比较得出快速傅立叶变换方法性能最优。并在ns2中实现了自相似流量产生器。
关键字:自相似;流量生成器;快速傅立叶变换;网络模拟
中图分类号:TP393.01
文献标识码:A
Abstract:The Study of large—scale integrating network traffic plays a very important role in both improving the performance and en-
500 5780 3 2048 0 9690
1024 00l∞
2048 O0310
1000 11125
12 4096 2 0310
4096 0 0780
1500 37.03I
35 8192 42970
8192 00940
2000 85 907
6I 16384 91090
163S4 01410
32768 19 39lO
列是由均值0.方差1的标准序列线性转化的,因此均值和方
差可以准确的满足要求。随着Hurst参数增大,整体波动性增
大。图2表明除了个别序列的Hurst参数与目标参数(如H=
文章编号:1008--0570(2008)02—3-0219—03
软件时空
自相似流量生成算法研究
The Study of AIgorithms Generating Self-similar Traffic
(哈尔滨工业大学计算机网络与信息安全技术中心)梁智涛 何 慧 李斌
LIANG ZHITAO HE HUl Ll BIN
一220—360元,年邮局订阅号:82—946
万方数据
gamma亟i数,逆傅立叶变换等。 表1各算法cpu运行时间与内存占用情况
h僻kmg RMD
F丌
cpu—time(s) memo吲M)
epu time(s) raemor-AM)
epu_tline(s)
me删-r(U)
100 n0790
1024 0 4690
r(k)=EI(x,一卢)(置+。一p)l EI(x,一_“)2 I。对平稳随机过程x
进行堆叠,产生的时间序列为x(…):x!“):k:1,2,3…其中
碰叫=虼(瓦…。+…瓦),k=l,2,3…如果x(m)的自相关函数
“m)满足,(…’fk):r(后1,对所有m=l,2,3…限=l,2,3…),则称随机 过程x(m)自相似。
generator in NS2.
Fomer Key words:serf-similar,traffic generator,Fast
Transform,Network Simulation
1 引言
网络流量的研究对于改进网络结构,提高网络性能。进行 入侵检测,提高网络安全性方面等都有重要的作用。随着网络 的愈加复杂以及网络应用种类的不断增多,当前的网络流量构 成越来越复杂。传统的网络流量模型如排队模型、泊松流模型、 Markov链模型等无法准确的描述当前的网络流量。上个世纪 90年代初,Will E.Leland首先通过观测.发现局域网流量呈现 自相似特性.之后Paxson等人通过观测广域网及各种应用,发 现自相似性普遍存在于网络流量中.甚至在无线网络中同样具 有自相似性。如何准确的刻画这些自相似的特性,并研究其对 网络性能带来的影响,就成为了当前研究的一个热点和难点。
相关文档
最新文档