网络可生存性技术研究综述_杨威
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0引言
随着因特网技术的日益成熟,IP(Internet protocol)网络逐渐成为承载数据、语音、图像、视频等多业务的统一核心平台,这就要求IP网络达到电信级的稳定性。
现有IP网络架构是由大量不稳定的器件组成的大规模的、松耦合的、复杂的分布式系统,美国加利福尼亚大学洛杉矶分校计算机科学研究部的技术报告指出:在4个月的时间里,在Sprint公司的一个重要的自治域中,20%的链路是小于1天的平均故障间隔时间,70%的链路是小于10天的平均故障间隔时间;0.2%到1%互联网路由表由于管理员的误操作而配置错误[1]。
本文介绍了纯IP网络的生存性技术,详细分析了其优缺点,并与光层生存性技术进行了分析对比。
最后就如何能更好的融合两层的生存性技术提出了跨层的生存性技术策略,并设计了IP over ASON(automatic switched optical network)进行跨层保护恢复的架构。
1网络可生存性的定义
网络可生存性[2]是指大规模无边界网络系统在遭遇攻击、故障或事故时,及时通过自我适应、重新配置、恢复、进化而具有的执行或维持关键服务的能力。
网络故障恢复的一般过程包括故障检测与定位、故障通告、业务恢复、故障修复、业务复原。
2IP层网络生存性技术
目前的IP层生存性技术主要包括:双向故障检测(bidirec-tional forwarding detection,BFD)、路由快速收敛、双路由器备份等技术。
BFD技术显著提高了故障检测和定位的时间;内部网关协议(interior gateway protocol,IGP)收敛和加速RIB/FIB更新提高了路由收敛的速度;为了避免由于路由器单点故障而产生的孤岛现象,边缘网络采用多宿主(Multi-Homing)机制,即单一边缘网络与多个ISP相连。
收稿日期:2010-07-20;修订日期:2010-09-25。
2.1
BFD 技术
BFD [3]是一套用来实现快速故障检测的国际标准协议,提供一种短时延、低开销的检测。
它独立于媒介,数据协议和路由协议。
可以作为适合媒介和协议的有效载荷。
通过周期性地发送BFD 故障检测包,BFD 可以提供任意路径之间的故障检测。
类型包括:直连物理链路,虚电路,隧道,多跳路径,非直连链路[4]。
BFD 不仅可以检测光层硬件故障,还可以检测上层软件故障,较以往“Hello ”检测机制检测速度更快,开销更少。
BFD 的工作模式可以分为异步模式和请求模式。
在异步模式下,发送端周期性发送BFD 控制分组,如果接收端接收的控制分组编号不连续或超时,则认为BFD 会话中断,通路失效。
在请求模式下,当需要验证连接性时,可以与远端系统进行短暂的BFD 控制分组通信,之后重新进人静默状态。
采用请求模式能够降低网络负载,但是故障检测不及时,有一定的局限性。
2.2路由快速收敛技术
路由收敛是指路由域中所有路由器对当前的网络结构和
路由转发达成一致的状态。
收敛时间是指从网络拓扑发生变化到网络上相关路由器对于当前网络结构和路由转发达成一致的过程。
目前网络路由收敛过程[5]
如图1所示,大致可以分解为以下几个步骤:①IGP 模块收到变化的链路状态报文(link state ad-vertisement ,LSA );②IGP 模块洪泛链路状态报文,并进行路由计算;③IGP 模块向路由管理平面通告路由计算结果;④路由管理平面将路由计算结果存储到转发信息库中。
路由收敛的过程主要包括路由计算和转发信息库的同步,所以提高路由收敛速度主要是加快路由计算速度和加速RIB/FIB 更新。
主要技术有域内网关协议(interior gateway
protocol ,IGP )收敛、加速RIB/FIB 更新促进路由协议快速收敛的机制。
2.2.1IGP 收敛
骨干网的拓扑非常复杂,全网的路由计算会耗费大量的
时间,频繁的路由收敛会给核心路由器带来很大的负荷。
IGP 快速收敛[6]
是一项解决路由收敛负荷问题的综合性技术,它通过增强SPF 算法(incremental SPF ,ISPF )、部分路由计算算法(par-tial route calculate ,PRC )来实现单路由器上的路由快速计算。
ISPF 只负责计算出网络拓扑最短路径树。
通过全网的路
由计算,ISPF 形成了一个直接反映网络拓扑的“树”状数据库;而计算出的最短路径树则保存在这个数据库中。
当链路状态信息发生变化后,ISPF 会判断出最短生成树的哪部分受到了影响,从而只计算那些受到了影响的部分,有效的降低了路由器的计算负荷。
PRC 直接判断出哪条路由(叶子)发生了变化,之后直接进行路由的选择与更新,即直接利用ISPF 计算出的最短路径树来计算叶子路由的。
为了能够快速响应网络状态的变化,提高网络收敛的速度,IGP 收敛采用了智能定时器。
预先设置时间参数,采用指数退避机制动态的改变定时器的时间间隔。
智能定时器的优势在于初始的时间间隔很短,可以实现快速的路由收敛,同时,时间间隔不断增加,降低路由计算的频度。
2.2.2
加速RIB/FIB 更新促进路由协议快速收敛的机制
文献[5]的研究表明,路由信息表(routing information
base ,RIB )和转发表(forwarding information base ,FIB )的更新制约路由协议收敛,常用的路由器内部结构中,RIB/FIB 的更新和FIB 的发布共享路由器的CPU ,这样会对路由器的性能产生一定的影响。
为了降低这个影响,通常是先把路由信息的前缀更新和发布,然后以50ms 为时间间隔交替更新和发布RIB/FIB 其它的前缀。
较大的网络需要10来次交替才能完成全部前缀的更新和发布,文献[5]提出了3种加快RIB/FIB 更新和发布的机制:设计网络规则使得只有少量重要前缀在路由收敛中起作用;为重要前缀分配较高的优先级;优化路由表管理代码。
2.3多宿主机制
Multi-Homing [7]是指边缘网络或主机连接到多个ISP 的技
术。
提高了边缘网络的容错能力和实现了负载均衡。
多宿主
网络体系结构示意图如图2所示。
当其中一台路由器发生故障后,通过将流量倒换到备份路由器上,从而保证业务流量通过其备份路由器绕道到达目的地,提高了边缘网络的生存性。
IP 网络主要针对网络故障恢复过程的各阶段特点,采用相应的技术提高自身生存性。
在现实的网络中,为了应对突发流量和网络故障备用容量的需要,IP 网络主要采用轻载的方式,使得网络运营成本成倍上升;随着光传输速率和传送容量的不断提升,40Gb/s 的单波长链路的传输速率可以支持625000路传统话音业务或500路高质量MPEG-2数据业务的并行传送。
假设单光纤支持的波长数为160,那么单一光纤故障将可能导致多达1亿路话音业务或8万路MPEG-2数据业务受中断,单一IP 层生存性技术显然会给网络核心路由器带来超负荷。
而采用光层恢复,只需倒换一根光纤就能使网络恢复正常,IP 层生存性技术有一定的局限性。
图1路由收敛过程
转发信息库(FIB )
路由管理平面链路状态信息的洪泛
路由计算
接收链路状态报文
IGP
3MPLS TE快速重路由技术
多协议标签交换(multi-protocol label switching,MPLS)是由英特网工程工作组(Internet engineering task force Internet,IETF)提出的一种基于标签交换的路由技术,结合了第二层ATM交换技术和第三层IP路由技术,通过在IP层报头和链路层报头之间添加标签,能够使无连接的IP网络存在连接特性,改变了IP网络的服务质量保障模式,为提高IP网络的生存性提供了有利的基础。
快速重路由[8]是MPLS TE中一套用于链路保护和节点保护的机制,当某处出现链路或节点失效时,配置有快速重路由保护的LSP可以自动将数据切换到保护链路上去。
针对现有设备基于MPLS TE的保护切换时间可达到1s左右。
基于MPLS[9]的恢复策略有两种基本模型:重路由和保护切换。
重路由恢复机制是指在故障发生之后,依赖于故障信息、网络路由策略、预配置和网络拓扑信息,按需重新建立一条路径;保护切换恢复机制根据路由策略预先建立一条恢复路径。
当故障发生后,受保护的流量切换到保护路径上。
基于MPLS[9]的恢复策略定义了3种恢复周期:MPLS恢复周期、MPLS复原周期和动态重路由周期。
MPLS恢复周期是指故障发生后,检测网络故障并把流量切换到基于MPLS 的恢复路径上的过程;MPLS复原周期模型是指当路径上的故障清除后,保护切换的业务复原到首选路径的过程;动态重路由周期是指故障修复后网络进入半稳定状态,动态路由协议收敛,建立新的工作路径并将业务倒换到新路径的过程。
4多层网络生存性技术
各种新业务应用日益涌现,对网络带宽有了更高的需求。
云计算和SOA作为新的网络应用,彻底改变了互联网的运行模式。
云计算使得更多的计算和存储由网络来提供;SOA作为新的体系架构,使得发布服务、发现服务都要靠网络来支撑。
因此,需要有充足的带宽资源来保证应用的正常运行。
传送网传输链路容量按照光纤定理,其成本/比特继续下降。
用户业务的带宽需求、计算机的处理能力和传送网的传输容量相互制约、相互促进。
4.1光传输网的发展现状
现代通信网络的演进趋势是以电路型交换为主的交换模式向以IP等数据包交换为主的交换模式过渡。
IP包交换的特点就是流量突发性,这就需要通信网络能够自动地、动态地分配带宽资源。
在网络建设、技术发展和业务需求的驱动下,以WDM为基础的光层组网技术和以IP为基础的网络智能化相结合,形成了以光为传送方式的自动交换光网络。
ASON作为新型的光传送网,在可生存性方面有以下优势:
(1)组网方式从点到点和环网向网状网方式演变,改进组网效率和灵活性;
(2)具备快速的故障恢复能力,能够提供多种生存性方式;
(3)可抵抗网络多点故障。
国际上许多通信设备商都在此方面投入力量开发产品,Lu-cent、Nortel、Alcatel、Cinea、Sycamore等公司都有了一些相关的产品。
美国AT&T公司率先应用CIENA的CoreDirector在全国范围内建设了连接近100个城市的智能光网络;国内的华为、中兴、烽火等公司推出了ASON产品;清华大学模拟ASON特性,组建了上百个ASON节点的光传送网。
ASON大规模应用还存在着许多亟待解决的问题:
(1)ASON的标准还不是很完善。
例如,ASON的网络管理、光性能的监视和测试、波长路由协议、信令中支持VCAT 和LCAS问题等都是ASON目前需要完善和解决的问题。
(2)各厂家产品之间的互联尚存在问题。
(3)如何协调IP层和ASON层的选路和生存性问题。
4.2多层网络的生存性发展现状
ASON是光传送网的发展趋势,IP over ASON是未来的网络分层架构,因此,多层生存性策略是未来网络生存性的研究热点和发展趋势。
为了利用各层生存性技术的优势,制定多层生存性策略来协调各层之间的保护恢复顺序。
充分利用ASON组网灵活和快速故障恢复的优势,IP层可以尽量少的预留备用带宽,提高网络带宽资源利用率。
文献[13]对IP网在静态光传送网上和智能光网络上的重路由进行对比,得出了在静态光传送网进行重路由需要的带宽资源较多,IP over ION(intelligent optical network)上的重路由在网络资源利用率方面具有明显的优势。
文献[14]对IP over ASON的承载方案进行了介绍,总结了直接承载和部分承载进行对照比较,提出了ASON承载网作为现有网络的备份网络,当流量突发和需要保护恢复时候通过UNI2.0动态的向ASON承载网进行带宽申请,将原有业务倒换到ASON网上,当网络恢复完毕,再将业务倒换到原来承载网上,并论证了部分承载方案的可行性和经济性。
文献[15]关于IP与ASON多层恢复的策略进行了分析,总结了前人提出的延迟时间法、恢复率法、恢复令牌法,并在此基础上对恢复率曲线进行分析,根据曲线的斜率提出了动态延迟时间法。
文献[16]通过对OSPF-TE协议进行扩展,携带可用的
多的IP层容量。
4.3跨层的生存性技术策略
IP层和ASON层的生存性技术策略有各自的优缺点,IP 层生存性技术优势在于恢复粒度较细,适合于恢复优先级较高的特定连接;ASON层的生存性技术特点是恢复速度较快、恢复粒度较粗,适合于恢复光纤断裂等故障。
针对各层生存性技术特点,将IP层虚拟网络拓扑和ASON 层物理网络拓扑存储在统一的控制服务器上,在控制服务器上采用跨层的生存性技术策略进行保护恢复的协调控制。
IP over ASON统一控制示意图如图3所示。
跨层的生存性技术的思想是将网络划分成相应的自治域,每个自治域由IP层和ASON层组成,有各自的统一控制服务器;通过在统一的控制服务器上采用特定的生存性技术策略,当网络出现故障时,根据控制服务器的生存性技术策略进行协调的保护恢复。
5结束语
业务种类的爆炸性增长使得IP网络需要达到电信级的稳定性,IP over ASON是未来光层承载IP的分层架构。
本文首先对IP层的生存性技术进行了详细分析,针对两层的技术特点设计了跨层的生存性技术解决方案,通过跨层的统一控制系统来更好的协调和控制IP层和光层的恢复顺序,从而使得网络整体的保护恢复算法更优化,避免了以往由于两层同时进行保护恢复而引起路由震荡的现象。
参考文献:
[1]Pej Dan,Massey D,Zhang Lixia.A framework for resilient Inter-
net routing protocol network[J].IEEE,2004,18(12):5-12.
[2]袁丹,张玉清.网络可生存性定义研究[J].计算机研究与发展,
2006,43(1):525-529.
[3]Katz D,Ward D.Bidirectional forwarding detection[R].Draft-
IETF-Bfd-Base-02.Txt,2005.[4]Rahul Aggarwal.BFD For MPLS LSPs[R].Draft-IETF-Bfd-
Mpls-01.Txt,2005
[5]Francois P,Filsfils C,Evans J,et a1.Achieving sub-second IGP
convergence in large IP networks[R].Computer Communication Review,2005,35(3):35-44.
[6]Ashwin Sridharan,Roch Guerin.Making IGP routing robust to
link failures[J].Lecture Notes in Computer Science,2005,3462
(1):634-646.
[7]Satoshi Uda,Nobuo Ogashiwa.Design and implementation of
overlaying multi-homing architecture[C].SAINT Workshops, 2004:165-172.
[8]Multiprotocol label switching architecture[R].RFC3031
[9]Framework for multi-protocol label switching(MPLS)-based re-
covery[R].RFC3469.
[10]RSVP-TE:Extensions to RSVP for LSP tunnels[R].RFC3209.
[11]Fast reroute extensions to RSVP-TE for LSP tunnels[R].
RFC4090.
[12]张成良.ASON技术发展与ASON/IP多层网络恢复[J].电信科
学,2006,22(7):18-21.
[13]Pickavet M,Demeester P,Colle D,et al.Recovery in multilayer
optical networks[J].Journal of Lightwave Technology,2006,24
(1):122-134.
[14]周荣生,杜春生.对ASON承载IP网的研究[J].电信科学,2007,
23(2):17-23.
[15]徐浩,李兴明.ASON网络多层生存性技术的研究[J].现代有线
传输,2005(6):64-67.
[16]Rabindra Ghimire,Seshadri Mohan,Michael Leary,et al.Concur-
rent multi-layer restoration scheme for GMPLS based WDM networks[C].ANTS,2008:15-17.
[17]David Harle,Saud Albarrak.Differentiated survivability in a dis-
tributed GMPLS-based IP-over-optical network[C].ONDM, 2008:12-14.
[18]Zhao Jijun,Wang Sujian,Tang Zhiyuan.Integrated multi-layer
network survivability based on GMPLS to improve fault re-covery time[C].ICCET,2009:126-130.
[19]Dimitri Staessens,Pieter Audenaert,Didier Colle,et al.Survivabi-
lity over multiple GMPLS domains[C].ICTON,2008:31-33. [20]Yan Qiang,Colle D,De Maesschalck S,et al.Performance evalua-
tion of multi-layer traffic engineering enabled IP-over-ION net-works[J].Photonic Network Communications,2005,9(3): 255-280.
[21]Staessens D,Depre L,Colle D,et al.A quantitative comparison of
some resilience mechanisms in a multidomain IP-over-optical network environment[C].IEEE International Conference,2006: 2512-2517.
[22]Generalized multi-protocol label switching(GMPLS)architec-
ture[R].RFC3945.。