5G核心网容灾方案
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
5G核心网容灾方案
摘要:随着国内各大运营商加快建设5G网络,5G核心网的建设成为5G网络建设的关键,由于5G核心网对于网络可靠性要求高,所以5G核心网容灾方案显得尤为重要。
本文旨在研究5G核心网的容灾方案,提升5G核心网部署的可靠性。
关键字:容灾;5G核心网
1 引言
5G核心网已经在全球范围内部署,相比传统移动通信的核心网,有大容量和高集成度的特点,一旦核心网设备发生故障,就会对网络服务的质量带来很大影响。
因为如何通过容灾技术提高网络可靠性,成为建设一个高可靠性5G核心网的关键,也越来越成为运营商关注的重点。
2 5G核心网概述
5G核心网部署方案有两种:非独立组网(NSA)和独立组网(SA)。
目前北美、日韩、欧洲运营商均倾向于先部署NSA(Option-3)、后期再演进到SA的5G部署策略,现网的物理和虚拟化网元均可软件升级支持NSA,利旧现网架构、接口、网管、计费和运维体系。
中国移动是3GPP SA(Option-2)标准化的主要贡献者,全新的架构和接口(服务化架构SBA)、全新的网元形态(虚拟化架构,现网核心网的物理网元不可升级支持;只有部分不涉及SBA 架构的网元,可以在5GC继续使用)[3]。
3 基于NFV核心网容灾方式
5G核心网中NFV(网络功能虚拟化)作为重要的关键技术,可以帮助运营商实现业务的灵活部署、自动化管理,因此NFV可靠性十分重要。
3.1 虚拟网元层容灾
虚拟网元层功能包括VNF(虚拟化的网络功能),VNF应用层容灾,首先考虑同厂家设备进行备份。
如果采用POOL方式进行网元容灾,首选业务各50%的分流方式,次选主备区域99:1的温备方式;1+1 主备/主互备方式网元容灾首选业务就近接入主用侧方式入网。
网络建设初期,建议控制面网元采用逻辑分省,专省专用的方式,初始容量对标现网,不易超大。
为保证真正容灾效果,两大区硬件资源至少满足实际业务需求的100%预留,相应传输,信令转接网元做相应资源预留。
每个大区的硬件资源池尽量分布在多机楼或多层,每一个资源池需要有独立传输,供电。
同一大区的NFV厂家建议选择两家。
在集中电信云部署的虚拟化网元与现网传统网元独立组网,为实现设备级和地域级容灾,相邻大区两两配对,将具备容灾备份关系的网元部署在两个大区中心,方式一:采用1:1负荷分担方式疏通业务。
方式二:采用主备(热)方式疏通业务。
方式三:采用按比例分担方式疏通业务。
3.2 MANO层容灾
MANO(管理和编排)负责对整个NFV网络和VNF网元的管理和编排[4],掌控全局视图和信息,是运维管理的统一入口,所以MANO 层需采用本地和异地容灾,来充分保障其可用性。
场景一:区域中心的NFVO+节点做全局维护,即从省里的所有VNF到区域的VNF都被看作大区的维护对象,这个时候就需要大区中心具有端到端的呈现视图,故障可分级定位并派发到下面各级。
大区负责区内所有省的VNF网元的生命周期管理,各类网元的局数据制作等。
场景一下的运维管理需要对运维能力,自动化运维,全局统计分析,故障排查系统做到比较成熟,同时由于省里边缘DC众多,大区的NFVO+以后的负荷和网络安全性是相当重要的地位,全区控制中心和资源调度中心,另一个大区的NFVO+节点作为大区NFVO+节点的容灾备份节点。
场景二:网络架构和场景一非常类似,区别在于大区的维护主体和省里的维护主体在一些工作量的划分上有所分工和侧重。
尤其在初期集中化建设,大区人力不足,且省里也依然保留有维护力量时。
省里可以负责各省VNF局数据的制作,大区负责资源池管理,VNF生命周期管理等,省里可以负责VNF局数据的制作及VNF生命周期管理,软件升级,打补丁等。
大区仅负责NFVI的维护。
这个场景需要大区的NFVO(NFV编排器)与各省OSS对接,省里和大区的人员分配也可以按网元类型进行一定配比。
4 5G核心网容灾方案
4.1 网元虚拟化(NF)实例容灾方案部署
5G核心网通过构建以DC为中心的网络云化平台,部署基于云化架构的VNF。
首先引入跨DC部署,各个NF的冗余实例分散在不同的DC中,其次各个NF的冗余实例分散在不同的资源池中。
NSSF(网络切片选择功能)、NRF(网络存储功能)、UDM(统一数据管理)/AUSF(鉴权服务功能)等网元采用1+1方式进行容灾,PCF(策略控制功能)、AMF(接入和移动性管理功能)、SMF(会话管理功能)、UPF(用户面功能)等网元采用组POOL方式进行容灾。
[1]
4.2 NF多场景容灾方案
标准CUPS(用户面和控制面分离技术)在容灾方面存在缺陷。
场景一:用户面网元和用户面网元1:1配比,DC1中的控制面或者用户面网元异常,对应的用户面或者控制面网元也无法工作,DC2中的控制面和用户面网元同时接管DC1的业务。
控制面和用户面网元均采用1+1方式进行容灾。
场景二:控制面网元和用户面网元1:N配比,一个控制面网元管理多个用户面网元,当其中一个用户面网元异常时,其他用户面网元继续工作。
DC1的控制面网元异常,管理之下的用户面网元均无法工作,这是DC2的控制面和用户面网元同时接管DC1的业务。
控制面网元均采用1+1方式进行容灾,用户面网元采用N+N方式进行容灾(1个控制面网元对应N个用户面网元)。
场景三:DC1和DC2中的控制面网元均采用1+1主备方式进行工作,DC1和DC2中的用户面网元组
POOL。
DC1中主用控制面网元故障,切换至DC2中备用控制面网元;DC1中用户面网元故障,由POOL中任意用户面网元接管。
控制面网元均采用1+1方式进行容灾,用户面网元采用组POOL方式进行容灾。
以上方式均会造成资源浪费,如果控制面网元组POOL(以下简称C-POOL),1个用户面网元对应C-POOL中的多个控制面网元,同时用户面网元也采用组POOL(以下简称U-POOL)方式进行容灾。
从传统的1+1对应,变为N+M,在提供可靠性同时,提高了资源的利用率。
1个C-POOL管辖多个U-POOL,通过C-POOL对所管辖的所有U-POOL进行统一日常管理、业务配置和版本管理,简化运维复杂度,降低运维成本。
在面向R16的容灾架构中,将实现1个用户面网元对应多个控制面网元,某个控制面或者用户面网元故障时,只影响本身在线的用户。
同时将支持异厂家控制面或者用户面网元组POOL,运营商选择更加灵活。
4.3 数据存储多场景容灾方案
5G系统架构允许任何NF向UDSF(非结构化数据存储功能)存储和寻回他的非结构化数据,控制面NF可能为了存储他们的非结构化数据共享一个UDSF或者可能拥有他们自己的UDSF。
[2]场景一:数据共享式容灾,UDSF统一存储。
如果NF1故障,Set内其他NF均可接管,冗余度为1/N(N为NF数量),要求比较度,多点故障时网络仍可继续处理业务。
在维护方面,由于UDSF
存储节点少,可以独立部署、统一管理。
同时做到了计算与存储分离,外部消息路由,计算和存储可异厂家部署。
场景二:数据分布式容灾,UDSF数据被NF独占,通过NF之间数据同步进行数据备份。
NF1故障,由对应的备份NF接管业务,冗余度100%,若NF与它对应的备份NF同时故障,则无法继续处理业务。
UDSF在NF中内置,作为一个服务,同NF同时部署和管理,节点分散,升级和维护需分别处理,运维复杂。
计算与存储未完全分离,后续仍需改造为独立部署UDSF方式,UDSF无法异厂家部署。
场景二通常作为5G初期部署方案,场景一作为5G核心网的目标架构,拥有实时同步、业务零中断等特点。
4.4 大区容灾方案
中国移动目前在全国分为8个大区,分别为华北(廊坊)、东北(哈尔滨)、华东1(南京)、华东2(金华)、华中(郑州)、华南(广州)、西北(西安)和西南(成都)。
同时为保证网络安全,在区域中心具备设备容灾在的基础上,进一步考虑地域级容灾,大区中心两两配对分为4组,互为备份,实时容灾,华北(廊坊)和东北(哈尔滨)、华东1(南京)和华东2(金华)、华中(郑州)和华南(广州)、西北(西安)和西南(成都)。
每个大区中心城市,建设至少2个资源池。
大区集中后,各个电信云资源池规模大,大区与大区之间距离远,节点级容灾首先考虑好本大区内的充分容灾。
由于单大区业
务体量巨大,跨区容灾是预防地理容灾的有效手段,但远距离传输可能对业务体验有一定影响。
所以完备的地理容灾机制,可以最大限度抵御灾难下的信令冲击。
5 结束语
5G核心网容灾方案要考虑的因素很多,包括对业务中断的影响,技术的先进性、网络的长期发展和演进等等,同时也要考虑网络容灾的经济性、复杂性和可操作性,5G核心网的容灾是业界必须要面对和解决的问题。