IMS核心网元准POOL容灾方案研究V1[1].4
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
IMS核心网元准POOL容灾方案研究
中国电信股份有限公司广东研究院许盛宏
【摘要】IMS网络将成为融合网络的新核心,而P-CSCF、S-CSCF是IMS核心网元,其组网的可靠性关系到IMS业务提供的稳定性。本文首次提出了P-CSCF、S-CSCF的
准POOL组网方案,阐述了组网要求、容灾数据备份和容灾接管实现,大大提高
容灾组网的可靠性,确保容灾业务实时接管,降低投资成本和提升设备利用率,对
IMS商用网络规划、组网部署具有极高参考价值。
【关键词】准POOL P-CSCF S-CSCF 实时接管容灾方案
1 引言
随着网络融合演进趋势加快和多媒体业务应用需求增加,中国电信加紧部署IMS网络,IMS网络将成为未来融合核心网的新核心,其规模难以估量,其安全问题必关系整个电信网络、业务安全。因此,很有必要研究IMS网络的安全组网方案。
P-CSCF是用户接入IMS网络的初始入口点,将拜访地接入网络的SIP事务转接到其归属地的S-CSCF。S-CSCF是IMS的核心设备,位于用户的归属网络,为UE提供注册管理和认证鉴权,并为IP多媒体业务呼叫的建立、维持和释放提供控制功能。
因此,S-CSCF、P-CSCF是IMS网络非常重要核心网元,但是目前组网方式无法满足大规模商用的需求,一旦主用设备瘫痪后,就导致业务接管时间过长、对用户影响非常大等问题,而采用准POOL容灾组网方案,进一步提升IMS网络的健壮性。
2 目前容灾方案分析
2.1容灾方案的实现
异地容灾组网的主要实现方式有:1+1主备、1+1互备、负荷分担、POOL和N+1备份。P-CSCF和S-CSCF目前的组网方案如下:
P-CSCF采用负荷分担方式,在正常情况下,相邻网元按照一定比例将话务负荷分担到N个设备;当有一个设备故障失效,相邻网元将所有话务负荷分担到其他的N-1个设备,接管设备非实时进行容灾业务处理。
S-CSCF采用N+1备份方式,在正常情况下,相邻网元按照一定比例将话务负荷分担到N个S-CSCF设备,另一个处于冷备份状态;当一个主用的S-CSCF设备故障失效时,相邻网元将故障设备所承担的话务接续到备份S-CSCF,备份S-CSCF设备非实时接管业务。
2.2 容灾方案存在问题
目前容灾方案主要存在的问题如下:
1.无法及时恢复业务:P-CSCF和S-CSCF所采用的组网方式,一旦用户注册所在的主用设备瘫痪后,需要等待用户重新注册才能恢复业务,无法实现业务的实时接管。
2.无法确保接管有效性:S-CSCF采用的N+1备份方式,由于处于备份的设备在平常没有负荷,难以保证在应急情况下的有效接管。
3.设备投资成本高:如这些网元采用1+1互备方式,可提高可靠性,但冗余度相当高,投资成本高,而且设备之间实时同步容灾数据才能确保业务实时接管,对设备性能开销较大。
4.用户感知的影响大:目前方案通过用户重新注册来实现业务非实时接管,这样就对用
户感知的影响很大,可能导致用户会在一段时间内无法通话。
2 准POOL方案的优势
为了解决上述的问题,可以采用准POOL组网方式。准POOL组网方式是指N个设备组成一个池,池内设备提供负荷分担服务,网元之间通过非数据同步方式实现资源共享。当一个设备瘫痪,其余N-1个可以通过一定方式获取共享数据进行实时接管,不需要等待用户的重注册。与POOL方式的最大不同点是,容灾数据不再通过网元之间的数据同步实现,而是巧妙的通过HSS数据共享或者容灾查询实现,一方面确保业务实时接管,另一方面设备性能开销很小,满足集约化运营需求。业务实时接管是指接管设备能为已注册用户未进行周期注册更新时提供完整的业务服务。
异地容灾组网方式的容灾切换指标分析如表1所示:
表1 异地容灾组网方式的指标对比分析
从上表的分析可知,准POOL技术比目前容灾组网方式具有绝对优势:业务实时接管、用户基本无感知、设备利用率高、投资成本低和较为容易实现。因此,对于需要容灾数据才能恢复业务的网元,P-CSCF、S-CSCF建议采用准POOL方案组网。
3 P-CSCF准POOL方案
3.1 容灾组网要求
N个P-CSCF设备组成一个准POOL,在正常情况下,BAC支持按照一定比例将话务负荷分担到准POOL中的所有设备;当一个P-CSCF设备故障失效时,BAC和S-CSCF将故障P-CSCF承载的
话务负荷分担到准POOL中的剩余其他设备,接管的P-CSCF设备通过I-CSCF查询获取用户当前注册的S-CSCF实时接管业务。
P-CSCF准POOL(以N=3为例)的组网结构图1所示:
图1 P-CSCF准POOL组网结构
在上述的组网中,对于用户初始注册请求,BAC采用负荷分担的方式选择P-CSCF准POOL 内的设备,可采用DNS配置方式:BAC在一个信令分组中,配置一个P-CSCF的域名,假设为,用户注册时采用此域名进行SRV查询。DNS的SRV配置池内所有设备的主机名,采用相同优先级,权重可以根据实际需要进行配置。为了实现容灾的负荷分担,DNS 对POOL中每一个P-CSCF主机都配置SRV查询,对于本主机采用高优先级,所有剩余主机都采用相同的低优先级。DNS配置关系如表2所示:
表2 P-CSCF准POOL方案的DNS配置要求
假设用户原来注册在P-CSCF1故障失效,对于已经注册的用户的呼叫、重注册请求,BAC 和S-CSCF根据DNS返回的序号为2的记录,将话务负荷分担到P-CSCF2和P-CSCF3,从而实现了到N-1个设备上负荷分担。
3.2容灾数据备份
P-CSCF所需要容灾备份数据就是用户当前服务的S-CSCF,按照标准注册流程,在用户注册时,S-CSCF通过信令与HSS进行交互,HSS就会记录下用户当前服务的S-CSCF,不增加额外备份需求。
3.3容灾接管实现
P-CSCF容灾接管主要考虑已注册用户的主叫和被叫业务实现,已注册用户的重注册、新用户注册与原有标准流程一致。
3.3.1 已注册用户主叫业务接管
已注册用户尚未进行周期更新时发起的主叫业务时,通过如下流程实现实时接管,假设P-CSCF1故障失效,P-CSCF2进行业务接管:
1.已注册在P-CSCF1的用户向BAC发起呼叫,BAC将呼叫转发到P-CSCF2。
2.P-CSCF2发现没有用户注册数据,根据主叫用户的域名查询DNS,将呼叫请求发往
主叫用户归属的I-CSCF,在INVITE消息中提取PPI域的主叫号码构造PAI,并在
INVITE消息的增加restore=1参数,标识接入侧P-CSCF/AGCF发来的消息。
3.I-CSCF 根据restore=1参数构造Cx接口的User-Authorization-Type取值为2,
并根据orig参数提取主叫号码向HSS发送LIR消息。
4.HSS处理LIR请求时,根据User-Authorization-Type取值为2,返回主叫用户的
S-CSCF能力集和动态S-CSCF name。
5.I-CSCF优先使用动态S-CSCF name路由,并呼叫请求消息送到S-CSCF。
6.S-CSCF收到呼叫请求后,根据restore=1参数识别是UE始呼流程,根据orig触
发主叫侧业务,从而完成容灾业务接管。
3.3.2 已注册用户的被叫业务接管
对于原来注册在故障P-CSCF1的用户的被叫接管,被叫S-CSCF将呼叫负荷分担到P-CSCF 准POOL的其他设备:
1.S-CSCF收到MT呼叫,根据用户的记录主机名P-CSCF1进行DNS查询,DNS返
回相应的P-CSCF优先级列表,S-CSCF检测到优先级最高的P-CSCF1故障失效后,
S-CSCF在优先级低的P-CSCF任选一个,假设为P-CSCF2。
2.根据SIP协议要求,S-CSCF 将Request URI封装为BAC的IP地址,将呼叫消息
发送给P-CSCF2。
3.P-CSCF2根据容灾策略放通呼叫,并根据Request URI将呼叫路由到用户注册的
BAC,BAC按照正常呼叫进行处理就可以完成业务接管。
4 S-CSCF准POOL方案
4.1 容灾组网要求
N个S-CSCF设备组成一个池,池内设备提供负荷分担服务。在正常情况下,相邻网元支持按照一定比例将话务负荷分担到准POOL中的所有设备,网元之间通过HSS数据存储实现容灾数据共享,当一个S-CSCF瘫痪,其余N-1个S-CSCF设备进行负荷分担,可以通过HSS查询获取容灾数据进行实时接管,不需等待用户的重注册。
S-CSCF准POOL(以N=3为例)的组网结构如图2所示: